如何掌握数据科学界的“黑色黄金”?(13)

合成数据集在这方面能提供很大的帮助 , 并且有一些现成的函数可用于尝试此路线 。 然而 , 有时需要能够基于复杂的非线性符号输入来生成合成数据 , 我们讨论了这种方法 。

此外 , 本文还讨论了一个令人兴奋的Python库 , 它可以为数据库技能实践和分析任务生成随机的实际数据集 。

本文的目的是要表明 , 年轻的数据科学家不必因为无法获得合适的数据集而陷入困境 。 相反 , 他们应该寻找和设计自己的编程解决方案 , 以创建用于他们学习目的的合成数据 。 在此过程中 , 他们可能会学到许多新的技能 , 并打开新的机会之门 。

编译组:高亚晶、韦振琛

如需转载 , 请后台留言 , 遵守转载规范

推荐阅读