如何掌握数据科学界的“黑色黄金”?(11)
为了解决符号表达式输入问题 , 可以容易地利用Python包SymPy , 它允许理解、渲染和评估符号数学表达式 , 达到了相当复杂的程度 。
例如 , 我们可以将符号表达式作为平方项(x2)和正弦项(如sin(x))的乘积 , 并由此创建随机回归数据集 。
或者 , 可以生成用于测试神经网络算法的基于非线性椭圆分类边界的数据集 。 注意 , 在下面的图中 , 展示了用户是如何输入符号表达式m='x1**2-x2**2'并生成这个数据集的 。
使用“pydbgen”库生成分类数据
虽然许多高质量的基于现实生活的数据集在网上就有 , 可被用来尝试很酷的机器学习技术 , 但从个人经验来看 , 学习SQL时情况并非如此 。
对于数据科学专家来说 , 基本熟悉SQL几乎与知道如何用Python或R编写代码一样重要 。 但是使用真实分类数据(如姓名、年龄、信用卡、社保号码、地址、生日等)访问足够大的数据库并不像访问Kaggle上的玩具数据集那样常见 , Kaggle是专门为机器学习任务而设计策划的 。
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?