如何掌握数据科学界的“黑色黄金”?( 十 )
当然 , 我们也可以向数据中加入一些噪声来检验聚类算法的鲁棒性 。
月形集群数据生成:我们也可以用datasets.make_moons函数生成带有可控噪声的月型集群数据来测试算法 。
用任意符号表达式生成数据
虽然前面提到的函数非常好上手 , 但是用户无法轻松控制数据生成的底层机制 , 并且回归输出不是输入的确定函数——确实是随机输出 。 虽然这对于许多问题可能就足够了 , 但是通常需要可控方法来生成这些基于定义良好的函数(涉及线性、非线性、有理、甚至超越项)的问题 。
例如 , 我们想要评估各种核化SVM分类器在配备有日驱复杂的分离器(线性到非线性)的数据集上的有效性 , 或者想证明线性模型对于由有理函数或超越函数生成的回归数据集的局限性 。 利用scikit-learning的这些功能很难做到这一点 。
此外 , 用户可能只想输入符号表达式作为生成函数(或分类任务的逻辑分隔符) 。 仅使用scikit-learning的实用程序是不太容易做到这一点的 , 并且必须为实验的每个新实例编写自己的函数 。
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?