如何掌握数据科学界的“黑色黄金”?( 七 )
在这种情形下你能够做什么?在互联网上搜索更多的数据集 , 希望其中一些能够带来与特定算法相关的限制和挑战 , 并帮助你学习?
是的 , 这是一种可能的方法 , 但是就时间和努力而言 , 可能不是最切实可行或最佳的方法 。 好的数据集可能不干净或不容易获得 。 与努力理解机器学习算法相比 , 你可能要花费更多的时间寻找、提取和争用合适的数据集 。 搜索真实生活数据集、提取数据集、运行探索性数据分析、甚至与其辩驳使其为基于机器学习的建模作适当准备等等这些经验是宝贵的 。 我正在写一本关于这个话题的课程/书 。
但是那可以分开教学和练习 。 然而 , 在许多情况下 , 您可能只想访问灵活数据集(或者其中的几个数据集)就能感受到机器学习算法种种暴力细节 。
令人惊讶的是 , 在很多情况下 , 这样的教学可以用合成数据集完成 。
什么是合成数据集?
顾名思义 , 合成数据集是以编程方式生成的数据仓库 。 所以它并不是由真实生活中的调查或实验收集起来的 。 因此 , 它的主要目的是足够灵活和丰富 , 以帮助机器学习实践者进行各种分类、回归和聚类算法的实验 。 它期望的属性是:
推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 阴阳师|阴阳师SR川猿强度如何 是否值得抽卡 改变斗技环境 大佬的新玩具
- 手机游戏|梦幻西游手游:活力如何换金币 一切都已给出 就看你的选择
- 华佗|三国杀:两位\奶爸\,朱治与华佗比,强度如何呢?
- 亲朋上分|《亲朋上分》266391亲朋下分亲朋上下分永劫无间崔三娘技能介绍 崔三娘如何获得更多技能
- s6|金铲铲之战:S6双城传说如何才能快速上手?基础知识很关键
- |冰雪传奇:平民玩家四转后如何打金
- 穿越火线|CF:传说武器再度上新,那王者、炫金该如何发展?
- 打野|打野已经被削到几乎不能再削了,到底如何平衡打野位置?