想让机器学习与商业结合,最重要的是什么?( 七 )
\n \n
“我会把数据集拆分成培养/测试两部分 , 运行LogisticRegression Random Forest SVM Deep Learning XGBoost程序……然后计算精确度、查全率、F1分数……最终挑选出最佳模型 。 ”
\n \n
但是 , 还有些问题被忽略了:
“这个过程中你有看过数据本身吗?要是你遗漏了一些数值怎么办?如果你拿到错误的数值或是不良数据呢?你怎么设置分类变量?你是怎么做特征工程的?”
\n \n本文中将介绍成功创建端对端机器学习系统的七个必要步骤 , 包括数据收集、数据监管、数据探查、特征抽取、模型培养、估值和部署 。
\n \n\n
给我数据!
\n \n\n \n
作为数据科学家 , 主要资源很明显是数据 。 但有时数据采集本身也有困难 。 一个数据科学团队可能会花费几周甚至几个月的时间来获取合适的数据集 。 其中的困难包括:
\n \n推荐阅读
- Uzi|Knight或像UZI因商业合同被卡俱乐部,LOL官方对此都毫无办法
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- 国服|LOLM:60天内如何从小白打到国服王者?这快捷径方法值得学习
- 催眠学习|《催眠学习》PC版,一款教你如何恋爱的游戏,非绅骑步呦!
- 任天堂|免费“大作”会有吗?任天堂商业报告提到将改善Switch会员服务
- 虎牙|哈利波特手游:同流派该如何击败?虎牙小若沐展示细节,值得学习
- 梦幻西游|梦幻西游:一只须弥画魂的励志蜕变史,这才是值得学习人生态度!
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保