想让机器学习与商业结合,最重要的是什么?(20)
\n \n
\n
别泄露数据
\n \n处理一个预测航班到达时间延误的项目时 , 如果使用数据集里所有可用的特征时 , 模型的精确度可以达到99% 。 不过 , 希望你会意识到 , 你可能用启程延误时间来推测进港延误时间 。 这是数据泄露的典型案例 。 如果我们使用了任何预测时不可用或未知的特征 , 就会造成数据泄露 。 大家要当心!
\n \n\n
图片来源:the Kini group.
\n \n\n
开源软件里能找到一切资源 , 平台还有什么用处?
\n \n构建机器学习模型从未像今天这样简单 。 几行R语言或Python语言代码足以建构一个模型 , 在网上甚至还能找到大量培养复杂神经网络的资源和课程 。 如今 , Apache Spark十分有助于数据准备 , 它甚至能对大型数据集进行归一处理 。 另外 , docker和plumber等工具通过超文本传输协议(HTTP)简化了机器学习模型的部署 。 似乎完全依靠开源平台资源 , 就能构建一个端到端的机器学习系统 。
推荐阅读
- Uzi|Knight或像UZI因商业合同被卡俱乐部,LOL官方对此都毫无办法
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- 国服|LOLM:60天内如何从小白打到国服王者?这快捷径方法值得学习
- 催眠学习|《催眠学习》PC版,一款教你如何恋爱的游戏,非绅骑步呦!
- 任天堂|免费“大作”会有吗?任天堂商业报告提到将改善Switch会员服务
- 虎牙|哈利波特手游:同流派该如何击败?虎牙小若沐展示细节,值得学习
- 梦幻西游|梦幻西游:一只须弥画魂的励志蜕变史,这才是值得学习人生态度!
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保