原创<br> 入职一年后,一位算法工程师给初学者的一封信( 六 )
稳定性>前沿性
我们曾经有一个有关自然语言的问题:把文字内容归为不同的类别。任务目标是帮用户向服务中心发送一段文本,并且自动把文本归为两类中的其中一类,如果模型预测的不够准确 ,那么把文本交给人工处理,工作量大概是每天1000-3000次请求,不多也不少。
BERT成为了今年最受瞩目的名词。但是如果没有谷歌的规模化计算工具,想要使用BERT训练模型来完成我们的需求则非常麻烦,而且这还仅仅是把模型用于生产前所需要的工作,因此,我们找到了另一种方法——ULMFiT。这个方法虽然不是最前沿的,但是它能产生足够好的结果,并且这个方法也很容易使用。
与其将某个方法改进到完美,不如借鉴已有的模型,在这基础上进行迁移学习,这样能带来更多的价值。
机器学习中的两大难点
将机器学习付诸实践存在两个瓶颈:从课程成果到项目成果的瓶颈、从理论模型到生产模型(模型部署)的瓶颈。
互联网搜索机器学习课程返回了大量的结果,我用了其中许多课程创建自己的AI硕士学位课程。但即使在完成了最好的几门课程,当我开始担任机器学习工程师时,我的技能还是建立在课程的结构化主干上,在现实问题中,项目并不是结构化的,我缺乏具体的知识,线上的互联网课程中无法教会你一些技能,比如:怎么质疑数据、探索与开发模型。
推荐阅读
- 上古卷轴6|B社文件夹进展! 老滚6要2026年后辐射5已有大纲
- gk|DNF:最悲催的100级武器!1年前趋之若鹜,1年后狗都不带
- 任天堂|发售24年后,德国审查机构解除了《007:黄金眼》游戏的禁令
- 帝国时代4|原神:战神关卡设计师入职米哈游原神项目?以后的关卡会改善吗?
- 机战|机战30:原创女主三叶收获极高评价 夏亚坦言这是自己的新妈妈
- 戒指|DNF:商人十年后解封!仓库一堆灵犀戒指,拍卖行却成“白菜”
- 奥拉夫|战神4首席关卡设计师官宣入职米哈游!米哈游要下血本做3A了?
- 剑网3|4年前被赶出服务器,4年后回归复仇打脸!剑网3七合一大战门口800人团战, 当年一线天再现
- 西山居|专访西山居孙红印:《剑网1:归来》是18年后补给玩家的礼物
- 天龙八部|开服3分钟爆满,新天龙八部怀旧服上线一年后,还是那么火?