我摊牌了 , 其实我是一个知乎小V , 有超过1万粉丝 。 而我的另一个身份是字节跳动算法工程师 , 研究方向是机器翻译 。
 >>>> 
 2020年5月我开始实习 , 那时我在机器翻译方向上完全是一个小白 , 一开始连公司系统都不会用 , 就一边看文档一边琢磨 。 文档里是项目组过往的技术沉淀 , 这些对团队同学都是公开的 , 我可以快速学习 。 我的mentor也很有耐心 , 基本上每隔一两天就会和我交流 , 直到我渐渐熟悉机器翻译场景下的各种技术应用 。
 很快 , 我开始接触LightSeq 。 LightSeq是火山翻译团队2019年12月启动的项目 , 初衷是实现“模型自由” , 让资源匮乏的用户也能够高效训练和推理大模型 。
 LightSeq的开发过程大致分为两个阶段:推理和训练 。 我来字节跳动实习的时候 , 推理引擎部分已经相对完善 , 但外界对此知之甚少 , 主要用户基本局限在字节内部 。
 我觉得 , 好的项目应该让更多用户知道 , 享受模型加速带来的便利 , 这个想法很快得到了leader的支持 。 我开始撰写关于LightSeq的各类文章 , 包括使用教程、应用实践等等 , 并在GitHub平台收获了1400+颗星 。 这个过程也让我对于LightSeq有了更加深入的理解 。
 
 
文章图片 
 
 2021年初 , leader问我是否愿意加入到LightSeq训练引擎的开发中 。 我有些意外 , 训练阶段对团队来说都是一次全新的挑战 , 但leader毫不介意我是新人 , 愿意给我机会成长 。 很多时候 , 我其实感受不到“实习生”这样的标签 。 在这个团队里 , 大家不论资历和层级 , 项目成员的目标非常明确:共同完成LightSeq训练引擎的加速 。
 相比推理 , 训练又是一个新的方向 , 需要自学底层技术 , 代码上也有不小的挑战 。 一开始是mentor写复杂的 , 我写比较简单的;渐渐熟练之后 , 善于抓细节的我 , 也能注意到一些其他项目成员没有留意到的提升点 , 特别有成就感 。
 我们几乎每天都会讨论同一个问题:还有哪些优化和提升的空间 。 但越往后 , 可优化的空间就越少 。 有时候写了一星期代码 , 但速度没有任何提升 , 会感到很沮丧 。 这时候就需要清空思路 , 从头到尾把整个模型再看一遍 。 对我来说 , 最快乐的时刻 , 就是把代码全部改完的一瞬间! 
 3个月后 , 我们超预期完成了训练加速 , 之前我们定的OKR是提升2倍 , 实际上做到了3倍 。
 过程中每改一个bug , 我都会记录下来 , 以免之后忘掉 。 我很喜欢总结 , 这是自我提升的一种方式 , 另一方面 , 把一路踩坑的经历记录下来 , 也能让其他人少走一些弯路 。
 我知道公司里有好多深藏不露的技术大牛 , 我还是个新手 , 有很多需要学习的地方 , 能有能和他们相互切磋 , 在平等、开放的氛围里 , 实现更多的技术突破 , 对我来说是挺棒的一件事 。
 其实在字节跳动 , 不少新业务、新项目的诞生 , 都是从一两个人的小团队开始的 。 很多时候 , 实习生也在其中扮演了关键角色 , 和团队一起成为业内重要开源项目的开发者 。 字节跳动2022春季校园招聘也已经启动了如果你也想在多元化的团队里 , 和优秀的伙伴一起“创业” , 可以投递简历加入我们! 
 「点击阅读原文 , 直达官网投递简历」
【技术|“技术小白”自述:作为实习生,我是如何通过快速学习成为项目开发者之一的。】
 
文章图片 
 
 「点击阅读原文 , 直达官网投递简历」
推荐阅读
- 实验|博士最“惨”能到什么程度?
 - 数据|“大数据杀熟”要成为历史了吗?
 - 重构|华为轮值董事长郭平:不会退出海外市场 将大幅增加对根技术的战略投入
 - 磁场|一场地磁暴让40颗“星链”卫星坠毁,对地面关键设施也有危害
 - 兔子|中科院利用基因编辑技术创新,高粱也能种出“稻花香”
 - 产品|高端数控机床铣头市场彻底告别“进口依赖”
 - 数据|“00后”已经开始自研卫星了
 - 材料|武汉大学与 OPPO 研发出“退烧”手机壳,原理类似人体发汗散热
 - 华为|MWC2022:5G持续渗透B端垂直行业 C端加码技术创新
 - 中空|天太机器人重磅推出2022新品“智巧”系列关节
 
