技术|“技术小白”自述:作为实习生,我是如何通过快速学习成为项目开发者之一的。


我摊牌了 , 其实我是一个知乎小V , 有超过1万粉丝 。 而我的另一个身份是字节跳动算法工程师 , 研究方向是机器翻译 。
>>>>
2020年5月我开始实习 , 那时我在机器翻译方向上完全是一个小白 , 一开始连公司系统都不会用 , 就一边看文档一边琢磨 。 文档里是项目组过往的技术沉淀 , 这些对团队同学都是公开的 , 我可以快速学习 。 我的mentor也很有耐心 , 基本上每隔一两天就会和我交流 , 直到我渐渐熟悉机器翻译场景下的各种技术应用 。
很快 , 我开始接触LightSeq 。 LightSeq是火山翻译团队2019年12月启动的项目 , 初衷是实现“模型自由” , 让资源匮乏的用户也能够高效训练和推理大模型 。
LightSeq的开发过程大致分为两个阶段:推理和训练 。 我来字节跳动实习的时候 , 推理引擎部分已经相对完善 , 但外界对此知之甚少 , 主要用户基本局限在字节内部 。
我觉得 , 好的项目应该让更多用户知道 , 享受模型加速带来的便利 , 这个想法很快得到了leader的支持 。 我开始撰写关于LightSeq的各类文章 , 包括使用教程、应用实践等等 , 并在GitHub平台收获了1400+颗星 。 这个过程也让我对于LightSeq有了更加深入的理解 。
技术|“技术小白”自述:作为实习生,我是如何通过快速学习成为项目开发者之一的。
文章图片

2021年初 , leader问我是否愿意加入到LightSeq训练引擎的开发中 。 我有些意外 , 训练阶段对团队来说都是一次全新的挑战 , 但leader毫不介意我是新人 , 愿意给我机会成长 。 很多时候 , 我其实感受不到“实习生”这样的标签 。 在这个团队里 , 大家不论资历和层级 , 项目成员的目标非常明确:共同完成LightSeq训练引擎的加速 。
相比推理 , 训练又是一个新的方向 , 需要自学底层技术 , 代码上也有不小的挑战 。 一开始是mentor写复杂的 , 我写比较简单的;渐渐熟练之后 , 善于抓细节的我 , 也能注意到一些其他项目成员没有留意到的提升点 , 特别有成就感 。
我们几乎每天都会讨论同一个问题:还有哪些优化和提升的空间 。 但越往后 , 可优化的空间就越少 。 有时候写了一星期代码 , 但速度没有任何提升 , 会感到很沮丧 。 这时候就需要清空思路 , 从头到尾把整个模型再看一遍 。 对我来说 , 最快乐的时刻 , 就是把代码全部改完的一瞬间!
3个月后 , 我们超预期完成了训练加速 , 之前我们定的OKR是提升2倍 , 实际上做到了3倍 。
过程中每改一个bug , 我都会记录下来 , 以免之后忘掉 。 我很喜欢总结 , 这是自我提升的一种方式 , 另一方面 , 把一路踩坑的经历记录下来 , 也能让其他人少走一些弯路 。
我知道公司里有好多深藏不露的技术大牛 , 我还是个新手 , 有很多需要学习的地方 , 能有能和他们相互切磋 , 在平等、开放的氛围里 , 实现更多的技术突破 , 对我来说是挺棒的一件事 。
其实在字节跳动 , 不少新业务、新项目的诞生 , 都是从一两个人的小团队开始的 。 很多时候 , 实习生也在其中扮演了关键角色 , 和团队一起成为业内重要开源项目的开发者 。 字节跳动2022春季校园招聘也已经启动了如果你也想在多元化的团队里 , 和优秀的伙伴一起“创业” , 可以投递简历加入我们!
「点击阅读原文 , 直达官网投递简历」
【技术|“技术小白”自述:作为实习生,我是如何通过快速学习成为项目开发者之一的。】技术|“技术小白”自述:作为实习生,我是如何通过快速学习成为项目开发者之一的。
文章图片

「点击阅读原文 , 直达官网投递简历」

    推荐阅读