本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发


本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发
文章图片

丹棱君有话说:科研工作者如何数十年如一日地保持热忱?如何不断突破自我?如何发现技术研究与生活的内在联系?如何在学得好的同时玩得好……一起来听听这位年过花甲并深度享受科研创新的前辈——微软亚洲研究院首席研究员宋謌平的答案吧 。
科学研究任重而道远 , 有很多人为此贡献了一生 。 今天 , “科学匠人”故事的主人公是这样一位年过花甲但仍然享受科研创新的一线前辈——微软亚洲研究院首席研究员宋謌平博士 。 已从事语音研究工作近四十年的他 , 在加入微软亚洲研究院之前 , 已在贝尔实验室工作了二十年 , 而今他在微软亚洲研究院也已十余年 。
如何能数十年如一日地坚持保持如初的热忱?是否遇到过中年危机 , 如何度过35岁+的迷茫与彷徨?又如何突破自我 , 不断寻找新的研究方向?在这里 , 让我们一起来听一听宋謌平博士的经验分享 。

本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发
文章图片
宋謌平 , 微软亚洲研究院首席研究员
做研究要怡然自得 , 要另类思考【本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发】宋謌平博士从来都不认为自己是所谓的“大师” , 他只是一个学习者 , 一个一直都在学习中的老学生 。 强大的好奇心驱使他不断探索未知领域 , 学习新事物 , 而这正是他在创新研究工作中永葆激情的秘诀 。
玩儿好 , 才能学得开心 明末清初的大学者顾炎武是宋謌平最钦佩的学人 。 他是杰出的思想家、经学家、史地学家和音韵学家 , 也是明末清初的“三大儒”之一 。 最具影响力的代表作品为《日知录》 , 其中不乏许多名言警句 , 他在书中说:“保天下者 , 匹夫之贱 , 与有责焉” , 后来梁启超将其精简为“天下兴亡 , 匹夫有责” 。 受当时的政治影响 , 顾炎武决定周游全中国 , 将每天看到的新事物、新知识记录下来 , 经过三十余年编成了《日知录》 。
受顾炎武的影响 , 宋謌平发现 , 如果能每天找到一两件事让自己保持积极乐观的状态 , 对于一个人长期坚持投入某项工作将非常有帮助 。 换句话说 , 你要学会“自己逗自己玩” 。
而“自己逗自己玩”的前提是“独立与独处” , 这里并非指社交或物理意义上的隔离 , 也不是大家常说的经济独立 , 而是精神上的独立 。 在宋謌平看来 , 作为一名治学者 , 保持着好奇心 , 不断追寻 , 需要有自己独立的人格 , 在精神层面能够坚持 , 对外与人沟通顺畅 , 对内怡然自得 。
反观周遭 , 有些人在专业层面、宏观大势层面都相当有见解 , 但能够用心向内观察自己的时候并不多 , 甚至不少人对娱乐自己存有误解 。 宋謌平所提倡的“娱乐”自己 , 不是简单的吃喝玩乐 , 而是挖掘自己的兴趣点 。 这个兴趣点可大、可小、可雅、可俗 , 但总能看到让自己欣喜的新知识 , 总能去做让自己愉悦的兴趣之事 , 在无形当中 , 其实就形成了自己的学习模式 , 宋謌平将其称为“细水长流模式” , 很多新事物、新知识就像海绵吸水一样 , 不经意间就渗入了个人的血液中 。
宋謌平表示 , 自己的这一模式可能得益于小时候的经历 。 宋謌平的父亲是一位书法爱好者 , 所以从小学开始他就跟随父亲学习书法 , 尽管表现不错 , 但也只是一个初级玩家 。 不过这样的经历 , 却让宋謌平体会到了“在玩耍中学习”的乐趣 , 并将这个习惯不经意间扩展到了工作、生活的所有领域 , 让他总是能够以放松的心态面对一切:学习、坚持、面对挑战…… 所以 , 有人可能会疑惑那么枯燥而单调的科研生活 , 他怎么能够坚持几十年不变?不会乏味吗?不会有瓶颈么?但在宋謌平而言 , 这些都不是问题 。
另类思考 , 探寻事物隐藏的本质 1965年诺贝尔物理学奖获得者 Richard Feynman 曾受邀到贝尔实验室进行量子计算的演讲 , 宋謌平便从 Feynman 身上学到了另一种思维方式 。 Feynman 在加州大学任物理学教授时 , 就曾尝试不使用微积分来教大一物理 , 他用简单的数学和更直观的方式 , 让学生感受学习物理的快乐所在 。 当 Feynman 来贝尔实验室做演讲时 , 宋謌平对演讲内容不甚理解 , 却自此爱上了 Feynman 的演讲方式——用最简单的语言去描述一件事物的本质 。

本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发
文章图片
2001年宋謌平接待日本 ATR 到美国贝尔实验室访问的松井知子博士(照片拍摄于贝尔实验室研究总部大门口)
“不要被传统的习惯和思维所束缚 , 在了解新事物、学习新知识的时候 , 其内在的本质比名词更重要 , 在字面之后隐藏着更多知识与内涵 。 就像水一样 , 表面来看它是流动的、不能根据容器来定义形状 , 但如果探究其背后的本质会发现 , 水能够以液体、固体与气体形态出现 , 所以不要被表象所迷惑 , ”宋謌平说道 。
因此宋謌平认为 , 成为科学家本身就是一件很有趣的事 , 无论是科学家、研究者还是工程师 , 都是在努力发现本质、再创新 , 使之为人类所用和提升人们的认知水平 。 “如果我们能够以放松的心态去追寻科研的本质 , 做研究就最让人开心 , ”宋謌平表示 。 这也是为什么他在这个年纪仍然选择做研究的原因 , “三岁为翁 , 百岁为童”学习当与年龄无关 , 才是他想要的状态 。
研究与论文 , 就是生活中的茶米油盐 很多人都会认为做研究、写论文非常高深 , 但在宋謌平眼里 , 它们与日常生活密切相关 , 生活中看到的规律 , 在科研中一样存在 , 不要把他们割裂 , 工作和生活完全可以融为一体、互相促进 。
技术研究:发现其与生活的内在联系 目前 , 宋謌平所在的微软亚洲研究院语音组正在研究序数回归算法 , 并将其转化用于微软小英这个辅助英语学习的 AI 产品以及微软 Azure 与语音相关的服务中 。 而在第一次看到序数回归时 , 宋謌平其实并不完全了解它 , 不过在学习之后他发现 , 关键不只是一个回归问题 , 还伴随着另一个有趣的话题——作为算法的创造者 , 研究员们一直在想方设法找到相关度量或方程式 , 以期望通过最简单的方法实现最好的优化 , 但在生活中 , 不是所有东西都是客观、可测试的 , 还存在了主观感受 。
例如 , 日常的英语演讲比赛需要评委打分 , 从1-5分中给出分数 。 评委可能会今天给3分 , 一觉醒来又变成2分或4分 , 主观评价会随心情不同而有所变化 。 同时 , 还要考虑新评委、新评分加入的可能 。 这种情况下 , 就需要改变方法 , 对评委进行偏好测试 。 而如果将平均意见分数和偏好测试都应用于序数回归算法中 , 那么语音编码、语音合成就容易得多 , 之后再将不同的编码或合成样本放到语句中 , 组合成不同句子 , 再次进行评分排序 , 复杂度就降低了很多 , 计算机将可以更好地完成这项工作 。
其实无论是语音合成的发音 , 还是图像、视频好坏的标准评判 , 都存在主观的判断 。 早年在美国的中文学校教孩子们学中文时 , 宋謌平就对此深有体会 , 现在将这些生活中的体会运用到研究中 , 探索将主观指标转换成数字上可优化的方法 , 他觉得非常有意思 , 这也成为微软小英将想法变成现实的最好的训练过程 。

本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发
文章图片
宋謌平(中) , 与微软亚洲研究院副院长田江森(左)以及微软亚洲研究院资深开发经理、微软小英项目负责人夏炎(右)
写论文就像做中国菜和写菜谱一样 总能从生活中获得灵感的宋謌平还发现 , 写论文与做饭的本质很类似 , 尤其是做中国菜、写中国菜谱 。 他分享了这样一则故事:
上个世纪30-40年代 , 时居美国的现代著名学者、语言学家、音乐家赵元任先生 , 他的妻子杨步伟非常擅长厨艺 , 久而久之便萌生出写菜谱的想法 , 教外国人学做中国菜、点餐或是选择食材 。 最初食谱是用汉语写的 , 后由赵元任和女儿翻译成书 , 在文字的翻译中 , 也可以一探做菜的讲究 。
例如 , “滚刀块” , 是指滚动原材料 , 如茄子、土豆 , 通过斜刀的方式将其切成大致相同的块状 , 因此翻译成英文应该是“Rolling knife ingredients”;中国烹饪中的“炒” , 赵元任却给出了一长串的翻译 , “Big fire, shallow fat, continuous stirring, and cut up material with wet seasoning , quick frying” , 也就是大火、少油 , 持续搅拌 , 然则将食材切块加入酱汁快炒 。 最终他用了很别致的两个英文词 “stir fry” 。
在宋謌平看来 , 写论文与做中国菜有异曲同工之妙 , 就如自创菜式 。 想要写一篇论文 , 首先需要收集其他相关论文 , 可以认为是食材 , 所处年代、研究方向都无所谓 , 然后进行筛选 , 最后再钻研自己的烹饪方法 。

本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发
文章图片

“筛选食材”的过程 , 宋謌平给大家提供了一种方法——猜答案法(Guesstimate) 。 看到一篇论文 , 不要着急阅读全文 , 先只查看标题 , 看是否可以猜出论文的大概内容;再读摘要 , 查看是否漏掉了哪些信息 , 然后根据摘要继续猜测;最后再仔细阅读全文 , 验证此前的猜测是否正确 。 有了这个猜测的过程 , 猜错的话也不要紧 , 你可以获得一个新的想法或新的算法;而猜对了就表示你能顺藤摸瓜直奔答案 , 尤其是作为编者 , 你的二次产出将会在思想上获得新的认知 , 同样的问题解决不会再照搬复制 , 更有可开辟的新的方法 。
在今天碎片化信息过剩的时代 , 研究人员都要研读成千上万篇的论文 , 如果用上述方法去做自己的论文 , 则可以事半功倍 。 宋謌平还强调 , 在遵循“猜答案法”时 , 也要像做序数回归研究一样的优先级设置 , 从而做好时间管理 , 进一步提高效率 。
追求极简主义 , 就是一个创新的过程 “在画布上 , 任何东西的存在 , 如果没有建设性 , 一定有破坏性 。 ”画家林风眠的这句话宋謌平一直记在心里 , 虽然这是在谈艺术 , 但对于科学研究 , 这个道理也是相通的 。
宋謌平在美国教中文时就有过类似的体会 。 对于母语是汉语的宋謌平来说 , 教中文他本来信心满满 。 最初 , 他先教孩子们注音符号 , 不用汉语拼音 , 但过了一个暑假 , 孩子们通通忘光;痛定思痛 , 他改为教汉语拼音 , 并发现孩子们非常喜欢 , 而且因为汉语拼音与英文字母更相近 , 所以孩子们容易记忆 , 即使长假过后仍然能够记住 。
无独有偶 , 宋謌平在日本交换研究访问时 , 沟通中也看到了类似的现象 。 一方面 , 日本的汉字与中文相似 , 意思也很相近 , 另一方面 , 日语中很多的外来语 , 由其它语言简化而成 , 例如 , “ パソコン(个人电脑)”就是 “Personal Computer” 的简化 , “ テレビジ(电视)”就是 “Television" 的简写 。 基于这些发现 , 再结合上文提到的猜答案法 , 宋謌平很快就适应了这门异国语言 , 可与日本朋友无障碍交流 。

本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发
文章图片
宋謌平于1987-1988 年在日本 NTT-EC 研究所交换访问时 , 与接待主人古井贞熙博士合影
这种贴近事物本质的学习方式 , 宋謌平称之为极简主义 。 “大道至简 , 追求极简主义的过程本身就是一个创新与归纳的过程 。 如何用最少的原则、定理 , 解释最多的现象 , 这在人工智能研究的多个领域都十分重要 , ”宋謌平说 , 例如机器学习和模型算法的训练 , 就在研究如何使用少量的参数来整理与记忆大数据集 , 减少过度的训练和计算资源的消耗 , 以找到更高效、低成本的训练方法 , 让 AI 系统更加强大 , 而不是无限堆叠算力或数据 。

本质|宋謌平:探寻科研,当如三岁之翁,百岁之童 | 我在微软做研发
文章图片

    推荐阅读