刘知远:多项NLP算法,架起"机器"和"自然语言"间桥梁 榜单人物( 四 )

在传统深度学习方法发展如火如荼的时候 , 刘知远没有盲目跟踪热点 , 深度思考深度学习缺乏可解释性等严重缺陷 , 探索知识指导的自然语言处理框架 , 在非常多的任务中能够看到 , 引入外部的知识之后 , 能够在这些任务中取得非常显著的性能提升 。

除了学术研究上的突出贡献 , 刘知远同样注重理论研究的实际应用 。 他根据博士成果完成的微博关键词抽取应用 , 曾获得500余万注册用户和3000多万次应用 。 致力于研制自然语言处理工具包60余项 , 包括中文词法分析工具包 THULAC、 中文文本分类工具包 THUCTC、知识表示学习工具包 OpenKE、知识获取工具包 THUNRE、网络表示学习工具包 OpenNE、关键词抽取工具包 THUTag 等 。 这些工具包已获数百家国内外研究机构与公司采用 , 在 GitHub 上获得超过 1万多星标关注 , 对NLP的研究与应用发挥了极大推动作用 。

也许是在身为教师的爷爷的耳濡目染下 , 刘知远很早便立下了从事教师职业的志向 。 谈及学术研究与人才培养 , 刘知远是这样认为的 , “做高水平研究 , 其实是培养人的一个途径 。 你想培养高水平的人才 , 那你就一定是通过做高水平研究来完成 , 所以我觉得两者是相辅相成的 。 ”刘知远因此更倾向于做一些比较基础的研究 , 这样能够让同学的能力和潜力得到比较大的发挥 。 “高校最重要的还是培养人 , 它本身承担着要持续为社会培养高水平科技人才的任务 。 ”

推荐阅读