2018 年度 GtiHub 开源项目 TOP 25:数据科学 & 机器学习(18)

NLP 这部分,我就不得不提 BERT 了。谷歌 AI 的这个开源项目为 NLP 领域带来了突破,赢得了 NLP 爱好者以及专家等人的强烈关注。继 ULMFiT 和 ELMo 之后,BERT 以它的性能战胜了比赛,在 11 项 NLP 任务中获得最佳成绩。

除了我在上面附上的谷歌开源项目的官方链接,BERT 的 PyTorch 实现(查看地址:https://github.com/huggingface/pytorch-pretrained-BERT)也值得前往一看。至于它是否让 NLP 步入了一个新时代,我们不久后就会知晓了。

MatchZoo

开源项目:https://github.com/NTMC-Community/MatchZoo

2018 年度 GtiHub 开源项目 TOP 25:数据科学 & 机器学习

MatchZoo 能帮助你知道模型在某个基准上表现得怎么样。对于 NLP,尤其是深度文本匹配模型,我发现 MatchZoo 工具包非常靠谱。MatchZoo 可应用的其他相关任务包括:

对话问答文本蕴涵信息检索释义识别MatchZoo 2,0 版本目前还在开发中,因此不妨期待一下这个已经很有用的工具箱再增加更多新的功能。

推荐阅读