拆解XLNet模型设计,回顾语言表征学习的思想演进( 二 )
所以我们要解决的问题便是:
怎么确定 (输入输出) 对,即模型的预测任务
这个模型怎么设计
2. 分布式语义假设
任何任务都可以用来做表征学习:情感分析 (输入句子,判断句子是正向情感还是负向情感),机器翻译 (输入中文,输出英文)。但是这些任务的缺点是需要大量的人工标注,这些标注耗时耗力。当标注量不够时,模型很容易学出"三长一短选最短"的取巧方案 -- 但我们想要的是真正的语言理解。
所幸语言学的研究中有一个重要的假设 --分布式语义假设 (Distributional Hypothesis):
One shall know a word by the company it keeps.[1]
我们可以通过一个词出现的语境知道这个词的意思。
所以我们可以将输入 x 定为目标词的语境,输出 y 定为目标词。这个任务的优点是我们并不需要人工标注的数据,只需要许多有意义的语段就可以了 -- 而在信息爆炸的互联网时代,这种数据是取之不尽的。
推荐阅读
- 魔兽世界怀旧服|这款盼了好久的模型级别机甲积木终于来了
- dota2|DOTA:为什么很多dota1玩家以dota2模型太丑画风不好拒绝玩2
- 双城之战|《双城之战》上线在即,LOL女警迎来模型升级,全部皮肤升级更新
- 白鲨|?打破GameFi“死亡螺旋”的困境,浅析Murphy的经济模型
- 黄忠|王者荣耀:5款返场皮肤提前锁定,6位英雄加强解析,金蝉模型更新
- 孙尚香|?王者荣耀:备好88碎片!水果甜心加入碎片商店,新模型特效美翻了
- ttg|原神:新角色一斗模型曝光,首个五星岩系大C登场?新武器属性一览
- 原神|原神:关于心海的几件事,别只看模型,策划强抬是有原因的!
- 雷神|原神:草神设计图曝光?多个人物模型确认,稻妻地图太“阴间”了
- 原神|原神:新5星角色埃洛伊值得培养吗?拆解技能机制,告诉你答案!