拓展你的视野!UCLEMNLP 2021Or ucla( 二 )
文章插图
文章插图
我们后面从两个方面分析了产生这种表现差异的原因:
- 具有地区特征的场景:我们在 GD-VCR 中标注了图像的场景标签,所以我们可以借助标签将不同地区同一个场景的图片放在一起进行比较。我们观察到,对于经常涉及地区特征的场景(例如婚礼,节日等),性能差距要大得多,约为8%-24%。但是,对于一些世界上普遍存在且比较相似的场景,模型的性能差距仅为0.4-1.3%。

文章插图
(具有地区特征的场景与其他场景上模型表现差异对比。字体越大表示模型表现差异越大。红色场景差异大于8%,蓝色场景差异小于8%。)
- QA pair 的推理层次:在介绍推理层次之前,我们可以先思考模型什么时候会失败。我们认为可能有2种情景。“情景1”是,模型在早期甚至无法识别非西方图像的基本信息。“情景2”是,模型在基本视觉信息的识别上效果不错,但最终由于缺乏特定区域的常识而最终失败。

文章插图
推荐阅读
- 说出你的故事|2021年这一年你过得如何?虎年一起参加余额宝“年年有余”活动吧
- 监听|手机有这十种情况可能是被监听了,你的手机出现过吗?
- 店铺|当心!你的旧手机可能会泄露个人隐私数据,提前清空也没用
- 造物节|在3万平的密室逃脱里追INTO1,淘宝造物节真有你的
- 被访者|疫情期间最适合你的用研方法:远程可用性测试
- 大数据|你的APP被大数据支配了吗?国家发布重磅新规,限制个性推荐
- 援疆|浙江援疆:电商赋能打造“十网百店”拓展线上市场
- 小雷|微信也来凑热闹?你的专属2021人生报告来了,点击查收
- 刷单|“好评返现”行为被叫停,你的包裹还能收到“返现卡”吗?
- 电话费|怎么判断你的手机是否存在“病毒”, 它们会悄悄的窃取你的个人信息!