谷歌AR工具Google Lens登陆全球Google Go市场,带来更好的理解能力( 五 )
挑战的一部分是,翻译后的文本可能比原文短得多或长得多。例如,德语句子往往比英语句子长。为了实现这种无缝叠加,Lens将译文重新分配到相似长度的行中,并选择适当的字体大小进行匹配。它同时能够匹配翻译的颜色及其背景。Lens可以分类像素是表示背景还是文本,然后从这两个区域中采样平均颜色,从而确保翻译文本与原始文本匹配。
5. 诵读文本
Google Go的Lens的最后一个挑战是大声诵读文本。系统利用谷歌的文本转语音(TTS)技术来生成高保真音频(一种应用机器学习来消除歧义的服务),并使用它来生成基于DeepMind WaveNet的真实语音。
当与屏幕配对时,它们将变得更具情景性和实用性。Lens利用来自TTS服务的定时注释来标记每个单词的开头,从而在诵读时突出显示屏幕的每个单词,就类似于卡拉OK机。例如,用户可以捕获不同按钮有着不同标签的ATM屏幕图像。这种卡拉OK效果将允许用户知道哪个标签适用于哪个按钮。它同时可以帮助用户学习如何发音相关单词。
6. 展望未来
谷歌表示:“我们希望这些功能可以对数百万人的日常生活产生积极影响。展望未来,我们将继续对这些阅读功能进行更新,包括改进文本结构理解(例如多列文本)和识别印度语脚本。在我们解决这些文本挑战时,我们继续寻找集合机器学习和智能手机摄像头的新方式,从而帮助改善人们的生活质量。”
推荐阅读
- 魔兽世界|暴雪嘉年华内容遭泄露,引玩家众怒,魔兽世界成捞钱工具?
- canyon|恐怖的中野联动!许秀给Canyon当工具人,DK扳回一城
- 魔兽世界|暴雪嘉年华原定内容泄露,5个魔兽世界同步推进,wow变捞钱工具?
- 漫威银河护卫队|中日巅峰对决!日本Google Play年度最佳游戏提名,看点十足
- 马戏团|剑与远征:新英雄曝出,造型酷似工具人,两款新皮齐上线春姑火了
- 打野|王者荣耀:本赛季还是工具人法师的天下,虽然法核能玩,但不推荐
- 原神|米游社的原神版块有什么?旅行工具和签到系统对玩家帮助很大!
- 猫神|KPL猫神沦为抵债工具?阿泰开播爆料: RNGM买6.6没给钱,拿猫抵债
- mod|《CS》最好玩的七个版本,MOD模组是个强大的工具
- 冲浪|阴阳师SP浪川削弱后强度详解 无脑人权卡即将变成二流强度工具人