微软被爆“偷听”用户录音,我们需不需要担心泄露隐私( 三 )
CNN认为,AI并不是魔术,各大科技公司推出的语音助手背后,都是机器学习算法模型在提供支持,而在训练算法模型的过程中,必须收集足够数量的语音数据,并交给人类进行标注,数据标注得越准确、数量越多,模型的效果越好。
简而言之,语音助手的进步,离不开人的介入,而人在介入过程中,又势必会接触到原始语音数据。
问题是,作为语音助手的用户,势必不愿意自己和AI对话的内容,在自己毫不知情的情况被另一个陌生人听到。
绕不开的人工数据标注
在几大科技巨头被爆陷入“偷听门”的事件中,都可以看到第三方外包公司的身影,这是数据标注的特点决定的。
目前的机器学习,通常使用的是监督学习,这需要有标注的数据来作为经验。而“数据标注”的对象则集中在文本、图片、音频、视频四个种类。
比如,图片标注包括了图像分割、物体检测、图像语义理解、图像生成、图片加注等标注方式;音频标注包括对方言、特殊情景语音进行识别标注等。
推荐阅读
- 微软|微软Xbox 20周岁了,但这些密辛你未必知道
- 微软|热血传奇:54级巨战《恩比德》,5万的裁决用来挂机好吗?
- 微软|【多图杀猫?】IGN满分大作《极限竞速:地平线 5》今日正式发布
- 魔兽世界怀旧服|提前试玩《战地2042》为EA Play和Game Pass用户提供了机会
- 电子竞技|印尼1.16亿游戏用户,“电竞”成为吸金行业
- Xbox|微软上季度游戏收入增长5亿美元,Xbox销售收入飙升166
- Xbox|曝微软正制作“少林”游戏 由《热血无赖》开发者与Xbox合作开发
- 太空狼人杀|《太空狼人杀》将登陆索尼和微软的游戏平台,基础售价29.99美元
- 网游|iPhone老用户玩游戏首选,用“物理外挂”轻松上王者
- playstation5|微软XGP游戏库10月下旬追加游戏公布,PS5国行光驱今日行情4589元