原创<br> 高尚大的人工智能背后:真的只是单调、枯燥和密集劳动吗?( 二 )

海量数据,为什么依靠人工来贴标签?

在电子信息时代以前,因缺乏合适的记忆载体,大自然的数据和人类的行为,绝大多数是没有被记录和保存的。现在,随着移动互联网的发展,信号无处不在,手机又是随身携带的,以至于,我们的任何行为都会被记录下来,形成或有价值或无价值的数据,如微信会记录下用户每天的步数,还给他们弄个排名,以刺激其加强锻炼;网络购物则会知晓消费者的喜好,从而在合适的时间推送出合适的商品;滴滴打车常年追踪着乘客经常去哪里,一来二去就能计算出一些“打车最佳路线”等等,但显然,单凭借这些自然地、无意识的数据,还远远达不到人工智能的远景目标,依旧需要大量的人工来“制造”数据。

毫无疑问,未来人工智能应用最广泛的领域,就是那些基于“经验”的领域,比如中医领域,无论它多么神秘或者高深莫测,本质上就是“不太复杂”的大数据:神农氏尝百草,就是收集数据的过程,而古代治疗疑难杂症,就是要不断地尝试,直到找到可以治愈疾病的良药,在可预见的未来,有很大一部分的医疗诊断,都会交给人工智能,机器扫描病人之后,只需要从数据库中找到对应症状即可,但在人工智能足够聪明之前,人类需要先将“数据传授给机器”,如印度的一位女工,拿到一段结肠的医疗视频之后,会利用自己的专业知识寻找到其中的“息肉”,即大肠中可能导致癌症的小肿块,看起来有点像黏糊糊的痘痘。当她们找到息肉时,就用电脑鼠标和键盘标记,在这个“凸起”周围,画一个机器能识别的圆圈,之后,当人工智能扫描到这个圆圈时,就能做出判断:恩,这就是息肉。

推荐阅读