让谷歌折戟的AI流行病预测,在今天如何被创业公司攻占?( 五 )

二、搜索引擎演化

同时搜索引擎的模式也并非一成不变的 , 谷歌在2011年之后推出“推荐相关搜索词” , 也就是我们今天很熟悉的搜索关联词模式 。

比如针对流感搜索词 , 给出相关寻求流感治疗的list , 2012年后还提供相关诊断术语的推荐 。 研究人员分析 , 这些调整有可能人为推高了一些搜索 , 并导致谷歌对流行发病率的高估 。 举例来说 , 当用户搜索“喉咙痛” , 谷歌会在推荐关键词给出“喉咙痛和发烧”、“如何治疗喉咙痛”等推荐 , 这时用户可能会出于好奇等原因进行点击 , 造成用户使用的关键词并非用户本意的现象 , 从而影响GFT搜集数据的准确性 。

而用户的搜索行为反过来也会影响GFT的预测结果 , 比如媒体对于流感流行的报道会增加与流感相关的词汇的搜索次数 , 进而影响GFT的预测 。 这就像量子力学家海森堡指出的 , 在量子力学中存在的“测不准原理”说明的一样 , “测量即干涉” , 那么 , 在充斥媒体报道和用户主观信息的搜索引擎的喧嚣世界里 , 也同样存在“预测即干涉”悖论 。 搜索引擎用户的行为并不完全是自发产生 , 媒体报道、社交媒体热点、搜索引擎推荐甚至大数据推荐都在影响用户心智 , 造成用户特定搜索数据的集中爆发 。

推荐阅读