大数据|大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯
文章图片
文章图片
文章图片
虽然事不关己 , 但是作为一名合格的吃瓜群众 , 想必不少人都时不时刷新着美国的大选结果 , 毕竟猜M国总统可比刷段子有趣多了
一边是人称建国、号称没有人比自己更懂xx的懂王特朗普 , 另一边是做了几年副总统平平无奇、被怀疑老年痴呆的睡王拜登 , 这两个人放在一起竞选美国总统就已经足够具有戏剧性了 , 而让这场大选变得更加有趣的 , 则是从未迟到的“打脸”与“反转”
大数据与民调其实早在这场大选开始之前 , 赌场、民调、经济学家、分析师、大数据公司等就已经开始预测了 , 而今年的情景 , 似乎与四年前特朗普大战希拉里颇为相似:
所有的媒体、民调机构和大数据预测结果都显示 , 2016年大选将毫无疑问地由希拉里胜出 , 希拉里将成为美国历史上第一位女总统
然而最终的结果却让人大跌眼镜 , 起初丝毫不被看好的特朗普 , 竟然一口气拿下6个摇摆州 , 绝境反击 , 成功上演丝血反杀的好戏!
【大数据|大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯】而结果就是 , 大数据系统和民调顿时被骂的狗血喷头 , 世界的吃瓜群众都表示很受欺骗
恰逢今年 , 美国经历了黑人运动、新冠疫情、移民风波等等数场混乱不堪的事件
特朗普的支持率因此一路走低 , 美国著名媒体The Economist甚至预测 , 大选时拜登的获胜率将超过97%
而大数据系统和民调机构也表示 , 今年的预测算法已经进行了修正 , 预测结果可靠率将高达80%以上 , 不会出现上次的乌龙事件
那么今年大选前 , 民调大数据系统给出的预测结果是什么呢?
拜登将在大选中获胜 , 成功当选新一届美国总统 , 特朗普将遭遇滑铁卢
民调大数据的依据似乎也十分科学 , 各种民调机构将定期对不同地区的民众进行调查 , 然而结合美国大选的规则、民主共和两党的区域划分、基于往年的大选规律、结合大数据预测算法 , 最终得出一个较为合理的结果
这么看 , 似乎民调大数据的结果会是十分合理的
一如既往地打脸事实上也似乎如此 , 因为大选开始前 , 拜登基本上确定已经手握210张选票 , 距离美国宪法规定的“270张即可获选总统”的规定数额 , 仅仅差之毫厘
而特朗普的情况就悲惨很多了 , 6个摇摆州中只要有一个没有拿到 , 就非常有可能败选
而特朗普要想赢 , 就必须拿下从德克萨斯到宾夕法尼亚的所有摇摆州 , 难度难以想象
而其中最重要的关键票仓——俄州、德州、宾州、佛州 , 拜登的民调情况又占优 , 可以说拜登几乎是具有极大优势的
而拜登则只需要赢下宾夕法尼亚就能锁定胜局 , 这场大选似乎已经提前板上钉钉了
然而 , 谁也没有料到 , 今天的美国大选竟然会如此惊心动魄 , 且富有戏剧性
大选刚刚开始 , 拜登与特朗普的争夺的确非常激烈 , 拜登的优势发力很猛 , 不少摇摆州都开始出现浅蓝 , 说明拜登的支持率较高
连关键票仓德克萨斯都翻蓝了 , 估计没人会怀疑民调的准确性了
然而 , 仅仅一个上午过去了 , 广大吃瓜群众却发现 , 那些翻蓝的摇摆州竟然开始变成浅红 , 最后竟然全都翻红了!
特朗普再次在摇摆州中获得了完全的胜利 , 截止到发文时 , 特朗普已经基本拿下了摇摆州中的关键选票
虽然拜登明面上还有着12票的优势 , 但是明眼人都能看出来 , 后面的票仓中拜登能拿到的选票寥寥无几
得摇摆州者得胜利 , 这是美国大选规则下不变的真理
这场“闹剧” , 十有八九是特朗普以成功者的姿态收场
哪怕最终出现了一些不可抗的事件 , 让拜登以微弱的优势获胜 , 这次大选也足够让美国的民调大数据系统 , 脸面尽失了!
大数据没用了吗连续两次的失误 , 让民调大数据的可信度迅速低到了令人发指的地步 , 甚至成了过街老鼠 , 人人喊打
按理说 , 美国的民调大数据系统应该是相当科学的 , 但是为什么会出现这么多乌龙事件呢?
其实 , 很多人都会有一种误解 , 认为大数据系统的结果真实性 , 来自于算法与实际情况的高度拟合性和契合性
但我们在做数据分析、数据挖掘或者其他与数据相关的工作时 , 首先都要保证数据来源的真实性与可靠性
就拿这一次美国大选来说 , 民调大数据系统所依赖的数据源 , 是来自于各个州的民调情况 , 以及该州往年的数据情况 , 比如哪些州一直都是民主党的票仓 , 哪些州一直都是共和党的铁杆
但是这种数据源的真实性却十分值得考究:
比如 , 会不会出现口头上支撑拜登 , 暗地里却给特朗普投票的情况?
当然有 , 而且这种情况或许非常多 , 因为特朗普的激进支持者有多烂 , 大家都懂得
比如 , 会不会出现幸存者误差的情况?
当然有 , 特朗普的支持者中有很大一部分是农民、农场主 , 分布地区多为偏远的山区等 , 大数据系统难以保证这个人群在民调当中的有效占比
比如 , 各州的历史数据会不会产生误差?
当然会 , 尤其是近几年美国各州之间的移民情况相当频繁 , 就以德克萨斯州为例 , 德州一直都是共和党的老窝 , 然而今年德州票仓的争夺却异常激烈
原因就在于很多人受不了加利福尼亚州的高税环境 , 有钱人和流浪汉同时涌入了德克萨斯州中 , 导致了民主党选民的迅速膨胀 , 这就是历史数据的偏差
当然还有非常多的其他情况会导致数据产生偏差 , 都是在于数据源的处理上 , 是否真的具有强说服力 , 是我们做数据分析中最苦难、也是最重要的工作
这些工作 , 远远不是那些民调大数据机构改改权重系数就可以解决的 , 反而让这次的预测更加的离谱
推荐阅读
- 捉迷藏|?LOL世界赛“含金量”数据出炉:EDG仅排第六,IG稳居榜首
- 碧蓝航线|碧蓝航线SR重巡福煦数据详解 期待越高失望越大 强度平平无奇
- kramer|国服极地大乱斗数据上线,来看看胜率榜符合你的预期吗?
- 米莱狄|峡谷数据榜:分均输出TOP5,干将莫邪只排第四,米莱狄至今被误解
- |S11淘汰赛数据盘点:场均时长为33分 55个不同英雄登场
- 中单|2021年英雄联盟世界赛终于落下帷幕!!大数据统计二!!
- 灵饰|梦幻西游:109级法系前排灵饰选择方法,用数据告诉你怎么做
- 卡牌|S11淘汰赛数据出炉,卡牌24场全被ban,压刀最多竟是辅助
- edg战队|堡垒之夜国服将清除数据,EDG创造队史晋级S11世界赛决赛
- 原神|原神:流水预测数据还在变化,日本的预估流水,倒是有了小状况