数据挖掘助奥巴马连任 大数据左右美国政界

大数据1年前 (2023)发布 aixure
60 0 0
导读:11月8日消息,《时代》周刊网站刊文指出,数据挖掘团队为奥巴马的连任立下了汗马功劳,政治领域的大数据时代已经到来。 以下为文章概要: 晚春时节,奥巴马竞选团队背后的数据专家注意到,明星乔治克鲁尼(George Clooney)对于年龄在40-49岁的美西地区女性…

  11月8日消息,《时代》周刊网站刊文指出,数据挖掘团队为奥巴马的连任立下了汗马功劳,政治领域的大数据时代已经到来。

  以下为文章概要:

  晚春时节,奥巴马竞选团队背后的数据专家注意到,明星乔治·克鲁尼(George Clooney)对于年龄在40-49岁的美西地区女性颇具吸引力。她们也是最愿意为了和克鲁尼——当然还有奥巴马共进晚餐而掏钱的人。

  他们的发现是正确的,乔治·克鲁尼为奥巴马举办的竞选筹资晚宴成功募集到1500万美元。

  他们也对为了奥巴马连任而在过去两年中收集到的其他数据进行了分析,奥巴马的竞选高参们决定利用这些分析结果。他们希望在美东复制克鲁尼效应。最终,他们选中了女明星莎拉·杰西卡·帕克(Sarah Jessica Parker),只要愿意掏钱,就能和奥巴马一起在帕克的家中用餐。

  大众并不知道数据挖掘对竞选策略的贡献,数据挖掘发现:大众喜欢竞标、小型晚宴和名人。

  核代码

  竞选团队经理吉姆·梅西纳(Jim Messina)从一开始就希望把这次竞选变成一次完全不同,并以度量来推动的竞选,政治仍是目标,但政治天分却不再是手段。

  “我们将度量竞选活动中的所有元素,”梅西纳在成为竞选经理后说。他此次雇佣的数据分析团队人数是2008年的5倍,并任命数据挖掘专家雷伊德·甘尼(Rayid Ghani)为芝加哥总部首席科学家。

  数据挖掘团队的具体任务并未对外公开,竞选活动发现人本·拉伯特(Ben LaBolt)说,那是我们的核代码。数据挖掘团队会定期向奥巴马和他的竞选高参报送他们的发现,但具体内容外界无从知晓,他们把手中的数据视为相对于罗姆尼团队的最大优势。

  11月4日,几位高级竞选顾问匿名对我们表示,通过大量的数据挖掘工作,他们帮助奥巴马筹集到10亿美元、调整了电视上的精准投放广告、创造出了摇摆州选民的精细模型。

  10亿美元

  尽管奥巴马在2008年的竞选中对技术的应用赢得了不少赞扬,竞选活动中数据库过多的弱点却无法被忽视。当时,在竞选团队中不同的部门之间从不分项数据。这一回,竞选团队在最初的一年半时间里把各种数据合到一起,制作了一个包含各类信息的大数据库。

  新的大数据库并不会直接告诉竞选团队如何寻找选民,但是数据挖掘团队却能利用这个数据库来进行分析,针对不同类型的选民测试不同的宣传策略。竞选办公室的电话表上列出的不仅是电话号码,还有他们被说服的可能性,这对于竞选团队而言是最宝贵的信息。

  “我们能够预测谁会在线捐款,我们能够对那些会通过邮件捐款的人和志愿者进行建模,”一位高级顾问说。他表示,建模预测的做法是相对于2008年大选的重大进步之一,大大提升了团队效率。

  网上筹资活动很大程度上依赖于复杂的邮件宣传,数据收集和分析在其中再次发挥了重大作用。米歇尔·奥巴马的邮件在春天最受欢迎,而竞选负责人梅西纳的邮件有时比副总统拜登的更有效。

  产出预测

  在筹资活动结束之后,数据挖掘团队转向选情分析。他们通过4个来源的民调数据来详细分析关键州的选民。一位官员说,通过对俄亥俄州2.9万选民的民调数据,他们可以深入分析各个族群的选民在任何时刻的趋势。在总统候选人的第一次辩论之后,他们分析出哪些选民倒戈,哪些没有。通过对这个数据库的分析,他们在10月发现,大部分俄亥俄州选民并非奥巴马的支持者,而是因为罗姆尼的失误而倒戈的人。

  一位高级官员说,他们每晚要实施6.6万次模拟选举,正是这些模拟选举推算出了奥巴马在摇摆州的胜率,并让他们得以通过这些数据来分配资源。

  这次竞选活动中,他们也首次尝试在Facebook上复制传统的上门宣传活动。在最后几周,下载相关应用的人们会收到带有他们在摇摆州的友人图片的信息,告诉他们只需点击一个按钮,就能鼓励这些朋友们登记参选、早点投票或是参与民调。收到信息的人们当中有五分之一会有所响应,这很大程度上是来自熟人效应。

  数据挖掘同样决定了竞选团队对广告的购买。梅西纳决定依赖内部的大型数据库作出决策,而非相信外部媒体顾问。竞选团队通过一些复杂的模型来精准定位不同选民,他们购买了一些冷门节目的广告时段,而没有采用在本地新闻时段购买广告的传统做法。芝加哥竞选总部的数据发现,广告效率相比2008年提高了14%。

  数据挖掘还决定了奥巴马在竞选后期应当在什么地方展开活动。今年8月,奥巴马决定在社交新闻网站Reddit上与网民互动,很多高级顾问对此一片茫然,他们得到的回答是“因为Reddit上有很多动员对象。”

  数据挖掘支持下的决策为奥巴马的连任立下了汗马功劳,并将成为研究2012年总统大选的重要元素。这意味着华盛顿的竞选专家的作用极具下降,能够分析大数据的量化分析专家和程序员的地位却大幅提升。

  一位官员说,“人们坐在屋里抽雪茄,高喊‘买《60分钟》’”的时代已经结束。政治领域的大数据时代已经到来。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...