上周末,英美两国的媒体,爆出了一则与Facebook脸书有关的大新闻。
报道称,一家名叫Cambridge Analytica剑桥分析的数据分析公司,通过为脸书平台开发的性格小测试程序,收割了超过5000万的用户数据。
并且,利用这5000万用户,操纵了2016年的美国大选。
(图源:Telegraph)
大概意思就是,这个公司针对每个用户的特点,尤其是那些偏中立不知道投谁的选民,投放洗脑政治新闻,进而最终将川普推向大选胜利。
(图源:Telegraph)
利用大数据给人洗脑?还影响选举?小小的一个脸书账号也能搞出这么多事儿?比起波澜诡谲的政治斗争,俄罗斯阴谋,在铺天盖地的报道中,我更在乎的是这个案件背后隐藏的大数据危机。
先给大家讲一下,它们如何抓取用户信息,又是如何操纵大选的大概过程:
2014年夏天,这个公司和一位剑桥的研究人员合作,展开了一项研究,抓取了大约32万用户的核心数据,这些用户的喜好,性格和交友圈信息,一览无遗。
(图源:YouTube)
在媒体披露的内部交流邮件中显示,各种用户信息从性别到智商,从政治倾向到工作信息,甚至脸用户是否自律严谨,都能够一一分析出来。
(图源:NYT)
具体如何操作,都基于剑桥大学研究人员Kogan开发出的一款,基于脸书平台的性格测试小程序“这是我的数字生活”。
Kogan和他的团队,以学术研究为名义,向参与测试的人,有偿征集所谓的测试答案,还在网站买广告位,推荐此款小程序。
实际上,在回答个人性格隐私的问题时,进入测试后,每一个使用者,都必须向第三方授权自己的脸书信息。似乎是一个我们平时经常遇到的画面,好像并没有什么大不了的。
(图源:Facebook 示意图)
第三方,就是Kogan所代表的小程序背后的剑桥分析。而授权的信息,不仅仅是参与测试用户的朋友圈信息,还包括他们朋友的资料。
据估计,每一个使用者都会带来额外的160位朋友的信息数据。
测试结束,他们拿到了接近32万个原始用户数据,然后每人至少160的好友,32万*160 = 5100多万!
这是个庞大的数字,2016年美国大选总有效票数也才1个多亿多一点,这5000万的作用有多大,可想而知。
(图源:FB)
(图源:Social)
得到这些数据的剑桥分析,建立了大型的分析模型,逐个分析用户的个人喜好和政治倾向。
这也被他们称为“Personality profiles性格资料”。在这些资料里,用户的教育信息、地理位置、喜欢的页面、情感状况、工作状况等都一一被记录下来。
接下来,便开始了“定制化”的洗脑过程。川普的竞选团队,从脸书的广告,和新闻推送计算出发,将有利于自己的消息和新闻定向,推送给潜在选民。
不知道投票给谁?Okay,给你推送希拉里的负面新闻,植入希拉里不行的概念。
我举个简单的例子,我们都知道希拉里是赞同接纳难民的,
如果据数据判断,一个用户他经常点赞批判接纳难民的相关内容,或者从该用户的交往人群,信仰等线索蛛丝马迹,大概推断此人反移民或者不支持接纳移民,
那么对他的主页频繁推送希拉里“接纳移民”的观点新闻,势必会让该用户产生对希拉里的反感。
(图源:Facebook)
喜欢耸动新闻?没问题,专门给你发送“震惊”类的内容,一次管饱。
(图源:Facebook)
当用户在潜移默化中,每天被推送阅读这些定制类的新闻时,你很难说他们不被影响。在大数据帮助下,川普团队潜移默化地影响了很多选民,这也成了他登上总统之位的强效助力。
(图源:NYT)
这一切,直到上周末,才被剑桥分析的前员工Chris Wylie揭露给公众,震惊世人的同时,也把脸书打的措手不及。
除了小扎被各种质问以外,脸书首席安全官决定辞职,英美两国的法律机构也纷纷计划问责。脸书的股价也在一天之内暴跌,小扎的身价缩水了60亿美元。
事实上,Facebook这种事,影响的不止是选举这样的大事件。大数据还在操纵我们每个人生活的方方面面。
首先,我们得谈谈大数据到底是什么?
简单来说,大数据就是利用海量信息,找到其中不易被人察觉的关联,并利用这种关联的分析方法。
想要从大数据中获利,离不开收集和分析信息。收集信息早已过了大张旗鼓搞调查的时代,现在的数据公司,已经都能做到无声无息地了解我们的生活。
这些公司做的第一步,就是收集数据。
我们在网络上的所有行为,每一次点赞,每一次分享,每一次浏览,都将成为被记录分析的数据。
(图源:uxpassion)
当代人手机电脑不离手,只要连接了网络,我们就在留下痕迹。
搜索引擎成了我们联通网络的大门,每次搜索,都会被看门的数据公司,记录下我们往哪个方向走。
(图源:elegenttheme)
搜索过游戏,就给你推荐游戏;消费过护肤用品,就给推送同类型产品;转发过汽车新闻,就给推荐汽车。
这种利用cookie搜集数据的方式,其实不是很新的技术了。最早的cookie在1994年就被设计出来了,最初只是想让用户在自己的电脑上,记录访问服务器时的状态。
现在的cookie也是一样的功能,大家访问购物网站的时候,网站在你的电脑上记录下你浏览的信息,再次打开这个网站时,网站就可以读取cookie了解到你之前做了什么。
比如有东西加到购物车还没结账,再进入网站时购物车自动恢复,或者看的小说看到一半,再打开网站时自动找到上次读到的位置。
(图源:machinedesign)
本来这项技术是为了提供更好的客户体验,让大家浏览网站时,不需要一次把所有的事情都做完。然而,这个技术被广告商盯上了,掌握了我们网上的一举一动。
通过读取cookie,广告商可以知道我们看过什么网页,看了多久,操作到什么地步。
除了读取cookie,数据公司还会收集用户的个人基础信息、点赞、社交圈、消费习惯和生活习惯,也就是Facebook这种公司从我们身上拿到的资料。
集齐了他们需要的信息,这些公司就开始对这些数据进行分析。
这个分析的过程,叫做用户画像。
用社交网站上的各种资料,配合用户在网上的浏览信息建立模型,用模型运算预测用户可能发生的行为。
(图源:sdtimes)
比如用户最近发了一大笔奖金,平时又在浏览包包,通讯录里还新加了几个代购,这种条件就可以预测用户买包的概率相当大,符合买包人群的普遍行为特征。
广告商根据这些分析结果,就可以预测我们可能会买什么,进行定向投放广告。
报姐在工作室里调查了一下小伙伴的手机,不同的年龄,婚恋情况,手机型号,学历的人群的确会收到不同的广告推送。
比如,这就是一个工作室里玩游戏,有驾照的男生近期收到的定向广告:
然而,这种推荐算法还只是初级,现在的公司收集信息,分析数据的能力已经进化到让人防不胜防。
它们不仅想知道我们搜索了什么,还想了解我们的各个方面。
(图源:xenlife)
乖乖让用户交出个人信息不是一件容易的事,我们又不是傻子,凭什么给这些公司我们的资料。
但是事实证明,道高一尺魔高一丈,为了搞到数据,他们想出各种办法,哄得用户乐呵呵地自己奉上隐私数据。
像剑桥分析给每个用户5块钱,用户不仅把自己的东西都交代了,还给了他们权限去了解自己的朋友们。想想我们,是不是也有曾经为了返券优惠,提供额外资料给某些app呢?
(图源:metrokids)
虽然是有不少人意志坚定,不为这种小恩小惠所诱惑。即便如此,依然会被数据公司,用各种方法抓取走你的信息。
比如,某大名鼎鼎的情色网站,做的成功不仅是因为它内容丰富,更因为它去通过各种办法收集用户信息,从海量片源中,精准推荐用户爱看的片子。
(图源:socialunderground)
除了记录搜索和浏览历史,这个网站想到了一个绝佳的点子获得用户的偏好信息:看用户观看完后是否关闭窗口。
一段视频播放后,没有快进快退,窗口也没有关闭,说明用户对这段影片是“满意”的,正在忙,腾不出手来关闭…
就这样,用着各种各样,我们知道或不知道的办法,个人信息就被搜集走了。不仅是我们的名字年龄,点赞、消费习惯、出行习惯甚至作息时间,都会被收集。
信息越多,通过数据模型分析出的结果越准确。他们甚至可以根据之前的消费记录,爱好、人脉和消费能力,预测出我们自己都不知道的,在未来会产生的消费需求。
(图源:sciencebusiness)
这些,利用我们在互联网上留下的痕迹,进行精确投放,已经让人不适。更让人不寒而栗的是,还有些技术像是幽灵一样,冷冷地监听窥视着我们的生活。
而这个释放这个幽灵的魔盒,就是我们所说的:手机权限。
手机系统设计的时候,为了避免用户信息泄露,同时又防止限制过多,有些app不能正常使用,提供了“权限”这个概念。
照相的app需要使用摄像头和存储照片的权限,导航app需要定位的权限,由大家决定让不让app使用这些功能。
于是,就有些公司把搜集信息瞄准到了这些app上,他们做一个软件,就想把用户的全部信息都得到。授予手机上app一些本不需要开的权限之后,它可以随时监测我们的位置,我们的通讯录,甚至我们的短信和电话。
那么简单说,权限就是一把钥匙,打开我们一切资料的钥匙。
这两天在Reddit上有一个讨论:在Facebook上曾经受到过什么让你觉得毛骨悚然的推荐?
其中就有这么两条:
FindingMoi:有个事,不是FB但也非常恐怖:我男票买了一个电脑椅,对他来说有点小,他提到有个大一号的款,但是更贵,所以他不换了。然后当我打开手机,我就收到了一个广告,给我推送了那把大一号的椅子!正好是我男票喜欢的颜色!(有8个颜色选项,给我推送的是蓝色款,就是我男票买过的颜色!)
Two_kids_two_pugs:这事也发生在我身上,一次又一次。有一次,我和我丈夫讨论要不要买一个黄色厨房搅拌器。我都没有搜,或者添加到购物网站的心愿单里。但当我打开APP,跳出来的就是那款黄色搅拌机!
这条微博发布后,有很多网友分享了他们相似的经历:
除了千方百计窃取用户信息,定制个人推荐,精准投放,数据还在默默地把我们划分为三六九,无情杀熟。
前段时间,有微博网友发现,在使用订机票、订酒店,打车、买电影票,叫外卖这些互联网平台服务时,老用户常常需要比平台新用户支付更高的价格。
类似的情况还有:
根据出行路线记录,同样路线和车型,老用户要比新用户贵上六七块;
选机票,看电影这种票务服务,选好后取消再预定,价格立涨甚至翻倍;
搜索比价以后,能看到的产品选项越来越少,最后只剩下商家想让你看的那几个;
(图源:微博)
这种“大数据杀熟“,也就是经济学上所说的一级价格歧视,厂商(垄断者)知道每位消费者,对任何数量的产品,要支付的最大货币量,并以此决定价格,因而能够获得每位消费者的全部消费剩余。
这曾经在经济学上,被认为是不可能出现的情况,因为垄断者无法了解,每一个消费者愿意支付的最大货币量。然而现在大数据,却为一级价格歧视的发生,提供了技术支持。
就像是,我们开始说的那样:大数据,比你更了解你自己。
在大数据面前,我们每一个人都是赤裸的,待宰羔羊。
(图源:linkedin)
这次Facebook操作选举的事件,只是揭露了大数据时代危险的冰山一角。
原来,我们看到的世界,不过是大数据为我们精心定制的一隅天地。
大数据,不止了解我们,掌握着我们一切的信息,能给我们安利心动的产品,提供我们需要的服务,还能让我们觉得我们看到了想看的一切。
(图源:executivestyle)
大数据分析出我们的三观,平台可以按照我们的三观偏好推送信息。
当我们毫不设防,我们的视野被控制在大数据为我们预设的轨道里,小到消费购物,大到政治宗教,我们最终沦为大数据的提线木偶。
(图源:inc)
前不久,科幻电影银翼杀手2049里有这样一幕:虚拟人Joi让K感受到了深刻而真实的爱。
但影片最后Joi的广告却出现了一句,让人类害怕的话,“Everything you want to hear 说你想听到的一切”。
(图源:thefilmmagazine)
了解你,洞悉你,甚至比你自己都清楚你。
大数据时代,我们还有何处可逃?
Source:
https://www.cnn.com/2018/03/20/politics/facebook-cambridge-analytica-key-players/index.html
https://www.independent.co.uk/voices/camridge-analytica-scandal-how-facebook-works-harvesting-data-politics-trump-brexit-a8264051.html
https://www.nytimes.com/2018/03/20/business/ftc-facebook-privacy-investigation.html
https://www.nytimes.com/2018/03/17/us/politics/cambridge-analytica-trump-campaign.html
http://www.bbc.com/news/uk-43480978
https://www.nytimes.com/2018/03/19/technology/facebook-cambridge-analytica-explained.html
https://newsroom.fb.com/news/2018/03/suspending-cambridge-analytica/
https://www.buzzfeed.com/ryanmac/these-men-helped-create-cambridge-analytica-here-is-their
https://www.theguardian.com/news/2018/mar/17/data-war-whistleblower-christopher-wylie-faceook-nix-bannon-trump
公众号
英国时报
长按识别左边二维码关注