通过分析大量用户的搜索记录,比如“咳嗽”“发烧”等特定词条,谷歌公司能准确预测美国冬季流感传播趋势。和官方机构相比,谷歌能提前一两周预测流感暴发,预测结果与官方数据的相关性高达97%。2009年甲型H1N1流感暴发时,“谷歌流感趋势”系统大显身手。这已经成为大数据应用的一个经典案例。
“谷歌流感趋势”系统为公共卫生机构提供非常有价值的数据信息的同时,却也招来了隐私保护组织的严厉声讨。人们担心的是,谷歌是否找到一种方法来确保收集的大量数据不会泄露究竟是哪些用户提交了相关搜索信息。
当你习以为常地浏览网页、发微博、逛社交网站的时候,可能并没有注意到,你的一举一动被“监视”着。如维克托所说,亚马逊监视着我们的购物习惯、谷歌监视着我们的网页浏览习惯,Twitter窃听到了我们心中的“TA”,FACEBOOK似乎什么都知道,包括我们的社交关系网。
如果说互联网时代人们的隐私受到了威胁,那么大数据时代无疑加深了这种威胁。大数据的价值潜力,使得个人信息被更多采集、更久存储、更彻底利用。甚至有些看似无关紧要的信息,关联在一起就能精准定位到具体的某个人。
在维克托看来,大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。因此,需要设立新的模式来保护个人隐私,这个模式应该更着重于强调数据使用者为其行为承担责任。
大数据时代,如何兼顾数据充分利用和个人隐私保护?邬贺铨认为首先需要界定什么样的个人信息可以被采集挖掘,以及挖掘出的数据可以做哪些用途。“具体的尺度需要在实践中一步步地厘清和把握。”
不只是个人隐私,国家安全是另一个值得关注的问题。邬贺铨特别强调,国内企业和相关政府部门要避免将自己的重要数据放到国外的分析应用平台,即使对方愿意免费提供相关服务。“这些看似无关的数据,其实都跟企业发展策略、国家经济运行状况密切相关,我们要时刻保持对信息安全的警觉。”