你是否有过这样的经历:逛完淘宝,打开QQ就收到才放进购物车的洗面奶的广告;百度一下自己关心的那支股票,在QQ上就收到相关的推送?如果有,那这几天发生的新闻或许可以解开你的疑惑——昨天,有网友发现,电脑上的QQ会读取谷歌浏览器的记录;随后更有网友追踪发现,QQ试图读取的,是电脑里几乎所有浏览器的历史记录,并且该行为已经持续了一年半。
该现象引起了社会各方的关注,腾讯迅速下场回应,但网友们并不买账。腾讯称,读取的数据只为判断是否恶意登录,数据不上传不储存。而网友针对性地提出了三点质疑:其一,判断是否为恶意登录,应该在登录时进行,为什么在登录后十分钟才进行检测?其二,火绒安全实验室阻拦时发现,QQ检测的关键词是淘宝、京东、炒股、融资。判断是否为恶意登录,为什么要检测这些关键词?其三,就算是为了判断恶意登录,该行为是否经过了用户的同意?目前,腾讯对这些问题没有进一步回答。
近两年,舆论对大数据的关注,其重心渐渐从“隐私”转向“价值”。在互联网出现时,学者、文化人担心的是互联网会成为一种监视工具,人们在网络上无所遁形。这次事件曝光后,网友们却进一步意识到,之所以腾讯要检索淘宝、京东这些关键词,是因为可以用其描摹每个用户的画像,达到精准投放广告的目的。凑巧,前段时间,上海市消费者权益保护委员会就刚批评微信利用用户数据投放个性化广告,广告关闭流程繁琐。监视是无形的,隐私感不强的人或许没有意识;但广告跟踪是有形的,越来越多人发现,自己被推送的广告,与自己在其他地方的操作相关联。数据是新型的生产资料,用户创造了数据,最后利润却流到平台和公司手里,这一点如今越来越惹人注意。
是什么导致了数据价值的“分配不均”?笔者认为,数据本身的特性是重要原因。首先,数据分表层数据和深层数据。表层数据是看得见的,如微博的发言,通过搜索就能获得,但深层数据是看不见的,如我们的浏览历史,只有少数人才能挖掘和拥有。互联网上漂浮着海量的数据,看似公平地供所有人取用,实际上个体与数据巨头对数据的享有完全不在一个层次。我们能享受QQ上各种资讯服务,但却没有办法像QQ一样挖掘自己在各个地方留下的痕迹,包括我们每一次的点赞、转发、购买,甚至是每一次点击,在某一页面上停留了多少秒,拼错的单词等等。这些数据看起来琐碎而且转瞬即逝,却有极为重要的价值,辅以我们被读取的浏览记录和注册QQ时提供的性别、年龄,QQ甚至能比我们更清楚自己身上的弱点和喜好。
其次是数据的再利用性。数据不像物质能源,使用完之后就会消耗,它永远能被再次利用。维克托·迈尔·施恩伯格在《大数据时代》中举了个例子,比QQ规模更大的社交软件Facebook,除了能对用户进行个性化广告推送,还曾打算与某一信贷公司合作开发一种以Facebook社交图谱为依据的信用评分系统。该公司一项内部研究显示,个人会偿还债务的可能性,和其朋友会偿还债务的可能性呈正相关,那公司就可以根据用户朋友的信用值决定对他发放的贷款额度,优化投资策略,这对Facebook和该公司有极大的商业价值。施恩伯格总结道,“数据的价值是它所有潜在用途的总和”,但这种价值只有拥有专业数据分析机构的数据巨头才能享有,普通人无法掌握深层数据,遑论进行数据分析?
数据占有的不平等,数据使用的不平等,导致了大数据时代下的“分配不均”。要想解决这一局面,不能只要求个体增强隐私意识,而要社会各界共同“亮剑”。目前,国家除了反垄断加码,加大对互联网平台的监管,还开启了对数字税的研究,对数据的定价、数据的所有权研究都被提上日程。在法律设计上,需要优化隐私保护模式,增强数据使用者的责任。企业方面,则需要真正做到尊重用户的隐私,不越过用户授予的数据访问范围,更不能在未经用户许可的条件下擅自收集用户数据。
文/何煦阳(湖南师范大学)