在高速发展的信息社会,大数据、人工智能等技术正在推开智慧城市的大门。新冠肺炎疫情防控中,打开通信大数据行程卡,便能查询最近14天去过的地市,方便低风险地区市民正常出差旅行;日常出行中,打开手机地图就能清楚地知道每条出行线路的拥堵情况、公交车还有几分钟到站、地铁的拥挤程度;日常娱乐中,APP会推荐你喜欢浏览的新闻、偏爱购买的产品。毫无疑问,这些都极大地提升了我们的生活效率,但同时,大数据“杀熟”、侵犯隐私等问题也随之出现。那么,大数据究竟是“天使”还是“魔鬼”,我们应该如何正确利用大数据?

当前,大数据已经成为发展数字经济的基础性资源,合理利用大数据能够提升生活、工作、生产效率,因此大数据被誉为数字时代的“石油”。但是大数据“杀熟”、大数据侵犯隐私等问题频发,也让不少用户担忧,在大数据面前,每个人都是透明的,我们正在不停地“裸奔”。

那么,在大数据高速发展的快车道,如何设置“红绿灯”?

数据已成数字时代“石油”

发展大数据已成为重要国家战略。

2020年年初,我国多次在重要会议上提出要加快推进新型基础设施建设,而数据中心则是新基建的重要部分。与此同时,去年年底,国家发改委、中央网信办、工业和信息化部、国家能源局四部门联合印发《关于加快构建全国一体化大数据中心协同创新体系的指导意见》指出,数据是国家基础战略性资源和重要生产要素,加快构建全国一体化大数据中心协同创新体系,是贯彻落实党中央、国务院决策部署的具体举措。

那么,什么是大数据?

其实,大数据并不是一个高冷的名词,而是已经充分渗透到当前的日常生活中。比如新冠肺炎疫情防控中,打开通信大数据行程卡,便能查询最近14天去过的地市;日常出行中,打开手机地图就能清楚地知道每条出行线路的拥堵情况、公交车还有几分钟到站、地铁的拥挤程度;日常娱乐中,APP会推荐你喜欢浏览的新闻、偏爱购买的产品,这都是基于大数据分析。

工信部信息化和软件服务业司副司长李冠宇在接受媒体采访时提出,大数据是以高容量、多样性、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。

显而易见,大数据可以应用于交通、工业生产、企业管理等方面,诸如在交通领域,大数据可以收集人、车、路的情况,并将这些数据通过云平台存储到城市大脑的数据中心,将获取到的有用数据进行分析,有效降低交通事故的发生概率,有力打击各类交通违章和违法行为,大幅提高城市交通运输系统的管理水平和运行效率。在工业领域,工业数据作为新的生产要素,能够有力驱动制造业转型升级、助力供给侧结构性改革持续深化,有助于推动制造业实现质量变革、效率变革、动力变革。在企业管理方面,企业可以用数据说话、用数据管理、用数据决策,通过建设数据仓库、数据中台,进行数据分析,使数据可视化,实现数字化转型。

数据中心产业迎“黄金时代”

“无论是云计算、物联网,还是大数据、人工智能和5G,每种业务形态均会带来数据量的增长,甚至是呈几何级数增长。未来5至10年,将是数据中心需求旺盛的黄金时代。”腾讯数据中心高级总监杨晓伟表示。

挖掘大数据的“金矿”,必须建设数据中心,存储、分析数据。近年来,数据中心产业正迎来快速发展。根据中国信通院统计,2019年我国IDC行业市场收入达到878亿元左右,近三年年复合增长率约为26%,预计未来仍将保持快速增长势头。预测2021年,我国IDC市场业务收入达到约1500亿元,到“十四五”末有望超过4000亿元。

一般来说,建设数据中心需要建设计算、存储、网络等部分,计算是指运行应用程序的内存和处理能力,通常由高端服务器提供;存储是指重要的企业数据通常存放在数据中心,存储在从磁带到固态硬盘的各种介质上,并有多个备份;网络是指数据中心组件与外界之间的互联,包括路由器、交换机、应用程序交付控制器等。

目前,我国运营商、设备商、以BAT为代表的互联网企业均在积极进行数据中心建设。诸如运营商方面,中国移动计划在2021年完善“3﹢3﹢X”数据中心布局,累计装机能力提升至108万架,深化云网、云数、云智、云边融合发展;中国电信计划直接投资102亿元,在2022年建成京津冀大数据基地。而互联网企业方面,阿里云已经在全球22个地域部署了上百个云数据中心,而去年7月,阿里云宣布位于江苏南通、杭州和内蒙古乌兰察布的三个超级数据中心正式落成,陆续开服,并新增超百万台服务器,辐射京津冀、长三角、粤港澳大湾区三大经济带;腾讯已在全球26个地区部署了超过80个数据中心,机柜数量超过10万,在网服务器超过100万台,带宽突破100T,同时在国内天津、上海、深汕合作区以及重庆共有四个自建大型数据中心集群;百度已在全球十余个地区建立了大规模数据中心,而在我国北京亦庄、河北保定、山西阳泉等地区也都进行了数据中心建设。

根据中国信通院测算,2020年数据中心建设投资达到3000亿元,预计未来3年,数据中心产业投资增加1.4万亿元。

数据向善是关键

任何事物发展都有两面性,大数据产业蓬勃发展的背面,也存在一些需要优化的问题。近年来,用户在网购、旅游订车票、订酒店、订外卖、预订网约车等线上便捷服务中,不断发现老用户比新用户价高等大数据“杀熟”“侵害隐私”问题。

对此,业界专家普遍认为,大数据“杀熟”在本质上是一种差异化定价行为。考虑到不同的交易成本,差异化定价本来属于企业经营自由的范围,但任何自由都有限度,一旦差异化定价的自由超过了一定的限度,就会变成违法行为。中国传媒大学大数据研究中心沈浩教授提出,消费领域的大数据“杀熟”,本质上指向“个性化推荐算法”。现在电商、社交媒体都可以获取大量消费者的个性化数据,这样就能给一个用户贴上成千上万个标签,完成用户数字画像。大数据里面清晰记录着用户的身份信息、使用喜好、消费习惯等,方便机器识别,甚至深层次预测用户行为,并在此基础上进行商品推荐。

大数据“杀熟”的问题正在引起相关部门的重视,诸如在旅游行业,2020年10月,文化和旅游部发布的《在线旅游经营服务管理暂行规定》正式施行,明确在线旅游经营者不得滥用大数据分析等技术手段,基于旅游者消费记录、旅游偏好等设置不公平的交易条件,侵犯旅游者合法权益。同时,中消协也建议在个人信息保护法、反垄断法、反不正当竞争法、价格法等相关法律中,增加算法应用的相关规定,让大数据算法更加透明化、公平化、合理化。

同时,专家建议,数据中心建设需进一步完善自上而下的顶层设计和规划,国家应加快健全完善数据流通应用的法规,推动从中央到地方、省市之间的数据共享。

可见,大数据的发展还有很长的路要走,如何合理收集、运用大数据,怎样判定隐私的边界,如何在保护隐私的基础上利用数据服务社会生活,还需要做很多工作。显然,只有及时纠正技术发展中的问题,才能引导大数据发展真正向善。