北京大数据交易所成立背后:还需破解政府产业社会的信任困局

3月31日,北京国际大数据交易所(以下简称“北数所”)在京成立。南都记者注意到,目前全国已有至少14个大数据交易平台,但近几年成立速度明显放缓。与此同时,大数据交易市场也面临着如数据难以确权、个人信息安全隐患等问题。

图:北京国际大数据交易所成立发布会。

北数所为何选在这个时间点成立?它能否破解困扰大数据交易市场的上述难题?在数据交易的过程中,如何保障个人信息的安全?

对此,有长期关注大数据交易问题的专家告诉南都记者,此次北数所的一个创新点在于改变以往“数据所有权”的交换,而是着重于“数据使用权”,避开了数据难以确权的问题。还有专家表示,大数据交易平台的未来发展需要着力破解政府、产业、社会三方的信任困局。

历年大数据交易平台成立数量呈U型

据了解,北数所是在北京市人民政府的推动下,经济和信息化局会同市金融局、市商务局、市委网信办等部门,组织北京金控集团牵头发起成立。

南都记者注意到,2014年3月,“大数据”一词被首次写入政府工作报告。2014年12月31日,全国乃至全球第一家大数据交易所在贵阳成立。据不完全统计,在2015、2016这两年间,全国各地有超过10家大数据交易平台成立。

然而,在2017年以后的几年间,各地的新增数量骤降。直至去年,再度出现新增的大数据交易平台,整体呈现出“多-少-多”的U型趋势。

去年8月,依托中国-东盟信息港的北部湾大数据交易中心在广西南宁成立。去年9月,北京市市长陈吉宁在服贸会宣布将设立北京大数据交易所;3月31日,北京市国际大数据交易所成立。据媒体报道,中新天津生态城正在筹建北方大数据交易中心。

大数据交易平台的成立为何呈现这样的趋势?

北京师范大学网络法治国际中心执行主任、中国互联网协会研究中心副主任吴沈括分析认为,2015年、2016年作为十三五规划开局,数据交易中心建设主要从大数据发展的角度出发,并且当时的顶层设计和法律规则相对更为稀少,所以存在发展瓶颈。

去年四月,中共中央国务院发布的《关于构建更加完善的要素市场化高效配置体制机制的意见》指出,引导培育大数据交易市场,依法合规开展数据交易。

吴沈括认为,近两年的数据交易平台建设,在很大程度上是受到中央上述政策的激励,而且目前数据安全法(征求意见稿)、个人信息保护法(征求意见稿)以及其他法律法规的出台,为数据交易提供了更多指引。“在新的技术环境下,这一波的数据交易平台建设有更多的新特征、新指向,有更多的想象空间。”

数据交易市场的确权之惑

北数所的成立有其独特意义。

北京市副市长殷勇在发布会上表示,设立北数所,就是要通过探索建立集数据确权、评估、交易、结算、应用、服务于一体的数据流通机制,规范数据交易活动,探索构建适应新的生产力的法律制度关系。此外,在准入方面,北数所将实行实名注册的会员制,对数据来源进行合规审核。

殷勇指出,北数所的大数据交易的创新点之一为“树立新的数据观”,根据数据不同性质采取多种模式,促进数据融合使用。针对高价值的多方数据,通过新型数据交易平台,采用多方安全计算、联邦学习等技术,支撑数据使用权交易,实现“数据不搬家、算法多跑路”。

何为“数据不搬家,算法多跑路”?

熟悉数据交易和北京国际数据交易所的法律专家王新锐律师表示,以往谈及数据交易时,强调的是“数据所有权”问题,但数据确权的难度比较大。他认为,“数据所有权像是一个悖论”。

“如果是一个金币或者不动产,我把它给你后,我自己就不再拥有金币或者不动产。但是我给你一份数据后,可能我手里还有一份数据,可以继续利用,这种情况很难控制。”王新锐如是解释道。

中国信通院发布的《中国数字经济发展白皮书(2020年)》中也阐明,由于数据的无形性、可复制性、可共享性等特点,导致数据权属确定的难度较大,数据权属分析已成为数据要素流通中亟待解决的问题之一。

王新锐认为“数据不搬家,算法多跑路”的意义在于,改变以往“数据所有权”的交换,而是着重于“数据使用权”。原始数据通过联邦学习、多方安全计算等技术的加工、脱敏,最终得到的是“算法跑下来的结果”,而非原始数据本身。

数据交易中如何保障个人信息安全?

除了数据难以确权的问题,另外一个关注焦点在于:数据交易过程中,如何保护个人信息安全?曾有业内人士谈到,2017年网络安全法出台之后,数据交易市场其实很难生存,“不包含用户隐私信息的这些数据其实在交易市场上的活跃度是不高的”。

此次发布会中,北数所方面表示,公众关切的个人隐私保护和信息安全,是北数所探索数字经济新业态的前提,也是决定未来发展的关键所在。殷勇也在会上提出:北数所要规范化经营,建立数据流动审计机制和一触即发的数据安全监管能力,保护个人隐私和企业商业秘密。

王新锐表示,如果交易的数据中涉及到个人信息,肯定是要脱敏、去标识化到“无法识别”的程度。比如说医疗数据,可能脱敏到完全识别不出来是哪名病人。“拿隐私或者个人信息进行交换,这肯定不是数据交易所会做的事。”

吴沈括认为,保护个人信息安全和促进大数据交易平台建设并不矛盾。相反,有效的大数据交易机制建设,能够提高个人信息保护的生态水平。特别是在新的技术应用环境下,新的个人信息保护技术的引入,可以在确保个人信息安全的基础上,提高数据交易的效率和效益,形成动态的良性平衡。

华东政法大学数据法律研究中心主任高富平曾指出,根据现行法律,如果想继续做数据交易主要有两种合法性标准:一是获得用户的同意,而且在数据交易和共享环节要单独再做一次授权同意;二是实现个人数据的匿名化,要经过处理无法识别特定个人且不能复原。

在数据交易过程中,哪一种方案更为可行?

吴沈括则认为,获得用户同意和匿名化数据的机制选择,并没有统一的一刀切答案,而是取决于具体的交易场景。在具体的交易场景当中交易双方根据特定的业务需要和各自的技术水平、经济承受能力等因素可以灵活做出针对性的选择。

他表示,数据交易平台的发展,除了政策战略的支持,法律规范的指引,还需要基于信任的产业生态的支撑。多头监管带来的业务规则不清晰、监管能力与企业技术优势之间的信息不对称、民众对于技术优势方的固有恐惧、不同企业之间数据治理能力的差异、网络违法犯罪黑灰产的蔓延以及数据泄露等安全事件都是“信任困局”的成因。

“从现在来看,如何破解政府、产业、社会三方的信任困局是未来发展需要着力解决的痛点问题。”吴沈括说。

采写:南都见习记者 孙朝