承泽观察| 沈艳、张俊妮 :数据流通的挑战与应对

发布日期:2022-09-30 10:26    来源:

导语:加快培育数据要素市场是当下关键问题之一,但现有要素市场发展并不尽如人意,数据交易成本高、合规成本高是重要原因。破局需从数据这一生产要素的特殊性出发,实现市场与政府的“双向奔赴”:市场主导形成多层次数据交易市场体系,政府在制定标准、引导技术发展以及降低合规成本等方面发挥关键作用。

数据在经济发展中扮演着日益重要的角色,中国也高度重视数据要素市场的建设。“加快培育数据要素市场”这一表述,在国务院2020年4月印发的《关于构建更加完善的要素市场化配置体制机制的意见》、2021年1月的《建设高标准市场体系行动方案》,和工信部2021年11月发布的《“十四五”大数据产业发展规划》中均被反复提及。与此相应,各地为培育数据要素市场作出了积极的努力,例如,截至2022年8月末,各地兴建的数据交易所已达46家。但是目前数据要素市场发展并不尽如人意,如何促进数据要素流通,成为数字经济健康持续发展的关键议题之一。

北京大学国家发展研究院课题组梳理了中国数据要素市场发展现状,发现三个主要现象。一是中国数据产出大、但是数据交易市场规模小。数字中国发展报告(2021)显示,2017-2021年间中国数据产出居世界第二,全球占比9.9%;但据国家工业信息安全发展研究中心的测算,2020年中国数据要素市场(含数据清洗、标注、交易等环节)规模约为545亿元,约为美国的3.1%、欧洲的10.5%、日本的17.5%。二是虽然快速成立不少数据交易所,但场内交易不足:2020年场内数据交易只占总体交易市场规模的4% ,2021年未超过5% (国家工业信息安全发展研究中心测算)。场内交易不足也体现在数据交易所的存续能力上。根据北京大学国家发展研究院课题组的统计,截至2022年8月,工商注册状态为存续或在业的数据交易所为30家,一些数据交易所已经退出运营。三是场外交易中,黑市数据交易规模不容忽视。有专家估算,2021年中国数据黑市交易市场规模超过1500亿元,并已形成产业链。

为什么数据要素市场发展不尽如人意呢?我们首先从数据这一生产要素的特征这一角度思考问题。无论是中文“数据”还是英文Data,其词典含义的共同点都在于强调了数据是记录信息的载体。这就决定了数据这一要素在权属、价值、安全、监管等方面,都要有别于传统要素市场。

从权属角度看,作为信息载体的数据具有准公共品特性,其非竞争性和部分可排他性决定了数据不能完全按照财产权的方式来界定其归属,因而“先确(财产所有)权再交易”的模式将不完全适用。从价值角度看,数据可以被无限复制,其中大数据具有生态特征,这就决定了数据的价值随使用人、使用场景和具体用途而存在很大变化,对同一数据的价值评判难以标准化。与此同时,由于数据使用不当可能导致隐私被侵犯和数据安全问题,与劳动、资本、土地等生产要素使用不当所产生的问题,在性质与解决方案上也有很大的差异。最后,从监管角度看,中国数据要素市场的建设尚处在初步阶段,而市场中的一些交易主体也具有一定的社会治理甚至监管功能,这对数据要素使用的监管也产生了不同于传统要素的挑战。因此,数据生产要素的特殊性决定了不能将传统生产要素市场的发展逻辑套用到数据要素市场上,这一点北京大学国家发展研究院教授黄益平在《大数据如何共享?》一文中也有所提及。

具体来说,数据要素的特殊性决定了在数据供给、需求乃至具体交易和流通环节,均面临与传统要素市场不完全相同的问题。在供给端,主要的问题是供给不足。我们将主要的数据供给方分为政府部门、数据丰富企业和数据采集供应商这三类来讨论这一点。政府部门面对的开放公共数据的需求高,但运营成本高、收益低、潜在风险高;数据丰富企业(如大型平台和国企)共享数据收益不足,数据共享出去之后可能被搭便车、甚至加剧了和自身的竞争,因此没有足够的动机去做;而对数据供应商来说,除了标准数据产品外,在具有生态特征的大数据供应各环节中,中国供应商普遍面临技术能力不足、性价比高、数据产品少的问题。

需求端的问题可能不是需求不旺盛,而是将需求转化成有效需求至少有五重困难。首先是识别需求难,也就是数据需求方可能有模糊的数据需求,但是并不清楚什么样的数据能满足自己的需求;二是即便能厘清需求,要寻找到合适数据类型存在困难;三是货比三家难,由于不少数据是非标准产品,货比三家需要的准确鉴别不同数据质量的要求较高;四是内外整合难,这是指即便购买到合适数据,如何将内部数据和外部数据整合使用也是不小的挑战;五是安全保障难,这是指一些数据需求方可能没有很好的数据安全保障,接入外部数据可能会增加数据安全的隐患,这让需求方望而却步。

最后,在数据交易完成环节存在的问题在于,由于不少数据产品是非标准产品,也缺少公认的标准,存在定价难、维权难和合规难的现象。这里,定价难的原因在于评估和鉴别数据产品由于缺乏一致标准,不易于通过市场大量重复交易来发现价格,进而难以评估价格是否合理;维权难主要体现在形成数据交易争端解决机制不清,一旦出现不遵从合同约定的情形很难维权,如卖家不按质按量按时提供数据产品、买家不按约使用数据;合规难则体现在数据交易可能会产生法律和合规风险,面临巨额罚款。

简单来说,数据要素市场发展不尽如人意,与中国现有的技术能力和制度监管环境下,数据这一生产要素的交易成本高密切相关。因此,要加快培育数据要素市场,需要以降低交易成本为抓手,从供、需两端以及具体交易完成环节付出努力。我们将数据交易分为点对点数据交易和数据中介交易两类,而数据中介又分为数据收集开发售卖商、数据集市(data marketplace)、数据信托等。美国、欧洲和日本等国的数据交易市场结构提供了一些可以借鉴的发展经验。

总体来看,在全球数据中介交易市场中,数据收集开发售卖商(或称数据经纪商data broker)在降低数据交易成本方面发挥积极作用是主流模式。数据收集开发售卖商从政府、商业机构和公开渠道获取个人、企业、地理位置、互联的物理设备、天气等各类数据,并将数据做分级处理后形成数据产品和数据服务,将其匹配给恰当的需求方。美国不少数据收集开发售卖商在不同行业中占据翘楚地位,如Corelogic涵盖美国99%以上住宅与商业地产数据;LiveRamp(2018前叫Acxiom,安客诚)则拥有全球7亿个人数据用于市场营销分析等。

值得注意的是,虽然数据集市也有优秀的企业(如Datarade),但总体看,撮合小的数据供应商与需求方的数据集市占比并不大。根据Maximize Market Research的统计,2021年全球数据中介交易市场规模约为2572亿美元,而其中数据集市的市场规模为7.8亿美元。另外,也有不少数据集市失败或关闭的例子,如微软的Azure DataMarket 于2018年关闭等。

数据要素市场发展不尽如人意的另一个重要原因在于数据交易的合规成本高。中国的《个人信息保护法》与《数据安全法》和欧洲的《通用数据保护条例》(GDPR)类似,以保护数据主体权益为核心,采取了择入式同意。由于担心数据流通可能会触犯相关法规,不少情况下,数据丰富企业不仅不敢售卖数据,甚至同一企业内不同部门间的数据流通均存在顾虑。

在降低合规成本方面,欧美日的一些做法也有可借鉴之处。其中,GDPR除了要求使用数据方获得消费者明确的同意之外,还有处理个人数据的其他五种法律依据,其中“正当利益(legitimate interest)” 提供了与择入式同意并行的另一种可能性,监管部门也有相应评估模板帮助企业作合规评估。美国以发展数字经济为核心,总体上采用择出式同意,对于隐私保护和数据安全等要求,更多从发展技术的角度去满足。例如,对隐私日本规则与GDPR相近,实践中更强调公共力量和市场力量的合作,多发挥行业协会和个人数据信托银行的作用。

加快培育数据要素市场,政府有所为有所不为。国际上数据中介交易中数据收集开发售卖商为主、数据集市为辅的模式,为中国数据交易所的发展提供一些借鉴经验。要避免各地一哄而上开办数据交易所而最后一地鸡毛。以市场主导具体交易模式,发展以高质量数据收集开发售卖商、点对点、数据集市和数据信托等多种模式相结合的数据交易市场体系或许是一条值得探索的道路。

在降低交易成本和合规成本方面,政府大有可为。一是有关部门可以积极参与制定数据和技术标准:如敏感数据和不敏感数据如何区分、存储,也可参与技术标准、资质认证(如分级数据牌照)等方面的工作;二是以发展技术促隐私保护和数据安全,以改变为了安全就不用数据这一被动局面,通过引导基金等加大助力对核心技术瓶颈的突破;三是做好监管,帮助企业对合规成本形成稳定预期。一方面,可以致力于助力供需两端解决数据争端;另一方面,可以及早考虑设立数据交易监管沙箱的可行性,最大限度减少监管落后于创新。最后,政府也可以鼓励领头羊企业以及相关行业协会更多发挥引领作用。

 

作者 :沈艳 北大国发院教授、北大数字金融研究中心副主任

张俊妮 北京大学国家发展研究院长聘副教授

本文来源:中新经纬


分享到: