当前位置:首页 > 文献资源 > 论文著作 > 理论推演
胡凌|公共数据开放的法律秩序:功能与结构的理论视角
2023年11月06日 【作者】胡凌 预览:

【作者】胡凌

【内容提要】


公共数据开放的法律秩序:功能与结构的理论视角

 

 

胡凌 北京大学法学院副教授

 

 

 

摘要:近年来,公共数据开放理念与实践逐渐普及,公共数据开放成为要素市场供给的首要环节,公共数据开放的法治化进展迅速,但以往的法律研究存在一些偏差,有必要在理论上回应这些问题。公共数据功能起源于生产方式,目标是应用于更大范围内的统一市场中。这就需要将其按功能区分为展示性和辅助性,前者直接成为信息服务或数据产品,后者用来辅助一般市场中的要素进行安全有序流动。从实践看,政府更有动力推动作为基础设施的信息生产,而较少有动力推动展示性数据开放,其中真正有价值的展示性数据往往通过文化产业交易和授权运营的方式进行,有助于增加地方财政收入。同时,中央和地方政府间的权力结构也可进一步解释何种功能性数据由不同层级的政府生产和使用。功能和结构的角度有助于帮助我们重新理解在现有法律制度框架下,公共数据开放事实上的分级分类如何运作。


关键词:公共数据开放;分级分类;功能;生产方式;行政发包制






一、问题的提出

 

2017年中央全面深化改革领导小组通过《关于推进公共信息资源开放的若干意见》以来,公共数据开放理念与实践逐渐普及;近年来又伴随数据要素的提出,特别是2022年《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称数据二十条)发布后,公共数据开放成为要素市场供给的首要环节。在这一背景下,公共数据开放的法治化进展迅速,越来越多的省市制定了公共数据资源共享与开放相关条例和执行办法。大量法律研究随之出现,集中于公共数据开放的范围、程序、分级分类标准、授权运营制度设计等问题。似乎相关制度实践已经进入正轨,只需按部就班推动执行即可。按照这一逻辑形成的公共数据有两个层面:一是与一般性的数据属性一致,公共数据是一种普世的、可以在真空中运作处理的要素。只要事先设计好程序和安全保障机制,通过授权运营确保专业性和效率,就可以根据市场需求持续增加供给,提供公平合理无歧视的信息源,由不同主体获取后进行市场竞争,进而产生更广的社会价值。因此,如果公共部门落实不到位,出错的不会是市场导向的经济学理念,而是政府部门的制度、技术和预算约束。二是由于担心在操作过程中常见的个人信息、商业秘密或者其他类型负外部性或风险,公共数据开放和运营需要更侧重于数据产品而非原始数据形态,这可能会带来阿罗信息悖论,需要不断完善市场机制(如交易所、经纪人)的功能。因此,如果交易机制不能有效运行,就不是交易观念本身的问题,而是相关公共数据尚未达到进入交易所的高合规标准。

 

然而,这一逻辑指引下的越来越细化的形式规范使公共数据开放的目标变得模糊,也难以解释现有政策和实践的不断调整。例如,2022年推动全国统一大市场建设的政策更加看重公共机关对市场信息的投入,而非数据市场数据二十条提及的共享共用原则已经超越既有法律框架下的政府部门内部共享的范围,延伸到更广泛的市场主体;一些省份在推动公共数据利用中提出构建两级数据要素市场体系,依靠行政和市场机制两种手段,而不是单纯的交易所机制。这都需要我们重新思考公共数据开放政策的指向和目标,即需要在多大程度上推动公共数据入市,如何使之成为普惠公共品便利各类市场要素的流动?作出不同选择的动力和后果如何?这些虽然是老问题,但还需要结合实践变化进一步探讨。

 

类似地,按照上述对公共数据政策的理解,以往的法律研究也存在一些偏差:其一,把公共数据想象成静态的可以随时提取的要素,由此引出数据权属等问题。但实际上对于数据要素来说,围绕所有权展开的确权分析不太重要,重要的是基于不同法律关系的控制力,以及根据实际需求动态地不断创设出某类信息的能力。数据需要生产和使用,而不是固化和囤积。因而以往研究较少关注作为一个系统和秩序的公共数据开放过程,例如开放动力、供给能力、如何实现价值生成和循环、科层结构等生产方式问题,这决定了真实世界中的使用方式和条件。其二,抽象谈论公共数据使我们难以直观理解究竟在讨论什么对象,即使是关于分级分类的制度设计,也主要以使用风险为导向,而非探寻市场实际需要的功能,因而有必要基于实践重新审视类型化和层级问题。例如,有些数据是信息产品和要素本身的供给,有些则是帮助包括信息产品本身在内的各种要素流动的基础设施型供给,如果仅仅关注前者就会存在偏差。其三,比较关注数据要素市场的形成,而忽视了其所要服务的统一大市场建设需求,即一般性市场需要什么样的信息工具,以及非市场机制在这一过程中的作用;而且即便在讨论非市场机制时,也更多关注地方政府部门的开放实践,看不到中央政府的角色。

 

本文尝试扭转上述通行的认知观念,在理论上回应这些问题。本文的主要观点是,有必要看到公共数据开放政策在真实世界中的运作秩序:公共数据功能起源于生产方式,目标是应用于更大范围内的统一市场中。这就需要将其按功能区分为展示性和辅助性两类,前者直接成为信息服务或数据产品,后者用来辅助一般市场中的要素进行安全有序流动。从实践看,政府更有动力推动作为基础设施的信息生产,而较少有动力推动展示性数据开放,其中真正有价值的展示性数据往往通过文化产业交易和授权运营的方式进行,有助于增加地方财政收入。同时,中央和地方的政府间权力结构也可进一步解释何种功能性数据由不同层级的政府生产和使用。

 

本文论证顺序如下:首先,从数据功能理论切入,按照市场功能对公共数据进行分类并置于不同生产方式中考察。这不同于单纯以风险为核心的分类标准,也不同于按照行业场景进行的区分。其次,把区分不同数据功能的行政结构放在行政发包的理论框架下理解,即中央和地方政府对不同类型的数据各有侧重,考察公共数据开放中的分级逻辑。事实上的分级受制于府际结构性关系,大量核心数据在全国统一信息系统建设下不断汇集,驱使地方政府推动更多经济创新活动,从而产生更多数据用于本地使用。作为理论应用的例证,再次对展示性数据和两类辅助性数据——认证和信用信息——进行讨论,特别关注其如何产生和变化。最后对本文的发现进行总结。

 

 

二、数据功能与类型化理论框架

 

(一)数据的两种市场功能

 

一般地方政府对公共数据开放进行分类主要有两种做法。一是根据风险程度判断是否有能力事先进行脱敏处理或开放后应对可能的后果,例如《上海市公共数据开放分级分类指南(试行)》认为对数据安全和处理能力要求较高、时效性较强或者需要持续获取的公共数据属于有条件开放,而涉及商业秘密、个人隐私,或者法律、法规规定不得开放的公共数据属于非开放,但两者的差异无非是是否有能力进行匿名化处理。二是根据相关数据的自然属性进行,例如《江苏省公共数据分类分级规范》按照主题、行业、对象对公共数据进行分类,但这种分类方式较为表面化,且涵盖的数据并不固定。两者的共同问题是无法基于实质理由说明数据分类的价值,本节从功能角度重新思考这个问题。

 

通常人们认为数据的价值主要从展示信息或进行数据分析和预测过程中产生,这些功能和信息技术带来的数字经济生产方式密不可分。由于数字平台可以跨地域调动和匹配不同的要素资源,产生了以信息内容服务为特点的商业模式,动员大众免费生产信息,并通过会员制进行收费。平台企业将生产过程和消费过程紧密结合在一起,追踪用户并进行预测和推荐,推动更多交易机会的产生。这都是我们熟悉的数据应用过程。但信息系统本身并不必然产生信任与稳定的合作关系,对于交易者而言仍然可能遇到大量一次性交易,需要有一些默认机制对交易者进行约束,确保行为可信和未来多次交易。如对主体身份进行核验,并根据受到追踪的历史行为进行评价,形成某种抽象信用。这两种辅助性信息充分体现了数据在保护市场秩序正常运行过程中起到的关键作用,甚至是基础设施类型的功能。

 

20232月征求意见的《杭州市公共数据授权运营实施方案(试行)》为例,该方案在具体场景应用中列举了若干领域的公共数据,其中具有展示性功能的包括:医疗健康数据产品、体育领域的健身场所信息、文旅领域的出行信息、科研领域的研究信息等;而具有辅助性功能的包括:金融保险领域的企业信用信息、商贸物流和工业制造领域的连接匹配信息、社会治理领域的舆情信息等。可以看出,只有有效区分数据功能,才能更有针对性地对公共数据开放进行有序挖掘和利用。

 

上述功能视角的讨论是笔者常用的针对数据法律问题的分析框架,之前主要用于讨论个人信息或数字平台中产生的数据,较少用于分析公共数据。下文将展示,功能分析对于公共数据的使用规则讨论同样十分必要,只有了解数据功能才能进一步决定如何进行开放使用。同时,功能分析本身就是场景分析,有助于解决以往研究一提到场景化就难以深入的问题。任何关于数据分析的前提都是要认清,如果要实现某个外在的关键社会功能,就必须在满足该功能的前提下设计数据使用条件和制度,而不是反过来根据所谓数据的性质确定使用方式。例如,个人身份证号码是个人信息,应当得到严格保护,但不能忘记其首先是由国家创设出来用于在公共服务过程中进行身份核验的,因此基础身份信息的功能就是认证,然后才需要进一步讨论何时以及为何需要核验查证等问题。如果不理解这一功能,就会出现由个人控制身份证号码决定其使用的认知错误。

 

当我们讨论数据功能时,实际上隐含了几种前提假设:其一,数据是依附性的,关于某些社会主体和对象的身份或行为,并服务于该对象的流动、改善或其他目标。这意味着我们首先要关注这些社会主体和对象处于何种法律和社会关系中。如果这些要素本来内生于公共服务,那么相应的公共数据开放也需要有利于公共利益,不太可能完全转变为私人资源。其二,数据的本质仍然是信息,不单纯是直接用来交易或展示,而是要看外部的社会或市场体系希望以何种功能使用此类信息。不同于以往通过机读或人读区分数据信息,简要的功能分析将数据大致分为两类:一类是展示性的,一类是辅助性的。展示性数据主要用于供人们浏览信息本身,而辅助性数据则用于帮助某个特定社会系统提升信任程度,确保交易安全,包括市场主体的身份信息、信用评分信息、匹配信息等。它们更有能力脱离特定场景不断整合抽象,将若干小场景融合为大场景,从而实现基础信息的扩展应用。无论是传统本地市场还是扩展式数字经济市场,都需要这类功能的数据。

 

功能分析既是一个描述性框架,也是一个规范性框架,即从市场主体的巨大需求出发对数据类型进行讨论,理解市场想要什么,并由此生产相应数据,进行成本收益分析。类似地,如果数据出境是重要的目标,起到辅助跨国业务正常开展的功能,那么就需要容忍一定的风险,制定逐步完善的规则,而非担心风险减少或停止流动。风险可以通过试点和竞争加以展示和降低,为数据使用不断推广打下基础。更重要的是,功能及其所需要的信息是伴随环境变化而变化的,在流动性较强的社会中,不安全因素增加使人缺乏足够的预期进行合作活动,社会主体更有动力隐瞒个人信息,因此需要公共机关要求强制披露或集中披露相关风险信息提供查询;在信任程度比较高的环境中则不需要这样做。因此,数据功能的出现及其实现方式都在不断变化,需要综合考虑信息获取成本、社会主体感知程度、约束力和后果等多重因素。将不同公共数据照此进行功能分类,可以适当跳出既有关于公共数据权属、风险的模糊性和固定化思路,看到和承认实践在变化,不断地推动新型数据的开发利用。

 

 

(二)市场和市场要素想要什么

 

如果仅仅关注数据要素市场如何形成,可能不足以理解公共数据开放对市场主体的影响,还需要回到市场特征本身。从生产方式的需求来看,现实中至少存在两种要素市场:一种是上文提及的由数字平台主导的跨地域扁平要素市场(网络化);另一种则是由行政区划层层分隔的本地化市场(网格化)。在网络化市场中,认证与识别服务是由平台企业统一提供的默认基础服务,更多面向流动性的个体,特别是自然人用户,追踪到的行为数据在平台企业的封闭架构中流动。而网格化市场则由政府在行政系统内部进行塑造,通过不同种类的行政行为获取行政相对人的信息,对相关行政行为和主体进行评价,更多涉及企业主体,较少涉及自然人,有助于一般性开放市场的快速建立和维护。

 

如前所述,按照原来设想的制度逻辑,公共数据被开发出来用于带动社会性数据汇聚,这容易被理解为将公共数据集中通过交易所进行投放或授权运营开展交易,使用者由此产生的衍生数据需要回馈至原初的公共资源池。这种想象可能在现实操作中存在偏差:首先,如果地方政府只是按照既有思路投放部分展示性数据资源,在特定行业中无非是在边际上增加供给而已(本地市场更青睐文化艺术内容交易),起不到真正辅助市场升级的作用,对线上和线下市场而言并非真正的核心功能。其次,如果衍生数据能够有价值地回馈,恰好意味着这些数据可以追踪到特定社会主体并提供更加充分的行为画像,而这恰好是公共部门不愿或无力进行处理的麻烦问题。最后,更何况使用者可能更倾向于训练人工智能算法模型,而非简单地商用。因此从市场要素角度而言,进行匿名化处理的展示性公共数据的吸引力未必有想象的那样大,更需要的可能是公共数据的其他功能,能够惠及一般性市场,帮助市场主体通过公共信息获益。

 

数据二十条规定,按照原始数据不出域、数据可用不可见的要求,以模型、核验等产品和服务等形式向社会提供,对不承载个人信息和不影响公共安全的公共数据,推动按用途加大供给使用范围。按照这一思路,一些省市已经意识到非市场机制推进公共数据运行的方式,即并非所有的公共数据都需要以市场化方式进行,重要的是稳定生产市场需要的信息,推动共享,进而降低要素流动成本。我们已经看到,数据交易所建设的高门槛合规机制仅能吸引少数企业,而大部分企业因合规成本较高只能选择场外交易,更凸显出推动辅助性功能数据快速进入市场的必要性。

 

综上所述,我们可以看到不同类型市场对公共数据的需求存在差异(见表1):

 


 


三、行政发包制与公共数据分级理论框架

 

(一)行政发包制概述

 

一般地方政府对公共数据开放进行分级的原则仍然是风险导向的,例如《江苏省公共数据分类分级规范》规定,根据数据在经济社会发展中的重要程度,以及一旦遭到篡改、 破坏、泄露或者非法获取、非法利用,对国家安全、公共利益或者个人、组织合法权益造成的危害程度,对公共数据进行定级。这一原则能够在本级政府可控的范围内操作,但无法明确受控范围的边界,本节从行政发包角度重新思考这个问题。

 

目前地方政府的公共数据开放实践逐渐深入,但研究者较少从府际角度进行讨论,似乎由地方政府进行推进是理所当然的,而且我们看到的大量报道也都指向网格化市场需要的本地公共数据。然而如果仔细考察就会发现,中央政府部门在目前公共数据公开过程中起到举足轻重的作用,不仅塑造规则,更有能力改变数据流动的结构。本节将使用政治学中常见的理论框架——行政发包制——对府际关系下的实践进行解释。该框架主要用来描述中国中央政府和地方政府之间的发包关系,即中央将各类行政事务和公共服务发包给地方政府,同时通过人事晋升和地方财政收入等方式提供隐性激励,不断推动完成下派的治理任务。在这一框架下,中央政府根据拥有权力和产生统治风险的不同类型在中央和地方进行事权划分,而地方政府在执行过程中也有不同的动力和表现,由此可以将不同治理事务进行简单划分(见表2):

 



2中的I象限是中央政府有动力进行发包的一般公共服务事务,但给地方提供的晋升激励较弱;II象限则涉及较强的晋升激励和获得特殊政策的可能,有时可能会涉及一定的统治风险,中央政府有动力进行发包,必要时也会进行细致的指导;III象限是中央政府不太有动力进行纵向发包的领域,主要涉及全国性的基础设施和核心权力领域,大部分服务由中央直属企事业单位执行,尽管地方也有较强意愿获得牌照或资质;IV象限则属于纯粹的公共安全和国家发展事务。这一理论框架综合考虑了绩效和风险分担,并非绝对是风险导向的。如果地方能够承受一定风险进行创新,并将负外部性限制在一定地域范围内,就可以允许其进行试验和推动。而全国性的基础设施则统一由中央政府部门予以规划和指导建设,在试点基础上不断推进,也可以有效降低风险。

 

(二)理解公共数据开放分级

 

在前述行政发包制框架下,公共数据开放应用实践可以得到较好的解释,即并非所有类型的公共数据都可以由地方政府进行推进,即使中央政府有意愿发包,地方政府也未必有足够动力执行,而是同时考虑到自身是否能够从中获益。当然这并不是说做好了就一定有直接回馈,而是说在同等预期条件下,公开何种数据可以带来更多可见益处的预期(如对地方经济增长有帮助)。由此可以将表2细化为下表(见表3):

 



现有地方公共数据条例的分级标准大都根据风险强弱分级,但没有考虑到中央和地方政府部门各自的运行动力。有时即使某类信息存在一定风险,也完全可以由地方政府来自行承担和开发,从而推动本地市场发展,特别是风险偏好型地方政府;但具有基础设施功能的公共数据则需要在全国范围内统一标准和规则。这一道理解释了在I象限,涉及的公共数据基本上是本地化和可展示性的,地方持续开发的动力不足,仅仅根据上级政府要求来执行。II象限则可能发挥地方更多能动性,特别是涉及统一信息系统以及可以增加部分财政收入的展示性数据,中央也有意愿发动地方开展建设。III象限涉及基础设施类型的辅助性数据,中央政府没有动力外包,希望进行全国统一规划设计,但这个过程也伴随着一些反复和调整。例如,现有企业征信管理是备案制,在各地的市场化竞争较为充分,仍处于II象限,而个人征信管理则从之前的若干平台企业建设为主转移至全国两家机构集中持牌运营,进入III象限。IV象限则涉及特定种类的关键展示性信息内容,各有其特殊性。

 

 

在这一稳定结构中,公共数据公开政策的执行者就不仅仅限于地方政府,而是中央和地方两级结构。中央和地方在视角和数据功能上有明显的区分。这说明行动中而非纸面上的公共数据分级如何形成,在行政发包制下可以得到一定解释。从中央角度看,从《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》《关于推进公共信息资源开放的若干意见》发布以来,中央开始系统推进一张网”“一平台”“一中心建设,各中央部门也纷纷建设主管的垂直领域全国一张网信息系统,如国家企业信用信息公示系统、国家医疗保障信息平台、国家公共资源交易电子服务系统等。全国一张网建设,首先意味着中央部门在主管行业领域进行大规模数据集中收集,便利了全国的政务信息流动,强化自身的监督权和发包权,对地方政府如何使用这些数据可以进行监督与核查。其次,这一机制意味着地方相关行业除非在地方事权的范围内可以继续生产数据外,相当多的重要领域的数据并没有太多权限自主决定公开和使用。最后,如果放在行政发包制下理解,中央政府的动力是将数据资源视为对地方经济活动约束和管理的一个重要抓手。例如,中央需要推动经济政策时,可以由特定行业的全国数据库运营者定向同地方政府合作,授权数据开发应用,或者与全国性的相关行业协会合作,释放数据价值,从而将关键行业数据真正作为一种公共资源进行集中控制和调配。2022年国务院办公厅发布的《全国一体化政务大数据体系建设指南》明确指出,国务院各有关部门统筹协调本部门本行业,摸清数据资源底数,编制政务数据目录,依托国家政务大数据平台,与各地区各部门开展数据共享应用,不得另建跨部门数据共享交换通道,已有通道纳入国家政务大数据平台数据共享系统管理。

 

在这个过程中,中央部门垂直地建立信息共享机制,推动互联互通的信息系统使用,并通过特定中央国企进行运营。后者的职责包括对相关数据进行持续督促收集、大数据行业统计,并根据政策需要进行商业化利用,但这些数据往往并未在部门之间横向共享。这里还涉及国企运营的全国性系统和地方政府的复杂合作关系,经常出现歧视性授权使用行为,可能引发数据垄断问题。此外,经过这个合作机制,地方政府可能不需要受到本地公共数据开放规则的约束,这也从一个侧面说明地方政府的能力和行为空间有限。

 

和中央政府部门行为模式类似,在行政发包制下,地方政府也有动力出台各自的公共数据共享公开条例,控制利用本地化的公共数据资源。动力之一是数据归集和政府内部共享,一些省级政府要求各地数据汇总至省级平台,建立全省一张网,希望加强对下级政府的控制约束,在科层制下使基层政府行动空间越来越小。需要的时候可以和地市进行合作对接,加强对特定市县的定向支持,并把该单位列为试点先行先试,逐步推广。动力之二是可以由此推动本地经济发展,推动中小企业贷款融资,解决就业问题,响应中央的政策要求。动力之三是掌握数据权力对本地要素流动进行追踪和限制。如在新冠疫情期间,个人健康码和行踪数据的收集就从基层逐渐收归到省级,否则可能出现数据滥用。

 

值得一提的是,公共数据是否能够收费交易一直有争议,数据二十条提出推动用于公共治理、公益事业的公共数据有条件无偿使用,探索用于产业发展、行业发展的公共数据有条件有偿使用,为数据授权运营收费确定了政策性支持。至此地方政府更加有动力推动诸如文化产业数据交易之类的经济活动,这就是为什么尽管数字藏品(NFT)平台交易可能产生非法融资风险,[23]仍然有相当的地方政府在不断推动,公共数据交易就成为强化数据财政的一种做法。[24]尽管不排除地方政府为了实现政策要求,仅在形式上开放一些没有特别用途和价值的政府信息,但总体而言只要公共数据开放能够在现有激励机制和任务下进行对接挂靠,帮助实现其他更加重要的治理发包任务,开放活动就可以预期持续进行。

 

由此不难发现,行政发包制塑造了整个公共数据循环的生产秩序和结构,中央推动地方不断生产,又将数据资源回馈给地方。地方政府的行动空间对公共数据开放而言是十分关键的问题。接下来将结合展示性和辅助性数据对这一问题进行讨论,并分析各自对市场的影响、生产结构、是否需要运营和交易等问题。

 

 

四、应用:比较解释三种公共数据

 

(一)展示性数据

 

数据要素政策的基础起源于21世纪初国家推动展示性公共数据要素资源的公开。但当时互联网刚开始发展,国家尚未认识到辅助性数据要素的重要性。直到平台经济初具规模,形成了巨大的商业生态系统,人们才发现市场中辅助性信息基础设施的重要意义。如前所述,单纯的展示性公共数据公开或授权运营本身可能不足以产生不同于原来政府信息公开的独特的增量价值。如环境或空间数据对于交通服务很有帮助,但仍然是边际上的,也无法帮助追踪至使用者产生消费互联网的价值形态。因此,除了一般性的延续传统政务信息公开的目录外,地方没有特别动力继续扩大公共数据的产出,因为这涉及一系列对信息系统的投入。

 

展示性功能意味着数据本身可以被直接读取和使用,主要用于信息性查询(及其基本的匹配功能),或者如果数量比较大,可能也会被机器读取,最终形成稍微抽象的数据产品。从价值开发的角度看主要可以分为三类:第一类是空间数据,如交通、地图、环境、气象等数据,此类数据用于描述物理空间的结构和变化,为在空间中提供服务进行匹配,特别是地图服务和天气服务,既可以单独授权进行牌照管制,也可以成为其他类型服务的辅助要素。第二类是产业链数据,用于工业大数据和知识图谱的生成,更多用于地方产业链汇聚和建设,特别可以为重要企业投融资提供行业指引,这类信息也可以授权运营或者开放。第三类是更加传统的文化产业产权交易数据,地方政府主要动力是将各类艺术馆、博物馆等文化产业的内容或实物通过区块链技术转化为数字藏品进行售卖,从而作为数据交易的一种类型。全国还建立了统一专网和交易中心进行互联互通。

 

不难看出,上述大部分展示性公共数据都位于I象限(如环境和空间数据),地方政府加大数据开放投入的动力不大。即使加大投入,也受制于数据种类和价值生成的结构,只需要逐步推进,在边际上增加价值即可。但那些中央政府特别看重的政策目标和能够带来经济收益的项目则属于II象限(如产业链数据和数字藏品),地方政府都愿意抓住政策窗口期迅速推进相关产业。如果有利可图,地方政府也有动力将一些展示性数据委托给地方国企运营。而对民营企业来说,除非是大型平台企业,否则很难获得资质,这就容易产生公平竞争问题。因此以往研究经常关注的I象限公开内容,在整个公共数据开放过程中地位并不太关键。

 

(二)身份数据:认证与识别

 

身份信息是经常被忽视的更为普世化的信息基础设施服务之一,这是任何市场正常运转都需要首先搭建的公共服务。如果缺乏此类服务,缺乏对市场参与者身份的辨识和追踪,市场可能会短时间内陷入机会主义交易,逐渐崩溃。在数字经济生产方式中,身份数据的目的是对真实基础身份的认证,确保使用公共服务的安全性(流动安全)。这需要全国统一技术标准,不能由地方进行设计和割裂。身份认证在互联网发展的前15年中以网络实名制名义出现,早期实践因缺乏整体规划,以具体政策目标为导向。即由中间人依照法律要求,通过传统身份证的在线比对核对,对主体使用网络服务的资质进行限制。从2010年开始,国家全面推动网络主权和真实身份认证,这一阶段面临着移动互联网和物联网的挑战,以及如何将线上认证拓展到广泛的线下场景的关键问题。这一阶段的前提是通过许可方式认证互联网每一层面的服务提供者和信息资源,再通过他们对更加广泛的用户进行身份认证。逐渐地,身份认证成为数字经济中十分重要的辅助性数据,当下的一网通办无证明城市建设实际上就是推动广泛认证服务的结果。

 

原初的身份证仅仅为了证明身份,但身份证在这一过程中的功能开始发生转变。在网络实名制探索过程中,不同部门主导的身份认证实践不断体现和拓展现代身份证的若干功能:(1)身份证明。身份证首先代表了国家授予自然人的公民身份,是一种政治身份,从而彰显主权权力。公民凭借此标识符即有权参加公共事务、获得公共服务。如选举、公共医疗保障、金融服务、公共交通服务等。2)查验与出示。在特定场合,公民需要向警察出示身份证件。如针对有违法犯罪嫌疑的人员、依法实施现场管制、发生严重危害社会治安突发事件,在火车站、长途汽车站、港口、码头、机场或者在重大活动期间设区的市级人民政府规定的场所等需要查验身份的场合。3)追踪与威慑。实名制的原初逻辑便是按照后台实名,前台自愿原则通过真实身份认证进行追踪,进而对潜在违法行为进行威慑。政府可以通过身份证追踪到犯罪嫌疑人使用特定服务的轨迹(如酒店、公共交通、网吧等),还可以通过人脸识别、步态识别技术进一步在公共区域内增加可供认证身份的连结点。一旦被广泛应用于接受私人服务的场合(如商场),身份认证即可成为履行安全保障义务的重要方式。这些功能越来越多地通过一次性的终端认证联系在一起,既是身份识别过程,又是行为记录追踪过程。随着适用的场景不断扩展,这一权力将涵盖更广泛的领域。后台记录不仅仅能够用于信用惩戒,更容易形成威慑。从这个意义上说,国家最早将居民身份证变成了一个全国范围内的超级账户,除了赋予公民身份,还在该账户下积累数据,便于事后追查。

 

但从国家角度说,对个人的管理仍然是由各类组织进行,而没有直接面对个人。因此个人和企业不太一样。目前还是把重点放在企业身份的认证,但个人身份认证还停留在试点阶段。《中华人民共和国网络安全法》(以下简称《网络安全法》)通过后,对身份认证提出了更多要求。主导线下二代身份证的公安部第一研究所建造可信身份认证平台(CTID),和微信与支付宝这样的超级APP合作推出居民身份证网上功能凭证(也称网证)。这是以身份证制证数据为基础,通过CTID签发的与实体身份证芯片唯一对应的电子映射文件。用户只需要在平台相应小程序中申请开通,即可对外展示或通过设备扫描认证。由于越来越多的人注册了微信或支付宝,可以预见这种通过应用平台推动的认证方式能够尽快普及,且较为灵活,能够适应不同终端设备和APP平台。

 

认证权力稳定地属于III象限,由中央政府部门进行设计和推行。但在新冠疫情期间,行程卡和健康码被创设出来,按照展示和追踪功能进行使用。为防止地方权力滥用,健康码的设计和入口不断上收。在2022年底恢复新冠病毒感染乙类乙管之前,大部分省级健康码已经做到了本省统一系统。同时,一些地方还创造出其他类型的认证信息,加上CTID尚未完全普及,因此可以说,个人认证基础信息目前仍然处于分裂状态。相比之下,统一的企业和其他组织的身份认证数据却长期没有统一。在2015年以前,相当多的机构代码受到条块影响不统一,国家也缺乏有效协调管理和信息共享工作机制。大多数代码仅应用于各部门内部管理,一些部门信息数据相互割裂封闭。同时,各类机构代码长度、含义、作用不同,导致法人和其他组织在设立和办理相关业务时,需到多个部门申请代码,有的还收取费用增加社会负担。由此发展改革委等八部门发布《法人和其他组织统一社会信用代码制度建设总体方案》,逐渐理顺代码管理体制和机制,建立覆盖全面、稳定且唯一的以组织机构代码为基础的法人和其他组织统一社会信用代码制度,为全国统一大市场建设奠定基础。

 

不难看出,市场主体身份数据是一类较为特殊的公共数据,其产生和调整不是事先确定的,而是根据实际情况不断测试迭代。但此类信息从未成为市场交易的对象,因为其是国家为了实现公共服务而提供的降低风险和交易成本的信息。在不同场合直接应用此类信息有助于公共服务的推行,如果增加价格因素可能会降低效能。

 

(三)信用数据:公共信用与征信

 

在现有社会信用体系框架下,社会信用体系分为政务诚信、商务诚信、社会诚信和司法公信四个主要类型,以及强化公共信用信息系统和征信系统两个主要系统。从国务院《社会信用体系建设规划纲要(2014—2020年)》发布以来,在行政发包制下,为让地方政府更好地实施建设和推动试验,公共信用事务一开始就位于II象限,但因为这一手段缺乏约束,成为一些地方滥用权力的手段。中央政府开始上收权力并加以规范,逐渐将其置于III象限。202011月国务院常务会议要求坚持依法合规、保护权益、审慎适度、清单管理,规范和完善失信约束制度,有序健康推进社会信用体系建设,从六个方面入手进行规范:(1)科学界定信用信息纳入范围和程序;(2)规范信用信息共享公开范围和程序;(3)规范严重失信主体名单认定标准;(4)依法依规开展失信惩戒,确保过惩相当;(5)建立有利于自我纠错的信用修复机制;(6)加强信息安全和隐私保护。因此公共信用作为一种新型行政处罚措施逐渐收归中央事权,但仍然为地方保留了一定自由空间,除了中央制定的全国公共信用信息目录外,各省和特定城市仍然有权制定补充目录。相比之下,企业征信行业较为发达,市场化程度高,成为地方政府市场管理的重要抓手,并未由中央统一集中上收管理,在不同的经济周期中将征信和中小企业融资信息作为杠杆使用,因此这一事务一直位于II象限。征信信息的辅助性功能目前要解决的仍然是属地化的企业和其他类型的组织,相关信息公开也主要服务于本地企业组织。

 

传统经济中自然人主体往往隶属于企业或其他社会组织,由后者进行代理管理。由于数字平台的兴起,以包括电子商务、分享经济、零工经济在内的个人为单位的生产和消费过程变得更加有影响力,传统企业组织对个人的约束削弱,需要有新的平台化治理方式。在这个背景下,平台有能力追踪消费者的购买与使用行为,从而将生产与流通消费环节紧密相连。为辅助流动更加快速的数字市场运转,平台企业通过第三方支付服务获得人们的真实的支付场景,并不断扩展到线下服务,为消费者信贷业务提供了数据基础,对个人消费者的评分和标签最终形成了大数据征信模式。在2020年以前,平台内的大数据征信模式一直位于II象限,多家头部平台企业利用此类模式推动了流行的消费者信贷业务和助贷模式,国家并未进行干预。但由于后来加强对个人信息的保护和认识到助贷模式的风险,国家逐渐加强对助贷模式监管,由央行的个人征信信息中心提供公共服务,并发放市场化个人征信牌照,两者都以集中化的方式运营,由此转向了III象限。

 

本部分对展示性和辅助性公共数据进行了比较,希望重新扩展我们对公共数据开放的认知框架。首先,数据要素市场供给不仅仅是展示性数据,也包括辅助性数据。前者并不如以往研究想象的那样重要和广泛,更加重要但往往遭到忽视的反而是后者。其次,需要重新审视地方政府在公共数据开放过程中的作用,只有看到在行政发包制中所处的结构,才能理解何种类型的开放是他们更有动力推动的。最后,公共数据开放已经形成了交易所之外的另一个生态,但因历史原因较为复杂,需要区分对待,中央和地方政府对于利益的追求可能是其中之一。

 

 

结语

 

本文从功能和结构的角度重新讨论了在现有法律制度框架下,公共数据开放事实上的分级分类如何运作。分级分类是进行公共数据处理的常见思路,通常以风险原则为导向。这种思路固然可以涵盖部分地方政府的开放实践,如涉及个人信息和商业秘密的内容需要谨慎地进行匿名化处理,但无法解释为何我们还需要一整套信用体系对相关社会主体信息进行披露。由于经常无法对风险进行有理由地说明,风险框架划分相对主观。但功能框架则基于一定程度的成本——收益衡量,认为对特定信息进行披露或使用本身可以推动市场有效运行,满足市场主体的需求,无论涉及何种数据,该功能都需要确立。对此类功能的认识决定了不同政府层级的投入和推动,这都说明现实中的分级分类是纸面上相关制度的有效支撑。这一框架可以进一步应用于理解重要数据、关键信息基础设施、数据交易所等需要分级分类的监管事务。

 

作为总结,本文研究的重点在于,首先,公共数据开放的种类并非无限,需要重新按照数据的功能进行分类,这并不是不要抽象化,而是需要引入不同视角看待,特别是需要看到拥有市场基础设施功能的信息服务供给而非单纯数据内容供给。其次,关注数据流动的生产性结构和层级性结构,生产性结构决定了一级政府不太可能实时追踪广泛的社会主体,因此在信用评分和行为分析上都弱于平台企业的行为数据生产。此类公共数据起作用的方式主要集中在行政处罚、监管便利和提供基本的公共信用。层级性结构决定了对于某类公共数据而言,中央和地方政府部门(及其运营组织)在如何开放使用不同类型的公共数据上形成了事实上的分级(不仅仅是中央地方事权意义上的划分)。最后,相当多的公共数据仅服务于公共服务的改善,无助于一般性市场要素流动和服务质量改进,因此除了市场化交易,还要看到依托行政力量推动的更为广泛的与社会主体进行数据共享,推动投资和交易真实信息,以便更好地匹配合作。重点不是数据本身是否形成了市场,而是看数据服务于何种市场,然后再讨论行政还是市场化手段更能满足该目标。在这一过程中,不同政府层级之间的动力和考虑不同,也会影响不同数据的生产和公开。例如,针对自然人主体的数字身份基础设施和征信系统都经历了从平台经济开发到推广至一般市场的过程,这说明市场机制帮助推动了更加统一化的征信服务。

 

中央和地方政府之间的公共要素供给究竟应当如何进行,本文并未给出完全的应然答案,而是希望展示其复杂性。传统上对公共数据开放的讨论,多集中于概念辨析,但现实变化和认识使得专注概念本身意义不大,关键是看到概念的指涉以及想要解决的问题。本文将功能分析框架引入对公共数据的分析,认为需要首先理解市场正常运转需要一些基本的信息基础设施功能,而且需要伴随社会变化而不断创设新型种类的数据,为公共目的创设和生产。因此重要的是生产和使用能力,而非固定不变的资产。功能角度的讨论有助于跳出既有概念,看到不同类型的数据如何实现真正的价值,从而围绕该种功能展开讨论,即如何进行价值最优的选择,究竟通过行政还是市场角度进行提供。而结构角度的讨论有助于理解社会行动主体选择的约束,特别是中央和地方政府之间的结构博弈,使我们理解任何法律执行都会遇到的约束和限度。恰好是在这样的动态维度下,我们才能更好地思考为推动特定法律执行落实,需要如何调整相关激励和行动空间。

 

本文借助公共数据开放问题,还延伸推动讨论了两个子问题。一是国家和市场的关系问题,即国家可以通过主导数据要素来推动市场建设,除了建立新的数据要素市场,也可以通过释放辅助性信息帮助传统市场发展。从国家角度看,越能成为普遍市场基础设施的数据,越需要统一授权或牌照运营。本文通过对身份认证信息和征信信息的分析讨论了这一点。二是中央和地方关系问题,即中央为推动统一大市场,也有动力将基础设施服务收归建设,而其他类型的公共数据则希望继续推动外包给地方进行。中央和地方政府利用公共数据推动不同市场的动力,使得权力博弈趋于稳定,从而进入一种公共数据生产的循环过程和周期。

 

 

 

原文刊载于《行政法学研究》2023年第4期,感谢微信公众号“行政法学研究编辑部”授权推送!