当前位置:首页 > 文献资源 > 研究报告
文献资源
林喜芬、李铮|论计算法学的全球发展趋势
2024年10月30日 【作者】林喜芬、李铮 预览:

【作者】林喜芬、李铮

【内容提要】



论计算法学的全球发展趋势




林喜芬,上海交通大学凯原法学院教授, 中国法与社会研究院副院长

李铮,上海交通大学凯原法学院博士研究生





摘要:随着新文科建设的推进,计算法学正成为近年来炙手可热的新兴学科和研究范式。中国计算法学现今的问题是:对计算法学之发展脉络,尤其是在学科的研究范畴和发展路径上没有形成一致的认识。文章通过使用多种统计学方法和研究工具,系统地梳理、分析和对比全球近二十年的计算法学研究的相关文献,重现了从21世纪初至近年国内外计算法学研究阶段、科研合作、研究主题和知识结构的演进过程和差异。与国外相比,中国计算法学在不同研究范畴上可能走向分化。倡导问题导向的计算法学研究有利于梳理不同研究路径的关系,促进学科的有序发展。学界需要尝试在问题意识、研究能力和研究方法的不同维度上整合计算法学的研究路径,探索计算法学发展的中国道路。

关键词:计算法学;法律实证研究;计算科学;人工智能;文献计量学






一、 研究缘起:如何实证地观察计算法学的发展

随着实证研究的稳步推进,智能技术的有机融合,以及数据资源的渐序丰富,计算法学正成为当前法学领域的热点议题之一。一方面,国家政策层面加大了对高校学科交叉的支持力度,促进了计算法学及相关学科群的构建与发展,以计算法学、数字法学、人工智能法学等命名的新兴学科在诸多主流高校接连落地。随之,数据权利、法律大数据、司法人工智能等带有很强交叉性的论题竞相成为法学领域新的学术增长点。另一方面,与之前基于零星数据或定性资料的实证研究相比,以裁判文书等大规模数据为基础并辅之以量化统计的实证研究越来越得到提倡和推介,产出了一系列数据科学属性较强的学术成果,后者乃是一种带有更强计算属性的学术研究范式。此外,法学界与其他学界(如计算机学界)、产业界共同成立的中国计算机学会计算法学分会等学术组织,共同召开的与计算法学相关的学术论坛,都不同程度地促进着计算法学的学科构建和法学研究的范式转型。

计算法学的概念并非我国首创,而是来源于域外相关学科的发展并由国内学者翻译后引入。目前,已有多名学者从学科论的角度作出了努力,如左卫民、季卫东、申卫星、马长山、屈茂辉等从计算法学的基本概念、学科范畴、体系建设的角度对计算法学进行了较全面的回顾和展望;于晓虹、邓矜婷等从方法论的角度对计算科学在法学研究中的应用进行了较详尽的阐述。张妮、刘东亮等探讨了计算思维在计算法学中的功能和作用。这些研究对计算法学在我国的勃兴与发展作出了奠基性贡献,但由于其主要采取的是学理提炼和学科提倡的视角,似乎仍有必要引入更具有计算特色的方法来还原计算法学在全球范围内的发展脉络,并借此探测中国计算法学的发展路径。

本研究以全球计算法学领域近二十年的文献为基础,遵循计算思维,运用文献计量学方法与工具,力求全面诊断国内外计算法学的发展现状,并试图探讨以下几个核心问题:第一,中国的计算法学在研究阶段、研究合作与研究主题等基本面向上与域外存在哪些异同?第二,计算法学学科自身具有交叉属性,不同学科间的科研合作会促进计算法学成果的产出吗?第三,中国计算法学的知识结构演进维度与域外相比是否存在差异,如果二者存在不同,其根源为何?第四,是否存在宏观视角下的计算法学研究,应如何更好地厘清计算法学不同研究路径间的关系?笔者希望通过回答上述问题,反思我国计算法学的发展道路。

二、 数据来源、计算方法与操作工具

(一) 数据来源

计算法学的概念与范畴目前尚未形成统一意见,其与法律信息学、计量法学、数据法学、人工智能法学等相关学科、概念间存在延续、包含、交叉关系。以目前国内学界提出的宏观概念与内涵来看,相关研究可分为本体论、规则论与工具论三个方面,是计算科学在计算思维、计算技术、计算方法三个层面上与法学思想的结合。因此,本研究于抽象的计算思维层面,选择了“计算”“自动”“机器”等主题词,体现运用计算科学进行问题求解的基本理念;于具体的计算技术层面,选择了“人工智能”“大数据”等主题词,反映计算科学领域当前最受关注的技术;于微观的计算方法层面,使用“机器学习”“算法”等关键词,表示法学研究与实践应用中对计算科学方法的引入。同时,除了关注计算科学技术对法治的挑战与赋能,计算法学还特别强调计算科学在研究方法中的引入,以定量的实证研究为主要特征,以裁判文书为常见的研究样本。因此,选择了“裁判文书”“实证研究”等主题词,对检索式进行补充和完善。将上述关键词分别组配后于WoS核心数据库和CSSCI数据库中检索,将学科范围限定于法学领域,最终收集到2000年至2020年间,已公开发表的原创性研究和文献综述共计5060篇。为了保证研究结果的准确性,使用软件自动除重和人工剔除结合的方式,从样本中剔除了重复数据和无关信息。

(二)计算方法

本研究从基本情况和知识结构两个层面展开。在基本情况层面,对文献数量进行描述性统计和曲线拟合,指数拟合公式为y=αeβx,线性拟合公式为y=αx+β;在研究主体情况分析中引入了合作网络分析,并对其中最大一个子群中各作者的点度中心度进行计算。在此无向图中,某一节点ni的点度中心度d(ni)可以表示为:


其中,ki表示现有的与节点i相连的边的数量,N-1表示节点i与其他节点都相连的边的数量。为进一步揭示作者发文量、专业背景与其在网络中的地位间的关系,分别采用Pearson相关性分析和独立样本t检验进行验证;在研究主题分析中,使用了测地距离对关键词进行降维,使用欧式距离进行多维尺度分析。以ij分别表示需要测量距离的两点,计算公式分别为:


在知识结构层面,本研究采用文献共被引分析。通过计算机处理,将文献原始引证网络矩阵化,基于矩阵运算获得共被引矩阵后,进一步进行统计学处理。

(三)操作工具

为了便于理解和阅读,本研究使用了多种软件和方法对结果进行了可视化展示。其中,统计学分析与可视化使用SPSS 25.0完成,作者子网络分析及可视化使用Bicomb 2.0Ucinet 6完成,知识结构演进分析则由Citespace 5.8.R3完成。

三、中国计算法学的研究现状:与国外比较的审视

(一)国内外研究阶段存在明显差异

近二十年来,各国在计算法学领域发表的研究文献数量呈增长趋势。美、英、意等国家的研究文献数量呈波动式上涨,各国出现快速增长的时期有所不同。我国的首篇重要文献出现在2001年,年发文量保持稳定增长至2013年的30篇。随后,国内研究的文献数量出现了两次爆发式增长。第一次出现在2014年,较前一年的数量翻了一倍,并以年均18%的增幅快速增长至2017年。次年,文献数量再次爆发,同比增长两倍,至此,我国在这一领域的重要科研产出在数量上已经远超他国总和,并稳定在年发表300篇左右(图1A)。


某一学科从诞生开始,其演进历程可划分为学科诞生期、学科发展期、学科成熟期与学科饱和期四个阶段,各阶段的文献增长曲线分别表现为较难确定表达式、稳定的指数增长、向线性增长演化和平行于横坐标四种形式。对中美两国发文数量随时间变化的情况进行分析可以发现,近二十年间我国在CSSCI数据库(R2=0.853)、WoS数据库(R2=0.912)的发文数量以及两数据库发文总量的变化趋势是一致的,总体呈明显的指数型增长(R2=0.917),而线性拟合的结果较差(R2=0.577)。美国的发文量变化趋势在指数曲线的拟合优度(R2=0.906)略高于线性拟合(R2=0.889),但二者在数据上相差不大(图1B、图1C)。从结果来看,我国与美国在计算法学的研究上处于不同的发展阶段。2014年至今的两次爆发性增长使得我国的计算法学研究已经进入学科发展期,而与此同时,美国的计算法学研究正从学科发展期转向成熟期。

(二) 国内研究合作缺失明显

随着科学问题的复杂化,高质量研究成果的产出越来越依赖于团队协作。目前,各国在计算法学的研究中已经产生了较为紧密的合作关系。发文量最大的美国与欧美发达国家间存在广泛的合作,占研究成果总体的11%。虽然我国发表在国外期刊的国际合作成果比例已经达到31%,但仅占国内外期刊总体的1%。在研究机构层面,国外已经形成了由哈佛大学、斯坦福大学法学院、牛津大学等机构主导的研究合作网络。而国内的高校及研究机构虽已与境外建立了科研合作关系,但均未与此领域中具有领导地位的机构开展过科研合作,这一结果再次从侧面反映,我国在该领域中的国际合作数量、质量均有待提高。

在个体层面,以欧美学者为主的研究合作关系多见于工具论路径下的计算法学研究,国内学者在网络中占比较低。笔者进一步提取网络中最大的子群,生成作者共现网络的两个最大子群,涵盖了从事法律信息学、计量法学研究的主要学者,代表了计算法学的两个主要学科起源(图2A、图2B)。两网络中各有33位作者,彼此存在越多的合作关系则其在网络中越处于中心地位,这种地位可以通过点度中心度d(ni)予以反映,数值越大则其在网络中所处的地位就越高。第一子群中,T. J. M.Bench-Capon处于中心地位,d(ni)=52H. PrakkenF. Bex9人处于重要位置,d(ni)20K.D. AshleyG. Sileno16人次之,d(ni)5D. WaltonL. Van der Torre7人,处于再次之地位,d(ni)5。在第二子群中,Stephen J. Choi处于中心地位,d(ni)=12Michael HeiseKuo-Chang Huang9人紧随其后,d(ni)5Tom GinsburgAdam S. Chilton15人次之,d(ni)3Lior Jacob StrahilevitzGeoffrey P. Miller8人则处于再次之地位,d(ni)=1


通过Pearson相关性分析对作者的发文数量与点度中心度的关系进行检验,结果显示,二者间的相关系数均大于0.6R=0.771P0.01R=0.657P0.01),两子群中作者地位与其发文数量均呈强正相关关系。第一子群中33位从事法律信息学相关研究的学者,以计算机科学家为主,但其中18位均具有法学专业背景。第二子群中从事计量法学研究的33位作者中,14位作者具有法学外的其他专业背景。其中,8位具有经济学学位,2位具有统计学学位,其余4位分别具有政治学、哲学、心理学与理学学位。依据专业背景分别将两个子群中的作者划分为两组,独立样本t检验结果显示,无论在哪一个子群中,具有复合背景的作者的点度中心度均显著高于单学科背景的作者(P0.05)。

(三) 国内外研究主题与维度趋同

使用Bicomb抽取两数据库中的关键词字段,合并同义词后,取占比前10%的为高频关键词,得到41个中文关键词、33个英文关键词。排在前10位的中文高频关键词为人工智能、大数据、著作权、个人信息、大数据时代、云计算、算法、隐私权、知识产权、法律规制,排在前10位的英文高频关键词为Artificial intelligenceBig dataMachine learningPrivacyEthicsDeep learningNeural networkData protectionLawGDPR。上述关键词代表了国内外近二十年来计算法学研究的热点话题。为进一步研究关键词间的内在联系,利用Bicomb 2.0生成41×41的中文共词矩阵与33×33的英文共词矩阵。可以发现,中文关键词被划分为5类。“人工智能”占据网络的中心地位,形成单独聚类,“个人信息保护”“被遗忘权”等词语形成第二聚类,“权利归属”“人工智能创造物”等词汇形成第三聚类,“法律人格”“自动驾驶”等词汇形成第四聚类,与“人工智能”“大数据”关联密切的“司法大数据”独自形成了第五聚类。英文关键词则被划分为四类。其中,“Big data”“GDPR”等词汇形成第一聚类,占据网络的中心,“Cloud computing”“Internet of things”等词汇形成第二聚类,“Data mining”“Social media”等词汇形成第三聚类,“algorithms”“surveillance”等词汇形成第四聚类。将共词矩阵导入SPSS 25.0中后转化为相似矩阵,数据拟合度极佳,揭示了国内外在重要研究领域中的话语趋同。

四、中国计算法学的知识谱系:聚类比较与脉络变迁

基于文献共被引分析,对中外研究成果进行聚类分析比较,结果如图3A和图3B所示,它们分别展示了我国与国外在计算法学研究领域的知识结构情况,节点颜色由深至浅代表了时间由远及近的变化,节点的大小表示被引频次,节点外的深色圆圈表示该文章为一年内被引频次激增的高突现文献,可以反映不同时期的研究热点变化。


从共被引网络的整体结构来看,在时间维度上,国外研究起步较早,知识结构在整体上存在多层次的演进过程,而我国在近五至十年间才开始大规模开展相关研究,知识结构在时间维度上更加扁平化;在空间维度上,国外的研究内容更为丰富,包含了法律实证研究、计算法学方法研究、人工智能治理等多个方面,而我国更侧重于研究计算科学发展带来的个人信息泄露、自动驾驶汽车侵权等新兴法律问题,其他维度涉猎较少。

(一) 我国计算法学研究的知识结构演进

通过聚类分析,国内的2182篇文献被分为7个独立的聚类,分别被自动命名为大数据、个人信息保护、产品责任、刑事责任、著作权、法律人工智能和算法规制(表1)。


国内计算法学领域中的第一个聚类形成于2013年,以个人信息与大数据的基础性问题研究为内容。这一时期对个人信息与隐私的区分,以及个人信息潜在的财产价值的认识,对于后续研究具有较强的指导意义。随着大数据技术的广泛应用,个人信息的财产属性显著提升,与之而来的个人信息秘密收集、二次处理与非法倒卖等现象引起学界注意,在个人信息财产价值认识的基础上,学界对其法律性质与保护进一步展开研究。至2016年,相关研究成果开始形成第二个聚类,研究的关注对象也逐渐由个人转向企业、行政管理部门在内的相关主体。由于传统的隐私权保护框架难以发挥有效作用,学界开始关注大数据技术应用更早的欧美国家的个人信息保护改革与制度设计,并试图在各利益主体间寻求平衡,为我国个人信息保护法的立法工作提供理论指导。

2017年左右,国内研究热度持续上升,短时间内形成了多个研究方向。聚类2形成于围绕人工智能技术特点进行的法律问题的一般性探讨,关注技术的潜在风险、对法律的挑战以及法律的应对,并由此产生了两种论断。第一种建立在高度盖然性认识基础上,将技术的应用视为系统性风险,认为有限理性的法律难以应对人工智能技术的发展,法律应适时予以回应。第二种则建立在现实性认识的基础上,认为现有的法学理论与框架足以应对人工智能引发的法律问题。聚类3由刑法学的研究成果构成,从一般性问题的研究转移至具体场景,关注人工智能的刑事责任能力以及刑法规制问题,延续了聚类2中两种论断的特点,形成了“肯定说”“否定说”两类立场鲜明的观点,围绕人工智能的控制辨认能力、承担刑事责任的可能性、立法规制的必要性等问题展开讨论。聚类4同样是一般性问题研究在知识产权领域的延续,但与聚类3不同的是,两类观点多围绕人工智能生成物的属性展开讨论,而较少关注人工智能是否应成为法律关系的主体,在此基础上又进一步形成了对权利保护的探讨与反思。

与学界轰轰烈烈的学理讨论相对应,实务机关对计算科技的热情有过之而无不及,在引入相关技术革新工作方法的同时,问题也随之不断涌现,相关探讨形成了聚类5的主要内容。侦查机关对计算科技的运用起步最早,在满足城市安防的同时产生了大量数据,传统的侦查模式由此向大数据驱动的一体化侦查、预测侦查转变,但两个重要问题仍亟待解决。其一是对公民信息过度收集的问题,其二是以发现线索为目的使用技术手段的合法性问题。在侦查机关数字化转型的同时,计算科技又席卷了司法机关,相继形成了特色鲜明的司法人工智能研究。部分逻辑学与法学学者延续着国外法律人工智能的研究脉络,从法律推理的角度尝试完善法律人工智能的理论范式与实践路径,并进一步提出了法律逻辑与数据驱动的新一代人工智能融合的理论设想。部分法学学者则从我国司法实践出发,一方面结合智慧司法、数字检察的实践样态,构建司法人工智能应用的理想图景,另一方面则聚焦法律人工智能的具体应用场景,提出司法机关数字化建设中存在的隐忧。在这种背景下,遵循司法规律,构建以司法人员为主体的人机协同机制,实现对司法人工智能的有限度应用逐渐成为学界共识。

在对计算科技的一般性问题的研究中,算法的核心地位迅速引起了学界的关注。相关研究从围绕概念、现象的讨论中衍生出针对技术特点的研究,由具体问题回归到一般性问题的探讨,研究深度得到进一步提升,于2018年形成了以算法及其规制为研究内容的聚类6。正是由于这种对算法的深刻认识,技术对隐私与自由的威胁、导致的歧视与偏见、带来的资本垄断等问题似乎找到了真正的原因,进而成为绝大多数学者主张规制计算科技的落脚点。目前在研究中已经形成了法律规制、伦理规制和技术规制三类模式。其一,采用立法的方式,通过要求算法公开、个人数据赋权、创制算法解释权、评估风险与限制应用等途径在模型的使用阶段进行规制,是目前的主流观点。其二,要求算法在编写过程中必须保证其运行的结果可以保障人类的利益,使法律和伦理融入算法,部分国家正在探索这种模式。其三,通过编写代码的方式将具有监管职能的程序植入算法中,在模型的训练和应用阶段,实现数据审查、动态调整和合规审查等功能,其本质是让算法实现自我规制,目前计算机科学界正在积极探索这一方式。

(二) 国外计算法学研究的知识结构演进

通过聚类分析,WoS数据库中的2878篇文献被分为8个独立的聚类,各聚类分别被自动命名为empirical legal studiesfederal courtcorporate litigationcircuit courtcomputational methodslocal enforcementbig dataalgorithmic accountability(表2)。


国外研究的前两个聚类形成于2008年,是近二十年来以美国为代表的法学学者在司法政治学领域取得的阶段性成果,聚类0以最高法院为研究对象,聚类1则以联邦上诉法院为研究对象。这些研究着眼于将司法判决视为原始数据,使用实证研究方法对数据进行分析,试图描绘出司法决策中各变量间的关系,证明或反驳对这种关系的特定假设,以求更清晰地认识司法决策的运作过程。近年来,司法政治学研究并未止步于对行为模式的揭示,而是开始采用诸如马尔科夫链蒙特卡罗算法、贝叶斯模型、支持向量机等机器学习算法,引入更多变量因素,期望构建可以预测行为方式的稳健模型。聚类2形成于2013年,以法经济学的实证研究为内容,主要可以概括为两方面内容。其一是对于诉讼行为背后的经济动机的分析,其二是对于法律在经济体治理中影响的研究。同年形成的聚类3,以宪法与行政法学的实证研究为内容,关注立法、司法与行政机构间的权力制衡问题,通过实证数据检验既往研究中形成的观点或理论,主要围绕制定法解释方法、立法授权司法审查问题等命题展开。

2016年,国外开始出现对既往各类型计算法学研究方法的总结与革新,构成了聚类4的主要内容,是人工智能技术应用于法律实践与法学研究的最新成果。总体而言,法学视野下的计算科学有两种应用形式,即作为代码的法律(Law as Code)与作为数据的法律(Law as Data),前者发展为应用于实践的法律科技,后者则代表应用计算科学的法学定量研究。以往法学期刊中的法律科技研究多为法学视角的应用展望,将其作为辅助工作或研究的工具,或将其视为改变现有司法实践的技术基础。最近一部分研究开始出现二者融合的趋势,新形成的法律科技开始成为法学研究的重要工具,而通过定量研究获取的数据和模型也反哺于司法实践中法律科技的研发。

国外对隐私、个人信息保护的研究与新兴计算科学技术的联系更为紧密,主要围绕其现实应用及规制展开。2011年左右,相关研究成果先后形成了聚类5与聚类6,以公权力机关法律科技应用的规制与隐私保护为主要研究内容,研究中常以两种对个人信息的收集与利用行为作为研究对象,其一是情报主导的警务执法应用,以DNA数据库及预测性警务系统为典型代表;其二为政治选举中的选民数据库应用。这一时期的规制探索始于数据的匿名化处理,但处理后的数据在与大量公开的非个人信息数据匹配后,依旧可以实现对个人身份的识别。同时,数据的重复利用又使得公众受到隐私侵害的系统性风险大幅提升,人工智能算法应用造成的知情权丧失、不公平与歧视等现象大量产生,进一步加剧了长期以来存在的种族问题,正当程序成了算法规制的另一选择。至2016年,相关研究形成了聚类7,针对以自动决策系统为代表的应用与欧盟《通用数据保护条例》进行广泛讨论,算法透明、提高可解释性等一系列举措在实践中的效果受到质疑,尤其是当追求算法透明造成进一步隐私侵害以及随之而来的“掌控感错觉”。因此,又进一步形成了两类较为典型的治理方案。其一是技术规制,这一方案主张在构建人工智能系统之初,就将价值判断、正当程序等问题在技术层面予以考虑,以代码的静态检查为基础,将数据输入、输出及计算的全过程固定以加强可解释性,弥补由技术特点造成的监管认识上的不足。其二是管理规制,这种监管不再局限于公权力机关,而是主张通过强化私营企业的审查监管、第三方评估、自我纠正及内部人员的举报,形成行业自律机制,甚至通过改变人员性别比例等内部管理方法降低产品产生的歧视风险。这种多元化的治理思想与个人数据赋权初步形成了二元治理模式,并被进一步概括为“协同治理”,被视为算法规制的未来路径。

五、中国计算法学的未来走向:分化抑或整合?

从前述中外计算法学的比较可以发现,我国与国外的研究在部分维度上大体相同,但又各具特色。一方面,在重要问题的研究上呈现趋同性,我国在前沿问题的研究上并不落后于国外。另一方面,国外研究起步较早,研究对象的选择、方法的应用抑或观点的阐述都相对成熟,研究人员具有多元学科背景,开展广泛的科研合作,学科发展领先于我国。中外差异突出表现在工具论路径的研究中。计量法学和法律信息学作为国外计算法学研究的主要脉络,占据计算法学知识版图的半壁江山,法律实证研究、法律科技研究与法律规制研究等不同研究范畴上均有优秀的成果产出,并形成了相对紧密的联系。近年来,相关学科概念随着社科法学的兴起、刑事法学中法律定量研究的出现、数据时代的到来而开始被国内学界接受,在计算法学学科起源问题上,产生了计量法学的延续、计量法学与信息科学交叉、法律信息学分支、计算社会科学分支等不同观点。进而,又形成了不同的学科内涵及相应研究范畴的概括。其中,持以量化研究为内容的狭义计算法学观的法学学者占多数,越来越多的计算机学者和逻辑学家开始尝试从法律信息学切入计算法学研究。但从知识图谱的分析结果来看,我国计算法学研究的工具论路径基础仍较为薄弱,计算法学的不同研究维度间初步显示出割裂的迹象。

(一)走向分化的中国计算法学

计算法学的研究存在多种路径,倡导利用计算科技开展实证研究的工具论路径即为其中一种。本研究的数据中,始终包含一定数量的中文法律实证研究成果,但与国外计算法学知识结构不同的是,国内在该方向上并未与其他研究形成共被引网络,反映了我国的法律实证研究在计算法学知识结构中的缺位。近年来,得益于数据资源的丰富、计算方法的普及、计算能力的提高,研究成本随之降低,但定量研究方法并未成为主流范式。相较于国外,我国的法学研究不具有量化研究传统,使用大数据研究的文献更是非常少。同时,现阶段的法学实证研究方法又稍显稚嫩,与计算科学联系并不密切,绝大部分的定量研究成果,时常被质疑是否可作为计算法学语境下的实证研究。研究范式的转移不可能一蹴而就,但当国内定量研究方法尚未普及时,大数据研究方法就在学界受到大力推崇,一方面促进了高质量研究成果的产出,而另一方面也使得小样本数据的研究认可度降低,间接地抬高了实证研究的门槛。

学界提出的另一种工具论路径的计算法学研究即为法律科技研究。从国内相关研究成果来看,计算机科学家与法学家仍处于较为独立的两个面向,尚未实现学科理论层面的深度融合。以计算机科学家主导的法律科技研究以服务于法律实务工作的信息化建设为主要目标,大多以应用程序、数据平台、智慧终端等服务产品为表现形式。法律科技的理论研究主体则主要是法学学者,法学学者从法律理论、司法实践、司法改革等多个层面进行深入探讨,成果多以论文的形式发表于法学期刊。前者侧重应用研究的属性,决定了从研究中形成理论的难度较大。而对于后者而言,计算科学面向的法律科技研究尽管热度很高,但尚无法作为法学研究为主流法学界所接受。在二者的科学问题属性、成果呈现形式、科研考核导向均存在较大差异时,理论研究的跨学科合作积极性被削弱。同时,中文世界的计算法学学术共同体、学术期刊、学术活动仍处于形成的过程之中,尚不具备同国外相抗衡的成果发表空间,进一步制约了理论化探讨的形成与呈现,造成了法律人工智能的理论研究与实践应用的分化。

随着新文科建设的开展,计算法学的分化又直接反应在高校学科的设置中。近年来,计算机科学与其他专业产生了诸如计算生物学、计算语言学、计算金融学、计算物理学等多门交叉学科,这些学科的共同特点是采取了工具视角的学科建设模式,即将计算科学技术视为研究方法,丰富和发展本学科的理论,这也是国内很多学者主张的计算法学发展方向。而相较于其他与计算科学交叉产生的二级学科而言,我国绝大部分的计算法学学科建设,尤其是以法学见长的院校,则采取了以法学理论为基础的对象视角,将技术应用视为研究对象,以保障科技的有序发展。这种学科设置方式体现了法学研究的应有之意。作为计算科学与法学交叉产生的不同面向,工具视角与对象视角的计算法学间产生了较大的知识间隙,削弱了计算法学的整体效应。目前的计算法学还称不上一门独立的交叉学科,实际上仍是计算科学与法学的学科交叉研究。中国计算法学若想从学科交叉中形成独立的交叉学科,仍需要将多种视角的计算法学进一步整合为问题导向的计算法学,实现不同研究路径间的良性互动。

(二)面向问题导向的中国计算法学

首先,中国计算法学的整合立足于问题导向的可计算性思考。数理逻辑研究在埃尔布朗哥德尔可计算函数、丘奇图灵论题等一系列讨论中形成了可计算性这一递归论的基础性概念,随着计算技术的发展,这一颇具哲学性的概念的内涵和外延不断扩张,成为计算科学的发展源泉。在数学和计算科学中,如果存在解决某一问题的可行过程,那么该问题即被称为“可计算的”,从计算法学的视角来看,可计算性则应指对法律的可计算性与法律是否应当被计算的辩证思考。无论是从法律与计算机制的共同特征、法律推理的逻辑结构,还是法律人工智能蓬勃发展的现实出发,作为社会秩序之描述的法律,其可计算性能够证成。而作为社会治理之手段的法律,是否应当被计算则是计算法学同时应该回答的问题:一方面,计算科学形成的数字连接重构了个体—社会关系,另一方面,计算科学依靠的算法又导致了权力与权力、权力与权利的失衡。在这个过程中,法律科技的公权力应用中“作为法律的算法”,与数字技术的私权力应用中“侵入法律的算法”,都要求对新型法律问题的研究回归到社会现象的揭示和法律基本问题的讨论中,对可计算的法律予以回应。

其次,中国计算法学的整合遵循问题导向的学科发展规律。高校在设置学科时,为了强调学科的组织性和边界感,人为划分了某一学科或学术研究的范畴,但这一范畴的实际改变并不以人的意志为转移,而是遵循知识发展的一般规律。从知识的源头看,无论是西方的柏拉图还是东方的“孔老”,著作中涉及的可细分的多门学科在当时都被视为整体。近代以来,随着科学研究的深入,学科分化成为学科发展主流,但同时也造成了学科间的孤立与脱节,近年来学科整合蔚然成风,快速填补了学科间的空白地,形成以物理化学为代表的单一交叉学科和以信息论为代表的交叉学科群。科学进步对科学问题研究的内在需要,造成了学科不断发生的分立与融合,形成了学科的一般发展规律,计算法学的发展亦应如此。

再次,中国计算法学的整合应能应对问题导向的数字社会之挑战。在算法深度融入社会秩序、参与社会管理、引发社会问题的现实下,人类文明已经毫无疑问地迈入了数字社会,而数字社会的治理内在地需要社会治理的数字化转型。基于计算科学的法律定量研究、法律科技研究与新型法律问题研究等不同研究路径,本质上是从发现、解决与优化的不同角度对问题予以回应,并形成了互相支持、互相依托、共同发展的关系。法律科技的研究能够为基于数据驱动的法学定量研究提供支持,前者掌握的技术、数据、算力是后者所不具备的,法律科技的发展在一定程度上决定了法学定量研究的高度。而相较于纯粹的技术研究或其他应用场景,法律科技研究又为法学学者深度接触计算科技提供了契机,大量的实务应用使得我国学者具备充足的研究样本。法学实证研究可以为计算科技相关法律问题的研究提供更全面的研究视角与思路,通过海量数据中存在的关联关系,挖掘数字技术带来的真问题,为规范研究和价值判断提供基础。

(三)整合中国计算法学的矛盾与路径

问题导向的计算法学研究更利于各方向间的互相促进,但同时又受限于两个现实困境,其一是专业知识背景较为单一的中国法学教育现实,其二是缺乏实质意义科研合作的中国法学研究现实。计算法学属于学科交叉的研究领域,同时涉及其所研究的部门法与信息技术、数据科学、统计学等多种学科知识,这对研究人员的专业知识背景提出了更高的要求。从作者合作网络研究的结果来看,在网络中占据关键地位的作者往往都具有法学之外的其他专业教育背景、研究经历或从业经验,这又与其产出高质量成果的数量显著相关。究其原因,可能与国外采取的通才法学教育模式有关。如美国将法律教育作为研究生教育,澳大利亚在大学法律教育中实行双学位制度,这种多元化的教育背景使得学者在交叉学科研究中具有明显的优势。我国近年来主张复合型人才培养同样如此,如法律硕士(非法学)专业硕士学位的设立,在一定程度上改变了我国法律教育专才化的培养模式。但是,这种专业学位的培养旨在为实务界提供人才,毕业生多走入司法实践岗位,对现阶段的学术研究很难快速形成积极作用。同时,交叉学科的研究又往往要求科研人员对两门及以上的专业都具有较深入的理解,因此在科学研究中,一般通过跨学科的科研合作来实现专业知识的互补。如近年来生命科学与物理学、化学、数学的跨学科合作,这种实质性的合作一般最终呈现为联名发表的学术论文。在中国传统的法学研究中,学者间以联署发文为形式的合作占比较少,通常由作者一人完成从文献检索到论文撰写全过程,这种情况的产生是由学科的特点与传统、不同作者观点立场的差别、主流期刊发表要求等多方面原因导致的。在同一部门法或跨二级学科的法学研究中,这样的影响可能不大。但是在学科高度专业化、学科交叉广泛化的科研发展趋势下,对于跨一级学科的计算法学来讲可能造成较大的负向影响。

为此,整合计算法学研究的不同维度,应尝试进一步梳理和化解计算法学宏观视角下的关系与矛盾,实现计算科学与法学间的正向反馈,探索中国计算法学的发展路径与发展模式。在学科建设上,应逐步尝试突破法学学科的传统界限,避免跨学科的计算法学走向法学+计算科学的多学科误区。在科学研究中,应深入开展实质的跨学科合作并主导研究方向,以防陷入技术主义的迷思。进而,实现我国计算法学在宏观、中观、微观等多个层面上的整合。在宏观层面,实现问题意识的整合,将计算思维贯穿于计算法学研究的全过程,关注现实情境下真命题的研究,利用数据发现法律现象和规律,提炼研究视角,让计算为法学学科立论;在中观层面,实现研究能力的整合,创新法学人才培养模式,鼓励多学科背景的法学研究者参与计算法学研究,支持跨学科研究合作的开展和成果的形成,让数据与法律问题对话;在微观层面,实现研究方法的整合,根据实证研究的不同需求和不同面向,引入其他学科的成熟方法,实现数据收集、数据处理与数据分析的全流程覆盖,让技术为法律研究赋能。