【作者】杜文静
【内容提要】
法律人工智能概率推理的困境与破解
*作者 杜文静
华东政法大学文伯书院副教授
摘要:概率方法是一种允许在不确定情况下进行证据推理的数学模型,具有计算可靠性和完备性的形式化基础。然而,概率推理在建模过程中存在两大困境,即概率数值从何而来以及如何解决证据聚合难题。贝叶斯概率和富兰克林原则为数值难题提供了破解之道。贝叶斯概率充分融合客观概率和主观概率,为它们提供统一框架,解决概率数值的评估分歧。富兰克林的一般性原则确保适当参考类的理性选择,解决数值难题的客观概率赋值。基于概率理论的贝叶斯公式具备一致性和规范性,借助严格的形式化概率推论可以消解证据聚合难题。通过两大困境的回应和破解,表明概率方法是计算不确定性推理的可靠工具,为面向法律人工智能的证据推理模型提供了理论支持。
引言
公正司法有赖于准确的事实认定,事实认定的基础在于事实构建。证据推理是推理者以所持有的可采证据和关于世界认知的常识知识作为前提,推导出事实主张的推理。法律人工智能文献表明,证据推理有三种建模方法:一是逻辑论证方法;二是修辞故事方法;三是数学概率方法。第一种本质上是逻辑取向,追求从证据到待证事实之间的推论链接;第二种本质上是修辞取向,追求构建有关“发生了何事”的故事说服目标听众;第三种本质上是数学取向,追求证据与假设的解释性事实之间的概率关系。证据推理的大多数研究都集中于运用论证和故事进行推理,尤其是法律人工智能热衷于含义理清系统的形式建模。但随着软件支持工具的发展,证据推理需要一种处理证据的定量方法,以有效弥补论证方法和故事方法的不足。研究表明,概率方法可以计算推理的不确定性程度,是人工智能建模技术的可靠根基。
以概率方法为基础的贝叶斯网络是研究的起点,它的一个重要特点是利用变量之间的独立性对概率函数进行有效建模。荷兰有研究者提出运用叙事构建贝叶斯网络的方法,并将其方法应用于一个复杂的案件分析和检验它的有效性。另有研究者开发了一种从贝叶斯网络抽取论证的算法,利用条件概率来度量推理的强度,根据概率数值大小来识别推理规则并对其进行排序。三种建模方法各有优劣,我们需要在分析证据的定性和定量两个方面找到平衡,即运用定性定量平衡法评估证据推理。维赫雅基于经典逻辑和概率理论建立了一个形式案例模型,该模型同时融合论证、故事和概率方法,三者的结合最终产生了一种新型的论证数学。该数学的第一个形式化版本在加利福尼亚诞生,由图形化语言构成,用以表示对犯罪案件过程中已发生事件所做假设的构建、检验和评价。
正是基于概率理论的良好理性基础,维赫雅的案例模型既可以定性阐明也可以定量分析证据推理。通过系统的全序结构能够定性比较论证的强度,借助条件概率数值能够定量比较推理的强度,这样概率论就架起了定性与定量的桥梁。然而,由于贝叶斯概率理论总体上的复杂性,对未接受正式训练的法律工作者来讲不够自然,他们经常误用、误解概率推理,这使得人们对概率推理的可接受性保持一种谨慎态度,也开启了关于司法证明性质的争论。在这一争论过程中,一些学者提出概率方法在司法证明中存在两大困境,直接挑战了概率方法的根基。这两大困境决定了法律人工智能建模的技术难度,但不能由于误用或者不理解概率推理或概率演算而否定其科学性和应用价值。相反地,我们应当将概率方法作为面向法律人工智能数学计算模型的坚定基础。实际上,概率方法作为一种分析工具,在事实发现者分析案件、认定事实等方面具有重要证成作用。概率方法具有一致性和规范性,可以避免不公正的司法裁决,是允许在不确定情况下进行证据推理的可靠数学理论。本文将对概率推理带来的两大困境逐一回应,从技术上提出破解之道,从更深的理论层面维系概率推理应用于司法证明的理性。
概率数值从何而来
给定初始概率数值作为输入,利用概率公理和概率推理规则,可以计算出其它更多概率作为输出。然而,概率公理系统没有为如何计算初始概率数值提供规则保障。初始概率的计算依赖于概率解释。在司法证明中主要存在两种概率解释,一是客观概率,二是主观概率。概率解释的多元性导致概率方法在法庭应用中备受争议。一方面,在英国上诉法院2010年裁定除非研究DNA证据以及“存在坚实统计基础的其它可能领域”,否则不应当用贝叶斯定理来评价证据。另一方面,概率思维在荷兰近年来已被许多最高法院成员和荷兰法庭辩论研究所共同拥护。在评估某个事件发生的概率时,可以基于频率客观赋值,也可以基于评价者个人经验主观赋值。客观概率对数据库的数量要求较高,而就目前社会技术现状而言,DNA证据数据库是发展相对完善的,可以运用客观概率进行演算,科学地分析案件事实的信念度。但其他证据类型的数据库尚不完善,在事实认定过程中,主体的经验、知识、情感将全部参与其中,在综合个人经验和可用数据基础上形成主观概率。由于客观概率与主观概率之间的某种张力,司法机关一方面对其采取谨慎态度,另一方面则主张务实地积极拥抱技术性的证据推理测度工具。
(一)对初始概率计算的批判。与司法机关的态度不同,证据法学家艾伦同时批判了客观概率和主观概率,并反对将概率方法应用于司法证明。艾伦认为,首先,客观概率需要通过相对频率或已知的统计分布数据来计算,而这些数据在现实中很难获取。其次,即便获取数据,也可能面临“参考类”选择的难题。另外,庭审中的争点是事件本身而非某一类事件的相对频率,唯一能够准确捕获的“客观”概率值是事件自身,用0和1二进制表示。对于主观概率,艾伦批判道:那些先验概率和用于更新先验概率的似然率数值可以是任何数值,不受审判中用于证明事实的证据的质量或证明力的任何限制,主观概率过于臆断与任意。虽然它提供一种保持一致信念结构的方法,但与推进结果的准确性没有必然关系。
(二)主观概率与客观概率评估的统一框架。针对客观概率和主观概率在事实证明过程中存在的难题,艾伦宣称概率方法不适用于法律领域,但这种观点有失偏颇。概率方法是一种规范的、数学的、成理论体系的方法,通过概率演算可以科学地分析不确定性,在所有的学科领域都发挥重要的指引作用。“概率分析展示的不仅仅是数值运算,还有推理的结构”。它支撑着众多社会学科,将统计测试、置信区间、回归等这些使得证明机制明确化的方法广泛应用于社会科学。此外,它还渗透到哲学领域的许多分支。在认识论、心灵哲学和认知科学中,知悉某种观点的状态可用主观概率函数来建模,而学习则可用这些函数的更新来建模。概率论对伦理学和政治哲学都有所影响,在诸如因果关系和自然法则等形而上学的主要著作中占有重要地位。在司法证明中应用概率方法也是自然与合理的,基于概率论的解释成为证明过程的基本范式。概率解释被刻画为个人对不确定命题可能持有的信任程度即信念度,这是由贝叶斯理论提供的一种概率测度,也称为贝叶斯概率。一般情况下,人们习惯用诸如“很强”“很弱”等模糊语词来表述对某一命题的信念度。但在司法实务中,尤其是在法官或陪审团权衡证据证明力时,如果能够用相对准确的数值度量命题的信念度,将有助于明确地揭示自由心证的形成过程。因此,用概率数值来测量信念度是不二之选。艾伦的批判似乎将司法证明中的概率理解为要么是客观的,要么是主观的,这种理解是不恰当的。具体案件中的概率可以是客观频率和主观信念度的融合,有些证据或事实的先验概率适合用客观概率赋值,而另一些却适合用主观概率评价。坎德将证据区分为内在证据和外在证据,内在证据考察证据固有的、基本构成的本质属性,该等属性在个体之间变化很大,但在任何特定个体内是恒定的,例如血迹证据的DNA图谱。外在证据考察证据的非本质的、偶然的物理属性,例如血迹的形状、数量、大小和位置等。内在证据应该用基于频率的客观概率来赋值,外在证据用基于个人知识的主观概率来评价。贝叶斯概率承认并接受客观概率,但不限于频率数据。从这种意义上讲,贝叶斯概率是客观概率的扩充,为主观概率和客观概率提供统一框架,是面向法律人工智能证据推理最适当的理论模型。
(三)参考类问题的破解。贝叶斯概率维系了主观判断和理性分析的平衡,但却面临参考类选择的困境。参考类问题是指在计算单个事件的概率时决定使用什么数据类作为参考依据的问题。在评估单个事件发生的概率时,通常先根据某个属性特征,将这个事件归属于某个参考类,然后计算出事件在该参考类中发生的频率。这个频率就被认为是该事件发生的概率。然而,每个事件通常都有多个属性特征,可以归属于多个参考类,甚至无穷多个参考类。在不同的参考类中,事件发生的频率很可能不同,因而该事件发生的概率也不同,这种概率的不确定性和模糊性就导致了所谓的参考类问题,即如何选择恰当的参考类来评价事件的概率?计算事件的概率数值,是概率方法的特定优势,也是概率推理的基础。参考类的选择将会直接影响概率数值计算的准确度和概率推理的合理性。如果恰当的参考类不能确定,则无法得到相关的频率,这将影响似然率和后验概率的准确计算,从而不能保证证据评价和信念度更新的可靠性与稳定性。
富兰克林原则为确定合理参考类指明了方法。为了评估某个体A出现结果B的概率,富兰克林给出确定合理参考类C的三个一般性原则。第一,参考类应由个体A的属性特征F来定义,因此确定参考类的问题可以转化为属性特征相关性的解释问题。一个属性特征F与结果B是相关的,当且仅当它能为结果B提供更多的信息。第二,相关性必须是共变的,即属性特征F和结果B是共变的并相互影响。比如,当某人驾车在十字路口等红绿灯时,交通灯的颜色(属性特征F)与安全通过十字路口(结果B)是共变的,当交通灯呈现绿色通过十字路口通常是安全的,反之,安全通过十字路口时交通灯通常显示绿色。第三,结果B的合理参考类C是由与B相关的所有属性特征的交集所定义的类。运用富兰克林原则时,应当注意如下四点:首先,要正确区分“参考类”和“定义类的属性特征”,不能将二者混淆。如辛普森杀妻案中,检方要评价“辛普森”(记为A)“杀死自己的妻子”(记为B)的概率,就需要根据辛普森经常虐待妻子(记为F)的属性特征找到“类似的”个体,这些类似个体构成的集合就是要寻找的参考类,而确定类似个体的属性特征是“经常虐待妻子”。其次,要注意属性特征F与结果B要有相关性,这种相关性不仅是共变的,我们还认为它应是敏感的。嫌疑人“经常虐待妻子”这个属性特征与“杀死妻子”这个结果的相关性是共变的、敏感的。再次,一旦个体A与结果B的相关属性特征被识别和确定,那么相关的参考类C是什么就相当明确,即参考类C就是由符合所有相关属性特征的与A类似个体组成。最后,按照富兰克林的三个原则选择的参考类,可能会出现一个问题:符合所有相关属性特征的个体太少,以至于参考类太小而无法做出合理的频率估计。正常情况下,合理的参考类应包含足够多的个体以对结果做出可靠的估计和预测。如果参考类太小,甚至只包含一个元素,那么它将无法支撑任何可靠的估计,因为在这样的类中个体很少出现。一个解决方案就是:从所有相关属性特征中分别选取若干属性特征定义多个参考类,然后权衡各参考类的合理性,从中选择一个类。如推动概率方法在法庭科学领域研究和应用的柯林斯案。在庭审中,检方指派某个数学专家进行统计方面的作证,预测随机挑选的夫妇作案的可能性,与之相关的属性特征有:扎着马尾辫的金发女性和带有络腮胡子的男性组成的夫妻、拥有黄色汽车的种族通婚夫妇。如果要同时符合这两个属性特征,那么参考类就会显得太小。我们可根据“扎着马尾辫的金发女性和带有络腮胡子的男性组成的夫妻”这个属性特征定义一个参考类C1,再根据“拥有黄色汽车的种族通婚夫妇”定义另一个参考类C2,然后根据这两个参考类的结果进行权衡,从而做出选择。正如艾伦等人所称,参考类的各种统计数据本身也是证据,有必要对其合理性做出解释和论证。实际上,富兰克林的三个原则就是确保所选参考类是合理的依据。
如果恰当的参考类可以确定,相关的数据可以找到,则应计算出频率,用客观概率赋值。如果找不到合适的数据,则有三种处理方法,一是调整要证明的内容,适当放大或缩小参考类,然后继续用客观概率赋值,二是基于概率范围、大小比较进行模糊的客观概率赋值,三是用主观概率赋值。据此,“概率数值从何而来”这个问题也有了答案。
如何聚合证据
合取难题最早由科恩在其著作中提出。合取难题通常出现在民事诉讼中,当原告主张的事实包括两个或两个以上的分支要件时,每个分支要件都必须成立才能使诉讼成功。例如,在医疗保险赔偿案件中,投保人可能会起诉保险公司在就医后未能赔偿他的损失。就医的情况(记为A)和保险合同的条款(记为B)可能都存在争议,如果他要诉讼成功,这两个要件都必须建立在投保人有利的基础上。在司法证明过程中,人们通常还需要将多个证据聚合以支持同一事实,这都可能涉及合取难题。因此,我们必须消解合取难题,否则会影响多项证据支持某个事实发生的概率,导致无法追踪贝叶斯网络中所有命题之间的概率关系,进而阻断贝叶斯网络建模复杂案件的实现。
(一)合取难题的成因。如果民事证明标准的“优势证据原则”或“概率平衡原则”,可以解释为主张事实的概率要求大于0.5,那么这一要求是应该单独适用于每个分支要件,还是适用于它们的合取即整个案件呢?我们认为这个问题有三种选择方案:一是概率平衡原则仅适用于分支要件,即只要求每个要件的概率大于0.5,无需考虑它们合取的概率;二是概率平衡原则仅适用于整个案件,即只要求所有要件合取的概率大于0.5,无需考察每个要件的概率;三是要求审查每个要件的概率值,同时也要求所有要件合取的概率大于0.5。概率方法采纳第三种方案,先审查每个要件的概率,但对其值是否大于0.5不做要求,然后通过相关概率公式进行演算,计算出合取的概率,并要求其值大于0.5。然而在上述医疗保险赔偿案件中,科恩做了如下的分析。假设C为分支要件A和B的合取,即C=A&B,根据所提供的证据,事实发现者认为A和B的不确定性是独立的,且每一个都可用0.7的概率来度量。那么根据概率乘法公式,P(C)= P(A)´P(B)=0.7´0.7=0.49。这样尽管每个要件都满足了概率平衡原则的证明标准,但整个案件却不满足这个标准。科恩认为,这是自相矛盾的悖论,并将其称为合取难题。由于合取难题的存在,科恩认为,概率推理适用于司法证明是有问题的。
帕尔多和艾伦也经常提及合取难题,以此批判司法证明中的概率方法。他们指出,在合取难题中,随着分支要件数量的增加,每个分支所需要的概率值也会随之递增。例如,在两要素的民事索赔中,帕尔多和艾伦指出当原告证明每一要素都达到0.6时会胜诉(合取的概率为0.36),而在证明其中一项要素达到0.9和另一项要素达到0.5时则会败诉(合取的概率为0.45)。这个案例表明,即便第一种情形的整个案件合取概率小于第二种情形案件的合取概率(0.36<0.45)且第二种情形某一分支概率高达0.9也无济于事,仍旧难逃前者胜诉、后者败诉的怪圈。
(二)合取难题解决方案的选择。为了规避合取难题,科恩指出:民事诉讼的规则要求原告在权衡各种可能性的基础上证明其案件的每一个要件。也就是说,科恩认为概率平衡原则应采用第一种方案。依据科恩的主张,在上述医疗保险赔偿案件中,投保人将胜诉,尽管整个案件的总概率(合取的概率)低于0.5。反对概率方法应用于司法证明的同时,艾伦提出了一套替代方案即相对似真理论来解释司法证明的过程。在相对似真理论中,概率平衡原则采用的是第二种方案,事实发现者从整体上推断所有证据的最佳解释。根据适用的证明标准,各竞争解释之间的比较也是从整体层面进行的,从而确定案件的最佳解释。一旦确定了最佳解释,则将该解释与实体法要求的各形式要件进行比较,以查看它们是否都被包含在解释中,如果包含则该解释将被接受,其对应的主张将获胜,否则该解释将被拒绝,其对应的主张将败诉。这样相对似真理论也避免了合取难题的出现。
我们认为第三种方案是符合直觉、自然的做法。第一种方案仅涉及逐个要件审查,是一种局部视角,然而人们的直觉却是要从整体上评价案件。第二种方案主要考察整个案件,是一种整体视角,但它忽视了每个要件的单独审查,这样做容易改变证据,甚至扭曲证据。正如西蒙批判道:整体视角的过程本身就有可能扭曲裁决,整体论不是从天而降的,相反,它是通过一个认知过程构建的。对于这个认知过程,我们认为应该是从局部到整体的分析过程。第三种方案正好符合这种理念,先局部审查每个要件,然后再做整体评价。概率方法就是基于这种认知的推理方法。在概率理论中,根据概率乘法公式,整个案件的合取概率都不可能大于任一分支的概率,它通常要比分支概率小。帕尔多和艾伦对这一点的理解是正确的,要使合取概率大于0.5,分支的概率值的确要求更高。分支越多,其概率值就要求越大,证明难度也越大。科恩认为,要求原告对每一项分支要件都得到法庭满意的证明即概率大于0.5已经尤为苛刻,倘若还要求进一步确立整个案件合取的概率大于0.5是不公平的,在司法实践中也是很难实现。尽管科恩、帕尔多和艾伦都正确认识到了这一点,但他们的错误在于将此概率现象过于简单地应用于司法证明。实际上,如果更为详细和全面地解释司法证明中的术语,并在概率理论框架下将其形式化,合取难题就会消失。早在1987年,通过解释证人的可靠性、先验概率和后验概率等术语,戴维就证明了合取难题是不会存在的。戴维认为:几个独立证据的合取对案件所提供的支持超过了它的任何组成分支所提供的支持。概率方法是完全符合逻辑和常识的。然而,学界迄今为止仍在争论合取难题,并据此批判概率方法的科学性,因此我们有必要来阐述应该如何消除合取难题。
(三)基于贝叶斯公式消除合取难题。在概率语境下,为了确保概率推理结论的可靠性,推理者必须基于证据进行推理。在这种意义上,合取难题可以描述为:在同时考虑两个证据a、b的情况下,命题C的概率会小于在考虑单独某个证据的情况下C的概率。若要消除合取难题,推理者首先要厘清评价的主体是证据,而不是命题,评价证据对命题的支持度也叫证据的证明力。对于证据E和命题H,推理者还要区分命题H的先验概率P(H)、后验概率P(H|E)以及证据的似然度P(E|H)和似然率。似然度用来衡量证据的可靠性,似然率则用来衡量证据的证明力,它是量化证据与待证命题之间推论关系的形式化框架。先验概率、后验概率和证据证明力的评价三者不能混淆,这点尤为重要。
在上述医疗保险赔偿案件中,科恩对概率数值的模糊表述,导致人们对概率推理产生某些误解。例如,0.7是先验概率、后验概率还是似然度?基于直觉,科恩粗糙地运用概率乘法公式,从而产生所谓的合取难题。科恩的证明过程存在如下四个问题:第一,推理过程没有明确展示证据,没有证据就无法进行证据推理,无法保证推理结论的合理性。第二,按照科恩的描述,0.7应该是后验概率,但由于没有展示证据,0.7却被视为先验概率,先验概率与后验概率混为一谈。第三,科恩没有说明0.7的后验概率是如何计算出来的,也没有说明相关的先验概率和似然度,犯了直接给后验概率赋值的错误。第四,证据的证明力要用似然率评价,而不是后验概率。我们评价的主体是证据的证明力,而非后验概率。因此,科恩不应将合取C的后验概率与其分支A、B的后验概率进行比较,而应将它与C的先验概率进行对比,进而评价证据的证明力。
由此可以得出,合取难题之所以反直觉,原因在于错误的推导过程,即如果证据a、b相互独立,根据概率乘法公式过于简单地计算命题C的概率,正确的推导应该是运用贝叶斯公式评价证据对命题C的支持度。塔罗尼(Franco Taroni)等人给出一个示例,假设命题C的先验概率P(C)=0.5,后验概率P(C|a)=P(C|b)=0.7,在证据a、b相互独立的情况下,利用贝叶斯公式计算出证据a、b的似然率都等于2.33,合取证据a&b的似然率等于5.44,大于它们各自的似然率,这表明合取证据的证明力强于单独证据的证明力。合取证据支持命题C为真的后验概率(P(C|a&b)=0.84),也大于单独证据支持命题C为真的后验概率(P(C|a)=P(C|b)=0.7)。这个例子说明,只要正确运用概率推理,合取证据的证明力可以大于其分支证据的证明力,合取证据的后验概率也可以大于其分支证据的后验概率,合取难题自然消失。
结论
概率方法是人工智能模型构建的底层支持。如果不能从理论上解决概率推理所谓的“两大困境”,那么就会直接挑战概率方法的理性根基,法律案件中证据推理的概率建模更是无从谈起。正如帕肯主张,法律人工智能研究一向关注的是提供用于计算机自动推理程序基础的理性理论。概率方法在事实发现者分析案件、认定事实等方面具有重要的证成作用,是一种允许在不确定情况下进行证据推理的可靠数学理论。在很多情形下,所谓的概率推理悖论都不是真正的悖论或难题,而是推理者在证明过程中对概率理论的误解或偏见。本文从技术层面上回应并破解了这两大困境,以此表明贝叶斯概率方法是司法证明的一个重要分析工具,当事实发现过程适合概率分析时,应当发挥其定量分析的优势,不仅为可视化案件中的证据、事实和推理过程提供支持,还为面向法律人工智能的证据推理模型提供了一套理性和计算可靠的形式理论。
原文刊载于《学术研究》2022年第4期,感谢作者授权推送!
网站编辑:翁壮壮
审读:季卫东