当前位置:首页 > 文献资源 > 论文著作 > 实证研究
文献资源
李学尧 刘庄|矫饰的技术:司法说理与判决中的偏见
2022年05月23日 【作者】李学尧 刘庄 预览:

【作者】李学尧 刘庄

【内容提要】

*李学尧

上海交通大学凯原法学院教授

上海交通大学中国法与社会研究院企划委员会委员

*刘庄

香港大学法律学院副教授


摘要我们用严格的实验方法证明:几乎所有法律人引以为豪的说理技术,都可以成为矫饰的技术”——用看似精密的法言法语,遮掩实际的判决理由,粉饰价值判断或法外因素对判决的影响。这些技术包括:策略性地解释法律概念,选择性地适用法律条文,从预先判定的判决结果反推因果关系、可预见性及其他事实判断——很多时候,法律只是判决的工具,而非判决的依据。而由于这种工具的隐秘性,受不当影响的判决往往又难以被识别和纠正。这些发现呼应了历史上各种批判性理论对形式主义法学的批评,同时提醒我们,各种繁复的法教义学理论和与之对应的司法技术,有可能成为滋生司法不公的温床。司法决策需要直面其试图掩盖的价值判断实质,才能使得法律说理更透明、更公正。

关键词司法偏见 掩盖 法律技巧 行为实验

司法说理被普遍认为是限制和监督司法权力的有效制度设计。通说认为,加强判决说理是中国近二十多年司法改革的重要成果之一。在法律实证研究界,刘庄等人通过行为实验等方法,从学理上证实了司法说理等程序性设计对于偏见纠正的作用。

然而,显而易见,司法说理无法完全杜绝司法偏见,甚至借助于一些不好的法律方法,它可能会成为司法人员有意无意掩盖司法偏见的矫饰技术。对于这一问题,当然可以继续采用属于社会学家孔德所言的形而上学,也就是逻辑思辨性的研究方法,在传统法解释学的研究框架内,寻找更佳的消除司法偏见的法教义学理论

本文的基本思路是,借助于法律实证研究的已有经验,特别是行为实验的方法,对法官采用法律解释技术来掩盖司法偏见的行为进行精准揭示,进而为判断何为好的法解释学或者好的司法说理提供有别于弱意义上的科学主义的评价标准。

问题的提出

为了更加简便地开展学术研讨,本文将司法说理定义为,法官在判决书或者其他司法文书中,对其裁判依据或者理由进行的解释说明。按照学术通说,司法说理是司法权力合法化和正当化的本质要求,是正当程序不可或缺的构成部分,也是法律完整性的源泉。古罗马法谚法律的理由是其灵魂所在Tatio legis est anima legis)、法律理由消失,法律本身也不存在Cessante Ratione legis cessat et ipsa lex)等也是类似通说理论的精练阐述。诸多学术成果还进一步从不同角度推论或者证实了,司法权力缺乏说理,其公信力是如何受到损害的。

对于裁判依据的正当范围存在着各种类型的激烈争论,比如:(1)在法律渊源方面,关于党规、政策性文件,以及传统美德公序良俗,是否可以成为裁判的规范依据;(2)在裁判结论正当化的标准方面,是否可以直接以后果主义(追求法律效果和社会效果的统一)而非规范主义的标准,从而将多元社会价值观作为规范依据;(3)司法说理未必一定要正确反映真正的法官决策过程,它只是正当化判决的需要而已。也就是说,什么说服了法官客观上的裁判结果,或者说服法律职业共同体和普通民众的理由(发展与证立的二分法),可以存在不一致。

尽管如此,在法律界仍然存在这样的共识:除非有明确的规范依据,否则有些与案件无关的因素绝不可以成为影响司法决策的理由。比如,在民事案件中,债权人的品德或者经济状况不可以成为债务人减免债务的考虑因素;在刑事案件中,犯罪嫌疑人的外貌、财富、地位、阶层出身,甚至受教育程度,绝不可以成为入罪与否或者量刑标准的依据。即使在量刑中可以考量当事人的道德水准、犯罪动因以及个人生活状况,但仍需要在司法说理中予以明确说明,且应具有一定的影响限度。而在案件事实或者因果关系的确定方面,对这种案外因素的排除性要求则更为绝对。如果违反了上述共识,实质上就挑战了法律面前人人平等”“法无明文规定不为罪等现代法治的基本原则。

在过去的三十多年里,认知心理学、法心理学的各种实证研究证实了,司法决策实质上会受到上文提及的与案件无关因素(法外因素)的影响。

在这里存在两种脉络,一是因法官自身因素造成的决策差别。比如,2011年在《美国国家科学院学报》(PNAS)上发表的《司法裁决中的法外因素》一文,以以色列假释委员会的假释裁决为例,证实了法官疲劳度对司法裁决的影响。在此基础上,李学尧、葛岩、秦裕林等人在2014年针对中国真实法官的行为实验证实,法官的决策会受到疲劳度以及对案件材料阅读难易程度的影响。此外,在英语世界此前还有诸多的实证研究集中于法官的专业知识和训练(经验直觉因素)、性别、党派(意识形态),甚至童年经历对司法裁判结果的影响。

二是集中于揭示当事人的外貌(包括穿着打扮)、性别、种族、社会阶层,以及所使用的语言等法外因素对法官和陪审团决策的影响。比如马斯塔德(Mustard)、拉奇林斯基(Rachlinski)等人通过行为实验证实了当事人种族和肤色的影响。在理论上,上述研究主要是在一种行为主义法学或者新现实主义法学的理论脉络上,运用认知心理学的代表性启发、可获得性启发、锚定效应、框架效应,乃至双加工系统理论等展开阐述和解释。

毋庸讳言,上述实证研究尽管运用了认知心理学”“实验心理学强科学主义的实验方法,但是由于相关讨论未触及规范问题,所以并未引起国内主流法学的关注和讨论。但在最近五六年里,随着一些受过良好法律专业训练的法学学者逐渐进入法律实证研究领域,上述法外因素影响司法裁判的讨论逐渐转移到道德因素、价值观念等法解释学所重点应对的内容。

比如,哈佛大学法学院主要从事公司法和司法制度研究的斯帕蒙(Spamann)等人针对美国真实法官的行为实验显示了,法官对案件的裁判结果会受到当事人道德品质的显著影响。更进一步地,归属于金融法专业的刘庄和斯帕蒙的合作研究还揭示,当法官们知道自己受到了不应该考虑的因素影响时,一般不会透露他们做出决定的真正原因。这种实证研究成果,也与社会科学界的类似研究形成了一种呼应关系。比如,欣赏者对于艺术作品质量的评价,是否会受到作者道德品质、外貌等实质上与艺术作品质量本身无关方面的影响。

本文试图在前述研究的延长线上,通过对以真实法官为被试的行为实验来揭露,当法官受到不适当的法外因素影响时,他们是如何在司法说理中为他们有偏见的决定辩护的;换句话说,他们用什么样的法律技术手段掩盖了他们的偏见决定?

研究思路与实验设计

(一)司法偏见被法律技术掩盖的主要场域:目光在事实与规范之间的往返流转

在法律人形成司法裁判的过程中,根据认知过程模型,可以将主要的法律技术概括为事实确定、规范选择、概念解释、标准确认以及因果关系的论证等五个方面。当然,在很多场景下,概念解释、标准确认本身就属于规范问题;而因果关系的论证也与事实确定分不开。

事实因果关系与法律因果关系、客观事实与法律事实(程序事实)等类似的概念区分,更是说明了司法裁判的技术本质是德国法学家恩吉施(Engisch)所言的目光在事实与规范之间往返流转。而在其中,概念解释、标准确认以及因果关系的论证,都属于事实(确认)与规范(选择)之间往返流转的重要技术。我们的主要理论假设是:法律技术掩盖司法偏见的魔鬼就隐藏于在事实与规范之间往返流转的过程中。也正鉴于此,我们选择了标准确定、概念解释以及因果关系这三个方面来展开行为实验。

参考国内外已有关于情感以及其他无关因素对决策影响的相关行为实验(并不仅限于有关法律的相关实验),以及结合主流法解释学讨论关注的重点,我们在三个实验中的基本设计是:设定法官对当事人的道德评价为自变量,设定法官裁判结果对当事人的有利与否为因变量。换言之,我们在每个实验中的刺激物都是试图唤起法官的道德感——而按照学术通说或者法律职业共同体共识,这些作为刺激物的道德感,并不可以作为司法裁判的依据。例如,在判定租赁合同纠纷案件时,插入了一个与案件的过失行为毫无关系的当事人私人生活品德问题(与腐败官员婚外恋关系),并唤起被试法官对其的道德厌恶感。

那么,为什么选取当事人的道德品质,而不是当事人的外貌(包括穿着)、性别、社会阶层等作为刺激呢?我们的主要考虑是:除了我们希望能与法解释学形成短兵相接式的直接讨论场景之外,更重要的是,在现代社会,当外貌、性别、社会阶层这些法外因素影响法官决策时,不光普通民众,就是法官本身也会产生不安或者愧疚感;但通过当事人的道德品质来启发法官产生情感,在理论论辩上的模糊性更强,因此具有更强的理论讨论意义。

(二)实验基本设计和理论假设

实验采用了组间设计的方式,即两组法官阅读同样的案例材料,两组材料唯一的不同为其中关于当事人道德品质的段落或语句。就此,一般而言,任何两组法官决策的差异都可以归因于当事人的道德品质。同时,如果两组法官给出了不同的说理,那么,理应与判决无关的当事人道德品质则是影响说理的唯一原因。换句话说,法官在使用说理来论证和粉饰其真实的判决理由——与本案无关的法外因素。

1.对法律标准的判断

研究1是一宗涉及违约金的租赁合同案件,法院可酌情降低违约金。在干预组的材料中,被告是与一名腐败的政府官员保持婚外情的女子。而基准组的材料中,并没有对被告私生活进行任何描述的内容。在这个案件中,我们主要观察的法律技术是对法律标准(standard,如过高”“一般情况下”“合乎常理等)的判断和解释(赔偿金额确认),主要的理论假设(理论假设之一)是:当事人的道德品质会影响法官对法律中的标准的解释和判断。换句话说,法官会策略性地解释法律中的标准,以论证其被法外因素影响的判决。

2.概念解释和法律适用

研究2是一宗涉及是否入罪的刑事案件。一名被告在家中饲养及售卖鹦鹉,被控非法售卖珍贵及濒危野生动物及其相关产品。在干预组中,他沉溺于赌博,在对照组中,他是一名照顾患病女儿的好父亲。在这个案件中,我们主要观察的法律技术是法律概念解释(驯养或者杂交的野生动物第二代,是否仍然属于野生动物),以及法律适用(是否适用某个特定的规则),主要的理论假设(理论假设之二)是:当事人的道德品质会对法官解释法律概念和适用法律产生影响。换句话说,法官会策略性地解释法律概念、选择性地适用法律条文,以论证其被法外因素影响的判决。

3.因果关系、可预见性及其他事实判断

在研究3中,被告在其院内存放氧气罐,引致一场大火。一名自愿参与灭火的邻居跌倒受伤,并诉被告侵权。在干预组下,被告储存氧气是为了生产冰毒;在对照组中,被告储存氧气是为了更好地照顾患病母亲。在这个案件中,我们主要观察的法律技术是对因果关系、可预见性及其他事实问题的判断,主要的理论假设(理论假设之三)是:在各类案件中,当事人的道德品质会影响法官对因果关系、可预见性及其他事实问题的判断。换句话说,法官会从预先判定的判决结果反推因果关系、可预见性及其他事实情况,进而论证其被法外因素影响的判决。

(三)对法官加以提醒并不能减少判决偏误

在我们的实验设计中,我们还能便利地检测另一个理论假设(理论假设之四):在说理中,法官会普遍有意掩盖自己知道的法外因素,避免提及这些因素对自身判决的影响。就此,基本的实验设计是:在询问法官做出相关司法决策的依据(理由)时,将刺激因素(当事人无关本案的道德品格)放在被试法官可以选择的多项选择题中。我们发现,几乎没有法官提及这些实际影响判决的因素。

这一实证发现并不意外。不过,如果从另一角度考虑,这一发现的理论意义可能会凸显出来:将这些无关因素放在法官的说理选项中,实际上是对法官的一种提醒,提醒他们注意不要受到无关因素的影响。显然,从下文的实验结果来看,这样的提醒并没有起到作用。同时,这也有助于我们判断,法官采取法律技术来掩盖司法偏见,是有意还是无意的。这一问题将在下文的讨论中详述。

基本实验过程

实验的总体情况是:(1)一共开展了三个行为实验。实验对象是真实法官。(2)实验采用标准的组间干预控制设计,被试法官被随机分配到干预组和对照组。(3)所有被试法官阅读的实验案例材料,都是从真实发生的案例改编而来。

本文的实验对象是参加短期培训班的五批法官。法官来自不同省份的5个基层或中级法院。实验的基本操作过程是:本文作者之一的李学尧先做一至两小时关于法律思维和法律方法的学术演讲。作为培训的一部分,每节课结束后,他邀请被试法官在课堂上用15分钟左右参与实验。被试法官用笔记本电脑、平板电脑或者其他移动设备通过Qualtrics平台参与在线实验。参加被试的法官人数分配如下:

研究1:414名法官;515名法官

研究2:115名法官;218名法官;335名法官;54名法官

研究3:338名法官

我们通常邀请每位法官参加一个实验。不过,参加其中一个课程的被试(N=38)参与了两个实验(研究2和研究3),时间约为30分钟。当被试参与两个实验时,两个实验的顺序是随机的。表1总结了参与者的基本统计信息。一些法官在完成实验后选择不透露他们的基本信息。表1中的描述性统计仅反映提交其资料的法官。

注:描述性统计基于提交相关信息的法官进行制作。括号中是标准差。

实验采用的是标准的组间设计方式。参与者被随机分配到干预组或对照组。他们阅读了改编自真实案例的案例简介。两组的案例材料是相同的——除了我们添加在干预组的干预材料(或者称刺激物stimulus)。我们试图利用当事人与案件无关的道德品性特征来诱导干预组和对照组的法官做出不同的决定。

研究设计的核心是:要求被试为他们的裁判决定选择判决理由。我们在每一项研究中都给被试提供了多项选择,以各种判决理由作为选项,一般有4—7个选项,包括2—3个在案件材料中辩论的法律和事实问题(以及包含在实验材料中的刺激物,见下文),法官可以选择他们认为应该适用的所有理由。他们也可以写下其他裁判理由。研究1中有10名被试、研究23名被试、研究37名被试写下了其他裁判理由。正如上文所述,我们的意图是,通过这个设计来观察干预组和对照组的被试法官给出的理由是否相同;也就是说,确定被试法官是否对刺激有反应。

需要注意的是,另一种设计是分别列出案件中辩论的问题,并请法官选择是或否作为简单的答案。例如,在研究1中,在实验材料中,首先问你认为这个案例中的违约金是否高于实际损失?”然后让被试决定是或否。不过,这种设计将诱使法官对他们实际上可能忽略或者在司法说理中可以回避的问题作出反应。目前的设计避免了这个问题。事实上,我们确实看到一些法官在选择裁判理由中避免提及某些问题:例如,在研究1中,一些法官既不选择B,也不选择D,回避了对事实问题的裁判。

法律标准的确定(研究1

法官可以策略性地解释法律,特别是其中关于标准的规定,进而合理化他们的判决。规则和标准是法律条文的一个基本类型划分。法律注定是不完备的,立法者不可能预见法律适用的所有情形。

因而,法律中一般都设有许多标准(比如,较高、轻微、巨大、通常情况、社会一般人等),为法官根据案件情形进行裁量留下空间。质言之,规则和标准的区别在于,是事前还是事后赋予法律条文以具体内容。规则在立法时便预先确定哪些行为是被法律允许的、哪些是被法律禁止的。标准则更一般化和抽象化,将问题留给了审判人员。

就此,法律标准为法官提供了很大的自由裁量权。这种裁量权很自然地会被用以粉饰判决结论。研究1旨在以严格的方法验证这种现象。

(一)案例场景和实验设置

研究1的大体材料如下:承租人(原告)和出租人(被告)签署了商户租赁合同。双方就一系列条款达成了一致,包括交付的具体日期,房租每月20万元,违约金30万元人民币。在规定的交付日2日前,出租人通知承租人,由于上一个承租人还没有搬离,不能按时交付商户。出租人要求延期10日交付。承租人主张对方违约,并要求赔偿违约金。承租人称,公司为搬迁做了大量的准备工作,而作为一家私募股权公司,推迟开业会引起客户的不信任,对公司形象造成负面影响,对公司业务造成实质性影响。

因为双方无法就赔偿问题达成一致,原告将被告告上了法庭,并提出了30万元违约赔偿金的要求。被告辩称,原告的实际损失仅包括因违反与搬家公司的合同而产生的潜在损失,总计约2万元人民币,以及因搬迁延期而失去的商业机会。同时,被告辩称,延期对原告业务的影响并不大,因为延期时间较短,原告仍可在其此前的办事处经营业务。原《合同法》第114条第2款规定,约定的违约金过分高于造成的损失的,当事人可以请求人民法院或者仲裁机构予以适当减少。被告辩称,合同中约定的30万元人民币的违约金高于原告的实际损失,要求法院将违约金降至2万元人民币,并愿意赔偿承租人10日的租金,约合6.7万元人民币。

在干预条件下,刺激因素是:被告被描述为一个品行不良的人,她与一个腐败的政府官员保持婚外情。这些信息单独作为一段置于案件事实结尾部分。实践中,诉讼当事人提供证据证明对方的不良道德品质是一种常见诉讼策略。但是,从法律角度看,当事人的私生活状况当然不能作为裁判涉及商业交易的考量因素。特别是,被告在本案外的品行与其在本案中的争议点完全不存在事实上的关系。

【干预变量,仅出现在干预组的案例材料中】本案被告杨某莉因故未能出庭。据悉,被告与当地国土局副局长张某长期保持婚外男女关系。张某涉及受贿罪与巨额财产来源不明罪,已被检察院审查起诉。杨某莉涉及张某受贿罪一案,涉嫌代为受贿、索贿等,已另案处理。本案所涉房产为杨某莉继承所得,与张某受贿案无关。

法官们被要求做出判决,并提供判决依据,具体的问题如下:您将在判决中给出的主要裁判理由是(可多选):

A.双方约定的违约金30万元,属于过分高于实际损失

B.被告违约未对原告经营造成重大影响

C.双方约定的违约金30万元,不属于过分高于实际损失

D.被告违约对原告经营造成重大影响

【随干预变量出现:E.被告与官员张某长期保持婚外男女关系,并涉及张某受贿案】

F.其他(请写在下方)【此处下方有一个较大的多行文字框】

(二)实验结果

干预条件下的刺激是为了诱使法官受到法外因素影响,作出不利于被告的判决。结果表明,这一研究设计是成功的。在干预组中,38.5%的法官认为原告胜诉,被告应全额赔偿违约金人民币30万元,而对照组中没有法官作出此决定。

这一差异在0.05的水平上统计显著(Fisher精确检验;表21)。我们还要求被试法官在不支持全部违约金的情况下,判决具体的赔偿金额。在干预条件下,法官给予的平均赔偿金约为18.5万元,而在基准条件下,这个数字约为8.5万元(如果法官支持违约金,则会直接顶格默认赔偿金额为人民币30万元)。差异在0.01水平上统计显著(见表21)。这些结果与以往类似实验得出的结论相类似。

注:*p<.1

**p<.05

***p<.01

实验关注的核心是法官选择的判决理由。合同法授权法官减少他们认为超过实际损失的违约金。我们将法官通常使用的两个裁判理由放在选项中,供法官选择:其中一个与法律标准有关——“过高;另一个问题是延迟交货是否对原告的业务产生了实质性的影响。这两个问题,前者涉及对法律标准的判断,后一个主要是事实问题。可以看到,两者的区别并不绝对。虽然过高是一种规范性判断,但它只能根据具体事实而作出判断。

1报告了实验结果。我们发现,两组的法官对法律标准有着不同的解释。干预组的法官更倾向于选择对被告不利的判决理由:他们更少选择A双方约定的违约金30万元,属于过分高于实际损失),即干预组法官更不倾向于援引合同法调整违约金额。同时,干预组的法官(38.5%)也更倾向于选择C选项,认为违约金不高于实际损失。基准组的16名被试中没有一个选择了这个选项。这些结果证明,法官不但受到了案外因素的影响,同时,他们通过对法律概念、规则的不同解释,对他们的判决进行合理化。

注意到,在干预组中,我们提供了选项E,涉及被告与腐败官员的婚外关系。从实验设计中我们知道,正是这一因素促使干预组的法官做出了更严厉的判决。然而,当提供判决说理时,没有法官选择这个选项,即法官有意隐瞒了他们真实的判决理由。

法律概念及法律适用(研究2)

研究2关注法官经常使用的法律概念解释和法律适用方法。

(一)案件场景

研究2的案件材料大体为:被告人王某,1983年生,案发时为深圳某厂工人。20144月,王某在厂区内捡到一只落单的鹦鹉,并将之带回宿舍。王某对鹦鹉很感兴趣。20145月,王某从网上购买一只雌性鹦鹉与之配对。此后,两只鹦鹉以惊人速度繁殖,一年后王某即繁育鹦鹉已达43只。20164月初,王某将其中6只鹦鹉以共约2000元的价格出售给朋友。警方调查表明,6只鹦鹉中,除4只玄凤鹦鹉外,还有2只小金太阳鹦鹉,学名绿颊锥尾鹦鹉,被列入《濒危野生动植物物种国际贸易公约》附录中,属于受保护物种。深圳市公安局森林分局于2016518日,以涉嫌非法出售珍贵、濒危野生动物及其制品罪,将王某刑事拘留。

在法庭上,控方和辩方就几个问题进行了辩论。第一个问题是,按照刑法的定义,在家中人工饲养繁殖的动物是否为野生动物。控方援引最高人民法院《关于审理破坏野生动物资源刑事案件具体应用法律若干问题的解释》第1条,说明最高法院已经明确将驯养繁殖的物种列入刑法保护范围。

辩方则认为:第一,《刑法》规定,非法出售珍贵、濒危野生动物罪的犯罪对象为珍贵、濒危野生动物,其含义是确定的,即所涉物种必须是珍贵、濒危野生的动物。公诉方将驯养繁殖的动物解释为野生动物,与事实有悖。第二,最高人民法院《关于审理破坏野生动物资源刑事案件具体应用法律若干问题的解释》中,将驯养繁殖的动物解释为野生动物,远远超出刑法文本,属于扩大解释,违反罪刑法定原则,与《刑法》本身相抵触,有违立法本意,不应在本案中适用。

另一个问题是事实问题:被告是否知道他的行为是非法的。辩方认为,王某饲养了较多鹦鹉,其中各种鹦鹉混杂,因而并不知道其饲养了受国家特殊保护的动物。因此,王某没有对自己行为违法性的概括认识,其行为不构成犯罪。相比之下,控方则认为王某是鹦鹉爱好者,对特定的繁殖和饲养技术有所了解。他还经常在网上与其他鹦鹉爱好者交流饲养经验。他自称不知道饲养的鹦鹉是国家保护动物,是完全不合常理的。目前的证据表明,王某知道或应该知道他的行为是非法的。公诉方建议判处被告有期徒刑五年。

(二)实验设计

实验材料在对照组和干预组中,对王某出售鹦鹉的动机有着不同的描述。在对照组中,被告被描述为一个照顾女儿的好父亲,而在干预组中他被描述为一个沉迷赌博的赌徒。显然,这些描述,与法律上应该怎样定性被告的行为,不应有任何关系,法官不应对其进行考虑。

【对照组:良好品德】王某进一步解释称,其出售的鹦鹉系幼鸟。因为女儿患有系统性红疮狼斑,需要自己更多的照顾和陪伴,无暇顾及幼鸟成长,才出售幼鸟。希望法官不要定罪。

【干预组:不良品德】此外,王某于2015年开始沉迷于网络赌博,并与妻子离异,无暇顾及培育鹦鹉,因而出售幼鸟。

法官被要求对案件做出判决,并从下列选项中选择他们的判决理由:您将在判决中给出的主要定罪(或判决无罪)理由是(可多选):

A.人工繁殖的鹦鹉属于野生动物

B.应当适用最高人民法院《关于审理破坏野生动物资源刑事案件具体应用法律若干问题的解释》

C.王某对自身行为的违法性有认识,即他在一定程度上知道自己饲养、出售的是受保护动物

D.人工繁殖的鹦鹉不属于野生动物

E.最高人民法院《关于审理破坏野生动物资源刑事案件具体应用法律若干问题的解释》过分扩大解释了刑法野生动物的概念,不应当适用

F.王某对自身行为的违法性没有认识,即他不知道自己饲养、出售的是受保护动物

【随对照组出现:G.王某的女儿患有系统性红斑狼疮,王某很可怜】

【随干预组出现:G.王某沉迷于网络赌博,人品较差】

H.其他(请写在下方)【此处下方有一个较大的多行文字框】

(三)实验结果

实验设计的目的是诱导法官根据被告的道德品质作出不同判决。实验结果与实验设想一致:在对照组中,37.1%的法官认为被告应当被定罪;而在干预组中,64.9%的法官作出了这一决定。差异有统计学意义(见表2)。我们还要求法官给出一个具体的刑期(如果法官宣判被告无罪,刑期视为0)。在干预条件下,法官给予的平均刑期约为1.5年,而对照组为0.4年(差异在0.01水平上统计显著)。这些结果表明,被告的道德品质导致了法官不同的司法判决。

在后续的选择题中,提供了三种判决理由:对法律概念的解释,即在这种情况下鹦鹉是否应该被判定为野生动物;法律的适用性,即最高人民法院的解释是否适用;事实问题,即被告是否知道他的行为是非法的。图2汇总了实验结果。

第一,发现被试法官随着被告人的品格不同,对野生动物的概念有不同的解释。在干预情况下(不良品德组),18.9%的法官认为本案中的鹦鹉不是野生动物(选项D),但48.6%的对照组(良好品德组)法官选择了这个选项(差异在0.05水平上统计显著)。这一发现表明,对照组的法官更有可能认为刑法中野生动物的概念不包括国内繁殖的物种,即法官更倾向于借助法律解释,为品格较好的被告出罪。此外,统计数字表明,干预组的法官较少提到鹦鹉的野生动物定性问题——只有45.9%(27.0%+18.9%)的法官(通过选择选项AD)提到了这个问题,其余的法官则回避了这个问题。相比之下,在对照组中,更多的法官(25.7%+48.6%=74.3%)愿意提及(援引)这一理由。

第二,法官们对是否援引最高人民法院相关规定,也随着被告品格的不同而不同。在干预组中,59.5%的法官认为对被告不利的规定应当适用(选项B),而对照组中这一比例则为37.1%(p=0.065)。干预组中16.2%的法官认为这一规定不适用(选项E),对照组则为40.0%(p=0.035)。这说明,法官借助法律适用问题,达到其特定的裁判目的。

第三,法官对事实问题的解读(被告是否意识到自己行为违法),也随着被告品格的不同而不同。在干预组中,48.6%的法官认为被告知道自己的行为违法(选项C),而对照组为28.6%(差异在0.10水平上统计显著)。

第四,在72名法官中,只有一名法官选择了被告的道德品质作为其判决理由(选项G)的一部分。但从实验设计中我们知道,正是被告的道德品质促使两组法官们作出了不同的判决。这意味着,绝大多数法官都对真实的判决理由闭口不谈,而适用以上各种法律技术来掩盖其真实理由。

因果关系和可预见性(研究3)

上述研究发现了法官可以利用解释法律概念、策略性地适用法律来合理化他们的判决。我们怀疑对事实的认定也能起类似的作用。我们用研究3来验证这个假设。我们关注的核心是因果关系和可预见性的认定。因果关系和可预见性是普遍存在于各种法律中的概念,是侵权、合同、保险和刑法中的基本要素。

实际上,关于因果关系和可预见性的法律理论尤为复杂,也尤为令人费解,很难指导审判实务(比如,关于因果关系的理论,很大比例属于循环论证)。此处,我们在更加抽象意义上的理论假设是:因果关系和可预见性是法官可以通过法律解释技术便利地操纵的概念。这一实验选取的是一个民事案件;但我们认为这一实验的结果,可以适用于刑法学中阶层论构成要件说中关于因果关系和可责性的讨论。

(一)案件场景

我们使用以下案件进行实验研究:被告王某强住在村中,他把两个氧气罐放在他家院子的墙边。某日午夜,氧气罐爆炸引起了严重火灾。据消防部门描述,氧气罐爆炸是由一名路人在墙外留下的烟头引起的,但他们找不到具体的责任人。氧气罐爆炸先使墙外的易燃物着火,进而扩大到周围的房子。原告赵某华和被告住在同一个村,当晚他自愿参加了救火。当日夜里天很黑,原告在救火时,于取水的路上掉进了路边的水沟里,导致他腿骨、腕骨骨折,腿骨刺穿了他的肌肉,腿骨暴露在外。

原告赵某华诉称,他跌倒是因参与救火造成的;被告王某强储存氧气罐、火灾和原告受伤之间存在因果关系;当被告储存氧气罐时,他应该预见到危险。因此,原告要求被告赔偿人民币44000元,用于支付治疗费用和其他费用。被告辩称,他储存氧气罐的行为与火灾之间没有因果关系;同时,火灾与原告受伤之间也不存在必然的因果关系。被告辩称,一些村民告诉他,原告那天晚上参加了宴席,喝了不少酒。他摔倒可能是喝酒的缘故。此外,被告还辩称,他也不可能预见到原告会在救火中跌倒受伤。

(二)实验设计

我们继续使用组间设计。在对照组中,被告是位孝顺的儿子,他储存氧气罐是为更好地照顾他患有肺部疾病的母亲;在干预组中,被告这样做是为了制造毒品。

【对照组:良好品德】(案件材料第一段)经调查,被告母亲患有肺部疾病多年,需要经常在家中吸氧。被告长期照料母亲,在家中储备有氧气罐。(案件材料最后一段)同时,被告放弃外出打工机会照顾母亲,人品得到邻里公认,希望法官加以考虑和照顾。

【干预组:不良品德】(案件材料第一段)经调查,被告在家中少量制备冰毒,氧气罐为其制备冰毒时使用。该案已由公安机关另案处理。(案件材料最后一段)原告进一步称,被告制备冰毒的不法行为,致其在救火中摔伤,被告理应受到相应责罚,对原告作出相应赔偿。

您将在判决中给出的主要裁判理由是(可多选):

A.被告储存氧气罐的行为,与原告受伤之间存在法律上的因果关系

B.被告对原告可能出现的受伤情形具有一定的预见可能性

C.原告虽然喝了酒,但是被告储存氧气罐的行为才是原告最终受伤的主要原因

D.被告储存氧气罐的行为,与原告受伤之间不存在法律上的因果关系

E.被告对原告可能出现的受伤情形不具有预见可能性

F.原告喝酒是原告最终受伤的主要原因

【随干预组给出:G.被告制备冰毒,道德品质差,应当受到惩罚】

【随对照组给出:G.被告照顾母亲,道德品质好,不应要求其赔偿】

H.其他(请写在下方)【此处下方有一个较大的多行文字框】

()实验结果

实验设计的目的是诱使法官在干预和对照条件下,因为刺激物(被告具备的不同道德品质)而作出不同的判决。实验结果表明,被试的判决与我们的设计一致。在对照条件下(被告品行良好),没有法官判定原告胜诉,即被告不应向原告支付全部损害赔偿金(人民币44000)。然而,在干预条件下(被告的道德品质较差)23.8%的法官给予原告全额赔偿(p=0.053)。我们还要求被试法官给出具体的赔偿金额。对照组平均判决赔偿金额约为14000元,干预组平均判决赔偿金额约为23000(p=0.056)

关于判决的理由,主要包括三个问题:1)因果关系,即被告储存氧气罐的行为与原告的伤害是否存在因果关系;(2)可预见性,即被告是否能够预见氧气罐可能引起火灾并造成人员受伤;(3)另一个事实问题是,被告的行为(氧气储存)或原告的行为(当晚饮酒)哪一个才是原告受伤的主要原因。需要注意的是,我们并没有将此定义为共同原因的问题。我们用中国法律实践中经常使用的主要原因这一模糊概念,将其描述为一个一般性的事实问题。


3汇总了实验结果,包括:第一,法官对因果关系作出了不同解释。在干预组中,66.7%的法官认为被告的行为与原告的伤害之间存在因果关系(选项A),而在对照组中,只有35.3%的法官选择了这一选项(差异的p值为0.101,接近统计显著)。另外,干预组中28.6%的法官认为被告的行为与原告的伤害之间没有因果关系(选项D),对照组中这一数字为47.1%。但这一差异在统计学上并不显著。

第二,法官对可预见性作出了不同解释。在干预组中,19.0%的法官选择E选项,即他们认为被告不具有预见到有人受伤的可能性。在对照组中,更多的法官(52.9%)选择了这个选项(p=0.042)

第三,我们没有发现法官对主要原因的事实问题作出了不同判断。在干预组中,28.6%的法官选择C选项;在对照组中,29.4%的法官做此选择。几乎没有法官选择F选项。

第四,38名法官中只有一名法官(为干预组中的法官)将被告的道德品质作为判决理由(选项G),但从实验设计中我们知道,道德品质正是促使法官做出不同判决的原因,即绝大部分法官隐瞒了他们真实的判决理由。

对实验结果的进一步分析

(一)外部有效性

上述研究采用随机实验,具备了较高程度的内部有效性。我们研究面临的挑战主要是他们的外部适用性。在实验研究中,我们不可避免地忽略了实验和现实世界之间某些重要区别。例如,在法庭上,法官会考虑更详细、更复杂的事实材料,在得出结论之前会有更多的考虑时间。法官在现实世界中要承担误判责任,因而更为细致认真。此外,一系列司法程序,如合议庭、上诉审等,都在限制他们裁量的权力。所有这些因素都使法官变得更为谨慎,减少他们的决策偏差。

即使如此,本研究仍有着较强的外部有效性。这是因为:我们的案例材料是根据实际案例改编而来,同时,我们为法官提供了比较长的时间来决定案件。同时,实验程序也允许法官在给出他们的理由后改变他们的决定,这实际上较好地模拟了真实世界的决策过程。此外,过去的许多研究都使用实验来研究情感、冲动、法外因素对判决的影响;研究人员也曾使用更真实的场景乃至真实世界的经验证据,而这些研究的发现也都与实验的结果类似。这些先前的研究发现减轻了我们对外部有效性的担忧。

我们研究中使用的是特定的案例场景和法律问题。一个自然的问题是,在这些场景中得出的结论,是否可以扩展到其他案例和问题?应该看到,我们设计了三种情景,涉及民法和刑法的问题,同时,三个案件所涉及的法律技术较为多样,包括对法律标准和法律概念的解释,对适用法律的选择,对因果关系、可预见性和其他事实问题的判断。就此,有理由认为我们实验得出的结论有较好的代表性和概括性,能够很好地推广到大多数法律问题的领域。

(二)事实判断与法律判断的比较

本研究宏观上的问题意识是对在事实与规范之间流转往返的法律解释技术进行实证检验。有些读者可能感兴趣于这样的问题:当法官试图使他们的决定合理化时,他们更喜欢使用法律解释还是事实分析?研究结果提供了初步证据,证明法官更愿意使用前者。

在研究1中,法官需要判定违约金是否高于实际损失,违约是否严重影响了原告的业务。前一个关于过高的问题,更类似是一个需要规范性判断的法律问题,而后一个关于严重影响的问题,则主要是一个事实问题。我们发现,在干预组和对照组中,法官对过高这一法律标准的解释存在显著差异,而对是否有严重影响,则分歧不大。这一比较提供了初步证据,证明法官更倾向使用法律解释而非事实判断来为判决进行合理化。当然,要注意,我们上文便已提到,法律事实的分野,在这里其实并不那么必然和明确。在研究2和研究3中也有类似的现象,在此我们不再赘述。

(三)隐瞒和矫饰:法官是有意还是无意的?

被试法官使用了多种法律技术来为他们可能存在偏见的决定进行合理化解释,他们很少提到真正推动他们做出决定的因素。他们这样做是有意的还是无意的,值得讨论。

从现有的证据来看,更有可能的情况是,法官故意隐瞒了他们真正的决定理由,而且他们还故意使用法律技术进行掩饰。这主要是因为,在判决理由的选项中提供了真正的决策原因(作为刺激物的当事人道德品质),但几乎所有的被试都避免选择此类选项。这里,将无关因素纳入选项中,是一个很强的提醒。在这一提醒下,法官很可能已经意识到他们不应该受到无关因素的影响,但这种认识并没有改变他们的决定:他们放任自己依从法外因素来对案件作出裁决,然后选择其他理由来掩盖真实的判决理由。

讨论与结论

法官的决策如果受到不当因素的影响,她是如何为带有偏见的决定辩护的呢?

在对在职法官的一系列行为实验中,我们首先重复了世界法学前沿的实验结果。更重要的,作为本文的核心,我们证实了历史上各种批判性理论对形式主义法学的批判——法官会使用各种法律技术来正当化判决中的偏见:策略性地解释法律概念(法律解释),选择性地适用法律条文(法律适用),从预先判定的判决结果反推因果关系、可预见性及其他事实判断(事实认定)。

总体来说,很多时候,法律成了判决的矫饰,而非判决的依据。证据还表明,当得以选择法律解释和事实认定来对判决中的偏见加以论证时,法官更倾向于解释法律。我们还发现,提醒法官注意判决过程中可能出现的偏见,并不能真正消除偏见。

在一篇行为实验的论文中,我们倾向于不对实验结果做过度理论解释或者演绎。但是,我们认为,本研究提醒法学界注意以下的理论问题,或者说,中国法学在下述几个讨论点应导入更多的研究,特别是实证研究。

第一,关于法的确定性的讨论。此前,不少现实主义法学家都对说理和法律的确定性提出过质疑。卢埃林曾说,除了最简单的案件外,法律确定性从未存在过,也永远不会存在。大多数司法推理只不过是用确定性的外衣装扮司法意见。而波斯纳法官则进一步认为,很多司法意见通过自信的写作方法对法的确定性做了夸张的描述。我们在这篇论文中的发现与上述学者的怀疑论是一致的,同时也证实了卢埃林的观点,即法律推理有时只是法官的掩饰手段,不管他们是有意还是无意。

现实中,不论争议多么复杂,大多数判决书看起来总是充满着确定性和正确性,法官总好像掌握了唯一正确的答题思路和答案,中外皆然。而事实上,我们不应该遗忘,法律本身充满着冲突和不确定性,案件事实很多时候也难以判断和认定。某些看起来确定性更强或者法学内部视角性质更强的法律方法或者理论,比如在道德与法律分离方面更加彻底的某些法学理论和方法,如排他性实证主义法学或者原旨主义的宪法解释方法,相比于那些容易将多元价值纳入其中的法律理论或者解释方法,也未必更能提升法的确定性,更可能只是高级一些的矫饰技术。比如,当美国的保守派法官使用原旨主义来解释宪法时,原旨主义就只是一种技术——别太把这些理论当回事了。

第二,关于法律职业化水平对法治的意义。法学通说认为法律职业化是法治建设水平的重要指标。作为这种命题的构成部分,法学通说还认为,说理增加了判决书的可读性与说服性,使得判决更为当事人接受,同时也起到示范和普法的效应。对此,我们大体赞同,但本研究的发现带来了一些隐忧:说理中出现的法律解释、推理、适用,可能并不是判决的真实理由,而只是真实理由的矫饰。实际上,使用了矫饰的技术后,判决的真实理由变得更难被察觉。就此,与法律职业化水平密切相关的司法说理并不必然能够成为司法公开透明和法律确定性的保障。

第三,我们的研究还提出了以下疑问:就法教义学而言,更加精细的法学理论真的比那些相对粗糙的法学理论更加有用,更能实现法治功能吗?比如,以刑法学为例,阶层化犯罪构成真的就会比四要件犯罪构成更好吗?更加精细化、复杂化的法律理论,如果不导入一些强科学主义的方法和讨论,会不会反而更方便法律被塑造成为更趁手的矫饰工具?我们希望借助本文以及本文延长线上的类似研究,引导学界思考相关的问题。这篇文章只是一个尝试性开端。


原文刊载于《中国法律评论》2022年第2期,感谢微信公众号“中国法律评论”授权转载!