2022年05月23日【作者】吴旭阳预览：

【作者】吴旭阳

【内容提要】

*吴旭阳

厦门大学法学院副教授

摘要：陪审制是司法民主的重要体现。在陪审制改革与试点的今日，我们进行陪审制的实验测试，以同一刑事案件的证据材料，对“十二人陪审团”、“六人陪审团”和“4+3陪审团”三种陪审模式进行实验比较分析，并对一批司法审判人员的个体进行参照测试。通过三种陪审团的集体合议和表决结果，我们发现陪审团在事实认定方面并不逊色于法学专业人士。我们进一步发现陪审员个体在证据证明力的认知以及罪名是否成立的判断方面，与法学专业人士的差距也不大，而且陪审员的工作积极性也很高。实验和实证调研表明，法官指示、证据规则和陪审团合议过程等要素，显著影响了部分陪审员对证据的认知和最终事实判断。这些对于我们今后的陪审制改革和探索，具有不小的参考意义。

关键词：陪审模式行为实验比较研究改革探索

一、陪审制的改革和研究

（一）陪审制的改革和研究意义

陪审制是司法制度的重要构成部分，其不仅涉及司法民主和司法监督，也关乎司法公信力，值得我们重视和研究。

陪审团制度是英美法系的一个重要特色制度，是其法律传统的特殊产物之一，并对各国有一定的借鉴意义。长久以来，英美国家的陪审团由十二名陪审员构成（简称“十二人陪审团”），并在表决上采用一致裁决原则。大陆法系的法国、日本等国也在后来引进了陪审制度；在刑事案件的审理中，建立了“9+3”（九名普通市民陪审员和三名法官）、“6+3”（六名普通市民陪审员和三名法官）等混合审判模式；此类陪审制也被称为参审制。近年来，美国出现了陪审团“小型化”趋势，美国已经有30个州允许将陪审团缩小到6人。[1]那么，这些不同的陪审模式，陪审团的大小以及人员构成的不同，是否会对陪审团的决策过程产生影响？从而影响其事实认定的结果？在现今中国进行陪审制改革试点，各地试点法院纷纷探索试用诸多陪审模式的情况下，这种陪审团人员构成和数量对裁判结果产生的影响，以及陪审群体内部决策互动过程的问题，非常值得我们关注和研究。

在我国，人民陪审员与法官一起组成合议庭，参与到案件的庭审与合议，陪审员与法官具有同样的权利（权力），通常是“两名陪审员和一名法官”（2+1）模式（本文讨论的陪审制模式为“陪审员数目+法官数目”，后文中数字模式为不同陪审模式的简称，下同）或者“一名陪审员和两名法官”（1+2）模式。但是，我国合议庭中陪审员人数较少，而且陪审员在庭审和合议中的作用比较消极，还存在“陪审员人选相对比较固定”等问题，在一定程度上弱化了人民陪审员制度的效果。

近年来，我国不断重视陪审制的改革，并探索新模式。2004年8月，十届全国人大常委会第十一次会议通过《关于完善人民陪审制度的决定》。该决定对陪审案件的范围、人民陪审员的任职条件、人民陪审员的选拔方式、人民陪审员的权利与职责进行了明确规定。中国共产党十八届三中全会则明确提出，“广泛实行人民陪审员制度，拓宽人民群众有序参与司法渠道”。而十八届四中全会更进一步明确，“完善人民陪审员制度，保障公民陪审权利，扩大参审范围，完善随机抽选方式，提高人民陪审制度公信度。逐步实行人民陪审员不再审理法律适用问题，只参与审理事实认定问题”。其不仅强调陪审制改革，还明确提出了若干具体要求；体现了对陪审制改革的重视。

2015年4月，《全国人民代表大会常务委员会关于授权在部分地区开展人民陪审员制度改革试点工作的决定》为陪审制改革试点工作的落地实施提供了法律的依据。为此，最高人民法院、司法部印发《人民陪审员制度改革试点方案》和《人民陪审员制度改革试点工作实施办法》。最高人民法院根据全国人大常委会的授权，研究制定陪审改革试点实施方案，在十个省、自治区、直辖市和五十个试点法院全面开展人民陪审员制度改革试点工作。

自从2015年4月获得全国人大和最高人民法院的授权和试点资格后，全国各陪审改革试点法院在陪审模式方面进行了不少创新和探索。在陪审团的模式上，各试点法院探索了“6+3”、“4+3”、“5+2”和“4+1”等各种模式[2]。这些陪审模式的创新，取得了良好的效果。我们对部分试点法院进行了调研，发现“4+3”模式在这些试点法院较多适用，具有一定的数量基础。因此我们认为，可以将“4+3”模式作为陪审制改革研究的一个先期的范本，与西方陪审制中的十二人陪审团和六人陪审团进行比较研究，以实证实验的研究方法进行相对科学、精密的分析和比较。

（二）陪审研究的实验方法

运用社会心理学的方法对司法进行研究，是美国学者汤姆泰勒（Tom Tyler）和沃尔克（Walker）等人在二十世纪七十年代开创的。他们研究了程序正义的各个问题，区分了“公平”和“准确”两种程序模式，并通过实验对两者的区别和普遍性进行检验。[3]

而关于陪审的决策研究，虽然传统上对此类实证研究有反对意见，或者认为陪审员的决策根本就是不确定的。[4]但是，西方国家对此不仅有相关学理研究，还进行了一些实证研究。对陪审的实证调研既有观察描述的社会调研，也有对于裁判结果的数量化分析研究。特别是行为法学派进行了一系列的实验研究，研究庭审过程中的各类问题，尤其是裁判者的认知定型（bias，也被称为“认知偏差”）问题；其中比较典型的“模拟陪审员”（mock juror）的裁判实验。美国的行为法学派进行了大量的“模拟陪审员”实验，并在《Behavioral Sciences & The Law》、《Psychology Crime & Law》、《Psychology, Public Policy, and Law》等杂志上发表了多系列的实验报告。此类实验从认知定型研究为主，偏重于司法实务，尤其是律师实务。

相关研究偏重心理决策模型的方式，以严密的逻辑推理、数据模型和以及各种实证实验报告的模式，对陪审员的司法裁判的心理模式进行细致的科学研究。“陪审员的事实认定”是其中一个重点，涉及到人的认知研究，并分成多种研究主题。在这些实验中，研究人员经依照各个要素进行组合研究，例如采用多要素的“2×2×2”、“2×2×3”等不同组合进行比较研究。被试者通常人数为200-800人，以采用“模拟陪审员”的个人决策为主，而不是以“陪审团团体决策”为主。在相关司法裁判实验模式的影响下，我国学者也开始尝试司法裁判实验，但更多地以法官或者裁判者为主。[5]

因此，为了更好地研究我国陪审制的试点模式，我们借鉴西方的“模拟陪审员”实验模式，对陪审的不同模式进行了文科实验研究。由于我国陪审制改革试点中，“4+3”陪审制较为普遍，因此我们选取了该模式进行实验研究对象。同时由于普通法系陪审制的模式主要是“12+0”模式（即“十二人陪审团”），近年来“6+0” （即“六人陪审团”）模式也不断扩展。因此，我们选取了“12+0”、“6+0”和“4+3”三种陪审模式进行实验的比较研究。同时，我们还对司法审判人员个体也进行对照研究，为“法官与陪审员的事实认定”进行比较研究。

我们认为，陪审制改革试点和模式的学理研究固然有其重要性和基础性，但如若以实证的问卷调查、访谈和实验等方法进行研究，进行更“精密”的分析研究，也能得出有一定说服力的结论，也能够更为科学地研究和评估现有的陪审试点模式。

二、实验设计

本实验设计以现有“十二人陪审团”（即“12+0”模式，下同）、“六人陪审团”（即“6+0”，下同）和“4+3”陪审团等三种陪审模式为实验模型进行比较研究，以求对不同陪审模式对于相同案件的“事实认定”差异问题进行比较研究。

同时，为了更好地进行比较分析。我们也对一批法官进行了问卷研究。因此，在数据上，存在四组数据以进行对比。

（一）审判组织

我们选取了西方典型的“十二人陪审团”、“六人陪审团”和我国的“4+3”陪审团作为三类陪审组织进行比较研究（每种模式各进行20组实验，共计60组）。

我们实际共进行实验65组，成功完成60组。在所有的60组实验之前，我们进行了3组预实验，每次预实验结束后，我们均与相关专家进行探讨总结，对实验文本和流程进行修订。另外，在60组实验之外，还有2组实验未成功。实验流程以西方陪审实验模式为基础，并经过厦门大学法学院和司法实务界相关专家学者的反复探讨，实验设计较为科学安全。

1、“12+0”陪审团。十二人陪审团是英美法系长期以来的主要陪审团组织模式，其表决采用“一致裁决”规则；如果不能达成一致，就称为“僵局陪审团”（或“悬疑陪审团”）。在本实验中，我们招募“非法学”被试者进行十二人陪审模式实验，按照英美陪审团的“一致裁决”模式进行表决。“12+0”模式共计进行实验22组，成功完成20组，1组实验失败（因为该组有被试者在案件合议时以玩乐态度对待实验，表决时反复转变立场，并表示这样做仅是为展现自身的口才说服能力），1组实验流程被误设为其他模式的“12+0”实验（被转为日后进行的其他模式实验）。

2、“6+0”陪审团。六人陪审团是英美法系近年来不断扩展的陪审团组织模式；也采用“一致裁决”的表决规则。在本实验中，我们招募“非法学”被试者进行六人陪审模式实验；也按照英美陪审团的“一致裁决”规则进行表决。六人团模式共计进行20组实验，成功完成20组。

3、“4+3”陪审团。“4+3”审判组织是法官与市民的混合审判机构。在大陆法系的法国、日本等国的刑事案件的审理中，也有“9+3”、“6+3”等混合审判模式，因此也被称为“参审团”。我们的“4+3”实验的表决规则为“5：2”的绝对多数有效。由于多数试点法院的表决规则为“4：3”即可做出有效的判定（民事案件和刑事案件均有），我们认为这种相对多数在刑事案件中的合法性较低，故采用“5：2”的“绝对多数”有效表决规则。实验进行20组，成功完成20组。

（二）被试者情况

我们的被试者分成三类，第一类为招募的非法学被试者，第二类为招募的法学专业被试者。此外还有法院的司法审判人员。

1、非法学被试者在实验中担任“模拟陪审员”。我们在厦门大学校园内分发了招募广告，志愿者联系我们表示愿意参加陪审行为实验，除个别被试者为毕业不久的厦门大学毕业生或其他院校毕业生外，多数被试者为厦门大学在校本科生或研究生，无教师参加实验。我们招募时对此类被试者的条件要求如下：（1）志愿者不限本科、研究生；学校不限于厦门大学，其他大学、大专院校均可。教师和社会人员也可以（必须会普通话）。（2）专业限制：法学专业（含双学位）和心理学专业两个专业不能参加本次实验。从事法律和心理相关职业者也不能够报名参加。（3）年龄必需符合选民的年龄要求，即要满18周岁。（4）要求没有精神病史，现在也没有精神疾病或精神问题；无犯罪史。（5）其他符合选民的要求。以上要求主要是参考西方国家陪审员任职的若干基本要求，并结合我们若干陪审试点法院对陪审员的相关要求，以及西方陪审行为实验的招募要求。

2、法学专业被试者仅限于在“4+3”模式中担任“模拟法官”。他们的招募条件如下：（1）厦门大学法学院（含知识产权学院、南海研究院等法学专业）在读的硕士研究生。（2）通过司法考试或者曾在司法实务领域进行过实习（担任法官助手为优）。（3）年龄必需符合选民的年龄要求，即要满18周岁。（4）要求没有精神病史，现在也没有精神疾病或精神问题；无犯罪史。（5）以及其他符合选民的要求。

3、法院司法审判人员。作为比较参考，我们也对江苏、广东、福建三省的五个法院的司法审判人员进行了相关的问卷调查，作为另外的对照组。我们对司法审判人员个体进行问卷调查，提供了同样实验素材（刺激材料）中的证据材料。法官们阅读完证据材料后，对被告人被指控的罪名是否成立问题进行判断，并对案件的各个证据的证明力进行排名。但是，由于他们不是陪审员，因此不提供法官指示等材料。我们分发了一百余份问卷，回收了81份问卷，其中有效问卷71份，但是有3名法官虽然填写了证据的证明力排名，却没有填写罪名是否成立，实际有效问卷68份。

（三）实验素材（刺激材料）

实验的案件材料为福建省某基层法院审理判决的案例。全部证据材料来源于判决书中所有的15项证据材料，以作为事实认定的依据。公诉方以“强奸罪”对被告人提起公诉。

由于该案件属于强奸案件，涉及个人隐私（因此该裁判文书也未在中国裁判文书网上公布），实验材料隐去所有人员的姓名，以甲乙丙或A、B、C等英文大写字母指代原被告、证人等各类人员。此外，对于证据材料中所有涉及到地名、店名、校名、公司名称等均进行隐名或更改，以保护当事人的隐私。实验结束后，我们全部回收各类实验材料。

经过庭审举证质证，本案的证据主要有：第1号证据：被害人丙某的陈述、辨认笔录。第2号证据：被告人甲某的供述。第3号证据：证人A的证言证明。第4号证据：证人B的证言证明。第5号证据：证人C的证言证明。第6号证据：证人D的证言及辨认笔录证明。第7号证据：证人E（丙某的丈夫）的证言证明。第8号证据：证人F（系丙某的邻居）的证言证明。第9号证据：证人G、H（系丙某的邻居）的证言证明。第10号证据：案发当晚公安机关对被害人丙某的人身检查笔录、照片。第11号证据：现场勘验检查笔录、现场照片。第12号证据：现场勘验检查提取物品登记表、提取笔录、《法医人类遗传学检验鉴定书》。第13号证据：被害人的门诊病历、诊断证明书、检验报告单。第14号证据：被告人与被害人的手机通联记录、手机电子数据。第15号证据：X小学路口、X村入口监控录像。

（四）流程

在实验中，三类陪审团均有以下阶段：

1、“法官指示前”阶段。作为个体的陪审员阅读证据材料，对罪名是否成立进行填写，并对证据证明力进行排名填写。

2、“法官指示后”阶段。法学教师或法学专业研究生以实验助手身份进行“法官指示”的宣读和解释。内容主要为：（1）相关罪名解释；（2）证据规则；（3）无罪推定等法律原则。陪审员人人都发放一份“法官指示”的打印本，以随时阅读参考。然后，陪审员阅读证据材料，对罪名是否成立进行填写，并对证据证明力进行排名填写。

3、合议阶段。陪审员进行表决，并发表个人意见，进行说服、辩论等活动。实验助手进行记录工作，并适度回答相关的法律问题（如罪名解释和证据规则等）。

4、经过多轮表决和讨论，陪审团最后达成裁决结果或并未达成裁决结果（僵局陪审团）。在实验后，我们还让被试者填写证据证明力排名。

被试者只进行事实认定，依照前述证据进行合议和表决，陪审员做出“强奸罪罪名成立”或“强奸罪罪名不成立”的判断。

（五）其他

本实验的策划时间为2015年初，并于2015年6-7月进行了预实验，据此进行了实验版本的修订。正式实验实施时间为2016年4月至10月。法官组的司法审判人员个人的问卷时间为2015年6月至2016年10月。

本实验的招募模式符合十八届四中全会中关于陪审制改革“随机抽选”的要求，也符合“只参与审理事实认定问题”的要求。在本实验的策划实施、理论探讨和数据分析过程中，我们在厦门市海沧区人民法院、龙海市人民法院等陪审制改革试点法院，以及厦门市中级人民法院进行了法官访谈、陪审员座谈、陪审员个人访谈的研究。同时，我们还参加了中国政法大学证据科学研究院前往山东省威海市环翠区人民法院（陪审制改革试点法院）关于陪审制试点改革的参观考察。相关高校和司法实务部门为本文的实验和理论研究提供了各种协助和便利，我们据此对实验模式和方案进行了补充和完善。

三、实验数据和合议过程的分析

本实验的数据收集是每个阶段的表格填写、合议意见记录和表决结果记录，主要目标是对不同阶段的罪名成立判断、合议意见、投票结果、证据的证明力排名和分值等要素进行记录和分析。我们对15个证据的证明力进行排名，证明力排名第一的证据设定分值为15分，证明力排名最后的证据证明力设定分值为1分。

数据结果和分析有以下几个部分。

（一）罪名是否成立的判断结果如下：

陪审模式	罪名成立的团		罪名不成立的团		僵局陪审团		团平均表决次数
陪审模式	数目	比例	数目	比例	数目	比例	团平均表决次数
“12+0”	1	5%	18	90%	1	5%	4.1
“6+0”	1	5%	19	95%	0	0%	2.95
“4+3”	0	5%	20	100%	0	0%	2.85
司法人员个体[6]	19	28%	49	72%	无	无	无

表1：陪审团、司法人员个体关于罪名是否成立的判断（单位：团或人）

表2：陪审员关于“罪名成立”的个体意见（单位：人）

	法官指示前		法官指示后		实验后（最终结果）
陪审模式	数目	比例	数目	比例	数目	比例
“12+0”	33	13.75%	87	36.25%	13	5.42%
“6+0”	19	15.9%	36	30%	6	5%
“4+3”	23	16.43%	32	23.86%	29	20.71%

由表1我们可以知道，在陪审团整体意见方面。经过多轮表决和辩论，20个“12+0”团被试者，有18个团的“一致裁决”的表决结果是“强奸罪罪名不成立”，占全部团数的90%；1个团的 “一致裁决”结果是“强奸罪罪名成立”，占5%；还有1个团经过多轮表决和辩论，最后不能达成一致意见，成为“僵局陪审团”，占5%。20个“6+0”团被试者，有19个团的最终“一致裁决”结果是“强奸罪罪名不成立”，占95%；1个团的 “一致裁决”结果是“强奸罪罪名成立”。此外，20个“4+3”团被试者，以“5：2”的多数有效的表决规则，20个团的表决结果均是“强奸罪罪名不成立”。

而司法人员个体组的罪名成立比例高达28%，根据表2我们可知，这比陪审员个体在“法官指示前”和“实验后”的阶段高得多。虽说在法官指示后的这个阶段，被试者个体的“罪名成立”比例不会低于司法审判人员；但经过充分合议之后，以陪审团的群体决议模式（而不是陪审员个体），陪审团的定罪比例也不会高于司法审判人员个体。而司法审判人员认定“罪名成立”的28%比例，如果随机组成三人合议庭的话，以现有审判的“多数有效”为合议庭表决规则，则这些司法审判人员所构成的多数合议庭的表决结果也是“罪名不成立”。当然，在组合的概率上，也不排除个别合议庭出现“罪名成立”的可能性。从这点看，完全由法官构成的三人合议庭与“12+0”、“6+0”和“4+3”三种模式的团体表决结果相比，没有太大的区别。

此外，根据表2的数据，被试者关于“罪名是否成立”的个体意见方面，在“法官指示前”、“法官指示后”和“实验后”的不同阶段也存在一定的变化。法官指示后，个体的“罪名成立”有大幅的增长。结合合议过程的发言记录，我们发现主要的原因可能是，陪审员认识到法官指示中关于“强奸罪”的解释与他们日常生活中所感知的强奸罪并不完全相同。出乎他们意料的是：原来在法律上，“强奸罪”的犯罪预备、犯罪中止和犯罪未遂等状态均属于“罪名成立”的范围。因此，部分被试者纷纷修改“法官指示前”的“罪名不成立”的立场，改为“罪名成立”立场。

但在“实验后”之后，陪审员个体的“罪名成立”比例也在下降，结合合议过程的发言记录，我们发现陪审员在合议中不断深入对“排除合理怀疑的刑事证据原则”以及“无罪推定原则”的认识和重视。而力辩“罪名不成立”的被试者，往往也是主打这两个原则来说服他人。因此在最后，许多被试者转变立场，转而“不得不”或者“含恨”认为罪名不成立。

而在三种陪审团模式的表决中，多数陪审团也要经过多轮表决才得出结论。可见，在不同阶段，经过不同的知识学习（法官指示）、分析和讨论，陪审员个体的结论会有所改变，进而引发团体表决结果的改变。

（二）被试者个体的证据证明力分值是否符合正态分布

被试者对于15个证据证明力的比较分析，也是我们要进行研究的一个方面。我们用每个阶段的各个证据证明力总分做正态性检验，发现其符合正态分布的要求（见表3）。

表3：被试者个体的证据证明力分值的正态分布

Tests of Normality
	Kolmogorov-Smirnova			Shapiro-Wilk
	Statistic	df	Sig.	Statistic	df	Sig.
4+3非法学（指示前）	0.156	15	0.200*	0.948	15	0.500
4+3非法学（指示后）	0.155	15	0.200*	0.910	15	0.134
4+3非法学（试验后）	0.199	15	0.112	0.911	15	0.139
4+3法学（指示前）	0.168	15	0.200*	0.924	15	0.218
4+3法学（指示后）	0.167	15	0.200*	0.918	15	0.178
4+3法学（试验后）	0.168	15	0.200*	0.933	15	0.301
6+0（指示前）	0.170	15	0.200*	0.896	15	0.082
6+0（指示后）	0.191	15	0.147	0.903	15	0.106
6+0（试验后）	0.197	15	0.123	0.904	15	0.111
12+0（指示前）	0.139	15	0.200*	0.941	15	0.400
12+0（指示后）	0.196	15	0.125	0.908	15	0.126
12+0（试验后）	0.217	15	0.056	0.919	15	0.189
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

表3中的两个检验都可以用来检验正态性，我们仅看Shapiro-Wilk test的结果即可。从结果中可以看出，在任意阶段，在5%的显著性水平下，被试者个体的证据证明力分值均具有正态分布的意义。由此我们发现，相关的研究具有统计学意义。

（三）在不同阶段，审判员关于部分证据的证明力分值有显著改变

我们通过数据分析发现，三种陪审团模式在“法官指示前”、“法官指示后”和“实验后”的不同的阶段中，证据证明力排名前五名的均为11-15号证据，此类证据属于“客观证据”。该数据与法官组（71人，含3名不表态者）的数据并无明显差别。可见，普通民众也比较重视“客观证据”的证明力；其与专业法官在事实认定方面的差异也不大。

为了检验不同阶段证据证明力分值的改变，我们用单因素方差分析来检验各个证据证明力的分值在不同阶段是否有显著性差异，被检验的为不同模式下陪审员被试者对证据证明力的分值排名。以ANOVA分析，在p值均小于0.05下（5%的显著性水平），证明力分值有显著改变。其结果如下：

表4：“4+3”模式下证明力分值改变显著的证据

“4+3”非法学80人	不同阶段对比	对比显著的证据	该证据的类型	Sig.
	“法官指示”前后的对比	第8号证据	证人证言	0.02
		第10号证据	被害人人身检查笔录、照片	0.005
		第13号证据	被害人的门诊病历、诊断证明书、检验报告单	0.28
	“法官指示后”与“实验后”的对比	第8号证据	证人证言	0.02
		第11号证据	现场勘验检查笔录、现场照片	0.012
		第13号证据	被害人的门诊病历、诊断证明书、检验报告单	0.001
	“法官指示前”与“试验后”对比	第11号证据	现场勘验检查笔录、现场照片	0.004
	“法官指示前”与“试验后”对比	第12号证据	现场勘验检查提取物品登记表、提取笔录	0.002
“4+3”法学60人	“法官指示”前后的对比	无明显差异
	“法官指示后”与“实验后”的对比	无明显差异
	“法官指示前”与“试验后”对比	无明显差异

不同阶段对比	对比显著的证据	该证据的类型	Sig.
“法官指示”前后的对比	第9号证据	证人证言	0.042
	第10号证据	被害人人身检查笔录、照片	0.002
	第13号证据	被害人的门诊病历、诊断证明书、检验报告单	0.012
“法官指示后”与“实验后”的对比	第11号证据	现场勘验检查笔录、现场照片	0.031
“法官指示前”与“实验后”的对比	第11号证据	现场勘验检查笔录、现场照片	0.019

表5：“6+0”模式下证据证明力的分值改变显著的（20个“6+0”团共120人）

表6：“12+0”模式下证据证明力的分值改变显著的（20个“12+0”团共240人）

不同阶段对比	对比显著的证据	该证据的类型	Sig.
“法官指示”前后的对比	第1号证据	被害人陈述	0.001
	第2号证据	被告人供述	0.003
	第3号证据	证人证言	0.028
	第6号证据	证人证言	0.001
	第8号证据	证人证言	0.002
	第9号证据	证人证言	0.010
	第10号证据	被害人人身检查笔录、照片	0.000
	第11号证据	现场勘验检查笔录、现场照片	0.040
	第13号证据	被害人的门诊病历、诊断证明书、检验报告单	0.000
“法官指示后”与“实验后”的对比	第1号证据	被害人陈述	0.001
	第4号证据	证人证言	0.003
	第7号证据	证人证言	0.028
	第8号证据	证人证言	0.001
	第9号证据	证人证言	0.002
	第10号证据	被害人人身检查笔录、照片	0.010
	第11号证据	现场勘验检查笔录、现场照片	0.000
	第13号证据	被害人的门诊病历、诊断证明书、检验报告单	0.040
“法官指示前”与“实验后”的对比	第2号证据	被告人供述	0.009
	第3号证据	证人证言	0.006
	第6号证据	证人证言	0.021
	第7号证据	证人证言	0.018
	第11号证据	现场勘验检查笔录、现场照片	0.004
	第13号证据	被害人的门诊病历、诊断证明书、检验报告单	0.008

通过相关数据分析，并结合合议过程的讨论，我们可以知道：

1、第10号证据的提升十分明显。在“12+0”和“6+0”的证据证明力排名中，在“法官指示前”排名前五名的均为第11-15号的“客观证据”，而第10号证据（被害人人身检查笔录、照片）的排名较后，只是在“法官指示后”和“实验后”的提升较大。但是，相比之下，在“4+3”模式下（法学和非法学的整体），第10号证据没有这个变化。然而，如果我们将“4+3”模式下的140名被试者分成法学组的60人和非法学组的80人，则在非法学组的80人中，也会出现这个情况。因此，这个问题值得我们重视。

而第10号证据是“被害人人身检查笔录、照片”，其虽有一定的客观性，但更需要进行深入地分析、解读，尤其是需要医学知识上的解读。在实验的讨论过程中，被试者屡屡对受害人的所谓“皮下伤痕”进行分析和辩论。甚至在多个被试陪审团中，有一部分被试者因此做出各种可能动作和姿势的模拟，以求推断“皮下伤痕”的性质，尤其是关于“什么样的行为和招式可能会造成此类位置下的皮下伤痕”。只有在经过充分讨论后，才能更好地对其性质或因果关系进行推定。

2、陪审员越是专业，陪审团规模越小，证据证明力分值在各个阶段中的变化就越小。由表4我们可以得知，在证据证明力分值的对比中，“4+3”的法学60人三个阶段的各个证据均没有显著变化；相比之下，“4+3”的非法学专业被试者80人对证据证明力的认定有所改变。而根据表5可知，“6+0”团三个阶段证据证明力的变化就比较多；而在表6中，“12+0”陪审团三个阶段证据证明力的变化就更多。同时，“12+0”陪审团的人数较多，又全部是非法学人士，而其辩论和表决的轮次也较多（平均4.1次）。由此我们可以猜想，被试者越是专业，陪审团规模越小，证据证明力分值在各个阶段中的变化就越小。而在合议过程中，“12+0”陪审团的讨论比较激烈，因此变化也较大。我们在实验中直观地发现，相比其他陪审模式，“12+0”陪审团讨论的场面往往十分火爆，讨论结束后大家依依不舍，甚至还十分兴奋，离开实验场地后依旧结伴热议案情。[7]

3、“4+3”陪审团中，法学专业的被试者对结果的影响力较大。

在“5：2”的表决规则下，如果我们将最终结果作为因变量，“罪名不成立”时取值为0，“罪名成立”时取值为1；“僵局”时取值介于0~1，不妨设为0.5；将法学与非法学专业的做出“罪名成立”的人数占他们各自总人数的比作为自变量，共得到两个自变量，并将这两个自变量的取值标准化；利用法官指示前与法官指示后的第一轮和第二轮表决的结果进行线性回归分析，我们发现：

（1）在法官指示前，代表法学专业的自变量系数在0.001的显著性水平下是显著的，而代表非法学专业的自变量系数仅在0.01的显著性水平下显著，且法学专业自变量系数为0.09639，大于非法学专业的0.07154。

（2）在法官指示后的第一轮表决中，代表法学专业的自变量系数在小于0.001的显著性水平下是显著的，而代表非法学专业的自变量系数在0.001的显著性水平下显著，且法学专业自变量系数为0.12712，大于非法学专业的0.09495。

（3）在法官指示后的第二轮表决中，代表法学专业的自变量系数在小于0.001的显著性水平下是显著的，而代表非法学专业的自变量系数不显著，且法学专业自变量系数为0.07782，大于非法学专业的0.01016。

综上我们认为，在“4+3”的混合陪审团中，法学专业的被试者对结果的影响力较大。

4、对于非法学被试者（在实际审判中就是非法学专业的陪审员）而言，法官指示和合议过程（包括表决和讨论等）对其案件证据认知有一定影响。从三种模式的“法官指示前”、“法官指示后”和“实验后”三个状态比较分析，我们发现被试者对于案件的证据证明力认知有一定的改变。同时，结合前述的表2的数据，我们可以看出，被试者关于“罪名是否成立”的个体意见，在“法官指示前”、“法官指示后”和“实验后”也存在一定的变化。但在另一方面，也如前所述（表1），在“4+3”陪审团中，法学专业被试者（作为法官）对证据证明力认定在几个阶段却都没有改变。由此可见，对非法学被试者而言，法官指示和合议过程对其事实认定有一定影响。

结合前述陪审团关于“罪名是否成立”的判断结果；我们可以推断：法官指示、合议过程（包括说服、辩论和表决等）对非法学陪审员关于案件的事实认定、证据证明力和最终结果均有一定影响。

四、思考与小结

通过对上述实验数据和合议现场观察的分析，结合中外陪审制的现状、理论和试点情况，我们对陪审模式、事实认定问题以及工作流程进行了分析总结，也收获了若干的结论和思考。

（一）非法学陪审员在陪审方面的热情和能力不低，大陪审制改革很有必要

1、非法学专业人士对参加司法活动十分重视，态度积极认真。绝大多数的陪审员被试者在陪审实验过程中，都意识到陪审制是司法民主和司法监督的一项重要制度，将相关司法实验的认识提高到“推动我国法治进程”的高度，都认真对待实验和审判。如前所述，甚至在多个实验的讨论中，被试者会进行场景模拟，以求真相。被试者说到激动或者情真意切之处，经常有较为激动的语言表达甚至于爆发口角之争。多组陪审团被试者，一直辩论到很晚，以至于最后没有公交系统回去。而在实验之前，有不少报名之后一直没有被安排参加实验的被试者，多次联系实验研究课题组，热切要求尽快参加实验。在实际的调研中也发现，陪审制改革试点法院的那些选民名册抽选的陪审员多数热情较高，工作态度积极认真，非常感人。许多居住在法院所在地几十公里外的陪审员，都会提前数个小时乘车或摩托车前来进行陪审，并在开庭前提前抵达法院，进行案情了解。

由此可见，民心可用。虽然是随机抽取，而且几乎没有报酬或者报酬较低，但是绝大多数人民群众对担任陪审员工作都十分认真。这对于推动我们司法民主，乃至于提升司法公信力和司法公正都具有积极意义。

2、非法学人士在案件事实认定方面的水平不低，其分析能力也不低。在第一部分的实验数据中，经过法官指示、合议之后，“12+0”、“6+0”和“4+3”陪审团的定罪比例也不会高于司法审判人员个人。虽然以陪审员被试者个体的表决比例计，他们在其中一个阶段的定罪比例高于司法审判人员；但是经过法官指示、充分合议之后，以团体审判模式，陪审团的定罪比例也不会高于司法审判人员个人。

案件事实源于日常生活事实，对案件事实的判断基于普通的认知能力。从知识上看，普通人具有一般的认知能力或知识能力；因此，作为普通人而非专业法律人士的陪审员就具有对一般案件事实做出合理判断的能力。学界也有观点认为，法官和人民陪审员由于法律专业知识的差异，虽会导致法律适用方面的差别；但在事实认定方面，陪审员则可以发挥作用。因为，“法庭上的案件事实认定，实际上采用的仍然是人们在社会生活中惯用的经验方法”。[8]著名的政治哲学家托克维尔也指出，虽然法官的法律知识远远高于陪审员，“但是，刑事诉讼要完全以常识容易辨认的单纯事实为依据。在这点上，法官和陪审员是平等的。”[9]

从知识论的角度看，普通民众也具有相当的事实认定能力。当代的知识论建立在康德的认识论和知识论的基础上。在康德看来，人类所谓的“感性”和“知性”能力具有先天性，即存在某些“先天综合知识”。尤其是知性，其能够起到重要的“统觉”作用。在康德的知性理论中归纳了十二种知性的范畴[10]，人类具有这些普遍的认识能力。在知识的事实认定方面，我们可以看到的就是“人为自然界立法”——因为我们人类有这些先验的知识，所以我们能够对相关事务做出合理的判断。这些先天或者先验的知识，从一定意义上看，体现在人类的绝大多数的正常个体的思维中。即只要一个人是正常人，其就会有这些正常的先天的知识；其并不为少数的智者或专业人士所拥有。正常人都会有这些推理能力，“先天原理之所以叫做先天原理，不仅是因为它们包含其他判断的原理于自身，而且也因为它们本身不再以更高且更普遍的知识作为根据。”[11]相关的知识论理论，能够为我们进行研究提供一个理论基础，以证明普通人能够对源于社会生活事实的案件事实做出合理的判断；这一部分并不为法学专业人士所专有。

当然，本实验也发现，在事实认定和证据的证明力方面，法学专业被试者与非法学专业被试者也存在一定的差异。诚如相关学者也指出，“与作为外行人的陪审员不同的是法官头脑中储备的相关法律知识使他们在建构故事的时候更关注那些符合法律要件的要点……与陪审员比起来，法官花费更多的时间来思考每项证据的可信度和证明力大小，并且对于证据间的因果关系的处理更为细致和谨慎。”^[12]但是，笔者相信这些方面的差异并不是主要的，或者说可能并没有起到决定性的作用；是经过法官指示和合议之后可以较好避免的差异。

因此，在案件的事实认定方面，人民群众的理性推理能力并未比法学专业人士低；而且从人民群众中“随机抽取”的陪审员的陪审热情也很高。虽然学界存有关于陪审团“是否能够真正代表民意”的质疑和剖析。[13]但是，笔者认为陪审员还是能够代表一定的司法民主和民意，其在案件事实认定上也具有不低的能力。我国司法体制现有的“大陪审制”改革试点工作很有意义，建议扩大推广面，并深入推进，以建立起适应我国国情的相关陪审制度。

（二）法官指示对陪审员的事实认定产生重要影响

通过实验我们发现，法官指示的内容对陪审员正确认识犯罪的构成、此罪与相似罪名的差别（在民事上则为相关的法律关系和法律要素）、判断事实以及了解证据规则有较为重大的影响。在被试者均为非法学专业的前提下，法官指示可以在很大程度上避免被试者因为缺乏相关法律知识而犯认知上的错误。

陪审员的决策，是对案件的事实认定。其判断的形成过程，不仅要受制于其他的知识体系和心理基础，还要在知识的产生过程中符合法律规定的轨道，符合法律要求的逻辑思维过程。

从认知的视角看，作为普通人的陪审员做出判断和决定不仅受制于理性，也受制于认知定型（也被称为“认知偏差”）。在米塞斯看来，行为与行动之间是存在差别的。“行为”（behavior）是无意识或潜意识的；“行动”（action）则是理性主导下所进行的。[14]人类许多认知过程和行为决策受无意识或者潜意识的影响很大。美国的行为法学派的相关研究，就更多地涉及陪审员的认知定型。而“法官指示”更多地是代表理性的知识，每个罪名、法律关系或者证据规则，均是数以百万计的相关案件或纠纷解决方案的反复博弈结果，通常具有极强的稳定性和普遍性。“法官指示”以相关纠纷解决规则的理性知识结晶，对非法学专业的陪审员进行法律知识指导或协助，使其在先验的知识、无意识或潜意识的认知定型主导下的决策时，部分接受理性知识的统领和引导，从而作出更接近纠纷解决最佳方案的决策。

因此，就日后陪审制的深入改革探索工作而言，建议从法官指示和证据清单的标准化和规范化着手，以开展进一步的调研和探讨。同时建议在实体法律问题、证据规则的提炼以及“无罪推定”原则等重点方面进行更好的提高和探索。

（三）合议的团体决策模式对陪审员事实认定产生重要影响

众所周知，讨论、论辩会影响一个团体的决策意见。前述实验数据和合议过程的观察记录也表明，陪审团在合议过程中的表决、论辩以及说服等活动，会不断地影响陪审员的判断，并进而影响陪审团的最终表决意见。团体决策作为所有变量的集合，并不是简单的相加，而是在自我变化并且侧面相互影响的动态结构。而由于“一致裁决”或者“多数裁决”的表决规则的介入，个体需要在一定程度上配合或者受到其他成员的影响。在这种情况下，群体决策模式可以互相影响，在一定程度上消除个体决策的差别。来自团体决策的不同压力和说服力，会影响一个人的决策选择，从而出现“从众”和“社会感染”等现象。[15]

而在团体决策中，有两类人的影响比较大：

一类是法学专业者。如前所述，在“4+3”实验的测试过程中，我们发现法学专业被试者的意见影响力较大。而表决结果也表明，陪审团中法学专业被试者的判断结果与20个陪审团的表决结果的重合比例非常高。实验表明非法学专业者受到法学专业者的影响较大，而同样的情况也出现在我们观察的司法实践中。

另外，在“12+0”和“6+0”模式的非法学人士中也有一种“意见领袖”。正如在法院调研时所发现的那样，我们在合议过程的观察和记录也发现，每个团都有个别陪审员在庭审过程中发挥重要的引导作用，是“意见领袖”。他们能够鲜明地表达自己的观点，并具有较强的说服能力，从而引导他人接受自己的观点。

当然，团体合议和决策也有风险。例如有学者就指出，“评议之后，陪审员会强烈地感到应该避免误判无辜”，“随着刑罚趋重，陪审员判处被告的可能性会下降”。[16]这在我们的实验中也有所体现。如前所述，我们发现陪审团中力争“罪名不成立”的“意见领袖”往往力推“排除合理怀疑”和“无罪推定”原则来说服他人，也具有相当明显的效果。这就会导致“罪名不成立”的概率增大。

因此，团体决策模式具有一定的科学性，也在一定程度上值得我们反思。在我国今日的陪审制改革试点工作中，对于团体决策中的表决和讨论的流程问题，有必要加强相关的研究和探索创新。

（四）不同陪审模式的比较

在进行本次实验的实证研究之前，由于受到英美法系的影响较大。我们深深地以为只有“12+0”这种陪审模式才是最佳的或者唯一正确的模式；而“6+0”以及法、日等国的“9+3”、“6+3”等模式都不够完整或者不精确。因此，我们对我国进行的各种陪审探索模式，如“4+3”等模式心存怀疑或者淡然处之，也认为此类模式的“精确性”较低。

经过此次实验，在进行了60组以上、500人次以上的实证对比研究后；我们发现，经过法官指示、合议之后，“12+0”、“6+0”和“4+3”陪审团的定罪比例也不会高于司法审判人员个人。而在本案的多数人、多数陪审团组、多数司法裁判人员以及我们请教的多数法学专家均认为案件素材更应该认定为“罪名不成立”。如果我们设定该意见为所谓的“正确的”意见；则我们发现，“三类陪审团的测试结果”并不差于“司法审判人员个人及其随机组合的合议庭的测试结果”。而在这三种陪审团中，“4+3”陪审团的团体表决结果还“好”于“12+0”和“6+0”陪审团，毕竟后两种模式还各出现了一组“罪名成立”的裁决。而“12+0”陪审团甚至还出现一组“僵局陪审团”；相对来说，这不利于提高司法效率。当然，在司法的价值取向中，“公正”是第一位的，其重要性远远高于“效率”。因为司法毕竟是文明解决纠纷的最后一道防线。

仅仅根据本案的素材和本次实验，在与“12+0”和“6+0”的对比中，我们发现“4+3”模式可能是能够同时更好地兼有“司法公正”、“司法效率”和“司法民主”等价值的审判模式。这让我们适当增强了本国司法创新和探索的信心。当然，这还需要其他实验进行进一步的完善和补充。而以不同的视角看，所谓的“无效率”或者“效率低”，反过来也可能是保障“正确性”的必要成本。

另一方面，像“4+3”这种混合的陪审团，也存在一定的局限。例如前述提到的法学专业者在“4+3”模式中的影响力较大的问题，法国的陪审员与法官的混合决策制度也暴露类似的问题。陪审员缺乏法学知识和经验，更由于对法学专业者的尊敬，往往听从于法官的意见。有评论指出，“法国陪审员的作用远不及在英美法系陪审制下的小陪审团有权独立对案件的事实问题做出裁决。在许多情况下陪审员实际上只是起到对法官的陪衬作用”。[17]在本实验中，我们在“4+3”陪审团中也发现，法学专业人士对非法学人士影响较大。这可能是一种好处，但也可能是一种缺陷；还需要进一步的研究和思考。

此外，相关国家的混合陪审（参审）模式也值得我们学习借鉴。法国、日本等大陆法系国家的刑事案件审理，就是“9+3”和“6+3”等混合审判模式。我国的若干试点法院，也进行了相关陪审模式的实践探索。法国陪审团由9名陪审员构成，在上诉审中公民陪审员的人数增加为12 名，法官有3名。在合议过程中，职业法官和陪审员对每一个问题都进行一次投票。在一审程序中，最少需要8 票赞成（8：4）才能确定有罪；在上诉审，最少需要10 票赞成（10：5）；空白票或者无效票应当做有利于被告人的票数计算。一旦确定有罪，则开始对量刑问题进行合议。有关刑罚的决定仅需7 票便可通过。

而日本在2004年制定了《裁判员参加刑事审判的法律》（于2009年开始施行），重新开始实行陪审制（参审制）。[18]日本陪审团由3名职业法官与6名裁判员（陪审员）组成，审理法律规定的重大刑事案件。但在辩方对起诉的事实无异议，案件的情节较为简单的情况下，也可以由裁判员4人与裁判官1人组成合议庭。陪审员与职业法官共同进行案件审理，进行事实认定，并具有量刑的权限。[19]法庭采用单纯多数（过半数）裁决制，需要法官和陪审员各自均有过半数通过才能做出裁决。因此，仅为陪审员的多数意见也不能做出裁决；但此时的决定意见必须由1名以上法官和1名以上裁判员共同赞成。[20]

我们认为，陪审团模式对于刑事案件，尤其是重大刑事案件而言具有启示意义。其既能够保证慎重，也能够维持较高的司法公信力。不同陪审模式有各自的优势，我们可以继续进行各类陪审模式的改革和探索，同时也应该借鉴域外不同的陪审模式（不仅是英美的模式，还有法、日等国的模式）。另外，国内也在进行相关的民事、行政乃至执行等案件的陪审制探索和试点；希望在日后的陪审制实验和实证研究，能够尝试进行各类陪审模式研究。

结语：有待于完善和进一步开展的工作

陪审团决策模型相对比较复杂；因此有学者如此形容：“至少在美国的制度中，陪审团是一个黑箱操作。由于陪审团秘密评议，无法知道陪审团处理了哪些信息，以及他们如何处理审判信息中那些未被错过和忘记的部分”，甚而指责“陪审团甚至不必向着以‘真实’为基础的裁决努力，正如在审判中显露的，因为陪审团并不被要求给出裁决理由，因此，在有关其判决的合理性上不必向任何人负责。”^[21]所以，进行相关陪审团团体的实验比较研究，是一个复杂、长期而艰巨工作。

本文的相关研究是在之前西方众多“模拟陪审员”实验研究模式的基础上的拓展，立足于中立、客观的调研和总结。由于时间关系，也由于被试者、数据数量以及是采用刺激材料而不是真实庭审的听审等局限性，此次实验和观察所得出结论的解释力是受到相关条件的支持且限制的。我们的相关结论有一定的推广解释可能性，但同时也是可以批判和修正的。尤其是作为刺激材料的案件案情和证据材料，作为个案可能也有本身的特殊之处。其所形成的结论还有待于更多案件材料，更多被试者以及更佳的方法改进之后，进行更好地补充、完善、修订和批判。我们也将继续进行相关的实证研究，争取做得更加精确，更加有现实意义。

此外，由于陪审制不仅是一个司法民主问题，其另一个重要基础就是司法公信力问题。本研究由于是陪审制内部的研究，尚未进行外部的观察研究。因此，相关的合法性和公信力还有待于外部调查和观察实证结论。例如在本研究中，“4+3”陪审团与法官个体的判断存在的差异并不大，但如果从一般民众的视角看，两者的公信力就可能存在明显不同，对此可以进行问卷的调研和验证。

同时，虽然“4+3”模式具有一定的数量基础，但其仅仅是作为陪审制改革研究的一个先期的范本，其他试点法院推出的其他各种陪审模式，也可以作为今后进一步实验、分析、比较实证研究的范本。现有工作也仅仅是我们参与中国陪审制改革试点研究的一个起点，也希望学界能够对相关问题进行更多的学理和实证研究。

致谢

在实验的策划和组织进行中，中国政法大学证据科学研究院张保生教授、张中教授、施鹏鹏教授等多名领导和专家进行了相关的理论指导。厦门市海沧区人民法院、龙海市人民法院、威海市环翠区人民法院等陪审制改革试点法院也为本研究提供了支持帮助。厦门大学法学院多名教师支持了本实验，硕士研究生廖丽萍、刘晓清、刘文婷、杨丽青、李雪、许惠茹、郑韵、刘凯、陈子岚（统计系）等二十几名同学作为实验助手做了大量的招募、实验排班、实验现场助手、数据整理等各类协助工作和调研工作。2015年《法律认知与实验》课程的部分本科生作为实验助手，协助进行了三组预实验工作，并提出了若干修改意见。

原文刊载于《学术月刊》2017年第1期，转自微信公众号“法律认知数据与智能”。

文档下载吴旭阳｜陪审团模式之行为实验比较研究