上海交通大学中国法与社会研究院

2024年09月04日【作者】姚洁、孙涛预览：

【作者】姚洁、孙涛

【内容提要】

联合实验方法在法律威慑领域的复制推广——以中国“醉驾入刑”为例

姚洁哈尔滨工业大学（深圳）人文与社会科学学院副教授

孙涛哈尔滨工业大学（深圳）人文与社会科学学院教授

【摘要】制定并执行有效的道路交通安全法是发达国家降低道路交通伤亡的重要手段。在我国，以酒后驾驶为例，自2011年5月“醉驾入刑”以来，政府在立法和执法方面的投入有目共睹，但由于缺乏公开的高质量一手数据，针对该法律效果的科学评估非常有限。本研究以经典法律威慑理论和最新的“差别威慑”概念为框架，通过复制基于情景式调查的联合实验和分层贝叶斯统计模型，来考察不同驾驶人在不同法律环境中的酒驾可能性，推广该方法在法律威慑领域的应用。作为评估酒驾法律威慑的联合实验系列研究之三，本研究在已有针对美国和中国大学生的实验基础上，将类似的实验设计和统计分析复制到中国的一般驾驶人群体中，量化了法律威慑三大要素（即严厉性、确定性和迅速性）对酒驾决策的影响，同时发现驾驶人群体内部具有明显的多样性。本研究证实了联合实验方法在不同国家和类型的驾驶人样本中的有效性，有利于促进“差别威慑”理论的发展和拓展其外部有效性，同时该方法可以推广到评估道路交通安全法规和其他公共政策领域。

【关键词】联合实验；实验复制；分层贝叶斯；差别威慑

一、引言

随着全球机动化和城市化的快速增长，道路交通安全的重要性日益凸显。道路交通事故每年导致全球超过135万人死亡和近5000万人受伤或致残，尤其对于5～29岁人群来说已成为第一致死原因。与发达国家相比，新兴经济体国家中机动车辆剧增和道路安全措施落后之间的矛盾更加明显，导致全球90%的道路交通死亡发生在中低收入国家。面对道路交通伤害给国家经济和家庭造成的沉重负担，世界卫生组织于2010年和2021年接连推出了两次“道路安全行动十年”全球计划（2011-2020，2021-2030），旨在全球推广有效减少道路交通伤害的措施和相关研究。其中，制定并有效执行道路交通安全法，对危险驾驶行为（例如超速、酒后驾驶等）形成威慑，已被众多研究证明是降低道路交通伤亡的重要手段。

以酒后驾驶为例，20世纪八九十年代美国通过了几条相关法律，大量实证研究证明了它们的有效性，即大大降低了道路交通死亡事故中醉酒司机的比例。这些研究成果大多依托于经典的威慑理论框架来解释法律对违法行为的影响，即法律在制定和实施过程中需要产生威慑效应，其效果受到处罚的确定性、严厉性和迅速性的影响。近年来西方资深学者例如Piquero等人又提出了“差别威慑”概念（differential deterrence），即法律对不同对象的威慑作用会有明显差别。尽管威慑理论在国外酒驾法律研究中已有广泛的应用，但现有研究大多采用项目评估（program evaluation）的研究方法，该方法着眼于法律实施的直接后果（例如涉酒交通事故的减少等），但无法考察法律对受众行为的微观威慑过程，即什么样的因素如何影响个人决策，以及如何调整法律制定实施中的细节以提高法律的有效性等。

此外，作为公共管理领域的重要分支学科，行为公共管理学近年来得到迅速发展，随着相关的实验方法兴起，过去五年内国际期刊上发表实验研究的数量显著增长。与公共管理的传统研究方法相比，实验法最大的优势在于它能进行因果推断以保证研究的内部有效性，同时有助于从微观上剖析政府行为过程和公民体验，从而准确提高公共决策的有效性。与此同时，实验的可重复性以及能否推广到实验样本以外的更多群体（即外部有效性）也能检验研究结论是否可靠，因此复制（replication）这种验证和拓展理论的关键方法日益得到关注。总的来说，实验研究在亚太地区目前还处于起步阶段，存有较大理论探索空间；在该地区尤其是中国开展高质量的实验研究和复制，对于整个地区的公共管理研究以及与其他地区的比较研究都具有重要指导意义，有利于推动国际公共管理理论本土化和中国化。

与酒驾相关的道路交通安全立法是近十年来我国政府的工作重点，2011年5月“醉驾入刑”以来获得了社会各界的广泛关注，政府在执法方面的大力投入也有目共睹。该法律的公众认知度高，时效性强，经历了长达十年的时间积累适合用来评估长期效果，同时也能为下一步的政策优化提供及时的参考建议。但遗憾的是，由于国内缺乏公开的一手交通事故数据，很难通过标准的统计方法（如间断时间序列分析等）来评估该法律实施前后的变化。尽管根据公安部的官方报道，在“醉驾入刑”的前三年里与酒精相关的交通事故和死亡人数显著减少，但无法对此做出因果推论，同时基于其他数据来源的调查研究结果也不太一致。此外，鲜有研究考察该法律的具体因素对驾驶人决策和风险感知的威慑作用；从长远来看，是否能进一步确认和保持这项立法的有效性还有待检验。因此，以中国酒驾法律为例，将实验方法应用于法律威慑领域，对已有研究将是重要的补充。

本文将首先综述实验研究方法和以往基于法律威慑理论的实验研究，并介绍本研究复制的原始联合实验和复制要点（第二部分），然后呈现本研究的实验设计、数据收集和分析方法（第三部分），接着对分析结果进行讨论，包括样本特征、联合分析模型、敏感性分析和细分群体比较等（第四部分），最后总结中国普通驾驶人与大学生和美国驾驶人的异同以及差别威慑的存在，阐述该联合实验方法在中美不同情境下的适用性和复制推广的重要性（第五部分）。

二、文献综述

（一）实验研究方法

1.实验类型

根据研究设计的不同，公共管理中的主要实验类型包括实验室实验（lab experiment）、调查实验（survey experiment）和实地实验（field experiment），同时部分学者也指出了自然实验（natural experiment）和准实验（quasi-experiment）的存在，尽管后两种类型与常见实验方法有较明显的不同。基于近五年来国际期刊发表的公共管理实验研究以及近十年来亚太地区的相关论文发表情况，目前应用最多的是调查实验，其研究设计方面具有明显的便利性，同时由于在线调查可及的范围更广，在提高样本代表性方面也更有优势。

2.联合实验方法

作为一种基于联合分析（conjoint analysis）的方法，联合实验（conjoint experiment）可被视为一种特殊的调查实验，能以嵌入问卷的形式大规模收集受访者数据。联合分析是一种系统地将多元素组合起来模拟现实场景，然后通过统计建模来量化各元素作用的研究方法，在市场营销研究中被广泛使用。其特点在于通过实验设计的方法，研究者可以科学地构建由不同产品特征组成的一系列虚拟产品，测试受访者的购买意向，从而预测特定产品的市场反应。应用于公共政策研究领域，联合实验可以通过评估受访者在不同虚拟政策场景中的决策反应，来准确估测每个政策要素对民众行为的独特影响。与公共管理领域的传统调查实验相比，联合实验可以同时考察的因素更多，因而具备模拟整体情境（包括不同竞争场景）的独特优势，能让受访者对多种因素的组合作出判断而不是孤立地评估单个因素。这更接近于现实中的决策过程，获得的实验数据能更明显地区分各因素作用的差异性，包括它们之间的互动关系也更清晰。

联合实验因其在解析民众行为决策和公共政策的有效性、针对性方面的巨大潜力，近年来在公共管理领域日益兴起。在无法通过自然实验或准实验来评估政策效果的情况下（例如缺乏公开的原始官方数据，更没有政策执行前后的数据，无法采用间断时间序列分析等方法），联合实验可以从另一个角度提供具有因果关系的证据；此外作为一种调查实验，它比实地和实验室调查的受访者范围更广。需要注意的是，公共管理领域已有的联合实验研究大多采用传统统计模型从总体上分析实验结果（即基于所有被试的平均值），考虑个体差异的方法较为局限；而在个体特征影响显著的领域（例如法律差别威慑），如果能结合已在市场营销研究中被广泛使用的分层贝叶斯方法（Hierarchical Bayes， HB），将有利于对个体差异进行更准确的统计建模。

（二）基于法律威慑理论的实验研究

1.法律威慑和差别威慑

作为刑事司法和犯罪学领域最具代表性的研究框架之一，经典威慑理论被广泛应用于法律影响违法心理行为的研究中。该理论的三大核心要素为法律刑罚的确定性、严厉性和迅速性，其共同影响法律的实际威慑作用：确定性与可能性有关，指的是违法行为被发现和受到惩罚的风险；严厉性指的是惩罚的强度；迅速性则指的是违法行为被处罚的速度。也就是说，如果不能做到违法必究、处罚必严、惩戒及时，那么仅靠制定某一法律并不能阻止相关行为的发生。需要注意的是，由于威慑效应是一种基于感知的现象，根据经典社会心理学理论，作为个人必须意识到法律惩罚的威胁，他们的行为才会受到影响。

经典威慑理论在过去几十年里得到了大量实证研究的应用，近年来的关键发现之一就是法律惩罚的威胁是否有效与针对人群的具体特征有关，促成了“差别威慑”概念的提出。未来研究应该将关注重点从法律处罚是否能遏制违法，转移到如何提高遏制效果的问题，即在什么条件下以及针对哪些人的惩处才是有效的。应用到酒驾法律领域，尽管国外的酒驾法律总的来说较为有效，但差别威慑也存在于不同国家和地区。差异来源之一是法律环境的不同（即不同执法强度、处罚形式和执行过程的多种组合），同时驾驶人的关键个人特征（如社会背景、道德意识、自我控制能力等）会影响到他们对法律风险的感知，这些感知差异会进而改变处罚风险对不同人群的威慑效应。

2.关于酒驾法律威慑的实验研究

开展实验研究有利于推动与酒驾法律威慑相关的环境与个体差异因素的研究。已有针对酒驾法律效果的研究大多采用项目评估方法，通常只针对单一的法律因素且只能评估现行有限的方案，无法准确量化法律威慑的多种要素在其他要素存在情况下的独特贡献。而实验研究可以通过将目标人群暴露在不同的虚拟法律环境中，观察记录参与者在不同环境下的决策，从而确定以上问题的答案。尽管数量非常有限，曾有研究针对酒驾决策进行过实验室实验，例如Nagin和Pogarsky测试了不同的驾照处罚带来的影响，Jacobs和Piquero则将惩罚规避（低确定性与高确定性）和严厉性（小额度的罚款与1年的监禁）两个因素结合测试了四种虚拟场景的作用。

在已有实验研究的启发下，Yao等学者首次通过联合实验的方法构造了更完整的虚拟酒驾法律环境，通过系统地改变多个因素（如酒驾处罚形式、执法力度和速度等）并分析被试的决策变化，从而量化各因素对酒驾可能性的影响，以及预测不同法律环境中的酒驾发生率。该实验选取了与美国酒驾法律相关的七个主要因素（包括血液酒精含量法定值、执法力度、拘留、罚款、驾照扣留、处罚速度、其他交通方式），通过部分析因设计（blocked fractional factorial design）的方法设计了36种虚拟法律场景，并对121名美国大学生驾驶人在各场景中表达的酒驾可能性进行了分层贝叶斯统计分析，获取了各实验要素对每位被试的独特威慑作用，即个体层面的参数估计（而不是基于平均值的建模）。与以往项目评估研究的结果类似，该实验也发现执法力度（即法律威慑确定性的体现）对潜在酒驾者的影响最大，同时首次证明了联合实验方法在法律威慑领域的可行性，以及采用分层贝叶斯分析对酒驾决策中的个体差异进行建模的优势。

基于以上发现，在中国2011年5月开始实施“醉驾入刑”并增加入狱2～3个月的处罚背景下，同时结合“差别威慑”研究领域的最新进展，Yao等学者将以上联合实验复制到了中国，对109名中国大学生的酒驾决策进行了探索。与原实验相比，新实验的整体设计和分析方法基本不变，但根据中国的实际情况对部分实验要素和内容进行了调整（例如改变了拘留处罚的长度，增加了驾照扣分处罚，以及去除了血液酒精含量法定值等），此外还在统计模型中增加了与差别威慑密切相关的个人特征因素作为控制变量。研究发现了中美大学生驾驶人在风险感知和酒驾决策方面的共同点和差异性，验证了该联合实验在中国情境下的适用性，为开展针对中国普通驾驶人群体的研究打好了基础。

（三）已有联合实验的复制要点

在国内较难获取完整交通事故数据的情况下，本文旨在进一步复制Yao等学者已开展的上述系列联合实验，通过实验方法从另一个角度来科学评估中国“醉驾入刑”十年来对驾驶大众的普遍威慑效应，以拓展法律威慑理论和“差别威慑”概念的外部有效性。在开展任何实验复制之前，需要结合Walker等学者总结的复制关键决策点，以及中国学者指出的在中国复制实验时的特殊情况，确定该研究问题在中国的理论和现实意义，以及实验方法是否能有效解决这个问题；然后评估原实验的情境和设计是否适合中国，最终明确实验复制类型和开展研究。

首先，Yao等学者的两项联合实验针对的是已在发达国家得到证明、对社会影响广泛的重要政策即酒驾法律，研究发现有较大的科学意义，且采取的实验方法对以项目评估为主的已有研究是方法上的重要补充，因而适合进行进一步的复制。

其次，上述系列实验中的原实验来源于美国，而中美两国在历史环境、政治文化、内部机制等方面存在巨大差异，例如亚太文化对集体主义的推崇和对政府权威的遵从倾向，犯罪导致社会污名化更严重的现象等。因此，第二项实验首先选择了中国大学生驾驶人样本进行研究，初步证明了原实验的情境和设计在中国的适用性。需要注意的是，由于历史和经济发展原因，中国大学生持有驾照的比例远低于美国同龄人，而且很多人在大学阶段并没有自己（或父母提供）的私家车，因而驾驶机会和经验欠缺得多。相对而言，美国大学生由于领驾照年龄早和开车锻炼多，更接近一般驾驶人群体的特征，一定程度上可以代表美国驾驶大众（抛开年龄因素的局限）。因此，本文作为该系列联合实验研究的第三项，将把针对中国大学生驾驶人的实验设计和流程复制到中国的普通驾驶人群体中，以更好地比较中美情境下的法律威慑作用。

最后，关于本文的实验复制类型，如下页表1所示，根据原实验和新实验中的目标群体和测量分析方法的情况，实验复制可以分为四种。同时Schmidt认为，从最基本的直接复制到最复杂的泛化延伸，复制研究对推动一般化概念及中层理论构建的贡献逐步提高。本文旨在开展实证泛化类型的实验复制，即将原实验的测量分析应用于新的对象（即普通驾驶人），在选择新的研究对象方面则结合了一致性和差异性的方法。选择对中国普通驾驶人群体进行实验复制，一方面是因为他们在驾驶经验方面更接近美国大学生样本，另一方面从地域上却更接近中国大学生样本，有助于同时比较中美驾驶人以及中国驾驶人内部的风险感知和驾驶决策差异。

（四）本文的研究框架

基于以上复制要点，本文总结了联合实验方法在法律威慑领域复制推广的可行性、可扩性和可比性三个维度，以及本文对应的研究内容和研究方法，具体如图1所示。可行性指的是原实验以被广泛应用的法律威慑和差别威慑作为理论框架，证明了联合实验可以有效地模拟法律环境和量化法律威慑要素；可扩性指的是原实验不受法律类型和地域的限制，体现了该方法在不同国家的酒驾法律领域的灵活拓展；可比性则指的是该系列实验的结果有利于比较不同国家的法律情境和不同类型的驾驶群体，从而为差别威慑提供更多实证依据。

三、研究方法

（一）联合实验设计

本文沿用了针对中国大学生的联合实验中考察的因素和内容，同时增加了两项在美国已实施但国内尚无的车辆处罚，即扣留车辆和酒精锁（alcohol interlock，汽车上的一种外置装备，每次启动车辆时必须吹气，无酒精时车才能启动）。下页表2列出了该联合实验中出现的所有因素，其具体内容参考了国内现行的法律条款以及与原美国实验的可比性：例如国内常见的罚款金额是一千元以上两千元以下，所以在此基础上增加了一定罚款额度来探索效果；而国内“醉驾入刑”以来可长达两个月的劳教处罚在美国并不存在，相对常见的是1～3天的短期拘留，所以在拘留因素里测试了这两种情况。除了与威慑理论三大要素相关的内容，该实验也包含了“其他交通方式”这一因素，以提供更真实的情景模拟。此外下页表2还指出了实验设计中考虑到的特殊限制，以避免出现违反日常经验的组合。

如表2所示，如果将联合实验里所有的具体因素全部组合起来，将会产生1 458种可能的法律环境，但显然不可能让每位受访者评估这么多种情况。与原实验一样，本实验也采用了部分析因设计，即从所有的可能组合中系统地选取一小部分具有代表性的情况，保证每一种因素的各级内容在选取的组合中出现次数尽量相同，并且各因素相互之间不存在相关性（例如“1～2个月的拘留”不能每次都与“集中执法”同时出现等）。基于以上原则，本文通过SAS软件自带的宏（%MktEx）进行了实验设计，该宏对于有特殊限制的复杂设计尤其适用，能自动采取多种方法来不断迭代优化设计效率即D-efficiency，从而产生正交（orthogonal）和平衡（balanced）的实验方案。在因素较少且没有任何限制的情况下，完美的设计可以达到100%的D-efficiency，但一般联合实验中非常少见；总的来说，D-efficiency越高，则参数估计的标准误差越小，实验设计越有效，详细技术细节可参看相关文章。

本文最终构建了一套包含72种虚拟情境的实验方案并被随机分成四组（D-efficiency=81.3%），每组由9对涉及不同酒驾法律因素的场景组成。每位受访者将被随机分配到某一组，对该组中的不同类型的法律环境分别进行成对比较，选出同一对组合中他/她更有可能选择酒驾的情境；每位受访者评估的场景限制在9对是为了避免答题疲劳。以上的实验设计方法保证了所有受访者能评估足够多样化且保持平衡的一系列虚拟环境，不会因为评估的环境不同而误导对被试的偏好估测。图2展示了一个联合实验中出现的虚拟场景的例子。

（二）样本和数据收集

为了获取更多样化的普通驾驶人样本，本文通过商业样本库公司在全国性车主样本库中进行了抽样，该样本库2019年已拥有会员653万人（其中电脑端的样本量达到556万），在涵盖国内驾驶人的样本库领域较为领先。本实验的对象限制在北京和深圳两地常住的驾驶人，并且通过电脑端来参与研究（即排除了智能手机上网用户，以保证联合实验展示信息的效果）。考虑到全国各地的驾驶环境和酒驾法律执行情况存在差异，实验地点选择了深圳是因为之前针对国内大学生的联合实验参与者也是来自深圳，有利于与本文的实验复制结果进行比较；同时增加了北京作为北方城市的代表，则是希望探索与差别威慑相关的地域因素，例如驾驶环境和饮酒文化等。本研究通过在线调查链接最终获取了315名合格驾驶人的有效数据（其中北京168人，深圳147人），他们均18岁以上、有驾照、私家车和饮酒习惯，且非全日制在读大学生。

除了参与联合实验以外，上述受访者还通过问卷的形式回答了一系列关于对当前中国酒驾法律的认知和相关饮酒与驾驶经历等问题，其中基于已有差别威慑的研究提炼出来的问题尤其重要，例如个人的道德约束、自我控制力、对非法律性酒驾处罚的态度和酒驾相关社会准则等。这些问题既能帮助了解受访者的个人情况，更大的作用是作为控制变量放入模型参数估计中，以更加精确地量化不同法律因素的独特威慑作用。此外在样本数量足够的情况下，还可以根据这些变量将驾驶人细分成不同群体，比较他们的酒驾决策过程，从而更好地验证差别威慑。

（三）数据分析方法

1.统计建模

在公共管理领域以往的联合实验研究中，大多采用传统的回归分析建立集计模型（aggregate model），估测不同实验因素对因变量的影响，产生一套针对所有受访者的参数估计和显著值。因此，本研究首先采用了双层混合logit模型从总体上分析实验数据；双层指的是影响因变量的两个来源，即参与者的个人特征（如人口统计学背景和过往行为等），以及实验中呈现的因素内容。从混合logit模型获取的各个参数估计也被称为“部分价值”，因为如果对给定情景中呈现的每个因素内容的估计值求和，则可以计算该情景的整体效用，并且可以预测在这些情况下结果的可能性（即本研究关心的酒驾行为）。

然而，以上传统集计模型存在一定局限，在估测“部分价值”时对偏好迥异的不同人的选择数据一视同仁；举个极端的例子就是，如果一半被试非常喜欢因素A，另一半非常讨厌因素A，那么放在一起分析得出的平均结果就是A没有任何作用，这显然不是正确的结论。类似这样的偏差可以通过分层贝叶斯（HB）方法来改善，在之前两项联合实验中都得到了很好的应用。

2.HB分析

作为一种贝叶斯模型，HB的逻辑不是基于研究假设来推算已有数据来自特定分布（即参数固定）的概率，而是将各个统计参数视为随个体而变化的随机变量，反过来基于已有数据和迭代计算来估测这些变量的实际分布，从而获取每位参与者对不同因素的偏好。HB的核心优势在于将每个被试与其他被试之间的偏好区别程度考虑进了模型，通过“借用”其他人的信息来提供对每个参与者的参数估计，能更清晰地体现因素偏好差异。与集计模型相比，HB方法确定的是每个受访者的偏好，而不是所有受访者的平均偏好；基于个体而不是平均值的建模，可以更有效地将真正的变量作用与数据干扰区分开来，无论是从个人层面还是总体层面来看都能产生更加稳定和准确的模型。因为篇幅原因，关于HB的相关数学细节和技术步骤可以参看相关文献。

因此，本研究首先通过SAS软件完成了混合logit集计模型，然后采用专业的Sawtooth软件对酒驾法律场景中的所有因素内容进行了HB分析，获得了该实验中每位参与者的个体参数估计，并对这些个体参数估计求平均值，与集计模型进行比较。但遗憾的是，对于这些联合分析获得的部分价值估计，我们不能通过参数大小来确定哪些因素的作用最为明显，因为建模过程中对每个因素不同的缩放处理导致各因素之间没有直接可比性。因此，下一步必须借助模拟器工具，通过敏感性分析的方法来确定每个因素对于选择结果的相对重要性。

3.敏感性分析

敏感性分析是在市场营销研究中针对联合实验数据常用的方法，主要目的在于通过每次改变一个属性的水平，同时将所有其他属性保持在基准水平不变，然后观察能在多大程度上改善或降低产品的总体偏好，确定每个属性的相对重要性。在本研究中，敏感性分析则可以帮助确定酒驾法律环境的哪些因素对于驾驶决策产生的威慑效应最强（无论是正面的还是负面的）。本文开发了一套基于Excel的模拟器工具，模拟器后端是来自HB模型的所有参数估计，前端则是由来自联合实验的各种因素组成的虚拟场景，可以根据需要自由改变各因素的内容来产生不同的场景，然后经过后端的统计方程计算，得出每种新场景下的预期酒驾率。也就是说，研究者可以在模拟器中随时改变驾驶人面临的环境特征（例如集中执法、没有拘留处罚、但有严厉的罚款及吊销执照等），然后查看酒驾可能性在不同法律环境下的即时变化。将这些变化记录下来并进行比较，就可以确定哪些因素和内容对酒驾决策的影响最大，从而评估所有因素的相对重要性，这就是敏感性分析的核心目的。

图3显示了本研究开发的一个模拟器工具的截图，左边是基准政策，右边是可供更新的情境。在基准情境中，执法力度保持在常规水平，即没有拘留处罚，罚款为1000～1999元，驾照扣留6个月，无驾照扣分和车辆处罚，同时其他交通方式为日益常见的代驾。这种情况与当前的法律环境较为吻合，有利于通过新的情景模拟来发现政策改变可能产生的影响。如前所述，通过在模拟器后端使用每位参与者的HB参数估计值，计算出给定情境下的个体酒驾可能性然后进行平均，就能对样本整体的酒驾率进行预测。如图3所示，基准情境和新的情境完全一样，因此当前两种情况的比例完全一样都是50%。然后通过在新的情境中每次更改一个因素的内容（保持所有其他因素不变），记录下每个因素内容对预测的酒驾可能性的影响。需要注意的是，在测试了给定因素的所有内容之后，在测试另一个因素之前，该因素要被调整回到它在基准情境中的水平。这样重复整个过程，直到所有因素和内容都被测试完毕。举个例子，当在新的情境中将拘留处罚的程度从没有处罚改成1～3天的拘留，酒驾可能性就从之前的50%变化为X%，将它们之间的绝对差异记录下来，通过比较这些绝对差异，就可以判断哪个因素能对酒驾决策产生最大的影响（即它的内容改变时能引起最大的变化）；也就是说，每个因素的相对重要性是由它们的内容引起的最大变化（绝对数）决定的。

四、数据结果与研究发现

（一）个人背景特征

本研究调查的普通驾驶人一共315人，他们的平均年龄34岁，其中最小18岁，最大63岁，性别分布方面也符合预期，男性多于女性（62% vs.38%）。我们对四组受访者的性别、年龄组别、收入等人口学特征进行了卡方分析，发现各组之间并无显著差异，确定了各组随机分配的平衡性。另外，该群体的偶尔酗酒现象较为普遍，即70%的人承认去年曾有过两小时之内饮酒5杯（男性）/4杯（女性）以上的情况，而承认自己有重度饮酒行为的比例13%也高于大学生样本，尽管还是低于美国大学生所报告的32%。

遗憾的是由于样本库对敏感问题的严格规定，参与本研究的驾驶人没有被直接问到自身的过往酒驾行为，所以无从了解他们是否曾饮酒两小时之内开过车或喝多了以后开车。但是他们之中85%的人承认曾被交警拦车检测过，这一远远高于中国大学生报告的比例，应该更真实地反映了国内的酒驾执法环境，因为非学生驾驶人才是日常道路上的主要驾驶人群，参与者每个月平均开车21天，因而接触交警执法的可能性更接近现实。同时，这样的高比例与他们对现有酒驾执法的认知也是一致的，66%的人感觉到他们所在城市的酒驾相关执法非常严。另外，在他们认识的人中间，酒驾行为的比例则与大学生了解的情况比较接近，比如67%的受访者知道有人曾经在饮酒两小时之内开过车，50%的受访者知道有人曾喝多了以后开车等，但他们认识的人曾被处罚过的比例更高（66%vs.41%），说明他们接触的驾驶人群体与大学生比起来涵盖面会更广。这些数据表明，尽管国内近年来的酒驾执法可能比美国更加严格，但酒驾行为在国内普通大众中依然较为常见，需要进一步提高相关法律的威慑效应。

针对国内现有的酒驾处罚措施三大类（即拘留、罚款、驾照扣留），普通驾驶人与大学生的认知较为接近，基本上都认为如果酒驾被抓就无法避免这三类处罚。尤其是在拘留惩处方面，37%的受访者认为4～10天拘留时间很常见，50%的人甚至认为达到了10天～1个月，再次印证了国内近年来对“醉驾入刑”以及坐牢处罚的相关宣传的普遍性和有效性。需要注意的是，正因为受访者对酒驾处罚的普遍认知，因此联合实验中采取的是让受访者对成对场景进行比较（即必须选出一个更有威慑效应的场景），而不是对单一场景进行评估，以避免他们的已有风险认知对选择的影响。

关于差别威慑研究中提到的几项重要个体特征因素，如表3所示，普通驾驶人与大学生一样，绝大多数都同意酒驾是一种违反道德的行为，对于非法律性的酒驾处罚即来自家人或朋友的批评也都表示担心，体现了国内的文化环境在这一问题上的统一影响。同时他们接触的聚餐场合的社会准则也较为类似，27%的人表示会碰到劝酒的情况，但基本上劝酒者都会建议其他的交通方式。不同的是，由于普通驾驶人在年龄和经历方面体现的成熟程度，与20多岁的大学生相比，平均年龄34岁的他们自我控制能力明显远远高于前者，只有不到1/4的人承认自己做决定时通常从直觉出发。

（二）联合分析的参数估计

在进行联合分析的建模过程中，表3中的所有个人特征加上人口统计变量都作为控制变量被一一测试，最终模型中只保留了具有统计学意义的显著变量（见表4）。与大学生驾驶人一样，对他人酒驾行为的了解会显著影响自身的酒驾可能性，比如承认“认识的人曾饮酒两小时之内开车”的受访者比其他人更容易酒驾（p<0.05），承认“认识的人曾喝多了以后开车”甚至倾向性更强（p<0.0001）。得益于本研究的更大样本量，我们同时发现了几项对大学生作用不明显、但显著影响普通驾驶人的个性特征，例如自我控制能力较弱的人更有可能不经过慎重思考而选择酒驾这种违法行为，尤其是在不良的社会准则影响下（比如有人劝酒）。同时有过酗酒行为的人也更容易酒驾（p<0.05），有可能是因为开车参加社交场合饮酒更为频繁。另外，有些个人因素则起到了保护作用，比如那些敬畏执法、感觉酒驾执法非常严的人，或者在道德上谴责酒驾行为的人，他们选择酒驾的可能性就显著低于其他人。

表4列出了以上控制变量在集计模型中的参数估计，更重要的是详细呈现了对联合实验中所有要素的分析结果，包括来自集计模型的参数估计及对应的p值，和HB模型中个人层面参数估计的平均值。在集计模型中，执法力度、拘留处罚和驾照扣留对酒驾行为的威慑效应最强，但各要素必须达到最高程度才会显著，包括最大的执法力度（即交警打击酒驾专项行动，必经酒精吹气测试点）、1～2个月的拘留处罚以及吊销驾照（5年不得重新申请）。而其他因素如罚款、车辆处罚和可选择的其他交通方式，对他们酒驾可能性的影响则不那么明显。来自HB模型的参数估计与以上结果在方向上一致，但后续的敏感性分析发现即使中等强度的处罚也可以达到不错的威慑效果（详见下文），同时HB对驾照扣分处罚的作用估值要远高于集计模型（即驾照扣12分能威慑到酒驾行为），更加符合研究预期。与原实验一样，以下的敏感性分析也采用的是HB参数估值，因为HB模型已被证明具备更高的预测未来行为的准确度，尤其在受访者存在较大个体差异的情况下，而且有利于发掘各属性之间的交互效应。

（三）敏感性分析结果

如图3所示，每一次要素内容的改变会给预测的酒驾可能性带来影响，比如当执法力度从常规执法改成高强度的执法，新的情境下酒驾可能性会从50%降到15%，这两个数字之间的绝对差35%就体现了该项改变引起的效果。将该步骤重复实施在不同要素和内容方面，所有获取的数值差异都被记录下来并呈现在下页图4中。除了与大学生驾驶人结果类似的地方，图4清晰地表明，新增加的车辆处罚一项几乎没有起到威慑作用，尤其是目前在美国得到广泛应用且效果明显的安装酒精锁政策并没有得到中国驾驶大众的认可。作为一种新型处罚手段，如何介绍推广该政策，帮助大众更好地理解相关后果，并根据国内的实际情况进行调整，值得未来更多深入的研究。

基于图4的结果，进一步确定了每个要素相对于其他要素的重要性，衡量标准是先选出每个要素能产生的最大影响（即不考虑方向的绝对值），然后进行要素之间的比较。例如，在所有要素中拘留处罚被证明对驾驶大众具有最强的威慑效应，因为实施最严重的拘留（即1～2个月）导致了受访者报告的酒驾可能性达到了最大程度的变化（即39%的下降）；紧随其后的是执法力度和驾照扣留，因为交警打击酒驾专项行动和吊销驾照这两项措施会分别带来35%和34%的酒驾可能性降低。值得注意的是，与大学生驾驶人相比，驾照扣分处罚对普通驾驶大众的威慑效应要明显得多，扣12分会使得参与者选择酒驾的比例大大减少（即29%）。如图5所示，以上各项改变值被调整使其相加等于百分之百，然后从大到小排列，以体现各要素的相对重要性。排在前四位的要素（即拘留处罚、执法力度、驾照扣留和扣分）起到最关键的作用，对于酒驾的威慑效应占据了全部效应的86%以上。与此相反，其他交通方式和车辆处罚则对驾驶决策影响甚微。

以上结果也体现了法律威慑三大核心要素的重要性，即处罚的严厉性、确定性和迅速性，分别对应图5排在前三位的拘留、执法力度和驾照扣留。选择由是否会被交警抓获来衡量处罚的确定性有以下原因：交警的执法力度越强，从客观上说发现酒驾的确定性越大；同时该因素也能影响到受访者的主观风险感知。根据对实验数据的进一步分析，当执法力度从常规执法上升到中等乃至专项执法时，受访者对被交警抓住可能性的估测明显上升（平均值分别为47%、59%和67%），回归模型也证明了执法力度显著提高了受访者主观评估的被抓确定性（p<0.05），说明该因素能有效地衡量法律处罚的确定性。另一个有趣的发现是，美国驾驶人对最强执法力度的风险评估值非常接近本实验结果（即69%），但针对常规执法和中等执法要低得多（分别为24%和48%），从另一个角度体现了近十年来中国政府在酒驾执法方面的大力投入对驾驶大众整体风险感知的有效影响。

（四）差别威慑结果

由于HB模型提供了每位受访者的个体参数估计，可以将不同人的参数应用于群体分析，因此本研究也对不同的驾驶群体进行了比较，验证差别威慑的存在。需要注意的是，该分析要求每组至少有80～100人，样本数量过小无法获得可靠结论，所以以下仅列出了有足够样本支持且差异明显的几个因素。

1.地域因素

深圳和北京作为本研究中一南一北的两个城市，在人口构成、城市文化、驾驶环境、酒驾执法等方面都具有一定差异，酒驾法律的威慑表现也有所不同。在各要素的重要性排序方面，尽管拘留处罚对两地的威慑作用都是排在第一位的，但北京驾驶人对拘留和执法力度的担忧程度几乎没有任何差别（22.6%vs.22.5%），而拘留对深圳驾驶人的影响却比执法力度更加明显（24.9%vs.19.7%），而且执法力度的重要性要低于驾照扣留而排在第三位。比起深圳对处罚类型的更高敏感度，北京更在意被处罚的确定性，即执法力度的提高最能遏制他们的酒驾行为。

2.个人特征因素

（1）对他人酒驾行为的了解

基于问题“你是否听说过有认识的人曾喝完酒两小时之内开车”，之前的集计模型已表明，回答“是”的人（N=212）更有可能选择酒驾（不管法律惩罚如何）。通过群体分析发现，了解他人酒驾行为的受访者对酒驾相关的法律因素也更加敏感，例如执法力度无论是中等还是高等，对该群体的威慑效应都比其他群体高得多；尤其是当常规执法变为交警流动巡查时，该群体的酒驾可能性降低了30.2%（而其他群体只减少了19.7%）。

（2）自我控制力

基于不同人做决定的风格（即“当你做各种决定的时候，你通常相信自己的直觉，而不会反复考虑权衡各种情况的后果”），本文将驾驶人分为冲动型和非冲动型。之前的集计模型发现，越容易冲动的人（N=130）越有可能选择酒驾。而群体分析表明，酒驾相关的法律处罚对他们的威慑效应也要全面低于非冲动型驾驶人，尤其是各处罚内部不同措施之间的差别明显不如非冲动型。比如在驾照扣留方面，扣留时间长短对冲动型驾驶人的酒驾决策影响较小（可能性变化为28.8%vs.26.8%），也就是说吊销驾照（5年不得重新申请）比起6个月的扣留措施，影响差别仅有2%。这表明冲动型的酒驾决定可能更加依赖直觉而不是理智权衡不同风险，他们不愿意花时间认真评估处罚风险和后果，所以提高处罚的严厉性对冲动型驾驶人的威慑没有对非冲动型那么有效。

（3）过往酗酒经历

对于一年内未曾有过酗酒行为的人来说（N=94），中等程度的处罚已经足够有威慑效应，而更容易酗酒的人则需要更严厉的处罚，例如拘留长度从1～3天提高到1～2个月时，其敏感性从31.6%变为40.7%。此外，驾驶人的过往饮酒行为也影响到了他们对其他交通方式的偏好，有过酗酒行为的人可能在外饮酒应酬的频率更高，因而对代驾这种花钱但快捷方便的方式接受度更高；而饮酒有限的驾驶人更多依赖于花钱少的地铁和公交手段，从另一个侧面也反映了两个群体不同的生活重点和方式。

五、结论与讨论

本研究作为联合实验应用于法律威慑领域的系列研究之三，将原实验的设计流程和分析方法复制于新的驾驶群体，即来自中国一南一北两个主要城市的普通驾驶人，再次验证了法律威慑和差别威慑理论，并比较了中美两国在酒驾决策与法律环境方面的差异。以往的酒驾法律评估中较少考虑到驾驶人的风险感知，而有限的实验研究绝大多数只针对大学生驾驶人而不具备完全代表性。一方面，本研究在样本上的优势使得实验结果可以推广到对中国普通驾驶人的未来行为预测上；另一方面也可以与几项数据较老的普通美国驾驶人研究进行比较。

（一）中国普通驾驶人和大学生驾驶人的比较

基于经典的法律威慑理论，法律刑罚的确定性、严厉性和迅速性对中国大学生和普通驾驶人均有显著影响，分别体现在执法力度、拘留和驾照扣留三方面。执法力度体现了法律刑罚的确定性，即力度越大则被捕受罚的可能性越大；拘留体现了法律刑罚的严厉性，尤其是1～2个月的监禁对于任何人来说都是后果严重的巨大惩罚；驾照扣留则不受司法程序的快慢限制可以马上执行，从而体现了法律刑罚的迅速性。然而在对以上这三个要素的排序上，普通驾驶人却因为个人背景和驾驶经验的影响与大学生的侧重点不同。对于大学生驾驶人来说，处罚的确定性高于严厉性和迅速性，他们最为畏惧的是被交警抓到的可能性，可能性越大则越不可能选择酒驾。而普通驾驶民众对媒体广为宣传的拘留这一严厉处罚表示出了最大的担忧，因为丧失1～2个月的自由、留下犯罪记录及相关后果（例如公职人员可被开除等）对他们的威慑效应无疑是巨大的，哪怕不一定会被交警发现，他们依然不敢心存侥幸。以上结果与Sloan等学者发现的拘留时长能显著降低酒驾可能性的结果一致，后者是基于十多年前的大规模问卷数据，而本研究通过联合实验方法证实了拘留处罚对普通驾驶人的强大威慑效应。该威慑作用的根本原因可能在于，普通驾驶人比起学生来说拥有更多的社会性资源（包括工作、婚姻、人际关系等），一旦失去这些资源，对他们的生活影响更严重，违法成本更高，所以他们对相关的具体惩罚措施更加敏感，在决策过程中估算相关的成本收益也就更为慎重。

除了拘留处罚，普通驾驶人对于驾照相关的处罚也更加重视，包括驾照扣留和扣分。与开车较少、意识不到短期失去驾照的影响的大学生明显不同的是，即使是6个月的驾照扣留也能给普通驾驶人带来巨大的威慑效应，因为每个月平均开车21天的他们对于失去驾照的后果感受强烈，无证驾驶哪怕只是6个月也存在较大风险，就更不用说被吊销驾照五年内不能申请了。同理，驾照扣分也与驾照的作用密切相关，扣12分的后果相当于暂时扣留驾照，必须去交管部门参加培训和理论考试才能取回，这对普通驾驶人来说也是巨大的时间和精力投入，与生活不太依赖驾照的大学生比起来，后果显然要严重得多。

（二）中美驾驶人的比较

如前所述，美国大学生由于领驾照年龄早和驾驶经历丰富，与普通驾驶群体的特征更为接近（抛开年龄因素的局限），一定程度上可以代表美国驾驶大众，因此本研究与原实验针对的美国大学生驾驶人也进行了比较。对美国驾驶人而言，执法力度的威慑作用高于拘留处罚，这可能与美国对酒驾行为一般不采取拘留措施的司法现实有关，也就是说该实验衡量的是美国驾驶人对假想拘留处罚的评估。从文化背景的层面来看，在中国集体主义的环境中，一旦有了犯罪记录将会引起更强烈的社会污名化，这也是东亚文化的共同点，而严厉的拘留处罚更容易加剧这种污名。另外，与中国普通驾驶人相同，驾照扣留对美国大学生的威慑效应非常明显，而且时长没有差别，只要扣留就有用，这可能与美国大学生开车频繁以及驾照扣留后较少无证上路有关。

此外，在可选的其他交通方式方面，由于美国没有商业代驾的形式，原实验评估的是对朋友代驾和公共交通方式的偏好，发现美国驾驶人更在意成本高低，而中国驾驶人无论是大学生还是普通人都更偏向于便利性（即选择更贵但更快捷方便的代驾服务）。该结果从另一个角度表明了商业代驾在中国对降低酒驾发生率的积极作用，与其相关的中美商业和文化环境的不同（例如代驾场景、大众的接受度和使用动机等）也值得进一步探讨。

（三）差别威慑的存在

除了中美之间的差异，本研究也发现了普通驾驶人群体内部比大学生存在更明显的多样性，从而导致同样的法律环境对不同人的威慑效果迥异。尽管由于样本数量的限制，本研究只对几个群体进行了单独的分析，但结果证明了对驾驶群体进行细分的重要性，即确定具备哪些特征的驾驶人群以及在什么条件下，法律惩处能够更有效地阻止潜在违法行为的发生。比如拘留处罚的时长产生的心理威慑效应在北京和深圳两地迥异：拘留处罚越严格，对深圳驾驶大众的影响会越大，而在北京1～3天的拘留处罚就足够有威慑作用。在个人特征方面，各项法律处罚手段对冲动型驾驶人的作用要低于非冲动型，曾有过酗酒行为的人对处罚的严厉程度提高更加敏感等。从智慧交通和城市治理的角度来看，如果能在这些差异化的结果基础上，进一步捕捉并影响公众对执法力度和惩罚力度的感知和权衡，例如加大处罚还是提高被逮住的概率，哪种策略更有效以及对谁而言等，将有助于对相关政策进行更合理的优化，促进执法效果的提高。

如Walkers等学者所述，实验复制很多时候无法完全重现原实验结果，也会从新的情境中获得新发现。本复制研究再次证明了联合实验在法律威慑领域的适用性，同时发现了中美驾驶人的众多区别和中国驾驶人内部的个体差异，为“差别威慑”在道路交通安全领域的发展应用提供了最新的中国证据。受益于分层贝叶斯方法和相关的政策模拟器，本研究为预测不同群体的违法发生率和实施宣传有针对性的法律法规提供了重要工具。类似的工具不仅能模拟不同政策场景的实施效果和确定各因素的相对重要性，还能帮助发掘作用最为明显的最优政策组合；尽管后者不是本研究的重点，研究者可以将该工具的优势拓展到未来相关研究中。此外由于样本地域的局限，本研究结果不一定能代表中国二、三线城市的酒驾法律环境和驾驶人风险感知，因此需要将类似的实验方法应用到基于不同地域/城市/社区的比较评估中。总的来说，结合分层贝叶斯模型的联合实验方法有助于进一步提高酒驾法律的有效性，同时还可以推广到道路交通安全法规和其他公共政策领域，为提高中国的公共管理研究质量作出更多贡献。

文档下载姚洁、孙涛：联合实验方法在法律威慑领域的复制推广——以中国“醉驾入刑”为例