上海交通大学中国法与社会研究院

2021年05月12日【作者】王鹏翔、张永健预览：

【作者】王鹏翔、张永健

【内容提要】

王鹏翔*、张永健**

* 中央研究院法律學研究所助研究員，德國基爾大學法學博士。philaw@sinica.edu.tw

** 中央研究院法律學研究所副研究員暨法實證研究資料中心副執行長，美國紐約大學(N.Y.U.)法學博士。kleiber@sinica.edu.tw

作者順序依姓氏筆畫排列，不代表貢獻程度有別。

摘要

法学（法释义学）一般认为是规范之学，故关注经验面向的法实证研究常受「非法学范畴」之讥。但规范论证是否可以完全抽离经验陈述，以及法学范畴是否如此狭隘，则有再检讨之必要。本文梳理法学与实证研究的本质，主张两者在至少两个层面上相辅相成：法律的规范论证往往必须援引经验事实（例如某法律手段是否有助于实现某法律目的或带来某种结果）作为理由，而设计良好的实证研究能够藉由因果推论，发现具有规范重要性的差异制造事实。法释义学有经验面向，认识与描述有效的法律，亦属法学范畴；而实证研究采用的社会科学方法，能拓展认识与描述法律之方式。本文将法实证研究分为三类：第一类检验「差异制造事实」是否存在，其发现可以直接作为支持或反对规范主张的理由。第二类检验法律的实效性，并刻画制定、适用法律之制度性行为。第三类则是以实证方法来描述法律论证。

关键词

法实证研究、法释义学、差异制造事实、因果推论、实效、制度性行为、描述性的法律论证理论

壹、前言

从事法实证研究的学者，尤其采量化方法（quantitative methods）者，常遇见之质疑是：法学研究所要解决的是「应然」层面的规范问题，实证研究处理的则是「实然」层面的经验事实问题，从实然如何能导出应然？法实证研究如何有助于解决法学问题？本文将尝试回答此大哉问。

首先要说明的是，所谓「实证研究」（empirical study/research/analysis），系指有系统地观察、搜集经验事实，并透过一定的方法对于搜集到的信息进行分析、推论，以回答研究者所欲讨的问题。作为研究素材的经验信息，可以透过实验、观察、访问、调查、爬梳档案与文件等方式来获得，而后予以分析；研究者可以提出假设，或以既有理论尝试预测答案，最后以统计方法分析数据，以检验假设成立与否或探究理论预测之精确性。「实证方法」（empirical methods）则是系统性搜集、描述、分析数据（data）的技巧──数据是与世界相关的客观信息，它们可以透过代数运算操作，或比较其绝对或相对值的大小。这些技巧包含了编码、运算、统计、分类集合、过程追踪（process tracing）、模式匹配（matching of patterns）等方法。实证研究关注大范围、总体（aggregate）现象，而非个案，此与具有优良传统的「案例评释」，有不同关怀。

所谓「法实证研究」，其研究的对象素材乃是法律制度、法律体系、司法行为以及其他法律现象。法实证研究所采用的方法，虽然迥异于传统的法学研究方法（例如法律解释或案例评释之方法），但这并不表示法实证研究与法学所关切的主题完全无关。本文的主要目的，正是要指出经验面向的规范意义，以响应前述质疑。

本文首先将尝试正面界定「法学」的概念，然后指出，虽然法学以解决规范问题为主要任务，但法学除了规范面向之外，也具有经验面向，而法实证研究可视为法学经验面向的重要一环，并且法实证研究的成果有助于解决法学所关心的规范问题。毋需否认，法学的主要工作──不论是对现行有效法的解释，或是提出修改、制定法律的建议──是规范导向，但经验事实的运用，在论证法学的规范命题时仍扮演了关键角色，而法实证研究正是发现法学相关经验事实的重要方式之一。更确切地说，不论在解释论或立法论的层面，实证研究成果都可能提供法律制度选择与采取特定法律解释的理由。因此，所谓「法学方法」不应过分局限于传统的法律解释方法。在这样的基础之上，本文也将举出一些实证研究的成果作为左证。

本文结构与核心论点如下：为使读者很快掌握本文核心论点，第贰部份以法律论证中广泛使用的比例原则为例，简要说明经验事实在规范论证中的角色。

第参部分第一节先厘清法释义学的主要任务，主张认识、解释、体系化现行法，以及立法论，都属于狭义法学之范畴。换言之，法释义学不仅是分析与描述性的，更有提出规范主张之任务。接着，第参部分第二节说明法学的经验面向包括两个层面：认识及描述有效的法律，以及在法律论证中运用经验事实的陈述。前者又可细分为（1）「描述性的法律论证理论」，例如过去十年来最高法院如何解释某个刑法条文构成要件；以及（2）「制度性行为研究」，例如法官的性别或经验是否影响慰抚金之酌定数额。关于后者，本文指出，在法律论证中运用经验事实的陈述，则是法学规范面向与经验面向最直接的交会点。第参部分第三节指出法实证研究（作为其中一种研究法学经验面向的取径）与前述两种层面的法学经验面向之关连。

第肆部分是本文核心贡献所在，是赶时间的读者也不应跳过的章节。第肆部分集中论述第二个层面的法学经验面向，即经验事实如何有助于规范论证。第一节提出「差异制造事实」的概念，指出可作为规范理由的经验事实乃是差异制造事实（可理解为因果事实）。第二节以法学规范论证中常见之目的论证与结果论证为例，说明两者的前提均包括差异制造事实，此即法学经验面向的清楚展示。第三节说明，量化之法实证研究透过各种统计方法以求作出因果推论。为便于不熟悉统计的法学读者理解本文论点，第三节以浅白方式综述多种法实证研究方法。第肆部分的关键论题，就是法实证研究能透过因果推论发现差异制造事实；而差异制造事实是法学规范论证不可或缺的环节；从而，法实证研究有助于法学规范论证。

第伍部份奠基于以上论述，将法实证研究分为三类：第一类检验「差异制造事实」是否存在，其发现可以直接作为支持或反对规范主张的理由。第二类检验法律的实效性，并刻画制定、适用法律之制度性行为。第三类则是以实证方法来描述法律论证。本文论述对多数法实证研究工作者，甚至许多一般读者，或许十分抽象，因此第伍部份综述过去十年来台湾许多法实证研究成果为例，作为印证。

貳、经验事实在规范论证中的角色──以比例原则为例

法律人经常运用比例原则来论证规范命题，例如国家得否采取特定的立法措施来限制人民的基本权利。当司法违宪审查套用比例原则中的「适当性原则」，以审查某个立法措施是否适合达成目的时，所谓「适当性」显然是可验证的事实。例如禁止药商广告处方药品，是否有助于防止一般人胡乱服药（司法院释字第414号解释之争点之一）。

「必要性原则」所谈的最「小」侵害手段，是相对于「较大」的侵害手段，而比较侵害程度之大小，也需仰赖经验面向的事实才能判断。例如要求烟商于烟品容器上标示尼古丁及焦油含量，比起完全禁止贩卖香烟，对烟商之财产权侵害较小（参见司法院释字第577号解释）。

「衡平性原则」（狭义比例原则）则在衡量目的与手段间的利弊得失，亦即立法目的之重要性是否足以正当化其对于基本权的侵害。若对某一基本权的侵害程度越高，则干预措施所追求目的之重要性也要随之越高。不仅基本权受侵害的程度高低涉及经验信息，目的之重要性亦同；因为，之所以必须进行衡量，乃是由于两者无法同时获得完整实现，实现其一须以牺牲另一为代价。因此，目的之重要性高低取决于，倘若不采取干预措施的话，它将会受到多大程度的负面影响（其不被实现的程度高低）。评估此种负面影响的程度高低，显然也需要仰赖经验事实的认定与判断。例如，司法院释字第603号解释认为，强制录存个人指纹资料，虽然足以达到「辨识迷失民众、路倒病患、失智老人及无名尸体」之目的，但此种需要辨识身分的特殊个案甚少。即便不采取强制录存指纹的立法措施，也不会对于辨识身分之目的造成重大损害（这是个经验判断）；因此，实现此目的之重要性程度并不高。但若强制录存指纹，则个人信息外泄风险极大（这也是个经验预测），可能斫伤隐私。两相权衡之后，大法官认为强制录存指纹的规定「损益失衡，手段过当，不符比例原则」，从而认定立法者不得采取此项措施。

从上面的简要论述可以看出，比例原则之操作──不论是适当性、必要性或衡平性的判断──都必须有经验面向的分析。然而，若没有清楚认识到规范论证中必备的经验要素，就会使得比例原则的操作者，以「隐然假设某个经验陈述是常识」或「此经验陈述不证自明」的态度，跳过了必须细致检验的经验陈述。以最近的司法院释字第712号解释为例，解释理由书谓：

立法者鉴于台湾与大陆地区人民血统、语言、文化相近，如许台湾地区人民依民法相关规定收养大陆地区人民，而无其他限制，将造成大陆地区人民大量来台，而使台湾地区人口比例失衡，严重影响台湾地区人口发展及社会安全，乃制定系争规定，以确保台湾地区安全及社会安定……核属维护重要之公共利益，目的洵属正当。系争规定就已有子女或养子女之台湾地区人民收养大陆地区人民时，明定法院应不予认可，使大陆地区人民不致因被台湾地区人民收养而大量进入台湾地区，亦有助于前揭立法目的之达成。

此段适当性原则的论述，意思是：若无两岸人民关系条例之限制，已有（养）子女的台湾人民会大量收养大陆地区人民，导致地区人口比例失衡，进而影响台湾社会安全。姑且先不论人口比例失衡是什么意思，大量收养大陆地区人民是否会导致失衡；也先不论社会安全如何会被前述现象影响（这些都是实然面的问题）；只要先问一个前提经验问题：若无限制，已有（养）子女的台湾人民会大量收养大陆地区人民吗？

图1是内政部所公布之本国人（终止）收养统计与外国人收养统计，显示每年国人收养台湾人的数目都只有三千上下，收养「非台湾人」更是低到一百以下。这极少数的外国收养数，大多数来自目前收养受重重限制的陆港澳。当然，因为内政部公布的仅为描述统计，并非有多重变量的原始数据，吾人无从得知「已有子」的台湾人、「已有女」的台湾人、「膝下犹虚」的台湾人，收养行为有何不同（例如是否已有儿子的台湾人比较不会收养）。我们不知道收养数目不高，是需求低还是供给少──若是前者，开放收养大陆地区人民不太可能冲击台湾人口结构；若是后者，则比较可能影响，但跨境收养所费不赀，会有多少人收养，难以预期。本文并不认为既有的数据已经足以作出明确推论，甚至可以说既有的数据隐然指向：收养制度开放不太可能造成人口冲击。毕竟，收养并不是要约加承诺就确定，依民法第1079条以下规定，还需由法院评估养子女最佳利益等因素后认可。但司法院释字第712号解释却以横扫千军的语汇，将此实证问题扫到一旁。大法官在本案对于适当性原则的操作，似乎并不适当。

图1：2009年到2011年收养数

数据源：内政部户政司人口统计资料。本文制图。

以上是以比例原则的运用为例，具体说明经验事实在法学规范论证中的角色。接下来，本文将从比较抽象的高度，阐述法学的概念与主要任务，逐步拓展、重建法学的范畴，说明法学的经验面向，与经验事实在规范论证中的角色，最后分类评述既有之法实证研究。请注意，本文有两大主张：法学本来就有经验面向，而非仅有规范面向；在法学固有的规范论证中，经验事实往往有不可或缺的作用（请见参、二、（二）」之图3）。其中一项主张是否为真，并不仰赖另一项主张为真。因此，即便论者不认为法学有经验面向，仍然需要严肃面对经验事实的规范意义。

參、法学的经验面向

从广义的角度而言，任何关于法律的研究──例如，法律哲学、法律社会学、法律经济分析、法律史等等──都可以看作法学研究。换言之，只要研究主题（subject matter）是法律相关，无论所采取之研究方法（research methods）是经济学、社会学、哲学或其他学门惯用的取径，就可以称为法学研究。如果对于「法学」采取这种广义的界定，似乎没有理由将法实证研究排除于法学之外。本文前言所引述的批评──实证研究不属于法学研究、其研究取向不是法学方法、其研究成果也无助于解决法学问题──显然并不是以此种方式来理解法学的范畴。为响应此批评，以下第一节先界定法（释义）学的范畴。第二节说明法释义学的两种经验面向。第三节论述法实证研究如何丰富法释义学之经验面向。

一、法学（法释义学）的概念与主要任务

在继受欧陆法（尤其是德国法）传统的地区，「法学」（相当于德文的“Rechtswissenschaft”或“Jurisprudenz”）这个概念通常指的就是所谓「法释义学」（Rechtsdogmatik，或译「法教义学」）。当批评者认为法实证研究不属于法学研究或无助于解决法学问题时，他们或许正是将「法学」理解为法释义学，这种理解方式，可称为「狭义的法学」。本文以下之论述，即在尝试指出：纵令对法学采取狭义之定义（法释义学），法实证研究仍在法学中扮演一定的重要角色。

「法释义学」并没有一个广为接受的清楚定义。但我们可以从法释义学的任务出发，初步地掌握（狭义的）法学的性质。本文的出发点是三位欧陆学者Aleksander Peczenik（瑞典）、Robert Alexy（德国）、Aulius Aarnio（芬兰）在1981年合着的经典论文The Foundation of Legal Reasoning，他们如此界定法释义学的工作：

法释义学的任务通常被界定为（i）对于法秩序内容的探究，以及（ii）法律概念与法律规范的体系化。这些任务也是彼此关联的：法秩序的内容无法独立于体系化的方法，反之亦然。

由于法秩序是由有效的法律规范所组成的，因此，法释义学的任务基本上可以分为三个部分：第一、认识哪些规范是有效的法律（包括制定法、行政命令、行政处分、司法判决先例等等），这部分的工作就是通常所谓的「法源论」（doctrine or theory of the sources of law）。第二，法律解释（legal interpretation），即探究法律规范的意义内容。第三，对于法律规范进行体系化的工作；所谓「体系化」（systematization），包括法律概念之间的位阶次序、法律规范的效力阶层结构，以及形成、发现一般法律原则。简言之，法释义学的主要任务可界定为：有效法律的解释与体系化（the interpretation and systematization of valid law）。

从以上法释义学的简要界定，可知法学主要关注规范问题。首先，法释义学的研究对象是特定法秩序中有效的法律规范；其次，解释法律规范其实是在提出某种规范陈述或主张。例如，刑法第278条第1项规定「使人受重伤者，处五年以上十二年以下有期徒刑」，如果「砍断他人左手拇指、食指与中指」这个行为可被解释为「使人受重伤」，那么这个解释就等于是在陈述下面这条规范：「砍断他人左手拇指、食指与中指者，应处五年以上十二年以下有期徒刑」。

不过，法释义学并不仅限于认识有效的法律规范，或陈述实务上采取何种法律解释（对规范体系的描述）；更重要的是，法释义学往往会对于「法律规范应该如何解释适用、法律规范应该如何修正、应该制定何种规范」提出建议，这些规范建议（norm recommendations）通常具有如下的形式：「基于某个（或某些）理由R，应该制定某条规范N，或者应对某条法律规范采取解释I」。例如，为了发挥袋地的土地利用价值，袋地之承租人或使用借贷人亦应享有邻地通行权。又如，因为利益之所在、危险之所归，以及对物有事实上管领力者方有可能防止危险发生，民法第373条所称之「交付」应仅限于现实交付和简易交付。

简言之，除了认识有效的法律规范之外，法学的重要工作在于，提出理由来支持某个法律上的规范主张。这些规范主张除了按照现行法（de lege lata）应该如何解决某个法律问题之外，也包括了立法论（de lege ferenda）的建议──例如现行法应该如何修正、是否应该制定某项法律措施。虽然法律人经常会区分关于现行法的主张（例如法律解释与适用）与立法论的建议，但正如Peczenik所指出：「de lege lata 与de lege ferenda的区分不是截然的。法释义学追求关于现行法的知识，但在许多情况下，它也导致法律的改变。因此，法释义学看来同时是描述性与规范性的。」法学方法论上的法律续造（法官造法）即为适例。在法律续造中，现行法的适用、解释与立法论问题之难以区分，早已是法学家的常识。例如，在民法物权编修订前，学说与实务即以促进土地使用效益为由，主张将民法第787条袋地所有人之邻地通行权类推适用至承租人或其他土地利用权人，这导致了日后民法修正时，增订了民法第800条之1的准用规定。

除此之外，本文认为，基于以下的理由，将立法论的研究包含在法学（法释义学）内，并无不当。首先，法释义学著作（如教科书、注释书、案例评释等等）常常指出现行法的问题、提议可能的修正方向。许多实际上参与立法论工作（例如担任修法委员）的法律学者，也不会认为自己所从事的是「非法学性质」的工作。

其次，如前所述，对现行法的解释，也是在提出某种规范主张，而非单纯描述性质。证成法律解释的理由，经常会涉及立法政策的考虑；尤其当法律规范容许不同的解释可能，必须论证为什么选择其一而排除其他解释选项时，更是如此。例如，为什么应该将民法第373条所称之「交付」解释为只包括现实交付与简易交付，而不涵盖占有改定或指示交付，乃是由于政策上应避免让未直接占有而无法防范、控制目标物毁损、灭失风险并享有目标物利益者，出其意料地承受危险负担的后果。事实上，解释法律就是形塑或改变法律的内容。每一个法律解释的结果，都会产生一条实证法所未明文规定的规范（例如：「砍断他人左手拇指、食指与中指者，应处五年以上十二年以下有期徒刑」、「买卖目标物之利益及危险，除契约另有订定外，自现实交付或简易交付时起，均由买受人承受负担」）。正是在这个意义上，法律解释与立法论之间具有连贯性，无法截然二分。

综上所述，关于法学的概念、分类与主要任务，参见下图：

图2: 法学的分类与主要任务

数据源：本文制图。

如前所述，法释义学的规范面向主要在于：提出理由来支持法律上的规范主张，这些规范主张包括了现行法的解释适用与立法论的建议。这样的工作称之为「法律论证」（legal reasoning/ legal argumentation）。本文关心的焦点之一即在于：经验事实──特别是由法实证研究发现的经验事实──是否能够在法律论证中，作为支持某项法律上规范主张的理由？本文的答案是肯定的。但在回答这个问题之前，仍必须先对法释义学的经验面向作一些初步的说明（见下节），再阐述经验事实如何能够具有规范意涵（第肆部分），最后本文也会以台湾既有之法实证研究为例，说明经验事实之规范意义（第伍部分）。

最后，值得说明者，本文之要求对象主要是台湾的法学学术社群。本文所观察到的现象，包括法实证研究数量有限，或质疑法实证研究的法学价值，是作者观察台湾法学学术社群所得，不当然代表其他国家也有类似现象。

二、法释义学的经验面向

Alexy在其《法律论证理论》中认为，法释义学是整合性学科，包括三个面向：经验的、分析的、规范的。相应于这三个面向，Alexy将上述法释义学的主要工作，区分为三种不同却又彼此相关的活动：描述现行有效的法律、对于法律的概念与体系分析、提出解决法律问题的建议。虽然Alexy没有系统地说明法释义学的经验面向，但他所称的「经验面向」包含两个层面：（一）认识以及描述有效的法律、（二）在法律论证中运用经验事实的陈述。以下两小节分述之。

（一）认识及描述有效的法律

就第一个层面而言，所谓「认识及描述有效的法律」可以从两个角度来看。第一个角度是将「法律体系」看作是规范的体系（legal systems as systems of norms），所谓「有效的法律」，就是某个有权机关所制定的规范（例如，立法院三读通过，总统公布的制定法、司法判决、大法官解释、行政命令与行政处分等等）。如果将法律单纯理解为有权机关制定的规范所构成的体系，那么认识及描述有效的法律，就不过是法典的重述或司法裁判的汇编，更抽象一点的工作，也只是有系统地整理出各种不同的法源依据。

第二个角度是将「法律体系」看作是一种程序体系（legal systems as systems of procedures），亦即制定、适用、解释、实施法律规范的过程。从这个角度来看，「认识及描述有效的法律」的工作又可以分为两种方式：

第一种方式是将程序体系看作是说理论证的过程，然后去描述这个过程的参与者（例如立法者或法官）基于什么样的理由或论据去制定、适用、解释规范。研究者甚至可以根据特定的理论兴趣进一步研究这些理由或论据的性质；但重点是，并不评价这些理由或论据的好坏优劣，此种研究可以称为「描述性的法律论证理论」（descriptive theory of legal reasoning）。例如：学者随机抽样地方法院判决后，分析出地方法院在计算民法第192条之扶养年数时，采用过八种计算方式；而年扶养费用也有「每人每月最低生活费」与「平均每人每月消费支出」两种差异颇大的选项。

第二种方式关注的则是程序体系当中制定、适用、解释规范的制度性行为──简言之，即立法、司法或行政行为，并试图说明，哪些因素会影响这些制度性行为，以及特定的立法、司法或行政行为产生什么样的效果影响。这样的工作，基本上是将法律制定与法律适用行为看作是由一连串经验事件所组成的因果链中的一环，其主要的理论兴趣在于推论出立法、司法或行政行为作成的原因，并观察或预测这些行为所导致的后果。

制度性行为之影响及效果，包括了法律规范（制定法、行政行为、司法判决）之实效（efficacy）。相对于以制定为导向的效力概念，实效研究关切的是：法律规范实际上是否被适用与遵守，被遵守与适用的范围大小或程度多寡，不遵守时有多高的机率会被制裁，规范的实施结果是否、以及在多大程度内能够达到制定规范的目的（例如汽车是否都没有在红在线停车，在红线停车是否经常被拖吊，画禁止停车的红线是否达到纾解车流或维持交通安全的效果等等）；以及说明影响实效状况的因素（例如，为什么在某些地区经常出现红线停车，或者停在红在线也很少被拖吊；或者找出为什么某些路段画红线禁停之后，交通流量并没有改善的原因）。实效状况是经验上可观察到的事实或行为，它也是经验研究的重要对象之一。例如：诉愿法要求诉愿审议委员会对行政处分作合目的性审查，去探究实际上某特定诉愿委员会是否有切实做到，即为关于诉愿法之实效的实证研究（详后「伍、二、」）。

显然地，如果将法律体系视为制度性行为的程序体系，那么法释义学中「认识及描述有效的法律」这项工作，势必要走向实证研究，至少也须大幅借助实证研究的成果。在本文第伍部分第二节，我们将举出一些台湾既有的法实证研究，进一步具体说明制度性行为与法律实效的实证研究的意义与成果。

（二）在法律论证中运用经验事实的陈述

经验面向的第二个层面关切的是经验论据在法律论证当中的运用。Alexy指出：「几乎所有的法律论证形式──如同几乎所有的实践论证形式──都会包含经验陈述。」论证法律上的规范主张时，经验陈述经常是理由或论据的一部分。这些经验性的论据包含了特定的经验事实、个人行动、行动者的动机，乃至自然科学或社会科学的法则等等；它们可被归类为不同的学门领域，例如经济学、社会学、心理学等等。

不过，Alexy并没有具体讨论这些经验陈述如何被安置到法律论证中，而只是以法律解释方法（the canons of legal interpretation）当中所包含的一些经验论证作为例子。例如，在文义解释当中，关于语言使用规则的确定；在历史解释或主观目的解释中，发现立法者意旨或立法过程的资料；在比较法解释中，关于外国法制的实施状况；在目的解释或后果导向解释当中，判断采取某个解释是否能够达成某种目的，或者预测采取某种解释或实施某条规范会导致何种后果；这些都属于经验面向的论述。

事实上，在法律论证或法律解释中诉诸经验论据，法律人并不陌生。从上文所举的几个法律解释的例子就可以清楚看出这一点。例如，「使人受重伤」的解释之所以包含「砍断他人拇指、食指与中指」这样的行为，首先是由于刑法第10条第4项第4款关于「重伤」的定义：「毁败一肢之机能者，属于重伤」，但更重要的是基于「失去拇指、食指与中指，则手（一肢）之功能即已丧失」这个经验陈述；如果不诉诸这个经验陈述，我们无法作出上述的解释。同样的，像「将邻地通行权的主体扩展至袋地承租人与使用借贷人，才能够达到发挥袋地经济效益目的」，或「只有对物有事实管领力的直接占有人才有能力防止目标物危险之发生」，也属于经验陈述或主张──至少这些主张必须诉诸经验论据才能检验其是否成立。

如前所述，法律论证──提出理由来支持法律上的规范主张──乃是法学规范面向的主要工作，在法律论证中运用经验事实的陈述，即为规范面向与经验面向的直接交会点（参见下图3）。出现于此交会点的重要议题是：经验事实──尤其是法实证研究所观察发现的经验事实──是否能作为法学规范论证的理由？

在下文「肆」处理此一议题之前，宜先于下一节扼要讨论法实证研究与法学经验面向之间的关联。但请注意：本文关于法学经验面向的分类，只是让读者清楚理解的方便法门，不代表彼此之间毫无关联。虽然经验与规范面向的直接交会点在于「经验事实作为法律论证的理由」，但此种经验事实（详见下文关于「差异制造事实」的论述），往往是由制度性行为的实证研究所发现，如前所述，探讨制度性行为的原因与实效，正属于「认识及描述有效法律」的重要部分。换言之，「认识及描述有效的法律」这个面向包含了将法律体系视为程序体系的实证研究，特别是实效研究，此类研究能够作出因果推论，发现作为法律论证理由的经验事实（差异制造事实），因此也会具有规范意义。因此，本文标题「经验面向的规范意义」所称之「经验面向」，必须以整体的方式来理解。

图3: 法学的经验与规范面向

数据源：本文制图。

三、法实证研究作为法学的经验面向

让我们转向法实证研究与法学经验面向之间的关系。按照法实证研究权威学者Theodore Eisenberg的看法，法律议题的经验分析（empirical analysis of legal issues）可以分为两大类。第一类是自然科学或社会科学的经验分析在法律个案中的运用，例如当事人可以运用自然科学或社会科学的实证研究成果，来支持其所提出的主张，或者法官可以使用这些实证研究成果作为证据或甚至判决理由的一部分。这个类型相当于法学之经验面向的第二个层面，亦即经验论据在法律证当中的运用。具体的例子如前一节所述：语意学或语用学的研究成果可以作为文义解释的重要依据；生理学家关于四肢的生理构造研究，可以让我们判断什么叫作「毁败一肢之机能」，以确定「砍断他人左手拇指、食指与中指」是否属于刑法所谓的「重伤」；关于土地使用效益的经济分析可以作为让袋地使用人同样享有邻地通行权的依据。

第二类的经验分析则是运用实证方法（信息收集与统计分析），来描述法律体系的运作过程，这是一般理解的「法实证研究」所进行的工作。这样的工作相当于法学之经验面向的第一层面，亦即描述、观察、分析法律体系如何运作。如前所述，它包括了描述性的法律论证理论与制度性行为的实证研究，即分析影响立法、司法或行政行为的因素，与观察或预测这些行为的效果。

非常有意思的是，Eisenberg指出：「藉由提供对于法律体系如何运作的精确描述，法律实证分析不只能够影响个别案件，而且还能够影响更大的政策问题。因为关于法律体系的错误印象乃是司空见惯，故实证研究能着力处不少。」按照这个看法，法实证研究的发现与成果，可以影响法院判决与立法政策。姑且不论实证研究如何发挥这样的影响力，问题是，对于法律（释义）学者而言，实证研究（Eisenberg的第二类经验分析）成果在法律论证中能够扮演什么样的角色？

如前所述，法释义学的工作不只是在描述有效的实定法规范，还会提出关于立法论与现行法的规范主张：例如「应该制定什么样的法律」、「现行的法律规定应该如何修正」、「法律规范应该如何适用或解释才能获得正确的判决结果」等等；更重要的是，法律学者必须提出理由来证成（justify）他所提出的规范主张。可以说，法学的规范面向是一种证成（justificatory）的工作，就此而言，法律学者与立法者和法官一样，都是从参与者的角度（the participant’s perspective）来进行法律论证。

但是法实证研究并不关心证成的面向，而毋宁是站在观察者的角度（the observer’s perspective），从社会科学研究者的观点去归纳出在法律运作过程中出现的行为规律性，并对这些行为提供因果说明（causal explanation），或至少点出须进一步探究的相关性（correlation）。就此而言，法实证研究从事的是说明性（explanatory）的工作——例如观察法官（或陪审团）的族群出身是否会导致其经常作出有利于特定族裔的判决；若是，则可能由法官的族群出身来预测其判决结果——但这并不表示族裔背景就可以作为法官判决当事人胜败诉的理由。我们推测，证成与说明之差异，或许就是某些法释义学者认为法实证研究无助于解决法学问题的原因之一，因为影响司法判决的因素，未必就能作为证成司法判决的理由。

本文并不否认，由于这样的观点区分，法释义学与法实证研究有不同的研究任务（research agenda），甚至有不同的研究取向──非常抽象地说，前者关切的是什么样的理由可以证成法律上的规范主张；后者关切的则是影响法律制度运作的因素，以及法律制度运作的效果。但这并不足以推论出，法实证研究的成果与法释义学所要解决的问题完全无关。如果其他学科（语言学、生理学、经济分析）的经验研究成果都能够运用于法律论证，以描述、观察、分析法律体系实际运作状况为主的法实证研究，其研究发现是否也能运用于法律论证，从而有助于解决法学所关注的规范问题？

邱文聪曾经提出过同样的问题。他区分两种观点的法实证研究：「外在观点的法学实证研究」（external approach of empirical studies about law）与「内在观点的法学实证研究」（internal approach of empirical studies of law）。「外在观点」相当于本文所称之「观察者观点」，外在观点的法学实证研究是描述性的，探讨「法律所处的经验现实是什么、法律与此一经验现实彼此间的互动关系、法律达成特定目的之实效、司法行为实践的经验现况等问题」。「内在观点」相当于本文所称之「参与者观点」，内在观点的法学实证研究「寄望藉由实证研究回馈到『规范性问题』的解答」。邱文聪指出，法学作为一种研究「规范」的学科，以及法律实践具有的论证特性经常表现在规范性的价值评断，因此，「有无可能在法学中进行『内在观点的法学实证研究』（亦即实证研究之结果在法学的规范论证中，可否做为支持或反对某一论证的理由）」，即成有待回答的根本问题。

本文认为，的确有可能进行所谓「内在观点的法学实证研究」，为了回答其所涉及的关键问题──「法实证研究的成果在何种条件与范围内，有助于解决法释义学所关注的规范问题？」、「在法律论证中，法实证研究的结果可否作为支持或反对某一论证的理由？」，本文第肆部分以稍具哲学性的方式来阐述经验事实（实然）和规范命题（应然）之间的论证关联，再以此出发讨论法实证研究所可能具有的规范意涵。

肆、经验面向的规范意义

一、经验事实作为规范性理由

如前所述，法学的规范面向，其主要工作在于提出理由来证成法律上的规范主张。可以用来证成某个规范主张的理由，称为「规范性理由」（normative reasons）。现在的问题是：经验事实是否能够作为证成规范主张的理由？其实，在日常生活中，我们经常诉诸经验事实来支持对于自己或他人提出的规范主张。例如：「为什么你应该戒烟？因为吸烟有害身体健康」、「为什么我们应该不开车上班？理由是开车会提高空气污染」。这些事实（「吸烟有害健康」、「开车提高空气污染」）虽然属于实然层面的经验事实，但它们能够作为支持规范主张的理由。这种可以作为规范理由的经验事实，本文称为「具有规范重要性的事实」（normatively significant facts）。

当然，主张「实然不能导出应然」者会认为，这些经验事实之所以具有规范重要性，仍要默认应然层面的前提。例如，「开车会提高空气污染」之所以能够作为不开车上班的理由，是因为应该降低空气污染；如果身体健康不是值得追求的目标，那么「吸烟有害身体健康」也不会构成应该戒烟的理由。

上述说法或许有部分的正确性，但必须强调：单单指出某个目标值得追求，或应该实现某个状态，并没有办法行动指引的作用。光从「保持身体健康是好的」这个评价陈述，我们无法知道该怎么作才能保持身体健康；同样地，单从「应该降低空气污染」这个应然命题，也无法推论出，究竟要采取什么样的行为或措施才有办法降低空气污染。当我们要决定，在数个可能的行为选项中（「抽烟／戒烟」、「开车／不开车」）应该采取哪一个时，我们必须判断，哪一个行为选项才能达到想要追求的目的或促成应该实现的状态（「抽烟有害身体健康，戒烟才能保持身体健康」、「开车会提高空气污染，不开车有助于降低空气污染」），这样的判断显然是经验性的，其成立与否需要经验论据的检证。

由此可以进一步说明，什么样的经验事实具有规范重要性，从而能够成为支持规范主张的理由。本文的看法是：作为规范理由的事实是一种「差异制造事实」（difference-making facts），它指出采取某个行为或措施会对某个结果的发生与否或发生机率造成差异，不论这个结果是某个值得追求的目标、某个应该实现的状态，或甚至是某个偏好或欲望的满足。

例如：「吸烟有害身体健康」是差异制造事实，它指出吸烟与否对身体健康所造成的差异：如果你戒烟，就不会导致身体健康受到损害。「开车会提高空气污染」这个差异制造事实，显示少开车会造成的差异：减低空气污染。又例如，「开车上班会增加油费开销」也是差异制造事实，它指出开车和不开车上班的差别：不开车上班可以节省油费开销。若比较想节省金钱而不是节省时间，那么「开车上班会增加油费开销」就是不要开车上班的一个理由。显然地，差异制造事实才能够发挥行动指引的作用──我们可以运用差异制造事实来考虑是否要采取某个行动或措施，以促使或避免某个结果的发生。

关于差异制造事实，有两点补充说明。首先，「差异制造」不一定是全有或全无的必然性宣称（例如吸烟必然会导致身体健康受到伤害），而可以是结果发生机率高低的差异。例如，跟不吸烟相较，吸烟会增加几成的罹患肺癌机率；或者，不开车可以降低多少程度的空污比例。抽象地说，采取选项A跟不采取A相比，会使得结果C的发生机率上升（例如，采取A则C出现的机率为80%，不采取A则C出现的机率只有50%），那么就可以说，采取A会对C的发生造成差异。简言之，所谓「差异制造」可以是概然性的。

其次，差异制造事实的成立与否，仰赖于某些背景条件（background conditions）。背景条件有别于差异制造事实：背景条件并没有指出差异，但它却是差异制造事实（理由）要成立所必须具备的条件。例如，「汽车使用石化燃料」这个事实并没有直接显示开车会造成何种差异，我们无法单凭这个事实来考虑，是否不要开车上班以避免某些负面效果，但「汽车使用石化燃料」却是使得「开车会提高空气污染」这个差异制造事实得以成立的背景条件；如果你开的是电动车，那么开车并不会造成空气污染提高的差异（虽然它可能仍会造成其他差异，例如耗电增加）。又如，「烟草含有尼古丁」是使得吸烟会对身体健康造成差异的背景条件，由于烟草含有尼古丁，所以吸烟会导致伤害身体健康。但是「烟草含有尼古丁」这个事实，它本身无法发挥行动指引的作用，因为它并没有告诉我们，吸烟会造成什么样的差异结果。

我们可以说，「背景条件」本身不是理由（差异制造事实），但它是一种「给予理由的事实」（reason-giving facts）。当我们陈述某个差异制造事实时，我们通常预设背景条件已经满足，但在不少情况下，关于采取某个行为或措施是否能够产生某种差异的争论，往往也会涉及背景条件是否已经满足的问题。例如，「死刑能够吓阻潜在犯罪者」常被用来作为支持死刑制度的理由。但这个主张（差异制造事实）要成立，需要一些背景条件，例如，媒体会大幅报导死刑案件、重大罪行被求处死刑的起诉与定罪率等等。背景条件同样是经验事实，其成立与否，同样需要实证研究的检验。

提出「差异制造」这个概念，旨在刻画因果关系。如果某件（或某类）事情（行动、事件、现象等等）会对另外一件（或另一类）事情的发生与否或机率高低造成差异，那么可以说：前者就是后者的原因（cause）。换言之，某件事情的原因，就是使得这件事情（结果）发生与否（或影响其发生机率高低）的差异制造者（difference maker）。用上面的例子来说：你之所以身体不健康，是因为你有抽烟的习惯；倘若你戒烟，就会比较健康。空气污染之所以愈趋严重的原因之一，是由于我们开车代步；如果不开车，那么空气污染的程度将会下降。要发现某件事情是否会对另一件事情的发生造成差异，主要是经验层面的工作，而实证研究的任务之一，就是要检验差异制造事实（甚至包括背景条件）之存在与否。例如，透过实验统计发现，吸烟者比起不吸烟者罹患肺癌与心血管疾病的机率较高；或者透过观察实测发现，以汽车代步比例愈高的地区，当地的空气质量就愈差。

实际上，差异制造事实可以用来提供因果说明（causal explanation）。当A这件（类）事情对于C这件（类）事情的发生会造成差异，那么可以说：A是导致结果C发生的原因；换言之，A说明了为什么C会发生。例如，居民普遍开车代步，说明了为什么当地的空气污染严重；抽烟的习惯，说明了为什么你的健康状况不佳。这种因果说明方式称为「正规说明」（canonical explanation）。

进一步而言，差异制造事实作为规范性理由，它与规范命题之间的证立关系也可以看作是一种说明关系：藉由指出一个行为会造成什么样的差异，差异制造事实对于为什么应该去作（或不作）这个行为，提供了一种结果论或目的论的说明（consequentialist or teleological explanation）。例如，对于为什么应该戒烟的一个可能说明是，因为吸烟会造成伤害身体健康的差异，为了保护健康，所以应该戒烟。之所以应该少开车，是因为开车会提高空气污染；为了降低空气污染，因此应该少开车。

结果论或目的论之说明（运用差异制造事实作为某个规范命题的理由），有别于前述的正规说明。在正规说明（某件事情对于另一件事情的发生造成差异）中，说明项（explanas）是差异制造者，即作为原因的事件、现象或行为（例如抽烟、开车），被说明项（explanadum）则是结果的发生（例如健康受损、空气污染加剧）。但是目的论或结果论的说明则是一种「逆转说明」（inverted explanation）：藉由「一个行为会造成某种结果差异」这种差异制造事实，我们反过来说明「为何应该采取（或不采取）这个行为」，以达成某个目的或促使／避免某个结果的发生。在逆转说明中，说明项是差异制造事实（抽烟有害健康、开车提高空气污染），被说明项则是为什么应该采取某个行为（应该戒烟、应该少开车），而这个行为恰恰是正规说明中作为说明项的差异制造者。

「正规说明」与「逆转说明」这两种不同的说明方式，或许可以响应前述法实证研究无助于解决规范问题的质疑：「法实证研究顶多只能找出影响法律运作或制度性行为（例如司法判决）的原因，但这些原因未必就能作为规范论证的理由」。这个质疑基本上是对的，但它忽略了重点：原因不是理由，因果事实（causal facts）才能作为理由。差异制造者是导致某个结果发生的原因，但能够用来证成规范命题的理由，是差异制造事实，而不是差异制造者。例如，假设会导致法官作出有利或不利特定族裔判决的原因（差异制造者），是其族群出身。或许「法官的族群出身」（例如「法官是白人」这个事实）无法作为支持何种规范主张的理由；但是，如果「白人法官会导致作出不利于非裔族群的判决」这个差异制造事实成立，那么这个差异制造事实将可以作为支持某些规范主张（例如，合议庭的法官或陪审团的组成应该考虑到族群分配比例）的理由。

以下我们将指出，法律论证──不论是立法论或解释论的论证──经常运用结果论或目的论的说明方式，来证成法律上的规范主张。如前所述，在这种论证方式，差异制造事实扮演了关键角色，它构成了是否应该实施某种法律制度、制定某项法律规范、或采取某个法律解释的规范理由。法律论证中所运用的差异制造事实，其成立与否，以及背景条件是否满足，正是法实证研究的重点之一。

二、差异制造事实在法律论证中的规范重要性

经验事实的规范重要性，最清楚地显现于目的论证与结果论证。以下将指出，这两种论证方式具有类似的结构，它们都必须诉诸某种差异制造事实来证成法律上的规范主张。

（一）目的论证

目的论证经常出现在法律解释方法中的目的解释（包括客观目的解释与主观目的解释），以及法律续造中的类推适用（目的性扩张）与目的性限缩。但除了目的解释之外，在决定各种解释方法的优先级时，所诉诸的也是某种目的论证。例如，相对于其他解释方法，文义解释之所以具有初步（prima facie）的优先性，乃是为了尊重立法者的决定，或者较能达到法安定性与可预测性的目标。

目的论证的运用并不仅限于法律解释，也及于立法论证。立法者之所以制定某项法律或采取某个制度措施，通常是为了达到特定的政策目标或实现某种价值。例如，为了保护国民身体健康，所以制定烟害防制法。法律学者也经常以是否能达到某个目的为理由，提出修法或立法的建议。例如，为了提高国民对于司法判决的信赖度，应该实施参审制；由于死刑不能达到吓阻犯罪的目的，所以应该废除等等。如前所述，诉诸比例原则当中的「适当性」原则来审查某个立法措施是否为达成目的之适宜手段，也属于目的论证的运用。

目的论证──不论是立法论或解释论的──之形式可以刻画如下：

（1）目的Z应该被实现。

（2）采取手段M有助于实现Z （倘若不采取手段M，则无法达成Z）。

因此，应该采取M。

Z代表某个政策目标、价值、原则或者值得实现的状态。M则可以是采取特定的法律解释、制定某项法律规范、实施某种法律制度等等。此处的前提（2）也可以是下面这个形式：

（2’）倘若采取手段M，反而无法达成Z。

准此，则相应的结论将是「因此，应该不采取M」。

目的论证的大前提，即应该追求或实现某个目的，是规范性的前提。确定规范目的，有时是经验性的问题，例如立法者的主观目的为何，可以从立法过程或立法史的数据当中去探求。但更多时候，要确定某个目的是否值得追求或应被实现，是价值判断与取舍的问题（例如尊重吸烟者的自由与保护国民健康孰轻孰重；国民对于司法判决的信赖度与尊重司法专业的正确性，何者才是应该追求的目标），基本上，实证研究不会多过问这些价值问题。

然而，一旦对于所应追求的目的有共识，目的论证是否能成功地证成法律上的规范主张，就只取决于前提（2）或（2’）是否成立。（2）或（2’）是经验性的前提，它所陈述的其实就是差异制造事实──采取某个手段M会对目的Z之实现造成差异。例如，采取参审制是否能够提升国民对于司法判决的信赖、死刑制度是否能达到吓阻犯罪的效果。如前所述，如果没有这种差异制造事实，我们无法直接从「应该实现某个目的」推论出「应该（或不应该）采取某个法律解释、制定某项法律规范或实施某种法律制度」。差异制造事实的成立与否，需要经验论据的支持，而法实证研究的重要工作之一，正是要提供这样的经验论据（参见以下「伍、一、」）。

值得注意者，如前所述，「差异制造」可以是概然性的。在许多情况下，实证研究的成果并不能确定，采取某个手段M就必然能达成某个目的Z，而只能告诉我们，采取M能够达成（或无法达成）目的Z的机率是多少。目的论证中的经验性前提（即手段与目的关联）的不确定性，会影响其支持结论的程度。例如，倘若研究发现，采取M则Z的实现机率为90%，这就能相当有力地支持「应该采取M」的结论。相对地，如果发现，采取M则Z的实现机率不到50%，此时可能就比较难以说服我们为什么应该采取M——当然，这取决于是否有比M更能达成Z之方案，M和其他方案能否同心协力，以及采取M或其他方案之成本与实现Z所获效益之多寡。当经验前提不确定时，要如何适当地作出法律决定，不是本文所要处理的议题。在这里要强调的只是，由于目的论证需要经验性前提的支持，且此种经验性前提可以是关于机率的陈述，关于机率高低的实证研究发现，会影响到论证的说服力。

（二）结果论证

所谓「结果论证」，指的是以采取某个解释、实施某项规范或制度所可能产生的后果、影响，来说明为什么应该（或不应该）采取这个解释或实施这项规范或制度。例如，以开放曾犯罪者驾驶出租车可能造成危害乘客安全的结果，来论证应该禁止有某些犯罪前科者开出租车为业（司法院释字第584号解释与林子仪大法官之不同意见书参照）；或者，以给予最高法院选案权可能促使其关注重要案件、提出重要见解为理由，来支持修法赋予最高法院选案权（讨论详后「伍、一、」）。

与目的论证不同之处在于，结果论证当中的「结果」，未必就是某个规范目的获得实现的状态，而可能是实施规范或制度所带来的附随效果。但结果论证和目的论证一样，都必须运用某种差异制造事实（因果关联）作为论据。结果论证的形式可以刻画如下：

（1）采取某个措施M会导致某个结果F。

（2）结果F是好的（或者：（2’）结果F是不好的）。

因此，应该采取M （或者：应该不采取M）。

结果论证和目的论证其实具有相同的结构，只不过大小前提的顺序相反。结果论证的前提（1）是陈述因果关联的经验性前提，它也是一种差异制造事实──采取M会对结果F是否发生或发生机率造成差异。前提（1）的成立与否是实证研究的对象。（2）则是评价性的前提，它表达了对于某个特定结果之好坏与否的评价判断。实证研究虽然不能过问评价判断；但和目的论证一样，如果欠缺实证研究所提供的论据来支持（1），单从关于结果好坏的评价性前提，无法推论出是否应该采取某个措施。

（三）综合比较与结合运用



	不过，目的论证与结果论证在实际运用过程上仍有些微的差异。在运用目的论证时，论证者通常已经确定所应实现之目的为何（例如充分发挥袋地之经济效用，以促进物尽其用之社会整体利益），并且假设手段与目的之间的因果关联（差异制造）成立（例如，将邻地通行权的主体扩展至袋地承租人与使用借贷人能够达到发挥袋地经济效益目的），然后来论证某个规范主张（「应将邻地通行权的主体扩展至袋地承租人与使用借贷人」）。



	对于目的论证来说，实证研究所扮演的角色，通常是事后检验作为假设的经验性前提是否成立，此时所进行的实证研究，通常对于规范目的为何已经有清楚地认识，其研究的主旨在于检验，目的论证中所假设的手段与目的之间的差异制造关联是否成立，因此其研究成果的规范意涵比较清楚。但在结果论证中，往往是实证研究先行，亦即实证研究先发现某个措施会导致何种结果，然后再透过对于结果的评价，来论证是否应该采取这个措施。

该采取这个措施。

先行的实证研究可能并不确定（也无法预知）所观察到的结果会被如何评价，因此其研究成果的规范意涵相对而言比较模糊。但如果要以此指责实证研究无助于规范论证，恐有速断之嫌。因为，在这个情况下，实证研究的发现之所以没有清楚地显现其规范意涵，是由于结果尚未受到充分评价，或者结果的好坏与否仍有争议，而不是实证研究本身的问题。

在法律论证中，目的论证与结果论证经常会结合运用。抽象地说，这个结合的论证形式如下：「采取某个措施M能够达到某个值得实现的目的Z，但它同时也会导致某个不好的后果F。」在这种情形下，究竟是否应该采取M，主要取决于目的与后果之间的取舍衡量（trade-off）：究竟是要为了达成目的，而忍受其伴随的负面效果，还是为了避免负面效果的发生，而放弃实现目的？

例如，禁止有犯罪前科者开出租车，或许能够达到保护乘客安全之目的，但也限制了有前科者的职业选择范围（当然，也可以反过来说：开放有犯罪前科者开出租车，可以保障其职业自由，但也可能有危害乘客安全的后果。因为目的论证和结果论证的结构相同，因此采取哪种描述方式并不重要）。究竟要开放或禁止，取决于保障职业自由与保护乘客安全两者孰轻孰重。不少论者认为，衡量是价值判断的问题，实证研究无法过问，也无助于解决。

然而，此种看法低估了实证研究对规范论证的可能贡献。首先，如前所述，采取某个措施究竟是否能够达成特定目的、或导致何种结果发生，往往需要实证研究支持。不仅如此，实证研究成果有可能降低规范评价论证的复杂度。例如，假设实证研究成果发现，采取M能够达成目的Z，但不会造成负面结果F（或者，采取M其实不能达成Z，但会导致负面效果F），其实就不必再去涉及困难的价值衡量。

其次，纵使目的与后果之间的取舍涉及衡量问题，亦即要去评估相冲突的原则、目的或价值孰轻孰重，但如同本文第贰部分所述，运用狭义比例原则时，关于目的实现之重要性高低（如果不采取系争手段，会对所要实现的目的造成多大负面影响），以及系争手段的负面效果大小（对基本权造成的侵害程度），也都必须仰赖经验事实的认定与判断。就此而言，实证研究成果可以提供价值衡量判断所需的经验论据。

再者，目的与后果间之取舍，往往也要仰赖其实现的机率来判断。实现机率高低，会对两者间之权衡产生某种加权效果。例如，认知到措施M达成目的之机率只有10%，但造成负面效果的机率却有80%，或措施M达成目的之机率为80%，但产生负面效果的机率只有10%，显然对决策者是有意义之信息。特别是当目的与后果在评价上具有同样重要性，或者两者之间孰轻孰重难以确定时，究竟要选择达成目的之手段，或为了避免负面效果而放弃采取该手段，往往就取决于前述实现机率的高低。目的达成或结果发生的机率，是实证研究（特别是量化的实证研究）的重要对象；如果机率因素在价值取舍衡量中扮演一定的角色，没有理由低估实证研究在评价或规范论证中的重要性。

最后须强调，陈述因果关联的经验性前提，在许多规范论证中，被当成经验法则，或想当然尔。但这不表示没有实证研究的存在空间。不同人所认为「理所当然」的结论不一定相同；不少经验法则可能彼此矛盾，或者只是特定时空的产物。法实证研究若能否证经验法则，或证明法律人的经验直觉有误，固然甚有贡献；但法实证研究若能证明某种未经严格检验之经验法则确实为真，也是强化了吾人之信念，似不应径以「早为吾人所知」一笔抹煞其贡献。

三、因果推论──法实证研究如何发现差异制造事实

（一）因果推论的基本难题

论述至此，本文已经论证了因果说明、差异制造事实与规范论证之关系，下一步则是阐述法实证研究如何发现差异制造事实，亦即实证研究如何进行因果推论（causal inference）的问题。

首先必须指出，以差异制造为基础的因果关系理论，往往诉诸所谓「反事实的」（counterfactual）想法来掌握「差异制造」的概念。例如「吸烟会对身体健康造成差异」的意思是：「倘若不吸烟，那么身体将会比较健康」。又如，「开车会造成空气污染程度提高的差异」，其实是在比较「居民开车」（事实状态）与「居民不开车」（反事实状态）这两个状态下的空气质量差异：在大部分居民都开车的情况下，空气质量不佳，倘若居民大都不开车，空气质量将会更佳。但这种刻画因果关系的方式，会面临的问题是：在现实条件的限制下，我们通常无法「创造」反事实的状态来测试某个因果宣称（causal claim，亦即关于差异制造事实的陈述）是否成立。

举例来说，我们要如何回答「性别是否会造成薪资的差异」这个问题？设想以下作法：首先，创造一个职场，随机地找一个就业者，赋予一个性别（比方：「男性」），让他进入这个职场，观察他的薪资；然后，我们让时光倒转，赋予这个就业者另一个性别（「女性」），让她进入同样的职场，再观察她的薪资。如果我们观察到，在这两个状况中，薪资的确有所差异──比方说，就业者为男性的状态所获得薪水比为女性的状态更高，则可肯定推论：性别会导致薪资差异。

但受限于现实条件，显然无人能采取上述作法来推论出「性别会造成薪资差异」：我们无法创造出上面那样的职场，我们不会也不能为了研究去改变一个人的性别，更不可能让时光倒转。实证研究者只能观察到现实的状况（例如一个男性就业者的薪资多少），但无法观察到反事实的状况（例如该男性就业者若为女性，其薪资将是多少）。由于经验上不可能同时观察到现实状况与对照的反事实状况，我们无法证实「倘若一个男性就业者是女性的话，他会获得比较低的薪资」这样的主张；因而也难以验证究竟性别是否为造成薪资差异的原因。这个问题称为「因果推论的基本难题」（the fundamental problem of causal inference）。

（二）控制的随机实验

尽管如此，实证研究仍发展出不同的方法来处理上述的基本难题。粗略地说，这些处理方法背后的基本设想是：虽然我们无法「创造」出反事实的状态，但我们仍可以在现实条件下「模拟」（simulate）反事实的状态，来作为对比观察的对象，以进行因果推论，从而发现差异制造事实。

典型的方法是「控制的随机实验」（controlled randomized experiment）。医学上经常使用此种方式来测试新药或新疗法的效果。在此种实验中，足够数量的受试对象被随机地区分两组（实验组与控制组）。随机区分乃是为了确保这两组对象具有高度相似性。当其他条件皆一致（例如两组受试对象的性别平均分布、平均年龄相近、生活习惯没有显著差异等等），这两组之间只有一个变项不同，例如实验组投以某种药物X，控制组则投以安慰剂（由于两组对象是随机区分的，因此其中一组可说是在「模拟」另一组的反事实状态，例如控制组是在模拟「倘若患者没有服药」的状态，反之亦然）。若实验结果发现两组之间有效果差异，例如实验组的存活率比控制组来得高，则可以说：X造成了患者存活率提高的差异。由此基本上可推论出，投治药物X和存活率之间具有因果关系，即服用X具有治疗该种疾病的效果。

控制的随机实验也可见于某些法实证研究。例如在设计精良的模拟审判中，将参与的受试者随机分为两组，一组采用全体一致决的投票规则，另外一组则采取多数决，再透过某种调查方式发现，比起后者，前者对参与审判的经验感到更满意。另一个例子则是在美国作过的下述实验：让一群受试者观看犯罪演出（例如一段模拟杀人劫财的录像带），再将其随机分成A、B两组，去指认一排人当中哪一个是加害人。这两组的区别仅在于，A组会事先告知「犯罪嫌疑人有可能在这排人当中，也可能不在其中」，B组则未被如此告知。实验结果发现，如果加害人的确在其中，这两组受试者指认的正确比例没有多大差别。但如果加害人未在其中，则B组指认错误的比例要比A组高得多。换言之，在这个情况之下，告知与否会造成指认错误率的差异：没有事先告知「犯罪嫌疑人有可能在指认对象当中，也有可能不在」，会导致指认错误率提高。这个因果推论成立的背景条件则是：在没有告知的情况下，受试者很可能已经假定加害人就在这排有待指认的对象当中，并且会认为他们的工作就是去指出这些人当中谁最像加害人。

（三）基于观察式数据的因果推论

控制的随机实验虽然常被视为发现因果关系的黄金律，但并非唯一的方法。在大多数的情况下，法实证研究所要探讨的问题很难用「现场实验」（field experiment）的方式来回答。例如，实际上不可能把刑事被告随机分配成两组，一组可以请律师辩护，另一组不行请律师，再来观察有何效果差异。也不可能为了研究法官性别如何影响就业性别歧视的案件结果，而将同一个（组）案件，随机分配给一组男性法官与一组女性法官同时进行审判，再比较结果有何不同。即使以模拟方式作实验，也不一定能复制真实世界的条件。例如在前述指认犯罪者的实验中，实验者已经知道谁是「犯罪者」（扮演凶手的那一位），也知道他是否在受试者指认的那一排人当中；但在现实环境中，我们往往无法确定真正的犯罪者是谁，也不一定知道他是不是就在被指认的对象当中。我们顶多只知道，要指认的对象有犯罪嫌疑而已。

因此，大部分法实证研究通常不是运用实验所产生的数据数据，而是分析现实世界所能获得的观察式数据（observational data）──例如法院实际作出的判决、就业市场中劳方的薪资所得等等。法实证研究分析观察式数据之目的，在于作出推论（inference）；所谓「推论」，乃是从已知的事实（搜集、编码、统计过的数据数据）来推测尚未知道的事实。例如在就业性别歧视案件中，从搜集编码到的案件，透过统计分析，来发现「合议庭有女法官」与「原告胜诉率」之间是否有相关性。或者，分析就业市场实际薪资的数据，观察到性别不同的确会造成薪资差异。事实上，在控制的随机实验中，研究者也是从所观察到的事实（实验组与控制组的存活率分别为何）来推论出实验前未知的事实（药品具有疗效）；所不同者只在于，在分析观察式数据的实证研究中，研究者并没有介入观察对象（作为推论基础的已知事实）的运作。因此，接下来的问题是，实证研究如何以观察式数据为基础作出推论──特别是能够发现差异制造事实的因果推论？

与控制随机实验类似的一种方式，是找出可供比较的对照组（the comparison group），透过对比观察来发现差异制造事实。例如，我们可能没有办法将甲地的居民随机区分为「开车」与「不开车」两组，以检验开车是否为造成当地空气污染严重的原因。但或许我们可以找到另一个人口规模、工厂数量、自然环境、植栽比率都相似的乙地，唯一相关的差别只在于，乙地的居民大多以自行车代步。如果对比观察发现，乙地的空气质量显然更好，那么我们也可以合理地推论：甲地居民开车造成了当地的空气污染。

这种对比两组观察数据的方法也可见于法律实证研究当中。例如，要检验某个路段的速限规定是否会影响该路段的车祸发生比率，可以对照另外一条道路状况（车流量、路宽、弯度、路面平坦程度等等）相似，但速限规定不同的路段，来观察两者车祸发生率是否有所差异。如果发现速限较低的路段，车祸比率也会较低，则或许可以认为，速限规定会造成车祸发生率的差异。

然而，就像进行控制随机实验有其实际困难，并非每个问题都能够找到恰当的对照组，以资对比分析。因此，大部分的法实证研究仍必须在欠缺对照组的条件下，分析既有的观察数据，先找出变项间的相关性，再进一步尝试作因果推论；兹说明如下。

一般而言，因果关系是介于两个变项──自变项（independent variable，又称「说明变项」explanatory variable）X与应变项（dependent variable）Y之间的关系，例如投药与否和存活率高低、速限高低与车祸发生率、性别与薪资高低、合议庭是否有女性法官与原告胜诉率等等。从观察数据中要选择何者是自变项，何者为应变项，变项如何赋值，属于实证研究的研究设计与数据编码的问题，在此不多赘述。在数据分析阶段，要探讨X与Y之间是否具有因果关系，第一步工作是运用统计方法（例如回归分析）来检验两个变项之间是否具有相关性（correlation）：Y是否经常伴随X的出现而出现，或者是否随着X的数值不同，Y的数值也会相应变化。例如，抽样统计发现，合议庭有女法官，则原告的胜诉率就会随之提高；或者统计全国各路段发现，速限越低的路段，车祸发生比例越少；速限越高的路段，则车祸发生比例越多。这种发现相关性的统计推论，是一种「描述推论」（descriptive inference）。

然而，两个变项之间有高相关性并不代表就具有因果关系（例如，统计发现「身高越高者，体重越重」，但这并不代表身高就是造成肥胖的原因）。之所以如此，主要有三种可能因素：第一，因果方向如何确定的问题；第二、共同因（common cause）问题；第三、干扰因素（confounding factor）的影响。所幸，这些问题基本上都有克服之道，兹简略分述如下。

首先，在部份问题中，因果关系的不对称（asymmetry）──如果X是造成Y的原因，那么Y就不会反过来是X的原因──可以解决因果方向不确定之疑虑。从差异制造的观点而言，所谓「不对称性」指的是：X的出现会造成Y出现机率之差异，但反之则不成立。例如：假设发现，是否有女法官参与审判与原告胜诉率有相关性；法官的性别组成可能会影响原告胜诉率，但胜诉率的升降不可能反过来改变法官的性别组成，由此即可推定，「是否有女法官参与审判」是说明原告胜诉率变异的可能原因。

不对称性通常也可透过时序优先性（temporal priority）来解释：原因出现在结果之前，但结果不会发生在原因出现之前；因此，可以根据出现顺序的时间先后，来判断何者为因，何者为果。例如，有可能平均温度越高，导致某地冷气装置比例高，也可能因为冷气装置比例高，排放热气于外，使得该地平均气温升高。但如果研究者发现，早在家家户户安装冷气之前，当地平均气温即已呈现上升趋势，则「高平均温度导致高比例冷气装置」，应是较为合理的推论。事实上，透过原因先于结果的时序优先性来确定因果关系，是实证研究中常见的作法。例如，比较同一路段的车祸发生率在速限降低前后的差异，若发现在速限降低后，车祸发生率才有明显下降，通常即会推断，「车祸发生率下降」是速限降低的结果。

此外，运用「工具变项」（instrumental variable）亦为实证研究解决「鸡生蛋、蛋生鸡」问题的方法。例如犯罪学研究发现高犯罪率地区有比较多的警察，但高相关性无法告诉我们是警察多导致犯罪（庄子云：「圣人不死，大盗不止。」），还是罪犯多的地方会加强警力。要知道孰为因孰为果，就需要借重工具变项。举例而言，好的工具变项可以影响警力，但不会直接影响犯罪，只会藉由警力的变动而影响犯罪率。学者曾选择「美国各州的消费税率变化」作为工具变项。消费税率些微增加，不太可能直接影响杀人放火的频率；但州政府税收增加往往就会多聘警察、维持治安。故若发现消费税率上升，犯罪率就下降，则可证明警力增加有助于打击犯罪。

其次，「共同因」问题指的是：两个现象经常伴随出现，也未必就具有因果关系，它们之所以经常伴随出现，或许是由另一未被量度的变项所造成——此变项称为「共同因」。换言之，这两个现象其实都是结果。例如，我们可以观察到，一旦气压计指针上升，则天气就会随之干爽，但前者显然并非后者的原因。相反的，两者之所以伴随出现，背后的共同原因是气压高低。

解决共同因问题的一个方法是，透过介入操作自变项X，来观察应变项Y是否有相应的变化。换言之，如果操作自变项X的数值并不会伴随Y的数值改变，则X就不是造成Y之状态（或数值）改变的差异制造者，从而不能认为是导致Y的原因。以上例而言，就算将气压计指针往上拉，天气也不会跟着变得干爽。因此，气压计指针上升，不是造成好天气的原因。

如前所述，分析观察式数据的实证研究，研究者通常无法透过干预观察数据的方式来确定因果关系；即便如此，研究者仍然可以藉由妥当的研究设计（提出合理的理论假设、选择适当的变项）、数据搜集与合适的对比观察，来避免基于共同因现象的谬误因果推论。用一个虚构的简单例子来说明：假定有研究发现，甲地的冰淇淋消费量与侵入住宅窃盗发生率具有高度相关性──冰淇淋消费量越高的季节，此类案件就越多。但由此推论出「吃冰淇淋是造成住宅遭到侵入窃盗的原因」，显然相当荒谬。

或许无法以直接干预冰淇淋消费量的方式（例如强迫喜欢吃冰淇淋的当地消费者不要吃冰淇淋），来观察当地侵入住宅窃盗的案件量是否仍然居高不下（若是，则可证明吃冰淇淋并不是导致侵入住宅窃盗案件增加的原因）；但可以质疑，这个研究的观察范围与对象太过狭隘，未控制其他可能作为原因的变项，也没有观察到其他地方是否有类似的情形。例如，在冰淇淋消费量提高的同时，当地的啤酒消费量、甚至泳装销售量也增加；或者，观察其他地方发现，同样的季节里，冰淇淋消费没有增加（该地少有冰淇淋店），但侵入住宅窃盗的案件数不相上下。如果将这些变项纳入考虑，我们需要更有说服力的理论假设，来说明这几个变项（冰淇淋、啤酒、泳装销售量）与侵入住宅窃盗发生率之间的关系。

在此一假设例子中，比较合理的说明或许是：真正具有因果重要性的因素，其实是「气温」。由于气温升高，人们就会多吃冰淇淋、多喝啤酒、到海边戏水消暑，同时也会增加户外活动的频率，从而让闯空门的窃贼更有机可乘，导致发生更多侵入住宅窃盗的案件。换言之，「冰淇淋消费量提高」与「侵入住宅窃盗发生率提高」，其实都只是气温升高带来的结果；前述研究之所以作出不合理的因果推论，乃是由于其研究设计不当忽略了「气温」这个（共同因）变项之故。

最后，即便分析观察数据发现两个变项之间具有相关性，但如果没有排除干扰因素（confounding factor），仍无法作出可靠的因果推论。所谓「干扰因素」，乃是可能潜在影响自变项对应变项作用的其他变项。例如，虽然统计发现，男性就业者的平均薪资较高，但样本中的男性就业者，其平均年资或教育程度也都比女性来得高。如果加入「年资」或「教育程度」作为自变项，就会发现，其实年资越长（或教育程度越高），薪资才会随之越高，由此则可推论：并非性别，而是年资或教育程度才是造成薪资差异的原因。

在随机控制实验中，透过将实验对象随机分配为两组，通常可以保证实验组与控制组除了自变项数值不同（例如投药与否）之外，其他条件一致，从而尽量排除干扰因素。例如，或许男女对所投药物反应不同，但由于实验组与控制组的性别分布是平均的，性别因素即会被抵销掉。但在运用分析观察数据的实证研究中，要排除干扰因素，尽可能地达到其他条件一致，以作出有说服力的因果宣称，则需要运用一些统计技巧；其中最常用的一种，就是「复回归模型」（multiple regression model）。

一元回归分析，只关注一个自变项X与应变项Y之间的相关性。复回归模型则考虑多个自变项X1…Xn与应变项Y之间的关系。纳入复回归模型中的变项，就被「控制」（controlled）了，意思是：当回归模型计算X1对Y之影响时，已经把其他变项Xi (2£ i£ n)对Y之影响排除，故X1之系数（coefficient）与统计上显著性（statistical significance）的判断，单单显示了X1本身对Y之影响。换言之，X1之系数之诠释，就是「在Xi (2£ i£ n)等条件一致或不变的情况下，X1数值的变化会对Y之数值有何种程度或方向的影响」。复回归模型中的所有自变项之诠释，皆是如此。

再以就业薪资歧视为例，薪资可能同时受到性别、年资、教育程度等要素之影响，但这三种变项并不总是完全统计上独立（亦即，相关系数不是0）。如果使用只有一个自变项的回归模型，逐一检视这三种要素对薪资之影响，结果即可能产生偏差。因为男性可能平均教育程度较高，故在此种一元回归模型中，性别自变项的系数，会吸收了教育程度对薪资之影响；研究者看到数值很大的系数与统计上显著之结果，就可能误以为就是性别导致薪资差异，但实际上是性别与教育程度联合起来导致薪资差异，但一元回归模型无法容许研究者将两者之影响分开。

而在复回归模型中，性别、教育程度、年资都是自变项，此时「性别」这个自变项之系数，就单单反应性别对薪资之影响，且已经把教育程度和年资对薪资之影响排除（或说控制住）。如果回归分析发现，若平均年资与教育程度相当，男性就业者的平均薪资仍比女性就业者来得高，则由此推论「性别造成薪资差异」，即较为可信。由小见大，法学者在以经验事实为基础作规范推论时，若不能全面掌握可能影响应变项的诸多因素，而只以一、两个面向与某种结果的相关性就遽然作出因果推论，即嫌速断。

在无法进行控制随机实验的情况下，复回归模型常被视为发现因果关系的次佳方法。但要运用复回归模型，从观察式数据作出有说服力的因果推论，仍有赖于妥当的研究设计与执行，例如相关变项是否都纳入考虑。但研究设计与执行是否妥当，并无放诸四海皆准的标准，没有一个统计指标、量表或操作手册能够告诉实证研究者，哪些变项是相关的、哪些变项该受到控制。运用复回归模型之研究设计与执行的妥当性，仍有赖于研究者的良好判断、与学术社群的检验。

（四）因果推论作为差异比较的统计推论

以上所介绍的几种因果推论方法，不论是控制的随机实验、对照组的对比观察（例如回归不连续法）、运用时序不对称性、工具变项或复回归模型，其实基本上都是藉由比较两个描述推论（统计推论）的差异，来进行因果推论，从而发现差异制造事实。例如，投药组的平均存活率，比投安慰剂组的平均存活率来得高；速限降低前后的车祸发生率有何种程度差异；相较于消费税率未增加前，消费税提高后，犯罪率下降；同样年资、教育程度的女性就业者，比男性就业者的平均薪资更低；就业性别歧视案件中，有无女性法官参与合议审判，原告胜诉率有何不同等等。

质言之，因果推论就是关于差异的统计推论，亦即比较两个描述推论的差异，以发现因果关系（差异制造事实）。为了简化讨论，暂且假定X为只有 1与0两个值的自变项（即所谓 binary variable），例如，X=1代表「投药」、「速限降低」、「就业者为男性」、「合议庭中有女性法官」；X=0代表「投安慰剂」、「维持原速限、「就业者为女性」、「合议庭中没有女性法官」。Y则代表应变项「平均存活率」、「车祸发生率」、「平均薪资」、「原告胜诉率」等。发现差异制造事实的因果推论──请注意，这是非常简化的方式──基本上可被刻画为以两个描述推论为前提的对比三段论（comparative syllogism）：

在其他条件皆一致的情况下，

DI1: X=1, 则Y的值为V1。

DI2: X=0，则Y的值为V2。

结论: X对Y产生的影响效果为V1与V2之间的差异。

对比三段论的结论，则像是「投药的效果是提高了50%的平均存活率」、「降低速限后导致车祸发生率减少三成」、「承审法官没有女性，会使得原告平均胜诉率下降20%」、「性别对薪资造成的差异是，男性就业者平均薪资比女性就业者高五千元」等等。

抽象地说，如果透过对比三段论发现，当其他条件不变，随着X值的不同（1或0），Y的值亦会随之有所变异（升高或下降），原则上即可推论出「X是一个差异制造者，X会对Y造成某种程度的结果差异」。

整体而言，从因果推论到规范论证的过程，参见下图：

图4：从因果推论到规范论证

数据源：本文制图。

惟关于因果推论与运用差异制造事实之规范论证，仍有几点值得注意：

首先是差异制造事实的规范蕴含问题。作为原因的差异制造者，有些是可以人为干预或操作的变项，例如投药与否、制定某项法律或政策（降低速限、增加合议庭女性法官比例），但有些不是（例如性别、天气状况）。在前者，差异制造事实之规范蕴含通常相当清楚，而可以直接作为支持规范主张的理由，例如患者应该服药，因为本药具有疗效；降低速限有助减少车祸发生率，因此应该降低速限；为了确保就业歧视案件的判决结果不受性别偏见影响，合议庭应该要有一定比例的女性法官。目的论证与结果论证中具有规范重要性的差异制造事实（采取某个法律解释、制定某项法律、实施某种制度能够达到某个目的，或导致某种结果）即属于此类（参见本文第肆部分第二节）。

当原因变项（如性别、气温）无法人为干预操作时，例如「性别是造成薪资差异的原因」、「气温上升导致侵入住宅窃盗案件量增加」，若要藉助此种差异制造事实进行规范论证，必须相当谨慎。例如，「为了提升薪资水平，女性就业者都应该去变性」和「为了减少窃贼闯空门，因此应该将夏季气温降低」显然都是荒谬的论证。比较合理的规范论证或许是：「为了改变男女同工不同酬的现象，应该要求雇主不分性别同工同酬」、「为了避免住宅被侵入窃盗，夏天出门要提高注意门户安全」。当然，此种差异制造事实也有可能作为实施某项法律政策的规范基础，例如：应该制定劳工性别平等法、入夏后应增加警力巡逻。但法律制定或政策实施是否能达到预期的效果（如消弭男女同工不同酬、降低侵入住宅窃盗发生率），同样需实证研究检验。

其次是因果推论本身的不确定性问题。因果关系可以拆解成「因导致果」（causes produce effects）及「果系于因」（effects depend on causes）；两者不总是同时成立。举例而言，吸烟导致身体健康不佳，但身体不健康的原因未必总是因为吸烟。回归模型所发现之因果关系，通常都只触及「因（可能）导致果」。如果有多个原因能够同时说明结果，则研究者应该将可能的说明变项尽可能纳入考虑，并且控制相关变项的影响，以检验除了所关注的原因之外，是否还有其他可能的原因会影响结果之发生。如前所述，这涉及控制随机实验与回归模型之研究设计与执行的妥当性。一般而言，若系争问题已有长足的理论研究或长串的实证研究，则找出其他可能的原因，并进而控制其影响的可能性即会提升；否则，仍必须仰赖先行研究者的良好判断，再由后续研究进行补充或修正。

更重要的是，因果推论（对比三段论）中作为前提的描述推论，都是机率性质的统计推论，所得到的结论也因而属于「平均而言」的机率因果关系。熟悉「若P则Q」或「充分、必要条件」等逻辑推演的法律人，要谨记社会现象通常不会如此黑白分明、因果清晰。例如在新药实验中，不是实验组的人全部生还，控制组（使用安慰剂）全部魂归西天；而是两组的生存率（几乎都是大于0%但小于100%）有统计上显著（statistically significant）或不显著之差异。同样的，速限降低后，车祸不会绝迹，就业性别歧视案件的原告碰到全由男性法官组成的合议庭，也不全然都是败诉，更不见得只要有女法官参与，就一定胜券在握。「机率上充分」（probabilistically sufficient）与「机率上必要」（probabilistically necessary）——表示其所宣称之充分或必要条件，容许少数之例外——已经是社会科学研究者能作的最强宣称。

总括而言，实证研究进行因果推论所发现的差异制造事实，大部分属于统计机率上的差异（采取某个措施，会提高或降低特定结果的发生率）；由于现实条件的限制与人类知识的局限性，很少有实证研究会宣称，其研究设计与执行结果能够保证所关注的变项之间具有确定的因果关系。不过，大自然与人类社会的奥秘，本来就很难被一个人或一个小团队全面解密。科学研究（包括实证研究）可以透过逐渐累积证据（如在不同地区不同法院也发现类似结果），小心控制相关变量，及辅以相关理论之研究（如研究发现之相关性可以被既有的经济学、心理学理论解释），均可增强因果推论之可信度──就此而言，因果推论不只是纯粹统计问题，也要仰赖良好的科学判断。因果推论无法做到100%确定，不表示研究者应该放弃作因果推论，因为许多公共政策之拟定，需要以因果关系为基础；研究者之职责是作更好的实证研究，使其因果推论更坚实。

因此，法实证研究论文之读者，不应该因为论文之研究方法是量化取向，就一概否定其规范意义，因为设计得宜的法实证研究，可以作出合理的因果推论，从而发现了有规范意涵的差异制造事实。确实有些法实证研究的方法仍有可改进之处，但那是个别研究的问题。批判性的读者，仍必须深入剖析其方法失当之处，才能做出公允之个别评价，而此评价不应该蔓延到其他法实证研究论文。就像是一篇糟糕的法释义学文章，不应株连其他运用传统释义学方法的论文。值得强调者，尤其在量化研究中采用的统计方法，往往超越一般不熟悉量化方法者之直觉，故批判性的读者，必须小心，毋以想当然尔的质疑，抹煞了一篇可能有贡献的法实证研究论文。

最后，法实证研究的成果，在社会科学研究的典范之下，有「否证可能性」（falsifiable）。即使是在当下设计最精良、数据最完整的实证研究，都可能将来被新的统计模型、更多的海量数据推翻其研究发现。实证研究的因果推论，都是在「未被推翻前」有作为规范论据之意义，奠基在差异制造事实上的规范论证，也必须跟着经验科学的新研究发现一齐调整。社会科学的研究，就是在社群共同努力之下，不断堆积新的证据，逐渐理解人的行为与制度运行的结果。否证可能性，不应该成为概括否定实证研究价值之理由。

伍、既有本土法实证研究之规范意义

2013年，知名的美国法实证研究新秀Joshua Fischman发表一篇掷地有声、对法实证研究者宛如暮鼓晨钟的长文，呼吁法实证研究者要将「实然」（is）和「应然」（ought）再度结合。Fischman指出，实证研究要帮助规范论证，必须注意下列几点：第一，选择与规范问题有关之研究，并将实证研究背后蕴含的价值判断说清楚。第二，依问题而选择实证方法，而非选择实证方法后，再决定问题意识。第三，明白论述实证研究如何能帮助规范论证。第四，思索特定情境下的实证研究如何能有一般性的意涵。Fischman虽然重视实然与应然结合，但文章没有说明如何结合。本文前四部份即是具体的回答。

Fischman进一步指出，重要的实证研究，能引导法律改革，或能描述重要的、与法律有关的现象，或有助于理论之发展。奠基于前文之论述，本文则将法实证研究分为三类，与Fischman之分类略微不同。详言之，第一类实证研究检验差异制造事实是否成立，对应到本文第参部分第二节所探讨之「在法律论证中运用经验事实的陈述」。而第二、三类实证研究则对应到本文第参部分第一节所探讨之「认识及描述有效的法律」；参见表 1。第三类实证研究以实证方法描述法律论证；换言之，是以系统化的数据搜集与分析方法，提出「描述性的法律论证」。第二类实证研究则检验制度性行为与刻画法律的实效性。

表1 实证研究类型与法学理论对应

数据源：本文制表。

以下，本文为三类实证研究，一一撮要举例。但请注意，一篇法实证研究论文，往往尝试回答多个问题。各问题可能属性不同，因而一篇法实证研究论文可能横跨两种或三种实证研究类型。例如，如果实效研究关切的主题是，法律规范或制度的实施是否以及在多大程度内达到了预期的效果或目的，其研究对象即为检验差异制造事实，而可同时归入第一类实证研究。同样的，制度性行为的实证研究关切立法、司法、行政行为会受到哪些因素影响，如果这些因素对制度性行为所造成的影响会受到一定的评价（例如法官判决结果不应受到性别或族裔因素所左右），那么制度性行为的实证研究也可能发现具有规范重要性的差异制造事实；因此，第二类实证研究的成果也会有相当程度的规范意涵。由于三类法实证研究对法学都有贡献，硬要将某篇文章贴上某类实证研究之标签，并非本文所欲。本文所列出者，仅为帮助读者理解三类实证研究有哪些具体的本土法律问题，已经被法实证研究者挖掘出来，不在于争辩某篇论文是属于某一类实证研究。限于篇幅，本文当然不会穷尽地回顾所有台湾的法实证研究。

一、第一类：检验差异制造事实是否存在

当法律社群关于值得追求之目的或结果之评价有价值共识，实证研究所发现的差异制造事实可直接用于规范论证──应该采取可以达到目的之措施，或应该采取导致（或避免）结果发生之措施。此种研究成果，或可作为修法、变更既有判例的前导理论，或作为捍卫现行法的左右护法。

当法律社群仍有价值分歧，实证研究所发现的差异制造事实仍可为不同立场的论者所援引，且可直接作为支持其各自规范主张的论据基础。例如，实证研究发现「采取某个制度或措施M会产生特定的结果F」，但法律社群对于F之好坏仍有争议；对F给予正面评价者，会以前述的发现作为应该采取M的理由；对F给予负面评价者，也能以此作为不应该采取M的理由。此时实证研究的成果虽然无法确定地支持应该或不应该采取M，但在此情况下，实证研究规范论述力道较弱，并非实证研究本身所致，而是价值辩论尚未到硝烟散去的时刻。

此外，如本文第肆部份第一节所述，差异制造事实的成立，经常仰赖某些背景条件。但背景条件并非永远不证自明，要研究差异制造事实是否成立，往往必须先确立背景条件是否已满足。背景条件同样是一种经验事实，关注背景条件之法实证研究，本文也将其分到第一类实证研究。

以台湾既有之法实证研究为例：公元2000年民事诉讼法修正后，当事人必须在诉讼准备程序中开示证据。1996年到2006年间地方法院的「诉讼和解率」变化显示，除了诉讼目标在600万元以上的案件外，其他案件之和解率在各地方法院都在2000年以后上升。证据开示所揭露之信息，使双方皆能更实际地评估案件胜败之可能，故导致和解率上升。民事诉讼中是否应该采取证据开示制度，是清楚的规范命题；而在民事案件中，促使当事人更常自愿解决纷争，而且是奠基于真实证据上的纷争解决，应该是多数人能够赞成的价值。此实证研究显示的差异制造事实是：实施证据开示制度能够促成当事人更常自愿解决纷争，故可作为支持应该采取证据开示制度的理由。

2003年民事诉讼法修法给予最高法院选案权之效果（民事诉讼法第469条、第469条之1参照），有学者随机抽样1996年到2008年间5%台湾最高法院的案件，以检验2003年修法之影响，发现：在修法前，最高法院就已经扩张使用「未具体指责原判决有何违背法令之处」而程序驳回上诉，频率并有上升趋势（修法后最高法院程序驳回之例稿文字转变，难以辨识以前述理由驳回之频率是否增加）。上诉人胜诉率与最高法院实体驳回率，在修法前后都没有统计上显著之差异。此外，最高法院判决中的实质说理长度以及撤销发回判决中论述「有原则重要性之法律见解」者也没有显著提升。促使最高法院关注在重要案件，且集中心力在提出重要见解，应该是多数民事法学者之共识。本研究发现2003年之修法没有达到立法时所预期之结果差异（促使最高法院关注重要案件，提出重要见解），这样的发现提供了学术社群检讨最高法院作法或立法者制度设计方式（修法赋予最高法院选案权）的规范论证弹药。

共有物分割时，避免制造畸零地，妨碍土地利用，应该是大多数法律人的共识。原物分割可能会产生畸零地，而变价分割不会。不过，最高法院长期强调原物分割优先；2009年民法第824条修正，又明确偏好原物分割（可惜修法理由没有明确阐明为何要偏好原物分割，仅说现行分割方式「过于简单」，故仿造德国等立法例修正）。是故，新立法与最高法院均偏好原物分割，可能使下级法院没有考虑具体情境就判决原物分割，导致畸零地增多。有学者随机抽样四分之一2008年至2010年间全国各地方法院之分割共有物判决，发现2009年修法并未增加地方法院使用原物分割之频率；而且，在原物分割会产生畸零地时，法院会倾向采用变价分割。本研究发现，差异制造事实并未成立；亦即，修法并未导致地方法院大幅采取原物分割，地方法院采取原物分割时也有考虑制造畸零地的负面效果。故从文义看可能产生的不良后果，实践中并未发生；故新民法第824条，及最高法院相关判决，目前不应给予负面的规范评价。

依据处分权主义，在损害赔偿或不当得利诉讼中，法院判给原告之金额，必须在原告主张之范围内。但在原告主张之范围与举证之程度内，法院必须依照法律之标准订给付数额，此应无太大争论。行为心理学所称之「锚定效应」，用白话说，法律之标准不够明确（慰抚金案件中之痛苦如何量化？相当于租金之不当得利案件中之年息如何厘定？），法官在下判决时，除了受案件客观事实影响之外，也下意识地受到「原告声明金额或年息」之影响。此种锚定效应，已经有无数心理学实验验证存在。有学者研究台湾地方法院在无权占有他人土地所生之相当于租金之不当得利案件中，法官之判决决策，发现法官年资在约11年以下时，此种锚定效应确实存在。实证研究所发现的因果关联，即「原告在诉讼声明中提出明确金额主张，会对资浅法官的判决产生不当影响」，对于有意主张在诉讼声明阶段剔除明确金额主张者，是其规范论据之实证基础；对于法官过于年轻的相关批评，也是初步的支持证据。

以公法研究为例，不少学者主张行政救济环节中的诉愿制度，其目的主要有三项：行政自我控制与审查、迅速经济解决纷争（并减轻法院负担）、合目的性审查。有学者抽样内政部2006至2009年近900件诉愿案件，以检验内政部诉愿会决定案件之态样。研究发现诉愿决定书甚少记叙「合目的性审查」之内容；假若诉愿会有详尽记载其检验行政处分合法性与合目的性之论理，则这是诉愿会极少作合目的性审查之证据。此外，内政部诉愿会当时纯由法律人组成，研究亦发现，案件涉及法律以外之专业知识时，内政部诉愿会倾向尊重原处分机关之事实认定，而几乎都驳回诉愿。尤其是后者，带有因果推论（涉及法律以外之专业知识，是造成内政部驳回诉愿的原因），又凸显了诉愿实务上未必尽到立法或学理对诉愿制度之要求与期待，亦即实施诉愿度无法达到前述行政自我审查的主要目的，这样的发现亦足以作为检讨改革现行诉愿制度的理由。

有些实证研究所发现之经验事实，是否能立刻成为立法或司法解释之准则，某程度取决于法律社群对相关规范价值的共识。例如，学者招募279名自愿者，随机将之分到不同组，进行模拟陪审审判，发现：在经过思辩过程后（相对于思辩过程前），陪审员认为「错判有罪」比「错判无罪」更糟的比率上升，陪审团的无罪开释率也上升。相较于「多数决」，「一致决」下的陪审团成员较愿意改变原始的投票倾向，也对讨论与判决结果有较高的评价（但若采一致决，而陪审团无法作成一致决定，则对一致决程序之评价反而比对多数决程序之评价更低）。但整体而言，无论采取一致决或多数决，「西瓜偎大边」效应与「倾向无罪开释」效应都存在；此与先前西方实验结果一致。学者因此建议台湾实行人民参审相关制度时应采一致决。该论文从实然发现推导出之应然政策建议，是否合理，取决于论者默认之规范价值。若认为无罪推定是刑事程序最核心的价值，且应该超越合理怀疑才应判刑，则参审制采取全体一致决，能降低有罪率，应有助于实现规范价值。不过，若认为刑事程序的核心价值在于发现真实，则在还不知道一致决与多数决何者较能发现真实时，即无法依据此研究成果作任何政策建议。

与前述研究类似，有学者研究强制辩护政策，而其背后的规范价值似乎尚乏社群共识。2003年之后，刑事强制辩护案件之被告辩护律师是随机分给法院公设辩护人与法扶义务律师，而非全部交给公设辩护人。政策上并决定逐步让公设辩护机制退场。2004年到2007年的全部地方法院之刑事案件中，在控制了案件类型与严重程度后，这两类辩护人所经手的案件审判平均刑期相当。然而，相对而言，公设辩护案件的定罪率较高，但刑期较短，原因很可能是公设辩护人与法扶律师的诱因不同所致。若论者认为重点是发现真实，此类实证研究并没有告诉读者，哪一种制度更能关该关的、放该放的（但有任何研究能做到？）。但若认为无罪推定的理念导出「有无罪比刑期长短更重要」的想法，且「只要辩护制度合理，无罪率越高越好」，则让公设辩护机制退场的政策，应给予正面的规范评价。

最后，有些研究并未直接针对差异制造事实，而是关注其背景条件，也就是前述「给予理由的事实」。例如学者利用「2011年台湾人民法律纷争解决行为模式的实证研究调查」资料，发现司法院即将推动试行的观审制，参与意愿在不同的人口族群间有显著的差异，特别是高社经背景的族群参与意愿较高，女性参与的意愿较低。若对比美国的陪审团多半是低社经背景者参与（且有忧心此影响决定质量），则此发现对政策决定者或许是一则喜讯，虽然无法成为强烈支持或不支持参审制之论据。再者，若观审制经立法院通过后实施，并发现特定社经背景或性别的观审员，较常作出「合乎真相」（真相如何独立被发现，暂且不论）之决策；假若合乎真相又是某些规范论者最重要的价值，则此差异制造事实，与学者已经研究之参与意愿研究结合，即有丰富的规范意涵──亦即参与意愿的研究成果可能发现观审制较能作出合乎真相决策之背景条件。

二、第二类：检验法律的实效性与刻画制度性行为

法律的实效性与制度性行为（如法官判决行为、行政首长决策行为、立法者的立法决定）的研究相互牵连，难以截然二分。本文的区分方式是：法律的实效性研究关注的是法律所意图管制、规范的对象，是否受法律之影响而改变行为，或是否守法。最为人熟知的例子是死刑是否有吓阻作用。而制度性行为关注的是制订、解释、适用、操作法律者，其决定为何，以及其行为决定受到何种因素之影响。例如美国学者发现，陪审团所决定的惩罚性赔偿数额，与财产上损害赔偿之数额呈线性关系。惩罚性赔偿之设计，是为了吓阻厂商污染，故研究陪审团的决策并非实效性研究。陪审团是决定事实（包括赔偿金数额）的决策者，它到底是乱判一通，还是脉络有迹可寻，就是制度性行为的研究范畴。

第二类实证研究不见得发现了差异制造事实，也不一定响应特定的价值辩论。法实证研究如同其他社会科学研究，无法在实验室中创造完整的验证条件，故无法随心所欲探究任何有兴趣的问题；很多时候，为了探究具有重大规范意义的问题，只能先从已有数据的面向着手。藉由知识的渐次累积，逐步刻画法律实际运作的经验面貌。

不管是法律的实效性或制度性行为，往往都有既有的实然理论。在实证研究大举进入法学之前，有几种主要的跨领域法学方法。法经济学（law and economics）、行为法经济学（behavioral law and economics）、公共选择理论（public choice）、法社会学（sociology of law）等等，就是此种「混血」路径的代表。有些有明确的双亲，像法社会学是法学与社会学的后代，法经济学是法学与经济学的小孩。行为法经济学则是「三人行」的成果：认知心理学先强娶了经济学，变成「行为经济学」，再结合法律经济学，诞生了行为法经济学；换言之，这是心理学、经济学、法学的三位一体。公共选择理论是经济学、政治学、法学共同的关怀。这些交叉学科都从各自的角度，在法学的研究范畴内，提出各式理论，如法官的决策行为。经过半世纪的理论发展，到法实证研究兴起时，过去50年来的理论是否有证据支持，变成新显学。因此，第二类实证研究除了可以认识及描述有效的法律之外，也可以同时检验其他学科提出之实然理论（这也是Fischman强调，但本文未完整开展之法实证研究贡献）。

本节先描述法律实效性之实证研究，再介绍既有之制度性行为实证研究。在公开数据不少，可能成为在台湾实证研究未来重点研究领域的公司、金融法，有学者发现法律上具有独立性的公司薪酬委员会成员，有三分之一与公司内部人具有「社交关系」，因而对公司法要求薪酬委员会成员有法律上独立性是否能导致合理薪酬划上问号。投资人保护法赋予投资人保护中心（公设财团法人）代表投资人提起证券团体诉讼的权利，有实证研究评估其实效性，发现此种证券诉讼高度倚赖刑事程序、仰仗和解金以赔偿投资人损害、诉讼时间冗长，是否能有效保证投资人权益，仍有疑虑。

依司法院释字第579号解释，征收补偿与被征收之损失必须相当。2012年土地征收条例第30条第1项修正前，依该法，被征收人所获得之补偿为公告土地现值与「加成补偿」。此种补偿，是否与被征收人之损失相当？若认为相当补偿就是市价补偿（此点当时学界未有共识），则学者实证研究发现多数2000年到2009年间土地被征收者所获得之补偿低于市价，即显示宪法之当为要求，并没有落实在征收补偿实务中。

有研究比较两种机制之实效性。台湾劳资争议之解决有两种协调机制：「政府协调」与「民间协调」；由劳工听取政府有关人员说明后，选择其中一种协调程序。运用 2005 至 2007 年所终结之协调案件纪录与涉入争议之劳工之电访调查，学者发现：绝大多数之劳工，并不了解两种程序彼此间之差异；同时，主管机关亦多未履行说明程序差异之义务。争议金额越高、劳工学历越高、有争议经验，会使得劳工更倾向采取政府协调机制。两种程序虽不影响和解成立之机率，但在和解成立时，却显著影响劳工的获偿率──政府协调案件之获偿率高于民间协调案件之获偿率3—9个百分点。换言之，民间协调机制所产出于政府协调机制相当之和解率，是以劳工作更多让步来达成。

既有的制度性行为研究，以对大法官或一般法院法官之研究最多。有发现司法院大法官的留学国背景对其在意见书中引用外国法律与判决，有显著之影响。有发现司法院大法官的多样性（不同时间由不同总统提名），导致更多违宪解释采用附期限失效之方式为之。

另有学者利用台湾最高法院民事上诉案件判决，研究「诉讼资源」（party capability）与「法院偏好」（court preference）对最高法院处理案件之影响。最高法院案件审理流程分成「形式审查」（最高法院有裁量以上诉不合法而裁定驳回）与「实质审查」（判决上诉有无实体理由）前后两个阶段，进一步以样本选择模型（sample selection）来控制最高法院的形式审查裁量权对判决结果所造成的选择偏误（selection bias）。发现诉讼资源多寡所影响的律师代理效果（聘请单独执业律师或大律师事务所的法务团队；是否聘请比较有在最高法院上诉经验之律师），呈现在「形式审查」阶段。但只要法官认为合法而进入第二阶段的实质审查，这些效果都将消失。不过，在形式审查阶段，最高法院偏袒政府（相对于企业或一般自然人），除了政府能动员的诉讼资源较多外，也和法院偏好有关──最高法院法官将自己视为政府的一环。

此外，台湾地方法院身体健康侵害慰抚金判决之实证研究，亦发现法官酌定之慰抚金数额，受被害人受伤程度与医疗费用之影响。详言之，身体健康受损程度越重、法院允许被害人请求加害人支付之医疗费用越高，慰抚金越重。此实证研究发现之事实是，身体健康受损程度轻重会对法院判决之慰抚金多寡造成差异。对地方法院死亡慰抚金之实证研究则发现，同一案件中若有不同亲属主张，法官给的慰抚金数额是「配偶 ≥ 未成年子女 ≥ 父母 ≥ 成年子女」；且法官会因为担心给予被告过重之赔偿负担而减少慰抚金数额。

2009年民法新增第796条之1，赋予法院在越界建筑纠纷中，有考虑双方当事人利益与公共利益后，例外不拆越界房屋之裁量权。有学者观察2009年至2012年底，三年余间全部（157笔）解释适用该条之地方法院判决，发现当法院以民法第796条之1作为排除所有物返还请求权之根据时，最关键之因素是越界面积低（实务上越界面积多在100平方公尺以内）、越界比率少（实务上越界比率多在20%以下）、越界非出于重大过失。

有些研究关注律师与当事人的制度性行为。有研究2000年到2006年间地方法院的一般诉讼案件，发现原、被告双方均有律师代理时，和解率最低；双方均无律师代理时，和解率最高；一方有代理者，介于其间。此现象产生的原因，并非如一般猜想，乃律师主导是否和解，且律师不愿意和解所致。恰恰相反，绝大多数律师收取固定、包审的律师费，和解有助于减少律师的工作量；数据显示，是当事人决定和解与否（律师费因为无论如何都要付，所以不是主要考虑因素）。事实上，是当事人一开始对进行诉讼与否的可行性评估，影响了当事人是否聘请律师。有无聘请律师对原告胜诉率没有统计上显著影响，有聘请律师的被告胜诉率较高。这并不能代表律师代理增加胜诉率，而同样是当事人选择的结果：被告理性评估主张之强弱以决定是否聘请律师，有望胜出的案件聘律师，没望的案件则不聘。

另外，有学者以2005–2007年劳资协调程序与后续诉讼程序之数据，发现：争议金额在和解成立与否及进行诉讼与否扮演了重要的角色。争议金额低时，和解率高，和解不成后的诉讼率低；争议金额高时，和解率低，和解不成后的诉讼率高。争议金额居中时，因而很可能不能和解，也没有争讼。传统法律经济学理论认为，被告愿意和解的前提是，原告若和解失败很可能实行诉讼以解决争议。作者之前述发现因而指出传统理论并没有获得实证分析之支持。

三、第三类：以实证方法描述法律论证

传统的判例研究或个案研究，是微观层次的描述法律论证；实证研究分析大量判决或其他法律活动，则是巨观层次的描述法律论证。举例而言，除了前述扶养费用计算之研究外，有学者研究在职灾补偿诉讼中，法院以何种方式诠释因果关系（条件关系或某种相当因果关系）。有研究地方法院如何诠释民法第787条之「通行必要」与「无适宜之联络」。有发现在诽谤案件中，法院近年来在刑事案件越来越常采用对言论者较宽松的故意过失程度标准；而在民事案件中，诽谤的慰抚金数额主要受到原告与被告之收入与相对社会地位影响。有分析所有的连动债纠纷判决，发现高等法院对客户签章是否表示银行当然已经尽到说明义务，采取两种见解（签名免责说与实质审查说）。

第三类实证研究应该是新手入门的试金石。只要有实证研究的基本概念，就可以有系统地整理判决或其他法律文本，从而积累法学知识。有志者，盍兴乎来？

陸、结论

法学的主要功能与角色在于作规范论证，但经验事实往往是规范论证中不可或缺的一环；不少法实证研究可以发现或验证法学规范论证所需之经验事实。不过，法学并非仅有规范面向。法学的经验面向除了发现可作为规范理由的经验事实（即「差异制造事实」），也包括了认识与描述有效的法律，尤其是制定、解释、适用法律之制度性行为以及法律的实效状况。无论对于法官、律师、当事人、学者，有系统地了解法律解释、适用的态样，以及立法者与解释、适用法律者背后的可能驱动原因，都有意义──它可以作为推动立法或司法改革的基础，作为决定如何判决的准则，或成为是否和解或诉讼的重要考虑。兴盛于美国、萌芽于台湾的法实证研究，带入统计方法与其他社会科学的思维，大大有助于我们认识与理解法律体系的实际运作。

本文尝试提供法实证研究的理论基础，并辨正法实证研究的法学价值。展望将来，由部门法内之具体问题出发，析论具体议题之差异制造事实，并以实证研究方法验证可作为规范论证之理由的差异制造事实是否成立，乃是法学实证研究（甚至法学研究）能否进一步向上提升之关键。

本文不同版本的初稿曾經先後發表於2014年6月18日中央研究院法律學研究所舉辦之「兩岸四地法律發展」學術研討會、2014年10月20日臺北大學法學院慕知學堂，以及2014年12月9日中研院法律所個人年度學術研討會；作者感謝兩位匿名審查人、干學平、王怡蘋、林子儀、邱文聰、官曉薇、唐曉晴、許可、許家馨、章程、程金華、黃丞儀、蔣侃學、謝耿亮、謝暉、簡資修、蘇彥圖及其他與會來賓之寶貴意見，以及范皓柔之研究協助。本文一些哲學上的想法（尤其是理由論與因果關係部分）獲益於中正大學哲學系王一奇教授甚多，特此致謝。

文档下载张永健：经验面向的规范意义──论实证研究在法学中的角色