上海交通大学中国法与社会研究院

2020年03月24日【作者】上海交通大学中国法与社会研究院预览：

【作者】上海交通大学中国法与社会研究院

【内容提要】

自2018年4月以来，由上海交通大学中国法与社会研究院主办的“法的学科交叉沙龙”已经成功举办五讲。五位在人工智能和大数据领域造诣深厚的专家与法学学者就技术在司法中的应用共同交流。

第一讲

2018年4月24日，“法的学科交叉沙龙”第一讲在凯原法学院举行。沙龙第一讲由上海交大安泰经济与管理学院沈惠璋教授主讲，主题为“人工智能、大数据与司法决策”。凯原法学院季卫东

教授主持了本次沙龙，媒体与传播学院徐剑教授、凯原法学院林喜芬教授担任评议人。

季卫东教授首先感谢沈惠璋教授主讲本次沙龙。沈教授长期从事系统工程和信息系统的研究，也是决策科学领域重要的学者。凯原法学院法社会学研究中心历来重视学科交叉研究，欢迎在

人工智能和大数据领域造诣深厚的专家共同为技术在司法中的应用提供帮助、相互交流。

沈惠璋教授开宗明义，主张从计算机科学发展的历史脉络来深入了解计算机科学、人工智能和大数据的理论本质，由此洞悉它们的发展前景和对司法领域可能的辅助作用。他以最早普及的人工智能产品傻瓜相机为例，介绍了终端用户、设计师、科学家和思想家的分工层次，指出只有涌现一批计算机领域的科学家和思想家、对现有基础理论做出重大突破，中国才能真正实现自主创新，走在世界人工智能领域前沿。沈教授从数学和逻辑学的发展历程出发，强调可计算性理论和图灵机模型是现代计算机科学的理论基础，而哥德尔不完备性定理决定了任何一个数学系统不可能既是自洽的，又是完备的，“停机问题”证否了“无所不能的程序”的存在。因此计算机程序不可能对所有问题都提供有效的算法，在当今时代我们尤其要分清理论发展和商业炒作，不能陷入理解的误区和盲目的恐慌。同样地，尽管人工智能注定会在一定程度上影响和改变司法决策，但是人工智能并不能完全取代人的作用。

接着，沈惠璋教授介绍了人工智能、机器学习和大数据的概念和特点，他提到深度学习本身不是逻辑推理，而是一种信号转化与模式识别，突出误差的比较；而司法之中是有说理的，比如被判刑的人会追问“为什么”、“凭什么”？在这种情况下要留意技术本身的局限性。在这里，沈老师展望了人工智能在司法决策中可能的几个应用方向，这主要体现为四个方面：数据挖掘的决策树算法在司法决策中用于知识发现、司法决策专家系统、基于范例推理的司法决策支持系统和群体司法决策支持系统。他还详细地讲解了神经网络算法及其理论局限，介绍了决策树、专家系统、范例推理和群体决策系统等技术，并展望了它们在司法领域的应用前景。

评议阶段，徐剑教授首先感谢沈惠璋教授严谨客观地梳理了人工智能发展的历程，指出司法公开使我们拥有了非常好的学习集，问题在于如何处理和使用这个学习集。林喜芬教授首先讨论了人工智能黑箱性质的可靠性与司法伦理，指出司法过程的实际运转可能并不是决策树式的树形模式。他还提到，尽管一般认为法律推理是按照三段论式的形式逻辑模式，但是法律现实主义等新的思潮和理论是反对这样的法律形式主义的，英美法系的司法决策很多时候也并不满足这个模式。两位老师的评议也充分体现了信息技术与法学的交叉效应，达到了非常好的对话效果。

交流互动环节，现场听众就人工智能与人的智能的潜能和局限与沈惠璋教授进行了深入探讨。沈教授谈到，当前的技术发展日新月异，但实质上突破性的进展还是比较缓慢的，尤其我们国家对

核心技术的掌握尚有不足，这需要数代人的接力、积累。而就信息技术而言，难点在于如何获取知识、如何采用统一的语言来表述这种知识以及如何灵活处理僵硬的判断结果，这都是法学将信息技

术引入探讨的任务之一。

季卫东教授做总结发言，他认为沈教授的讲座非常有启发性，他从哈特的可撤销原理和法律系统的自我指涉问题出发做了精彩的回应。最后，他代表法社会学研究中心感谢沈惠璋教授做客本次法

的学科交叉沙龙，首次交叉沙龙活动宣告圆满结束。

第二讲

2018年5月8日，“法的学科交叉沙龙”第二讲在凯原法学院举行。此次沙龙由电子信息与电气工程学院金耀辉教授主讲，主题为“司法信息化中的人工智能：历史、挑战、实践与愿景”。凯原法学院季卫东教授主持了本次沙龙，程金华教授和许多奇教授担任评议人。

季卫东教授首先欢迎金耀辉教授主讲本次沙龙。他介绍道，学科交叉沙龙旨在借助交大的优势和特色，推动跨学科交叉研究。金耀辉教授从著名的贝尔实验室回国后参与了多项重大科研和应用

项目，近年来对法学交叉研究也有高度关注。

金耀辉教授的讲座分为历史、现实、思考和前瞻四个部分，梳理了人工智能发展历史，介绍了人工智能在司法领域的应用现状，分析了具体的实践应用项目，并展望了未来人工智能与法律研究

和应用的远景。

他首先简述了人工智能的三大流派和发展史：以数理逻辑模拟人的心智的符号学派、以仿生学模拟脑的结构的联结学派和以控制论模拟人类行为的行为学派。他还讲解了机器学习的基本概念和原理，认为特征选取是机器学习成败的关键。针对近年来大火的深度学习，金耀辉教授认为尽管深度学习的计算能力和特征刻画能力十分强，但是模型的可解释性也在下降。为此，“可解释性人工智能”（Explainable Artificial Intelligence, XAI）的概念被提出，目的在于突破算法黑箱的限制，为数据处理和运算结果提供逻辑解释。

金耀辉教授回顾了人工智能与法律的结合。他指出，上世纪中叶人工智能诞生之初就有学者设想借助这一技术实现法律的自动化处理，而以1970年Buchanan & Headrick《关于人工智能和法律推理若干问题的考察》一文发表为标志，人工智能与法律作为研究分支正式诞生。当前司法信息化中人工智能的应用十分广泛，美国的Case Crunch对案件结果的预测甚至超过了人类律师。他总结道，人工智能与法律结合的必要性体现在可以提高司法效率、促进司法公正、提升立法质量。

接下来，金耀辉教授介绍了自己团队研发的OMNIRank模型。该模型利用人工智能算法预测P2P平台的风险状况。通过5大类118个特征、6种深度学习算法，该模型的准确率可以达到85%。但是正因为人工智能的算法黑箱性质，无法对预测结果提供逻辑解释，因此在实际应用中遇到了困难。金耀辉团队进一步尝试了“元思”系统，通过输入模糊的先验人工逻辑，并在优化迭代中辅以少量人工校验和干预，可以大幅提升算法性能。该系统未来有望在司法实务中用于类案研究。金耀辉教授还以四川眉山的多元化社会调解为例，介绍了社会管理的AI流程。

最后，金耀辉教授展望了人工智能司法应用的远景。他指出，当前人工智能的研究和应用还处于初级阶段，法律具有独特的复杂性和模糊性，这为未来研究提出了挑战，更孕育着广阔的契机。人工智能在法律的深度、实质应用需要面对法律、管理、技术、数据和人才等多方面的挑战。

季卫东教授感谢金耀辉教授精彩的汇报。他总结道，大数据、互联网和人工智能的三元互动是理解人工智能与法的关键因素。未来人工智能的司法应用需要突破算法黑箱，满足可解释性。

评议讨论阶段，程金华教授首先感谢金耀辉教授的分享。他提出，机器学习的运算多是基于回归原理，利用旧有的规律和趋势对未来进行预测，但是法律的发展除了依据以往的规律经验，还需要不断优化调整，将法律实践推向更高更好的层次，这一点在疑难和复杂案件中会尤其突出。季卫东教授也认为，这实际上涉及到了一个重要的法律问题。模糊的先验选择到人工智能需要经过清晰的逻辑处理，其中需要多次的逻辑迭代。但同时法律的发展也需要优化选择。如何平衡二者是需要认真研究的。许多奇教授也指出，对于复杂前沿的法律案例，在法解释学的内部也莫衷一是，对于这类情况人工智能可以发挥怎样的作用？关于P2P平台风险模型，人工智能的模型是利用过往数据对未来预测，但是在当前防范系统性金融风险、政策出台迅速的大背景下，原有方法是否能保持良好的准确度也是值得探讨的问题。

第三讲

2018年5月22日，“法的交叉学科沙龙”第三讲在法学楼203会议室成功举办，主讲人上海交通大学国际关系与公共事务学院樊博教授就“大数据、人工智能与城市应急”进行了精彩演讲。讲座由凯原

法学院季卫东教授主持，由朱芒教授、李学尧教授担当评议。

樊博教授首先就“法的交叉学科沙龙”的邀请表示了感谢，并幽默地表示他在季卫东老师、朱芒老师面前感觉自己好像是博士生开题。樊博教授近年来一直致力于文理交叉研究尤其是信息科学在政

府公共管理中的应用，今天来法学院分享的是最近做的两个案例。

讲座分为三块，首先樊博教授以“大数据下的社会科学研究”为题，宏观地谈了大数据技术对社会科学研究和人才培养的影响。他认为，传统量化分析和数据分析视角的区别在于前者自顶向下，从理论建构开始，而后者自底向上，从数据处理开始。对于互联网+背景下的知识形态，樊博教授认为我们正在经历知识从个体记忆向云端存储转变、知识碎片向数据结构化转变、数据结构化向智能化转变的过程，因此今后应更加注重培养学生的信息检索能力，并展现了国务学院最近的本科培养方案。关于政府公共服务的走向，樊博教授认为未来的电子政府将把流程而非职能作为基本单位，从金字塔式管理模式转向扁平的网络模式，政府层级间的横纵整合、部门间的信息共享将成为趋势。第二块“大数据下的应急管理网格研究”中，樊博教授以他自己最近亲自参与的案例为例，展示了如何利用消防部门的出警数据寻找地理空间因素与火灾风险的关联性，并进而搭建出风险预警的网格模型。第三块“大数据下的应急恢复力研究”中，樊博教授以他与学生合作完成的研究为例，展示了如何利用人民广场地铁站刷卡数据来计算不同时间段的人流量概率分布，相应开启的安检闸机数量并最终求出为了应对灾害发生而需要储备的“冗余”闸机数量。

在点评环节，季卫东教授首先表达了对樊博教授的感谢。同时谈到触类旁通的两点感想，一是由灾害应对中冗余资源的必须存在联想到最近的员额制司法改革把法官推向负荷极限，把“冗余”的司法资源统统砍掉。二是赞赏灾害恢复力的概念。评议人朱芒教授首先提出一点疑惑，城市管理水平是否等同于技术水平？是否上海通过投入最强的技术力量，就能在社会稳定等城市管理诸方面超过纽约、巴黎？换言之，在政府的整体功能没有改革的前提下，用扁平化的方式提升行政效率能否解决一切问题？

此外，朱芒教授提出了大数据应用于城市管理可能给人权保障带来的挑战，比如通过智能手机进行信息采集带来政府服务的不公平、地铁刷卡数据的隐私权和安检的合法性、信息共享平台下法外因素的考量等等问题。归结来说，中国面对行政效率提高和法治国家建设的双重课题，不可偏废其一。李学尧教授在评议时谈到从火灾预警系统联想到犯罪预警系统，用人际关系数据代替空间关系数据，或许将会是公共管理的下一步方向。此外，由灾害应急的恢复力可以联想到朝代更替的恢复力，而法律制度应该是社会恢复力的重要变量。

在提问环节，提问者分别提出了应急网格研究中地理信息特征是人抓取还是机器抓取、应急恢复力研究中人流分布的泊松模型如何选取，以及企业对数据的垄断是否构成对《反垄断法》的违反等问题。樊博老师耐心对选取的研究案例进行了解释，并鼓励法学院的学生对大数据应用的合法性问题展开研究。

讲座最后，季卫东教授又高屋建瓴地归纳了今后如何推动公共管理和法学领域对话的若干可能话题。如冗余资源配置的根据，风险大数据的种类，环境污染的风险，交通整顿中市民的守法意识，城市灾害的应对以及企业产品责任的认定等。法社会学需要理论介入，但更重要是归纳性思考，而学者的价值在于能不能慧眼识珠，找出理论规律。樊博教授再次对法学院的要求表示感谢，并坦承说，管理学的思路是对既存事物优化，可一样事物该不该存在会不会存在，是管理学不考虑的，因此有许多要向法学请教的地方，也希望未来有更多合作的机会。

第四讲

2018年6月19日，“法的交叉学科沙龙”第4讲在凯原法学院顺利举办，上海交通大学科学史与科学文化研究院院长江晓原教授以“科学出版暴利的背后：从开放存取到掠夺性期刊”为主题做报告。讲

座由季卫东教授主持，高全喜教授、王先林教授担任评议人。

江教授以国际科学期刊出版中的“开放存取运动”为切入，首先介绍了近些年来大批涌现的开放存取期刊的运营机制和利润空间。他认为，从实际运营的情形来看，“开放存取运动”的存在模式主要体现为：对论文的阅读者（使用者）免费，论文的撰写者（发表者）付费，论文的一部分出版者可以大幅盈利。在开放存取期刊的实际运营中，后两者是紧密结合在一起的，只有=进入了SCI的开放存取期刊才可以收费，收费的“主流区间”在每篇论文1500～5000美元之间，收费基本上和该刊的影响因子高低成正比。SCI以外的开放存取期刊通常就无法收费，但因开放存取期刊运营成本极为低廉，所以仍然可以大面积存活。通过揭示开放存取期刊背后的商业利益驱动，以及开放存取期刊对学术生态的破坏效应，江教授在此基础上以翔实的实证研究为基础向大家揭示了国外不良期刊对中国科研经费的惊人掠取，由此揭开“开放存取运动”的真面目。

随后，江教授通过一系列数据和表格的分析指出，“开放存取运动”的实质在于期刊出版商通过运营开放存取期刊无限制地发表低端论文谋取暴利，为此不惜严重损害科学出版的学术生态。 “开放存取运动”未在中国大行其道，这应该视为中国科学期刊界的幸运；如果国际科学共同体还有自我修复能力，“开放存取运动”终将盛极而衰，他在讲座中反复认真地告诫中国的科学期刊千万不要去“趟这滩浑水”。在点评环节，王先林教授和高全喜教授分别从经济法规制和科研创新与发表平台的角度谈论了自己对于“开放存取运动”的看法，讲座的参与者热烈讨论、积极提问，现场效果极佳。

第五讲

2018年10月15日，“法的交叉学科沙龙”第5讲在凯原法学院举办，哥伦比亚大学中国法研究中心主任李本（Benjamin Liebman）教授以“中国法院裁判文书的大数据化：如何把文本作为数据”（Mass Digitization of Chinese Court Decisions: How to Use Text as Data in the Field of Chinese Law）为题，报告了其团队的两项近期研究。整个演讲围绕两个主题展开：首先，我们能从既有数据中学到什么？其次，研究者该如何使用司法数据？讲座由季卫东教授主持，由程金华教授担任评议。

李本教授介绍的第一项已完成研究基于105万多份河南省的法律裁判文书。该项研究的起始问题是：数据库中包含什么、遗失了什么，又该如何解释不同法院之间在裁判文书披露上的差异？首先，李本教授团队搭建的数据库，包括了从河南省高级人民法院网站上下载的全部先于2015年的司法裁判文书，其中绝大多数案件出现在2006年到2015年之间，而2015年之后的裁判文书则被最高人民法院司法裁判文书网收录。除了判决书和裁定书外，这百万份司法裁判文书还包括函书、强制医疗通知书、申诉通知书、减刑假释通知书、拘留通知书等，这些文书在过去完全被研究中国法院的西方学界忽视，并且随着2016年《最高人民法院关于人民法院在互联网公布裁判文书的规定》的出台在未来将有更大范围的公开。这个数据库遗漏了什么？2014年河南省法院工作报告载有相关数据表明，仅有41%的审结案件被公开，即便考虑到河南约25%的民事案件以不上网的调解书结案，依然有约三分之一本应该上网的裁判文书未得到解释。此外，该如何解释一省之内不同法院之间实践上存在的

较大差别（从15%到83%不等）？李本教授笑称，人均GDP和人口总数在解释此一差别时不具备统计上的显著性，反倒是通过非正式研究发现法院领导的角色具有很大的解释力，一语引起全场会心的笑声。

紧接着李本教授又介绍了还在进行之中的、基于全国4000万份裁判文书的第二项研究。这项研究采用基于无监督机器学习技术的结构主题模型包（Structural Topic Model package）对文本主题进行识别，其目的在于深化对于跨时间、跨区域法律现象的了解。所谓主题模型，是一种把重复出现的文本字样（text pattern）找出来之后人工标记（tag）主题的研究工具，比如把宅基地、建房、宅基、使用权、使用、居住、村民等词同时出现的文本手动全都标记为宅基地主题等，一个文本中显然可以同时含有多个主题。一项以2万5千多个河南行政诉讼文书为对象的主题模型研究更新了学界既有的对中国行政诉讼的认识，比如集团诉讼和起诉警察不作为等创新性诉讼策略的增加，以行政诉讼为表、以向民事第三人追偿为里的“行政诉讼民事化”现象等。另一项拓展到全国范围行政诉讼的主题模型研究则试图找出2015年《行政诉讼法》修改前和修改后起诉案件类型的变化，随着《行政诉讼法》修改后立案标准的降低，新增案件似乎并没有集中出现在某些特定主题领域，那么到底什么因素导致了案件数量的增长，以及法院是否在依靠程序裁定来应对办案数量的压力？面对这些悬而未决的问题，李本教授坦陈数据更多提供了问题而不是答案，而答案可能更多需要对高透明度法院进行定性研究来获知。

在评议和提问环节，程金华教授首先点出，李本教授对中国司法裁判文书的研究并非追赶学术时髦的举动，而是多年来在河南等省份所做定性研究的自然延伸，因此较之普遍以“威权法治”（Authoritarian Legality）等理论来描述中国的西方学界，有着更强的在场感。程老师同时又指出，李本教授所使用的裁判文书数据应该算作大量数据而不是大数据、包含着结果信息而不是过程信息。在随后的回答环节，李本教授谦逊地请教该如何使用如中国裁判文书这样大量、不全的数据，程金华教授提议可以先聚焦到一两个案由进行分析。在观众提问环节中，听众中来自法院的法官对如何使用主题模型非常感兴趣，而来自安泰经管学院金融系的年轻老师则提出建设性的学术批评，认为量化研究应从假设而非数据出发。季卫东教授最后总结发言，认为从中国裁判文书网在2014年上线起，中美学者应该是从同一条起跑线上开始做研究，借助着“司法大数据与中国审判能力和审判体系现代化”的国家重大社科基金项目和亚行项目，中国的法社会学学者也应当在借助主题模型等技术手段进行司法裁判文书分析上有所斩获。整场讲座中，李本教授以其娴熟的汉语一一回答了提问，其和善的笑容和随处的幽默都散发着学术和人格魅力。讲座在全场观众的热烈掌声中结束。

文档下载新建 Microsoft Word 文档