孙晓勇 | 司法大数据在中国法院的应用与前景展望
发布日期:2021-08-20 来源:《中国法学》

作者简介:孙晓勇,国家法官学院院长

内容提要

人民法院积极适应信息技术革命,推动建立司法大数据管理和服务平台,在服务司法审判实践、提升审判管理质效、建立阳光司法机制、深化应用法学研究、助力科学决策等方面进行了积极有益探索。同时,司法大数据的应用也面临一些挑战,应进一步加强对数据的利用和管理,提升数据处理能力和数据质量,重视法律和数据技术复合型人才培养。未来的司法大数据应用,将秉持“服务司法实践、服务公众需求、服务社会发展”的理念,立足于提升司法大数据应用效能,朝着“使法院更健康,使法官更健康,使社会更健康”的趋势发展,在助力提升审判体系和审判能力现代化水平以及社会协同治理能力、优化社会治理模式方面发挥更大作用。

关键词:大数据  司法大数据  智慧法院  人工智能

司法是大数据最为重要的应用领域之一。2012年以来,中国的司法大数据建设实现了跨越式发展,成为中国司法“亮丽的名片”。相较域外而言,我国在司法数据的体量和数据公开方面具有明显优势,不仅收集、生成了海量的司法数据,还通过中国裁判文书网向公众公开。我国智慧法院建设呈现出地方试点、技术治理与国家推进相结合的“中国特色”,既保障了中国智慧法院建设的先进性,也提升了智能技术在司法领域应用的深度和广度。可以说,我国法院信息化建设已突飞猛进,成为司法大数据应用大国。通过发掘蕴藏于司法大数据中的丰富信息,探索司法案件与社会活动、政府行为之间内在的关联与规律,是人民法院延伸司法功能、积极服务国家治理的创新举措。如何深化司法大数据在中国法院的应用,进而使之更好地为司法工作赋能助力,实现智慧法院的建设目标,既是一个实践课题,也是一个重大研究课题。

一、司法大数据的概念与发展历程

(一)面向法院的司法大数据司法大数据是一个处于不断发展变化之中的新生事物。关于司法大数据的概念,目前并没有达成充分共识。本文所探讨的司法大数据主要是指面向法院的司法大数据,即全国3500多家法院、1万多个人民法庭在司法工作中形成的审判流程、执行信息、法律文书、庭审活动信息、司法政务、司法人事、外部协查等数据的总和及其关联关系。这些数据既包括审判执行活动中每天录入或产生的案件基本情况等结构化信息,也包括诸如起诉书、裁判文书等半结构化数据(大部分法院已经对文书进行了OCR识别),还包括庭审活动录音录像、图像视频类证据等非结构化数据。人民法院将这些数据以信息化的方式进行存储和一体化管理,建立数据完整度模型,使用全要素质量评估方法进行数据质量校验和控制,挖掘案件、人员、财物、外部信息等数据之间的关联关系,探索蕴藏其中的司法活动和社会发展规律。

从数据的面向对象看,司法大数据可分为面向内部的全量数据仓库和面向外部可公开信息形成的较全量数据仓库。内部全量数据是以最高人民法院的全国大数据平台以及各高级人民法院和有条件的中级人民法院的大数据分平台为基础的海量数据,主要为内部司法人员提供大数据分析类服务。外部较全量数据是以中国裁判文书网、中国庭审公开网、中国执行信息公开网和中国司法案例网等为基础的全国法院可公开的案件数据,是社会公众了解相关信息以及研究人员进行司法大数据研究较为全量的数据仓库。外部数据仓库是内部数据仓库的子集,这两类数据均具有数据量大、种类多、实时性强、价值大等基本特征。

从数据来源看,司法大数据主要包括以下几类:一是审判流程类数据,是法院审判案件过程中每一个节点产生的结构化信息,比如立案时产生的案号、案由、原被告信息等等。二是执行信息类数据,是法院在执行办案各环节中所产生的结构化信息或公开信息,比如案件基本信息、失信被执行人、限制消费人员、财产处置信息等。三是法律文书,是法院审理案件过程中根据司法程序依法接收或产生的各类文书,此为结构化或半结构化数据,比如起诉书、应诉通知书、开庭公告、庭审笔录、裁判文书等。四是庭审活动信息类数据,是法院开庭审理案件过程中产生的用以记录庭审活动的数据,比如庭审音视频信息、庭审笔录等,此为半结构化或非结构化数据。五是司法政务人事类信息,包括法院组织架构、人员信息、司法行政装备、工作动态、内部文件运转、司法统计等,是人民法院进行政务管理和公开的重要内容。六是外部协查类数据,是法院审理案件过程中依靠外界提供的数据信息,比如执行查控中当事人的存款、不动产、金融理财产品、船舶、车辆、证券、网络资金等信息,文书送达中根据身份证号信息从电信部门获取的电话信息、公安人口库信息等。

(二)司法大数据的发展历程

习近平总书记多次强调,“面对信息化潮流,只有积极抢占制高点,才能赢得发展先机”,“要运用大数据促进保障和改善民生”,“要运用大数据提升国家治理现代化水平”。2019年1月,中央政法工作会议上,习近平总书记再次强调,“推动大数据、人工智能等科技创新成果同司法工作深度融合”。习近平总书记的高度重视,极大地推动了大数据在各领域的应用,为新时代加强司法与大数据的融合应用指明了方向,给人民法院司法工作创新发展带来了广阔前景。近年来,人民法院深入贯彻习近平法治思想,认真贯彻落实习近平总书记关于实施国家大数据战略的重要指示精神,积极拥抱信息技术革命与数字时代带来的机遇与挑战,秉持“大数据、大格局、大服务”理念,历经初步探索、平台建设、深化研究、应用推广和创新发展等阶段,积极推进国家大数据战略落实,为司法大数据的挖掘、分析、应用奠定良好基础。

1.初步探索阶段

最初的司法数据分散在人民法院各个应用系统中,仅仅用于记录内容、报送审签,人们尚看不到大数据的影子。各地法院在司法实践中,逐步认识到数据汇聚对审判辅助、审判管理将起到的重要作用。2008年,浙江省高级人民法院启动实施案件数据大集中工程,完成了全省三级法院审判业务系统的数据集中。同年,重庆市高级人民法院开始汇聚全市法院审判、政务、队伍等应用系统信息及其他关联数据,建成全市法院数据云中心,为法院工作提供基础的司法管理、动态监控管理等服务。2013年5月,北京市高级人民法院建成“信息球”,实现了全市三级法院审判数据的全自动采集、各类统计表的全自动生成以及审判业务运行态势全面分析。地方法院在司法大数据方面的实践与探索,为最高人民法院建设全国法院数据集中和管理平台建设积累了有益经验。

2.平台建设阶段

2013年,最高人民法院印发《人民法院信息化建设五年发展规划(2013-2017)》,明确提出建设国家司法审判信息资源库,决定筹建全国法院数据平台。随即,最高人民法院印发《关于报送人民法院案件信息数据有关问题的通知》,要求高级人民法院报送辖区法院2010至2013年案件数据,完成了数据平台建设前的初始数据积累。基于此,最高人民法院建立了数据自动生成、数据质量保障、数据比对反馈、数据动态展现等四类数据管理机制,初步实现了全国法院数据的自动入库、自动质检、自动反馈数据质量和自动计算等重要的数据汇聚功能。2013年底,建成人民法院数据集中和管理平台,实现每日大约7万件新增案件数据实时上传平台。2016年7月,数据集中和管理平台升级为大数据管理和服务平台,平台功能由数据汇聚、简单数据分析向大数据分析、专题分析、大数据服务升级,平台可从审判业务数据自动生成11大类153套2.2亿组司法统计图表,并向全国法院提供大数据分析服务。2016年底,贯通全国法院的数据质量管理体系全面形成,案件结构化数据置信度长期稳定在99%以上,人民法院历史上首次实现全国法院司法统计报表由大数据平台自动生成,改变了传统上完全依靠人工逐级填报的司法统计模式。

3. 深化研究阶段

基于人民法院大数据管理和服务平台收集的海量司法数据,大数据平台本身的司法分析已经难以满足司法实践、司法研究和社会治理等大数据服务的需要,同时大数据平台的海量司法数据已经越来越受到社会各界关注。2016年7月,最高人民法院在江苏省高级人民法院、东南大学设立人民法院司法大数据研究基地,对司法大数据进行应用研究。同年9月,最高人民法院司法案例研究院挂牌成立,同步公开运行中国司法案例网,开展司法案例大数据研究,统一法律适用,强化案例指导制度。同年11月,最高人民法院信息中心联合中国电子科技集团有限公司成立中国司法大数据研究院有限公司(以下简称“中国司法大数据研究院”),从事司法大数据决策支持、产品孵化等相关研究。截至目前,中国司法大数据研究院已研究发布了967项司法大数据研究成果。中国司法大数据研究走向了实体化、规模化、专题化研究阶段。

4.应用推广阶段

在最高人民法院积极推动和示范引领下,地方各级法院对司法大数据从探索尝试走向全面分析和深度应用。2016年4月27日,最高人民法院印发《关于申报司法大数据专题任务的通知》,要求高级人民法院积极申报专题研究,携手构建数据研究新格局。目前而言,大部分法院已经能够基于地方大数据平台开展司法统计、收结存统计分析、审判态势分析、即席分析统计等审判管理工作;一些法院通过对数据资源进行关联融合,形成了案件前审后续、涉诉当事人情况分析、执行线索分析等数据服务能力;一些法院上线了包含量刑推荐、偏离预警等功能的审判辅助系统;一些法院具备了诉讼风险评估、判决结果预测等基于司法大数据的智能分析能力;还有部分法院通过深入挖掘海量案件信息,获得常规难以发现的数据信息,推动解决执行难等问题,为社会治理中的痛点、堵点、难点问题提供解决线索。大数据在各地法院的积极推广应用,已经成为推动法院改革发展的重要力量。

5.创新发展阶段

2021年,最高人民法院发布的《人民法院信息化五年发展规划(2021-2025)》要求,基于大数据管理和服务平台,将构建司法数据中台、智慧法院大脑和司法链综合平台,全面拓展数据和知识服务。智慧法院大脑将汇聚人民法院已有和将有的人工智能共性能力,为各类应用提供智能化支持;司法数据中台将分布管理和分析人民法院各类数据,为各类应用提供接口服务、数据服务、知识服务、决策支持;区块链综合平台将面向各级法院和社会公众提供统一数据存证和验证能力,提升司法公信和司法效率。司法大数据的出现与应用,不仅为司法机关赋能增效,还打破了研究机构长期以来数据匮乏或数据垄断的局面,研究数据更“触手可及”。司法公开数据支撑司法研究,形成了一个产、学、研相结合的体系,通过不断深化应用法学研究、拓宽研究方法与场域,切实服务法学教育、法学研究、司法科技创新。我国司法大数据研究也开始从单一的法院内部向由法院、高校、研究机构、律所、企业、创新团队等构成的复合型团队转变,推动了法学、计算机科学、社会学、统计学、自然科学等多学科交叉融合发展。我国的司法大数据,特别是向社会公开的裁判文书、庭审直播等数据也同样引起了海外一些研究机构的关注和研究,在助力人民法院传播中国法治好声音、构建国际法治话语权方面发挥了独特作用。

二、人民法院的司法大数据应用场景

在以习近平同志为核心的党中央坚强领导下,在最高人民法院统筹、各级人民法院共同努力下,“十三五”期间智慧法院建设取得跨越发展,在“十二五”时期建成的以网络为中心的人民法院信息化2.0版基础上,转型升级建成了以数据为中心的人民法院信息化3.0版,形成了全业务网上办理、全流程依法公开、全方位智能服务的智慧法院。中国法院信息化已经在全世界法院树立了网络覆盖最全、数据存量最大、业务支持最多、公开力度最强、协同范围最广、智能服务最新的样板,为信息时代的世界法治文明提供了中国方案,贡献了中国智慧。人民法院的数据管理和服务能力大幅提升,司法大数据应用也取得积极成效,产出诸多成果,带来系列变化,推动智慧法院建设向智能化方向发展,为服务司法实践、服务公众需求、服务社会发展提供有力科技支撑。

(一)推进审判工作的高效化、智能化与精细化

司法大数据在中国法院最基础的应用,在于通过对案件的前审后续关联,可以查看到当前案件的基本信息、一审或二审的相关情况及电子卷宗信息,为法官全过程研讨案情、掌握案件脉络提供支持。而它更多更深层次的运用在于通过大数据挖掘分析建立起智能辅助办案系统,打通政法部门之间跨部门、跨系统的智能办案体系,其主要服务对象是包括法官在内的政法工作群体。申言之,司法大数据在裁判文书自动生成、文书自动纠错等领域的运用极大地提高了审判效率;司法大数据在类案推送、量刑辅助、偏离预警、判决结果预测等领域的运用提高了办案质量,促进了公平正义;司法大数据在证据方面的运用有效破除了数据壁垒,统一了公检法之间的证据标准,有力推进了以审判为中心的刑事诉讼制度改革。

一是有助于提升司法质效。为满足人民群众更高水平的公平正义,人民法院不断加强信息化建设,将大数据、自然语言处理等技术融入到司法审判中,研发出裁判文书辅助生成、类案智能推送等系统,作为解决“案多人少”矛盾的重要手段。裁判文书辅助生成系统是将起诉书、庭审笔录、证据等案件信息以及法律法规输入,通过对案件相关文书分析和信息智能提取,按照对应案由的文书模板自动生成裁判文书的初稿。法官不用再对照纸质卷宗摘录出相应的文书撰写所需事实信息、诉辩主张、法律适用等内容,大大提升了法官撰写裁判文书的效率。法官可以将节省的时间用来办理更多的案件,也可以有更多精力专注地投入到文书说理的撰写中。以河北法院为例,自2016年7月裁判文书辅助生成系统上线至2021年5月,河北190家法院的1.4万余名法官使用该系统,辅助生成裁判文书270余万份,法官反映至少减轻了30%的工作量。2018年1月,中国司法大数据研究院在最高人民法院指导下研发了类案智能推送系统。从实际操作层面看,该系统最大程度满足了2017年8月《最高人民法院司法责任制实施意见(试行)》中提出“承办法官在审理案件时,应当进行类案与关联案件检索”的要求。类案智能推送系统以海量司法大数据为基础,通过多维类案要素匹配进行类案智能推送。该系统主要用于解决类案查找过程中面临的精准性问题,辅助用户快速构建案件的语义画像(包含案由、案件事实、争议焦点、法律适用等要素),并基于语义画像从海量历史案件中发现相似案件,面向法官、检察官、律师、社会公众提供专业、智能、精准的类案推送服务。在类案推送的精准度方面,做到全案由文书数据整体搜索推送准确率达到63.7%,民事、刑事Top10类型的准确率达到85.5%,其中以文检索全案由整体准确率61.6%,热门类型案由整体准确率81.8%。高精准度和全覆盖性的类案推送系统可以快速帮助法官确定可供参考的裁判规则、裁判尺度、裁判理由,降低疑难复杂案件撰写中对法官在事实判断、价值判断、法律适用、文书说理上反复斟酌的难度,有效促进司法为民、提升司法质效。

二是有利于维护司法公正。同案不同判预警是对法官裁判结果偏离度的分析提醒。它通过主动介入审判过程,采取一定算法,模拟法官裁量权的实施过程,利用同类案件的集体决策的方式保证结果的可靠性,结合统计机器学习方法和专家规则方法,避免了单一决策的随机性误差,维护裁判规则的统一性。当分析结果出现较大偏离度时,系统会自动提醒法官注意同案不同判的存在,法官可据以纠偏;也可据以分析是否为“同案”或“类案”,从而评估是否应当予以“同判”。同时,审判监督也可以运用类案不同判预警系统检查法官的判决结果,有效提醒预警,促进裁判尺度统一,增强司法公信力。同理而言,量刑规范化亦是如此,系统可以智能识别提取犯罪事实和量刑情节,自动推送关联法条和类案,自动依据历史量刑数据推荐量刑,自动生成程序性法律文书和框架性裁判文书,以及多维数据统计等。此外,裁判文书智能纠错系统可大大降低低级错误的发生概率。如,上海法院的裁判文书大数据智能分析系统,实现对裁判文书中61项要素的智能分析,发现人工评查不易发现的逻辑错误、诉讼请求遗漏、法律条文引用错误等问题,推进文书智能化纠错,助力司法公正。2019年10月,最高人民法院为统一法律适用,保证裁判质量,维护司法公正,印发《进一步加强最高人民法院审判监督管理工作的意见(试行)》,全面推行“类案及关联案件强制检索”制度,要求承办法官在办理案件时,对已审结或者正在审理的类案与关联案件进行全面检索,并制作检索报告。

三是有利于推进以审判为中心的刑事诉讼制度改革。通过数据交换、信息共享与业务协同,破除政法部门之间的数据壁垒,统一公检法之间的证据标准。如,在上海市委政法委统筹协调下,上海市高级人民法院牵头研发刑事案件智能辅助办案系统(又称“206系统”),着力解决刑事案件办案中存在的证据标准适用不统一、办案程序不规范等问题。“206系统”在打通公安、检察、审判机关数据流转通道基础上,将统一适用的证据标准指引、证据规则指引嵌入刑事办案系统中,做到证据同步校验、瑕疵及时提示、流程智能卡控,确保提请逮捕、移送审查起诉的案件事实证据经得起法律检验,促进政法机关跨部门业务协同,提升办案质量和效率,有效防范冤错案,减少司法任意性,推进实现以审判为中心的刑事诉讼制度改革的目标。截至2020年底,“206系统”建设应用基本实现三个100%目标:证据标准指引覆盖常涉罪名达到100%(已完成102个罪名证据标准指引,包含上海地区常涉71个罪名)、上海地区常涉罪名案件录入系统达到100%(凡在71个常涉罪名范围内的案件均要求录入系统)、一线办案干警运用系统办案达到100%。上海地区常涉罪名的刑事案件办理已实现从立案、侦查、报捕、起诉、审判均在“206系统”内运行,系统累计录入证据材料2400万余页,提供证据指引54万余次,提示证据瑕疵4.8万余个,公安录入11.5万余件,检察院审查起诉5.8万余件。最高人民法院总结上海法院试点建设经验,于2018年在全国法院推广建设刑事案件智能辅助办案系统,促进跨部门业务协同。

(二)推进执行工作的集约化、标准化与规范化

大数据时代对于人民法院执行工作的意义在于,要求法院执行部门全面掌握涉执行工作全流程信息,提升数据处理效率,分析数据、挖掘数据、共享数据、利用数据,进而服务于执行工作,特别是促进解决执行难。而这一类数据,很大一部分属于司法大数据范畴里的外部数据。人民法院依托大数据技术,建立了覆盖全国、基本囊括被执行人主要财产形式的网络化、自动化的查控系统,解决查人找物难的问题;建立跨地区、跨部门、跨领域的联合惩戒机制,解决当事人逃避执行、隐匿财产的问题。“从网络查控涵盖财产信息范围之广、执行员使用之便利等方面来看,显然已经超过了绝大多数西方发达国家。”以往需要法院派员外出甚至远赴外地调查、搜查、控制可供执行的财产,如今已在相当程度上被执行员利用“总对总”“点对点”查控系统所替代。通过执行信息化、执行大数据的运用,人民法院执行工作已悄然发生了深刻的变化。

解决执行难问题,首要难题在于查人找物。传统“登门临柜”的查人找物模式,耗时费力、成本高昂、覆盖有限、效率低下,导致大量案件难以得到实际执行,当事人的合法权益难以得到实现,必须探索信息化时代“查人找物”的新模式。为此,在深圳、福建等地方法院的前期探索下,最高人民法院开始构建执行大数据共享机制,使大数据共享实现制度化:一方面,打破法院地域限制,实现执行数据在全国法院的全面共享与互通;另一方面,与社会数据资源形成共享大数据资源池,人民法院与国家和社会性机构建立了大数据共享。基于此,人民法院依托大数据技术,建立覆盖全国、基本囊括被执行人主要财产形式的网络化、自动化的查控系统。2014年12月24日,最高人民法院正式开通了“总对总”网络查控系统,经过6年多的努力,现在的网络查控系统各项功能得到全面提升,实现了对被执行人主要财产形式的“一网打尽”。一是目前已基本实现对所有银行业金融机构的全覆盖。可查询的银行从2014年底的20家,扩展到现在的3900多家,农村信用社、城镇银行、外资银行均被覆盖在内。二是可查询的信息种类丰富。从最初的单一银行存款,扩展到现在的与中国人民银行、公安部、自然资源部、银保监会等16家单位、3900多家银行,可查询16类25项信息。三是覆盖面大大提升。形成以最高人民法院“总对总”为主体,以地方法院“点对点”为补充的查控体系,实际应用查控系统的法院由过去的30%扩展到现在的100%。截至2020年12月底,全国法院通过网络查控系统累计查控案件9000.99万件,累计冻结资金13219.58亿元,查询房屋、土地等不动产信息18950.07万条,车辆11964.50万辆,证券13899.58亿股,渔船和船舶369.03万艘,网络资金561.71亿元。实践证明,最高人民法院“总对总”查控体系的查人找物效果是传统模式无法想象的,在全世界是独一无二的,充分体现了中国的体制优势,也充分说明了司法大数据技术应用的巨大潜力。

解决执行难问题的第二大难题,在于应对当事人逃避执行、隐匿财产行为。实践中存在较高比例的被执行人逃避执行、规避执行、抗拒执行、藏匿财产的情况,有的甚至无所不用其极。这其中很多问题是没有办法通过查控解决的。因此,通过实现信用信息公开和共享,建立跨地区、跨部门、跨领域的联合惩戒机制是解决问题的关键所在,而这一惩戒机制的落地实施,必须依靠全社会相关资源的大数据共享、业务协同。依托大数据共享平台可以描绘出失信被执行人身份、信用情况的大数据画像,当失信被执行人进入各部门职责范围内时,可对其进行自动识别、控制、拦截,实现大数据联动惩戒。

最高人民法院于2013年出台相关司法解释,建立了失信被执行人名单制度,即“黑名单”制度,推动对失信被执行人进行联合信用惩戒,以此不断压缩失信被执行人逃避执行、规避执行、抗拒执行的空间,让失信被执行人“一处失信、处处受限”,迫使其主动履行法律文书确定的义务。失信被执行人名单制度,对推进精神文明建设和社会诚信体系建设都具有极其重大的意义,得到社会各界的高度肯定,成为信用中国建设的一大亮点。2016年6月27日,习近平总书记主持召开中央全面深化改革领导小组第25次会议,审议通过《关于加快推进失信被执行人信用监督、警示和惩戒机制建设的意见》,强调要建立健全跨部门协同监管和联合惩戒机制,完善失信被执行人名单制度。2016年以来,最高人民法院与国家发改委等60家单位签署文件,采取11类150项惩戒措施,对失信被执行人担任公职、党代表、人大代表、政协委员以及出行、购房、投资、招投标等进行限制。通过与相关单位数据信息共享,互联互通,实现对失信被执行人自动识别、自动拦截、自动惩戒,真正让“老赖”无处遁形,让限高人员限制消费。依托司法大数据支撑的失信被执行人名单制度,得到社会各界的广泛认同,是我国社会诚信体系建设的重大突破,是推进国家治理体系和治理能力现代化的重要举措和重大创新,这也是司法大数据中执行数据与外部数据共享、共治、融合、联动之后形成的威慑能力。

(三)推进诉讼服务的智能化、高效化与便捷化

大数据同一站式多元解纷与诉讼服务工作的深度融合,有力推动了人民法院诉讼服务建设进入更加便捷、透明、高效的“智慧时代”。人民法院借助于司法大数据,践行以人民为中心发展理念,将智慧法院建设成果应用到传统司法模式之中,以互联网、大数据、云计算为基础,构建一种新的在线诉讼服务模式,立足于人民群众多层次、多样化的司法需求,聚焦人民群众反映强烈的立案难、诉讼难的堵点、痛点问题,优化甚至重塑网络场景下的诉讼程序和司法规则,打通司法服务“最后一公里”,最大限度消除当事人诉讼不便,更好地实现司法正义,努力让人民群众在每一个司法案件中感受到公平正义。

一是大数据提供诉讼风险评估。在诉前阶段,可以利用大数据为当事人提供诉讼风险评估分析:通过深度分析用户的诉讼行为,挖掘用户的个性化需求,为社会公众提供类案检索、诉讼策略推荐等精准化的诉讼服务;通过挖掘海量司法数据,为社会公众提供诉讼风险分析、诉讼结果预判、诉前调解建议等服务,引导当事人选择更为经济的纠纷解决方式,有效促进矛盾纠纷多元化解与诉源治理。当前,诉讼风险评估系统已在很多法院应用,当事人可以进行案情有关描述的选择,提交完成后获得通过大数据分析生成的法律建议书,其中包含法律意见、行动建议、法律法规以及类案参考等内容,并科学提示当事人采取调解或诉讼等不同解纷途径所花费的时间、经济成本,提醒当事人结合自身实际情况理性选择,鼓励当事人对适宜调解的案件,通过诉前调解方式解决纠纷,这也是通过大数据智能预测、风险评估的能力鼓励当事人选择非诉方式解决争端的有效实践。通过提供诉讼风险评估,司法大数据还可以最大程度的消除信息不对称,实现诉讼相关信息在当事人与诉讼代理人之间的公开、透明、共享,促进诉讼代理人工作朝更加规范化、精细化、高效化方向发展。

二是大数据能有效识别虚假诉讼、恶意诉讼。目前,利用司法大数据,在立案阶段就能实现虚假诉讼的提前预警、准确识别及有效应对。而在全国法院数据没有联网、没有大数据、没有案件关联的情况下,这些是不可想象也是不可能实现的。这一应用主要是通过大数据技术对当事人、案件基本信息等情况进行数据分析、关联案件检索等,掌握当事人的涉诉情况,为当事人虚假诉讼、恶意诉讼、涉众型诉讼的发现提供技术支持,增强预测预警预防虚假诉讼、恶意诉讼的能力和水平,做到早发现、早处置,把风险隐患消灭在萌芽阶段。比如,江苏省高级人民法院研发的“套路贷”虚假诉讼智能预警系统,运用云计算、大数据、NLP(自然语言处理)和智能算法等技术,实现对风险人员、风险案件的智能识别与预警,辅助法官精准高效甄别防范“套路贷”虚假诉讼,助推对“套路贷”虚假诉讼活动的有效打击和源头防范。

三是大数据让多元解纷更加便捷高效。各级人民法院认真贯彻落实习近平总书记“坚持把非诉讼纠纷解决机制挺在前面”的要求,紧紧围绕党的十九届四中、五中全会提出的“坚持和完善共建共治共享的社会治理制度”“完善人民调解、行政调解、司法调解联动工作体系”“构建源头防控、排查梳理、纠纷化解、应急处置的社会矛盾综合治理机制”等重大部署,以人民法院调解平台建设为抓手,为人民群众提供线上高效率、低成本的纠纷解决方案。2018年2月上线的人民法院调解平台打破数据孤岛,与其他相关部委调解网站实现对接,完成相关调解组织和调解员的平台入驻,不但可以广泛集合法院审判资源和社会调解资源,为当事人对调解员提供更多的选择,更重要的是调解员通过平台的大数据智能比对与分析,可以快速获得当事人画像、精准调解案例参考、精准法条推荐、精准裁判文书参考等,从而汲取大数据智慧,使每一个调解员拥有了“军师”“智囊”。这与传统的工作模式大不相同,形成人民法院多元解纷力量大合奏,司法大数据赋能带来了显著的进步。截至2021年5月底,人民法院调解平台累计汇聚调解案件1765万件,调解成功率65%,平均调解时长24天。

四是大数据让诉讼服务更加便民利民。人民法院积极推动网上立案、网上缴费、网上证据交换、网上开庭、电子送达、网上调解等诉讼活动,极大方便了诉讼参与人的诉讼活动。网上诉讼服务平台是最早期的线上诉讼服务模式,可以支持当事人、律师和法官全部在网上进行诉讼和涉法涉诉信访业务的办理,实现“全业务覆盖、全天时诉讼、全流程公开、全方位融合”的在线诉讼模式变革。同时,为了尽快适应科技变革、方便群众诉讼,最高人民法院在宁波移动微法院基础上,推动全国法院上线了中国移动微法院小程序,实现了“指尖上的诉讼”。依托中国移动微法院,最高人民法院、高级人民法院、中级人民法院、基层人民法院及1万多家人民法庭连接起来形成一张“立案协作网”,实现全国范围内跨域立案和一体化移动诉讼服务,特别是跨域立案,打破了案件地域管辖限制,增强了法院间协作,共同为当事人提供立案便利,让人们可以足不出户就能享受方便、快捷、优质的诉讼服务。为应对网络空间纠纷不断上升的形势,在浙江法院率先探索建立电子商务网络法庭的基础上,杭州互联网法院正式挂牌,其诉讼平台实现与多个电商平台对接,涉互联网案件相关诉讼从立案、送达、举证、质证、庭审、调解到判决、执行全流程在线进行,使当事人足不出户就能在网上参与诉讼,解决纠纷。自2020年1月1日至2021年5月31日,全国法院在线立案1219.7万件,在线立案占全部立案数的28.3%;在线调解总次数651.3万次、诉前成功调解案件614.29万件;在线开庭128.8万次,在线庭审平均用时42.34分钟;电子送达3383.3万次,占总送达次数的37.97%。多种在线诉讼方式切实为人民群众参与诉讼提供了便利,特别是疫情期间,各级人民法院通过移动微法院等平台畅通网上诉讼服务渠道,提供立案、交费、开庭、调解、送达等全方位服务。

司法大数据的便民利民性还突出表现在节能减排方面,大大节约了诉讼当事人与法官的出行和人力成本。最高人民法院从2017年开始对智慧法院建设促进绿色发展和产生的经济效益进行评估,计算指标包括了网上立案、网上缴费、网上开庭、网上调解、跨域立案、网上司法拍卖等服务人民群众的内容,也包括电子卷宗跨院调阅、网络查控、执行委托、远程提讯等服务审判执行的内容。以2019年为例,当年通过电子诉讼、网络查控等信息化手段,减少当事人、法院工作人员出行约67.3亿公里,折算节约出行成本约49.81亿元,减少碳排放约390.44万吨;节约时间约306.48万人/年。这些数据非常直观的反映了司法大数据在人民法院工作中的强大作用,在促进节能减排方面的显著效果。

(四)推进审判管理的自动化、精细化与智慧化

大数据的价值还在于提供科学的方法论,通过数据助推管理变革。通过司法大数据的应用,可以有效地提升审判管理质效,通过构建扁平化的审判管理体系,实现事后监督管理向事前管理、事中管理转变,推动程序管理向实体监管转变。

在审判资源配置方面,司法大数据有利于人民法院掌握审判执行的案件态势和特征,合理配置司法资源。以辅助优化审判资源和提升质效为主线,基于司法审判信息资源开展审判态势分析,动态发现社会矛盾的发展规律及审判实践中突出问题,进而反馈到司法实践予以响应。数据显示,立案登记制改革以来,人民法院案件受理量2016年突破2000万件,2019年突破3000万件,部分法院“案多人少”矛盾尤为凸显。运用大数据可以系统查询了解各地法院、各业务部门的办案情况,开展有效的流程管理、态势分析。例如,运用大数据技术,对办案系统数据进行实时分析和监测,对比立案数据、审理周期等进行分析,预警提示突击结案、虚报结案等引发的系统数据异常波动;新增接近审限和长期未结案件统计查询功能,及时提醒相关法院和法官加快案件办理进度;通过全国法院收结存数据,实时形成全国案件态势,根据全国多发案件类型的数量、区域分布情况,分析经济发展、社会治安等热点问题;通过长期未结案件进行统计分析,实现对案件审理超期的监督管理,进而提出处理意见。

在案件态势发展预测与预防方面,司法大数据可以清晰反映当前某类犯罪的特点和规律,便于有针对性的制定司法措施。比如,对套路贷受害者和犯罪分子分布情况进行分析,有助于更精准地打击和预防犯罪;对套路贷受害者群体的普遍特性进行分析,有助于提出针对性的救助和治理方案。通过分析电信网络诈骗案件数据,能显现出电信网络诈骗的特征,为制定相应防范措施提供有效参考与支撑。此外,最高人民法院司法解释与重大司法政策、司法改革举措的出台,背后都得到了司法大数据分析、研究和支撑的助力。比如,“关于调整一审民事案件级别管辖的标准”如何确定最为科学合理、贴近审判实践与旺盛司法需求的需要且不违背制度设计的初衷,司法大数据的运用与研判就发挥了重要参考作用。

在审判监督管理方面,运用司法大数据还可以提升审判监督管理的自动化、精细化与智能化水平。包括可以科学测定法官、司法辅助人员的工作量,建立相对平衡的办案工作机制;科学设置绩效考评指标,建立相对完善的审判监督管理体系;基于汇聚的司法人事数据和案件数据,推进“人—案”融合关联,建立“人与案、事与人”多维度大综合的人事绩效管理体系,为法官员额制司法改革下的审判资源配置提供定量化的数据支持;运用大数据对法院审判质量和审判效率相关性进行实证分析,有利于科学掌握审判质量和审判效率指标之间的关系,树立正确审判管理理念。如,2018年,最高人民法院上线了“智能审务督察系统”,以审务督察业务应用为主线,对全国法院庭审、诉讼服务等业务活动中的不规范行为进行智能督察。又如,河北省高级人民法院创新研发“重点案件监督管理平台”,制定统一规范的监管规则,建立案件特征识别库,并以此为基础实现大数据自动分析、系统自动标记、平台实时提示、全程在线记录等,确保审判监督管理依法有序、规范到位。再如,浙江省台州市中级人民法院研究开发“台州法院清廉司法风险防控系统”,设置7大类60个审判、执行和综合风险点指标和红黄蓝三色风险预警提示。2021年5月,该系统共计触发56个风险节点监控,较2019年4月减少了77.41%,实现司法廉政风险有效防控。

(五)推进司法公开的主动化、常态化与可视化

司法公开一般有狭义公开与广义公开两个维度。“狭义公开限于审判公开,主要是指庭审公开与判决的公开,广义公开则是指除涉及国家秘密、个人隐私和商业秘密方面的信息外,与审判有关的所有信息公开。”长期以来,无论是在立法,抑或司法实践中,都更为关注狭义公开。近年来,随着司法改革向纵深推入,最高人民法院积极回应人民群众对司法信息获取的需求,以前所未有的广度和深度推进司法公开由狭义的审判公开向广义的司法公开拓展,先后建成全国统一的裁判文书公开、庭审活动公开、审判流程公开、执行信息公开等司法公开平台,越来越多的司法数据向公众开放查询,为人民群众带来“看得见”的正义,拓展了司法公开的广度和深度,让正义更加可感、可知、可见。

中国裁判文书网统一公开各级人民法院的生效裁判文书;中国审判流程信息公开网向当事人及诉讼代理人点对点公开收案、立案、审判组织、审判程序、送达等信息以及文书和庭审笔录,向社会公众公开法官名录、开庭公告、最高人民法院司法解释、各地法院的审判指导性文件等法院公共信息;中国执行信息网公开了全国法院失信被执行人名单信息;中国庭审公开网向社会公众直播全国各级人民法院的开庭审理活动。截至2021年5月底,中国裁判文书网公开的文书总量已达1.19亿篇,访问总量超过了629亿人次,日均新增裁判文书8万多篇;中国审判流程信息公开网累计公开案件4779余万件,公开案件信息项28.85亿余项,访问量5.1亿余人次,流程信息公开率达到99%以上;中国执行信息公开网累计公布执行案件信息410万余条,正在公布失信被执行人647万余人次;中国庭审公开网累计直播庭审1295万余场,访问量超过372亿人次。随着司法公开和信息化建设的深入推进,司法公开平台大数据分析和可视化展示得到不断升级完善。

(六)推进社会治理的科学化、专业化与现代化

传统的治理主要包括决策和实施,通常是按照经验进行决策,然后根据实施过程中所发现的问题进行局部修正。而现代化的治理应该是形成从观察、判断,到决策、实施,再到观察、判断的这样一个完整的、循环的“治理回路”。通过对司法大数据的分析挖掘,可以填补“治理回路”中“观察”和“判断”两个环节的缺失,完善观察视角,实现决策整体闭环,大幅提升决策的科学性和针对性。一方面,司法大数据能够折射或者反映出国家或省市区县的经济社会运行状况,对当地进行“数字体检”,及时发现社会风险隐患或治理成效,有助于提升当地党委和政府决策服务能力,推进社会治理决策闭环。另一方面,大数据是重要的国家基础性战略资源之一,司法大数据正日益成为重要的生产力要素,助推我国社会发展、经济转型、民生安全,为相关决策的制定提供科学支撑。

一是服务社会治理,促进科学决策。全国3500余家人民法院平均每天受理的7至8万件案件现象及其背后特征,是经济社会所产生问题的最终、最真实的客观反映,是辅助重大决策、促进国家治理的重要依据。借助海量司法数据,运用大数据分析方法进行深入研究分析,可以探寻社会矛盾纠纷演变规律,观测到经济社会运行趋势,发现行政管理或社会治理中存在的问题与漏洞,更好服务党委政府科学决策和经济社会发展。

民事审判中的大数据分析报告有助于分析预测社会经济运行态势、社会热点问题等。如,离婚纠纷大数据分析中可以发现,婚后第三年为婚姻破裂的高发期,这与我们日常认知的“七年之痒”差别很大,因此夫妻双方婚后应提早加强沟通、理解,渡过感情脆弱期。同时,数据分析中显示涉“家暴”离婚纠纷案件占离婚纠纷案件的22.44%,且呈逐年上升趋势,婚姻家庭稳定事关社会稳定,这些为婚姻关系维护、公序良俗的引导起到重要参考价值。又如,苏州市中级人民法院通过司法大数据分析,发现20%的金融案件因被告送达地址不明确导致相对正常案件诉讼周期平均增加5个月。经认真分析研判后,苏州市中级人民法院向全市30余家银行发出司法建议书,建议“银行签订金融合同时,增加‘文书送达地址确认书’”,得到银行系统积极响应,使该类诉讼的诉讼周期及诉讼成本都得到了明显降低。再如,2020年新冠肺炎疫情期间,嘉兴市中级人民法院针对重点领域、重大风险开展“专项化”司法大数据分析,向市委市政府和浙江省高级人民法院报送《关于新冠肺炎疫情对我市经济运行和社会治理潜在影响的专题分析报告》,研判、预测辖区中小微企业经营风险、商贸综合体运营风险、房地产企业违约风险、服务行业转型风险、劳动密集型企业用工风险、防控措施行政风险、医疗行业潜藏风险、疫源管理风险、纠纷积压风险等九大风险点,并提出相应的对策和建议,聚焦风险高发、易发的关键领域和环节,加强分析研判、预警预判,切实提升防范化解潜在风险能力水平。

刑事审判中的大数据分析有助于发现刑事案件趋势、社会焦点,促使政府部门采取对应措施。以2013-2017年全国刑事案件数据来看,故意杀人、故意伤害、抢劫、强奸、走私贩卖运输制造毒品、放火、爆炸、投毒等“八类严重暴力”犯罪案件呈现逐年下降趋势,其中2015年下降6.98%,一定程度上反映出近几年全国各地社会治安形势不断好转,人民群众人身安全感明显上升。同时,该数据又显示,交通肇事和危险驾驶案件呈逐年上升趋势,2014年、2015年同比增长分别达到了28.07%、21.07%,这一数据暴露了大众道路安全意识薄弱,急需交通监管和宣传教育的加强。

行政审判中的司法大数据有助于分析政府依法行政的水平,助推法治政府建设。2016年至2020年,全国各级人民法院新收行政一审案件逐年同比增长率为11.31%、11.19%、8.28%、-7.70%,整体呈现增长率放缓直至出现负增长(2020年数字有一定疫情影响)趋势,一定程度上反映了政府依法行政水平在进一步提升。

二是服务科学立法,促进社会治理体系现代化。民之所呼,立法所向。司法大数据可快速反映社会矛盾焦点,为国家有关部门立法和政策制定提供依据。大数据让我们从模糊管理向精准管理,从经验决策到科学决策变成了可能,也让我们能通过量化和前瞻性的方式来做出恰当的决策与行为,从被动“堵漏洞”向主动“防风险”转变,从供给侧向需求侧转变,为善治目标的实现提供了现实的路径。我国经济社会快速发展,新事物、新业态层出不穷,对法律制度的供给也提出了越来越高的要求。传统的立法研究存在调研成本高、时效低、立法效果难以预测等问题。利用司法大数据,可以及时感知社会矛盾,准确把握矛盾焦点,从海量的司法数据中找到纠纷的影响或关联因素、矛盾焦点、发展趋势,让司法数据不断拆分、合并、融汇,最终输出为呈现经济社会发展中矛盾及其剧烈程度、发展特点等规律性信息,科学服务立法需求。

在立法过程中,可借助司法大数据,用数据说话,可以有效提升立法调查研究中的量化分析水平,并预测法律法规的实施效果,从定性走向定量,促进科学立法,从而为顶层设计提供参考与辅助,成为推动治理决策的“方向标”,促进国家治理体系现代化。比如,2013年至2017年,各年度仅使用过1次的刑事罪名占全部罪名的比例是17%至24%之间,其中27个罪名近5年零次使用,有成为“僵尸”罪名的趋势,由此通过司法大数据分析评估暴露僵尸法律法规,为法律法规的制定、修改、完善提供参考。又如,2018年10月底重庆公交车坠江重大事故发生后,中国司法大数据研究院发布《公交车司乘冲突引发刑事案件》司法大数据分析报告。这一分析报告不仅及时回应了人民群众重大关切,也为有关部门出台指导意见,以及刑法对于相关罪名的修订提供了重要参考。

三、司法大数据应用的未来展望

司法大数据在服务司法实践、服务公众需求、服务科学决策方面已取得诸多成效,但随着司法大数据应用不断向纵深发展,实践中也反映出一些问题。例如,数据资源还需进一步丰富,数据之间的关联融合还需进一步加强;司法大数据深度分析和应用在一些法院还未全面展开,面向用户的数据智能推荐还不够精准,面向应用的知识服务不够丰富;司法链平台基础存证验证应用场景和成效有待丰富提升,跨链互认标准和协调机制尚未建立;司法大数据人才队伍培养不够;数据安全等制度建设还滞后于应用等。但瑕不掩瑜,作为蓬勃发展的新事物,在从传统司法向智慧司法的转型过程中,如何让司法大数据扬其所长、补其所短,充分激发其作用与效能,是在推进智慧法院建设过程中值得深入思考与研究的问题。

(一)面临的挑战

随着人民法院大数据管理和服务平台与中国裁判文书网等司法四大公开平台的建设与推进,人民法院通过审判实践积累的大量数据已经成为司法大数据应用孵化的沃土。司法大数据在法院的应用也得到了蓬勃发展,在诉前、诉中、诉后提供了全流程的智能化辅助和决策支持。司法大数据除在法院应用于审判执行、司法管理外,还为社会治理提供了更科学的决策参考,为服务国家治理提供更精准的意见建议,为立法提供更详实的数据支持。同时也要看到,司法大数据应用发展还面临数据来源不足、智能化不足、数据的应用不够等挑战。

1.在数据来源方面,司法大数据的源数据当前集中于人民法院大数据管理和服务平台等系统中。从法院内部来看,司法大数据的生产者和使用者并非同一个群体,导致司法大数据内在发展动力不足。一方面,司法大数据的生产者即数据提供者,大多是一线法官,负责把审判执行相关数据信息录入人民法院大数据管理和服务平台。但是,这些一线法官很难对这些数据整体的情况进行掌握和分析,也无法直接应用这些数据,录入数据或者是严格按照2019年发布的《人民法院信息技术标准》的规范要求录入数据的积极性不够高。另一方面,使用数据的人员因为使用的滞后,无法直接对数据加工和生产进行指导,无法让数据生产者按照使用者的需要去录入,导致数据在一定程度上也无法满足使用者的需要。这使得数据的生产、使用和加工无法形成一个闭环,从某种程度上来说,这种状况一定程度影响到数据质量的提升。司法大数据的完整性也存在着一定的不足,使司法大数据的应用面及应用效果受到了一定的约束。

2.在司法智能化方面,大数据的检索推荐精准度有待提升。以中国裁判文书网为例,在当前的应用中,较为典型的做法是通过构建关键词及关键词的组合形成检索知识库,让用户输入关键词进行检索。关键词检索虽然能提供高效的内容检索服务,但是关键词检索仅限于字面内容,无法通过机器学习达到人工智能的层面,使得机器能够理解到用户所输入语句背后的真正意图。而且关键词及其组合的梳理,还需要大量的人工工作量介入,标准也很难统一。具体到类案推荐应用,当事人使用时,如果不够了解具体的法律知识,很难通过关键词在案例数据库检索到相应的内容。例如,当事人可能只会表达“我想离婚,孩子归我”等生活事实,而在案例数据库中只有类似“过错”“抚养权”“探望权”“财产纠纷”等法律事实关键词。同样,在实际审判执行的应用中,即使是专业法官,也经常出现“高频不需要找,低频找不到”这种尴尬的问题。要想解决此类问题,需要将传统的关键词检索推向智能的语义检索,将传统的手工知识库制作转变为机器学习生成知识库。此外,相对于裁判文书的这一最终的裁判结果数据,庭审同步录音录像更完整、更如实的展现了司法行为的全过程,但是受限于对视频信息快速检索定位、信息快速获取转换等智能化能力的不足够,该部分数据还未得到十分有效、充分的利用。

3.在数据的分析利用方面,仍不足够深入。对法学界来说,法教义学的研究占据主流地位,大数据的分析虽然越来越多,而且应用得越来越广,但仍处于无法足够“独当一面”的尴尬境地。究其原因,一方面很多数据是“支离破碎”的,无法完整地支撑最后的研究结论;另一方面,对数据的统计分析,是需要“门槛”的,必须先学习数据统计分析的方式,这令一些学者望而生畏,使得对数据的应用分析仍停留在一些较为浅层次的局面。未来,应进一步丰富数据的应用场景,加强对数据的分析利用,将定量分析和定性研究更有效的结合,使得数据能够更好地支撑分析结论。

(二)加强司法大数据管理和运营

《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出“加强智慧法院建设”。中国司法大数据未来的发展,除了“量”的增长之外,更重要的是“质”的提升,以及司法大数据管理的规范化、制度化建设。未来,在推动信息技术与法治建设融合促进,依靠科技创新驱动智慧法院建设,努力创造更高水平数字正义迈进的过程中,司法数据中台、智慧法院大脑和在线法院的建设,系统化、便捷化、智能化、精准化将成为司法大数据发展中的重要着力点,持续辅助智慧法院实现自我优化和自我革新。

1.从数据的内外流动与传输看,加强对数据的利用和管理成为必然。对于司法大数据,既要科学合理利用,还要严格管理,充分发挥大数据资源的效能。要建立一套数据分类分级治理制度,规范数据的采集、使用、公开以及所有权、使用权等问题。个体数据是否存在安全风险,取决于个体数据的性质,但即使所有不存在安全风险的个体数据汇聚到一起,也无法保证整体数据不存在安全风险。这也正是大数据的特点和价值所在。因此,要在内部建立起过程完整、分区严格、权限严密的数据库,严格区分涉密信息和非涉密信息;对外可定向向有关部门和高校等研究机构以及部分有资质的企业开放数据资源,开放的数据资源必须经过严格审核,隐去涉及国家秘密、个人隐私、商业秘密等不应公开的信息,这类信息的部分内容可作为政府决策以及相关学者研究使用。在使用时要有严格的规范,即在为社会提供公共服务的时候,要区分普通信息与敏感信息;既要充分考虑人民群众对于政府信息公开的需求,又要严格依法依规使用;确保公共服务合法合规,最大限度地保护各方群体的利益。

2.从数据来源多样性看,提升综合数据处理能力成为关键。互通性和共享性是大数据的重要特点。随着我国数字化转型的持续推进,不同机构、不同平台之间数据的交互越发频繁。因此,在保障数据安全的前提下,应在司法服务的不同环节、不同应用、不同机构之间建立统一的司法大数据交换标准及司法数据中台,充分发挥大数据互通和共享的特点,从而为司法大数据应用形式的多样化提供更好的支撑。同时,在法院工作中也不难发现,不同企业开发的应用系统,在需要打通接口时,总存在技术参数不同等干扰因素,数据对接并不顺畅,这需要在对公司企业行为约束的基础上,加强对数据对接技术的研究和利用。比如一些大数据专家所提出的“黑盒式”互操作技术,可以在不同系统间不进行接口对接的情况下,实现数据的实时动态采集和汇聚。对这些多源异构的数据进行处理和加工的能力,是决定未来谁能掌握并运用好大数据的关键能力,是司法大数据应用与发展的关键。提高综合数据分析、处理与加工的能力仍是当前发展的重中之重。

3.从数据应用效果看,数据质量是影响其应用效果的关键因素。当前数据的交互乃至跨境流动是大数据领域发展的趋势所在。为了更好地利用数据,势必要进一步提高数据质量,防止收集到的数据都是“脏数据”,最终影响到数据分析的结果。大数据的价值并不在于个体数据所表达的独特信息,而在于大批量具有共同特点的个体信息所呈现的共性的信息,因此,不同来源的数据之间要实现交互运用,必须要先统一数据标准。对此,可通过人工智能应用明确数据匹配规则,建立统一的数据标准。具体来说,可以通过机器学习、自然语言处理帮助建立数据重复识别匹配规则和匹配链接规则,并通过深度学习实现对数据清洗和数据质量的效果评估。另外,人工智能也有利于实现对非结构化数据的采集和关键信息的提取,改变以往通常通过创建非结构化数据的搜索索引的收集方式。在数据生成阶段,应该让专家提前介入,提出需求并设定一套甄别、清洗数据的标准,让程序自动完成数据的筛查和检验工作。理想的状况还是要建立一套审判流程标准体系,实现数据自动生成,数据填写的相互校验,既可减轻法官负担;又可提高数据质量,确保平台采集到高质量数据。

4.从长远发展看,加强法律和数据技术复合型人才培养十分必需。司法大数据的发展,人才是关键。只有跨学科、多维度、多领域、多视角,才能驾驭大数据时代的机遇和挑战。但目前的人才和人才培养模式,明显难以适应。既精通法律、又能熟悉运用信息技术、掌握大数据管理的复合型人才,是当前实施国家大数据战略之亟需。一是借助大数据技术的运用,积极推动法学教育、法学研究方法和研究范式的创新,逐步提高法律专业人员在司法大数据应用中的参与度,推动司法人员以及其他法律从业人员与技术人员的深度合作,培养既懂法律又懂技术的跨学科人才。二是对于人民法院综合型大数据人才的培养和储备而言,需要招募一批有坚定政治素养、理想情怀,求真务实、耐得住寂寞、不务虚功、愿意坐冷板凳的技术人员来充实一线,切实为推动大数据与司法工作深度融合提供智力支持。三是积极探索深化研究数据法学学科。随着全社会对数据重要性程度认识的进一步加深,以及相关法律规范的不断完善与增多,数据法会像经济法、社会法那样独立成为新的法律部门。通过与普通高校等科研机构开展联合培养研究生项目,招收统计学、经济学、计算机科学、管理学、信息学等跨学科跨领域专业人才,精选有学术潜质和学术悟性的人才,定期到国家法官学院培训,培养一批拥有多学科知识和应用能力的交叉型、实践型、创新型应用法学人才。

当然,司法大数据应用还要遵循司法规律,明确其工具性定位。司法有其特性与规律,数据应用需要尊重司法规律。司法的规律和其特殊属性,决定了司法大数据在司法领域的应用与定位只能是辅助工具。尽管司法大数据和人工智能技术的发展一次次打破人类的传统技术认知界限,但也要警惕司法大数据万能论,即司法大数据应用不可能完美替代法律职业人士。换句话说,要做到充分利用大数据而不是迷信大数据,以大数据、云计算为依托的智慧法院只能是辅助而不可能成为主角。因为机器终究是人类研究出来的,数据和人工智能不可能、也不应该取代人的思想和意志。对社会纠纷的司法裁决是世界上最复杂的难题之一,包含事实查明、证据审查、法律适用等一系列问题。法是善良和公正的科学,包含正义和道德的要求,涉及人权与正义等价值判断,案情若有变化,处理结果相去甚远。我们不应将裁判的决定权让渡给机器或人工智能,司法的本质在于它是一种依靠人类理性通过争辩和对话获致裁判结论的过程,在其中起主导和决定作用的永远是人。正是基于此,大数据技术的开发不是要取代法官,而是要为法官工作提供更精准的辅助。同样,大数据技术也不能以管理为本位,司法管理技术始终要以服务于审判权行使为目标而不是代替审判权行使。特别是要围绕“寻找事实、寻找法律”这一人民法院审判工作的基本属性,以全面推进审判体系和审判能力现代化为目标,推进司法大数据应用,创新审判模式,优化诉讼流程,助推司法改革,为更加客观寻找事实、更加精准适用法律提供坚强的科技支撑。

(三)提升司法大数据应用效能

司法大数据的应用与发展在司法史上没有现成经验可循,如何科学把握大数据发展带来的机遇,构建具有中国特色的司法大数据应用体系是摆在我们面前一项现实而紧迫的任务。面向实践,司法大数据发展将践行以人民为中心的发展思想,秉持“服务司法实践、服务公众需求、服务社会发展”理念,其应用成效朝着“使法院更健康,使法官更健康,使社会更健康”的趋势发展,实现应用场景更加丰富、应用重点不断前移与应用深度大幅提升的目标,在助力提升社会协同治理能力、优化社会治理模式上发挥更大作用。

1.面向法院

面向法院,司法大数据将提供更加多样化高质效的诉讼服务,通过不断丰富应用场景、不断拓展应用深度,促进司法公正,推动法院“瘦身”,使法院“更健康”。一是提供更加多样化、高质效的诉讼服务。未来,人们可能不再满足于获取方便、快捷的司法服务,而是对司法服务的质效抱有更多期待。司法大数据在诉讼服务方面的应用也将不断深化,从当前的诉前矛盾智能调解、智慧法律咨询、诉讼风险评估与结果预测、司法链存证等朝着更加丰富、精准化、人性化的诉讼服务发展。例如,通过司法大数据可长期追踪诉讼当事人的心理状态和行为模式,开展基于个案的诉讼类型化分析,通过总结归纳诉讼参与人的需求,向其提供更有针对性的诉讼服务。

二是对法官进行“业务体检”和“廉政体检”,促进司法公正。一般来说,造成司法不公可能有三个方面的原因:法官能力水平不足、外来干预以及利益诱惑。未来,司法大数据将在提升法官能力和防止司法腐败方面发挥更重要的作用。例如,通过司法大数据对法官进行“业务体检”。就像驾驶员获得驾驶证需要通过道路交通安全法律法规、场地驾驶技能、道路驾驶技能和安全文明驾驶知识四个科目的考试,法官将来也应借助司法大数据与人工智能技术,通过法律知识理论和模拟庭审等科目的考试。司法大数据可以为每位法官“画像”,通过考察法官在事实认定、法律适用以及法庭礼仪与法庭突发情况应对、舆情危机处理等方面的能力,分析挖掘法官需要重点提升的政治能力、司法能力和综合能力素养,开展个性化培训。

司法大数据能通过预测某一地区高发的案件类型,为该地区法官自动推送相关培训课程,实现精准培训。司法大数据还能建立司法纠错预警系统,对法官进行“廉政体检”。当前,一些法院已上线了包含量刑推荐、偏离预警等功能的审判辅助系统,未来可通过司法大数据进一步分析严重偏离预期结果的判决背后的原因,特别是可能存在的司法腐败。例如,通过司法大数据应用对证据进行标注,将可信的证据标注为绿色,将高度不可信的证据或者系统认为可能不可信的证据标注为红色。如果案件大量采纳了标注为红色的证据,就代表着法院内部可能存在串通造假行为,或者公安、检察院可能存在造假或逼供行为,对案件可能存在的司法不公或司法腐败起到预警作用。

三是进一步减少案件数量、提高司法管理效率,推动法院“瘦身”。在开展外部广泛合作,数据融合共享的基础上,人民法院与行政机关、监管部门、群团组织、基层自治组织等协同从源头遏制纠纷将成为减少案件受理数量、降低矛盾尖锐程度的关键所在,能够切实把“非诉讼纠纷解决机制挺在前面”,从而扭转人民法院逐年增加的案件量,先让案件量“瘦身”。全链条司法管理模型的建立也将推动司法资源配置科学化、合理化,使法院实现有效“瘦身”。司法大数据可以运用于法院案件管理、人事管理等各个领域,目前在部分法院已经有了初步的运用,但仅限于收集某个法院办案系统、人事系统中的数据,比如案件和人事的关联、案件的难易系数、法官承办案件数、法官之间任务量的比较等等,都可以相对科学的评价法官的办案效率。同时,也可以从法官所办理案件的上诉率、发回重审或改判率、信访率等方面,评价法官办案的效果,这些都是将人案关联、评估法官业绩、办案效果的重要数据支撑,从而可以科学合理地调配法院审判资源。

2.面向法官

面向法官,司法大数据将在提升法官司法能力、保障法官人身安全和心理健康方面发挥更重要的作用,使法官“更健康”。具体来说,司法大数据推动了法官学习方式的变革,将为法官提供一种网络化、数字化、智能化、精准化、终身化的学习模式。司法大数据与人工智能应用将进一步增强网络培训课程的交互性和可视化,法官不必定期集中进行地面培训,能够通过开放共享的网络培训师资库,利用碎片化的时间随时随地学习,从而大大提高学习质效,提升司法能力。

未来,司法大数据还将更关注法官的心理健康。影响法官心理健康的因素很多,比如办案压力;比如遭受不同程度的跟踪、骚扰、谩骂、威胁、恐吓甚至暴力伤害等;比如与职业尊荣感有关的因素,也可能导致法官存在浮躁、不平衡的心理等。对此,可以通过司法大数据进一步减少纠纷数量、提高办案效率,从而缓解“案多人少”的矛盾,平衡好法官个人的工作与生活,让法官心情愉悦;通过应用区块链存证技术,对威胁法官人身安全的高风险案件进行预警,减少法官遇害案件的发生;通过司法大数据对法官进行“心理体检”,定期收集法官心理健康数据,研究探索法官心理健康发展变化规律,不断完善心理辅导长效工作机制。自信是一切心理健康的基础,法官通过培训学习,对业务了然于胸,对工作充满自信,这是对自身健康的一大促进。对未来恐慌与不确定性是引发焦虑的主要因素,让法官借助于司法大数据与人工智能的手段,提升认知水平,真正做到见微知著,工作游刃有余,让法官更快乐地学习、工作,更健康地生活。

3.面向社会

面向社会,司法大数据应用重点将不断前移,更多参与社会风险预防与制度的事前、事中评估,让社会更健康。习近平总书记强调:“法治建设既要抓末端、治已病,更要抓前端、治未病。”社会治理的最高境界,是实现对各类风险的预测、预警和预防,防患于未然。目前的司法大数据应用仍主要集中于末端的审判环节,随着其他司法环节数据的不断积累,司法大数据的应用热点将持续前移,让大量矛盾纠纷“化于未发、止于未诉”。法院要医治社会疾病,通过前端治理、源头治理实现医“社会之心”,让社会生产、生活活动更健康。

在矛盾应对方面,司法大数据将实现社会治理从矛盾应对到风险预防的飞跃。司法大数据将让更多矛盾纠纷在萌发阶段就得到妥善化解,而不是等矛盾纠纷到了法院之后,通过非诉化解模式或诉讼模式解决。例如,运用司法大数据动态分析矛盾纠纷多发易发领域、成因特点和变化趋势,及时向当地党委政府及有关单位提出意见建议,最大限度把各类风险消灭在萌芽状态。通过大数据分析发现某一地区经济社会发展当中一些不通畅的地方,还能为那些矛盾暂时没有集中爆发的地区提供参考和预判,便于这些地区的党委政府及有关单位把矛盾疏导和纠纷化解工作做在前面,把矛盾消灭在萌芽阶段。司法大数据还将用于公民个人生产生活或企业生产经营的预警、预测、纠偏和风险防范。例如,对那些易冲动实施暴力犯罪且有前科的行为人,可以及时通过司法链、物联网进行信息联通,甚至通过AI手环或智能穿戴等,对行为人可能实施的相关暴力行为进行监测和预警,通过及早防范和应对,进而降低社会风险。

在社会治理方面,司法大数据将有效提高制度的事前评估能力,不再局限于从诉讼端评估制度运行效果,全面服务于制度的事前、事中和事后评估。一项制度一般要经过“制度制定”“制度执行”和“制度效果”三个阶段,其评估活动对应也涉及事前价值评估、事中综合评估和事后事实评估三个层面,既要评估制度目标效果,还要评估制度的成本。在我国,制度既包括根本制度、基础制度、重要制度,也包括长期制度、中期制度和短期制度。对社会制度的评估往往是一个持续的过程,特别是对中长期制度来说,要经过“评估—反馈—完善—再评估—再反馈—再完善”的循环过程。一般来说,长期制度评估通常以事前价值评估为主,通过司法大数据分析把控社会制度问题的症结及关切所在;中期制度评估通常以事中综合评估为主,通过司法大数据分析及时掌握社会制度执行阶段的真实情况,保障社会制度的顺利实施;短期制度通常以事后事实评估为主,通过司法大数据方法生成评估指标,量化反映社会政策产生的真实效果。目前,司法大数据主要是从诉讼端的视角对制度运行效果评估。例如,运用大数据分析方法进行制度实施成效研判,常态化监测立法规范、司法解释及有关政策的实际运行效果,为有效弥补法律规范因与实践脱节而造成的滞后性提出意见建议。未来,司法大数据应用将深度挖掘各行各业发展运行中常见的法律风险,合理分析预测人民群众可能存在的司法服务需求,及时为立法、司法解释及有关政策的制定提供参考和智力支持。当然,对于司法大数据的应用与管理也需要有制度规范,如何在应用实践中,完善其制度,前文也有论述。司法大数据必将为司法实践赋能,助力提升社会协同治理能力,优化社会治理模式,不断提高社会治理决策的科学性、前瞻性和有效性。

进入新时代,党中央决定实施国家大数据战略,吹响了加快建设数字中国的号角。信息技术发展无止境,司法大数据在人民法院的应用,是一个长期探索并不断优化的过程。随着人民法院建设智慧法院的不断推进,司法数据中台、智慧法院大脑和在线法院的建设完成后,司法大数据必将在立案、审判、执行、管理、监督等全领域各环节发挥更重要的辅助作用。积极拥抱信息技术革命与创新发展,通过司法大数据与人工智能的有机结合“让社会更健康”,或许是未来司法大数据的发展趋势。司法大数据在人民法院的应用会进一步丰富和深化,人民法院智慧司法将依靠我们的制度优势,构建具有中国特色的司法大数据应用体系,让司法大数据在辅助国家相关科学决策、服务经济社会持续健康发展等方面发挥更加重要的作用。


责任编辑:杨燕
本站系非盈利性学术网站,所有文章均为学术研究用途,如有任何权利问题请与我们联系。
^