×

打开微信,扫一扫二维码
订阅我们的微信公众号

×

打开手机,扫一扫二维码
即可通过手机访问网站并分享给朋友

统计学在司法实务中的运用(一)

供稿 | 端心怡2022-07-04454



统计学作为收集、分析、呈现和解释数据的科学已被广泛应用在诸多跨学科领域,例如金融学、临床医学、经济学等。当下热门的数据科学、人工智能、机器学习也是基于统计学的理论基础而迅速发展起来的。随着科技的不断发展,如何利用技术手段确保法律服务的专业化、自动化、智能化,推动法律服务的变革与创新,是每一位法律人所关注的话题,也是许多学者所关切的研究方向。

数据推理越来越被认为是司法活动中的必要技能,统计科学可以回答的标准问题类型大致可分为以下几类:


● 描述性统计:例如,该国报告的抢劫案数量是多少?在药物缉获中发现了多少种特定类型的药物?


● 从样本估算整体情况:例如,根据犯罪问卷调查的结果推断国内违禁药品违规使用的总体情况。


● 从样本作出科学推论:例如,焚烧炉排放物是否会增加出生缺陷的风险?


 预测:如给定一组特征,被告再次犯罪的可能性有多大?

统计学中常用到的计量方法可以归为下面几类:


● 假设检验:用于检测样本与样本、样本与总体的差异,如T检验、秩和检验等方法。


● 回归分析:用于分析变量间的关系以及对结果的预测,如多元回归、线性回归、Logit回归等方法。


● 干预分析:用于分析外部干预在时间序列上的影响,如MA、ARIMA模型等方法。




94d97dcb6fb9dfbf1bf107f9f691b200.png



将统计学应用在司法实务中也许并不像听上去那样晦涩,即使是利用统计学的基本思维,也能在法律活动中发挥作用。举例来说,在行政执法过程中,可能会面临检验、提取证据等需要,当样本总量过于庞大时,往往会采取抽样取证的方式,那么如何科学地进行抽样就涉及到统计学的相关知识。麻省理工大学的本奈特教授曾经遇到过这样的案例:为了保护幼扇贝免遭捕捞,美国渔业和野生动物保护机构规定“每个扇贝肉的重量至少1/36磅才可以捕捞”。一艘渔船被指控违反了这个重量标准。这艘船抵达港口时装有11000袋扇贝,港务人员随机抽选了其中的18袋来检查。港务人员根据18袋的结果估计这艘船上每个扇贝肉的平均重量为1/39磅,低于标准,于是立即没收了捕获品的95%,随后进行了拍卖。那么只选取18袋抽检,是否可以代表全体?根据统计学的基础理论,18属于小样本,数据不能被假设呈正态分布,可以推断抽取的18袋不具有随机性和代表性,而当样本数量至少大于30的时候一般被认为是大样本,可以假设为正态分布,抽取的样本才更具有推算总体情况的意义。当然,如何决定样本数量有不同的科学计算方法,30仅为大样本的一般标准,但是至少能启发我们对证据证明力的思考。另一方面,采用平均值的判断标准是否可以达到保护幼扇贝的目的?如果捕捞了一批大扇贝,那么即使捕捞了部分小扇贝,平均下来也未必超过规定。在立法层面,如果将平均值改为捕捞幼扇贝的百分比,或是规定捕捞网网眼的大小,也许更能更好地达到立法目的。




56f6885470094818379dd19b1fb77991.png



统计学中的干预分析,是在时间序列分析中应用统计建模,从而分析外源力及干预的影响,它可以反映数据随时间推移的变化与规律,从而预测未来的发展,为解决实际问题提供依据。为解决醉酒所带来的一系列健康问题、社会问题等,加拿大育空地区一家政府经营的酒类商店使用了新的警告提示,其中包括癌症警告、低风险饮酒指南等信息,这些标签暂时取代了以前的妊娠警告标签。在干预期间,98%的酒精容器共贴上了约300000个新标签以检验新警告标签引入之前、期间和之后场所内消费情况的变化,模型同时也根据人口和经济特征随时间和地区进行了调整。最终的结果是,在干预期间,人均酒精零售总额下降了6.31%,有新警告提示的产品人均销售额下降了6.59%,而无标签产品的销售额上升了6.91%。在干预后,当再次引入妊娠警告标签时,酒类消费出现了更大的下降。统计分析方法的应用,帮助当地政府验证了新策略是否可以达到其规范目的,也为政策与立法提供了科学依据。


从回溯的角度来看,统计学的应用对于评估改革试点、立法效果也发挥着重要的作用。1994年秋季,美国弗吉尼亚州通过了废除假释和刑罚改革的法案,并对1995年1月1日或之后犯下的所有重罪进行了量刑改革。研究人员通过多种统计方法构建时间序列模型,比较研究了这项立法对犯罪率的影响。根据ARIMA模型结果发现,该改革对谋杀和强奸有显著的负面影响,对于财产犯罪(入室盗窃除外)和故意伤害未发现任何统计学意义上的显著影响。




30bb4b288a9a1ad1581c78a39b7eeca4.png




回归分析,是统计学中被广泛用来预测的方法,它能够从大量数据中筛选出真正对结果产生影响的因素,建立起因果关系,并根据这些重要因素预测未来的结果。律师在法律服务中通过搜索“关键词”、检索相似案例和裁判结果来预测自己的案件结果就是依据类似的原理。不同的是,律师检索工作中“关键词”的确认是基于律师个人的经验主义判断,而统计学中“关键词”(即自变量)的确认,是基于科学的计算结果。回归分析在司法实务中比较常见的应用实例是预测犯罪率,举例来说:肯尼亚科技大学的多名学者对肯尼亚某地区的犯罪率进行过分析,样本数据10万条,其中因变量是犯罪率,自变量包括贫困率、失业率、入学率、年轻男子百分比、定罪率、结案率、被捕概率、人口密度和警察覆盖率。回归模型的结果显示入学率对犯罪率并无显著影响,因此模型中将入学率剔除,在剩下的其他显著因素中贫困率对犯罪率的影响力最大,而结案率的影响力最小。根据模型的结果,嵌套进新的地区数据便可得出对肯尼亚特定地区的犯罪率预测。


以上案例,仅是统计学在司法实务应用中的冰山一角,两者的学科交叉,不论是在理论上还是在实务操作中,都值得深入探索和研究。每一次方法上的转变,都将为发展带来新的影响。统计学在司法实务中的应用,作为一项新的研究课题,在我国法学研究中的重要性日益凸显。作为法律服务者,我们要率先掌握科学思维、运用科学方法,优化法律服务方式,推动法律服务的变革与创新。

 


引    用 


The Royal Society, The Use of Statistics in Legal Proceedings: A Primer For Courts  


S.Sridharan, Intervention Time Series Analysis of CrimeRates:the impact of sentence reforms in Virginia, Tibergen Institute


Jinhui Zhao , Tim Stockwell, Kate Vallance, Erin Hobin, The Effects of Alcohol Warning Labels on Population Alcohol Consumption: An Interrupted Time Series Analysis of Alcohol Sales in Yukon, Canada, J Stud Alcohol Drugs 2020 Mar; 81(2):225-237.


Chris Muchwanju, Joel Cheruyiot Chelule, Joseph Mung’atu, Modelling Crime Rate Using a Mixed Effects Regression Model, American Journal of Theoretical and Applied Statistics volume 4, Issue 6, November 2015, Pages: 496-503


屈茂辉,  张杰    计量法学本体问题研究



如果您有法律上的问题需要咨询,或其他业务方面的合作,请留言,谢谢!
提交 >
请认真填写以上信息,我们不会向本所以外的人士透露您填写的任何资料。