第一作者简介:王黎,男,湖北荆门人,硕士,研究方向为微量物证。E-mail: 1443240421@qq.com
统计学方法在微量物证理化检验工作中受到越来越多的重视,采用有效的统计学方法对检验数据进行分析,不仅能够深度挖掘复杂数据背后信息,还能不断提高数据的应用价值和证据本身的证据价值。本文对目前微量物证领域常用统计学方法进行归纳总结,简要介绍了常用统计方法的应用,对各类方法优缺点进行说明。最后,对法庭科学工作者都比较感兴趣的贝叶斯统计与似然比方法在理化检验数据统计分析中的应用进行了介绍。
Statistics plays an increasing important role in interpreting scientific data. Statistical methods have recently been received more and more attention in forensic science, especially in the field of trace evidence. Varieties of analytical method are often used to analyze different kinds of trace evidence, producing multidimensional physical and chemical data. Choosing the appropriate statistical methods to interpret the complicated data is crucial for the examiners to be provided with more convincing results from the investigated trace evidence. The commonly-used statistical methods in the field of trace evidence are summarized in this paper, with the explanation about the problems existing in the related statistical methods. In addition, a brief introduction is made about the application of new statistical methods, e.g., the likelihood ratio and Bayesian statistics.
近年来, 随着大型分析仪器的普及, 法庭科学家在建立准确分析各种微量物证的分析方法以及提高检验灵敏度等方面做了大量工作[1, 2]。此外, 为了提高微量物证比对检验和来源推断的准确性, 越来越多的方法用于同一个检材的检验[3, 4]。以泥土物证检验技术为例, 在近百年的泥土检验技术的发展中, 检验人员对泥土物证的认识不断细化, 分析手段逐渐涵盖了物理性质分析、元素分析、有机物分析、微生物分析、植物孢粉分析、植物DNA分析等[5]。检验方法的系统化和多样化必定伴随着检验数据的不断丰富, 而这些数据之间往往是相关的, 这就使得数据变得更加复杂, 因此仅靠肉眼对这些检验数据进行简单的分析已远远不能满足对数据进行充分应用的要求, 如何对检验数据进行准确解释和利用一直是困扰法庭科学工作者的一个难题。对于珍贵且复杂的实验数据, 根据检验目的不同, 法庭科学工作者应该严谨科学地选择不同的统计学方法来对数据进行准确的解释和利用。否则, 可能导致数据中所包含的丰富信息与特征被掩盖, 更有甚者会对研究人员产生误导甚至得出错误的结论。从这个角度来说, 选择合适的数据分析方法与物证检验技术的革新与完善同样重要。
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学, 根据数据分析的目的, 统计学学科发展出许多行之有效的数据分析解释方法, 许多方法与法庭科学中的分析需求非常契合。微量物证法庭科学工作者在对理化检验数据的统计分析方面也做了大量研究和尝试。一些常见的数理统计方法包括t检验, 方差分析, 主成分分析, 聚类分析, 判别分析等在微量物证检验领域都已成熟应用。Waddell等[6]采用聚类分析中的分层聚类分析法, 提取出对易燃液体总离子色谱图分类有用的特征, 成功地将一些具有相似化学成分的易燃液体分类; Peets等[7]采用主成分分析法(principal component analysis, PCA)对89种混合纤维成分的全反射傅里叶变换红外光谱法(attenuated total reflectance Fourier transform infrared spectroscopy, ATR-FT-IR)光谱谱图分类, 得到很好的分类效果, 并将其作为ATR-FT-IR法在纤维检验中应用的评价依据。尹宝华等[8]用聚类分析法, 以检验结果中的物理参数、纤维种类和元素成分构成的数据集, 对纸张物证进行了分类。郭洪玲等[9]利用欧式距离, 对33种汽车大灯灯壳中13种微量元素数据进行统计处理, 得到较好的区分度。由此可见, 面对分类与比对的需求, 统计学给出了很好的解决方法。本文对微量物证领域常用的数理统计方法进行综述, 并简要介绍贝叶斯分析和似然比检验在本领域的初步应用。
对于微量物证检验结果, 首先应该明确检验方法产生的数据类型, 建立对该数据结构与内在逻辑关系的初步认识, 并最终在检验结果解读时针对不同的分析目的采用合适的统计学方法。
在微量物证领域, 常见检材有燃烧残留物、橡胶、射击残留物、泥土、纸张、纤维、塑料、油漆等, 得到的数据通常为定量的连续多维数据和定性离散数据。例如, 在泥土物证检验中, 应用X射线荧光光谱法(XRF)得到的元素含量的数据为在一定区间内波动的数值, 数据类型为连续数据, 从而多种元素含量数据即为多维连续数据; 而X射线衍射光谱法(XRD)得到泥土矿物成分种类, 为不连续的离散数据。
在明确了微量物证的检验数据类型后, 由于这些数据存在量纲不同、数据间存在相关性等问题, 因此需对原始数据进行加工整理使之满足后续统计分析的要求。通常理化检验数据可能存在的问题包括:1)检验数据离散度大导致标准偏差较大, 需要对原始数据进行离群值检验; 2)检验数据量纲不同, 例如元素分析中常量元素与痕量元素的含量往往相差几个数量级, 可对数据进行标准化或者对数转换; 3)理化检验数据分布不满足统计方法对数据分布的要求, 例如利用Kolmogorov-Smirnov检验数据, 不满足正态分布, 可以进行核密度估计(kernel density estimation, KDE); 方差分析中的方差齐性检验得到方差不齐的结果, 可进行数据转换使其接近齐性, 比如box-cox转换与对数转换; 样本独立性检验得到指标间高度相关的结果, 可以进行数据降维等。
对微量物证进行检验时, 检验人员总是希望采用多种方法获取更多信息, 但这样增加了样本分析的复杂程度, 同时指标间可能会有较强相关性, 信息相互掩盖, 此时可以对数据进行降维处理。数据降维是指通过映射的方法将高维数据映射到低维空间中, 克服数据维度增加带来的分析困难[10]。虽然数据降维意味着部分信息的丢失, 但得到的降维数据已足以反映原有高维数据的特征。通常适用于微量物证检验数据降维的方法有主成分分析与概率图模型。
1.2.1 主成分分析(PCA)
主成分分析是将多个指标转化为少量几个综合指标的多元统计方法, 其信息量损失较少[11]。通过作线性变换将对随机变量总方差贡献最大的几个“ 因素” (即新的正交变量)挑出进行解释, 这即是主成分分析的主要思路。这里的“ 因素” 即主成分, 并不是单纯的某一个指标, 而是各个指标的加权和, 这些主成份已经足以反映原有高维数据的信息, 这样就剔除了一些无关紧要的指标的干扰, 降低了统计模型的复杂程度, 提高分析效率。郭洪玲等[12]对泥土物证XRF检验数据处理时, Si、Al与Fe元素之间, Si、Fe与Ti元素之间相关系数均在0.8以上, 采用主成分分析提取到的三个主成分对原始数据的解释度已达到82.38%, 可以作为原来十个元素信息的替代。当然并不是所有理化检验数据都适合进行PCA降维处理, 如陈振邦等[13]在用PCA对助燃剂燃烧残留物组分进行降维处理时, 验证PCA会造成原始数据中的部分信息丢失, 给后面的判定分析带来困难。
1.2.2 概率图模型(Graphical Models, GM)
理化检验的多维数据有时相关性并不强, 进行PCA降维处理效果不明显, 此时概率图模型可以作为PCA方法的补充。概率图模型以图形表明变量间依赖关系, 是一种基于图论的数据降维手段[14]。每一对直接相关的变量(节点)都由一条边连接起来, 直到每个变量(节点)都被包含在网络中, 只选取网络中有边相连的关系代替所有变量间的关系, 从而达到降维的目的。Zadora[15]在其著作中利用GM方法将车漆数据七种变量(化合物)间的复杂网状相互关系简化为六种关系, 大大降低了比对的工作量, 同时仍然保留了大部分信息。
针对微量物证的样品分类与比对的应用需求, 采用不同的统计方法, 可为案件侦查和庭审阶段提供重要信息。
1.3.1 差异显著性检验
对于样品间的比对分析, 可采用差异性检验方法来实现两组或者多组样本间是否存在显著性差异的目的。根据数据特点和分析需求, 可采用以下几类差异性检验方法。
T检验(t-test), 是最常见的数据处理方法之一, 被广泛运用于理化物证的实验数据处理。适用于符合正态分布且方差具有齐性的两组单参数样本之间的均值差异性比较。Welch检验是T检验的变体, 适用于符合正态分布而方差不齐的两组单参数样本之间的均值差异性比较。Pawluk-Koł c等[16]在研究玻璃样本成对比较时, 采用了T检验与Welch检验对72块车侧窗玻璃和69块挡风玻璃的折射率值进行了两两比较, 对假发现率(false discovery rate, FDR)进行了有效的控制。
Hotelling T2检验(Hotelling, s T2 test)与T检验不同, 适用于多变量样本间的显著性检验。为比较Hotelling T2检验与T检验, 可以以两种方法的第Ⅰ 类错误概率来比较, 第Ⅰ 类错误概率又叫拒真概率(第Ⅱ 类错误为纳伪概率), 比如检材中含有汽油而鉴定结果为未检出, 或同一的玻璃样本给出不同一的结论。对于多变量样本进行显著性检验时, 可采用T检验法对参数进行逐个统计分析, 但是多次单变量的T检验会大大增加犯第Ⅰ 类错误的概率, Hotelling T2分布是T分布的二元自然推广, 常用于两组向量均值的比较。Zadora[17]在其研究中, 选取O, Na, Mg, Al, Si, K和Ca七种元素, 并以除O以外其他元素与O的比值的对数〔以Na为例:log10(Na/O)〕作为源数据, 应用Hotelling T2方法对玻璃样本的扫描电镜能谱仪(scanning electron microscopy with energy dispersive X-ray, SEM-EDX)元素检验数据进行分析, 来验证两组玻璃碎片的元素分析结果是否有显著性差异。
方差分析(ANOVA)又称变异系数分析, 它研究的是各个不同来源的变异对样本总变异贡献的大小。ANOVA将自变量的变异分为单因变量和随机变量的影响。排除自变量本身随机性因素的条件下, 研究在改变该单一因变量时, 例如超高效液相色谱色谱柱条件选择, 检材前处理中是否进行有机溶剂清洗, 检验实验室温度等, 自变量是否受其影响。而通常情况下, 微量物证检验数据不只是受单因素的影响, 为此可以采用多因素方差分析(MANOVA)。MANOVA是研究多个因变量与自变量相互关系的数理统计方法, 尤其适用于理化检验中多指标数据的分析。多元方差分析的基本思路是将多个因变量看成一个整体, 分析多个因变量对自变量整体的影响, 发现不同总体的最大组间差异, 从而说明这些因变量是如何影响自变量。多次ANOVA检验不能代替MANOVA检验, 原因是多次ANOVA检验犯第Ⅰ 类错误概率增大, 另外存在同时观察多个因变量的联合影响的需求。Alamilla等[18]在对激光刻蚀-电感耦合等离子质谱(laser ablation-inductively coupled plasma mass spectrometry, LA-ICP-MS)法得到的圆珠笔油墨元素数据分类时, 采用MANOVA/HSD(事后显著性检验)法对9个批次的样本进行检验, 结果表明其中5组样本能够被完全区分。此外, 广义线性混合模型适用性更广, 不仅将自变量与因变量都可扩展到多维, 而且其因变量与自变量的关系也不再局限于线性关系。在微量物证检验领域, 检材前处理条件的设计、仪器分析中分析条件的设计例如柱温的选择、多反应监测中碎片离子峰的选择等一些研究自变量对因变量影响的情景中, MANOVA方法有很大应用潜力。
对于总体分布不明确, 或者总体参数假设条件不成立的检验数据类型, 可以采用非参数检验, 前文提到的Kolmogorov-Smirnov检验即是非参数检验的一种。非参数检验又称为非参数估计, 是指在不考虑原总体分布或者不作关于参数假定的前提下, 用已知类别学习样本的先验知识直接进行统计检验和判断分析的一系列方法的总称[19]。对于离散数据, 不知道其总体分布, 可以按数据大小次序排队, 以每个具体数值在整个数据中的位置或次序的信息来进行所需要的统计推断, 例如威尔克森符号秩检验、Spearman秩相关检验等。Prada等[20]在研究纺织品上挥发性人体气味残留物采集方法(顶空固相微萃取-气相色谱-质谱联用法)时, 利用Spearman秩相关性检验比较了单一材料与混合材料纺织品上挥发性人体气味提取率, 得到单一材料纺织品提取率较高的结论。非参数估计对总体假设少, 可作为一种补充方法, 处理离散数据或者直接处理一些有问题的数据。
1.3.2 聚类分析(Cluster Analysis)
对于微量物证的样品分类应用需求, 可采用聚类分析对检验数据进行统计处理。从样本数据中找出一些能够度量样本间相似程度的指标, 并以此为分类的依据, 将相似程度大的归为一类, 逐步归类最终将所有样品都聚类完毕, 这是聚类分析的思路。在聚类分析时需要估算不同样本之间的相似性(Similarity Measurement), 这时通常采用的方法就是计算样本间的“ 距离” (Distance)。距离分析的方法种类有很多, 分别适用于不同类型的数据分类要求。在实验数据处理过程中选用合适的距离分析方法可得到理想的分离分类效果。常见的距离分析有欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离。Stefan Uitdehaag等[21]在进行荷兰土壤样品的无损分析时, 分别采用了兰氏、切比雪夫、闵可夫斯基、布雷— 柯蒂斯和欧式五种距离分析方法并比较其优劣, 最终将兰氏距离纳入了判别模型。
K-均值法是一种快速无监督的聚类方法。方法首先随机选取几个类的形心, 把每个样品逐个归类到与其最近的均值类中, 然后计算新类别的形心, 再将下一个样本归类, 重复上述步骤直到各类中不再有样本的进出[11]。该方法可以检验最终分类的稳定性, 如果更换另一种初始形心得到的是相同的分类结果, 那么可以认为分类稳定。Thanasoulias等[22]在对圆珠笔墨水光谱分析时, 以间隔1 nm记录400~750 nm波长范围内的油墨光谱得到351个变量, 利用K-均值法将351个变量聚为了20个类别, 简化了分析过程。
1.3.3 判别分析(Discriminant analysis)
判别分析也是一种常用的分类统计方法, 该方法利用样本数据各种特征值来判断其类别的归属。常见判别分析方法有线性判别分析(Linear Discriminant Analysis, LDA, 也叫Fisher判别), 贝叶斯判别等。王荣辉等[23]在对汽油分类分析时, 利用PCA和Fisher判别方法对50组的90 #和 93 #两种汽油的31种成分进行分类, 分类正确率达到了100%。又如Yadav等[24]在利用傅里叶变换红外(FT-IR)法对非法烈酒地理来源分类时, 采用了PCA与LDA结合的分析方法, LDA结果显示在七个地域中五个达到了100%分类正确率。判别分析与聚类分析都是微量物证检验中强有力的数理统计分析手段, 判别分析优势在于样本的分类, 且在进行交叉检验时仍能得到较高的判别率。笔者尝试对北京顺义、大兴和沈阳的泥土样品中常量元素的含量[12]进行判别分析, 结果表明三处泥土样本能够很好地区分。
微量物证领域现有一些经典的统计分析方法或多或少存在其各自的局限, 这就要求在数据分析时进行不同方法间的相互交叉印证, 同时不断引入新的统计学方法来作为原有统计方法的补充。
频率学派和贝叶斯学派是当今数理统计学的两大学派。与频率学派不同, 贝叶斯方法注重先验信息的处理并让其参与统计推断。在法庭科学领域, 每一个案件无法重复, 有些推断可以通过进行刑侦实验来验证, 但更多情况下是无法用频率去解释的, 因此不适合用大量重复实验的方法来解决一些与物证检验有关的统计学问题。这时可以利用经验或者历史资料, 即利用先验信息来帮助分析样本总体最终做出是否接受假设的决策。例如一位经验丰富的警察能够依据枪声判断出到底是步枪还是手枪而普通人可能难以分辨。先验信息在统计推断中应当给予重视并加以利用。
贝叶斯假设检验需要提出零假设H0和备择假设H1, 在得到后验分布π =(θ |x)后, 计算H0和H1的后验概率α 0, α 1。通过后验机会比α 0, α 1的值来确定是否接受假设。a0, a1> 1时接受H0; 否则拒绝H0。另外还可以用贝叶斯因子(后验机会比先验机会比的比值)大小来衡量对假设H0的支持程度。贝叶斯因子取值越大, 对H0的支持程度越高[25]。例如在玻璃样本检验中, 未知样本某元素含量X落在A、B两种玻璃产品该元素含量区间(该区间由已有数据库确定)的概率分别为α A=P(X|A)与α B=P(X|B), 后验机会比即为α A, α B, 可以依此来判断是否接受假设, 同时贝叶斯因子可以定义为:
其中P(A)/P(B)为A、B两种玻璃产品产量比值, 即A、B两种产品相对稀缺度, 这样利用贝叶斯因子与1大小的比较判断支持的强度有多少。贝叶斯因子对样本数据(未知玻璃样本)是灵敏的而对先验信息(玻璃样本库)的变化是迟钝的。目前在本领域贝叶斯方法应用面临的一个难点在于如何确定先验分布, 在缺少数据库的支持下先验分布的确定具有较强的主观性。
随着检验人员作为专家证人出庭的机会增加, 作为法庭物证中重要的一环, 检验人员常需要对案件的物证做出两个相反方向的决定, 即是决定证据是否有价值。似然比检验(likelihood ratio, LR) 是一种反映样本灵敏度与稀有度的复合指标, 是贝叶斯分析的一种特殊情况。在微量物证领域似然比检验的应用就是以零假设与备择假设之比的大小来衡量物证的价值, 即源于同一客体的“ 可能性” 与源自不同客体的“ 可能性” 大小的比值。例如, 在犯罪现场发现窗户玻璃被打碎, 在嫌犯家中发现了粘附有玻璃碎片的牛仔裤, 这时在实验测得两者玻璃折射率的条件下(E)做出假设(H1)牛仔裤上的玻璃碎片来自于现场碎裂的玻璃; (H2)牛仔裤上的玻璃不是来自于现场玻璃。显然, 在该条件下两种假设发生的概率的比值(LR=P(E|H1)/P(E|H2))越大时, 物证对假设H1的支持力度越大。Zadora[17]在其著作中利用似然比对200块玻璃碎片比对和分类问题进行分析。研究选定O, Na, Mg, Al, Si, K, Ca和Fe八种元素。由于数据的非正态性, 在建立LR模型时, 选用核密度估计(KDE)建立元素的概率密度函数。最终计算得到的LR值等于3 736, 介于1 000至10 000之间, 对于假设H1:两者源自相同客体有着强支持。并且LR模型的误判率较低(其中第Ⅰ 类错误率=4.7%, 第Ⅱ 类错误率=4.0%)。
结合近几年法庭科学发展趋势来看, 笔者认为多种检验方法与多种统计方法的相互印证才能够显著提高证据价值, 同时新统计方法的引入可以帮助微量物证检验人员建立新的物证评价体系, 近些年贝叶斯方法与似然比检验逐渐受到越来越多的法庭科学工作者的重视[26, 27, 28]。新方法体现了不同物证的稀缺性, 将多种理化检验手段得到的指标同时纳入了统计模型, 通过对物证多种方法检验数据的解释, 证据价值得到了有效的评估。检验人员出具的物证检验报告可以直观地反映微量物证的证据价值, 更容易为检察官法官所接受, 能够改善现有检验报告过于专业化导致非专业人员无法理解检验结果, 甚至错误使用的情况。当然统计学方法也不是万能的, 没有一种适于所有物证价值评价的“ 通法” , 盲目使用统计学方法会产生误导甚至错误性的结论。2016年, 美国统计学会曾发表声明, 对P值的滥用做出了警示[29]。目前在国内物证价值评价的工作尚未展开, 一方面需要进行实验数据的积累, 建立微量物证数据库, 另一方面可以加强与国际同行间物证价值评价方法的交流, 在国内建立起物证价值评价体系。法庭科学是一个极严谨的学科, 物证价值的评价对案件侦破和法庭审判有重要意义, 不断尝试将新的统计学方法引入微量物证检验领域, 利用统计学方法挖掘物证价值, 提高物证的证明力, 让统计学方法更加有效准确地服务于物证检验是今后努力的方向。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|