人工智能在法医学中的应用与展望
刘志勇1,2, 张更谦3, 严江伟1,2,3,*
1. 中国科学院北京基因组研究所,北京 100029
2. 中国科学院大学,北京 100049
3. 山西医科大学法医学院,山西 晋中 030600
*通讯作者简介:严江伟,男,北京人,博士,教授,主任法医师,研究方向为法医基因组学。E-mail:yanjiangwei@gmail.com

第一作者简介:刘志勇,男,山西大同人,硕士研究生,研究方向为法医基因组学。E-mail:zhiyongliu1@163.com

摘要

目前,人工智能(artificial intelligence,AI)的理论不断创新与发展,尤其是在机器学习与神经网络方面,其成果在包括法医学在内的许多学科领域中得到了广泛的应用。人工智能辅助的法医学基础研究,涵盖了法医病理学、法医物证学、法医临床学、法医毒物分析学、法医人类学、法医昆虫学等领域,为解决传统法医学问题提供了新的思路与方法,极大地促进了各学科的进步,也为其将来法医学实践应用提供了巨大的发展空间。本文在简单介绍人工智能的概况后,着重综述了人工智能在法医物证DNA分型、死亡时间推断、个体特征刻画、年龄和性别推断、毒物目标化合物筛选与检测峰判读以及影像图像与病理学切片诊断应用中的研究成果,并讨论其在未来亟待解决的问题,以及发展中可能遇到的问题。

关键词: 人工智能; 法医学; 综述
中图分类号:DF795.1 文献标志码:A 文章编号:1008-3650(2019)05-0383-05
Forensic Applicability of Artificial Intelligence and Prospect
LIU Zhiyong1,2, ZHANG Gengqian3, YAN Jiangwei1,2,3,*
1. Beijing Institute of Genomics, Chinese Academy of Sciences, Beijing 100029, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
3. School of Forensic Medicine, Shanxi Medical University, Jinzhong 030600, Shanxi, China
Abstract

At present, artificial intelligence (AI) is constantly innovating and developing, especially in machine learning and neural network. Its achievements have been widely applied into various industries including forensic science. The basic forensic research assisted by AI covers the forensic disciplines among pathology, biology, clinics, toxicology, anthropology, entomology and other fields, thereby having provided new ideas and methods for solving traditional forensic problems, promoted great development of various forensic subjects meanwhile bringing forward tremendous forensic application progress. With a brief general introduction of AI to begin, this paper mainly summarizes the research achievements of AI from forensic DNA typing, postmortem interval inference, individual characteristic depiction, age and/or sex judgment, screening and peak interpretation of toxic target compounds to imageological and pathological diagnosis about tissue sections. Moreover, discussions were made of the problems to be solved urgently and the troubles coming from development.

Key words: artificial intelligence; forensic; review

人工智能(artificial intelligence, AI)主要是用人工的方法和技术, 模仿、延伸和扩展人的智能, 实现机器智能, 其长期目标是达到与人类智力水平相当的人工智能[1]。AI是在1956年美国新罕布什尔州举办的“ 达特茅斯夏季讨论会” 中首次提出, 它是在控制论、信息论和系统论的基础上, 综合了数学、心理学、哲学、认知科学、计算机科学、工程学等所形成的综合性学科。法医学是应用医学、生物学及其他自然科学的理论与技术, 研究并解决法律实践中有关医学问题的一门医学学科[2]。由于法医学所需要解决的问题具有涉及范围广、影响因素多、经验性强等特征, 而AI的核心就是学习和推理, 其在法医学中应用势必会加快该学科的理论与实践发展。

1 人工智能概述

AI经过几十年的发展, 逐渐形成了自动推理与不确定推理、机器学习、神经网络、专家系统、自然语言处理、模式识别、知识表示等学科体系[1], 并且随着AI日新月异的发展, 其涉及的内容也不断扩展。

1.1 自动推理与不确定推理

自动推理是指机器能够从一个或多个已知的判断(前提)逻辑地推论出一个新的判断(结论)的思维形式, 它是人工智能的核心内容之一, 是专家系统、程序推导、程序正确性证明和智能机器人等领域的基础[1]。不确定推理主要是讨论处理数据的不精确和知识的不确定所需的一些工具和方法, 主要有可信度方法、贝叶斯概率推理、模糊推理等。

1.2 机器学习

机器学习指让机器模拟人的学习能力, 获取知识和技能, 以此来增强机器的性能, 使机器拥有类似于人的智能[1]。统计学习是一种应用非常广泛的机器学习方法。统计学习是基于数据而构建概率统计模型, 可利用该模型进行数据分析与预测。支持向量机(support vector machine, SVM)是统计学习的一种类型, 是一种监督学习模式下的数据分类、模式识别、回归分析模型, 其具有强大的数学基础及理论支撑[3]。SVM在解决小样本、非线性及高维模式识别中有诸多优势, 也可推广到其他类型的机器学习中[1]。目前SVM已经应用于手写文本检测、人体部位识别、车辆交通违法检测、医疗领域等[3]

1.3 神经网络

神经网络也称为神经计算, 是对人脑或者生物神经网络的抽象和建模, 以类似生物的交互方式适应环境并从中学习, 其网络有许多层, 通过感知系统连接的层与层可将每层内容逐渐抽象, 最终实现复杂数据的处理[1]。虽然神经网络的训练速度较慢, 与人类大脑相比相差甚远, 但经过多年的发展, 其在医疗领域、模式识别、智能机器人方面取得的成就是巨大的。深度学习由人工神经网络发展而来, 是试图通过一系列多层的非线性的变换对数据进行抽象的算法[4]。其核心是将原始数据的每层特征提取出来, 然后作为下一层的输入, 逐渐转化为高层抽象的表达, 进而发现数据中复杂的结构。深度学习应用的主要类型有图像识别、语音识别、机器翻译、自然语言处理等。在人脸识别、信息检索等领域也展示出独特的优势。

1.4 其他

AI其他主要方面有:1)专家系统。是一类具有专门知识和经验的采用AI中知识表示和知识推理来模拟通常只能由专家才能解决的问题的计算机智能程序系统[1], 比如医学影像专家系统[5]、中医专家系统[6]、法医学专家系统[7]等。2)自然语言处理。是使用机器处理人类语言的理论与技术[1], 目前该技术取得了较大进展, 比如文摘生成、机器翻译等。3)模式识别。是将来源于对象的信息, 经过分析处理, 进而对该对象进行描述、分类、解释的过程。模式识别在文字识别中有很重要的应用, 比如光学文字识别技术。其在语音识别和图像识别中也有重要应用。

2 人工智能在法医学中的应用

法医学经过几十年的发展, 各大分支学科取得的成就有目共睹, 极大地促进了法医学鉴定事业的进步, 然而实践与理论研究中仍有一些问题有待解决, 比如死亡和损伤时间的精确推断、复杂死因分子鉴定、混合斑的溯源分析、个体特征推断等, AI的发展必定会为研究并解决这些问题开辟新的途径。

2.1 AI在法医物证DNA分型中的应用

当应用毛细管电泳平台进行DNA分型检验时, 往往有一些干扰因素:仪器运行、样品本身、毛细管状态、染料、通道和电压变异等, 目前的处理办法一般是采用静态峰阈值, 尽可能过滤杂峰, 将干扰降到最低。而实际中这些干扰因素往往是动态变化的, 设置的静态峰阈值不能够很好解决该问题, 时常会有假阳性假阴性的情况出现, Marciano等将AI中机器学习技术引入基因分型中, 将静态峰阈值变化为动态峰阈值, 很好地适用了复杂情况下的基因分型, 在一定程度有助于该问题的解决[8]。人工神经网络在处理峰图方面表现出巨大潜能, Taylor等探索用其自动识别电泳图谱[9], 下一步还将尝试用该方法处理混合DNA图谱的问题[10]。可以推知, 随着基因组测序的技术手段不断进步, 成本不断降低, 法医物证科学家们将面对的不再是简单的STR分型信息, 而是全基因组的测序信息, 因此这些基础数据的信息挖掘就至关重要[11]。由于机器学习在数据挖掘上具有分类、预测、关联、侦查等分析优势, 较适用于法医物证学与人类学中DNA大数据挖掘, 比如宏观上需要通过DNA确定个体的精准地理信息、民族信息、语系信息, 微观上需要确定个体精准的容貌特征、特殊性状等, 最终实现嫌疑人的精准定位。在以上领域中AI将发挥关键作用, 目前已经有学者用机器学习的方法对DNA序列的分类[12]、DNA位点的预测[13]进行初步探索。

2.2 AI在死亡时间推断中的应用

死亡时间又称死后时间间隔(postmortem interval, PMI), 是指检验尸体时距离死亡发生时的时间间隔, 是法医学中急需解决的问题。传统的解决方法有通过尸体现象、离子和酶学检测、DNA降解检测等推断, 近些年的新方法有显微分光光度、傅里叶变换红外光谱技术、彗星试验等[14]。法医昆虫学结合AI为PMI的推断提供了新的动力, 用两种人工神经网络的方法分析尸体上丝光绿蝇幼虫烃类化学物质的GC-MS谱估计绿蝇的生活阶段, 进而估计PMI, 得到准确度为80.8%和87.7%的结果[15]; 与之相似的通过机器学习的方法分析尸体鼻腔、外耳道等处微生物的变化, 也成为推断PMI的一种新方式[16]; 此外国内学者周兰等[17]用多种机器学习的方法连续分析家兔死亡后48 h内角膜图像推断PMI, 发现多种模型预测结果准确度有一定差异。针对白骨化尸体的研究, 已经有研究者通过机器学习中的随机森林方法, 训练模型进行PMI推断[18]。尸体的PMI推断不仅受到尸体本身状态影响, 更与尸体所处的环境有关, 环境因素的复杂变化导致PMI的推断是困难的, 因而AI结合多种尸体“ 标记” (昆虫学、微生物学、尸体现象等等)进行大数据分析可能是解决PMI问题的一种较优的方式。

2.3 AI在个体特征刻画、年龄和性别推断中的应用

法医遗传学个体特征刻画主要是通过全基因组关联分析寻找与外观特征相关联的单核苷酸多态性位点来进行[19], 进而建立模型进行特征预测。Lippert等[20]报道了基于机器学习的方法(最大熵算法)进行的1 061个个体面部特征和肤色、声音、性别、祖先预测等, 尽管获得的准确度不同, 但该方法为后续研究奠定了良好基础; Hwa等[21]使用一组SNP(常染色体, 性染色体, 线粒体), 利用机器学习聚类的方法对18个降解DNA样本进行祖先推断, 成功率可达94.4%。随着人群性状、遗传基因组学数据的不断积累与AI辅助下的数据综合应用处理能力不断提高, 生物物证介导的“ 嫌疑人X” 个体特征刻画会加速发展与实现。

年龄推断是法医实务中非常重要的问题, 包括活体年龄推断和尸体年龄推断。AI深度学习在骨图像识别和骨龄评估中尽管处于研究的初级阶段, 但已经表现出很强的发展势头[22]。Spampinato等[23]将深度学习神经网络模型首次应用于青少年手腕关节X线片骨龄推断自动化评估, 使用多种深度学习神经网络算法对图像进行识别, 结果表明人工方法与AI方法阅片间的误差为0.79岁。在国内维吾尔族青少年左手腕关节骨龄自动化评估的类似研究显示:男性误差范围在± 1.0 岁及± 0.7 岁的准确率分别为 81.4%和 75.6%, 女性分别为80.5%和74.8%[24], 随着算法的进步, 准确度将会进一步提高; 使用支持向量机的方法对140名11~19岁中国青少年骨骺生长评分, 也为活体骨龄确定提供新的途径[25]。组织DNA甲基化是生物体普遍的表观遗传现象, 其随着年龄的增长会逐渐积累, 结合神经网络的方法进行DNA甲基化法医学年龄推断已经获得很大进展[26]。此外, 深度学习也用在颅骨的性别鉴定中[27]。法医人体骨骼专家系统早在1995年就被尝试开发[28], 而基于AI方法的白骨化尸体骨龄推断文献报道较少, 深度学习可能给这个相对空白的领域带来突破。

2.4 AI在毒物分析目标化合物筛选与检测峰判读中的应用

近年来, 新的毒物毒品以惊人的速度增长, 毒物毒品检测分析面临着前所未有的挑战[29]。值得欣慰的是, 传统的毒品毒物检测方法在AI的辅助下研发速度明显加快:在毒物检测开发过程中, AI结合贝叶斯概率的方法可以辅助目标化合物的筛选[30]; 在检测结果的判读上, Woldegebriel等[31]开发了一套基于新的贝叶斯统计的概率模型, 在液质联用时用于物质的真峰与伪峰辨别。可以推知, AI机器学习将会在中毒检测及代谢组学生物标记物筛选、相关实验数据实时及后处理软件开发中发挥作用。AI在法医毒物检测中的研究应用尚处于初级阶段, 随着不同学科相互交叉, 相信法医毒理学与法医毒物分析学会迎来巨大的变革。

2.5 AI在影像图像与病理学切片诊断中的应用

AI在医学影像与病理学图像处理诊断中已经展现出优越性, 临床影像学专家系统初见成效[5], 在AI辅助下可将病理学图像转化为高保真可挖掘的数据, 不但可以进行精细化的病理诊断, 也可以自动生成诊断报告[32]。医学影像图像在法医临床鉴定中是一种非常重要的鉴定依据, 据不完全统计, 国内法医临床鉴定每年数量约100万件[33], 需要鉴定的影像图片数量非常之大。如果将临床影像学专家系统经过一定的适应性修改, 会极大地方便法医临床的影像诊断。随着其他检验程序的加入, 开发出全套智能检验鉴定专家系统成为可能, 实现从受理案件到鉴定报告全自动生成, 而法医临床工作者只需完成关键步骤(比如体格检查等)即可。在法医病理学中, 虚拟解剖优势逐渐凸显[34], 在此过程中将产生海量的影像数据, 此时开发配套的虚拟解剖AI影像诊断系统迫在眉睫。Ebert等[35]以出血性心包积液为例, 将深度学习的方法应用于死后CT图像诊断中, 证实了AI方法的可行性。未来在法医病理学切片诊断方面, AI不仅可以加强光学显微镜的诊断速度与精度, 也可同时分析其它辅助方法的结果, 比如免疫组织化学、基因分子诊断、红外光谱分析等, 因而未来构建多学科、共平台的法医病理诊断体系是关键。国内学者董贺文等[36]通过使用机器学习算法研究猪皮肤电流损伤病理切片的红外光谱特征, 证实该方法在猪皮肤电流损伤的鉴别诊断中具有可行性, 也表明AI辅助下的切片诊断具有较强的可操作性。相比于人工专家阅读各种图像, AI不仅可以快速、无疲劳地在发现异常、量化测量及鉴别诊断中发挥作用, 随着算法理论的突破优化, 还可以对海量图像进行数据深度挖掘, 达到高效、充分利用图像信息的目的。AI的深度应用, 有利于减少鉴定人员的主观性, 减少冤假错案, 缓解鉴定人员不足与水平参差不齐的状况, 也有助于全国标准的统一适用。

3 展望

2017年7月20日, 国务院发布了《新一代人工智能发展规划》(国发〔2017〕35号)[37], 该文件从顶层设计角度肯定了人工智能的重要性, 作为国家战略的一部分, 势必会引起“ 人工智能+其他专业” 相结合的浪潮。人工智能技术的发展日新月异, 引领着技术的变革, 也改变着法医学的基础研究与实践应用。

在法医学领域, 尚有一些关键问题有待解决, 比如死亡、损伤时间以及服毒时间的精准推断, 猝死的确切机制, 个体特征的准确刻画, 动物实验数据难以应用到人体等, 虽然新技术、新方法不断进入该领域, 但是由于方法复杂, 准确度较差, 检测结果个体差异性大等原因, 导致离实际应用还较远, 要解决这些问题, AI的引入不失为一种新的思路。但是, AI技术在带来便捷的同时, 也会给将来法医学证据的法庭采信带来影响。比如AI技术自动生成的和人工制作的各种鉴定意见书的效力问题, AI机器人能否作为鉴定人出庭接受质询等等。随着AI的发展应用, 这些都是无法避免, 需要解决的问题。

参考文献
[1] 史忠植. 人工智能[M]. 北京: 机械工业出版社, 2016. [本文引用:8]
[2] 丁梅. 法医学概论[M]. 5版. 北京: 人民卫生出版社, 2016. [本文引用:1]
[3] 刘方园, 王水花, 张煜东. 支持向量机模型与应用综述[J]. 计算机系统应用, 2018, 27(4): 1-9. [本文引用:2]
[4] YU D, DENG L. Deep learning and its applications to signal and information processing[J]. IEEE Signal Processing Magazine, 2011, 28(1): 145-154. [本文引用:1]
[5] 程勇, 陈卫国. 医学影像专家系统的研究和应用[J]. 放射学实践, 2006(3): 309-311. [本文引用:2]
[6] 张士舜. 中医学与人工智能[J]. 辽宁师专学报(自然科学版), 2017, 19(2): 1-4. [本文引用:1]
[7] 幸宇, 邢扬, 王体春, . 构建辅助命案现场重建的法医学专家系统[J]. 重庆医科大学学报, 2014, 39(10): 1471-1473. [本文引用:1]
[8] MARCIANO M A, WILLIAMSON V R, ADELMAN J D. A hybrid approach to increase the informedness of CE-based data using locus-specific thresholding and machine learning[J]. Forensic Science International Genetics, 2018, 35: 26-37. [本文引用:1]
[9] TAYLOR D, POWERS D. Teaching artificial intelligence to read electropherograms[J]. Forensic Science International Genetics, 2016, 25: 10-18. [本文引用:1]
[10] TAYLOR D, HARRISON A, POWERS D. An artificial neural network system to identify alleles in reference electropherograms[J]. Forensic Science International Genetics, 2017, 30: 114. [本文引用:1]
[11] AMORIM A, NADIA P. Big data in forensic genetics[J]. Forensic Science International Genetics. 2018, 37: 102-105. [本文引用:1]
[12] 董云玲. 基于机器学习的DNA序列分类算法研究[D]. 哈尔滨: 东北农业大学, 2017. [本文引用:1]
[13] 邹国英. 基于机器学习方法的DNA位点预测研究[D]. 景德镇: 景德镇陶瓷大学, 2016. [本文引用:1]
[14] 虢洪松, 崔文. 死亡时间推断方法的研究进展[J]. 济宁医学院学报, 2014, 37(3): 193-196. [本文引用:1]
[15] BUTCHER J B, MOORE H E, DAY C R, et al. Artificial neural network analysis of hydrocarbon profiles for the ageing of Lucilia sericata for post mortem interval estimation[J]. Forensic Science International, 2013, 232(1-3): 25-31. [本文引用:1]
[16] JOHNSON H R, TRINIDAD D D, STEPHANIA G, et al. A machine learning approach for using the postmortem skin microbiome to estimate the postmortem interval[J]. PLoS ONE, 2016, 11(12): e0167370. [本文引用:1]
[17] 周兰. 基于角膜图像的死亡时间推断研究和中毒死亡案件的调查研究[D]. 武汉: 华中科技大学, 2010. [本文引用:1]
[18] 戴佳琳, 戴家佳. 白骨化尸体死亡时间的推断[J]. 数理统计与管理, 2017, 36(2): 226-235. [本文引用:1]
[19] KIDD K K, PAKSTIS A J, SPEED W C, et al. Developing a SNP panel for forensic identification of individuals[J]. Forensic Science International, 2006, 164(1): 20-32. [本文引用:1]
[20] LIPPERT C, SABATINI R, MACHER M C, et al. Identification of individuals by trait prediction using whole-genome sequencing data[J]. Proceedings of the National Academy of Sciences, 2017, 114(38): 10166. [本文引用:1]
[21] HWA H L, WU M Y, LIN C P. et al. A single nucleotide polymorphism panel for individual identification and ancestry assignment in Caucasians and four East and Southeast Asian populations using a machine learning classifier[J]. Forensic Science Medicine and Pathology, 2019, 15(1): 67-74. [本文引用:1]
[22] 胡婷鸿, 万雷, 刘太昂, . 深度学习在图像识别及骨龄评估中的优势及应用前景[J]. 法医学杂志, 2017, 33(6): 629-634, 639. [本文引用:1]
[23] SPAMPINATO C, PALAZZO S, GIORDANO D, et al. Deep learning for automated skeletal bone age assessment in X-ray images[J]. Medical image analysis, 2017, 36: 41-51. [本文引用:1]
[24] 胡婷鸿, 火忠, 刘太昂, . 基于深度学习实现维吾尔族青少年左手腕关节骨龄自动化评估[J]. 法医学杂志, 2018, 34(1): 27-32. [本文引用:1]
[25] WANG Y H, LIU T A, WEI H, et al. Automated classification of epiphyses in the distal radius and ulna using a support vector machine[J]. Journal of Forensic Sciences, 2016, 61(2): 409-414. [本文引用:1]
[26] VIDAKI A, BALLARD D, ALIFERI A, et al. DNA methylation-based forensic age prediction using artificial neural networks and next generation sequencing[J]. Forensic Science International Genetics, 2017, 28: 225-236. [本文引用:1]
[27] 赵倩娜. 计算机辅助三维颅骨性别鉴定方法研究[D]. 西安: 西北大学, 2016. [本文引用:1]
[28] 邱小杉, 董峰, 邱凤章, . 法医人体骨骼个人识别专家系统的研究[J]. 数理医药学杂志, 1995(2): 163-165. [本文引用:1]
[29] 杜鸿雁, 杨智, 刘博, . 国内外法医毒物学研究进展及发展趋势[J]. 刑事技术, 2016, 41(5): 357-360. [本文引用:1]
[30] WOLDEGEBRIEL M, GONSALVES J, VASTERN A C, et al. Robust Bayesian algorithm for targeted compound screening in forensic toxicology[J]. Analytical Chemistry, 2016, 88(4): 2421-2430. [本文引用:1]
[31] WOLDEGEBRIEL M, VIVOITRUYOLS G. Probabilistic Model for Untargeted Peak Detection in LC-MS Using Bayesian Statistics[J]. Analytical Chemistry, 2015, 87(14): 7345. [本文引用:1]
[32] 闫雯, 李楠楠, 张益肇, . 人工智能时代的病理组学[J]. 临床与实验病理学杂志, 2018, 34(6): 661-664. [本文引用:1]
[33] 党凌云, 郑振玉, 宋丽娟. 2014 年度全国司法鉴定情况统计分析[J]. 中国司法鉴定, 2015(4): 116-119. [本文引用:1]
[34] 陈忆九. 虚拟解剖技术的应用研究进展[J]. 法医学杂志, 2014, 30(5): 360-366. [本文引用:1]
[35] EBERT L C, HEIMER J, SCHWEITZER W, et al. Automatic detection of hemorrhagic pericardial effusion on PMCT using deep learning - a feasibility study[J]. Forensic Science Medicine and Pathology. 2017, 13(4): 426-431. [本文引用:1]
[36] 董贺文, 李伟, 黎世莹, . 基于机器学习算法研究不同电压所致猪皮肤电流损伤红外光谱特征[J]. 法医学杂志, 2018, 34(6): 619-624. [本文引用:1]
[37] 国务院关于印发新一代人工智能发展规划的通知(国发〔2017〕35号)[EB/OL]. [2018-11-01]. http://www.gov.cn/zheng-ce/content/2017-07/20/content_5211996.htm. [本文引用:1]