第一作者简介:张庆霞,女,河南淮阳人,硕士,主任法医师,研究方向为法医物证检验与研究。E-mail: qingxiazhang@sina.com
目的 联合应用毛细管电泳与二代测序技术,探索肯定亲权案件中的STR基因座的突变率和突变方式。方法 2600例肯定亲权关系的案件材料采用PowerPlex21试剂盒进行STR检验,发现67例存在基因座突变,对该67例亲子关系(62例三联体,5例二联体)的196个样本用SeqTyper®24构建文库,使用Ion PGMTM平台进行二代测序。结果 12个STR基因座共发现71个突变,父源突变与母源突变的比例为3.13‥1。其中64例亲子关系观察到1个基因座突变,2例观察到2个基因座突变,1例观察到3个基因座突变,有些突变从毛细管电泳所得STR基因座结果无法判断是增加还是减少了一步,二代测序则可以明晰等位基因的遗传方式及突变情况。结论 对于复杂核心序列、含不完全重复单位的基因座,有些突变可以通过二代测序明确突变的来源和方式,更直观地从微观碱基序列的角度观察等位基因的遗传。
* 通信第一作者简介:马万山,男,北京人,学士,主任法医师,研究方向为法医物证检验与研究。E-mail: 13691442641@139.com
Objective To coalesce capillary electrophoresis into next generation sequencing for exploring the mutational patterns among STR loci from paternity testing.Methods From 2600 cases of confirmed paternity, the relevant STR loci were screened with PowerPlex21 kit, thus having 67 cases found of mutations that involved with 196 samples (relating to 62 trios and 5 duos) which were afterwards detected through SeqTyper®24 to construct the correlative library. Further, Ion PGMTM platform was adopted to carry out next generation sequencing.Results There were 12 STR loci having been found of totaling 71 mutations, among which the mutant ratio of paternal to maternal was 3.13:1. Single one-locus mutations were observed in 64 cases, with the two-locus’ in two cases and the three-locus’ in one case. For some mutations, it is difficult to determine whether there has been increased or decreased of a step from the capillary electrophoretic results of STR loci. In contrast, next generation sequencing can clarify the inheritance route and mutational pattern.Conclusion For the locus harboring complex core sequence and/or incomplete repetitive unit, next generation sequencing is able to identify and confirm certain mutations, having the inheritance of alleles observed more directly from the microscopic DNA base sequences.
毛细管电泳检测STR(CE-STR)技术早已广泛应用于亲子鉴定。近年来, 二代测序技术开始应用于法医物证领域[1]。二代测序技术 (second generation sequencing, SGS或next generation sequencing, NGS)是通过边合成边测序, 经捕捉新合成的末端标记来确定DNA的碱基序列。NGS技术可以同时在一个反应内完成数十万到数百万条DNA分子片段的序列测定, 具有高测序深度、高并行性和高准确性的特点, 能够充分地挖掘有效的遗传信息, 在亲子鉴定方面, 应用二代测序技术检测STR (NGS-STR)可以获得STR基因座序列内部的结构差异, 能增加多态性信息, 因此可以更好地鉴别亲权关系以及突变情况。
本文联合应用CE-STR和NGS-STR, 以2015年至2016年北京通达首城司法鉴定所已出具鉴定书的2 600例肯定亲权关系的案件为基础, 对存在STR基因座不符合遗传规律的67例案件所涉及的196个样本, 应用SeqTyper® 24试剂盒进行文库构建和二代测序技术检测, 分析相关基因座的突变来源、突变步数等, 探讨二代测序在亲权鉴定方面的优势与不足。
2 600例肯定亲权关系的7 722份血斑样本来自北京通达首城司法鉴定所日常受案工作。
样本提供者签署了知情同意书。本研究已经伦理委员会论证, 符合伦理要求。
1.2.1 DNA提取、PCR扩增和STR分型
采用IQ试剂盒(美国Promega公司)提取7 722份样本的DNA, 以PowerPlex21试剂盒(美国Promega公司)进行PCR扩增, 扩增体系和条件按试剂盒说明书进行。
扩增产物以3130xL型基因分析仪(美国ThermoFisher公司)电泳检测, 采用GeneMarker软件进行基因分析。
1.2.2 突变基因座的确认
对于20个STR基因座(PowerPlex21系统)中检出1~2个不符合遗传规律基因座的亲缘样本, 补充检测MicroreaderTM 23sp ID System(苏州阅微基因技术有限公司)和Sure ID PanGlobal人类DNA身份鉴定试剂盒(宁波海尔施基因科技有限公司), 共检验43个常染色体基因座。
按照GB/T 37223-2018亲子鉴定技术规范[2]要求计算亲权指数(paternity index, PI值), 当PI值大于10 000则“ 支持被检测男子是孩子的生物学父亲” , 在实践中即认为达到认定的水平。
本文中的三联体的累积亲权指数大于107, 二联体的累积亲权指数大于104, 符合亲子关系, 因此作者将上述亲子鉴定中不符合遗传关系的基因座确认为突变基因座。由于案件受理时样本提供者已确认生母, 本文三联体按亲母疑父进行计算, 当孩子的突变基因来自母亲, 在计算PI值时不考虑已明确来自母亲的突变[3]。
1.2.3 突变等位基因及来源的确认
对于突变基因座要先确定突变的等位基因, 再确定来源。
1)确定突变等位基因的原则
在父母的等位基因中, 以与突变而成的新等位基因步数相差最小的等位基因为发生突变的等位基因, 即优先考虑一步突变, 然后再考虑发生概率较小的多步突变, 多步突变是通过逐步突变形成的; 若相差的步数相同, 则以结构相同的等位基因作为突变基因; 若步数相同而结构不同则判为来源无法判定[4]。
2)确定突变来源的原则
对于三联体, 由于同一基因座源自父母同时发生突变的几率较低, 故较易判断孩子中发生突变的等位基因。
1.2.4 文库制备、高通量测序与数据分析
将检出不符合遗传规律的基因座的62例三联体鉴定、5例二联体鉴定, 应用北京爱普益生物科技有限公司SeqTyper® 24试剂盒(包含CSF1PO、vWA、D3S1358、D5S818、D7S820、D8S1179、D13S317、D16S539、D21S11、D18S51、FGA、TH01、TPOX、D2S1338、D19S433、D6S1043、Penta D、D12S391、Penta E、D6S474、D17S974、D1S1679、D1S1656和Amel, 片段长度在95~281 bp之间)进行文库构建, 采用Ion Chef自动化测序模板制备系统和PGM测序系统(均为美国ThermoFisher公司)进行测序, 芯片为318V2BC(美国ThermoFisher公司), 操作参照Ion PGM Hi-Q view chef Kit(美国ThermoFisher公司)试剂盒说明进行。
采用SeqVision V1.5软件(北京爱普益生物科技有限公司)与参考序列比对进行分析, 流程包括长度质控、Barcode归类、基因座归类、基因分型。
等位基因序列命名主要以STRbase公布为准, 并以A、B、C编号作为后缀, A、B、C是在STRbase中公开的序列[5], 如D21S11 29A。本研究中自己新发现的序列用#1、#2表示, 按发现时间的先后顺序, 第一次发现的序列命名为#1, 第二次命名为#2, 依次类推。
2 600例肯定亲权关系的案件, 共7 722份样本, 双亲(三联体)鉴定2 522例, 单亲(二联体)鉴定78例, 共观察到5 122次减数分裂。经STR检验共发现67例亲子关系(其中62例三联体, 5例二联体)存在基因座突变。对该67例亲子关系所涉及的196个样本进行二代测序, CE平台得到的STR分型结果与NGS平台得到的结果完全一致。经计算得到的突变率及突变步数结果见表1, 67例案件的突变方式见表2。
在64例亲子关系案件中观察到1个基因座突变, 2例亲子关系观察到2个基因座突变, 1例亲子关系观察到3个基因座突变。
本研究中, TH01、TPOX、D3S1358、D7S820、D16S539、D2S1338、D19S433、D6S1043基因座未发现突变。
在67例亲子关系案件中共发生了71次突变(表1), 其中一步突变为60次 (84.50%), 增加和减少一步各30次; 两步突变为4次 (5.63%), 两步增加1次, 两步减少3次; 三步突变为3次 (4.23%), 三步增加1次, 三步减少2次。
![]() | 表1 12个STR基因座的突变率及突变步数(N=5122) Table 1 Mutation rate and steps from the involving 12 STR loci (N=5122) |
对比两个平台对突变步数判断的影响, 经CE平台检测有2例不能确定突变步数是增加还是减少了一步, 而通过NGS平台检测结果的序列推断, 确定此2例(详见表3的案例1和案例2)均为增加一步的突变; 有4例两个平台均不能确定类型。
根据1.2.3中的原则确定突变的父源或母源, 在71次突变中观察到父源突变50例, 母源突变16例, 两者比例为3.13‥1, CE不能确定为5例, 经NGS平台检测后仍有4例不能确定, 详见表2。
![]() | 表2 67例案件的突变方式 Table 2 Mutation patterns of the related 67 cases |
本研究表3中的案例2, CE的结果在D21S11上, 父亲的分型为28/32.2, 孩子为28/30, 母亲为29/31, 其突变来源于母亲, 既可是29→ 30, 也可以是31→ 30, 根据测序的结果母亲的29B序列与孩子的30A序列差异仅表现在最后[TCTA]10与[TCTA]11不同, 其余序列均相同, 而母亲的31A与孩子的30A序列差异较大, 因此判断来自母亲的突变应为29→ 30。通过NGS平台的测序结果还可以判断具体突变来源于亲代的哪个等位基因, 本研究的案例3, D21S11, CE平台得到的STR分型, 父亲为29/30, 孩子为30, 母亲为31, 测序结果表明孩子的30由两个不同的亚型组成, 即30A和30B, 母亲的31也由两个不同的亚型组成, 即31A和31#2, 孩子的30A来自父亲, 孩子的30B是由母亲的31A突变而来。亲代为长度相同的纯合子, CE平台检测的结果无法判断该亲代的哪个等位基因传递给子代, 经NGS平台的测序可发现纯合子实为两个等位基因序列不同的亚型。有4例则经过二代测序也无法判断突变来源, 例如表3的案例4。
![]() | 表3 部分案例中突变基因座的等位基因序列 Table 3 Allelic base sequence of mutation-harboring STR loci from the related cases |
本研究在5 122次减数分裂中观察到12个STR基因座发生71个突变, 突变率在0.02‰ ~2.73‰ , 其中D12S391、FGA、D8S1179、D21S11四个基因座的突变率在2‰ 以上, vWA的突变率接近2‰ , 因此在亲权鉴定时应加以注意。
本研究观察到的高突变基因座与毕洁等[6]对20 723例亲子鉴定中19个STR基因座的突变分析中D12S391、FGA为高突变基因座相一致, 但Penta E的突变率存在差异。突变率高的原因是STR基因座长度较长, 根据测序结果可以看到重复单位数目较多、序列相对复杂。一步突变中, 出现重复单位增加为30次, 与出现重复单位减少了30次的数目相当, 两步与三步突变中, 重复单位减少的数目多于增加的数目。
父源突变与母源突变的比例为3.33‥1, 与文献[7]报道的父系突变率是母系突变率3.5倍的结论相一致, 父系突变多见的原因是男性的精原细胞成为精子所经历的复制和分裂比卵细胞多, 因此产生滑动错配的概率相应增多。
检验基因座数量越多, 检测到的突变基因座就会越多。针对一个案例中发现多个突变基因座, 本文共检验43个常染色体基因座, 选择三套试剂盒, 一是确证突变, 印证基因型的准确性, 二是增加新的基因座来增加累积PI值, 以更加科学地认定或排除亲权关系。
另外, 在计算累积PI值时, 不符合遗传规律的基因座必须参与计算, 针对两个及以上突变基因座的案例, 本研究累积PI值均达到了107以上, 同时增加检验了性染色体STR, 分型结果也符合遗传规律, 因此支持认定亲权关系。
对多个基因座突变的案例, 为防止出现鉴定结论错误, 通过增加检测常染色体STR、X-STR、Y-STR[8]、SNP等多种遗传标记以及采用序列测定方法补充信息含量尤为必要, 不能单纯依靠出现3个或以上STR基因座不符合遗传规律就做出排除的鉴定意见。
与基于毛细管电泳平台所得STR长度多态性结果相比, 二代测序可以反映STR基因座序列内部结构的差异, 增加了多态性信息。针对突变来源的分析, 主要分为以下三种类型。
第一种类型, CE得到的STR分型结果无法判断突变步数是增加还是减少了一步时, 二代测序能明晰, 如表3中的案例1和案例2。
第二种类型, CE的结果为纯合型, 经二代测序发现亚型不同, 测序结果可以明确是由具体何种亚型突变而来。等位基因亚型即序列多态性的发现更加细分了基因座的分型, 其等位基因亚型频率低于对应的等位基因频率, 提高了基因座的个体识别能力和非父排除率, 可提高个案的亲权指数, 但目前由于缺乏等位基因亚型的群体遗传数据, 因此本文计算时仍按照该等位基因的频率进行计算。
第三种类型, 如案例4, 两种方法均无法判断突变来源, 对于父母序列均相同的等位基因, 如vWA的19, 父母核心序列均为[TCTA][TCTG]4[TCTA]14, 在侧翼区也未见不同, 此时应用二代测序没有优势。
与毛细管电泳检测相比, 二代测序具有直接检测序列多态性、可组合的基因座不受荧光种类限制、每个基因座的扩增片段长度不受荧光组合限制等优点, 但二代测序的检测时间相对较长、测序成本较高。
本研究发现, 对于核心序列复杂、含不完全重复单位的基因座, 二代测序可以通过序列测定明确某些突变的来源, 更直观地从微观碱基序列的角度观察等位基因的遗传, 能充分发挥其对相同长度等位基因片段“ 亚型” [9]的检测能力, 提高STR基因座的等位基因检出数目和鉴别能力。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|