多拷贝Y-STR基因座判型标准及家系排查应用
丁光树, 孙辉, 孙敬, 袁丽萍, 莫晓婷, 宋文, 尚蕾*, 李万水*
公安部鉴定中心,北京 100038
* 通信作者简介:尚蕾,女,山东临沂人,博士,副主任法医师,研究方向为法医遗传学。E-mail: bluesnoopy9@126.com;李万水,男,河北张家口人,学士,主任法医师,研究方向为法医遗传学。E-mail: liwanshui68@sina.com

第一作者简介:丁光树,男,河南南阳人,硕士,主检法医师,研究方向为法医遗传学。E-mail: dinggsh2009@foxmail.com

摘要

研究多拷贝Y-STR基因座的拷贝数判定方法,探索多拷贝Y-STR基因座在家系排查中的应用效能。选取在多拷贝Y-STR基因座DYF399S1、DYS464、DYF371中出现分型异常的男性家系排查样本,分别扩增可能表征3个多拷贝Y-STR基因座拷贝数变化的内参基因BPY2、DAZ、CDY1,并检测判断它们在各样本相关于上述3个多拷贝Y-STR基因座的拷贝数,以此与根据分型图谱推测的预期值进行比较。在研究选取的样本中,内参基因实测拷贝数与预期拷贝数相符,表明可通过上述内参基因的检测分别判定DYF399S1、DYS464、DYF371的拷贝数变化。进一步结合多拷贝Y-STR的染色体定位,可初步推断Y染色体上的缺失或重复类型。本研究为男性家系排查样本多拷贝Y-STR异常分型的判定提供了一种简便实用的分析方法,初步提出了针对多拷贝Y-STR基因座的家系排查判定方案。Y染色体片段缺失或重复事件出现频率较高,因此可导致出现多拷贝Y-STR异常分型,对此应在今后的案件排查中留意重视。

关键词: 法医遗传学; 多拷贝Y-STR基因座; Y染色体片段缺失或重复; 内参基因; 家系排查
中图分类号:DF795.2 文献标志码:A 文章编号:1008-3650(2022)05-0523-07
Multicopy Y-STR Genotyping: Suggested Determinant Criteria and Application in Familial Investigation
DING Guangshu, SUN Hui, SUN Jing, YUAN Liping, MO Xiaoting, SONG Wen, SHANG Lei*, LI Wanshui*
Institute of Forensic Sciences, Ministry of Public Security, Beijing 100038, China
Abstract

A method was here established for determining the copy numbers of multicopy Y-STR loci which to be also explored about the efficacy for familial investigation maneuver in relevant cases. Three reference genes of BPY2, DAZ and CDY1 were selected to amplify with the investigated male-pedigree samples bearing abnormal profiles related to three multicopy Y-STR loci (DYF399S1, DYS464, DYF371). Ratios were obtained with measuring and comparing the peak areas of the above genes against those of their homologous ones from the electropherograms of the amplified products, hence rendering the expected ratios by which whether the copy number had varied was to analyze for each of the three multicopy Y-STR loci. The measured copies of reference genes were consistent with the expected for most of the tested samples, indicating that the reference genes are eligible for determining the copy numbers of the three selected multicopy Y-STR loci. Y chromosomal deletion or duplication patterns can also be estimated for the investigated samples if the above results are to combine with the chromosomal locations of related multicopy loci. The method provided here is convenient to determine the abnormal profiles of multicopy Y-STR in relevant samples from cases. A novel familial investigation strategy has therefore been suggested about taking multicopy Y-STR into consideration. Certainly, the abnormal profiles of multicopy Y-STR loci should be paid much attention with the ever-increasing inclusion into forensic application of such Y chromosomal STR loci that are prone to occur with deletions and duplications.

Key words: forensic genetics; multicopy Y-STR loci; Y chromosomal segment deletion or duplication; reference gene; familial searching

Y-STR遗传标记已广泛应用于男性家系排查[1], 对多起大案要案的侦破发挥了重要作用。由于突变的存在, 利用Y-STR进行家系排查, 通常需要遵循一定的评判标准[2]。有研究人员提出, 对于两个Yfiler Plus单倍型, 差异基因座不超过4个或总突变步数不超过5时, 不应排除来源于同一家系的可能性[3]。另有研究指出, 当检验的Y-STR基因座数量增加至30个以上且包含较多的高突变率Y-STR基因座(RM Y-STR)时, 同一家系男性个体间Y-STR的分型容差可达6个/步[4]甚至7个/步[5]。当然, 这其中主要考虑的是单拷贝Y-STR基因座, 其容差的产生往往来源于DNA复制滑动引起的等位基因突变。而对于核心重复序列结构复杂、分布于染色体上多个位置的多拷贝Y-STR基因座[6]而言, 情况可能截然不同。现有一起案件, 其检材的多个多拷贝Y-STR基因座疑似存在拷贝丢失的情况, 很可能源于Y染色体的片段缺失。为分析验证, 本文设计系列实验, 探讨了利用内参基因拷贝数变化辅助判断多拷贝Y-STR基因座拷贝数的方法, 提出了多拷贝Y-STR在家系排查中的初步评判方案, 以期为后续有关案件的侦查提供思路。

1 多拷贝Y-STR基因座拷贝缺失的发现
1.1 材料来源及检验

1998年, 某省某市一女性被杀。2021年, 办案机关将待排查血样送至公安部物证鉴定中心进行Y-STR检验。经利用自制DNATyperTMY36、MCY、RMY等Y-STR试剂盒检验, 仅从分型上看, 获得了与现场物证容差在3以内的样本69份(含0容差样本5份)。

1.2 结果分析

在向当地公安机关反馈家系样本排查结果时, 需要计算排查样本与现场DNA分型之间存在的容差。从电泳图谱(图1)看, 大量排查样本与现场DNA在DYF399S1基因座上存在分型差异, 且该基因座仅出现了1个“ 等位” 基因(“ 等位” 用以区别于常染色体上的真正等位基因, 下同)(表1)。DYF399S1基因座为三拷贝基因座[7], 那么, 一个“ 等位” 基因的出现可能是由于该基因座三个拷贝“ 等位” 基因分型一致, 也可能是出现了拷贝丢失。但是仅根据分型图谱, 很难判定拷贝是否丢失及其丢失的数量, 因此会影响到对于现场物证与排查样本是否来自于同一家系的判断。

图1 部分家系排查样本(A、B、C)在DYF399S1、DYS464、DYF371基因座的分型图谱Fig. 1 Profiling genotypes of three Y-STR loci (DYF399S1, DYS464, DYF371) from certain samples (A, B, C) of case

表1 部分排查样本在多拷贝Y-STR基因座(DYF399S1、DYS464、DYF371)的分型情况 Table 1 Profiled genotypes of multicopy Y-STR loci (DYF399S1, DYS464, DYF371) from certain samples of case

进一步分析Y-STR毛细管电泳检验图谱发现, 排查样本在其他多拷贝基因座的分型似乎也存在异常(图1)。初步比较同一基因座中不同“ 等位” 基因的检测峰面积发现, 大量样本在DYS464、DYF371基因座(均为四拷贝基因座)[8, 9]中分别检测到了疑似3个拷贝(表1)。

结合多拷贝基因座DYF399S1、DYS464、DYF371在Y染色体上的位置推测:这些样本可能在Y染色体上存在片段缺失, 在DYF399S1基因座可能只存在1~2个拷贝。

2 多拷贝Y-STR拷贝缺失与重复的验证
2.1 样本分类

为进一步验证上述案件排查样本中3个多拷贝Y-STR基因座的“ 等位” 基因缺失情况, 研究3个多拷贝Y-STR基因座缺失规律, 在回溯近期几起案件排查样本的电泳图谱后, 综合选取了疑似分型异常(图2)的样本40份用于后续研究。

图2 4类多拷贝Y-STR基因座分型异常样本的典型电泳图谱Fig. 2 Typical electropherograms of 3 multicopy Y-STR loci from 4 kinds of abnomal profiling samples

用MCY试剂盒重复检验后, 将这些样本根据峰型特征初步分为4类, 其中, 第1类样本10份, 第2类样本20份, 第3类样本9份, 这3类样本均各来自于同一地区, 第4类样本仅1份。4类样本在3个多拷贝Y-STR基因座的拷贝数根据分型图谱中各“ 等位” 基因峰面积比进行初步推测(表2), 以男性基因组标准品(9948)作为正常分型参照。

表2 4类多拷贝Y-STR基因座分型异常样本的推测拷贝数 Table 2 Speculated copies of 3 multicopy Y-STR loci from 4 kinds of abnomal profiling samples
2.2 实验设计

2.2.1 内参基因的选择

根据文献调研, 选取可用于分别表征DYF399S1、DYS464和DYF371基因座拷贝数变化的3个内参基因:BPY2[10]、DAZ[11]和CDY1[12], 通过对此3个内参基因拷贝数的检测推断相应多拷贝Y-STR基因座的拷贝数。

内参基因选取原则如下:1)其拷贝数与所表征的多拷贝Y-STR基因座拷贝数相同, 且相应拷贝在Y染色体上位置很近(40 kb以内)(图3), 发生缺失或重复时, 二者拷贝数也应同步变化。2)其在基因组中有相应的同源基因且同源基因拷贝数确定并基本不变。BPY2DP[10]、DAZL[11]和CDY2[12]分别为BPY2、DAZ和CDY1的同源基因(表3)。

图3 部分多拷贝Y-STR基因座及本文所用3个内参基因的染色体位置分布示意图[12]Fig. 3 Schematic for Y chromosomal locations of certain multicopy Y-STR loci and 3 reference genes [12] for this research

表3 9948中3个内参基因与其同源基因预期峰面积比 Table 3 Expected ratios of peak area from each of 3 reference genes to that of their respective homologous gene from 9948

设计三对引物, 分别扩增三个内参基因及其同源基因:BPY2(BPY2DP)、DAZ(DAZL)、CDY1(CDY2), 利用扩增片段长度差异和毛细管电泳区分内参基因和同源基因, 通过内参基因与其同源基因检测峰面积比(检测值)判断内参基因的拷贝数, 进而推断DYF399S1、DYS464和DYF371基因座的拷贝数(表3)。

在未发生Y染色体片段缺失(或重复)的样本中(比如9948基因组标准品), 理论上3个内参基因与其同源基因经扩增、检测后, 预期峰面积比应分别为3:1、4:2、2:2(表3)。同理, 对于四类分型异常样本, 内参基因与其同源基因的预期峰面积比(预期值)可以根据表2中的多拷贝Y-STR推测拷贝数演算。

BPY2(BPY2DP)基因的引物根据UCSC网站(http://genome.ucsc.edu/)参考序列设计, 而DAZ(DAZL)和CDY1(CDY2)基因的引物序列则参考文献[13], 上游引物均用6-FAM染料进行标记。

2.2.2 实验过程

研究选用10 μ L扩增体系, 其中2× Master Mix 5 μ L, 上下游引物4 μ L, 模板:男性基因组标准品(9948)0.2 ng、四类分型异常样本血卡(0.5 mm直径) 1片。PCR扩增程序如下:94 ℃、5 min; 94 ℃、40 s, 56 ℃、30 s, 72 ℃、40 s, 28个循环; 60 ℃、20 min。扩增产物以ABI 3500XL型遗传分析仪经毛细管电泳检测和GeneMapper ID-X v.1.5软件数据分析, 统计计算各样本关于BPY2(BPY2DP)、DAZ(DAZL)、CDY1(CDY2)基因的检测峰面积比。

2.3 结果与讨论

通过上述实验, 获得9948及4类分型异常样本在BPY2(BPY2DP)、DAZ(DAZL)和CDY1(CDY2)基因的检测峰面积比值(检测值), 部分结果见表4。总体而言, 检测值与预期值基本相符。因此, 研究选取的BPY2、DAZ和CDY1基因, 基本上可用于分别表征DYF399S1、DYS464和DYF371基因座的拷贝数变化。这或可作为将来案件排查样本有关多拷贝基因座准确判型的一种简便方法。

表4 9948和部分多拷贝Y-STR基因座分型异常样本的内参基因检测结果 Table 4 Results of reference genes from both 9948 and 4 kinds of abnomal profiling samples bearing multicopy Y-STR loci

第2类20份样本选取自本文1.1中所述的69份案件排查样本, 均来自于同一家系。对于个别样本在DYS464基因座表现出的1个“ 等位” 基因(表2), 根据DAZ(DAZL)的检测结果(表4), 可以判定此类样本在DYS464基因座仅缺失了1个拷贝, 也就是说电泳图谱表现出的单峰实际上代表3个拷贝, 这也验证了我们之前的推测拷贝数(表2)。根据BPY2(BPY2DP)的检测结果, 可以判定第2类样本均在DYF399S1基因座缺失了2个拷贝, 电泳图谱(图1)中的1个峰实际上就代表DYF399S1的1个拷贝。至此, 可以确定现场物证与排查样本在DYF399S1基因座的拷贝数是一致的, 嫌疑人很可能来自于0容差样本所在家系。

本研究也发现3份样本(1-3号、2-2号、4-1号)在部分内参基因的检测值与预期值之间存在差异(表4)。如4-1号(第4类异常分型的1号)样本在DAZ(DAZL)基因的峰面积比检测值约为6:2, 也就是说DAZ基因可能是增加了2个拷贝, 相应地, DAZ表征的DYS464应该也增加了2个拷贝。因此, 有理由推测4-1号样本在DYS464分型图谱(图2)中表现出的二“ 等位” 基因型, 实际上分别代表4个拷贝(AAAA)和2个拷贝(BB), 而不是表2中推测的3个拷贝(AAB)。其他2份样本的检测结果异常可能与其特殊的缺失类型或者内参基因引物结合区变异有关, 具体原因有待进一步探究。

3 多拷贝Y-STR异常分型成因分析及判型标准建议

多拷贝Y-STR基因座的各“ 等位” 基因命名方法主要有两种:1)仅根据观察到的“ 等位” 基因片段大小直接命名的C型命名法(conservative approach)。2)结合观察到的“ 等位” 基因片段大小及其峰高比例进行命名的E型命名法(expanded typing method)。

对于三拷贝及以上的基因座而言, 两种命名方法的结果存在较大差异, E型命名法获得的单倍型数目往往更多, 但是仅根据峰型高低判断也更易产生分型误差[6]

随着多拷贝Y-STR 基因座在案件排查中的应用越来越广, 异常分型将会更多地出现, 这对于分型结果的判定和解释会带来更多的困难。张文琼等[14]对DYF387S1、DYF399S1、DYF403S1、DYF404S1四个多拷贝基因座在湖北汉族252名无关男性个体中的异常分型进行了研究, 观测到的异常分型发生率高达7.94%, 远高于传统试剂盒中Y-STR多“ 等位” 基因的发生率。

Y染色体的男性特异区域(male-specific region of the human Y chromosome, MSY)主要由八大回文序列构成[12]。分析多拷贝Y-STR基因座的Y染色体位置(图3), 发现这些基因座大多分布于AZF(azoospermia factor, 无精症因子)区域中的AZFb和AZFc亚区, 这两个区域主要由五大回文序列和一些反向重复序列构成。AZFc区域缺失或重复事件的出现, 往往为非等位同源重组(non-allelic homologous recombination, NAHR)所致。在精子生成的过程中, AZFc区域中位置不同但序列相似的片段(block)之间可能发生重排, 导致产生各类染色体结构变化如缺失、重复、易位、倒位等[15], 这也是多拷贝Y-STR 基因座异常分型出现频率较高的潜在原因。

对于多拷贝Y-STR基因座判型标准, 现提出以下建议, 供大家参考。

1)对于DYF387S1、DYS527等两拷贝基因座, 建议都采用E 型命名法, 根据同一基因座内各“ 等位” 基因的峰型和峰高、结合不同基因座间峰高比(或峰面积比)进行判型。

2)对于DYF399S1、DYS464和DYF371等三拷贝及以上的基因座, 仅根据峰型高低判型, 难度较大且有可能错误判型。根据峰高、峰型初步判断其拷贝数可能存在异常时, 建议采用其他方法(如qPCR、NGS等)对拷贝数进行验证, 从而准确判型。比如本文通过对分型异常样本中3个内参基因拷贝数的检测, 辅助推断DYF399S1、DYS464、DYF371这3个多拷贝Y-STR的拷贝数。

3)基于以上两点, 建议对发生缺失(或重复)的Y染色体区段进行分析, 结合各多拷贝Y-STR在Y染色体上的位置分布, 综合判定各个多拷贝Y-STR的拷贝数与分型。比如位于AZFc区域(图3)的DYS527、DYF387S1、DYF383S1、DYF404S1、DYS459这5个两拷贝基因座的拷贝数一般会同步增减。

4 多拷贝Y-STR在家系排查中的应用

Zhang等[16]对AZFc区域常见的gr/gr缺失在东亚人群的发生频率进行研究发现, 东亚人群中gr/gr缺失的频率(约8%)远高于欧美人群, 并且这种AZFc区域的部分缺失通常并不影响东亚男性的生精能力。Zhang等[16]还发现, 在研究选取的我国八个不同民族群体内部, gr/gr缺失频率也存在显著差异, 湖南土家族和甘肃汉族群体缺失频率最高(15.3%), 而在广西瑶族群体中没有发现缺失。尽管AZFc区域部分缺失可能并不影响生育能力, 但是会导致多拷贝Y-STR基因座出现异常分型, 并且能遗传给下一代。因此, 在我国不同地区与不同民族间, 多拷贝Y-STR基因座出现异常分型的频率和类型很可能也存在较大差异。

本研究所涉多起案件排查样本中发现多拷贝Y-STR基因座存在拷贝数缺失, 这提示对于男性家系排查的标准应重新审视。已报道的家系排查参考标准大多针对单拷贝Y-STR基因座, 其对“ 等位” 基因突变的考虑相对简单。现在, 大量的家系排查实践加入了对多拷贝Y-STR基因座的检验, 由于Y染色体AZFc区域部分缺失(或重复)导致的多拷贝Y-STR基因座异常分型出现概率增大, 对异常分型的准确解释及利用应引起足够的重视, 在进行家系排查时, 多拷贝Y-STR的异常分型或许可以作为一种重要的家系、民族、地域特征。

在此, 我们初步提出家系排查中涉及多拷贝Y-STR基因座的判定方案:

1)现场检材与排查样本仅在某一个多拷贝Y-STR基因座分型存在差异时, 建议采用不同试剂盒进行验证, 排除引物结合区碱基突变造成拷贝数减少的可能。由于2个以上Y-STR基因座引物结合区同时发生突变的概率很低, 因此建议结合其他Y-STR进一步判定是否存在缺失。

2)现场检材与排查样本在多个多拷贝Y-STR基因座的分型均无缺失(或重复), 从零容差样本所在家系开始, 按容差数依次展开排查。

3)现场检材在多个多拷贝Y-STR基因座分型均无缺失(或重复), 而家系排查样本在多个多拷贝基因座中存在分型缺失(或重复), 则排除该家系的可能性较大; 反之亦然。

4)现场检材与排查样本的多个多拷贝Y-STR基因座分型均存在缺失(或重复), 且缺失(或重复)类型基本一致, 那么来源于同一家系的可能性较大。

5)对于2、3、4中提到的多个多拷贝Y-STR基因座的具体个数, 应综合分析检验的多拷贝Y-STR基因座数量和出现缺失(或重复)的多拷贝Y-STR在染色体上的位置分布与连锁情况, 视情况而定。

上述判定依据将在今后的实际案件中做进一步验证, 并尝试通过STS、SNV等标记对不同地区、不同民族人群的多拷贝Y-STR的缺失/重复模式进行更为精细的研究, 以期能为相关案件的排查提供更具指向性的线索。

参考文献
[1] 李鸿雷, 张旭, 孙辉, . 家系排查中Y-STR突变分析[J]. 刑事技术, 2018, 43(6): 501-504.
(LI Honglei, ZHANG Xu, SUN Hui, et al. Analysis of Y-STR mutation into familial searching[J]. Forensic Science and Technology, 2018, 43(6): 501-504.) [本文引用:1]
[2] 尚蕾, 丁光树, 李万水. Y-STR突变在物证鉴定领域的研究及应用进展[J]. 刑事技术, 2020, 45(4): 390-396.
(SHANG Lei, DING Guangshu, LI Wanshui. Progress from researches and applications of Y-STR mutation in forensic science[J]. Forensic Science and Technology, 2020, 45(4): 390-396.) [本文引用:1]
[3] LIU H, LI X, MULERO J, et al. A convenient guideline to determine if two Y-STR profiles are from the same lineage[J]. Electrophoresis, 2016, 37(12): 1659-1668. [本文引用:1]
[4] 张广峰, 高珊, 畅晶晶, . Y-STR单倍型在大家系中的差异研究[J]. 刑事技术, 2018, 43(2): 138-143.
(ZHANG Guangfeng, GAO Shan, CHANG Jingjing, et al. Variation of Y-STR haplotype in a deep-rooted pedigree[J]. Forensic Science and Technology, 2018, 43(2): 138-143.) [本文引用:1]
[5] 吴微微, 张晓霞, 金雷, . 中国汉族男性家系Y-STR基因座容差情况调查[J]. 中国法医学杂志, 2020, 35(4): 390-393.
(WU Weiwei, ZHANG Xiaoxia, JIN Lei, et al. An analysis of Y-STR mismatch distribution between the same male lineage in Chinese Han population[J]. Chinese Journal of Forensic Medicine, 2020, 35(4): 390-393.) [本文引用:1]
[6] 尚蕾, 莫晓婷, 杨帆, . 多拷贝Y-STR基因座在法庭科学领域的研究[J]. 刑事技术, 2018, 43(2): 97-103.
(SHANG Lei, MO Xiaoting, YANG Fan, et al. Progress towards forensic research and application of multi-copied Y-STR loci[J]. Forensic Science and Technology, 2018, 43(2): 97-103.) [本文引用:2]
[7] HENSON G L C. DYF399S1: a unique three-copy short tand em repeat on the human Y chromosome[J]. Journal of Genetic Genealogy, 2005(1): 8-11. [本文引用:1]
[8] REDD A J, AGELLON A B, KEARNEY V A, et al. Forensic value of 14 novel STRs on the human Y chromosome[J]. Forensic Science International, 2002, 130(2-3): 97-111. [本文引用:1]
[9] JOBLING M A, SAMARA V, PANDYA A, et al. Recurrent duplication and deletion polymorphisms on the long arm of the Y chromosome in normal males[J]. Human Molecular Genetics, 1996, 5(11): 1767-1775. [本文引用:1]
[10] CAO P R, WANG L, JIANG Y C, et al. De-novo origin of VCY2 from autosome to Y-transposed amplicon[J]. PloS One, 2015, 10(3): e0119651. [本文引用:2]
[11] SAXENA R, BROWN L G, HAWKINS T, et al. The DAZ gene cluster on the human Y chromosome arose from an autosomal gene that was transposed of repeatedly amplified and pruned[J]. Nature Genetics, 1996, 14(3): 292-299. [本文引用:2]
[12] SKALETSKY H, KURODA-KAWAGUCHI T, MINX P J, et al. The male-specific region of the human Y chromosome is a mosaic of discrete sequence classes[J]. Nature, 2003, 423(6942): 825-837. [本文引用:3]
[13] MACHEV. Sequence family variant loss from the AZFc interval of the human Y chromosome, but not gene copy loss, is strongly associated with male infertility[J]. Journal of Medical Genetics, 2004, 41(11): 814-825. [本文引用:1]
[14] 张文琼, 肖超, 余谨, . 4个多拷贝RM Y-STR基因座的异常分型[J]. 中国法医学杂志, 2016, 31(5): 476-479.
(ZHANG Wenqiong, XIAO Chao, YU Jin, et al. Anomalous genotype observation of 4 multi-copy RM Y-STRs[J]. Chinese Journal of Forensic Medicine, 2016, 31(5): 476-479.) [本文引用:1]
[15] KURODA K, TOMOKO, SKALETSKY, et al. The AZFc region of the Y chromosome features massive palindromes and uniform recurrent deletions in infertile men[J]. Nature Genetics, 2001, 29(3): 279-279. [本文引用:1]
[16] ZHANG F, LI Z, WEN B, et al. A frequent partial AZFc deletion does not render an increased risk of spermatogenic impairment in East Asians[J]. Annals of Human Genetics, 2006, 70: 304-313. [本文引用:2]