1、ICS 11.100 C 06 DB32 江苏省 地 方 标 准 DB 32/T 4028 2021 常染色体 STR基因座等位基因频率参数 Allele frequency parameters of autosomal short tandem repeat (STR) loci 2021-05-14发布 2021-06-14实施 江苏省市场监督管理局 发布 DB32/T 4028-2021 1 目 次 前 言 . 2 引 言 . 3 1 范围 . 4 2 规范性引用文件 . 4 3 术语和定义 . 4 4 群体遗传学参数计算 . 5 5 群体遗传学参数结果 . 7 DB32/T 4028
2、-2021 2 前 言 本 文件按照 GB/T 1.1-2020给出的规则起草。 本文件由江苏省人民医院提出。 本文件由江苏省卫生标准化技术委员会归口。 本文件主要起草单位:江苏省人民医院、司法鉴定科学研究院、江苏省公安厅物证鉴定中心、江苏 省司法鉴定协会,南京市司法鉴定协会。 本文件主要起草人 :周惠英、潘猛、李成涛、苏勇、居晓斌、陈峰、 冀强、 刘燕婷、崔鹤、叶琴。 本文件为首次发布。 DB32/T 4028-2021 3 引 言 科学研究表明,不同民族、不同地区人群的遗传特征存在差异。在进行人类遗传同一认定及亲权鉴 定时,应采用同地区同民族的人类遗传基因频率分布资料。 本文件运用法医物证
3、学、遗传学和统计学等学科的理论而制订,为法庭科学采用常染色体 STR基因 座进行法医物证鉴定所涉及的亲权指数计算提供科学数据和统一标准。 DB32/T 4028-2021 4 常染色体 STR 基因座等位基因频率参数 1 范围 本文件规定了汉族人群 19个常染色体 STR基因座的等位基因频率。基因座包括: D18S51、 Penta E、 FGA、 D6S1043、 D21S11、 D3S1358、 vWA、 Penta D、 D8S1179、 D12S391、 D19S433、 D5S818、 D13S317、 D7S820、 D16S539、 THO1、 TPOX、 CSF1PO、 D2S
4、1338。 本文件适用于 司法鉴定机构和司法鉴定人从事法医物证鉴定的活动,其他单位可参照使用。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 37223 亲权鉴定技术规范 SF/Z JD0105010 常染色体 STR基因座的法医学参数计算规范 3 术语和定义 下列术语和定义适用于本文件。 3.1 亲权鉴定 parentage testing 通过对人类遗传标记的检测,根据遗传规律分析,对个体之间的血缘关系进行判断的活动。
5、 来源 :GB/T 37223,3.1 3.2 基因座 locus 基因在染色体的特定位置。 来源 :SF/Z JD0105010,2.1 3.3 等位基因 allele 基因座上的基因可以有多种形式,它们之间存在 DNA一级结构的差异,这种有差异的基因互称为 等位基因。 来源 :SF/Z JD0105010,2.2 DB32/T 4028-2021 5 3.4 平衡定律 Hardy-Weinberg equilibrium 用于阐述繁殖对群体的基因频率和基因型频率的影响。该定律建立在一个理想的群体模式上,即群 体无限大、随机婚配、没有突变及没有大规模的迁徙和没有选择因素的影响,结论是群体中的
6、基因频率 和基因型频率在逐代传递中保持不变。 来源 :SF/Z JD0105010,2.7 4 群体遗传学参数计算 4.1 亲权指数 判断亲权关系所需的两个条件概率的似然比率,计算公式如下: )子的生物学父亲或母亲假设一个随机个体是孩 遗传表型概率(检测到当事人的 的生物学父亲或母亲)假设被检测个体是孩子 遗传表型概率(检测到当事人的PI 4.2 等位基因频率 处于 Hardy-Weinberg平衡状态的调查群体中,某种等位基因数目占该基因座上所有等位基因数目的 百分比。计算公式 如下 : 总个体观察数2 子数含有该等位基因的杂合+纯合子数2等位基因频率 注:单个基因座上全部等位基因频率的总和
7、应为 1。 4.3 杂合度 调查群体中某遗传标记所有基因型中杂合子的占比。杂合度越高,说明该遗传标记的杂合性越大, 在法医学个人识别中的应用价值越大。杂合度分为观察杂合度( observed heterozygosity , Hobs)和期望 杂合度( expected heterozygosity , Hexp)。计算公式分别为: 个体数调查 数个体杂合子Hobs ni iPN N 1 211Hexp 式中: N为调查群体中所有等位基因或单倍型的总数, n为等位基因或单倍型种类的数目, Pi为第 i 个等位基因或单倍型的频率。 4.4 排除概率 不是孩子生父或生母的随机个体,能够被遗传标记排
8、除血缘关系的概率。用于评估某一遗传标记系 统在亲权鉴定案件中的实际价值。遗传标记系统的多态性程度越高,可用于排除非生物学父亲或母亲的 能力越强。 一个常染色体 STR 基因座有 n 个等位基因,并且均为显性,则该 STR 基因座在三联体、二联体亲 权鉴定时 PE 计算分别按照下列公式进行: a) 三联体亲权鉴定 PE 计算公式: DB32/T 4028-2021 6 )334(21)1( 21 1 1 22 1 iij n i n ij ii n i i PPPPPPPEtrios b) 二联体亲权鉴定 PE 计算公式: 21 1 1 2 1 2 )1(2)1( jijin i n iji n
9、 i i PPPPPPPEduos 式中: PE为排除概率, n为等位基因的个数, Pi为等位基因 i的频率, Pj为等位基因 j的频率 4.5 累积排除概率 亲权鉴定不止使用一个基因座,有必要知道使用的全部遗传标记对于不是孩子生父的男子,否定父 权有多大的可能性,即累积排除概率 (cumulative probability of exclusion, CPE)。 计算累积排除概率的前提条件是一个遗传标记系统独立于另一个系统。计算公式为: CPE=1-(1-PE1)(1-PE2) (1-PE3) (1-PEk)=1- kj 1 (1-PEk) 式中: PEk为第 k个遗传标记的 PE值。求出
10、各个遗传标记的 PE值后,可按公式求出累积排除概率。 4.6 个体识别能力 随机抽取的两个体,在某个遗传标记中的表型、基因型不相同的概率越高,说明这个遗传标记在识 别不同个体方面的效能就越强,计算公式如下: mi ifPmDP 1 211 式中: DP 为个体识别能力, m 为某一遗传标记的表型数目, if 为第 i个表型的频率, m i i f 1 2 指调 查群体中随机抽取两个无关个体在某一个基因座上二者表型纯粹由于机会而一致的概率。 4.7 累积个体识别能力 个体识别不止使用一个遗传标记,一组相互独立的遗传标记联合使用,识别群体中不同个体的综合 能力,即累积个体识别能力( total d
11、iscrimination power, TDP)。计算公式为: TDP = 1-(1-DP1)(1-DP2) (1-DP3) (1-DPk) =1-Pm1Pm2Pm3Pm4Pm5 Pmk= kj jPm11 式中: k为遗传标记的数目, Pmj为检测系统中第 j个遗传标记的 Pm值, kj jP1 为检测系统中 k个遗 传标记的总 Pm值。 4.8 多态信息含量 遗传标记多态性可提供的信息量的度量, PIC值介于 0和 1之间,越接近 1,则遗传标记的信息量越 多。 PIC值取决于 STR基因座上等位基因数目及频率分布。计算公式为: ni ini ini ijni nij ini i PPP
12、PPPPIC 1 421 21 2211 1 21 2 )(121 DB32/T 4028-2021 7 式中: n为等位基因的数目, pi为基因座上第 i个等位基因的频率, pj为基因座上第 j个等位基因的频 率。 5 群体遗传学参数结果 5.1 样本来源 本文件样本选择,以身份证前 4位(省市代码)筛选江苏汉族人群无血缘关系个体样本共计 9025份。 19个常染色体 STR基因座复合 PCR扩增,扩增产物用 3130遗传分析仪(美国 ABI公司)进行毛细管电泳, 采用 GeneScan 3.2软件分析并获取分型结果。 PowerStats软件进行法医学参数(表 1)和等位基因频率参 数(表
13、 2)统计。 5.2 法医学参数 表 1中 Hardy-Weinberg平衡 定律 检验 P值均大于 0.05,说明本文件收集的样本有效。观察杂合度 、 多 态信息含量 、 个体识别能力和 排除概率统计 值 显示 19个 STR基因座随机抽样情况下 能 提供 较 高 的群体 多 态性信息。 累积个体识别能力 为 0.9999999999999999984341, 累积排除概率 为 0.999999989。以上均符合 法医物证鉴定使用要求。 表 1 江苏汉族人群 19 个 STR基因座的法医学参数( n=9025) 基因座 观察杂合度 个体识别能力 排除概率 多态信息含量 Hardy-Weinb
14、erg 平衡定律检验 P值 D19S433 0.8116 0.9416 0.6208 0.7919 0.5299 D5S818 0.7689 0.9139 0.5429 0.7385 0.1958 D21S11 0.8147 0.9443 0.6266 0.7965 0.7922 D18S51 0.8538 0.9629 0.7023 0.8407 0.6967 D6S1043 0.8705 0.9703 0.7356 0.8608 0.4510 D3S1358 0.7179 0.8707 0.4567 0.6689 0.5184 D13S317 0.8015 0.9309 0.6019 0.
15、7716 0.5731 D7S820 0.7736 0.9129 0.5509 0.7374 0.6404 D16S539 0.7888 0.9185 0.5787 0.7503 0.6635 CSF1PO 0.7339 0.8840 0.4828 0.6891 0.4579 Penta D 0.8083 0.9395 0.6146 0.7861 0.6504 vWA 0.7974 0.9301 0.5944 0.7702 0.2437 D8S1179 0.8464 0.9560 0.6880 0.8254 0.0774 TPOX 0.6161 0.7974 0.3108 0.5617 0.5
16、310 Penta E 0.9163 0.9872 0.8288 0.9136 0.2329 TH01 0.6405 0.8257 0.3424 0.5976 0.5986 D12S391 0.8370 0.9547 0.6693 0.8211 0.5697 D2S1338 0.8665 0.9653 0.7276 0.8475 0.3098 FGA 0.8488 0.9614 0.6926 0.8368 0.4795 DB32/T 4028-2021 8 5.3 等位基因频率参数 经过统计分析获得的 19个 STR基因座 等位基因频率参数,用于法医物证亲权鉴定时亲权指数 计算, 结果见表 2
17、。 表 2 江苏汉族人群 19 个常染色体 STR基因座等位基因频率参数( n=9025) D18S51 Penta E FGA D6S1043 D21S11 等位基因 频率 等位基因 频率 等位基因 频率 等位基因 频率 等位基因 频率 7 0.0001 5 0.0498 13 0.0002 8 0.0002 25 0.0001 8 0.0002 6 0.0001 14 0.0002 9 0.0014 26 0.0002 9 0.0002 7 0.0010 15 0.0001 10 0.0320 27 0.0027 10 0.0011 8 0.0045 16 0.0002 11 0.0974
18、 28 0.0454 10.2 0.0001 9 0.0072 16.2 0.0001 12 0.1376 28.2 0.0073 11 0.0029 10 0.0436 17 0.0023 13 0.1405 29 0.2603 12 0.0328 11 0.1300 17.2 0.0001 14 0.1415 29.2 0.0008 13 0.1895 12 0.1089 18 0.0221 14.3 0.0001 30 0.2772 13.2 0.0008 13 0.0508 18.2 0.0001 15 0.0151 30.2 0.0099 13.3 0.0001 14 0.0851
19、19 0.0470 16 0.0034 30.3 0.0049 14 0.2076 14.2 0.0001 20 0.0466 17 0.0440 31 0.1085 15 0.1840 14.4 0.0002 20.2 0.0003 17.3 0.0007 31.1 0.0002 15.2 0.0001 15 0.1003 21 0.1034 18 0.1749 31.2 0.0713 16 0.1298 16 0.0830 21.2 0.0023 18.2 0.0002 32 0.0317 17 0.0748 17 0.0808 21.3 0.0001 18.3 0.0001 32.2 0
20、.1220 17.1 0.0001 17.4 0.0001 22 0.1709 19 0.1448 33 0.0069 18 0.0439 18 0.0818 22.2 0.0057 19.1 0.0001 33.1 0.0001 19 0.0441 18.4 0.0015 22.3 0.0001 19.3 0.0005 33.2 0.0443 20 0.0323 19 0.0618 23 0.2280 20 0.0540 34 0.0007 21 0.0250 19.3 0.0001 23.1 0.0001 20.3 0.0008 34.2 0.0047 22 0.0164 19.4 0.0
21、009 23.2 0.0103 21 0.0072 35 0.0001 23 0.0064 20 0.0471 24 0.1935 21.3 0.0021 35.2 0.0002 24 0.0042 21 0.0287 24.2 0.0085 22 0.0003 36 0.0002 25 0.0022 22 0.0168 25 0.0991 22.3 0.0013 36.2 0.0001 26 0.0006 22.3 0.0001 25.2 0.0039 23 0.0001 27 0.0005 23 0.0082 26 0.0423 23.3 0.0001 28 0.0001 23.2 0.0
22、001 26.2 0.0007 29 0.0001 24 0.0041 27 0.0100 25 0.0022 27.2 0.0001 26 0.0008 28 0.0018 27 0.0003 29 0.0003 28 0.0001 30 0.0003 DB32/T 4028-2021 9 表 2 (续 ) D3S1358 vWA Penta D D8S1179 D12S391 等位基因 频率 等位基因 频率 等位基因 频率 等位基因 频率 等位基因 频率 12 0.0014 10 0.0001 5 0.0001 8 0.0019 14 0.0002 13 0.0013 12 0.0001
23、6 0.0030 9 0.0003 15 0.0155 14 0.0447 13 0.0023 7 0.0058 10 0.1023 16 0.0070 15 0.3564 14 0.2534 8 0.0487 11 0.0897 17 0.0930 16 0.3274 15 0.0309 9 0.3192 12 0.1332 17.3 0.0004 17 0.2037 16 0.1760 10 0.1181 13 0.2209 18 0.2286 18 0.0597 17 0.2498 11 0.1476 14 0.1870 18.2 0.0001 19 0.0049 18 0.1814 1
24、1.2 0.0001 15 0.1739 18.3 0.0001 20 0.0004 19 0.0894 12 0.1804 16 0.0789 19 0.2199 20 0.0153 13 0.1262 17 0.0109 19.3 0.0003 21 0.0012 14 0.0402 18 0.0011 20 0.1714 22 0.0001 15 0.0090 21 0.1067 23 0.0001 16 0.0013 21.3 0.0001 17 0.0002 22 0.0795 19 0.0001 23 0.0446 24 0.0207 25 0.0095 26 0.0020 27
25、0.0003 D19S433 D5S818 D13S317 D7S820 D16S539 等位基因 频率 等位基因 频率 等位基因 频率 等位基因 频率 等位基因 频率 9.2 0.0001 6 0.0001 6 0.0001 6 0.0001 6 0.0007 10 0.0004 7 0.0166 7 0.0032 7 0.0009 7 0.0002 10.2 0.0003 8 0.0031 8 0.2719 8 0.1419 8 0.0095 11 0.0029 9 0.0684 9 0.1334 9 0.0583 9 0.2872 11.2 0.0001 10 0.1940 10 0.1
26、468 9.1 0.0028 10 0.1286 12 0.0392 11 0.3328 11 0.2463 9.2 0.0001 10.2 0.0001 12.2 0.0049 12 0.2342 12 0.1515 10 0.1588 11 0.2495 13 0.2967 13 0.1386 13 0.0372 10.1 0.0008 12 0.2078 13.2 0.0394 14 0.0104 14 0.0092 11 0.3484 13 0.1019 14 0.2375 15 0.0017 15 0.0003 11.1 0.0002 14 0.0140 14.2 0.1088 16
27、 0.0001 12 0.2436 15 0.0008 14.3 0.0001 13 0.0384 15 0.0702 14 0.0054 15.2 0.1481 15 0.0003 16 0.0114 16.2 0.0336 17 0.0015 17.2 0.0044 18.2 0.0003 DB32/T 4028-2021 10 表 2 (续 ) THO1 TPOX CSF1PO D2S1338 等位基因 频率 等位基因 频率 等位基因 频率 等位基因 频率 5 0.0003 5 0.0001 5 0.0001 13 0.0001 6 0.1053 5.2 0.0001 7 0.0014
28、14 0.0001 7 0.2590 6 0.0001 8 0.0024 15 0.0001 8 0.0558 7 0.0004 9 0.0486 16 0.0116 9 0.5175 8 0.5200 10 0.2391 17 0.0668 9.3 0.0353 9 0.1213 10.1 0.0001 18 0.1146 10 0.0256 10 0.0253 11 0.2416 19 0.1625 11 0.0008 10.3 0.0001 12 0.3789 20 0.1203 12 0.0002 11 0.3024 12.1 0.0001 21 0.0252 12 0.0286 13 0.0758 22 0.0463 13 0.0018 14 0.0112 23 0.2189 14 0.0001 15 0.0008 24 0.1567 16.1 0.0001 25 0.0613 26 0.0118 27 0.0026 28 0.0009 29 0.0002 a 注: 出现稀有等位基因时, 按国际法医遗传学会推荐公式计算: 稀有等位基因 频 率 =(Xi+1)/(2n+1) , Xi 为该遗传标 记等位基因总数, n 为 检测样本个数 ( n=9025)。 _