1、 ICS 13.310 A 92 中 华 人 民 共 和 国 公 共 安 全 行 业 标 准 GA GA/T XXXX XXXX 序列多态 STR 等位基因命名规 则 Nomenclature for sequence-based STR alleles 2020-08-01 发布 2021-01-01 实施 中华 人民共和国公安部 发 布 GA/T XXXX XXXX 目 次 前 言 . I 引 言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 2 5 命名原则 . 2 6 命名规则 . 3 附 录 A( 规范性附录) 法 庭科学 STR 基
2、因座序列信息 . 6 参 考 文 献 . 14 GA/T XXXX XXXX I 前 言 本标准按照 GB/T 1.1 2009 给出的规则起草。 请注意本文件的某些内容可能涉及专利 。 本文件的发布机构不承担识 别 这些专利的责任。 本标准由全国刑事技术标准化技术委员会 法医检验 分技术委员会( SAC/TC 179/SC 6) 提出 并 归口。 本标准起草单位: 公 安 部物证鉴定中心 、 四川大学 、 广州市公安局 、 辽宁省公安厅 、 北京市公安局 、 北京爱普益生物科技有限公司 。 本标准主要起草人: 季安全 、 叶健 、 王乐 、 康克莱 、 王正 、 刘超 、 刘锋 、 焦章平
3、、 张驰 、 周骋 。 GA/T XXXX XXXX II 引 言 STR遗传标记 广泛应用于 法 庭 科 学 、 医疗 诊断 以及 人类学研究 。本 标准面向 STR的应用需求,制订统 一的序列多态 STR等位基因命名规则, 提高 STR的应用价值。 GA/T XXXX XXXX 1 序列多态 STR 等位基因命名规则 1 范围 本标准规定了人类序列多态 STR等位基因命名规则。 本标准 适用于 所有从事 STR测序的 DNA实验室和产品制造商 。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件 , 仅 注日期的版本适用于本文 件。凡是不注日期的引用文件,其最
4、新版本(包括所有的修改单 )适用于本 文件 。 GB/T 37226 2018 法庭科学人类荧光标记 STR复合扩增检测试剂质量基本要求 GA/T 383 2014 法庭科学 DNA实 验室检验规范 3 术语和定义 下列 术语和定义适用于本文件。 3.1 基因座 locus 染色体上基因所占的位置或基因组 DNA 中的一段 。 GB/T 37226 2018,定义 2.2 3.2 等位基因 allele 位于一对 同源染色 体的相同位置上控制 同一 性状的不同形式的基因 。 3.3 基因型 genotype 个体一个或多个基因座上等位基因的组合,是生物体可见 性状的实际基因组成。 3.4 短串
5、联重复序列 short tandem repeat 一类广泛存在于真核生物基因组中的 DNA 串联重复序列。 其 重复单位 通常 由 2 6 个碱基构成, 重复次数通常在 5 60 次 。 3.5 单核苷酸多 态性 single nucleotide polymorphism 在 人类基因组范围内,任何单碱基突变使特异核苷酸位置上出现两种或 两种以上碱基,其中最少 的一种在群体中的频率不少于 1%, 所 形成 的 多态 性 遗传 标记 。 GA/T XXXX XXXX 2 3.6 长度多态性 length polymorphism 同一基因座上,各等 位基因之 间的 DNA 长度 差异构成的多
6、态性。 3.7 序列 多态 性 sequence polymorphism 同一基因座上,因 不同个体 DNA 序 列碱 基差异构成的多态性。 3.8 重复区序列 repeat region sequence STR 中重复单位 串联 组成 的部分, 一般 从第一个重复单位的 5端, 至最后一个重复单位的 3端的 序列。 3.9 侧翼序列 flanking sequence STR 重复区 序列两侧的 DNA 序列。 3.10 重复 单位 repeat unit STR 重复区 序列中 连续 反复出现的 DNA 序列 。 3.11 重复 结构 repeat structure STR 重复区
7、序列中重复 单位 的 组成形式 。 4 缩略语 下 列 缩 略语适 用于本文件。 DNA:脱氧核糖核酸( Deoxyribonucleic Acid) SNP:单核苷酸多态性( Single Nucleotide Polymorphism) STR:短串联 重复序列( Short Tandem Repeat) 5 命名 原则 5.1 以 GRCh38 作 为 比对 参考 序列,以其正向序列作为 STR 序列比对依据,进行序列比对、定 义 重复 结构 、定位 SNP。 5.2 定 义 STR 重复区的起始位置、终止位置和 重复 结构 见 附 录 A, 起始和终止位置是以参考序列描 述的 ,不因碱
8、基插入或缺 失而 改变。 5.3 命名规则 应具备基 因座可拓展性。 5.4 若 发现新的 STR 等位基 因,应可依据本命名规则 进行系统性唯一命名。 5.5 充分利 用 STR 序列 多态信息 。 5.6 与 国际法医遗传 学会 推荐 的 长度 多 态 STR命 名 指南 兼容 。 GA/T XXXX XXXX 3 6 命名 规则 6.1 命名通式 按照以下通式结构进行命名, 命名 细则 按 照 6.2 的 规定 执行。 ( / / ) : 重复区序列中 非重复单位的碱基变异信息 侧 翼 序列的碱基变异信息 重复区序列信息 等位基因的长度多态分型 , 用 阿拉伯数字 表示 6.2 命名细则
9、及示例 6.2.1 重复 结构 中仅包含单一重复 单位 的基因座, 用重复 单位 数目命名该等位基因。 示 例 : TPOX 基因座 重复 结构 为 AATGa, 该 基 因座 某 等位基因 重复区 序列为 AATG8, 侧翼序列与参 考 序列完全 相同, 则该等位基因命名为 8。 6.2.2 重复 结构 中包含 N( N1) 个重复 单位 的基因座,等位基因命名为: 重复 单位 总数目 (第一个 重复 单位 数目 /第二个重复 单位 数目 / /第 N 个重复 单位 数目 )。 示 例 1: D2S1338 基因座重复 结构 为 GGAAaGGCAb, 该基因座 某等位基因 重复区 序 列
10、为 GGAA6GGCA11, 侧 翼序列与参 考 序列完全相同, 则该等位基因命名为 17(6/11)。 示 例 2: D12S391 基因座重复 结构 为 AGATaAGACbAGATc,该基因座某等位基因 重复区 序列 AGAT11AGAC7, 侧翼序列与参 考 序列完全相同,则该等位基因命名为 18(11/7/0)。 示 例 3: D21S11 基因座 重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某 等位基因 重复区 序列为 TCTA6TCTG5TCTA3TATCTA3TCATCTA2TCCATATCTA7, 侧翼序列与
11、参 考 序列完全 相同, 则该等位基因命名为 26(6/5/3/3/2/7)。 6.2.3 当等位基因的 重复区 序列 中的重复 单位 存在插入序列时 , 将该插入序列以大写英文字母形式 插入等位基因名称的相应位置, 并 以“ +” 连接 该插 入序列和前后序列 。 在确定插 入的序列 和位置时, 应依次优先考 虑插入序列的 碱基 个数最少和 插入位置 最 靠近 序列 5端 的情况 。 示 例 1: TH01 基因座重复 结构 为 AATGa, 该基因座 某等位基因 重复区 序列为 AATG6ATGAATG3, 侧翼序列与 参 考 序列完全相同, 则该等位基因命名为 9.3(6+ATG+3)。
12、 示 例 2: D6S1043 基因座重复 结构 为 ATCTa, 该基 因座 某等位基因 重复区 序列为 ATCT5ATGTATCT10, 侧翼序 列与参 考 序列完全相同, 则该等位基因命名为 16(5+ATGT+10)。 示 例 3 : VWA 基 因 座 重 复 结构 为 TAGAaCAGAbTAGA , 该 基 因 座 某 等 位 基 因 重复区 序列为 TAGA3TGGATAGA3CAGA4TAGACAGATAGA , 侧翼序列与参 考 序 列 完 全相 同, 则 该 等 位 基 因 命名为 14(3+TGGA+3/4+TAGA+1)。 ( 该序列可能的序列插入 方式 如图 1 所
13、示, 根据上述优先规则, 确定 方式 一 作 为 唯一 序列 插入方式而进行相应命 名 ) 图 1 VWA 基因座 序列插入 方式 示意图(粗体标示的序列即 不同方式 插入序列) GA/T XXXX XXXX 4 6.2.4 当 等位基因的侧翼序列中存在 碱基替换 、插入 、 缺 失 时, 将侧翼序列中的碱基替换、插入、 缺 失信息增加体现在 重复区 序列信息 之后 , 中括号“ ”内 。以 重复区 序列为基准定义碱基 替换、插 入、缺失位 置 ; 以“ -”和“ +”分别表示“上游”和“下游” ; 以“ s”表示“替换”, 并紧 接替 换后的 碱基(序列); 以“ i”表示“插入”, 并紧接
14、 插入 的碱基(序列) ,同时以 连接号 “ ”连接插入的前后 位置,并以 下划线 “ ”标示 ; 以“ d”表示 “缺失 ” 。 当 出 现连续的碱基替换、插入、缺失时,以 “ ”连接碱基替换、插入、缺失的起始和终止位置 ,并以 下划线 “ ”标示位置范围 。当侧翼序列 中多处出现碱基 替换、插入、缺失时,按照“ 上游在下游之 前,位置数值 小的在位置数值大的 之前” 规则依次排列 , 中间用“ /”相连。 示 例 1: TPOX 基因座重复 结 构 为 AATGa, 该基因座 某等位基因 重复区 序列 为 AATG8, 侧翼序列 下游第 15 个碱 基( rs576104845, 参考序列
15、为 C) 替换 为 T, 则该等位基因命名为 8+15sT。 示 例 2: D13S317 基因座重复 结构 为 TATCa, 该 基 因座 某等位基因 重复区 序列 为 TATC8,侧翼序列下游第 1 个碱 基( rs9546005, 参考序列为 A) 替换 为 T, 则 侧翼序列下游起始 4 个碱基与 重 复 单位 同为 TATC, 该等位基因命名为 8+1sT。 示 例 3: Penta D 基因座重复 结构 为 AAAGAa, 该基因座 某等位基因 重复区 序 列 为 AAAGA12,侧翼序列下游第 4 个碱基( rs186259515, 参考序列 为 A) 替换 为 G, 则 侧翼序
16、列下游起始 5 个碱基与 重复单位 同为 AAAGA, 该等位 基因命名为 12+4sG。 示例 4: DYS626 基因座重复 结 构 为 AAAGaAGAAbAGAGGAAGcAAAGd, 该基因座某等位基因 重复区 序列 为 AAAG17AGAA2AGAGGAAG3AAAG3, 侧翼序列 下 游第 39 个碱基 与 第 40 个碱基 之间 插入 4 个碱基 ( AGAA) , 该等位基因命名为 26+3940iAGAA。 示 例 5: Penta D 基因座重复 结构 为 AAAGAa,该基因座某等位基因 重复区 序列 为 AAAGA5,侧翼序列上游第 16 个碱基到第 4 个碱基(参考
17、序列为 AAGAAAGAAAAAA)共 13 个碱基发生缺失,该等位基因命名为 5-164d。 示 例 6: Penta D 基因座重复 结构 为 AAAGAa,该基因座某等位基因 重复区 序列 为 AAAGA12,侧翼序列下游第 14 个碱基到第 20 个碱基 (参考序列 为 AAAAAAA)区 段内 1 个碱 基发生缺失 (该序列为虚构示例 ) ,该等位基因命名 为 12+14d。 6.2.5 当插入序列 位于 重 复 区 序列与侧翼序列之间时,规 定该插入序列计入重复区, 按 照 6.2.3 进 行命名。 示 例 1: D7S820 基因座重复 结构 为 TATCa, 该基因座 某等位基
18、因 重复区 序列 为 TATC9,且在 重复区 序列与上游 侧翼序列之间存 在单碱基 A 插 入, 则将该插入计入重复区 序列 , 该等位基因 命名为 9.1(A+9)。 示 例 2: D2S441 基因座重复 结构 为 TCTAa,该基因座某等位基因 重复 区 序列为 TCTA10TTTATCTA2,且在 重复 区 序列与上游侧翼序列之间 存在单碱基 A 插入,则将 该插入计入重复区 序列 ,该等位 基因命名 为 13.1(A+10+TTTA+2)。 6.2.6 (本条细则所适用的序列在实际人群中出现 的 概率 很 低) 当等位基因的 重复区 序列中 非重复 单位 存在碱基替换、插入、缺失时
19、,在 碱基替换、插入、缺失发生位置的 前一个重复单位数目后以 星 号 “ *”表 示, 并在命名 通式 的 重复区序列中非重复单位的碱基变异信息 部分补充说明碱基替换、插 入、缺失处的完整序列信息,以 冒号 “ :”起始。以 下划线 “ ” 标示替换的碱基,以“ +”连接插入 碱基和 前后序列,以删除 线 标示缺失的 碱基。如果 多处序列存 在碱基替换、插入、缺失, 分别在相 应 位置以 “ *”表示,并 在命名 通式 的 重复区序列中非重复单位的碱基变异信息 部分依次补充说明 ,中 间用 逗号 “ ,”相连 。 如果 以上序列 的碱基 变 异 导致 重复区 序列长度变化, 则 相应调整长度多
20、态分型。 示 例 1: FGA 基因座重复 结构 为 GGAAaGGAGAAAGbAGAAAAAAGAAAc, 该基因座某等位基因 重复区 序列 为 GGAA2GGAGAAAG12AAAAAAGAAA3, 即在最后两个重复单位之间序列存在 2 个碱基的缺失,侧翼序列与参 考 序列完全相同,则该等位基因命 名为 19.2(2/12*/3):AGAAAAAA。 (该基因座的 重复区 序列中 , 非 重 复 单位序 列亦计 入长度多态分型 ) 示 例 2: D19S433 基因座重复 结构 为 CCTTaCCTACCTTbCTTTCCTTc, 该基因座某等位基因 重复区 序列为 GA/T XXXX
21、XXXX 5 CCTT14CCTACCTTTTCCTT,即第二段 非重复单位 序列存在 2 个碱基缺失, 侧翼序列与参 考 序列完全相同,则 该等 位基 因命 名为 15.2(14/1*/1):CTTT。 示 例 3: D21S11 基因座重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某等位基因 重复区 序列为 TCTA9TCTG12TCTA3TCATCTA2TCCATATCTA13, 即 第一段非重复单位 序列存在 2 个 碱基的缺失,侧翼序列与参 考 序列完全相同,则该等位基因命名为 38.2(9/12/3*/0/2/13)
22、:TA。 示 例 4: D21S11 基因座重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某等位基因 重复区 序列为 TCTA6TCTG5TCTA3TATCTA3TCATCTA2TCCATTTCTA7(该 序 列 为虚构示 例) , 即 在第三段 非重复单位 序列存在碱基替换 ,侧翼序列与参 考 序列完全相同,则该等 位基因命名为 26(6/5/3/3/2*/7):TCCAT T。 示 例 5: D21S11 基因座重复 结构 为 TCTAaTCTGbTCTAcTATCTAdTCATCTAeTCCATATCTAf, 该基因座 某
23、等位基因 重复区 序列为 TCTA6TCTG5TCTA3ATATCTA3TCATCTA2TCCATTTCTA7(该序列为 虚构示例) , 即 在第一 段 非重复单位 序列存在 单 碱基插入,第三段 非重复单位 序 列 存在 碱基替换,侧翼序列与参 考 序列 完全相同,则 该等位 基因命名为 26.1(6/5/3*/3/2*/7):A+TA,TCCATT。 GA/T XXXX XXXX 6 附 录 A ( 规范 性附录) 法庭科学 STR 基因座序列信息 法庭科学 STR基因座序列信息 见表 A.1。 表 A.1 法庭科学 STR基因座序 列信息 序号 基因座 染色体 编号 GRCh38 染色体
24、上位置 重复 结构 GRCh38 重复区 序列 1 D1S1627 Chr1 106421092- 106421130 ATTa ATT13 2 D1S1677 Chr1 163590026- 163590085 TTCCa TTCC15 3 D1S1656 Chr1 230769616- 230769683 CCTAaTCTAb CCTATCTA16 4 D1GATA113 Chr1 7382831- 7382874 GATAa GATA11 5 TPOX Chr2 1489653- 1489684 AATGa AATG8 6 D2S441 Chr2 68011947- 68011994 T
25、CTAa TCTA12 7 D2S1776 Chr2 168788893- 168788936 AGATa AGAT11 8 D2S1338 Chr2 218014859- 218014950 GGAAaGGCAb GGAA2GGACGGAA13GGCA 7 9 D2S1360 Chr2 17310718- 17310801 AGATaAGACbAGATc AGAT5AGAC9AGAT7 10 D2S1772 Chr2 66824006- 66824105 CTATaGTATCTATbCTATcCTGTCTATCTGTCTAT CTAT6GTATCTAT4CTAT7CTGTCTATCTGTCT
26、AT 11 D3S1358 Chr3 45540739- 45540802 TCTAaTCTGbTCTAC TCTATCTGTCTA14 12 D3S4529 Chr3 85803484- 85803531 GATAaAATAGATAb GATA4AATAGATA7 13 D3S3053 Chr3 172033175- 172033210 GATAa GATA9 14 D3S3045 Chr3 107271167- 107271224 AGATaATAGATb AGAT4ATAGAT10 15 D3S1744 Chr3 147374752- 147374828 ATAGaATGATAGbATA
27、TAGc ATAG2ATGATAG13ATATAG 3 16 FGA Chr4 154587736- 154587823 GGAAaGGAGAAAGbAGAAAAAAGAAA c GGAA2GGAGAAAG14AGAA AAAAGAAA3 GA/T XXXX XXXX 7 序号 基因座 染色体 编号 GRCh38 染色体上位置 重复 结构 GRCh38 重复区 序列 17 D4S2408 Chr4 31302798- 31302833 ATCTa ATCT9 18 D4S2366 Chr4 6483114- 6483172 GATAaGATTbGATAcGACGATA d GATA7GATT3
28、GATA2GACG ATA2 19 D4S2364 Chr4 92596222- 92596257 ATTCaATCCATTC ATTC7ATCCATTC 20 D5S818 Chr5 123775556- 123775599 ATCTa ATCT11 21 CSF1PO Chr5 150076324- 150076375 ATCTa ATCT13 22 D5S2500 Chr5 59401444- 59401487 CTATa CTAT11 23 D5S2800 Chr5 59403132- 59403199 GGTAaGACAbGATAcGATT d GGTA3GACA8GATA3GATT
29、 3 24 D6S1017 Chr6 41709531- 41709570 GGATa GGAT10 25 D6S477 Chr6 6140394- 6140465 TCTAaTATCTAbTATCTAc TCTA2TATCTA2TATCTATCTGTCTA 11 26 D6S1043 Chr6 91740225- 91740272 ATCTa ATCT12 27 D6S474 Chr6 112557951- 112558018 AGATaGATAbGGTAcGACA d AGAT5GATA12 28 SE33 Chr6 88277144- 88277245 CTTTaTTCTCTTTb CT
30、TT16TTCTTT9 29 D7S820 Chr7 84160226- 84160277 TATCa TATC13 30 D7S3048 Chr7 21227099- 21227174 TATCaTACCbCACCc TATC9TACC7CACC3 31 D7S1517 Chr7 123857645- 123857732 CTTTaGTTTCTTTbGTTTcCTTT d CTTT2GTTTCTTT2 GTTT2CTTT15 32 D8S1179 Chr8 124894865- 124894916 TCTAaTCTGbTCTAc TCTATCTGTCTA11 33 D8S1115 Chr8
31、42681448- 42681471 TAAa TAA8 34 D8S1132 Chr8 106316692- 106316774 TCTAaTCATCTAb TCTA6TCATCTA14 35 D9S1122 Chr9 77073826- 77073873 TAGAa TAGA12 36 D9S2157 Chr9 133160282- 133160311 ATAa ATA10 GA/T XXXX XXXX 8 序号 基因座 染色体 编号 GRCh38 染色体上位置 重复 结构 GRCh38 重复区 序列 37 D9S925 Chr9 18289122- 18289189 TATAaTGTCb
32、TATCcTACCdTATC e TATA2TGTC2TATC9TACC2 TATC2 38 D10S1435 Chr10 2201138- 2201181 TATCa TATC11 39 D10S1248 Chr10 129294244- 129294295 GGAAa GGAA13 40 D10S2325 Chr10 12751052- 12751126 ATAAGa ATAAG15 41 TH01 Chr11 2171088- 2171115 AATGa AATG7 42 D11S4463 Chr11 131002511- 131002558 TATCa TATC12 43 D11S23
33、68 Chr11 19259601- 19259684 TATCaTGTCbTATCc TATC3TGTC2TATC16 44 VWA Chr12 5983977- 5984044 TAGAaCAGAbTAGA TAGA11CAGA5TAGA 45 D12S391 Chr12 12297020- 12297095 AGATaAGACbAGATc AGAT11AGAC7AGAT 46 D12ATA63 Chr12 107928590- 107928628 TTGaTTAb TTG3TTA10 47 D13S317 Chr13 82148025- 82148068 TATCa TATC11 48
34、D13S325 Chr13 42599304- 42599382 TCTAaTCATCTAb TCTA11TCATCTA8 49 D14S1434 Chr14 94842054- 94842105 CTGTaCTATb CTGT3CTAT10 50 D14S608 Chr14 283802643- 28380330 GATAaN12GATAbGACAGATA c GATA3N12GATAGACAGATA9 51 Penta E Chr15 96831015- 96831039 TCTTTa TCTTT5 52 D15S659 Chr15 46081911- 46081966 TATCa TAT
35、C14 53 D16S539 Chr16 86352702- 86352745 GATAa GATA11 54 D17S1301 Chr17 74684855- 74684902 AGATa AGAT12 55 D17S974 Chr17 10615428- 10615474 ATAGaATGATAGb ATAG2ATGATAG9 56 D17S1290 Chr17 58254109- 58254192 AGATaN28ATAGb AGAT4N28ATAG10 GA/T XXXX XXXX 9 序号 基因座 染色体 编号 GRCh38 染色体上位置 重复 结构 GRCh38 重复区 序列 57
36、 D18S51 Chr18 63281667- 63281738 AGAAa AGAA18 58 D18S535 Chr18 40568863- 40568929 AGATaAGACAGATbGATAGAT c AGATAGACAGAT2GATAGAT 12 59 D18S853 Chr18 3990629- 3990664 ATAa ATA12 60 D18S1364 Chr18 65732998- 65733056 TAGAaTACATAGAb TAGA3TACATAGA11 61 D19S433 Chr19 29926235- 29926298 CCTTaCCTACCTTbCTTTCCT
37、T c CCTT12CCTACCTTCTTTCCTT 62 D19S253 Chr19 15617484- 15617531 ATCTa ATCT12 63 D20S482 Chr20 4525692- 4525747 AGATa AGAT14 64 D20S470 Chr20 17391907- 17391946 AGGAa AGGA10 65 D20S1082 Chr20 55249399- 55249440 ATAa ATA14 66 D21S11 Chr21 19181973- 19182099 TCTAaTCTGbTCTAcTATCTA dTCATCTAeTCCATATCTAf TC
38、TA4TCTG6TCTA3TATCT A3TCATCTA2TCCATATCTA11 67 Penta D Chr21 43636205- 43636269 AAAGAa AAAGA13 68 D21S1270 Chr21 30334488- 30334556 ATAGaATGATAGbATGATAG c ATAG3ATGATAGATGATAGAT GATAG10 69 D21S2055 Chr21 39819508- 39819649 CTATaCTAACTATbN30TATC c CTAT2CTAACTAT12N30TATC 13 70 D22S1045 Chr22 37140287- 37
39、140337 ATTaACTATTb ATT14ACTATT2 71 D22GATA198B05 Chr22 17169811- 17169882 CTCTaATCTbACCTc CTCTATCT13ACCT4 72 DXS10074 ChrX 67757345- 67757400 AAGAaAAGGbAAGAc AAGA14 73 DXS10075 ChrX 67778478- 67778454 TAGAaTGATAGAb TAGA5TGATAGATATAGA12 74 DXS10077 ChrX 48458661- 48458717 TCCa TCC11TCTTCTTCC6 75 DXS1
40、0079 ChrX 67496081- 67496164 AGAAaAGAGAGAAb AGAA17AGAGAGAA3 76 DXS101 ChrX 102158105- 102158194 CTTaATTb CTT17ATT13 GA/T XXXX XXXX 10 序号 基因座 染色体 编号 GRCh38 染色体上位置 重复 结构 GRCh38 重复区 序列 77 DXS10101 ChrX 134520485- 134521619 AAAGaGAAAGAAGGAAAbA GAAAcAAGAAAAGdAAAAAGA AAAAGeAA AAAG3GAAAGAAGGAAA3A GAAA4AAGA
41、AAAG5AAAAAGA AAAAG13AA 78 DXS10103 ChrX 134284959- 134285038 TAGAaCTGACAGATAGAbCAGA cTAGA TAGA2CTGACAGATAGA11C AGA4TAGA 79 DXS10135 ChrX 9338302- 9338400 AAGAaGAAAGGAAAGAbAAAG AAGA3GAAAGGAAAGA19AAAG 80 DXS10146 ChrX 150403932- 150404065 AAAGaAAAAGbN10GGAAcN1 0GGGAdGGAAGGGAGGAAeA GGAAf AAAG2AAAAG13N1
42、0GGAA2 N10GGGA2GGAAGGGAGGAA4 AGGAA3 81 DXS10148 ChrX 9270938- 9271033 GGAAaAAGAbAAAGcAAGGAAAGAAGG d GGAA4AAGA12AAAG4AAG GAAAGAAGG2 82 DXS10159 ChrX 56722943- 56723052 AAAGaAGAAbAGAGAAcAAAG d AAAG4AGAA2AGAGAA6A AAG15 83 DXS10162 ChrX 62701505- 62701583 TCTTaTTTCTTbTTCTTc TCTTTTTCTT3TTCTT15 84 DXS1016
43、3 ChrX 62866507- 62866597 AAATAaAAAATAb AAATA16AAAATA2 85 DXS10164 ChrX 63025199- 63025253 ATTCTa ATTCT11 86 DXS10165 ChrX 63857444- 63857526 AAGAaAAAAAAGb AAGA6AAAAAAG14 87 DXS6789 ChrX 96194447- 96194530 TAGAaTACAbTAGAc TAGA11TACA9TAGA 88 DXS6795 ChrX 23226446- 23226478 AATa AAT11 89 DXS6799 ChrX
44、98124075- 98124125 ATCTa ATCT11ATCATCT 90 DXS6801 ChrX 93256208- 93256258 AGATaAGTTGATAGATb AGAT2AGTTGATAGAT9 91 DXS6804 ChrX 112869525- 112869576 TATCa TATC13 92 DXS6807 ChrX 4825369- 4825438 TATCaGTCTATCbTCATTACTATC c TATC12GTCTATC2TCATTACT ATC 93 DXS6809 ChrX 95683205- 95683355 AGATaN10AGATbGATAc
45、N9AGAT dATAGe AGAT13N10AGAT5GATA3N9 AGAT3ATAG9 94 DXS7132 ChrX 65435647- 65435702 TAGAa TAGA14 95 DXS7133 ChrX 109798334- 109798377 ATAGa ATAG11 GA/T XXXX XXXX 11 序号 基因座 染色体 编号 GRCh38 染色体上位置 重复 结构 GRCh38 重复区 序列 96 DXS7423 ChrX 150542522- 150542589 TGGAaAGGACAGATGGAb TGGA12AGGACAGATGGA3 97 DXS7424 Ch
46、rX 101363888- 101363938 ATTa ATT17 98 DXS8377 ChrX 150398253- 150398405 AGAaGGAAGAbAGAcGGAAGA d AGA30GGAAGA6AGA2GGA AGA6 99 DXS8378 ChrX 9402262- 9402301 ATAGa ATAG10 100 DXS981 ChrX 68977538- 68977592 GATAa GATAGATGATA12 101 DXS9902 ChrX 15305598- 15305641 TAGAa TAGA11 102 DXS9907 ChrX 32949346- 32
47、949393 ATAGa ATAG12 103 GATA165B12 ChrX 121744145- 121744180 AGATa AGAT9 104 GATA172D05 ChrX 113931717- 113931756 TAGAa TAGA10 105 GATA31E08 ChrX 141140209- 141140240 AGATa AGAT8 106 HPRTB ChrX 134481509- 134481560 ATCTa ATCT13 107 DYS19 ChrY 9684380- 9684443 TCTAaCCTATCTAb TCTA12CCTATCTA3 108 DYS385a ChrY 18680632- 18680