已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基因变异的表述方法 1 上集回顾 DNA的化学结构 查找序列 正义链和反义链 碱基书写顺序 mRNA和前体mRNA 外显子和内含子 CDS和UTR 外显子 CodingDNA 全基因突变 热点突变和已知突变 2 HGVS规范了基因及蛋白的变异表述 表述不统一将造成互相理解障碍 3 突变 与 多态性 的不同 Mutation突变 Change改变 罕见的 Disease causingchange致病改变 Polymorphism多态性 Changein 1 inpopulation人类群体中大于1 的改变Notdiseasecausingchange不致病的改变 4 建议使用的词语 Mutation突变 Polymorphism多态性 负面 正面 建议使用中性词 Variant Alteration变异CNV拷贝数变异SNV NotSNP 单核苷酸变异 5 指南 的定义 6 PGM中的Variant 7 VariantCaller的导出结果 写成 SNV 为好 8 报告有待规范 写成 变异 为好 9 规范的基因名称 1 网址 www genenames org或搜索引擎搜索关键词 HGNCgene 10 规范的基因名称 2 11 参考序列出处 1 基因的核酸信息包括染色体基因组DNA序列和mRNA序列 核酸信息参考NCBIGenBank核酸序列数据库参考序列 ReferenceSequence RefSeq 基因组DNA序列GenBank注册号前面用NT NC或AC加下划线进行标注 其中以 NT 标注的序列为BAC克隆或鸟枪测序法获得的不完整的基因组测序序列 如10号染色体上的片段NT 030059 同一序列号有不同的版本号时 后面用点加版本号表示 如NT 030059 14 成熟mRNA转录本 12 参考序列出处 2 美国国立生物技术信息中心 NCBI 收录的参考序列编码具有权威性及唯一性 其中前缀 NM 表示为mRNA序列 NP 表示多肽序列 NG 表示基因组序列 基因组参考序列应列出完整基因序列 包括5 以及3 非编码区 UTR 当使用某段编码DNA参考序列描述突变时 应选择合适的转录体 且转录体的起始转录点应当明确 例如选择最常见的转录体 或者是已知的最大转录体 或者具有组织特异性的编辑转录体 当某一参考序列具有多种转录方式时 选择NCBI数据库里注释最全面的版本 肿瘤个体化检测治疗指南 试行 国家卫生计生委个体化医学检测技术专家委员会制定 13 参考序列出处 HGVS有不同看法 HGVS建议使用LRG LocusReferenceGenomic 序列作为首选参考序列 如果该基因没有LRG序列 则采用RefSeq作为参考序列 HGNC的页面 14 LRG序列的web页面 点击这些绿色的 号得到有意思的内容 15 前缀 应指出突变位于哪种序列中 g 表示基因组序列 如g 476A T c 表示CodingDNA 编码DNA 序列 如c 76A T m 表示线粒体DNA序列 如m 8993T C r 表示RNA序列 如r 76a u n 表示非编码RNA序列 p 表示蛋白质序列 如p Lys76Asn 对于DNA变异的表述 c 优于 g 直观地得知该变异点在外显子上还是内含子上 会不会造成氨基酸编码改变 与表型联系起来 16 序列位置编号 1 基因组 线粒体DNA RNA 非编码RNA 蛋白序列 以参考序列的第一个碱基或氨基酸确立为1 直接数其在对应参考序列中的位置即可 如 g 476 m 9222 p 76 17 序列位置编号 2 CodingDNA 编码DNA 序列 将CodingDNA看成连续的 排除内含子间隔 以起始密码子ATG的第一个碱基A确立为1 以终止密码子的最后一个碱基确立为结束N 若碱基在CodingDNA范围内 则其位置为1 N区间内的自然数 如c 112 起始密码子ATG的上游的第一个碱基确立为 1 一直向5 端推移编号为 2 3 整个5 UTR区域位置均为负数表示 如c 72 没有 0 碱基 终止密码子下游的第一个碱基确立为 1 一直向3 端推移编号为 2 3 整个3 UTR区域位置均为 自然数 表示 如c 85 对于内含子起始片段内的位点 以上一外显子最后一个碱基的位置 加号和距离这个碱基的位置表示 如c 77 1 对于内含子末端的位置 以下一外显子第一个碱基的位置 减号和距离这个碱基的位置表示 如c 77 2 和 的分界线需谨慎决定 5 UTR若有内含子 内含子上的碱基位置以 23 1 23 2 22 2 22 1 形式表示 3 UTR若有内含子 内含子上的碱基位置以 154 1 154 2 155 2 155 1 形式表示 不建议使用c IVS1 1G c IVS1 2G形式的表示 IVS interveningsequence 原因 外显子 内含子的编号比CodingDNA编号更易引起混乱 18 序列位置编号 列表举例 19 c 171 c 247 c 246 c 312 序列位置编号 外显子 内含子举例 c 246 6 c 247 4 20 序列位置编号 5 端举例 c 26 c 25 6 c 25 c 1 21 变异的表述总体规范 1 英文输入法的大于号 表示碱基替换 如c 76A T 英文输入法的下划线 不是中划线 表示从起始位置编号到终止位置编号范围的受到影响 如c 76 78del del 表示缺失 如c 76delA dup 表示重复 如c 8dupG 不是c 8 9insG 重复和插入的定义不同 见后 ins 表示插入 如c 76 77insG delins 表示同时有缺失和插入 如c 112 117delinsTG inv 表示倒位 如c 76 83inv con 表示转换 如c 123 678conNM 004006 1 c 123 678 fs 表示移码 frameshift 变异导致在起始密码子和终止密码子之间的开放阅读框发生改变 如p Arg97Profs 23 ext 表示延伸 extension 变异发生在起始密码子或终止密码子上 导致氨基酸序列较之原序列变长了 如p Met1ValextMet 12 英文输入法的圆括号 表示发生变异的具体位置不确定 如c 67 70 insG 但是圆括号内的位置范围要尽可能缩到最小 英文输入法的方括号 表示发生在某个等位基因上 如c 76A T 或者已确定的数量 如c 123 124 4 22 变异的表述总体规范 2 DNA 前缀 c 位置编号 76 参考序列碱基 A 变化 改变后的碱基 如果有 T c 76A T 碱基以大写字母表示 包括A T G C Y R W等 RNA 前缀 r 位置编号 39 参考序列碱基 a 变化 改变后的碱基 如果有 u r 39a u 碱基以小写字母表示 包括a u g c y r w等 蛋白 前缀 p 参考序列氨基酸 Trp 位置编号 52 变化 没有 但 del ins 等不变 改变后的氨基酸 如果有 Ala p Trp52Ala 氨基酸以三字母 第一个字母大写 或单字母表示 如Trp或W 建议以三字母表示 第一个字母大写 不建议以单字母表示 因为单字母容易和碱基混淆 23 变异的表述总体规范 关于氨基酸终止 HGVS 用 Ter 或 英文输入法且英文字体下的星号键 表示氨基酸翻译终止 如p Asn26Ter或p Asn26 不使用 X 表示氨基酸翻译终止 原因 IUPAC IUB InternationalUnionofPureandAppliedChemistry InternationalUnionofBiochemistryandMolecularBiology 已规定 X 用来表示未指定或未知氨基酸 所以不能用来表示终止 X 符号代表终止密码子 例如 p Gly542X表示542位点的甘氨酸残基被终止密码子所代替 肿瘤个体化检测治疗指南 试行 此处存在争议 24 变异的表述 替换 替换 substitution 一个碱基 氨基酸被另一个碱基 氨基酸替换 特征是 一对一 如果是一个碱基 氨基酸变异成多个碱基 氨基酸 那是缺失 插入 如果是多个碱基 氨基酸变异成一个碱基 氨基酸 那是缺失或缺失 插入 如果是多个碱基 氨基酸变异成多个碱基 氨基酸 那是缺失 插入或转换 故没有 c 76 77AG TT 这种写法 用 英文输入法的大于号 表示某个碱基变成了另一个碱基 不建议使用 A76T 类似的形式表示 但是氨基酸替换没有 要写成 p Trp52Ala 这样的形式 举例 c 76A T p Glu26Asp 25 变异的表述 缺失 缺失 deletion 原本该有的没有了 举例 c 76del或c 76delA c 76 78del或c 76 78delACT 可以不用写成c 76 78del3 p Gln8del p Gln8 Ala10del 氨基酸移码变化见后 最靠近3 端法则 most3 position 缺失的碱基 认为其靠近3 端 而不是5 端 ACTTTGTGCC变成ACTTGCC 缺失了哪三个碱基 ACTTTGTGCC还是ACTTTGTGCC TGT比TTG更靠近序列的3 端 故认为缺失了TGT c 5 7del 而不是TTG c 4 6del ctttagGCATG变成cttagGCATG 写成c 301 3delT 而不是c 301 4delT c 301 5delT 但是该法则有例外 在描述外显子 内含子边界的变异时 认为缺失的碱基影响外显子大于影响内含子 如CAGgtg变成CAgtg 写成c 3delG 而非c 3 1delG 不确定断裂位置的情况 见于使用MLPA和PCR法发现的外显子缺失 要使用圆括号和预估的断裂位置范围 例如 c 87 1 88 1 300 1 301 1 del 表示某基因Exon3 4缺失 5 断裂点在Intron2 c 87 1 88 1 不确定具体在哪处 3 断裂点在Intron4 c 300 1 301 1 不确定具体在哪处 c 30 12 1 13 1 del 表示从基因5 某个位置开始至Intron1中的某个位置缺失 c 1 1 del 表示整个基因都缺失了 提醒 不要随便打 能确定具体断裂位置就不要打问号 26 变异的表述 重复 重复 duplication 碱基或氨基酸多出了一份拷贝 不是多份拷贝 并且多出来的部分直接加在其3 端 如果不是直接加在其3 端 而是插到了其它地方 那叫 插入 举例 c 7dup或c 7dupT 注意不写成c 7 8insT c 77 79dup或c 77 79dupCTG c 87 1 88 1 301 1 302 1 dup p Gly4 Gln6dup 描述重复的位置时也须符合 最靠近3 端法则 例如 MKMGHQHQCC变成MKMGHQHQHQCC 写成p His7 Gln8dup 不写成p His5 Gln6dup 27 变异的表述 多份重复 多份拷贝重复 repeat 碱基或氨基酸多出了多份拷贝 并且多出来的部分直接加在其3 端 如果不是直接加在其3 端 而是插到了其它地方 那叫 插入 表示形式 第一个重复单元起始位置 第一个重复单元终止位置 总共的重复数 如c 123 124 4 或者 第一个重复单元起始位置 重复单元 总共的重复数 如c 123TG 4 不用 c 123 124TG 4 形式表示 显得冗余 特殊举例 脆性X综合症FMR1基因5 端重复单元 c 128 126 79 确定共有79个重复单元 c 128 126 600 800 重复单元数在600 800之间 具体数量不确定 通过SouthernBlot做出的结果 不要写成c 128GGC 79 因为该基因中有的GGC重复单元可能变异为GGA单元 写成c 128GGC 79 就不符合实际情况 亨廷顿舞蹈症HTT基因重复单元 c 53AGC 21 p Gln 23 为什么此处不写氨基酸编号原因不明 群体研究 g 1209 4523 12 45 该片段在人群中重复12 45次不等 28 变异的表述 插入 插入 insertion 原本没有的却有了 且多出的部分不是其5 端紧邻的碱基或氨基酸的拷贝 和 重复 的区别 举例 c 51 52insGAGA c 123 54 123 55insAB012345 2 g 76 420 p Lys2 Met3insGlnSerLys p Trp182 Gln183ins17 注意 所描述插入位置一定是由下划线连接起来的范围 而非单个点 c 51 52insGAGA 清晰的表明了插入位置是在c 51和c 52之间 c 51insGAGA 就会引起混淆 插入位置是在c 51的5 端还是3 端 不确定时需打圆括号 如 c 67 70 insG 不确定是在c 67 c 70间的哪个位置插入了G c 11 12ins 2 或者 c 11 12insNN 确定插入了两个碱基 但不确定插入的碱基序列是什么 c 11 12ins 100 或者 c 11 12insN 100 确定插入了100个碱基 但不确定插入的碱基序列是什么 29 变异的表述 插入 续 如果插入DNA或RNA的碱基很多 多到无法把所有插入的碱基都写出来 应尽量寻找所插入的碱基来源 加入到描述中 如 c 123 54 123 55insAB012345 2 g 76 420 实在找不到插入碱基的来源 怎么办 HGVS未指明 个人看法 仅供参考 可以用 ins 插入碱基的数量 加括号 来表示 数量要打括号 如 c 11 12ins 100 不直接写成 c 11 12ins100 但 在已清晰地描述了DNA或RNA的变异基础上 氨基酸变异描述可以不加括号 直接写插入的数量 如 p Trp182 Gln183ins17 30 变异的表述 缺失 插入组合 先缺失 再插入 同时满足缺失和插入的表述规范 举例 c 112 117delinsTG或者c 112 117delAGGTCAinsTG c 113delinsTACTAGC或者c 113delGinsTACTAGC p Cys28delinsTrpVal 氨基酸的在码变异 inframe 和移码变异 frameshift 在码变异 inframe 一个或多个氨基酸变成另外的一个或多个氨基酸 但其它氨基酸编码不受影响 DNA的单碱基替换 或碱基缺失 增加的数量是3的倍数 可导致在码变异 移码变异 frameshift DNA的碱基缺失或增加不是3的倍数 造成在起始密码子和终止密码子之间的开放阅读框发生了变化 变异发生处C端下游的氨基酸编码都受到影响 注意以上概念和蛋白 延伸 的区别 31 变异的表述 移码变异 在码变异的表述 没有 fs 如 p Gln8 Ala10del p Cys28delinsTrpVal 移码变异的表述 1 短描述 前缀 受影响的第一个氨基酸 fs 如 p Arg97fs 2 长描述 推荐采用 前缀 受影响的第一个氨基酸的变异情况 fsTer 或fs 变异后的新终止位置 如 p Arg97Glyfs 26 不要加入 del ins dup 等字眼 关于确定变异后新的终止位置 受影响的第一个氨基酸确立为1 然后再新的开放阅读框中 其C端下游的氨基酸依次编号为2 3 即为终止密码子所对应的氨基酸位置编号 把 直接连在 fsTer 或 fs 的后面 举例 变异后新的开放阅读框为Trp112 受影响的第一个氨基酸 原本是Asn Ala113 Gln114 Asp115 Leu116 117 则变异写作 p Asn112Trpfs 6 117 112 1 6 不是写作 p Asn112Trpfs 5 p Asn112Trpfs 117 亦或 p Asn112Trpfs 118 在变异后新的开放阅读框中没有发现终止密码子 则 用 代替 如 p Ile327Argfs 32 查看移码后的翻译序列 1 33 查看移码后的翻译序列 2 34 氨基酸的特殊变化 1 同义变化 氨基酸没有改变 用 p 表示 不使用 p Leu54Leu 或 p L54L 形式表示 打括号表明没有在蛋白水平和RNA水平上进行实验实证 不建议用 p Leu54 或 p L54 形式表示 仅是不建议 不是禁止 但国内的 指南 对同义变化的表述没有谈及 无义变化 用 Ter 或 英文输入法且英文字体下的星号键 表示氨基酸翻译终止 如p Asn26Ter或p Asn26 不使用 X 表示氨基酸翻译终止 存在争议 特殊例子 p 110Glnext 4或p 110Qext 4 表示原110位氨基酸应为终止位置 但变成了Gln 延伸出了4个新氨基酸 包括这个Gln 然后在114位终止 即Gln110 原本是 Ala111 Asp112 Trp113 114 p 321Argext 或p 321Rext 表示原321位氨基酸应为终止位置 但变成了Arg 延伸出了很多个新氨基酸 没发现终止密码子 不知道在哪里终止 因此打上 35 氨基酸的特殊变化 2 第一氨基酸的变化 因为启动子区或起始密码子的变异导致没有蛋白翻译出来 并且提供了实验数据支持 则用 p 0 表示 因为启动子区或起始密码子的变异推测没有蛋白翻译出来 不能提供实验数据支持 这种情况较常见 则用 p 0 或 p Met1 表示 因为启动子区或起始密码子的变异导致翻译起始位点改变 1 翻译起始位点变到了上游举例 p Met1ValextMet 12 或 p M1VextM 12 表示原第一位Met变成了Val 新的氨基酸较之参考氨基酸序列多出了12个氨基酸 从Met 12到Thr 1 新的第一个氨基酸变成了Met 12 编号规则与CodingDNA5 UTR编号规则一致 同样没有 0 位氨基酸 2 翻译起始位点变到了下游举例 p Phe2 Met46del 或 p F2 M46del 表示发生变异后 较之于参考氨
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年幼儿园谚语公开课课件
- 2026年幼儿园比尾巴公开课课件
- 2026年福建省晋江市高二生物下册期末考试考试卷标准卷附答案
- 2026年江苏省句容市高二生物下册期末考试测试卷及答案(典优)
- 2026年福建省福安市高二生物下册期末考试测试卷含答案(突破训练)
- 2026年江苏省太仓市高二生物下册期末考试测试卷(基础题)附答案
- 2026年山东省胶州市高二生物下册期末考试模拟卷【突破训练】附答案
- 企业技术创新推进方案
- 企业环境管理环节方案
- 2026年湖北省麻城市高二生物下册期末考试检测卷含完整答案(易错题)
- 2026年广东省汕头市潮南区中考一模英语(含详细答案解析)
- 建筑防水维修用快速堵漏材料验收方案
- 2026年安全生产月:非煤矿山爆破作业安全管理课件
- 13 任何可能的紧急情况的处理措施、预案以及抵抗风险包括工程施工过程中可能遇到
- 中国成人患者肠外肠内营养临床应用指南(2026版)
- 2025年交通运输概论考试试题及答案
- 五下道法 全册必背120个考点26春
- 天津中考:历史高频考点总结
- 2026年地铁站务员面试常见问题
- 2026苏教版(新教材)小学科学二年级下册《探秘玩具》单元综合测试卷及答案(2套)
- 2026年中央安全生产考核巡查明查暗访清单
评论
0/150
提交评论