已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
用Polyphen2和SIFT进行突变 SNP功能预测 三个网址 Polyphen2 http genetics bwh harvard edu pph2 SIFT http sift jcvi org 以上两个在线应用的软件 主要对SNP以及点突变进行功能预测 但预测限于错义突变 其他无义突变 突变为终止密码 碱基缺失 插入所造成的框移突变 以及起始密码子的突变均不可以预测 Uniportdatabase 数据准备 两个网站均为在线提交数据 提交的数据文件格式可有以下两种 第一种为蛋白质的氨基酸序列 按照FASTA格式编写第二种为蛋白质在Uniportdatabase中的ID 获取蛋白质序列或ID 可以在NCBI中查找 也可以直接在Uniportdatabase中查找 此处填写蛋白质名称 查询结果 仔细核对以上数据 ID就是所在polyphen2中需要号码 以humanDAX 1为例 ID为P51843 ID 蛋白质名称 种属 点击所需要的蛋白质ID链接 在出现的页面中可以详细查看DAX 1的信息 再次核对是否正确 注意右上角的几列标签 如图 点击 获取FASTA格式数据 此数据可能会被下载 下载后可以用记事本程序打开 或者有时会在浏览器中直接打开 可以将其中数据全部复制备用 下方即是打开的FASTA数据 最上面是蛋白质的信息 含ID 名称 种属 下方是氨基酸序列 sp P51843 NR0B1 HUMANNuclearreceptorsubfamily0groupBmember1OS HomosapiensGN NR0B1PE 1SV 2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRCCFCGEDHPRQGSILYSLLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNSTLFLLRFINANVIAELFFRPIIGTVSMDDMMLEMLCTKI 成都家教 成都家教网 Polyphen2应用 进入网站 http genetics bwh harvard edu pph2 在这里以我们以前发现的DAX 1L262P这个突变举例 在红框出填入已经查到的ID 下方FASTA数据可以不用输 绿框中输入突变氨基酸位置 在AA1中选择L AA2中选择突变后的P 最后点Submit 运行画面 每隔5 10秒点refresh刷新页面 直至Results中出现View 然后点击View 结果 一般突变预测看第二条图HumVar的结果 分数越接近1 0 损害可能越大 越接近0 损害可能性越小 结果分为benign possiblydamaging以及probablydamaging注 possibly为有可能 probably为很可能 成都家教 成都家教网 练习 小常所发现的SF 1基因一处SNP G146A 请用Polyphen2进行预测 蛋白质功能是否受到影响 最后结果 SIFT 进入网站 http sift jcvi org 在singleproteintools中找到SIFTsequence 点击打开进入数据提交新页面 填入自己email SIFT运算时间在20min左右 你可以等 也可以让他把邮件发送过来 蛋白质FASTA数据 将下载好的蛋白质Fasta数据上传即可 或者将用记事本或浏览器打开的Fasta数据copy至此数据框中 蛋白质序列可以截选 但必须有第一行的蛋白质信息数据 此处填蛋白质突变或SNP位点信息 如S578N L262P G146A等 成都家教 成都家教网 SIFT预测ARS578N功能变化 在Uniport中搜索AndrogenReceptor 下载FASTA数据 如下图为浏览器打开后的结果 sp P10275 ANDR HUMANAndrogenreceptorOS HomosapiensGN ARPE 1SV 2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ 此为第一行蛋白质信息 如果采用copy至数据输入框 而不是采用文件上传方法 红框中数据必须黏贴进输入框 而后面的蛋白质序列只需黏贴需要部分 注意 一般来说用文件上传方法比较简单 但SIFT对氨基酸序列有要求 大于500的氨基酸序列不能分析 故像AR这种有919个AA的就不能采用直接上传模式 而要将氨基酸序列裁剪过后按Fasta格式黏贴至数据框中 成都家教 成都家教网 sp P10275 ANDR HUMANAndrogenreceptorOS HomosapiensGN ARPE 1SV 2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ 我们需要先编辑FASTA数据 在记事本中打开 首先找到第578位的S 红色标出 因为SIFT最佳预测大小为300 400左右的氨基酸序列 那么我们将之前的400个氨基酸删除 蓝色部分 那么我们的突变位点就从S578N变为S178N 最后将末尾的139个氨基酸也一并删除 咖啡色 保留中间389个氨基酸 加上第一行的蛋白质信息 这就是我们需要提交的数据 成都家教 成都家教网 将刚才编辑好的数据填入这个框中 之前介绍过这个数据输入框 此框中填入突变信息S178N 页面中其他选项保持默认就可以 一般不需要更改 最后提交就可以 成都家教 成都家教网 OK 现在大家可以泡杯咖啡或茶 聊聊天 过个5 10分钟就可以出结果 一般不超过20分钟 如果出错 会有错误信息提示给你 如果你填好了邮箱 也可以不必等 过一会收邮件就可以 结果会有一堆英文 看了头痛 直接找到ScaledProbabilitiesforEntireProtein和Predictionsofsubstitutionsentered两处链接 分别点击进去 ScaledProbabilitiesforEntireProtein给出了所提交氨基酸每个位点发生突变后的计算分数 只要分数小于0 05就认为可能影响到蛋白质功能而Predictionsofsub
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年大学第四学年(建筑工程施工)门窗安装工艺试题及答案
- 浙江省杭州市景成实验校2026届初三第三次诊断性考试数学试题含解析
- 四川省自贡市富顺县2026届初三模拟考试(三模)英语试题试卷含解析
- 云南省昭通市昭阳区乐居镇中学2026届初三大练习(一)语文试题含解析
- 石家庄外国语校2026年初三练习题二(全国卷I)语文试题含解析
- 浙江省杭州市临安县重点达标名校2026年初三5月第二次月考试题(数学试题理)含解析
- 重庆市一中达标名校2026届初三下学期入学摸底考试英语试题含解析
- 四川省仪陇县大寅片区2025-2026学年初三下学期期末考试英语试题理试题(A卷)含解析
- 陕西省榆林市府谷县重点达标名校2026届初三下学期第二次联考(二模)英语试题试卷含解析
- 四川省甘孜县2025-2026学年初三3月教学质量检测试题语文试题含解析
- 卫生部病历书写基本规范2025年版
- QGDW11337-2023输变电工程工程量清单计价规范
- 建设施工质量保证金协议
- YD-T+1267-2003基于SDH传送网的同步网技术要求
- 2-3 配电终端运维
- 北斗手持机操作教案
- 建桥学院学生手册
- 储能技术-电化学储能
- 碧桂园地产集团--运营管理-碧桂园项目全周期管理对标V1课件
- 来访车辆登记表
- 中药香囊制作(中药学基础课件)
评论
0/150
提交评论