版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验三:多条序列比对Clustalx(一) ClustalXClustal是一种利用渐近法(progressive alignment )进行多条序列比对的软件。即从多条 序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及 远的将其它序列依次加入到最终的比对结果。(Figure 3.1 )/1.安装clustalx 程序。双击安装clustalx-2.0.12-win.msi.exe文件到自己的电脑上。也可从/download/current/下载,列表中的倒数第二个文件。clus
2、talx-2.0.12-wi n. msiHorseHba_Du HflixkBox scHbbjHuinnCLUSTAL WIQuick pairwise iilignm吧nt: calculate distance matrixHlw.HumanMvu Whak!alpha heli 匕 msi2.准备要比对的序列Neighbor-Joining tree(gnicle lrt*e)Progressive alignment following guide treeFigure 3.1 clustal 算法请查找至少存在于5个物种中的同源序列(核酸或蛋白质皆可),并保存为fasta格式,存
3、 为文本文件(所有的序列请粘贴到同一个文本文件中)。选择NM XM£NP打头的序列,不要选 择N(或 NW打头的序列,那是全基因组序列。做法可参照邮箱中的preparations for practice3.doc文件。3.打开clustalX程序开始菜单一程序一clustalX2- clustalX24.载入序列点最上方的File菜单,选择Load Sequenee-选择你刚保存的序列文件,点打开。在左侧窗口里是fasta格式序列的标识号,取自序列第一行“>”后的字符。(Figure 3.2)注意:ClustalX程序无法识别汉字,无法识别带空位的文件夹名,如my docum
4、ent。各位同学保存的序列文件不要保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。常见文件打开错误原因:1 序列格式有问题,非正确的fasta格式。2文件中有序列重复粘贴。TIPS:想要方便识别序列所属物种,可在每条序列“>”后输入物种名,加空位即可。EXAMPLE 原格式:>gi|262050536|ref|NM_002218.4|Homosapiens inter-alpha(globulin)inhibitorH4 (plasma Kallikrein-sensitive glycoprotein) (ITIH4), transcript variant 1, mRN
5、A2改为:human gi|262050536|ref|NM_002218.4| Homo sapiens inter-alpha (globulin) inhibitor H4(plasma Kallikrein-sensitive glycoprotein) (ITIH4), transcript variant 1, mRNAFigure 3.2 载入序列5. 比对参数的选择可以对两条序列比对的参数和多条序列比对的参数进行设置。a.两条序列比对的参数设置点击 Alilgnment 菜单,选择 Alignment Parameters,再选择 Pairwise Alignment Para
6、meters,得至U Figure 3.3.首先可以选择 比对的效果,是slow/accurate 还是 fast/approximate。第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。除非序列非常长,一般采用第一种模式。可以选择空位罚分系统,要使用 的DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。Figure 3.3 Pairwise Alig nment Parametersb.多条序列比对参数设置点击 Alilgnment 菜单,选择 Alignment Parameters,再选择 MultipleAlignmentParameters,得至U
7、 Figure 3.4.Figure 3.4 Multiple Alig nment ParametersDelay diverge nt seque nee是指当两条序列的差异大于某个值(百分比)的时候,这两条 序列的比对将推迟进行,它们的比对结果会在最后加入到最终的多条序列比对结果。DNAtransition Weight等于0的时候,程序将转换(transition )当作错配(mismatch)看待, 等于1的时候,将转换(transition) 当作颠换(transversion) 看待。当参与比对的序列差 异较大时,DNA transition Weight 应该选择的小些(接近0
8、),如果参与比对的序列差异 较小时,DNA tran sition Weight 可选择的大些(接近1)。6. 更改输出格式点击 Alignment 菜单,选择 Output Format Options ,页面如 Figure 3.5。默认的是输出clustal format,如果需要其它格式,可在复选框里打勾。PHYLIP格式是利用PHYLIP软件进行建树时,需要输入的格式,我们将在实验6系统发育树构建中用到。Figure 3.5 输出格式选项7. 进行比对点击 Aliglnment 菜单,选择 Do Complete Alignment.此时出现一个对话框,提示你比对结 果保存的位置,你
9、在上一步选择了多少种输出格式,这里就会给出多少个文件的路径。选择 好了点0K即可。要得到理想的比对结果,你可能需要选择不同的参数,进行多次比对,最后再对各种比对结 果进行分析,选择哪个是最合理的结果(the result maki ng biological sense )。比对结束后生成的aln文件是多条序列比对的结果,可以用记事本打开浏览(Figure 3.6)在某一列比对结果下方如果出现*,说明这列是完全匹配。dnd文件是比对过程中生成的进化 树,可以用treeview (压缩包中的treev32.rar 文件)打开浏览(Figure 3.7)。5CLUSTAL 2. Q. 10 nii
10、ltiplt seQuenct aliruientHUMCOWMOUSEK2TELEG ANSFRUITFLY PIG AKABIDOPSISHOMANCOWMOUSERATELECANSFRUITFLYPIGARABILOPSISFigure 3.6记事本打开生成的aln文件HUMMCOWMOUSERATELEGaMSFRUriFLYPIGARDOPSiSATGCTOAOZ KCTCK KCT TACCTGC rCCTCGCGCOCCGCGCCKOGACGCC TTGiOC ACkTC TT AGT TC ATG TTOG AG TT TCTCTGGTCTCT TAC TC TT TCAOC
11、 TAG kAAT TTGTTTHUMANCOWMOUSERATELEGANSFRUITFLYPIGWil IP W SISCGGAGG TCTGGCCTAT1AAG TAGTCGCGGAGACGGGG TGC TGG T TTGCG TCG TAGTCTCC K-TG TTCKOGGC&TOGT TT K 一wcCMGGCC TCGT ITT TT TGCGC3 TCCTTTCCTGCGGCGCCT TC -GKTTTGCACClTC&TtrcCTGCG&CMCTK TTTAjMTCGGTG血TGTT GCATG TATI TC TA4GC TGCTCTGCTACGG
12、ICACACC 匚肚 GT 鴛 Q TCGAGCGCCAGGC TCOC AC 去 TGGMC甜匚 M ATg;關 AC 占 TUCAWCC CGTCTCCCAjwCAATAAACGaTGTATACATTTTCiTGTGTCTTKTMGATJiTTGAT?GCAGCG TC TGGGG TT TCCGT TGCAG TCCTCG AACC-AGGACCTCG r-<TJTTGOTIGCCGKICTA&CGGTCC匚囲 CC開朋ACGTCCG TCGCC TTCTCGTCT TGCTC KTCTGC KOC TCCW鹏&朋 GCCGCCGC TGTCG TC T-CCT T
13、GCT T TT TGCTC TCCCAGG TTCCGAGGCCGOCGCTATQA血 TC r-TCTCAC TCAGQTCTCCAACGCGATTT rTCCGCAGCi TJWAAGATMXTGGAAA&TTCTCAAT TTTTT_CQTTTTGATAAAT T&AMGT&AJCGGATC TGGCGAG TTGAOGCAfiCAGCGGCCCGCGGCGGCGGCCAWAG TCTT TT T TTGCGCAAATiTAATCMTTCAATGCTAK TT TTG T-CTtAMTGTGCFigure 3.7 Treeview 打开 dnd 文件8. 迭代比
14、对如果序列比对结果不理想,可以采用迭代选项,多次迭代寻找最佳比对结果。点击 Alignment 菜单,选择 iteration,选择 iterate each alignment step 或 iterate finalalig nment.然后再点击 Aliglnment菜单,选择 Do Complete Alignment 进行比对。9. 概型(Profile )比对模式以上介绍的都是 Multiple alignment Mode , ClustalX 还提供了一个概型比对模式,在菜单 栏下方选择 Profile Alig nment Mode,可以对两个比对结果(alig nment, termed profilehere)进行再比对,或将一条序列与一个比对结果( profile )进行比对。(Figure 3.8 )还 可以利用二级结构信息指导多条序列比对。7ClustalK 2. U. ID口叵冈Figure 3.8 Profile Alig nment Mode(二) TreeviewClustalx 产生的guide tree(即后缀为dnd文件),可以通过treeview 软件浏览。解压缩并安装treev32.rar文件。双击后缀为dnd文件,选择treeview程序打开即
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年官圩镇卫生院医护人员招聘笔试备考题库及答案解析
- 2026年6月江苏扬州市邗丰产业投资管理有限公司招聘补充笔试备考题库及答案详解
- 2026四川达州市中贸粮油公司招聘3人笔试备考试题及答案详解
- 2026年康复科常见康复训练计划编制考核试题及答案解析
- 2026年嘉定区安亭医院医护人员招聘笔试备考题库及答案解析
- 2026年穆林县林业局职工医院医护人员招聘考试参考题库附答案详解
- 2026年ISO标准及公司质量管理测试卷附答案
- 2026年亳州市中医院公开招聘工作人员笔试参考题库及答案详解
- 2026年天津市南开区黄河医院医护人员招聘笔试备考题库及答案解析
- 2026年广州紫荆医院医护人员招聘笔试备考题库及答案解析
- 江苏省无锡市2025-2026学年五年级下学期6月数学期末调研试题(试卷+答案)
- 湖南省2026年全省政工专业知识考试(政治+中国近现代史)试题解析及核心考点
- 广东省中山市2024-2025学年高一地理上学期期末考试试试题含解析
- 天津市南开区2023-2024学年四年级下学期6月期末数学试题
- 2024年四川省凉山彝族自治州中考道德与法治真题(原卷版+解析版)
- 质量信得过班组汇报材料课件
- 学院监察工作试点的实施方案
- 中学数学教学设计研究的开题报告
- APD自动化腹膜透析机的使用
- 220kv输电线路工程建设监理实施细则
- 体育概论全部课件
评论
0/150
提交评论