生物信息学课堂操作练习.doc_第1页
生物信息学课堂操作练习.doc_第2页
生物信息学课堂操作练习.doc_第3页
生物信息学课堂操作练习.doc_第4页
生物信息学课堂操作练习.doc_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学课堂操作练习一、生物信息学科的发展和研究内容通过下列internet上的自教课程,初步了解不同的数据库和分析工具http:/www.ebi.ac.uk/2can/education二、 生物数据库1. 熟悉各种数据库。2. 重点了解genbank和swiss-prot所包含的各种功能和适用范围。三、 关键词或词组为基础的数据库检索1. 熟练掌握entrez检索体系。2. 查找与水稻抗病基因xa21有关的资料(1) 由多少碱基构成?编码多少个氨基酸?(2) exon和intron的位置?(3) 是否有3d structure数据?1) 由多少碱基构成?编码多少个氨基酸? 4623b.p., 1025a.a.; 2) exon和intron的位置? exon: 242700,35433943 intron: remaining; 3) 是否有3d structure数据? 没有. 3. 查找c. elegans基因组的资料。(1) chromosome i的测序是否已完成?(2) 已知的chromosome i的序列有多少碱基?序列发表在哪份杂志上?期号和页码?1) chromosome i的测序是否已完成? 完成. 2) 已知的chromosome i的序列有多少碱基? 序列发表在哪份杂志上? 期号和页码? 15.0724mb.p.(15072421b.p.), science 1999 jan 1;283(5398):35.4. 查看人类基因组第1染色体上基因的分布。/mapview/maps.cgi?org=hum&maps=ideogr,est,loc&links=on&verbose=on&chr=15. 查看arabidopsis的系谱树,以及arabidopsis第1染色体上的序列。比较arabidopsis基因组的资料提供形式与人类基因组有什么不同 (/taxonomy/browser/wwwtax.cgi?id=3701, /mapview/maps.cgi?taxid=3702&chr=1) 貌似没什么区别比较arabidopsis基因组的资料提供形式与人类基因组有什么不同。6. 与retrotransposon有关的文献资料有多少篇? 5774, (在pubmed中直接查找关键词, 2009328) 与rice retrotransposon有关的文献有多少篇? 214, (在pubmed中直接查找关键词, 2009328)7 检索我校在2009年1月发表的被pubmed收录的科研论文huazhong agricultural university,297. 熟悉srs检索体系。8. 熟悉dbget检索体系。四、 核苷酸和蛋白质序列为基础的数据库检索1. 了解blast frequently asked questions的答案。2. 以大麦mlo基因(z83834)为查询序列(1) 用blastn能检索到多少条与mlo同源的序列?与mlo同源的序列:共找到63条与mlo同源的序列(2) 在使用blastn 检索中,如改变e value的阈值,能检索到多少与mlo同源的序列?将e value (expect threshold)由默认的10改为1时,仍有63条同源序列。若将e值改为5e-19时可以找到61条同源序列。(3) 怎样去掉alignment过程中出现的小写字母? 这里所说的小写字母就是出现重复序列时被算法筛选后出现的n。将algorithm parameters中的filters and masking选项里的low complexity regions前的勾去掉就可以去掉比对过程中出现的小写的n。(4) 用psiblast检索到的与mlo蛋白同源的序列与用blastp检索到的同源序列是否有差别?psi-blast的特色是每次用profile搜索数据库后再利用搜索的结果重新构建 profile,然后用新的profile再次搜索数据库,如此反复直至没有新的结果产生为止。psi-blast先用带空位的blast搜索数据库,将 获得的序列通过多序列比对来构建第一个profile。psi-blast自然地拓展了blast方法,能寻找蛋白质序列中的隐含模式,有研究表明这种方 法可以有效的找到很多序列差异较大而结构功能相似的相关蛋白,甚至可以与一些结构比对方法,如threading相媲美。psi-blast服务可以在 ncbi的blast主页上找到,还可以从ncbi的ftp服务器上下载psi-blast的独立程序。首先得到mlo的蛋白质序列:cab06083.1;然后用blastp检索。选中psi-blast。第一次检索得到100个同源序列,再以这些序列为基础,再次检索,得到标有new的序列。第三次检索,已经没有含有new的序列,检索结束。(5) 熟悉phiblast 检索方法。(6) 用mlo基因序列检索蛋白质数据库能找到多少同源序列?使用blastx,输入accession number :z83834,找到100个同源序列3. 从以mlo基因的氨基酸序列检索到的同源序列中任取两条序列,用blast 2 sequences作分析,看它们之间是否存在同源序列。mlo基因氨基酸序列号:cab06083 选取两条为:p93766、aak94905可以看到具有较高的同源性。identities = 397/432 (91%), positives = 412/432 (95%)五、 多序列对位排列分析和系谱分析1.用大麦mlo基因(z83834)编码的蛋白质序列在数据库中检索同源序列,找出与 mlo同源程度最高的另外9条序列。对位排列这10条序列,确定这些同源序列的保守区段;分析这些保守区段是否组成已知结构域(domain)或模体(motif)。 1.在ncbi中的nucleotide数据库中输入z83834,点击链接到蛋白质序列,用fasta格式输出,复制该蛋白序列2.进入ncbi的blast,选择protein blast,粘贴所复制的蛋白序列,进行blast3.在结果中选中同源度最高的10条结果,点击get selected sequences4.在display中选则fasta,send to 中选则text,复制有内容。5.在ebi的clustaw分析网页粘贴序列,点击run2.练习使用各种修饰功能修饰对位排列上述10条序列。 1. boxshade功能 在多序列对位排列结果网页复制序列排列结果 在“boxshade”网页(ttp://software/box_form.html)粘贴序列,在“input sequence format”栏目选择“aln”,在“output format”栏目选择“rtf_new” 在结果网页点击“here is your output number 1”,得结果。2. 颜色修饰 功能“clustalw results”网页展示多序列对位排列结果点击“show colors”用不同颜色的字母展示对位排列结果3.根据系谱分析,上述10条序列中哪两条序列的同源程度最高? 1. “clustalw results”网页展示多序列对位排列结果2. 点击“show as phylogram tree”展示phylogram tree,可据此判断同源程度。4.用大麦mlo基因(z83834)序列检索数据库,找出与mlo同源程度最高的另外4条序列。对位排列这5条序列,确定这些同源序列的保守区段;分析这些保守区段是否组成已知结构域(domain)或模体(motif)。 1. 进入ncbi的blast, 选择nucleotide blast,粘贴基因序列号z83834,进行blast2. 在结果中选中同源度最高的5条结果,点击get selected sequences3. 在display中选则fasta,send to 中选则text,复制所有内容。4. 在ebi的clustaw分析网页粘贴序列,点击run六、 基因结构分析1. 从核苷酸数据库中选择dna序列,试用不同的分析工具分析真核生物和原核生物的基因结构,并将分析结果与核苷酸数据库中的结果相比较。2. 掌握genscan和genefinding中的各种分析方法。七、 蛋白质结构分析1. 从数据库中任选一蛋白质的序列作分析对象,熟悉分析蛋白质的一级和二级结构的方法。以猪leptin蛋白为例,在ncbi上查找到其序列,再转至expasy 网站http:/www.expasy.ch/ 一级结构 1:pi 、mw 、氨基酸组成 http:/www.expasy.ch/tools/protparam.html 2:疏水性 http:/www.expasy.ch/tools/protscale.html3:重复序列 http:/www.embl-heidelberg.de/andrade/papers/rep/search.html二级结构 /nomi/nnpredict.html(貌似这个网站不能搜) http:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html2. 大麦mlo基因(z83834)编码的蛋白质是膜镶嵌蛋白质还是膜附着蛋白质?先搜出mlo蛋白的序列,输入http:/bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html网站,由图形看出是膜镶嵌蛋白,跨膜六次。3.水稻抗病基因xa21的产物位于细胞的什么部位?基因xa21:u37133.1 /nuccore/1122442在ncbi中输xa21 gene” oryza sativa”,找到xa21序列。输入/得到plas的得分最高,说明该蛋白在细胞膜上4. xa21基因产物是否糖蛋白?什么类型的糖蛋白?分析是否是糖蛋白在http:/www.cbs.dtu.dk/services/netoglyc/和http:/www.cbs.dtu.dk/services/netnglyc/说明是n-连接的糖蛋白5. xa21蛋白的亲水性和疏水性如何?grand average of hydropathicity (gravy): 0.049亲水性分析http:/www.expasy.ch/tools/protscale.htmlhydropathicity0 ,疏水强 gi|1405|emb|x55152.1| o.aries mrna for tumor necrosis factor alpha (tnf-alpha)ggccaagagagagacaagcagctgcagaaccccctggagataacctcccagacaacacacccccgagagacagccaggcaacttgctctctcatacaccctgccacaaggctctcctgtctcccgtctggacttggatccttctgaaaaagacaccatgagcaccaaaagcatgatccgggatgtggagctggcggaggaggtgctctccaacaaagcagggggcccccagggctccagaagttgctggtgcctcagcctcttctccttcctcctggttgcaggagccaccacgctcttctgcctgctgcacttcggggtaatcggcccccagagggaagagcagtccccagctggcccctccttcaacaggcctctggttcagacactcaggtcatcttctcaagcctcaaataacaagccggtagcccacgttgtagccaacatcagcgctccggggcagctccgatggggggactcgtatgccaatgccctcatggccaacggcgtggagctgaaagacaaccagctggtggtgcccactgacgggctttacctcatctactcgcaggtcctcttcaggggccacggctgcccttccacccccttgttcctcacccacaccatcagccgcattgcagtctcctaccagaccaaggtcaacatcctctctgccatcaagagcccttgccacagggagaccctagagggggctgaggccaagccctggtacgaacccatctaccagggaggggtcttccagctggagaagggagatcgcctcagtgctgagatcaacctgccggaatacctggactatgccgagtctgggcaggtctactttgggatcatcgccctgtgagggcgcaggacatgcatcctctcccacctcagttaccttattatttactccttcagaccctcctcatccccttctggtttagaaagggaattaggggctcagggctgggctccaagcgtccaactttaaacaacagctgcacttagaaattagggatgtagggaagtgaggcctggacaatgggccaccaacca

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论