




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一实验项目名称:核酸和蛋白质序列数据的使用实验目的:了解常用的序列数据库,掌握基本的序列数据信息的查询方法。教学基本要求:了解和熟悉NCBI核酸和蛋白质序列数据库,可以使用BLAST进行序列搜索,解读BLAST搜索结果,可以对蛋白质序列的结构域搜索,解读蛋白质序列信息,可以在蛋白质三维数据库中查询相关结构信息并进行显示。实验内容提要:在序列数据库中查找某条基因序列(insulin),通过相关一系列数据库的搜索、比对与结果解释,回答以下问题:1. 该基因的基本功能?2. 编码的蛋白质序列是怎样的?3. 该蛋白质有没有保守的功能结构域 (NCBI CD-search)? 4. 该蛋白质的功能是怎样的?5. 该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结构是什么样子的?给出示意图。实验类型:综合性必修或选修:必修使用的主要仪器:可以访问国际互联网的计算机。二实验项目名称:双序列比对实验目的:练习使用动态规划算法进行双序列比对;理解打分矩阵和参数对双序列比对结果的影响;理解动态规划算法的原理。教学基本要求:动态规划算法是序列比对最基本的算法,可以确保找到最优比对。分为全局比对(Needleman-Wunch algorithm)和局部比对算法(Smith-Waterman algorithm)。通过本实验的练习,更好的理解动态规划算法。实验内容提要:对如下的两条序列进行双序列比对分析: Drosophila Sex-lethal proteinASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAFVDFTSEMDSQRAIKVLNG Mouse Huc RBDMDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGFVNYSDPNDADKAINTLNGL这些蛋白质包含一个RNA识别模体(RNA Recognition Motif,RRM)。该模体包含两个高度保守的两个功能区RNP1和RNP2(已用红色标记)。通过ebi网站的在线工具完成练习(http:/www.ebi.ac.uk/Tools/psa/emboss_needle/)。1. RNP1和RNP2是否得到比对? 选择至少三个(差别大的)空位罚分和延伸值来进行比对,2a. 算法是否找到RNP1和 RNP2的正确比对?b. 当空位开启罚分高时,结果发生什么变化?c. 当空位延伸罚分高时,结果发生什么变化? d. 为什么k个连续的空位罚分要小于k个间隔的空位罚分?使用PAM250矩阵重复上述过程。3. 比对结果是否发生变化?继续进行这两条序列的局部比对,通过ebi网站的在线工具完成练习,网址:(http:/www.ebi.ac.uk/Tools/psa/emboss_water/)4a. RNP1和RNP2是否在局部比对中得到比对?b. 局部比对的生物学意义是什么?c. 为什么在这种比对中我们选择局部比对而不是全局比对? 采用不同的打分参数和其它打分矩阵。5. 比对结果发生了什么变化? 实验类型:综合性必修或选修:必修使用的主要仪器:可以访问国际互联网的计算机。三实验项目名称:序列的点阵分析实验目的:点阵分析是双序列分析最直观的工具,通过本实验了解点阵分析的原理和方法。教学基本要求:了解和熟悉点阵分析的原理和参数对分析结果的影响,可以对结果进行解读和解释。实验内容提要:本实验在如下网址完成:http:/myhits.isb-sib.ch/cgi-bin/dotlet首先学习根据dotlet的在线教程,快速学习其基本使用方法和参数设置。然后进行如下的序列分析。回答问题:点阵分析的基本原理是什么?1. 重复序列通过点阵分析可以很容易的发现序列中的重复,果蝇的一个蛋白质(索引号码:P24014)中具有几个重复片段,请通过dotlet分析,找到这些序列重复的片段。SLIT_DROME (P24014):MAAPSRTTLMPPPFRLQLRLLILPILLLLRHDAVHAEPYSGGFGSSAVSSGGLGSVGIHIPGGGVGVITEARCPRVCSCT GLNVDCSHRGLTSVPRKISADVERLELQGNNLTVIYETDFQRLTKLRMLQLTDNQIHTIERNSFQDLVSLERLDISNNVI TTVGRRVFKGAQSLRSLQLDNNQITCLDEHAFKGLVELEILTLNNNNLTSLPHNIFGGLGRLRALRLSDNPFACDCHLSW LSRFLRSATRLAPYTRCQSPSQLKGQNVADLHDQEFKCSGLTEHAPMECGAENSCPHPCRCADGIVDCREKSLTSVPVTL PDDTTDVRLEQNFITELPPKSFSSFRRLRRIDLSNNNISRIAHDALSGLKQLTTLVLYGNKIKDLPSGVFKGLGSLRLLL LNANEISCIRKDAFRDLHSLSLLSLYDNNIQSLANGTFDAMKSMKTVHLAKNPFICDCNLRWLADYLHKNPIETSGARCE SPKRMHRRRIESLREEKFKCSWGELRMKLSGECRMDSDCPAMCHCEGTTVDCTGRRLKEIPRDIPLHTTELLLNDNELGR ISSDGLFGRLPHLVKLELKRNQLTGIEPNAFEGASHIQELQLGENKIKEISNKMFLGLHQLKTLNLYDNQISCVMPGSFE HLNSLTSLNLASNPFNCNCHLAWFAECVRKKSLNGGAARCGAPSKVRDVQIKDLPHSEFKCSSENSEGCLGDGYCPPSCT CTGTVVACSRNQLKEIPRGIPAETSELYLESNEIEQIHYERIRHLRSLTRLDLSNNQITILSNYTFANLTKLSTLIISYN KLQCLQRHALSGLNNLRVVSLHGNRISMLPEGSFEDLKSLTHIALGSNPLYCDCGLKWFSDWIKLDYVEPGIARCAEPEQ MKDKLILSTPSSSFVCRGRVRNDILAKCNACFEQPCQNQAQCVALPQREYQCLCQPGYHGKHCEFMIDACYGNPCRNNAT CTVLEEGRFSCQCAPGYTGARCETNIDDCLGEIKCQNNATCIDGVESYKCECQPGFSGEFCDTKIQFCSPEFNPCANGAK CMDHFTHYSCDCQAGFHGTNCTDNIDDCQNHMCQNGGTCVDGINDYQCRCPDDYTGKYCEGHNMISMMYPQTSPCQNHEC KHGVCFQPNAQGSDYLCRCHPGYTGKWCEYLTSISFVHNNSFVELEPLRTRPEANVTIVFSSAEQNGILMYDGQDAHLAV ELFNGRIRVSYDVGNHPVSTMYSFEMVADGKYHAVELLAIKKNFTLRVDRGLARSIINEGSNDYLKLTTPMFLGGLPVDP AQQAYKNWQIRNLTSFKGCMKEVWINHKLVDFGNAQRQQKITPGCALLEGEQQEEEDDEQDFMDETPHIKEEPVDPCLEN KCRRGSRCVPNSNARDGYQCKCKHGQRGRYCDQGEGSTEPPTVTAASTCRKEQVREYYTENDCRSRQPLKYAKCVGGCGN QCCAAKIVRRRKVRMVCSNNRKYIKNLDIVRKCGCTKKCY从uniprot或者genbank数据库中的注释信息进行进一步确认你所发现的结果。2. 低复杂度区域恶性疟原虫抗原蛋白前体(索引号码:P69192)具有一段低复杂度区域的序列,通过点阵分析找到这个特点。SERA_PLAFG (P69192):MKSYISLFFILCVIFNKNVIKCTGESQTGNTGGGQAGNTVGDQAGSTGGSPQGSTGASQPGSSEPSNPVSSGHSVSTVSVSQTSTSSEKQDTIQVKSALLKDYMGLKVTGPCNENFIMFLVPHIYIDVDTEDTNIELRTTLKETNNAISFESNSGSLEKKKYVKLPSNGTTGEQGSSTGTVRGDTEPISDSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSESLPANGPDSPTVKPPRNLQNICETGKNFKLVVYIKENTLIIKWKVYGETKDTTENNKVDVRKYLINEKETPFTSILIHAYKEHNGTNLIESKNYALGSDIPEKCDTLASNCFLSGNFNIEKCFQCALLVEKENKNDVCYKYLSEDIVSNFKEIKAETEDDDEDDYTEYKLTESIDNILVKMFKTNENNDKSELIKLEEVDDSLKLELMNYCSLLKDVDTTGTLDNYGMGNEMDIFNNLKRLLIYHSEENINTLKNKFRNAAVCLKNVDDWIVNKRGLVLPELNYDLEYFNEHLYNDKNSPEDKDNKGKGVVHVDTTLEKEDTLSYDNSDNMFCNKEYCNRLKDENNCISNLQVEDQGNCDTSWIFASKYHLETIRCMKGYEPTKISALYVANCYKGEHKDRCDEGSSPMEFLQIIEDYGFLPAESNYPYNYVKVGEQCPKVEDHWMNLWDNGKILHNKNEPNSLDGKGYTAYESERFHDNMDAFVKIIKTEVMNKGSVIAYIKAENVMGYEFSGKKVQNLCGDDTADHAVNIVGYGNYVNSEGEKKSYWIVRNSWGPYWGDEGYFKVDMYGPTHCHFNFIHSVVIFNVDLPMNNKTTKKESKIYDYYLKASPEFYHNLYFKNFNVGKKNLFSEKEDNENNKKLGNNYIIFGQDTAGSGQSGKESNTALESAGTSNEVSERVHVYHILKHIKDGKIRMGMRKYIDTQDVNKKHSCTRSYAFNPENYEKCVNLCNVNWKTCEEKTSPGLCLSKLDTNNECYFCYV四实验项目名称:多序列比对实验目的:在序列分析中,多序列比对具有广泛的应用,是许多其他分析的基础和前提,比如进化发生分析、构建位置特异性打分矩阵、找到一致序列等,本实验的目的是熟悉多序列比对相关的操作和编辑方法。教学基本要求:了解和熟悉多序列比对的原理和基本方法。实验内容提要:1. 使用CLUSTALW 算法,比对一组蛋白质序列,该序列属于RAD51-RECA,在DNA的复制阶段起重要作用,这些序列可以从NCBI genbank、Uniprot等序列服务器获取,序列的索引号码为:P25454,P25453,P0A7G6,P48295。将这些序列保存在一个文本文件。如果查询到的序列不止一个的话,选择第一个。P25454.1 Full=DNA repair protein RAD51MSQVQEQHISESQLQYGNGSLMSTVPADLSQSVVDGNGNGSSEDIEATNGSGDGGGLQEQAEAQGEMEDEAYDEAALGSFVPIEKLQVNGITMADVKKLRESGLHTAEAVAYAPRKDLLEIKGISEAKADKLLNEAARLVPMGFVTAADFHMRRSELICLTTGSKNLDTLLGGGVETGSITELFGEFRTGKSQLCHTLAVTCQIPLDIGGGEGKCLYIDTEGTFRPVRLVSIAQRFGLDPDDALNNVAYARAYNADHQLRLLDAAAQMMSESRFSLIVVDSVMALYRTDFSGRGELSARQMHLAKFMRALQRLADQFGVAVVVTNQVVAQVDGGMAFNPDPKKPIGGNIMAHSSTTRLGFKKGKGCQRLCKVVDSPCLPEAECVFAIYEDGVGDPREEDEP25453.1 Full=Meiotic recombination protein DMC1MSVTGTEIDSDTAKNILSVDELQNYGINASDLQKLKSGGIYTVNTVLSTTRRHLCKIKGLSEVKVEKIKEAAGKIIQVGFIPATVQLDIRQRVYSLSTGSKQLDSILGGGIMTMSITEVFGEFRCGKTQMSHTLCVTTQLPREMGGGEGKVAYIDTEGTFRPERIKQIAEGYELDPESCLANVSYARALNSEHQMELVEQLGEELSSGDYRLIVVDSIMANFRVDYCGRGELSERQQKLNQHLFKLNRLAEEFNVAVFLTNQVQSDPGASALFASADGRKPIGGHVLAHASATRILLRKGRGDERVAKLQDSPDMPEKECVYVIGEKGITDSSDP0A7G6.2 Full=Protein RecA; AltName: Full=Recombinase AMAIDENKQKALAAALGQIEKQFGKGSIMRLGEDRSMDVETISTGSLSLDIALGAGGLPMGRIVEIYGPESSGKTTLTLQVIAAAQREGKTCAFIDAEHALDPIYARKLGVDIDNLLCSQPDTGEQALEICDALARSGAVDVIVVDSVAALTPKAEIEGEIGDSHMGLAARMMSQAMRKLAGNLKQSNTLLIFINQIRMKIGVMFGNPETTTGGNALKFYASVRLDIRRIGAVKEGENVVGSETRVKVVKNKIAAPFKQAEFQILYGEGINFYGELVDLGVKEKLIEKAGAWYSYKGEKIGQGKANATAWLKDNPETAKEIEKKVRELLLSNPNSTPDFSVDDSEGVAETNEDFP48295.2 Full=Protein RecA; AltName: Full=Recombinase AMAGTDREKALDAALAQIERQFGKGAVMRMGDRTQEPIEVISTGSTALDIALGVGGLPRGRVVEIYGPESSGKTTLTLHAVANAQKAGGQVAFVDAEHALDPEYAKKLGVDIDNLILSQPDNGEQALEIVDMLVRSGALDLIVIDSVAALVPRAEIEGEMGDSHVGLQARLMSQALRKITSALNQSKTTAIFINQLREKIGVMFGSPETTTGGRALKFYASVRLDIRRIETLKDGTDAVGNRTRVKVVKNKVAPPFKQAEFDILYGQGISREGGLIDMGVEHGFVRKAGAWYTYEGDQLGQGKENARNFLKDNPDLADEIERKIKEKLGVGVRPDAAKAEAATDAAAAADTAGTDDAAKSVPAPASKTAKATKATAVKSa. 练习使用EBI CLUSTALW(http:/www.ebi.ac.uk/Tools/msa/clustalw2/);b. 将序列数据拷贝复制到窗口中;c. 采用默认参数进行比对;回答:clustalw算法的基本原理?2. 在BAliBASE网站查找一组蛋白质:1csy。这些蛋白质的一致性为20-40%,属于BAliBASE参考序列1。正确的比对结果网址如下:http:/bips.u-strasbg.fr/en/Products/Databases/BAliBASE/ref1/test1/1csy_ref1.html主要的比对信息截图如下所示:注意:这里的比对是基于结构信息的,所以是正确的。是序列的部分比对,为什么?这五条序列的名称和索引号码如下:Sequence Name SWISSPROT Accession1csy P43405 1gri P29354(已被分为P62993和P62994,序列完全一致,任选一条即可。)1aya P35235 2pna P23727 1bfi P27986 sp|P43405|KSYK_HUMAN Tyrosine-protein kinase SYK OS=Homo sapiens GN=SYK PE=1 SV=1MASSGMADSANHLPFFFGNITREEAEDYLVQGGMSDGLYLLRQSRNYLGGFALSVAHGRKAHHYTIERELNGTYAIAGGRTHASPADLCHYHSQESDGLVCLLKKPFNRPQGVQPKTGPFEDLKENLIREYVKQTWNLQGQALEQAIISQKPQLEKLIATTAHEKMPWFHGKISREESEQIVLIGSKTNGKFLIRARDNNGSYALCLLHEGKVLHYRIDKDKTGKLSIPEGKKFDTLWQLVEHYSYKADGLLRVLTVPCQKIGTQGNVNFGGRPQLPGSHPATWSAGGIISRIKSYSFPKPGHRKSSPAQGNRQESTVSFNPYEPELAPWAADKGPQREALPMDTEVYESPYADPEEIRPKEVYLDRKLLTLEDKELGSGNFGTVKKGYYQMKKVVKTVAVKILKNEANDPALKDELLAEANVMQQLDNPYIVRMIGICEAESWMLVMEMAELGPLNKYLQQNRHVKDKNIIELVHQVSMGMKYLEESNFVHRDLAARNVLLVTQHYAKISDFGLSKALRADENYYKAQTHGKWPVKWYAPECINYYKFSSKSDVWSFGVLMWEAFSYGQKPYRGMKGSEVTAMLEKGERMGCPAGCPREMYDLMNLCWTYDVENRPGFAAVELRLRNYYYDVVNsp|P62993|GRB2_HUMAN Growth factor receptor-bound protein 2 OS=Homo sapiens GN=GRB2 PE=1 SV=1MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMKPHPWFFGKIPRAKAEEMLSKQRHDGAFLIRESESAPGDFSLSVKFGNDVQHFKVLRDGAGKYFLWVVKFNSLNELVDYHRSTSVSRNQQIFLRDIEQVPQQPTYVQALFDFDPQEDGELGFRRGDFIHVMDNSDPNWWKGACHGQTGMFPRNYVTPVNRNVsp|P62994|GRB2_RAT Growth factor receptor-bound protein 2 OS=Rattus norvegicus GN=Grb2 PE=1 SV=1MEAIAKYDFKATADDELSFKRGDILKVLNEECDQNWYKAELNGKDGFIPKNYIEMKPHPWFFGKIPRAKAEEMLSKQRHDGAFLIRESESAPGDFSLSVKFGNDVQHFKVLRDGAGKYFLWVVKFNSLNELVDYHRSTSVSRNQQIFLRDIEQVPQQPTYVQALFDFDPQEDGELGFRRGDFIHVMDNSDPNWWKGACHGQTGMFPRNYVTPVNRNVsp|P35235|PTN11_MOUSE Tyrosine-protein phosphatase non-receptor type 11 OS=Mus musculus GN=Ptpn11 PE=1 SV=2MTSRRWFHPNITGVEAENLLLTRGVDGSFLARPSKSNPGDFTLSVRRNGAVTHIKIQNTGDYYDLYGGEKFATLAELVQYYMEHHGQLKEKNGDVIELKYPLNCADPTSERWFHGHLSGKEAEKLLTEKGKHGSFLVRESQSHPGDFVLSVRTGDDKGESNDGKSKVTHVMIRCQELKYDVGGGERFDSLTDLVEHYKKNPMVETLGTVLQLKQPLNTTRINAAEIESRVRELSKLAETTDKVKQGFWEEFETLQQQECKLLYSRKEGQRQENKNKNRYKNILPFDHTRVVLHDGDPNEPVSDYINANIIMPEFETKCNNSKPKKSYIATQGCLQNTVNDFWRMVFQENSRVIVMTTKEVERGKSKCVKYWPDEYALKEYGVMRVRNVKESAAHDYTLRELKLSKVGQALLQGNTERTVWQYHFRTWPDHGVPSDPGGVLDFLEEVHHKQESIVDAGPVVVHCSAGIGRTGTFIVIDILIDIIREKGVDCDIDVPKTIQMVRSQRSGMVQTEAQYRFIYMAVQHYIETLQRRIEEEQKSKRKGHEYTNIKYSLVDQTSGDQSPLPPCTPTPPCAEMREDSARVYENVGLMQQQRSFRsp|P23727|P85A_BOVIN Phosphatidylinositol 3-kinase regulatory subunit alpha OS=Bos taurus GN=PIK3R1 PE=1 SV=1MSAEGYQYRALYDYKKEREEDIDLHLGDILTVNKGSLVALGFSDGQEAKPEEIGWLNGYNETTGERGDFPGTYVEYIGRKKISPPTPKPRPPRPLPVAPGPSKTEADSEQQASTLPDLAEQFAPPDVAPPLLIKLVEAIEKKGLECSTLYRTQSSSNPAELRQLLDCDTASLDLEMFDVHVLADAFKRYLLDLPNPVIPVAVSSELISLAPEVQSSEEYIQLLKKLIRSPSIPHQYWLTLQYLLKHFFKLSQTSSKNLLNARVLSELFSPLLFRFPAASSENTEHLIKIIEILISTEWNERQPAPALPPKPPKPTTVANNGMNNNMSLQDAEWYWGDISREEVNEKLRDTADGTFLVRDASTKMHGDYTLTLRKGGNNKLIKIFHRDGKYGFSDPLTFNSVVELINHYRNESLAQYNPKLDVKLLYPVSKYQQDQVVKEDNIEAVGKKLHEYNTQFQEKSREYDRLYEDYTRTSQEIQMKRTAIEAFNETIKIFEEQCQTQERYSKEYIEKFKREGNETEIQRIMHNYEKLKSRISEIVDSRRRLEEDLKKQAAEYREIDKRMNSIKPDLIQLRKTRDQYLMWLTQKGVRQKKLNEWLGNENTEDQYSLVEDDEDLPHHDEKTWNVGSSNRNKAENLLRGKRDGTFLVRESSKQGCYACSVVVDGEVKHCVINKTATGYGFAEPYNLYSSLKELVLHYQHTSLVQHNDSLNVTLAYPVYAQQRRsp|P27986|P85A_HUMAN Phosphatidylinositol 3-kinase regulatory subunit alpha OS=Homo sapiens GN=PIK3R1 PE=1 SV=2MSAEGYQYRALYDYKKEREEDIDLHLGDILTVNKGSLVALGFSDGQEARPEEIGWLNGYNETTGERGDFPGTYVEYIGRKKISPPTPKPRPPRPLPVAPGSSKTEADVEQQALTLPDLAEQFAPPDIAPPLLIKLVEAIEKKGLECSTLYRTQSSSNLAELRQLLDCDTPSVDLEMIDVHVLADAFKRYLLDLPNPVIPAAVYSEMISLAPEVQSSEEYIQLLKKLIRSPSIPHQYWLTLQYLLKHFFKLSQTSSKNLLNARVLSEIFSPMLFRFSAASSDNTENLIKVIEILISTEWNERQPAPALPPKPPKPTTVANNGMNNNMSLQDAEWYWGDISREEVNEKLRDTADGTFLVRDASTKMHGDYTLTLRKGGNNKLIKIFHRDGKYGFSDPLTFSSVVELINHYRNESLAQYNPKLDVKLLYPVSKYQQDQVVKEDNIEAVGKKLHEYNTQFQEKSREYDRLYEEYTRTSQEIQMKRTAIEAFNETIKIFEEQCQTQERYSKEYIEKFKREGNEKEIQRIMHNYDKLKSRISEIIDSRRRLEEDLKKQAAEYREIDKRMNSIKPDLIQLRKTRDQYLMWLTQKGVRQKKLNEWLGNENTEDQYSLVEDDEDLPHHDEKTWNVGSSNRNKAENLLRGKRDGTFLVRESSKQGCYACSVVVDGEVKHCVINKTATGYGFAEPYNLYSSLKELVLHYQHTSLVQHNDSLNVTLAYPVYAQQRR 从序列数据库获取这五条序列的fasta格式,放在一个文本文件中,选择ebi网站上(http:/www.ebi.ac.uk/Tools/msa/)的至少四个多序列比对工具(如MAFFT、MUSCLE、CLUSTALW2、Clustal Omega、T-Coffee、DbClustal等)进行分析,将结果保存(Download Alignment File)。扩展名为.fasta。现在用一个多序列比对软件,比如bioedit、seaview或者jalview(下载安装windows版本的比较快速)导入刚才保存的多序列比对结果文件(扩展名为.fasta的)。比较各个算法的比对结果(BAliBASE数据只是这些多序列比对的一部分,而我们得到的是这几条序列全长上的比对),所以需要将不相关的列删除掉或者用其它符号替代,或者也可以不作处理,找到相关部分就可以了。比较多序列比对的结果,与BAliBASE上的相比,那个的结果更好些?你是如何评价结果的?3. 序列徽标序列徽标(sequence logo)是一个常用的直观的多序列比对的图示工具,对如下的一些序列,创建其序列徽标。网址:/。dinD 32-52aactgtatataaatacagttdinG 15-35 tattggctgtttatacagtadinH 77-97tcctgttaatccatacagcadinI 19-39acctgtataaataaccagtalexA-1 28-48tgctgtatatactcacagcalexA-2 7-27aactgtatatacacccagggpolB(dinA) 53-73gactgtataaaaccacagccrecA 59-79tactgtatgagcatacagtarecN-1 49-69tactgtatataaaaccagttrecN-2 27-47tactgtacacaataacagtarecN-3 9-29TCCTGTATGAAAAACCATTAruvAB 49-69cgctggatatctatccagcasosC 18-38tactgatgatatatacaggtsosD 14-34cactggatagataaccagcasulA 22-42tactgtacatccatacagtaumuDC 20-40tactgtatataaaaacagtauvrA 83-103 tactgtatattcattcaggtuvrB 75-95aactgtttttttatccagtauvrD 57-77atctgtatatatacccagct将结果保存,简单的解释一下。sequence logo图中包含的意义有什么?五实验项目名称:序列数据库的搜索比对实验目的:通过该实验理解BLAST和PSI-BLAST的基本原理。教学基本要求:可通过BLAST和PSI-BLAST进行数据库的搜索比对,对结果进行恰当的解释。可利用BLAST进行相关序列的检索,利用PSI-BLAST进行远相关序列的检索。理解两个工具的原理。实验内容提要:本实验中,查询下面这条序列在细菌(bacterial)中的同源序列。gi|76828014|gb|BC107078.1| Homo sapiens G protein-coupled receptor, family C, group 5, member D, mRNA (cDNA clone MGC:129714 IMAGE:40027066), complete cds ATGTACAAGGACTGCATCGAGTCCACTGGAGACTATTTTCTTCTCTGTGACGCCGAGGGGCCATGGGGCATCATTCTGGAGTCCCTGGCCATACTTGGCATCGTGGTCACAATTCTGCTACTCTTAGCATTTCTCTTCCTCATGCGAAAGATCCAAGACTGCAGCCAGTGGAATGTCCTCCCCACCCAGCTCCTCTTCCTCCTGAGTGTCCTGGGGCTCTTCGGACTCGCTTTTGCCTTCATCATCGAGCTCAATCAACAAACTGCCCCCGTACGCTACTTTCTCTTTGGGGTTCTCTTTGCTCTCTGTTTCTCATGCCTCTTAGCTCATGCCTCCAATCTAGTGAAGCTGGTTCGGGGTTGTGTCTCCTTCTCCTGGACGACAATTCTGTGCATTGCTATTGGTTGCAGTCTGTTGCAAATCATTATTGCCACTGAGTATGTGACTCTCATCATGACCAGAGGTATGATGTTTGTGAATATGACACCCTGCCAGCTCAATGTGGACTTTGTTGTACTCCTGGTCTATGTCCTCTTCCTGATGGCCCTCACATTCTTCGTCTCCAAAGCCACCTTCTGTGGCCCGTGTGAGAACTGGAAGCAGCATGGAAGGCTCATCTTTATCACTGTGCTCTTCTCCATCATCATCTGGGTGGTGTGGATCTCCATGCTCCTGAGAGGCAACCCGCAGTTCCAGCGACAGCCCCAGTGGGACGACCCGGTCGTCTGCATTGCTCTGGTCACCAACGCATGGGTTTTCCTGCTGCTGTACATCGTCCCTGAGCTCTGCATTCTCTACAGATCGTGTAGACAGGAGTGCCCTTTACAAGGCAATGCCTGCCCCGTCACAGCCTACCAACACAGCTTCCAAGTGGAGAACCAGGAGCTCTCCAGAGCCCGAGACAGTGATGGAGCTGAGGAGGATGTAGCATTAACTTCATATGGTACTCCCATTCAGCCGCAGACTGTTGATCCCACACAAGAGTGTTTCATCCCACAGGCTAAACTAAGCCCCCAGCAAGATGCAGGAGGAGTATAA1a. 在NCBI中采用blastn程序,搜索上述序列,将物种限制在“Bacteria”,其它参数默认,得到几个结果命中?E值小于0.1的有几条?1b. 为了扩大搜索,可以对参数进行调整,将BLASTN的word size换为7,其它同上次,得到几个命中?E值小于0.1的有几条?1c. 选择BLASTX,将物种限制在“Bacteria”,其它参数默认,得到几个结果命中?E值小于0.1的有几条?1d. 在BLASTX中,将word size调整为2,选择BLOSUM45打分矩阵,Gap Existence 10,Gap Extension 3,将物种限制在“Bacteria”,其它参数默认,得到几个结果命中?E值小于0.1的有几条?2. 如下序列是刚才所检索的核酸序列对应的蛋白质序列:gi|76828015|gb|AAI07079.1| G protein-coupled receptor, family C, group 5, member D Homo sapiens MYKDCIESTGDYFLLCDAEGPWGIILESLAILGIVVTILLLLAFLFLMRKIQDCSQWNVLPTQLLFLLSVLGLFGLAFAFIIELNQQTAPVRYFLFGVLFALCFSCLLAHASNLVKLVRGCVSFSWTTILCIAIGCSLLQIIIATEYVTLIMTRGMMFVNMTPCQLNVDFVVLLVYVLFLMALTFFVSKATFCGPCENWKQHGRLIFITVLFSIIIWVVWISMLLRGNPQFQRQPQWDDPVVCIALVTNAWVFLLLYIVPELCILYRSCRQECPLQGNACPVTAYQHSFQVENQELSRARDSDGAEEDVALTSYGTPIQPQTVDPTQECFIPQAKLSPQQDAGGV2a. 利用着条序列进行PSI-BLAST检索,第一轮PSI-BLAST的参数与上述最后一次的BLASTX参数一致,即word size调整为2,选择BLOSUM45打分矩阵,Gap Existence 10,Gap Extension 3,将物种限制在“Bacteria”,得到几个匹配?E值小于0.1的有几条?2b. 选择E值小于2的序列进行下一步的PSI-BLAST迭代。得到几个匹配?E值小于0.1的有几条?2c. 大多数你所发现的蛋白质都具有相同的功能,是什么功能?如何进一步确定你的查询序列与结果中的序列相关?实验类型:综合性必修或选修:必修使用的主要仪器:可以访问国际互联网的计算机。六. 实验项目名称:HIV病毒的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高级会计师面试题精 选及答案解析
- 文库珍藏版:历年精 选的操作考核问题与答案
- 2025留置辅警面试题目及答案
- 2025-2030中国无机酸制造行业应用动态及投资规模预测报告
- 机械基础考试题库及答案
- 采样培训考试题库及答案
- 幕墙施工课件连接
- 2026届江苏省泰州市名校化学高二上期中联考模拟试题含解析
- 常用电池基础知识培训课件
- 豫西名校2026届化学高三上期末考试试题含解析
- 【《惠东农商银行个人信贷业务发展现状及存在的问题和策略分析》15000字】
- 光伏项目开发培训课件
- 职业年金政策讲解
- 智联猎头企业薪酬调研白皮书-2025年年中盘点
- 基孔肯雅热、登革热等重点虫媒传染病防控技术试题
- 消防设施操作员(监控方向)中级模拟考试题及答案
- 艾梅乙反歧视培训课件
- GB/T 10069.3-2024旋转电机噪声测定方法及限值第3部分:噪声限值
- 中国农业银行笔试题库(含答案)
- GA 1808-2022军工单位反恐怖防范要求
- GB 9706.202-2021医用电气设备第2-2部分:高频手术设备及高频附件的基本安全和基本性能专用要求
评论
0/150
提交评论