




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、在线blast的用法总结标准化文件发布号:(9556EUATWKMWUBWUNNINNULDDQTYKIIBlast ( Basic Local Alignment Search Tool)是一套在蛋白质数据库或 DNA 数据库 中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序 列比较。BLAST结果中的得分是对一种对相似性的统计说明。BLAST采用一种局部的算法获得两个序列中具有相似性的序列NCBI 的在线 blast: /Blast.cgiBLASTHomeRecentBmjc LocdiScsrch Toci
2、HelpHKBirBLAST HomoBLAST fin為 region of Similarity between b*oio型cal 豹queuesAAgnlng iftuigo roleln Sequences,fry tM C06ALTAlQrenl Toci. GoBLAST Assembled RefSeq GenomesArew wor re 5WkP*f?“EgWVX Z2 *Vr 20W 15 (KCTO C5TChoose a 粘cm gonerrto to sfisrch, or lt all qcrwmtc BLAST databasesTgtheDiy & Mor.B
3、asic BLASTChocM a ELAST 沪0卽的 lo nzinufjcoUda bldttSwich u rwdeolM d3Gt祜 grg a nude*ollde quei) AgRhrz blastn, meqablasl, disconligixus meqabfastpfotein blastSearch protoin database usr a protoin quor/&帥“海 DI旳P, |$i-t)hsi,plHW3$tblastxSearch pvolein database us ng a translated Qucleoide querylhlMfnSo
4、arch Iraaslalod midnolido dalsbaso udng a priMoin quoryibljwtxSearch IramlalDd nudcolido dalaso uung a transidtad nuclcollda quorySpecialized BLASTChog* a typesearch (fir dN伸3钩n 卩科曰如能) Make speccic primers *th Piimci-BLAST Soarch lin: Arch:vi! Find CO取如曲dOJTRi歿 初your花如的8 (ofe)a Find sequences wilh s
5、imiar conseivud domahi aidiilECtiHi! (edart) Saarch soquoncoz th h*o qti.Ppr.ftjpg (GEO)o 创arch(taRLASI) Search fof SUfa (srf) Scferi $equer: for、电(ontdrM“!Qiion icsaeen) Aq two (cr rriore) sequencer uein$ BIZST (U2$C0D Search oiateio or 耐金皿血 Urqrts in PubCbcm BAssayn Search SR A trAnscM|H “nd gunaE
6、c IftnaHc Conslrarrt Bacod Protein Wpla AMqniM Tool NaadlamyVAsch Global Sequence Alicmmant Too!本文详细出处参考:/475/举例一:核酸序列的比对1,进入在线blast界面,可以选择blast特左的物种(如人,小鼠,水稻等),也可以选 择blast所有的核酸或蛋白序列。不同的blast程序上而已经有了介绍。这里以常用的 核酸库作为例子。BLAST Assembled Genomes0人姿D Mouse :小鼠 -n Rat大嫁0 gbMopsfs iha帕胸邀南
7、芥Choose a species genome to search, cr list all genomic BLAST daiabasesa P&jn frog/Odyf es 黒猩猩a My撤上物细苗黒腔果蝇 a Apfc密蟀BaSiC RS57以核苜酸庠的Bl的为倪Search a nucleotide database using a nucleotide queiy Mgonlhms blastn, mgablast, dascontiguous megablastChoose a BLAST prbgram to toin blastSeaKfi proieinri
8、sing a 卩 rotein queryAigobthms bla&tp. psi-bla&l. phi-blastblastxSearch protein dalabas-e using a translated nucleotide query*IhlvsOiSealed translated nucleotide dstsbase using s 卩rotein querySearch translated nucleotide database using a translated nudleotide query(补充介绍下:1、BLASTN nucleotide blast是核酸
9、序列到核酸库中的一种查询。库中存在的每条已知序列都将同所查序列作一对一地核酸序列比对。2、BLASTP protein blast是蛋白序列到蛋白库中的一种查询。库中存在的每 条已知序列将逐一地同每条所查序列作一对一的序列比对。3、BLASTX是核酸序列到蛋白库中的一种查询。先将核酸序列翻译成蛋白序列(条核酸序列会被翻译成可能的六条蛋白).再对每一条作一对一的蛋白序 列比对。4、TBLASTN是蛋白序列到核酸库中的一种查询。与BLASTX相反,它是将库 中的核酸序列翻译成蛋白序列,再同所查序列作蛋白与蛋白的比对。5、TBLASTX是核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的
10、核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列).这样每次比对会产生36种比对阵列。|)2,粘贴fasta格式的序列。选择一个要比对的数据库。关于数据库的说明请看NCBI在线blast数据库的简要说明。一般的话参数默认。Enter Query SequeitceEnter accwdon number, gl. oi PASTA sequence u:xn_】ss兀scctt us etc as art ccoccc as ato aojeoaowc eg旳 coir cocojacccccctCQacgccccoccaaazcdgcaqcgTCCCoacgcaccg&ccjazu
11、jacdgrt IdttcatoottOPtogBparoatpaEtpcogccotogacQcogBctcBCBgogBOgtcttttcgffagtqgcdG1MTOueiytwbfdmgeFromToKt ASTHnucawrtxkjix*iq e nucieaiiiie Query, w化一13Or, upload fileJob Title Align two or more sequences 、,6a(abaeOHutrian genornic 4 naiscTipi 0Mouse genomic * ttanecnp S)Others (nr eic )Plucteotde
12、colleclion (nrnt)7 qOrganismOniony三01够。学川的 “me or泌como阪ion$ wi bmeug养Choo$e Search SeiEntrez Query逹里很据需更一个正确的數据库. 如果不明白上匕对一诙轉比較一个结亲 就色明白的了Optimise for、这里的一股葫眾认Program Sanction Highly similar seqiAacea (m眄处 13呦O More dissiniihr ssQwncss (dscorrtiQuous megablasl)Q SomQv4iat simlsr soquoncos (blastn)gh
13、8Q n PLASr nlgorrttm 营Search daulidse n( using Megablast (Optimise lot h* Show refcutt* in new windownuencee?3, blast参数的设置。注意显示的最大的结果数跟E值,E值是比较重要的。筛选的标准口最后会说明一下。BLASTSearch database nr using Meqablast (Optimize for highly similar sequences)P Show rcsuKd in q new window Aloftrithnu)arameiejsNote: Par
14、ameter values that differ froMax target、sequences显示的最穴结杲数SB二SGlGctthemaximurri numberof aligned soquoncosto displa/ Short quprips(3 Automatically adjust parameters for shoil input sequences 妙 已道Scoring ParametersMatch/Mismatch ScoresGap CostsL1-2 v -I LinearFilters and Masking Filter0 Low complGxity
15、 regions & Species-specific repeats for: HumanMask回 Mask for lookup table only 妙 Mask lower case letters 点BLAST运行BLASTSearch database nr using Megablast (Optimize for highly similar sequences) ESIlesults in a new winduw4,注意一下你输入的序列长度。注意一下比对的数据库的说明。ii*对的握*的说明NM_001076791 Mus musculus RiKEN cDNA 96300
16、25121-Query 10 OejcripKonIC1IL2795HM-001076?91 Mus muscubs RIKEN cO泌 9630025121 ge-? W30D2t21Rill mWifiMole f K-jngm财沁 or 2 HTGS 汗UkOther repeats*兄jnrwr“妁0七】(6少尹更 处公r H Grmhic Swinmy5, blast结果的图形显示。没啥好说的。Distribution of 160 Blast Hits on the Query Sequence Mouse-over to show defline and scores, clic
17、k to show alignmentsColor key* for alignment scores=200Q uerjf250500750100012506, blast结果的描述区域。注意分值与E值分值越大越靠前了,E值越小也是这样。 DescnptlonsLegend fcr 佃 ether ctwupe E liGene Q GEO O G*c EJ Slructire O Mjp VoAiclnq&CMt .11:c lo srL oolwQ匹盼罗(8.,102血、簸挨男英它數冼库 的说明咖gw00iQ?h7l 28K001633dW 1TXT12 3乂加0仪4丄1XER0JSrn
18、thetr wnstrkrt Nus mujcylw do” !KO3t 1000(24. MGC:H Nua muiojlua R1KEN cDXA 0630025! qn(963DQ25UlPik mRI TPA: I PA so: Hj musevkje raaubtof &t cjc-limuoori cardd/&: Nus mujojlvj o0jhm5V?5ne cOU*. Ft】咲N2Mer”e255. MGC;U Hama BpMn* krwpal-ooXadbox protein mOLL. osmpteta cd* Nuc muccjluc RlKhcXAC33O011K
19、17 gra C33O0UKifcl. m NU5 mujojlvi bljjtocm bhocr(OU? ES od5 cDU.沽”疋Md Ibf .MiTPA: TPA exp: Wj muscuhja rqulator M aex-limflbon cnddata : Mu$ mu5Ojlt MC ck*ie RPZ5-210I20 from chrctname U. wmp Nou EA quanca frc-?Btl6 an dircmoacfna 13. c PReDICTTD: Retiu, nozjacw jimior tp rwulstor of 5*5 c-Imtabon
20、Hua muiojlui RIKEN cDKA GJ30011K17 . ftXA cC*IA dona r NiM muiojlirt 16 6ft neor ctrebdlim eDMA. F:KEt fdl lerrttfi24&31000.0100%24W100%.0.0100*233100%-00100%.24”100%0.0100%242吨0.0100%2E100%-00K%2150】叽0.095%21SO100佻0.095%21500.0214SlWfe0.0S6%4060吨0.0100%557099%00100%.211199%0.092%2,旳9咫0.0*105274%00E
21、 v?leI Que coverafcMom YgGL 期QE07, blast结果的详细比对结果。注意比对到的序列长度。评价一个bias(结果的 标准主要有三项,E值(Expect),致性(Identities),缺失或插入(Gaps)。加 上长度的话,就有四个标准了。如图中显示,比对到的序列长度为1405,看 Identities这一值,才匹配到1344bp.而输入的序列长度也是为1344bp (看上面 的图),就说明比对到的序列要长一点。由Qurey (起始1)和Sbjct(起始35) 的起始位置可知,5,端是是多了一段的。有时也要注意3,端的。v Alignments | Select
22、 AllJn*|EC:17Z7L6.:l| 3Synthetic construct Nus iriusculus clone ua&GE: 1000 69524, MGC: 19Q42 6RIKEW cDnA 9630025T21 gene (9630025T2 lRlk) mKNA, encoders.coupletw proteinLength=1405 一比对到的序列长僅也泉需耍注意的黠的gggg A: 0:30们 刖30左5l2lRik I FrKEN cDWA 9630025121 gene Mus musculus(1U or fewer Publled links iScore
23、 = 2483 bits (1344) f Expect = 0.0 : V_电尊=至霑三4岌identities = 13躬门沏4仕6叱,心ph - U71342齿$)亠_艮兀方匸一 1且 Serar.d=Plus/PlusQuery 1里孔;n 库对序 在比的t y t5 153 6 Q-I I II II II I II II II I II II II I II II II I II II II I II II I II II II I II II II I II II ATGGAGGAAATOCIGTCCTTCCGGGATGTGGCCAITiJArTriTCTCCAGAAGAGAGGSACTAC CTSGTC CTGCTCAGTG;GATCTGIACAGAGAC OTGATGC ISGAAPTATAGC CAC I I II II II I II II II I II II II I II II II I II II II I II II I II II II I II II II I II II TAC CTSGTC CTGCTCAGTGGATCTGIACAGAGAC OTGATCC TGGAGAATTAMGC CAC609412 0154Uuery121Sbjct155
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 客服专员考试试题及答案
- 排水沟排水管施工方案
- 2025年为了和平考试试题及答案
- 2025网签版有条件贷款合同样本
- 盐田体育馆设计施工方案
- 做账实操-合同结算科目的账务处理SOP
- 2025年天津华北地质勘查局所属事业单位招聘高层次人才5人(第二批)考前自测高频考点模拟试题及答案详解(新)
- 2025贵州铜仁市妇幼保健院引进专业技术人才考前自测高频考点模拟试题及答案详解1套
- 货柜拆除方案范本
- 声测管埋设施工方案
- 中医课题申报书的范文怎么写
- 五粮液企业文化知识竞赛题及答案
- 2025年公基常识题及答案
- 诺如病毒胃肠炎诊疗方案(2025年版)解读学习课件
- 2025年地方AMC行业研究报告及未来行业发展趋势预测
- 农业综合行政执法大比武试题库(试题及答案)
- 2025年零碳园区发展白皮书-荣续ESG智库
- 国企新员工入职纪检培训
- 边境守护者边境管控信息化平台建设方案分析
- 变电站安全准入培训内容课件
- 西方翻译理论流派划分探索
评论
0/150
提交评论