新版blast本地化构建+数据库下载+序列间的相似性检索_第1页
新版blast本地化构建+数据库下载+序列间的相似性检索_第2页
新版blast本地化构建+数据库下载+序列间的相似性检索_第3页
新版blast本地化构建+数据库下载+序列间的相似性检索_第4页
新版blast本地化构建+数据库下载+序列间的相似性检索_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、新版blast本地化构建+数据库下载+序列间的相似性检索Ethn obota ny前面记录了 blast-2.2.23-ia32-win32的本地化构建及相似性检索,NCBI新近对blast程序做了一些修改推出了 blast+,这里结合网上资料、 blast+的user manual对blast+的本地化构 建及使用作一引荐。1blast+的本地化构建链接到:ftp:/ftp. ncbi. nlm.n /blast/executables/blast+/LATEST下载ncbi-blast-2.2.23+-ia32-win32.tar.gz (绿色版),解压到d盘,并将文件夹更名为

2、 blast (我 习惯这样做,因为在 dos中写命令时方便),这样就安装完毕了, blast下具2个文件即bin 和 doc。2数据库下载2.1法1:直接从NCBI下载subject序列去掉txt的扩展名做成数据库即*db,然后将query 序列的txt扩展名掉做成查询文件*in。(格式必须是fasta,名字可以自己随便命名)2.2法2:从NCBI中的ftp库下载所需要的某一个库或几个库,其链接为ftp:/ftp .n cbi. nlm.n /blast/db/2.3法3 :利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。2.3.1 p

3、erl程序的下载和安装可google "Perl for Windows ”获得,也可直接按此连接 下载并,安装到任何盘均可。2.3.2 运行 update_blastdb.pl 进行下载开始 运行cmd+确认进入dos系统 输入以下命令打开bin文件夹。斑命令提示符hinvnsnffr Windnus XPR.1.2AHR1<C> 版权所有 1985-2001 Microsoft Co®= Docunent0 andtingsAdminis= tt):>cd blastbin 0): blastbin>接着输入下述命令回

4、车查看操作帮助(这一步可以不做,不妨碍后续操作)P: blaatbln>pei*l update Jslastdb.pl还可输入下述命令回车查看NCBI中的库(无需登录NCBI你就可以看到你所需要的库)17 -V- J.I I ZD:XblastXbin>pevl update_blastdb.pl 一一showperl以下载载体库(vector)为例演示如何下载库。输入如下命令回车即可。直到后面出现 done即表示已经下载完毕。如果下载其他数据库,你就可以在上面的 update_blastdb.pl后面的vector换成其它数据库的名字即可。再做本地b

5、last时即可以你下载的压缩文件名代替你bin中*db数据库,进行搜索。上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是是NCBI中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。3序列间的相似性检索以人的BCL2-like mRNA检索人类的mRNA库为例介绍核酸序列的本地检索。3.1下载人类的mRNA数据库(只能用后 2种方法的其中一种),这里用ftp下载,速度较快, 其链接为 /refseq/H_sapiens/mRNA_Prot/human.rn

6、a.fna.gz解压后置于blast的bin文件夹下。3.2去NCBI下载BCL2-like的mRNA序列,其登录号为 NM_207002.2用作你做该实验的 query序列,将该序列置于 bin中命名为human,并去掉扩展名。3.3格式化数据库开始运行cmd+确认 进入dos系统 输入以下命令打开 bin文件夹。环命令提示符hinvnsnffr Windnus XPR.1.2AHR1<C> 版权所有 1985-2001 Microsoft Corp.C:Documents and SettingsAdministratop>d:D:>cd blastbinD:bla

7、stbin>输入以下命令对数据库进行格式化。1: blast Xbin>makeblastdb-exe -in human . rna. f na -parse_seqids -liash_index -dbtype nucl-in参数后面接将要格式化的数据库,-parse_seqids,-hashndex两个参数一般都带上,主要是为blastdbcmd取子序列时使用,-dbtype nucl告诉程序这是核酸数据库。3.4 运行 blastn (blast+)输入以下命令进行数据检索。D:Xblastbin>blastn.exe -task blastn -query hum

8、an -db human.pna.fna -out test.tx k这样即可在bin下查看结果。 以上实验所输入的全部命令如下:4蛋白序列间的比对检索数据库格式化命令:makeblastdb.exe - in db - parse_seqids- hash_index- dbtype prot比对命令:blastp.exe task blastp cjner- db db out test.txt关于参数的说明:blastp.exe程序执行命令,exe前的程序根据自己的需要而换;-task后面选择你所要用的程序,blastn,blatp,tblastx等;-query后接查询序列的文件名称;-db后接格式化好的数据库名称;-out后接要输出的文件名称及格式;-dbtype后接所格式化的序列的类型,核酸用nucl,蛋白质用prot;makeblastdb.exe 格式化数据库的命令;-helpbl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论