版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
四、核苷酸和蛋白质序列为基础的数据库检索 Sequence-baseddatabasesearching序列对位排列(sequencealignment)将两条或多条序列对位排列,突出相似的结构区域序列1序列208/14/96两条DNA序列对位排列分析08/14/96两条蛋白质序列对位排列分析08/14/96序列对位排列排列分析的种类序列对库对位排列分析从数据库中寻找同源序列主要涉及核苷酸数据库和蛋白质数据库两序列对位排列分析多序列对位排列分析08/14/96(一)序列对位排列分析的基本原理1、记分矩阵(scoringmatrix)记分矩阵中含有两条序列对位排列时具体使用的分值分数越高,两条序列匹配越好DNA序列对位记分矩阵序列1ACGTTAGC序列2ACTTTGGC记分0.90.9--=5.208/14/96蛋白质序列对位排列分析记分复杂一致氨基酸的记分不同稀有氨基酸(C),分值高普通氨基酸(S),分值低相似氨基酸也记分,如D-E序列1:TTYGAPPWCS序列2:TGYAPPPWS*****序列1:TTYGAPPWCS序列2:TGYAPPPWS*****08/14/962、空位(间隔)罚分(gappenalty)基因进化过程中产生突变序列对位排列分析时允许插入空位空位罚分涉及两个参数插入缺失空位开放(gapopening)空位延伸(gapextension)蛋白质序列对位记分序列1VDS-CY序列2VESLCY记分424-119708/14/96
BLASTFASTABlitz(二)序列对库对位排列分析主要检索体系用待分析序列对数据库进行相似性分析重复许多次的两两序列对位排列分析从数据库中找出所有同源序列08/14/961、基本概念(1)Sequenceidentity和sequencesimilarityIdentity:
两条序列在同一位点上的核苷酸或氨基酸残基完全相同Similarity(positive):
两条序列在同一位点上的氨基酸残基的化学性质相似Query:
1IGQAQCSTFRGRIYNETNIDSAFATQRQANCP32
IGQAQCTF+
RIYNET
+AFAT
+ANCPSbjet:
2IGQAQCGTFKDRIYNET---TAFATSLRANCP3208/14/96(3)Gappedalignment
和ungappedalignmentQuerySubjectQuerySubjectQuerySubjectQuerySubjectGappedalignment:
为达到最佳alignment,序列中加入空位Ungappedalignment:相比较序列的核苷酸或氨基酸序列连续08/14/96(4)Alignmentscore和E(expect)value衡量两条相比较序列相似程度的标准rawscore:原始分,分值越大,两个比较序列相似程度越大bitscore:
采用统计学方法以原始分为基础计算的Evalue:期望得到的、完全由机会造成的、相当于或大于目前分值的alignment次数
E=10,5e-46=510-46,E值越小越好
取决与
alignment分值、相比较序列的长短和数据库中数据的数量08/14/96(5)Low-complexityregions(LCRs)
核苷酸和蛋白质序列中短的重复序列或由少数几种核苷酸或氨基酸残基组成的序列(如Poly-A)
数据库中半数以上的序列至少带有一个LCRSequencealignment时应避免LCR相互配对得分
BLAST用Filter功能避免比较LCR用小写字母代表LCR中的每个氨基酸残基或核苷酸08/14/96BLASTprogramblastn 用核苷酸序列检索核苷酸数据库blastp 用氨基酸序列检索蛋白质数据库blastx 将核苷酸序列通过6种阅读框翻译成不同的氨基酸序列检索蛋白质数据库tblastn 将蛋白质序列译成不同的核苷酸序列检索核苷酸数据库tblastx 将核苷酸序列通过6种阅读框翻译成不同的氨基酸序列检索核苷酸数据库(数据库中的序列也被翻译出不同的氨基酸序列)08/14/96
GFCN*FFT*LN?
WLLQLILNLA*C
MASATNSSLSLM?5’ATGGCTTCTGCAACTAATTCTTCACTTAGCTTAATGC3’3’TACCGAAGACGTTGATTAAGAAGTGAATGCAATTACG5’?PLQW*NLV*TLAHSRCSIR*LR*H?AEAVLEESVNIBlastx的
6种阅读框架08/14/96BLASTdatabasenr(nucleotideBLAST)GenBank(无EST,STS,GSS,HTGS)nr(proteinBLAST) GenBankCDStranslation+PDB+SwissProt+PIR+PRF)Drosophilagenome
果蝇基因组month nr中的一部分,30天内提交的或修改过swissprot 蛋白质数据库est EST数据库dbsts STS数据库pdb 蛋白质三维结构数据库pat 专利的数据库08/14/96如何进行BLAST检索?
使用WWW服务使用BLASTemail服务08/14/96(1)BLASTN将要查询的序列直接粘贴到序列框中或输入登陆号(GI号)选择database选择Autoformat(Full-auto或Semi-auto)可进行其它项目的选择用于分析进一步选择检索范围:Limitbyentrezquery(如proteaseNOThivI)Filter(Humanrepeats):遮盖重复序列可加快检索速度(特别是>100kb的片段)Alignmentview:如query-anchoredwithidentitiesNCBI-gi:是否显示序列的GI号08/14/96(2)BLASTP基本操作同blastn08/14/96(4)PHI-BLAST
(PatternHitInitiatedBLAST)search
蛋白质序列,并带有特殊结构(pattern)带有同样的特殊结构这一邻近的序列与被查询序列相似
与PSI-BLAST相连,重复检索检索数据库中相似的蛋白质可查询检测到的特殊结构08/14/96(5)
TranslatedBLASTblastx,tblastn,tblastx基本操作同blastn08/14/964、Blitz检索BLAST和FASTA检索体系有时不能检测出某些远缘序列的相关性Blitz检索体系在发现家族成员方面比其它两种检索体系更可靠只能检索蛋白质数据库速度慢,最好使用email服务08/14/96检索方法:通过email服务检索方法:Blitz检索主页输入email地址、粘贴待分析的序列email服务被接收08/14/96(三)两序列对位排列分析两序列全局对位排列分析对位排列贯穿整条序列长度两序列局部对位排列分析两序列相似性最大区段的对位排列分析08/14/96(1)BLAST2sequences
NCBI的分析工具对任意两条序列进行对位排列分析允许空位08/14/96
序列来源
输入Accessionnumber
直接粘贴序列
适用于blastn,blastp,blastx,tblastn,tblastxblastn:两条核苷酸序列相比较blastp:两条蛋白质序列相比较tblastn:比较蛋白质序列(sequence1)和核苷酸序列(翻译成蛋白质序列)(sequence2)blastx:比较核苷酸序列(翻译成蛋白质序列)(sequence1)和蛋白质序列(sequence2)tblastx:两条核苷酸序列(翻译成蛋白质序列)比较08/14/96
结果格式
两种图形两序列对位排列2108/14/96(2)Globala
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第二节 海水提取食盐说课稿2025学年初中化学北京版2024九年级下册-北京版2024
- 心理健康活动设计2025说课稿
- 2026年尊严说课稿感裙子
- 高中2025尊重残疾人献温暖说课稿
- (完整版)玻璃幕墙安装施工方案
- 2026年学做小雷锋说课稿
- Unit 1 Farm animals说课稿2025年小学英语二年级下册牛津(绿色上教版)
- 深静脉血栓的护理评估与计划制定
- 学吹竖笛(二)说课稿2025学年初中音乐粤教花城版2024七年级下册-粤教花城版2024
- 2026年AR工业维修系统开发技术架构优化
- 燃气管道巡线巡检管理方案
- 面面垂直的性质课件2025-2026学年高一下学期数学人教A版必修第二册
- 2026云南西双版纳供电局及所属县级供电企业项目制用工招聘14人笔试参考题库及答案解析
- 2026年江苏南京高三下学期二模数学试卷和答案解析
- 2025-2026学年成都市锦江区九年级下二诊英语试题(含答案和音频)
- 2026年-兴奋剂风险预警与防控机制试题
- 2026-2030中国高纯铝行业市场发展趋势与前景展望战略研究报告
- 2026年湖南省张家界市初二学业水平地理生物会考真题试卷(+答案)
- 2026年事业单位考试公文改错专项训练测试
- 2026年芯片设计DFT工程师高频面试题包含详细解答
- 2026年上海市静安区社区工作者招聘考试参考题库及答案解析
评论
0/150
提交评论