




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
序列比较的生物学基础序列比较的生物学基础 构成生命的基本单位是蛋白质 而作为在细 胞中催化各种化学反应的分子机器的酶 也 是蛋白质 另外 细胞的许多结构也是蛋白 质组成的 连非蛋白质的构成部分也是由属 于蛋白质的酶所催化生产的 一个人体含有 大约100 000种不同的蛋白质 正是这 100 000种蛋白质的特性及其相互作用使我们 无所不能 序列比较的生物学基础序列比较的生物学基础 蛋白质由20种氨基酸组成的多肽折叠而成 蛋白质 由20种不同的氨基酸组成不同长度的聚合体 也称 为肽或多肽 由这种线性拓朴结构的聚合体折叠起 来产生形状各异的不同蛋白质 不同的形状以及20 种氨基酸的化学特性决定了蛋白质的功能 现代生 物学中的一个很主要的概念是 蛋白质的功能特性 主要决定于线性多肽链中20种氨基酸的序列 由于 大多数蛋白质都是自身折叠而成 所以理论上知道 了一个蛋白质的序列后即可推导出其功能 序列比较的生物学基础序列比较的生物学基础 什么决定蛋白质的氨基酸序列 分子生物学 的中心内容就是描述我们从父母获得的遗传 信息是如何储存于DNA中 它们是如何被用 于复制相同的DNA副本 如何从DNA转录到 RNA再翻译到蛋白质的 序列比较的生物学基础序列比较的生物学基础 DNA由4种脱氧核苷酸组成 ATGC DNA是由4种脱氧核苷酸 形成的线性多聚体 这4种核苷酸是 腺嘌呤脱氧核苷单磷酸 deoxyAdenosine monophosphate A 胸腺嘧啶脱氧核苷单磷酸 deoxyThymidine monophosphate T 鸟嘌呤脱氧核苷单磷酸 deoxyGuanosine monophosphate G 胞嘧啶脱氧核苷单磷酸 deoxyCytidine monophosphate C 序列比较的生物学基础序列比较的生物学基础 RNA则是由A U G C 4种核苷酸形成的相似 线性多聚体 这4种核苷酸是 腺嘌呤核苷单磷酸 Adenosine monophosphate A 尿嘧啶核苷单磷酸 Uridine monophosphate U 鸟嘌呤核苷单磷酸 Guanosine monophosphate G 胞嘧啶核苷单磷酸 Cytidine monophosphate C 序列比较的生物学基础序列比较的生物学基础 遗传密码遗传密码 三联子三联子 mRNA上每3个核苷酸翻译成蛋白质多肽链上的一个氨基酸 这3个核苷酸就称为一个密码 也叫三联子密码 翻译时从 起始密码子AUG开始 沿mRNA5 3 的方向连续阅读直到 终止密码子 生成一条具有特定序列的多肽链 mRNA中只有4种核苷酸 而蛋白质中有20种氨基酸 若以一 种核苷酸代表一种氨基酸 只能代表4种 4 1 4 若以两种 核苷酸作为一个密码 二联子 能代表4 2 16种氨基酸 而假定以3个核苷酸代表一个氨基酸 则可以有4 3 64种密 码 满足了编码20种氨基酸的需要 序列比较的生物学基础序列比较的生物学基础 4种核苷酸组成种核苷酸组成64个三联密码子 个三联密码子 4种核苷酸可以组成64个不同的三联密码子 triplet codes 用于编码20种氨基酸绰绰有余 其中三个 为终止密码子 代表多肽序列的末端 一种氨基酸 可以由1 6个三联密码子编码 由多个密码子编码 的氨基酸 不同密码子的使用频率并不相等 这种 使用频率的不同分布称为 密码子偏好 coden usage 不同种的生物密码子偏好不同 序列比较的生物学基础序列比较的生物学基础 形成形成6个开放读码框个开放读码框 由于氨基酸是由三联密码子编码的 因此 DNA序列就包含三个不同的开放读码框 取 决于从第一 第二或第三位核苷酸开始 第四 位和第一位同框 而双链DNA的两条链都可 以转录RNA 后者翻译蛋白质 因此 一个 DNA序列及其互补链可以有6个不同的读码框 reading frames 序列比较的生物学基础序列比较的生物学基础 序列测定 序列测定 序列测定 序列测定 可以用化学方法测定蛋白质的氨基酸序列以及DNA和 RNA的核苷酸序列 可是 就目前来说 测定DNA 的核苷酸序列比测定RNA序列和蛋白质序列容易的 多 由于蛋白质序列可以由编码它的DNA序列推导 出来 许多已知的蛋白质序列其实就是从DNA序列 推导出来的 将mRNA转为DNA cDNA 是一个简单 的实验技术 因此RNA分子的序列通常是以cDNA 序列测定的 序列分析其实就是从已知蛋白质 RNA DNA序列作出生物学推论的过程 序列分析的困难序列分析的困难 技术欠缺 DNA非编码区比编码区多 编码区不连续 内含子 外显子 mRNA非编码区 tRNA SnRNA 从DNA序列推导蛋白质序列 从蛋白质序列推导结构和功能 二级结构 alpha helix beta sheet 超级二级结构 三级结构 四级结构 为什么结构命名如此复杂 结构决定功能 实验方法欠缺 蛋白质三级结构推导的基础 目前不能从结构推导功能 序列分析的困难序列分析的困难 编码区不连续编码区不连续编码区不连续编码区不连续 内含子 外显子内含子 外显子内含子 外显子内含子 外显子 编码蛋白质的DNA并不是连续的 而是在其中 分布有许多叫做 内含子 的分隔区 大多数情 况下 这个问题可以通过测定mRNA cDNA 的序列来解决 因为cDNA中所含的非编码的 额外部分很少 而原来被分隔开的外显子 exons 在mRNA cDNA 中已经被连接成为 一个连续的片段 当然 在某些特殊情况 下 难以分析RNA而只能分析DNA本身 序列分析的困难序列分析的困难 从蛋白质序列推导结构和功能从蛋白质序列推导结构和功能 当我们得到一个蛋白质序列之后 从序列推导 它的结构遇到的困难很大 最后 即使已经测定了蛋白质的三级结构 目 前还没有任何技术可以从它们的结构推导出 其功能特性 序列分析可以做些什么 序列分析可以做些什么 从数据库中查找相似序列 从数据库中查找相似序列 从数据库中查找相似序列 从数据库中查找相似序列 在我们刚刚测定了一个感兴趣的DNA序列后 提出的第一个问 题很可能就是 是否有人见过与此相似的序列 今天的国 际互联网上已经有人很成功的将所有已经测定的序列收集起 来供人查找 在DNA序列的收集方面主要靠三个小组的通力 合作 他们一个在日本 一个在欧洲 还有一个在美国 形 成三个大的数据库 分别是DDBJ EMBL和GeneBank 这 些数据库不断的相互交流数据 使各数据库的数据保持一 致 因此查找任何其中一个 就等于查找所有三个 序列分析可以做些什么 序列分析可以做些什么 序列排比 推导进化树 结构 功能 序列排比 推导进化树 结构 功能 序列排比 推导进化树 结构 功能 序列排比 推导进化树 结构 功能 尽管不可能完全从蛋白质序列本身推测其功能或结构 但在一 定程度上还是可以做到的 尤其当未知结构与功能的蛋白质能 与已知结构功能的蛋白质序列做比较时 更是如此 其次 目 前的分析就算不能得出蛋白质结构与功能的最终结果 也可以 为将来的进一步分析提供参考 第三 通过比较不同种生物等 位蛋白的序列 这些等位蛋白被称为 同源的 可以勾画出这些 物种的进化树 序列相似性的概念序列相似性的概念 序列对比序列对比 aligmentaligment 是序列分析的基础 其他是序列分析的基础 其他 一切都建立在序列排比的基础上 一切都建立在序列排比的基础上 ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCTAGCTGCTAGCTAG ACGCTAGCGCAAGCTGCTAGCTAG 序列相似性的概念序列相似性的概念 序列对比的目的 序列对比的目的 序列对比是推导蛋白质二级结构的基础序列对比是推导蛋白质二级结构的基础 是初步蛋白质功能推断的基础是初步蛋白质功能推断的基础 可用于蛋白质三级结构的推导可用于蛋白质三级结构的推导 可用于推导进化树和解释种间亲缘关系可用于推导进化树和解释种间亲缘关系 用于分析分子水平的选择压力用于分析分子水平的选择压力 selective pressure 探测序列之间的相互关系探测序列之间的相互关系 探测启动子等基因调控单元探测启动子等基因调控单元 序列相似性的概念序列相似性的概念 序列排对比具有上述强大功能的原因是 序列排对比具有上述强大功能的原因是 人们发现 假如两个生物大分子的序列足够人们发现 假如两个生物大分子的序列足够 相似 几乎毫无疑问相似 几乎毫无疑问 当然不是绝对当然不是绝对 它们具有它们具有 相似的生物学功能 并且可能是同源的 相似的生物学功能 并且可能是同源的 序列相似性的概念序列相似性的概念 在序列中编码功能的句法和语义中具有两个重在序列中编码功能的句法和语义中具有两个重 要的特征 要的特征 功能被编码于序列之中 即序列提供了功能被编码于序列之中 即序列提供了句法句法 编码具有一定的冗余度编码具有一定的冗余度 redundancy redundancy 即序列中一 即序列中一 些位点的改变可以保持功能不变 这就使编码具有些位点的改变可以保持功能不变 这就使编码具有 强劲的强劲的语义语义 序列相似性的概念序列相似性的概念 在对一个新测定的在对一个新测定的DNADNA序列进行分析时 序列进行分析时 比如分析的结果是 这个序列与某种细菌的比如分析的结果是 这个序列与某种细菌的 ATPaseATPase相似 这是否意味着这个未知序列相似 这是否意味着这个未知序列就就 是是一个一个ATPaseATPase 答案是不能确定的 答案是不能确定的 所以就所以就 必须完全理解在序列水平上必须完全理解在序列水平上 相似性相似性 或或 同源同源 性性 是如何定义的 是如何定义的 序列对比是如何进行的 序列对比是如何进行的 一致性一致性 identity identity 两个蛋白质有一定数量的氨基酸在对比的位点 上是相同的 即如果38个氨基酸的蛋白质中 15个位点相同 我们说它们39 4 相同 39 4 MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG PRNGTIKIYENPARTFTRPYSAKNITIYKEND 序列比较是如何进行的 序列比较是如何进行的 相似性相似性 similarity similarity 通常在某些位点上有一些氨基酸被另外一些化通常在某些位点上有一些氨基酸被另外一些化 学物理特性相近的氨基酸所代替 这种突变学物理特性相近的氨基酸所代替 这种突变 可称为可称为保守突变保守突变 将保守突变的因素考虑在 将保守突变的因素考虑在 内 就可以定义各种打分方案内 就可以定义各种打分方案 scoring schemes 对两序列的相似程度打分 所得分对两序列的相似程度打分 所得分 值即代表其相似的程度 值即代表其相似的程度 序列比较是如何进行的 序列比较是如何进行的 同源性同源性 homology homology 只有当两个蛋白质在进化关系上具有共同的祖只有当两个蛋白质在进化关系上具有共同的祖 先时 才可称它们为同源的 先时 才可称它们为同源的 序列比较是如何进行的 序列比较是如何进行的 要分析两个序列是否相似 必须首先作对比分析 alignment 如何作对比分析 如何作对比分析 最基本的条件是对序列的相似性做定量分析 然后将序列进行排 比 在排比中要用到 Gaps 间距 或Insertions 插入 Substitutions 取代 对gaps和insertions打分可用较简单的扣分方案 而substitutions 的打分则比较复杂 必须先构建出一个计算机的算法矩阵 Matrix 再根据此方案对序列中氨基酸残基之间的差异或相似 进行打分 序列比较是如何进行的 序列比较是如何进行的 要对两个序列进行对比 必须首先打出其相似性的 定量分值 于是需要一个打分矩阵 打分矩阵打分矩阵 Scoring Matrix 给不同的氨基酸对定义的一系列相似性分值 对氨 基酸配对相似性的尺度衡量 例如苯丙氨酸和异亮 氨酸相似性的定量标准 可以以多种方式来定义 序列比较是如何进行的 序列比较是如何进行的 打分矩阵打分矩阵 Scoring Matrix 对氨基酸对相似性的尺度衡量 例如苯丙氨酸 Phe 和 异亮氨酸 Ile 相似性的定量标准 可以以多种方式 来定义 因此 设计一个打分矩阵 首先必须确定 用什么算法模型 在序列排比分析中 打分矩阵只 是某个算法模型的量化表现 排比的结果只在该算 法模型所划定的范围内有意义 序列比较是如何进行的 序列比较是如何进行的 打分矩阵打分矩阵 Scoring Matrix 简单打分矩阵 单一打分矩阵和遗传密码 打分矩阵 目前使用最简单的打分矩阵就是 匹配打分矩阵 identity matrix 如果两个氨 基酸相同 就打一个分值 不同就打另一个 分值 不管替换的情况 例如 相同就打1 分 不同就打0分 这就是最简单常用的单一 打分矩阵 当然 也可以相同打 6分 不同 打 1分 序列比较是如何进行的 序列比较是如何进行的 打分矩阵打分矩阵 Scoring Matrix 因为所有的点突变都产生于核苷酸的变化 因此对比中氨基酸对的相关性是随机的还是 遗传的应处决于由一个密码子转变为另一密 码子所必需的点突变的数量 由这一模型而 产生的打分矩阵将根据导致密码子改变所需 改变核苷酸的数量来定义两个氨基酸之间的 距离 此为遗传密码子打分矩阵 genetic code matrix 与匹配打分模型相比 它改进 了排比中的灵敏度和专一性 遗传密码子打分矩阵 A genetic code matrix A B C D E F G H I K L M N P Q R S T V W Y Z 3 0 2 0 1 0 2 0 2 0 1 0 2 0 1 0 1 0 1 0 1 0 1 0 1 0 2 0 1 0 1 0 2 0 2 0 2 0 1 0 1 0 2 0 A 3 0 1 0 3 0 2 0 1 0 2 0 2 0 2 0 2 0 1 0 1 0 3 0 1 0 2 0 1 0 2 0 2 0 2 0 0 0 2 0 2 0 B 3 0 1 0 0 0 2 0 2 0 1 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 2 0 2 0 1 0 1 0 2 0 2 0 0 0 C 3 0 2 0 1 0 2 0 2 0 1 0 1 0 1 0 0 0 2 0 1 0 1 0 1 0 1 0 1 0 2 0 0 0 2 0 2 0 D 3 0 0 0 2 0 1 0 1 0 2 0 1 0 1 0 1 0 1 0 2 0 1 0 1 0 1 0 2 0 1 0 1 0 3 0 E 3 0 1 0 1 0 2 0 0 0 2 0 1 0 1 0 1 0 0 0 1 0 2 0 1 0 2 0 1 0 2 0 0 0 F 3 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 2 0 2 0 1 0 2 0 2 0 1 0 2 0 G 3 0 1 0 1 0 2 0 0 0 2 0 2 0 2 0 2 0 1 0 1 0 1 0 0 0 2 0 2 0 H 3 0 2 0 2 0 2 0 2 0 1 0 1 0 2 0 2 0 2 0 2 0 0 0 1 0 1 0 I 3 0 1 0 2 0 2 0 1 0 2 0 2 0 1 0 2 0 1 0 1 0 1 0 2 0 K 3 0 2 0 1 0 2 0 2 0 2 0 2 0 1 0 2 0 2 0 1 0 2 0 L 3 0 1 0 1 0 1 0 2 0 1 0 2 0 2 0 1 0 0 0 1 0 M 3 0 1 0 1 0 1 0 2 0 2 0 1 0 0 0 2 0 2 0 N 3 0 2 0 2 0 2 0 2 0 1 0 1 0 1 0 2 0 P 3 0 2 0 1 0 1 0 1 0 1 0 1 0 3 0 Q 3 0 2 0 2 0 1 0 2 0 1 0 2 0 R 3 0 2 0 1 0 2 0 2 0 1 0 S 3 0 1 0 1 0 1 0 1 0 T 3 0 1 0 1 0 2 0 V 3 0 1 0 1 0 W 3 0 1 0 Y 3 0 Z What is the cost of matching a G with a L What does this score represent 序列比较是如何进行的 序列比较是如何进行的 打分矩阵打分矩阵 Scoring Matrix Dayhoff打分矩阵 The Dayhoff Matrix 一个根据经 验的氨基酸相似性打分矩阵 这个矩阵假设 一旦确定了两个序列的进化关系 其 交换的氨基酸将是相似的 Dayhoff及其同事在70 年代初期作的一个蛋白质序列和结构图表集中 通 过用一些哺乳动物蛋白质序列的对比发展出了一个 精确的突变数据打分方案 mutation data matrix 其方案对特定蛋白质序列排比中 序列的差异是随 机发生的还是反映同一个共同祖先序列的机率作了 定量 序列比较是如何进行的 序列比较是如何进行的 打分矩阵打分矩阵 Scoring Matrix 其它相似性打分矩阵可以根据氨基酸的任何特 征构建出来 只要这些特征能定量表示出 来 如亲水性和疏水性 电荷 分子体积等 的分隔系数 遗憾的是 这些生物物理量只 能部分反映氨基酸之间的关系 并不能百分 之百的推论出相关蛋白质氨基酸的保守性 序列相似性的作图分析 利用计算机比较序列利用计算机比较序列 我们可以让计算机以最佳的方式来作序列比较 开始时 可我们可以让计算机以最佳的方式来作序列比较 开始时 可 以先将两个序列摆在一起 数一数匹配的残基数 可是 这以先将两个序列摆在一起 数一数匹配的残基数 可是 这 样还没有考虑生物序列的另一相关因子 样还没有考虑生物序列的另一相关因子 残基之间可以存在残基之间可以存在 不同的相似度不同的相似度 例如 例如 亮氨酸与异亮氨酸亮氨酸与异亮氨酸的相似度大于其与的相似度大于其与 其它氨基酸如组氨酸等的相似度 尽管它们都属于不同的氨其它氨基酸如组氨酸等的相似度 尽管它们都属于不同的氨 基酸 基酸 序列相似性的作图分析 利用计算机比较序列利用计算机比较序列 因此 第一步首先制作一个表或距阵 用来标明各不同氨基因此 第一步首先制作一个表或距阵 用来标明各不同氨基 酸残基之间的相似度 这样一来 计算机就不会将亮氨酸变酸残基之间的相似度 这样一来 计算机就不会将亮氨酸变 为异亮氨酸与亮氨酸变为组氨酸等同对待 有好些这种氨基为异亮氨酸与亮氨酸变为组氨酸等同对待 有好些这种氨基 酸相似度表或酸相似度表或打分矩阵打分矩阵已被制作出来 如已被制作出来 如PAMPAM BLOSUMBLOSUM BLOSUM32BLOSUM32等 每个距阵都是根据不同的假设或实验数据制等 每个距阵都是根据不同的假设或实验数据制 作出来 计算机就根据这些表来判定残基之间的相似度 作出来 计算机就根据这些表来判定残基之间的相似度 序列相似性的作图分析 利用计算机比较序列利用计算机比较序列 当然 我们还希望计算机将两个序列逐个碱基相对当然 我们还希望计算机将两个序列逐个碱基相对错位错位 以 以 免忽略耷掉任何相似的区段 如果我们把这一过程做成一个免忽略耷掉任何相似的区段 如果我们把这一过程做成一个 二维的图表 可能比较容易看出这个工作是如何完成的 在二维的图表 可能比较容易看出这个工作是如何完成的 在 图表中 将其中一个序列的残基与另一序列的所有残基逐一图表中 将其中一个序列的残基与另一序列的所有残基逐一 比较 比较 序列相似性的作图分析 利用计算机比较序列利用计算机比较序列 C X G X A T G C T X A X A T G C A T G C 上图的对角线代表上图的对角线代表不作任何移位不作任何移位不作任何移位不作任何移位比较两个序列时的匹配残基 比较两个序列时的匹配残基 序列相似性的作图分析 利用计算机比较序列利用计算机比较序列 A C X A T G C A G X T X G A T G C A X G A T G C 这里 我们将这里 我们将主对角线用点主对角线用点标出以作参考 可以看出 相似标出以作参考 可以看出 相似 的区域表现为对角线 而相对的错位则简单的表现为移置的的区域表现为对角线 而相对的错位则简单的表现为移置的 对角线 孤立的匹配标记代表个别的匹配而不是区段的匹对角线 孤立的匹配标记代表个别的匹配而不是区段的匹 配 因此将其忽略不计 配 因此将其忽略不计 这一方法在查看反转序列时也很有用 反转的序列将简单的这一方法在查看反转序列时也很有用 反转的序列将简单的 表现为反对角线 表现为反对角线 A X T X C G T A G X C X A T G C A T G C 序列相似性的作图分析 利用计算机比较序列利用计算机比较序列 对角线比拟法在查找前面见过的序列中隐藏特征时也很有对角线比拟法在查找前面见过的序列中隐藏特征时也很有 用 例如 用 例如 一个重复序列会表现为一系列平行的对角线 一个重复序列会表现为一系列平行的对角线 它它 们从不同的残基发出而有同样的长度 们从不同的残基发出而有同样的长度 查找查找反转的重复序列反转的重复序列 stemstem loopsloops等 也可以通过检查这个二等 也可以通过检查这个二 维图很容易找出 维图很容易找出 一旦我们了每一个残基相对位移比较完了序列之后 一旦我们了每一个残基相对位移比较完了序列之后 加加gapsgaps的的 工作就等于是在不断的移位残基比较中查找相似的区段 然工作就等于是在不断的移位残基比较中查找相似的区段 然 后用适当的后用适当的gapsgaps将它们连接起来 将它们连接起来 说起来简单 实际上还是很说起来简单 实际上还是很 难的 因为计算机可能会加入太多的难的 因为计算机可能会加入太多的gapsgaps 而我们知道自然情而我们知道自然情 况下况下gapsgaps并非发生的很频繁 而且它们通常会破坏序列的功并非发生的很频繁 而且它们通常会破坏序列的功 能 我们需要建立一个方法来评定哪里需要加能 我们需要建立一个方法来评定哪里需要加gapsgaps 但一旦加但一旦加 了了gapsgaps之后 对于其它的限制 如引入新的邻近之后 对于其它的限制 如引入新的邻近gapgap 即延长即延长 gapgap的长度 则应相对放松 的长度 则应相对放松 序列相似性的作图分析 利用计算机比较序列利用计算机比较序列 可见 对角线的的思路引至了非常有效的序列比较分析方可见 对角线的的思路引至了非常有效的序列比较分析方 法 其实 法 其实 这就是目前大多数计算机程序做序列比较分析时这就是目前大多数计算机程序做序列比较分析时 所采用的方法所采用的方法 它们首先尝试象上述一样的建立一个序列比 它们首先尝试象上述一样的建立一个序列比 较的距阵 然后寻找对角线 最后较的距阵 然后寻找对角线 最后尝试将尽可能多的对角线尝试将尽可能多的对角线 连接起来 成为一个最佳相似排比连接起来 成为一个最佳相似排比 记住 记住 一个对角线代表一一个对角线代表一 个相似的序列区段个相似的序列区段 可是 这一方法还有两个主要缺点 可是 这一方法还有两个主要缺点 比较的量 比较的量 它随着序列大小的增加而增加 因为它随着序列大小的增加而增加 因为每一个残基每一个残基 都要与另一序列的都要与另一序列的所有所有残基比较 残基比较 必须从距阵中寻找对角线 必须从距阵中寻找对角线 并寻找各种可能的组合 以找出并寻找各种可能的组合 以找出 最佳排比 最佳排比 完成以上两步在计算机的运算中是完成以上两步在计算机的运算中是非常消耗资源的非常消耗资源的 因此 因此 大多数计算机软件都走捷径来加快运算的速度 让我们看一大多数计算机软件都走捷径来加快运算的速度 让我们看一 个稍微复杂的比较 个稍微复杂的比较 这里所比较的也只不过是两个这里所比较的也只不过是两个小序列小序列 约约100100碱基碱基 可以从中 可以从中 看出一些对角线 但是它们被看出一些对角线 但是它们被大量孤立的点弄模糊大量孤立的点弄模糊了 这些了 这些 孤立点代表随机的匹配 由于点太多 要判断哪些是有关的孤立点代表随机的匹配 由于点太多 要判断哪些是有关的 哪些是无关的 即使对计算机来说也是很艰难的工作 哪些是无关的 即使对计算机来说也是很艰难的工作 任何情况下我们都是对任何情况下我们都是对一段连续的相似残基感兴趣一段连续的相似残基感兴趣 而对随 而对随 机匹配不感兴趣 也就是对沿着对角线的匹配感兴趣 我们机匹配不感兴趣 也就是对沿着对角线的匹配感兴趣 我们 可以可以设一个最小的对角线长度设一个最小的对角线长度 比如说 比如说1010个连续的残基个连续的残基 这 这 样一来就可以消除随机的点 这就叫一个样一来就可以消除随机的点 这就叫一个 windowwindow 窗口窗口 要 要 求至少有这么长的相似区段才去考虑它
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 临床大专儿科试题及答案2025年版
- 临床并发症护理试题及答案2025年版
- 2025年广东省劳动合同样本
- 2025年文化旅游IP开发与运营项目在文化旅游资源整合中的可行性研究
- 2025年文化产品跨界合作在文化创意产品线下体验店的应用前景
- 2025年微电网能量管理技术创新在智能电网电力需求响应中的应用
- 2025年特色小镇文化旅游产业开发项目可行性研究:技术创新与旅游经济新动能
- 2025年特色小镇文化创意产业集群发展规划报告:技术创新引领未来
- 镜花缘课件教学课件
- 2025年3D打印技术在汽车制造中的轻量化设计
- 流感传染的预防与护理知识培训课件
- 秋季慢性病知识讲座
- 2024年全国高考体育单招考试语文试卷试题(含答案详解)
- 《西方经济学》(下册)课程教案
- 小儿雾化吸入的健康宣教课件
- 电力系统运行方式分析和计算
- 法院送法进校园讲座
- 反比例函数 单元作业设计
- 病机中医学基础课件
- 公路技术状况评定标准
- 2022年四川雅安综合类事业单位招聘392人笔试备考题库及答案解析
评论
0/150
提交评论