生物分子数据库课件_第1页
生物分子数据库课件_第2页
生物分子数据库课件_第3页
生物分子数据库课件_第4页
生物分子数据库课件_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物分子数据库课件生物分子数据库课件一、概述生物信息学的定义 生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。 (美国人类基因组计划实施五年后的总结报告) 一、概述生物信息学的定义二、生物信息学数据库种类Nucleic Acids Research杂志每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期115种通用和专用数据库。至2008年,生物信息学数据库总数已达1078个。比2007年增加110个。二、生物信息学数据库种类Nucl

2、eic Acids ResNucleic Acids Research 杂志Nucleic Acids Research 杂志生物分子数据库课件Nucleic Acids Research 杂志Nucleic Acids Research 杂志生物分子数据库课件生物分子数据库课件相关数据库及其主要分类 1. 核酸序列数据库 2. RNA 序列数据库 3. 蛋白质序列数据库 4. 结构数据库 5. 基因组数据库 6. 代谢酶相关产物 7. 人类和其他脊椎动物基因组 8. 人类基因和疾病 9. 其他数据和其他基因表达数据库 10. 蛋白组资源 11. 其他分子生物学数据库 12. 细胞器官数据库

3、13. 植物数据库 14. 免疫学数据库相关数据库及其主要分类 1. 核酸序列数据库核酸序列数据库核酸序列数据库蛋白质序列数据库 蛋白质序列数据库 蛋白质结构数据库蛋白质结构数据库基因组数据库图谱和显示器基因组数据库图谱和显示器人类疾病与基因数据库 人类疾病与基因数据库 生物信息分析工具 BLAST 序列相似性对比PRIMER 引物设计 蛋白质结构预测数据库 (EMBL)根据已知蛋白质序列,预测同族二级、三维等结构蛋白质功能预测数据库 (EMBL )根据已知蛋白质序列,预测蛋白质功能生物信息分析工具 BLAST 序列相似性对比我国生物信息相关网站 我国生物信息相关网站 三、 生物信息数据库检索

4、三、 生物信息数据库检索1.Entrez NCBI综合数据库1.Entrez NCBI综合数据库Entrez 用途检索大分子生物学数据获取GenBank, EMBL等数据库的核酸序列获取Swiss-port,PIR,PRF,PDB等蛋白质序列;从核酸序列翻译到蛋白质的序列获取基因和染色体图谱;蛋白质三维结构数据及大分子模式(MMDB)等其他生物信息数据库检索PubMed书目文献数据Entrez 用途检索大分子生物学数据Entrez生命科学搜索引擎Entrez生命科学搜索引擎Entrez 跨库检索Entrez 跨库检索检索字段限制分子类型选择基因位置限定序列片段限定数据更新日期限定功能栏核酸序列

5、检索检索字段限制分子类型选择基因位置限定序列片段限定数据更新功能序列存取号基因定义数据库标识符序列存取号基因定义数据库标识符代码物种来源参考文献特性专业评论代码物种来源参考文献特性专业评论碱基数原序列复制后,可到BLAST中进行相似性 对本碱基数原序列复制后,可到BLAST中进行相似性 对本 2. BLAST序列相似性检索Basic Local Alignment SearchTool是核酸和蛋白质序列的局部对准相似性检索工具 2. BLAST序列相似性检索序列相似性检索Blast是为从相同和不同的有机体中,提供对比核酸或蛋白质序列,寻找相似性序列片断的工具。从通过寻找不同基因的相同序列片段,

6、可以推断最新测定的基因功能、预测基因家族的新成员、探索基因的进化关系。在基因组测序的工作中,序列相似性检索可以预测蛋白质代码和翻译产物的功能和定位。序列相似性检索Blast是为从相同和不同的有机体中,提供对比选择对比程序基因组对比特殊对比选择对比程序基因组对比特殊对比将序列数据库中的复制序列在此粘贴将序列数据库中的复制序列在此粘贴序列对比报告对比资源类似性图谱序列对比报告对比资源类似性图谱对比图谱报告数据库标识符基因定义类似性积分E值为匹配期望值。说明可以找到与搜索序列相匹配的其它序列的几率。E值越接近零,越不可能找到其它的匹配序列,其背后的含义就是E值越少,匹配度越好对比图谱报告数据库标识符

7、基因定义类似性积分E值为匹配期望值。点击可得待检序列与库存序列对排基因表达库链接单基因库基因信息库点击可得待检序列与库存序列对排基因表达库链接单基因库基因信息人类染色体上的抗肿瘤基因序列对排表人类染色体上的抗肿瘤基因序列对排表相关文献链接相关文献链接对排序列不一致处序列对排报告对排序列序列对排报告3.NCBI structure 提供为研究蛋白质三维(3D) 结构集成的二个数据库: 分子模型数据库(MMDB),提供关于各种蛋白质的结构信息; 蛋白质域数据库(CDD),提供在proteins(CDs)内保存的功能领域序列和结构对准表达目录。 这两个数据库让科学家检索和观看结构,从结构上查找特定蛋

8、白质的相似蛋白质,并且辨认功能位点。3.NCBI structure 提供为研究蛋白质三维(Structure检索步骤第一步: 在Entrez sturcture检索栏中直接输入的检索词包括:PDB 代码, 蛋白质名字, 作者, 或期刊名。第二步: 通过Entrez 列阵搜寻,得出检索初步结果 。 也许出现多个指定的蛋白质存在的记录, 它们反映了不同的实验性技术情况, 并且出现或缺乏各种各样的配合基或金属离子。 记录也许包含全长分子的不同片段。另外,还有许多突变体蛋白质结构,用户要注意筛选。检索结果同时包含了 PDB记录,包括实验性描述, PDB 代码。Structure检索步骤第一步:第三步

9、:显示结构概略页 观察次要结构 Secondary Structure按钮对观看3D 分子的结构是有用的前奏 第四步:观看完整蛋白质结构按钮Full Protein Structures(须下载Cn3D软件) Viewing 3D Structures第三步:显示结构概略页 检索MMDB例:查找铁氧化还原蛋白的三维结构蛋白质代码:1doi铁氧化还原蛋白:ferredoxin fe检索MMDB例:查找铁氧化还原蛋白的三维结构进入NCBI STRUCTURE进入NCBI STRUCTURE1doi执行检索输入检索提问1doi执行检索输入检索提问Structure 记录蛋白质代码蛋白质描述:来自死海

10、古菌的铁氧化还原蛋白Structure 记录蛋白质代码蛋白质描述:来自死海古菌的Structure Summary蛋白质描述作者生物体分类名称参考文献显示3D结构下载显示软件蛋白质链栏。鼠标放在栏上,显示残基数。点击显示分子各条链、邻族结构。显示序列报告显示存储域Structure Summary蛋白质描述作者生物体分类名蛋白质链栏点击链接鼠标放在链栏上,界面显示残基号蛋白质链栏点击链接鼠标放在链栏上,界面显示残基号死海高盐环境下,生物体蛋白的适应结果,外周结构中有许多亲水键,更容易结合钾离子,中间红色部分为铁离子,他们的结合位点清晰可见。透视图选择旋转放映死海高盐环境下,生物体蛋白的适应结果

11、,外周结构中有许多亲水键4.NCBI基因组数据库GENOME美国国家生物技术信息中心 NCBI整合。Genome 数据库借助Entrez Map Viewer (图形显示器软件),让用户观看数据库内带有综合遗传和自然图的各种有机体基因组、全部染色体、序列集成数据。 4.NCBI基因组数据库GENOME美国国家生物技术信息中序列显示蛋白质库生物学证据 Viewer 模型制作同源基因基因命名数据库序列显示蛋白质库生物学证据 Viewer 模型制作同源基因基 5. OMIM Online Mendelian Inheritance in Man孟德尔遗传数据库由美国Johns Hopkins大学建立

12、。现也属NCBI集成系统中的一个库。它主要报道人类基因和遗传缺陷相关疾病的文字信息、图片和参考文献,被称为人类基因及其相关疾病与遗传特征的百科全书 5. OMIM 例: 查找与疾病相关的基因通过OMIM寻找疾病基因信息,通过染色体定位找到疾病基因。如:查找角化过度症(营养不良性神经病)Keratoderma,palmoplantar例: 查找与疾病相关的基因OMIM检索Keratoderma palmoplantar染色体位点OMIM检索Keratoderma palmoplantaOMIM检出结果OMIM检出结果OMIM 基因图谱OMIM 基因图谱生物分子数据库课件6. 引物设计所谓引物是指

13、在聚合反应中作为底物引发聚合产物的短的序列统称为引物。PCR反应中扩增一个已知序列DNA,对其引物须有一定的满足条件,才能有效地扩增模板序列,这些条件有:(1)引物长度为20个碱基;(2)引物序列与被扩增的序列不具有同源性;(3)引物中G+C碱基的含量以40%60%为宜等。设计满足PCR扩增条件的引物称为最佳引物设计。根据引物设计的条件,进行计算机的程序处理,便可以方便地进行自动引物设计。目前国际上有许多设计最佳引物的软件,有网上Web界面,也有单位发行的软件包,它们的功能各有特色,优点各异。 6. 引物设计所谓引物是指在聚合反应中作为底物引发聚合产物的探针和引物设计相关网站探针和引物设计相关

14、网站WHITEHEAD INSTITUTE primer3输入序列WHITEHEAD INSTITUTE primer3输入设定参数设定参数输出结果引物长度熔点起始序列数引物中碱基+c的比例引物起始处与寡合苷酸任意区域的互补指数引物与寡合苷酸3端的互补指数引物序列输出结果引物长度熔点起始序列数引物中碱基+c的比例引物起始处7.蛋白质结构预测7.蛋白质结构预测蛋白质预测的常用途径1. 从氨基酸组成辨识蛋白质 2. 预测蛋白质的物理性质 3. 蛋白质二级结构预测 4. 其他特殊局部结构 5. 蛋白质的三维结构 蛋白质预测的常用途径1. 从氨基酸组成辨识蛋白质 蛋白质的三维结构蛋白质的三维结构蛋白质

15、预测的成功范例 色氨酸笼 trp-cage nlyiqwlkdg gpssgrppps 由20个氨基酸构成,是华盛顿大学的Jonathan Neidigh制造的人造蛋白。 大部分小分子短链结构比较松散,这种蛋白质却像大分子蛋白质一样,具有紧凑、明确的结构。 Simmerling等人利用电脑模拟技术,根据一种蛋白质的基因编码,准确地预测了它是怎样折叠成三维结构的。预测结果,几乎完全符合华盛顿大学研究小组利用核磁共振技术测量出的这种“迷你”蛋白的形状。 蛋白质预测的成功范例 色氨酸笼 trp-cage nly色氨酸笼氨基酸序列:nlyiqwlkdg gpssgrppps 色氨酸笼蛋白质功能预测例:

16、对给定的未知功能的序列example预测其功能蛋白质功能预测例:对给定的未知功能的序列example预测其IntroPro 在domain的水平上对未知的序列进行注释IntroPro 在domain的水平上对未知的序列进行注释未知功能蛋白质序列MASVSFEQVTKQFDDYVAVNNLNLEIEDGEFLVFVGPSGCGKTTSLRLLAGLETVSQGQICIGDRRVNEL SPKDRDIAMVFQSYALYPHMSVYENMAFSLDLQGKPKEEIRQRVCSAAELLGIEKLLHRKPKELSGGQRQ RVAVGRAIVRKPSVFLMDEPLSNLDAMLRVQARKEISKLHSDLATTFIYVTHDQVEAMTMGDRIAVMKDG ILQQVDSPANLYNQPANLFVAGFIGSPAMNFFQVERLSQEGKEKLSLDGVVLPMPDSVAKNGDRPL

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论