




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 生物信息学Bioinformatics孙丽丹2014 11 27 2 一 引言二 生物信息学及其发展历史三 生物信息学基础四 生物信息学主要研究内容五 生物信息学当前的主要任务 内容 3 引言 引言 4 曼哈顿原子弹计划 阿波罗登月计划 人类基因组计划 人类自然科学史上的大计划 3 引言 5 基因组计划带来的科学挑战 随着实验数据和可利用信息急剧增加 信息的管理和分析成为基因组计划的一项重要的工作1 信息的整合2 信息的储存3 信息的比较4 信息的分析5 信息的分解 基因组学 功能基因组学 引言 6 这些过程都需要生物信息学的帮助 引言 人类基因组计划带来了 生物信息学 7 生物信息学的应用 医学 引言 新药物设计基因芯片疾病快速诊断流行病学研究 SARS人类基因组计划寄生虫基因组计划 8 病人 健康人 基因芯片诊断 及早治疗 对症下药 引言 9 此外 生物信息学和人类基因组计划为药物靶标的发现和新药的研制开创了新天地 未来的药物设计将是基于生物信息学的知识挖掘的过程 通过数据分析首先确立靶标分子 预测蛋白质分子结构 设计药物分子与靶标分子相互作用 10 生物信息学及其发展历史 11 生物信息学 Bioinformatics 这一名词的来由 八十年代末期 马来西亚的美籍学者林华安 HwaA Lim 认识到将计算机科学与生物学结合起来的重要意义 开始留意要为这一领域构思一个合适的名称 CompBio bioinformatique bio informatics 或bio informatics bioinformatics 12 生物信息学 新兴的交叉学科 Mathematicalsciences Computersciences Lifesciences 13 So 生物信息学是一门交叉学科 它包含了生物信息的获取 处理 存储 分发 分析和解释等在内的所有方面 它综合运用数学 计算机科学和生物学的各种工具 来阐明和理解大量数据所包含的生物学意义 美国人类基因组计划第一个五年总结报告 1995 采用信息科学技术 借助数学 生物学的理论 方法 对各种生物信息的收集 加工 储存 分析 解释的一门学科 收集 加工 储存 计算机科学家分析 解释 生物学家 生物信息学 14 生物信息学基本思想的产生 生物信息学的迅速发展 二十世纪50年代 二十世纪80 90年代 生物科学和技术的发展 人类基因组计划的推动 生物信息学的发展历史 15 20世纪50年代 生物信息学开始孕育20世纪60年代 生物分子信息在概念上将计算生物学和计算机科学联系起来20世纪70年代 生物信息学的真正开端 序列比对算法 20世纪80年代初期 生物信息分析方法的发展20世纪80年代以后 生物信息服务机构和数据库20世纪90年代后 HGP促进生物信息学的迅速发展 生物信息学的发展历史 16 生物信息学基础 17 生物学基础 生物学背景 分子生物学细胞生物学发育生物学生物化学 分子生物学 核酸的结构 蛋白质的结构 DNA的复制 基因的转录 蛋白质的生物合成 18 计算机基础 数据库技术 关系数据库网络基础 基于web的数据库系统操作系统 windows Unix Linux计算机编程语言 JAVA Perl Python PHP MySQL 19 数学基础 算法图论动态规划贝叶斯统计马尔可夫模型隐马尔可夫模型神经网络模型遗传算法聚类分析支持向量机 20 生物信息学主要研究内容 21 生物信息学主要研究内容 1 生物分子数据的收集与管理2 数据库搜索及序列比较3 基因组序列分析4 基因表达数据的分析与处理5 生物大分子结构预测 22 通过本门课程的学习 我们将能够 学会搜索各种生物信息学资源 能够利用各种工具搜索核酸 蛋白质数据库 能够对未知基因及其产物进行初步的生物信息学分析 能够利用数据库进行序列的拼接和电子克隆 能够进行系统发育树的构建和分析 能够掌握基因组和蛋白质组分析的基础 了解生物信息学的一般概念和基本算法 初步设计本地化的的生物信息学分析软件 学习目标 引言 23 生物信息的收集与管理 24 生物信息学主要研究的信息载体DNA RNA分子蛋白质分子 25 DNA核酸序列 蛋白质氨基酸序列 蛋白质结构 蛋白质功能 最基本的生物信息 维持生命活动的机器 第一部遗传密码 第二部遗传密码 生命体系千姿百态的变化 生物分子数据及其关系 蛋白质结构决定功能 26 生物分子信息的特征 生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切的联系 27 生物信息学数据库资源 模式生物测序3大核酸数据库蛋白质数据库 28 生物信息学数据库资源 模式生物测序 29 模式生物基因组计划 模式生物基因组计划酵母 线虫 果蝇 细菌 拟南芥等共约50多种已完成 70余种正在进行 目前总量已达60亿碱基对 30 生物信息学数据库资源 三大核酸数据库 31 三大基因数据库 GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列 以及与它们相关的文献著作和生物学注释 它是由美国国立生物技术信息中心 NCBI 建立和维护的 NCBI的网址是 http www ncbi nlm nih gov EMBL核酸序列数据库由欧洲生物信息学研究所 EBI 维护的核酸序列数据构成 查询检索可以通过因特网上的序列提取系统 SRS 服务完成 数据库网址是 http www ebi ac uk embl DDBJ数据库日本DNA数据仓库 DDBJ 也是一个全面的核酸序列数据库 与Genbank和EMBL核酸库合作交换数据 使用其主页上提供的SRS工具进行数据检索和序列分析 DDBJ的网址是 http www ddbj nig ac jp 32 三大基因数据库之间的关系 33 生物信息学数据库资源 蛋白质数据库 34 蛋白质序列数据库 PIRPIR是一个全面的蛋白质序列数据库 它是由美国生物医学基金会NBRF 日本的国际蛋白质信息数据库JIPID和德国的慕尼黑蛋白质序列信息中心MIPS合作建立和维护的 PIR的网址是 http pir georgetown edu SwissProt该数据库由瑞士日内瓦大学于1986年创建 目前由瑞士生物信息学研究所和欧洲生物信息学研究所EBI共同维护和管理 数据库网址是 http www uniprot org 35 蛋白质结构数据库 PDBPDB是目前最主要的蛋白质分子结构数据库 目前由美国RCSB管理 以文本格式存放数据 包括原子坐标 物种来源 测定方法 提交者信息 一级结构 二级结构等 PDB的网址是 http www rcsb org pdb 36 基因组数据库 蛋白质序列数据库 蛋白质结构数据库 DDBJ EMBL GenBank PIR PDB SWISS PROT 生物分子数据的存储与获取 数据库 搜索 37 基因组序列分析 38 什么是序列分析 拿到一个基因 蛋白质序列 我能做什么 39 在数据库中进行序列相似性搜索序列组成 分子量 等电点 初级分析酶切位点分析 载体构建 基因结构分析 启动子序列分析Motif的寻找与序列的模式识别 含跨膜区的预测等 亚细胞定位功能域 domain 预测 序列分析的内容 为了功能的分析 40 序列比对 序列比对两个序列的比对是指这两个序列中各个字符的一种一一对应关系 或字符的对比排列 分类 双比对 全局比对 局部比对 多序列比对 AAGCTTAACGTAATCTTAACGT 41 序列比对 序列比对两个序列的比对是指这两个序列中各个字符的一种一一对应关系 或字符的对比排列 分类 双比对 全局比对 局部比对 多序列比对 AAGCTTAACGTAATCTTAACGT 几个重要的概念 相似性 一致性 同源性 42 序列的相似性 相似性 similarity 是指一种很直接的数量关系 比如说 A序列和B序列的相似性是80 或者4 5 这是个量化的关系 一致性 identity 两个蛋白质有一定数量的氨基酸在排比的位点上是相同的 即如果38个氨基酸的蛋白质中15个位点相同 我们说它们一致性为39 4 MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG PRNGTIKIYENPARTFTRPYSAKNITIYKEND 43 所以 相似性的数值一定比一致性的要 大or相等or小 44 同源性 homology 指从一些数据中推断出的两个基因或蛋白质序列具有共同祖先的结论 属于质的判断 就是说A和B的关系上 只有是同源序列 或者非同源序列两种关系 而说A和B的同源性为80 都是不科学的 生物序列的同源性 45 相似性和同源性关系 一般来说 序列间的相似性越高的话 它们是同源序列的可能性就更高 注意不要等价混用这两个名词 A序列和B序列的同源性为80 记住这种说法是错误的 46 主要的blast程序 47 Blastn1的作用 对于已知的基因 可以分析其相似基因 对于未知的基因片段 可以分析其属于什么基因 Blastn2的作用 对于新基因 可以了解基因的结构特征 5 UTR和3 UTR的大小 Blastp的作用 对于已知的蛋白 可以分析其相似蛋白 对于未知的蛋白片段 可以分析其属于什么蛋白 Blastx 分析你的基因编码什么产物 分析你的基因是否是新基因 tBLASTn的作用 已知一种蛋白序列 在另一物种中进行其同源蛋白基因的电子克隆 insilicocloning 寻找一个新的蛋白质序列 如双向电泳得到的 是否已有核酸序列 是否可以克隆 48 基因表达数据分析与处理 49 基因芯片 应用 测序 表达谱分析 基因表达差异分析 50 生物信息学和基因芯片 生物信息学 基因芯片 促进 丰富 提取什么信息如何提取信息如何处理和利用信息 确定芯片检测目标芯片设计数据管理与分析 51 生物信息学在基因芯片中的应用 提取什么信息如何提取信息如何处理和利用信息 确定芯片检测目标芯片设计数据管理与分析 52 生物大分子结构预测 53 蛋白质结构预测 蛋白质的生物功能由蛋白质的结构所决定 蛋白质结构预测成为了解蛋白质功能的重要途径蛋白质结构预测分为 二级结构预测空间结构预测 蛋白质折叠 54 复杂结构分析 X射线晶体结构分析 多维核磁共振 NMR 波谱分析和电子显微镜二维晶体三维重构 电子晶体学 EC 等物理方法 Difficult
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年南平延拓文旅集团幼儿园保育员招聘若干人笔试参考题库附答案解析
- 2025云南省文山州八布乡人民政府招聘联防所联防员(4人)笔试参考题库附答案解析
- 2025云南昭通市大关县机关事务服务中心招聘公益性岗位人员2人笔试备考题库及答案解析
- 2025云南省投资控股集团有限公司集中招聘98人考试模拟试题及答案解析
- 2025上海华东师范大学社会主义历史与文献研究院图书资料专业技术人员招聘笔试参考题库附答案解析
- 2025福建泉州市晋江市首峰中学招聘笔试参考题库附答案解析
- 2025浙江宁波象山县商贸集团有限公司第三期招聘工作人员2人笔试参考题库附答案解析
- 2025浙江杭州上城资本私募基金管理有限公司招聘1人考试模拟试题及答案解析
- 2025年甘肃省平凉市静宁县西岭幼儿园教育集团总园招聘考试参考题库附答案解析
- 若尔盖县2025年医疗卫生辅助岗招募(6人)考试备考题库及答案解析
- 制造业班组长培训
- 研发项目策划书
- 创作属于自己的国画作品
- 烟草行业基础知识培训课件
- 《花生膜下滴灌技术》课件
- 2024年江苏高科技投资集团有限公司招聘笔试参考题库含答案解析
- 办公室文员员工职责
- 完整版江苏省政府采购专家库入库考试题库(1-4套卷)
- 飞机基础知识-飞机机型分类
- 样品不合格分析及改良流程图
- 小学三年级上册《健康成长》全册教案教学设计
评论
0/150
提交评论