




已阅读5页,还剩75页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章生物信息学概述 郑珩副教授中国药科大学生物信息学教研室zhengh18什么是生物信息学 What 为什么要学习生物信息学 Why 怎样学好这门课程 How 通过本课程学习 要达到什么要求 1 什么是生物信息学 信息是用符号 信号或消息所包含的内容 来直接或间接描述客观世界 生物信息 分子 细胞 核酸 蛋白质 多糖 DNA 遗传密码的携带者 引自NeilCampbell著Biology第4版 1996 从基因组序列信息到基因功能 染色体 基因 蛋白质 功能 8 采用信息科学技术 借助数学 生物学的理论 方法 对各种生物信息 包括核酸 蛋白质等 的收集 加工 储存 分析 解释的一门学科 收集 加工 储存 计算机科学家分析 解释 生物学家 生物信息学 Whatisbioinformatics 9 生物信息学 研究对象 生物学 核酸 蛋白质 研究内容 数学模型 生物学范畴研究工具 计算机科学 程序 研究人员 计算机科学家生物学家 10 生物信息学 新兴的交叉学科 Mathematicalsciences Computersciences Lifesciences 2 Why AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGT ACGT hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheear hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheearthatthisNation underGOD shallhaveanewbirthoffreedom andthatgovernmentofthePeople bythePeopleandforthePeopleshallnotperishfromtheearth AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGT ACGT 15 人类基因组计划开始 HumanGenomeProject HGP 人类基因组计划带来了生物信息学 第一节生物信息学发展简史 16 曼哈顿原子弹计划 阿波罗登月计划 人类基因组计划 人类自然科学史上的3大计划 17 基因组 Genome 包含细胞或生物体全套的遗传信息的全部遗传物质 细胞核基因组DNA细胞质 线粒体 叶绿体 基因组DNA 人类基因组 3 2 109bp 18 人类基因组计划准备用15年时间投入30亿美元 完成人全部24 22 X Y 条染色体中3 2 109个碱基对的序列测定 主要任务包括做图 遗传图谱 物理图谱以及转录图谱的绘制 测序和基因识别 其根本任务是解读和破译生物体的生老病死以及与疾病相关的遗传信息 19 HGP的历史回顾 1984 12犹他州阿尔塔组织会议 初步研讨测定人类整个基因组DNA序列的意义1985Dulbecco在 Science 撰文 肿瘤研究的转折点 人类基因组的测序 美国能源部 DOE 提出 人类基因组计划 草案1987美国能源部和国家卫生研究院 NIH 联合为 人类基因组计划 下拨启动经费约550万美元1989美国成立 国家人类基因组研究中心 Watson担任第一任主任1990 10经美国国会批准 人类基因组计划正式启动1998 5塞莱拉遗传公司成立 宣布3年内完成HGP JamesWatson 20 2000Celera公司宣布完成果蝇基因组测序国际公共领域宣布完成第一个植物基因组 拟南芥全基因组的测序工作2001 2 15 Nature 刊文发表国际公共领域结果2001 2 16 Science 刊文发表Celera公司及其合作者结果 Drosophilamelanogaster果蝇 Arabidopsisthaliana拟南芥 21 AttheWhiteHouseonJune26 FrancisCollins r DirectoroftheNationalHumanGenomeResearchInstitute PresidentClinton andJ CraigVenter PresidentofCelaraGenomics laudedthethousandsofscientistswhocontributedtothegenomesequence 公共领域和Celera公司同时宣布完成人类基因组工作草图 22 2001年2月15日 Nature 封面 2001年2月16日 Science 封面 23 我国对人类基因组计划的贡献 24 human Arabidopsis拟南芥 Thermotogamaritima Escherichiacoli大肠杆菌 Buchnerasp APS Rickettsiaprowazekii Ureaplasmaurealyticum Bacillussubtilis Drosophilamelanogaster Thermoplasmaacidophilum Plasmodiumfalciparum Helicobacterpylori mouse Caenorhabitiselegans rat Borreliaburgorferi Borreliaburgorferi Aquifexaeolicus NeisseriameningitidisZ2491 Mycobacteriumtuberculosis 1 0001 000 0001 000 000 0001 000 000 000 0001 000 000 000 000 0001 000 000 000 000 000 0001 000 000 000 000 000 000 0001 000 000 000 000 000 000 000 000 103Kilo106Mega109Giga1012Tera1015Peta1018Exa1021Zetta1024Yotta 100Tera bytes 1014 atypicalgenelab year Allthewordseverspokenbyhumanbeingsaccounttoabout5exa bytes 5 1018 Soonusing1zetta bytes 1021 and1yotta bytes 1024 生物信息量至少是所有人类说过的话的200倍 至2004年 国际数据库记录的核酸碱基数目已超过200亿 如果用传统的纸张来书写 以每个核苷酸作为一个字符 则需要印制2万本每本1000页每页1000字的书 另外 二维凝胶电泳技术 测序质谱技术以及生物芯片技术的高速发展和广泛应用 也使得大量的数据信息已经无法用传统的文献形式发表 而更多的需以数据库形式 通过文字 图象 超链接等多种方式来记录 计算机工具的介入 30 生物分子信息的特征 生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切的联系 31 生物信息学 Bioinformatics 这一名词的来由 八十年代末期 马来西亚的美籍学者林华安 HwaA Lim 认识到将计算机科学与生物学结合起来的重要意义 开始留意要为这一领域构思一个合适的名称 起初 考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系 他使用的是 CompBio 之后 又将其更改为兼具法国风情的 bioinformatique 看起来似乎有些古怪 因此不久 他便进一步把它更改为 bio informatics 或bio informatics 但由于当时的电子邮件系统与今日不同 名称中的 或 符号经常会引起许多问题 林博士于是将其去除 bioinformatics 就正式诞生了 林博士也因此赢得了 生物信息学之父 的美誉 32 Bioinformatics 第二节生物信息学的研究领域 基因组序列装配基因识别基因功能预报基因多态性分析基因进化mRNA结构预测基因芯片设计基因芯片数据分析疾病相关基因分析 蛋白质序列分析蛋白质家族分类蛋白质结构预测蛋白质折叠研究代谢途径分析转录调控机制蛋白质芯片设计蛋白质芯片数据分析药物设计 一 核酸及基因组信息1 大规模核酸测序及拼接2 基因识别与定位3 基因相关的SNP研究4 非编码区信息结构分析5 比较基因组学 一 生物学领域 35 1 大规模基因组测序 36 37 运用计算机软件进行序列拼接 2 基因识别与定位 3 基因相关的SNP研究 SingleNucleotidePolymorphisms SNP 是指在基因组上单个核苷酸的变异 一般而言 SNP是指变异频率大于1 的单核苷酸变异 40 基因变异与疾病 4 非编码区信息结构分析 在微生物中 非编码区只占整个基因组序列的10 20 但在高等生物和人类基因组中 非编码序列则占了基因组序列的绝大部分 在人的基因组中 非编码序列超过95 5 比较基因组学 比较基因组学 ComparativeGenomics 是基于基因组图谱和测序基础上 对已知的基因和基因组结构进行比较 来了解基因的功能 表达机理和物种进化的学科 二 蛋白质及蛋白质组信息1 蛋白质结构模拟2 蛋白质功能预测3 基因表达及蛋白质组信息学 44 蛋白质三维结构测定主要方法 X射线晶体结构分析 多维核磁共振 NMR 波谱分析和电子显微镜二维晶体三维重构 电子晶体学 EC 等物理方法 Difficult Expensive TooMuchTime 蛋白质结构及功能预测 蛋白质组研究 三 分子相互作用及代谢调控网络 对生物功能的分析表明基因和蛋白质很少单独起作用 它们倾向于成组地通过网状的交互作用而影响生物系统的功能 分子相互作用信息和单个分子的信息一样重要 48 结构与功能 信号网络代谢途径 细胞重建 系统重建 基因组 基因 后基因组时代 单个基因的结构与功能基因家族代谢途径基因组 四 生物进化的研究 序列相似性比较 生物信息数据库数据库接口和检索工具的研制新的算法和软件1 多序列比较方法2 序列拼接与分析3 基因组大尺度作图和功能基因组分析方法4 蛋白质结构和功能预测5 生物大分子结构图形化显示6 细胞代谢过程模拟7 药物设计相关软件开发 二 在计算机领域 第三节在药学领域应用 一 初始阶段 信息收集初步调研确定合适的药物作用靶可行性分析 靶点结构 化合物信息 1 诊断类药物 生物芯片设计遗传病 基因诊断感染性疾病 抗体 基因芯片 PCR技术 二 药物设计 53 病人 健康人 基因芯片诊断 及早治疗 对症下药 2 预防类药物 计算机辅助疫苗设计计算机预测抗原表位 EPIMMUNEIMGT HLADatabasehttp www ebi ac uk imgt hlaHLASequenceDatabasehttp www anthonynolan org uk HIGEpiMatrixhttp www brown edu Research TB HIV Lab epimatrix epimatrix htmlEPIPREDICThttp www epipredict de http www jenner ac uk MHCPred MHCPred 所谓基因组药物 Genomicdrug 是指利用基因序列数据 经生物信息学分析 高通过基因表达 高通量功能筛选和体内外药效研究开发得到的新药候选物 实际上利用了反向生物学的原理 沿着从基因序列一蛋白质一功能一药物的途径研制新药 其优势是取自庞大的人类基因资源及其编码蛋白质做为原材料 具有巨大的开发潜力 3 开发基因组药物 58 人类基因组约有10万左右的基因 编码10万以上的蛋白质 其中至少5 即5000以上的基因编码蛋白质可能具有药物开发前景 而目前利用常规技术开发的人类重组蛋白质药物已上市的只有20多种 进入临床实验的只有100多种 美国的人类基因组科学公司 HGS公司 根据其1999年2月公布的消息 在功能基因组研究领域 HGS公司己发现95 的人类cDNA 克隆了9000个人类分泌蛋白质的全长cDNA 发现了3000个基因的可能医学应用 发现了35个新的白细胞介素类分子和40个新的生长因子类分子 已有3个基因组药物进入临床 4 寻找药物作用新靶点 基因组比较 抗微生物同源性搜索表达差异分析 理想的抗生素靶标应为微生物细胞存活所必须 在病原
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 申请参加航模社团申请书
- 救济粮申请书
- 2025常用汽车抵押合同范本
- 2025【合同范本】市区两层楼房出售合同
- 住宿舍申请书
- 房产抵押登记申请书
- 天然气开户申请书
- 2025年危化品试题库(附答案)
- 创业者协会申请书
- 2025年GCP考试题库带答案(a卷)
- GB 14536.9-1996家用和类似用途电自动控制器电动水阀的特殊要求(包括机械要求)
- 《百团大战》历史课件
- 尿培养标本的留取规范及临床意义课件
- 名贵药材-三七课件
- 国学《弟子规》 课件
- 中山大学2019级本科培养方案修订说明
- 股骨干骨折的护理查房课件
- 六年级上册美术课件-5.蔬菜的联想 |苏少版 (共65张PPT)
- (完整)脑瘫儿童康复评估量表
- 2023新版南农《美学与大学生艺术素养》整理
- 燕窝知识讲解燕窝品鉴会
评论
0/150
提交评论