版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章 生物信息学概述,郑珩 副教授什么是生物信息学?(what) 为什么要学习生物信息学?(why) 怎样学好这门课程?(how) 通过本课程学习,要达到什么要求,1.什么是生物信息学,信息是用符号、信号或消息所包含的内容,来直接或间接描述客观世界,生物信息,分子:,细胞,核酸,蛋白质,多糖,dna-遗传密码的携带者,引自neil campbell著biology第4版,1996,从基因组序列信息到基因功能,染色体,基因,蛋白质,功能,8,采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。
2、收集、加工、储存:计算机科学家 分析、解释:生物学家,生物信 息学,what is bioinformatics?,9,生物信息学: 研究对象:生物学(核酸蛋白质) 研究内容:数学模型;生物学范畴 研究工具:计算机科学(程序) 研究人员:计算机科学家 生物学家,10,生物信息学新兴的交叉学科,mathematical sciences,computer sciences,life sciences,2. why?,agcatcgaagttgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgatgcatgacc
3、tagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatga
4、cctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaa
5、gttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatga
6、cctagcaagttgcatgacgattgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgac
7、ctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagc
8、atcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatg
9、acgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagt,a c g t,hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromthe
10、ear,hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheear that this nation, under god, shall have a new birth of freedom; and that government of the people, by the people and for the people shall not perish f
11、rom the earth,agcatcgaagttgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgca
12、tgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatga
13、cgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgac
14、ctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctag
15、cagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatga
16、cctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatg
17、catgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagt,a c g t,15,人类基因组计划开始 (human genome project, h
18、gp) 人类基因组计划带来了 生物信息学。,第一节 生物信息学发展简史,16,曼哈顿原子弹计划,阿波罗登月计划,人类基因组计划,人类自然科学史上的 3 大计划,17,基因组(genome):包含细胞或生物体全套的遗传信息的全部 遗传物质。 细胞核基因组dna 细胞质(线粒体、叶绿体)基因组dna,人类基因组: 3.2109 bp,18,人类基因组计划准备用15年时间投入30亿美元,完成人全部24(22+x+y)条染色体中3.2109个碱基对的序列测定,主要任务包括做图(遗传图谱物理图谱以及转录图谱的绘制)、测序和基因识别,其根本任务是解读和破译生物体的生老病死以及与疾病相关的遗传信息。,19,
19、hgp的 历史回顾,1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组dna序列的意义 1985 dulbecco在science撰文 “肿瘤研究的转折点:人 类基因组的测序” 美国能源部(doe)提出“人类基因组计划”草案 1987 美国能源部和国家卫生研究院(nih)联合为“人类 基因组计划”下拨启动经费约550万美元 1989 美国成立“国家人类基因组研究中心”,watson担任 第一任主任 1990.10 经美国国会批准,人类基因组计划正式启动 1998.5 塞莱拉遗传公司成立,宣布3年内完成hgp,james watson,20,2000 celera公司宣布完成果蝇
20、基因组测序 国际公共领域宣布完成第一个植物基因组拟南芥全基 因组的测序工作 2001.2.15 nature刊文发表国际公共领域结果 2001.2.16 science刊文发表celera公司及其合作者结果,drosophila melanogaster 果蝇,arabidopsis thaliana 拟南芥,21,at the white house on june 26, francis collins (r), director of the national human genome research institute, president clinton, and j. craig
21、 venter, president of celara genomics, lauded the thousands of scientists who contributed to the genome sequence. 公共领域和celera公司同时宣布完成人类基因组工作草图,22,2001年2月15日nature封面,2001年2月16日science封面,23,我国对人类基因组计划的贡献,24,human,arabidopsis 拟南芥,thermotoga maritima,escherichia coli大肠杆菌,buchnerasp. aps,rickettsia prowa
22、zekii,ureaplasma urealyticum,bacillus subtilis,drosophila melanogaster,thermoplasma acidophilum,plasmodium falciparum,helicobacter pylori,mouse,caenorhabitis elegans,rat,borrelia burgorferi,borrelia burgorferi,aquifex aeolicus,neisseria meningitidis z2491,mycobacterium tuberculosis,1,000 1,000,000 1
23、,000,000,000 1,000,000,000,000 1,000,000,000,000,000 1,000,000,000,000,000,000 1,000,000,000,000,000,000,000 1,000,000,000,000,000,000,000,000,103 kilo 106 mega 109 giga 1012 tera 1015 peta 1018 exa 1021 zetta 1024 yotta, 100 tera-bytes (1014) / a typical gene lab / year all the words ever spoken by
24、 human beings account to about 5 exa-bytes (51018) soon using 1 zetta-bytes (1021) and 1 yotta-bytes (1024) 生物信息量至少是所有人类说过的话的200倍!,至2004年,国际数据库记录的核酸碱基数目已超过200亿!如果用传统的纸张来书写,以每个核苷酸作为一个字符,则需要印制2万本每本1000页每页1000字的书! 另外,二维凝胶电泳技术、测序质谱技术以及生物芯片技术的高速发展和广泛应用,也使得大量的数据信息已经无法用传统的文献形式发表,而更多的需以数据库形式,通过文字、图象、超链接等多种方
25、式来记录。,计算机工具的介入,30,生物分子信息的特征,生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系,31,生物信息学(bioinformatics) 这一名词的来由,八十年代末期,马来西亚的美籍学者林华安(hwa a. lim)认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“compbio”;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bio-in
26、formatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,名称中的-或/符号经常会引起许多问题,林博士于是将其去除, “bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。,32,bioinformatics,第二节 生物信息学的研究领域,基因组序列装配 基因识别 基因功能预报 基因多态性分析 基因进化 mrna结构预测 基因芯片设计 基因芯片数据分析 疾病相关基因分析,蛋白质序列分析 蛋白质家族分类 蛋白质结构预测 蛋白质折叠研究 代谢途径分析 转录调控机制 蛋白质芯片设计 蛋白质芯片数据分析 药物设计,(一)、核酸及基
27、因组信息 1、大规模核酸测序及拼接 2、基因识别与定位 3、基因相关的snp研究 4、非编码区信息结构分析 5、比较基因组学,一、生物学领域,35,1.大规模基因组测序,36,37,运用计算机软件进行序列拼接,2、基因识别与定位,3.基因相关的snp研究,single nucleotide polymorphisms (snp),是指在基因组上单个核苷酸的变异,一般而言,snp 是指变异频率大于1 %的单核苷酸变异,40,基因变异与疾病,4、非编码区信息结构分析,在微生物中,非编码区只占整个基因组序列的10%20;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中
28、,非编码序列超过95%,5、比较基因组学,比较基因组学(comparative genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。,(二)蛋白质及蛋白质组信息 1、蛋白质结构模拟 2、蛋白质功能预测 3、基因表达及蛋白质组信息学,44,蛋白质三维结构测定主要方法:x射线晶体结构分析、多维核磁共振(nmr)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,ec)等物理方法,difficult! expensive! too much time!,蛋白质结构及功能预测,蛋白质组研究,(三)、分子相互作用及代谢调控网络,对生
29、物功能的分析表明基因和蛋白质很少单独起作用,它们倾向于成组地通过网状的交互作用而影响生物系统的功能,分子相互作用信息和单个分子的信息一样重要。,48,结构与功能,信号网络 代谢途径,细胞重建,系统重建,基因组,基因,后基因组时代,单个基因的结构与功能 基因家族 代谢途径 基因组,(四)、生物进化的研究,序列相似性比较,生物信息数据库 数据库接口和检索工具的研制 新的算法和软件 1、多序列比较方法 2、序列拼接与分析 3、基因组大尺度作图和功能基因组分析方法 4、蛋白质结构和功能预测 5、生物大分子结构图形化显示 6、细胞代谢过程模拟 7、药物设计相关软件开发,二、在计算机领域,第三节 在药学领
30、域应用,一、初始阶段:信息收集 初步调研确定合适的药物作用靶 可行性分析:靶点结构、化合物信息,1、诊断类药物:生物芯片设计 遗传病:基因诊断 感染性疾病:抗体、基因芯片、pcr技术,二、药物设计:,53,病人 健康人,基因芯片诊断,及早治疗,对症下药,2、预防类药物: 计算机辅助疫苗设计 计算机预测抗原表位,epimmune imgt/hla database http:/www.ebi.ac.uk/imgt/hla hla sequence database .uk/hig epimatrix /re
31、search/tb-hiv_lab/epimatrix/epimatrix.html epipredict http:/www.epipredict.de,http:/www.jenner.ac.uk/mhcpred/,mhcpred,所谓基因组药物(genomic drug)是指利用基因序列数据,经生物信息学分析、高通过基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物 实际上利用了反向生物学的原理沿着从基因序列一蛋白质一功能一药物的途径研制新药,其优势是取自庞大的人类基因资源及其编码蛋白质做为原材料,具有巨大的开发潜力。,3、开发基因组药物,58,人类基因组约有10万左右的基因编码10万以上的蛋白质,其中至少5即5000以上的基因编码蛋白质可能具有药物开发前景而目前利用常规技术开发的人类重组蛋白质药物已上市的只有20多种,进入临床实验的只有100多种。,美国的人类基因组科学公司(hgs公司)。根据其1999年2月公布的消息,在功能基因组研究领域,hgs公司己发现95的人类cdna;克隆了9000个人类分泌蛋白质的全长cdna;发现了3000个基因的可能医学应用;发现了35个新的白细胞介素类分子和40个新的生长因子类分子;已有3个基因组药物进入临床。,4、寻找药物作用新靶点,基因组比较:抗微生物 同源性搜索 表达差异分析,理想的抗生素
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑幕墙工程防雷连接电阻测试方法选择原则制定方法选择原则
- 2026春学期小学部编版语文三年级下册期末复习课件
- 24小时动态血压监测方法及临床意义
- 2025-2026学年1.13近似数 华东师大版数学七年级上学期(课件)
- 家庭医学应激性溃疡护理要点
- 舞蹈课程设计模板
- 藏戏教学设计与实践路径
- 核医学科核素应用安全操作指导
- 小儿过敏性紫癜治疗
- 年度榜单设计
- 2025年幼儿园保育教育评估指南测试试卷与答案
- 大学系部管理办法
- 禁毒宣传进企业课件
- 雷斯丹一生健康
- 重庆市2025年高考真题化学试卷(含答案)
- 家长进课堂科学课件
- 江苏苏州2024~2025学年高二下册6月期末考试数学试题含解析
- DB1331∕T 054-2023 雄安新区建筑节能与绿色建筑工程施工质量验收标准
- 四川省江油市五校2025年七年级英语第二学期期末联考试题含答案
- 污水处理中菌藻共生系统的污染物去除机理及技术应用现状研究
- 湖北省武汉市2018年中考物理真题试卷(含答案)
评论
0/150
提交评论