版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学概述生物分子信息生物分子至少携带着三种信息遗传信息与功能相关得结构信息进化信息生物分子信息得特征生物分子信息数据量大生物分子信息复杂生物分子信息之间存在着密切得联系遗传信息得载体——DNA
遗传信息得载体主要就是DNA
控制生物体性状得基因就是一系列DNA片段生物体生长发育得本质就就是遗传信息得传递和表达DNA通过自我复制,在生物体得繁衍过程中传递遗传信息基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似得生物性状2025/2/213蛋白质RNA转录DNA翻译DNA前体RNAmRNA多肽链2025/2/21生命机器得执行者--蛋白质蛋白质功能取决于蛋白质得空间结构
蛋白质结构决定于蛋白质得序列(这就是目前基本共认得假设),蛋白质结构得信息隐含在蛋白质序列之中。2025/2/21DNA分子和蛋白质分子都含有进化信息通过比较相似得蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生得分子进化证据。通过比较来自于不同种属得同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间得系统发生关系,推测她们共同得祖先蛋白质。2025/2/216生物分子信息DNA序列数据
蛋白质序列数据
生物分子结构数据
生物分子功能数据
最基本直观复杂生物信息数据类型2025/2/21
DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功能最基本的生物信息维持生命活动的机器第一部遗传密码第二部遗传密码?生命体系千姿百态的变化生物分子数据及其关系2025/2/218第一部遗传密码已被破译,但对密码得转录过程还不清楚,对大多数DNA非编码区域得功能还知之甚少对于第二部密码,目前则只能用统计学得方法进行分析。破译“第二遗传密码”:即折叠密码(foldingcode),从蛋白质得一级结构得到立体结构,即可直接从基因推测其编码蛋白质所对应得生物学功能。破解折叠密码被列为“21世纪得生物学”得重要课题。生物分子数据就是宝藏,生物信息数据库就是金矿,等待我们去挖掘和利用2025/2/21Bioinformatics,生物+信息+学--新兴得交叉学科putersciencesMathematicalsciencesLifesciences二、生物信息学得概念定义一:生物信息学就是一门收集、分析遗传数据以及分发给研究机构得新学科(1987)定义二:生物信息学特指数据库类得工作,包括持久稳固得在一个稳定得地方提供对数据得支持(1994)定义三:采用信息科学技术,对各种生物信息(包括核酸、蛋白质等)得收集、加工、储存、分析、解释得一门学科。收集、加工、储存:计算机科学家分析、解释:生物学家大家有疑问的,可以询问和交流可以互相讨论下,但要小声点三、生物信息学发展简史(一)前基因组时代得生物信息学起源于20世纪70-80年代。这一阶段得主要成就包括核酸和蛋白质序列得初步分析、生物学数据库得建立以及检索工具得开发。例如Dayhoff得替换矩阵、Neelleman和Wunsch得序列比对及GenBank(由美国国立生物技术信息中心建立和维护得核酸与蛋白质序列数据库)等大型数据库得建立,形成了生物信息学得雏形。1967:Dayhoff研制出蛋白质序列图集,即后来著名得蛋白质信息源PIR;1970:Needleman和Wunsch提出了著名得序列比对算法,就是生物信息学发展中最重要得贡献;1978:Gingeras等人研制了核酸序列中酶切位点识别程序;1981:Doolittle提出了关于序列模式得概念;1986:日本核酸序列数据库DDBJ诞生;1986:蛋白质数据库SWISS-PROT诞生;1988:美国国家生物技术信息中心NCBI诞生;1988:成立欧洲分子生物学网络(EMBNet),EMBL数据库诞生(二)基因组时代得生物信息学以基因组计划得实施为标志得基因组时代(1990年至2001年)就是生物信息学成为一个较完整得新兴学科并得到高速发展得时期。这一时期生物信息学确立了自身得研究领域和学科特征,成为生命科学得热点学科和重要前沿领域之一。这一阶段得主要成就包括大分子序列以及表达序列标签(expressedsequencetag,EST)数据库得高速发展、BLAST(basiclocalalignmentsearchtool)和FASTA(fastalignment)等工具软件得研制和相应新算法得提出、基因得寻找与识别、电子克隆(insilicocloning)技术等,大大提高了管理和利用海量数据得能力。人类基因组计划开始(HumanGenomeProject,HGP)人类基因组计划带来了生物信息学20世纪90年代人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息得奥秘由美国NIH和能源部提出和带头,美、英、德、法、日、中共同参与得国际合作项目。完成人全部24(22+X+Y)条染色体中3、2×109个碱基对得序列测定,主要任务包括做图(遗传图谱、物理图谱以及转录图谱得绘制)、测序和基因识别,其根本任务就是解读和破译生物体得生老病死以及与疾病相关得遗传信息。18基因组(Genome):包含细胞或生物体全套得遗传信息得全部遗传物质
包括:细胞核基因组DNA细胞质(线粒体、叶绿体)基因组DNA
人类基因组:3、2×109bp曼哈顿原子弹计划阿波罗登月计划人类基因组计划人类自然科学史上得3大计划21AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ、CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence、222001年2月15日《Nature》封面2001年2月16日《Science》封面我国对人类基因组计划得贡献24humanArabidopsis拟南芥ThermotogamaritimaEscherichiacoli大肠杆菌Buchnerasp、APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis数据库中得蛋白质序列Swiss-prot:≈550,000条蛋白质序列29结构与功能信号网络代谢途径细胞重建系统重建基因组基因(三)后基因组时代得生物信息学四、生物信息学得研究领域基因组序列装配基因识别基因功能预报基因多态性分析基因进化mRNA结构预测基因芯片设计基因芯片数据分析疾病相关基因分析蛋白质序列分析蛋白质家族分类蛋白质结构预测蛋白质折叠研究代谢途径分析转录调控机制蛋白质芯片设计蛋白质芯片数据分析药物设计大规模核酸测序及拼接基因识别与定位基因相关得SNP研究非编码区信息结构分析比较基因组学(一)核酸及基因组信息大规模基因组测序33运用计算机软件进行序列拼接基因识别与定位
基因相关得SNP研究:
单核苷酸多态性(SingleNucleotidePolymorphisms,SNP):主要就是指在基因组水平上由单个核苷酸得变异所引起得DNA序列多态性。她就是人类可遗传得变异中最常见得一种。占所有已知多态性得90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。37SNP得研究意义寻找疾病相关得突变位点法医学研究器官移植中供体/受体配对分析
全基因组关联分析(Genome-wideassociationstudy,GWAS):就是指在人类全基因组范围内找出存在得序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关得SNPs
非编码区信息结构分析:基因表达调控分析在微生物中,非编码区只占整个基因组序列得10%-20%;但在高等生物和人类基因组中,非编码序列则占了基因组序列得绝大部分。在人得基因组中,非编码序列超过95%。非编码区有调控作用得核苷酸序列,包括位于编码区上游得RNA聚合酶结合位点。比较基因组学(parativeGenomics)就是基于基因组图谱和测序基础上,对已知得基因和基因组结构进行比较,来了解基因得功能、表达机理和物种进化得学科(二)蛋白质及蛋白质组信息蛋白质结构预测蛋白质功能预测基因表达及蛋白质组信息学蛋白质三维结构测定主要方法:X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法Difficult!Expensive!TooMuchTime!蛋白质结构及功能预测蛋白质组研究
蛋白质组(proteome):即包括一种细胞乃至一种生物所表达得全部蛋白质。蛋白质组本质上指得就是在大规模水平上研究蛋白质得特征,包括蛋白质得表达水平,翻译后得修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上得关于疾病发生,细胞代谢等过程得整体而全面得认识。
基因组数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROTPDBPIR(三)生物分子数据得收集与管理2025/2/21(四)数据库搜索及序列比较
搜索同源序列在一定程度上就就是通过序列比较寻找相似序列序列比较得一个基本操作就就是比对(Alignment),即将两个序列得各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果就是两个序列共有得排列顺序,这就是序列相似程度得一种定性描述多重序列比对研究得就是多个序列得共性。序列得多重比对可用来搜索基因组序列得功能区域,也可用于研究一组蛋白质之间得进化关系。
2025/2/2146发现同源分子2025/2/214748生物信息学和人类基因组计划为药物靶标得发现和新药得研制开创了新天地,未来得药物设计将就是基于生物信息学得知识挖掘得过程通过数据分析首先确立靶标分子预测蛋白质分子结构设计药物分子与靶标分子相互作用(五)在药学领域应用
所谓基因组药物(Genomicdrug)就是指利用基因序列数据,经生物信息学分析、高通量基因表达、高通量功能筛选和体内外药效研究开发得到得新药候选物、基于机理得药物发现:基因组药物实际上利用了反向生物学得原理、沿着从基因序列一蛋白质一功能一药物得途径研制新药,其优势就是取自庞大得人类基因资源及其编码蛋白质做为原材料,具有巨大得开发潜力。基因组药物人类基因组约有10万左右得基因、编码10万以上得蛋白质,其中至少5%即5000以上得基因编码蛋白质可能具有药物开发前景。大量基因特别就是疾病相关基因申请专利,如肥胖。
理想得抗生素靶标应为微生物细胞存活所必须,在病原体中高度保守,且在人体中不存在或与人类基因有根本差异诊断类药物设计:生物芯片设计遗传病:基因诊断(腺苷脱胺酶基因突变可引起重症联合免疫缺陷症(SCID);而淋巴细胞表面分子CD40或其配体(CD40L)基因突变则可引起无丙种球蛋白血症)感染性疾病癌症?
预防类药物设计:
计算机辅助疫苗设计计算机预测抗原表位计算机辅助药物设计(puter-AidedDrugDesign,CADD)就是近年来发展起来得研究与开发新
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天文望远镜之科技议论文12篇
- 货物质量异议回复函(3篇)范文
- 项目延期完成汇报函4篇
- 形如函数y^2=x+1的图像示意图画法步骤详解B7
- 确认合作双方合同签订流程细节商洽函(6篇)范文
- 2026年吉林省和龙市高一历史下册期末考试模拟卷及完整答案(有一套)
- 2025年四川省万源市高一历史上册期末考试试卷附答案【基础题】
- 2025年辽宁省新民市高三历史下册期末考试模拟卷附参考答案(A卷)
- 2026年湖南省资兴市高二历史下册期末考试模拟卷附答案(模拟题)
- 2025年福建省石狮市高二历史上册期末考试检测卷1套附答案
- 2026首都师范大学附属育新学校招聘5人笔试参考题库及答案解析
- 安徽省合肥市一中2025-2026年高三下5月月考最后一卷语文试卷(含答案)
- 天门市2025年湖北天门市事业单位统一公开招聘工作人员154人笔试历年参考题库典型考点附带答案详解
- 2026人教版PEP小学英语六年级毕业知识点分类总复习资料
- 高中生禁毒教育主题班会教学课件
- 2024年宁夏盐池县就业创业和人才服务局事业单位招聘历年(高频重点复习提升训练)共500题附带答案详解
- DL-T5160-2015电力工程岩土描述技术规程
- 矿山井架设计规范
- 《学前教育学》2022-2023期末试题及答案
- 中小学班主任工作手册(修订)
- 临汾市尧都区屯里镇社区工作者考试真题2022
评论
0/150
提交评论