版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,生物信息学及其应用,2,3,生物信息学的概念 1,生物信息学所研究的材料是生物学的数据,进行研究的方法是从各种计算技术衍生而来 (Benton,1996) .,4,生物信息学的概念2,生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、存储、传递、检索、分析和解读的科学,是现代生命科学与计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科,5,生物信息学的产生背景,生物信息学产生和发展的推动因素 人类基因组计划() 信息技术的大规模应用 生物医药的迅速发展及其经济的需求,6,7,元素周期表的发现奠定了二十世纪物理、化学研究和发展的基础,“基因组序
2、列图”奠定二十一世纪生命科学研究和生物产业发展的基础!,“基因组”-生命科学的“元素周期表”,人体解剖图奠定了现代医学发展的基础,8,G,4 Cards,9,生物信息学发展阶段,前基因组时代 基因组时代 后基因组时代,10,生物信息学的发展趋势,发现新基因和新的单核苷酸多态性 基因组中非编码蛋白质区域 在基因组水平研究生物进化 完整基因组的比较研究 从功能基因组到系统生物学 蛋白质结构模拟与药物设计,11,12,生物信息学在分子生物技术中的应用,双序列比对 多序列比对 序列分析 分子进化 表达序列分析 基因芯片数据分析 基因注释与功能分析 蛋白质及蛋白质组分析 蛋白结构分析与预测,转录调控信息
3、分析 生物分子网络 单核苷酸多态与人类疾病 MicroRNA与复杂疾病 计算表观遗传学 人类复杂疾病与计算系统生物学,13,生物信息与精准医学,精准医学是一种考虑基因、个体差异、生活方式和环境的促进健康和治疗疾病的新方法,是基于患者的基因、生理和病理特征来定制治疗方案,是更精确的个性化医学。,14,精准医学线路图,15,16,癌症精准化医疗,17,肿瘤个体化诊疗的全平台建设,病情咨询 样本采集 基因检测,数据解读 临床应用,18,数据库是生物信息学重要的工作平台,19,核酸研究(NAR)上收录的2000-2009年生物数据库数量增长趋势,20,21,生物信息学数据库特点,数据库数量增长迅速 数
4、据库内部结构日趋复杂 数据库与用户之间构建交互通道 数据库提供更新数据和分析工具,专业性更强 数据库之间的交叉链接构成信息化网络,22,全球生物学数据库,Nucleotide Sequence Databases RNA sequence databases Protein sequence databases Structure Databases Genomics Databases (non-vertebrate) Metabolic and Signaling Pathways Human and other Vertebrate Genomes Human Genes and Dis
5、eases,23,Microarray Data and other Gene Expression Databases Proteomics Resources Other Molecular Biology Databases Organelle databases Plant databases Immunological databases Cell biology,24,如何查找最新的数据库,25,26,27,数据库分类,基因组数据库 人类基因组数据库 各种模式生物基因组数据库 核酸和蛋白质一级结构序列数据库 生物大分子三维空间结构数据库 由以上三类数据库和文献资料为基础的二次数据库
6、,一次数据库,28,一次数据库,基因组数据库-来自基因组作图 序列数据库-来自序列测定 (表达数据) 结构数据库-来自X-衍射和核磁共振结构测定 也称基本数据库、初始数据库,29,二次数据库,根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建具有特殊生物学意义和专门用途的二次数据库,是数据库开发的有效途径。 也称专门数据库、专业数据库、专用数据库、复合数据库,30,特点比较,一次数据库的数据量大,更新速度快,用户面广,通常需要高性能的计算机硬件、大容量的磁盘空间和专门的数据库管理系统支撑。 二次数据库的容量则要小得多,更
7、新速度也不象一次数据库那样快,也可以不用大型商业数据库软件支撑。,31,基因组数据库,基因组数据库是分子生物信息数据库的重要组成部分,主要包括人以及鼠、河豚鱼、拟南芥、水稻、线虫、果蝇、酵母、大肠杆菌等各种模式生物。 GDB-人类基因组数据库 AceDB-线虫基因组数据库http:/sanger.ac.uk,32,模式生物,基因组计划研究中具有代表性的 若干种生物,如小鼠、线虫、酿酒酵母、大肠杆菌等。 通过模式生物的研究,可以了解相关的其他生物的特征。,33,human,Arabidopsis 拟南芥,Thermotoga maritima,Escheric
8、hia coli大肠杆菌,Buchnerasp. APS,Rickettsia prowazekii,Ureaplasma urealyticum,Bacillus subtilis,Drosophila melanogaster,Thermoplasma acidophilum,Plasmodium falciparum,Helicobacter pylori,mouse,Caenorhabitis elegans,rat,Borrelia burgorferi,Borrelia burgorferi,Aquifex aeolicus,Neisseria meningitidis Z2491
9、,Mycobacterium tuberculosis,模式生物,34,序列数据库,核酸序列数据库 EMBL (Europe molecular biology laboratory http:/ebi.ac.uk/embl) GENBANK (NCBI ) DDBJ (DNA Data Bank of Japan http:/ddbj.nig.ac.jp ),35,36,37,蛋白质序列数据库 PIR ( protein info.resource ) SWISS-PROT http:/www
10、.expasy.ch,38,结构数据库,蛋白质结构数据库 PDB 通过X射线晶体衍射和NMR测定的结构数据 (),39,40,蛋白质结构分类数据库SCOP-将蛋白质按传统分类方法分成型、型 、/型、 +型、多结构域蛋白、膜蛋白和细胞表面蛋白、小蛋白等七大类。CATH-将蛋白质分为主类、 主类、 -类、低二级结构类(二级结构成分含量很低的蛋白质分子),41,二次数据库,基因组二次数据库 蛋白质序列二次数据库 蛋白质结构二次数据库,42,二次数据库,以核酸数据库为基础构建的二次数据库有基因调控转录因子数据库TransFac,真核生物启动子数据库EPD,克隆载体数
11、据库Vector,密码子使用表数据库CUTG等。,43,以蛋白质序列数据库为基础构建的二次数据库有蛋白质功能位点数据库Prosite,蛋白质功能位点序列片段数据库Prints,同源蛋白家族数据库Pfam,同源蛋白结构域数据库Blocks。,44,二次数据库,以具有特殊功能的蛋白为基础构建的有免疫球蛋白数据库Kabat,蛋白激酶数据库PKinase等。 以三维结构原子坐标为基础构建的数据库为结构分子生物学研究提供了有效的工具,如蛋白质二级结构构象参数数据库DSSP,已知空间结构的蛋白质家族数据库FSSP,已知空间结构的蛋白质及其同源蛋白数据库HSSP等。,45,蛋白质回环分类数据库则是用于蛋白质
12、结构、功能和分子设计研究的专门数据库。 此外,酶、限制性内切酶、辐射杂交、氨基酸特性表、序列分析文献等,也属于二次数据库或专门数据库。,46,综合数据库国家基因库CNGB,47,The Cancer Genome Atlas (TCGA,/tcga)与癌症的发生和发展相关的分子突变图谱 European Genome-phenome Archive (EGA,https:/ega.crg.eu)多种测序以及分型数据,如基因组关联分析、分子诊断 Cancer Genome Anatomy Project (CGAP,http:/cgap.nc
13、)收集了正常组织、前癌组织以及癌细胞的基因表达水平,以期改善癌症的检测、诊断以及病患治疗,肿瘤生物信息学数据库,48,数据库专业组织,生物数据库已成为生物信息学重要的工作平台 由世界上知名的生物信息机构组织维护和开发,49,50,国际著名的生物信息中心,NCBI- National Center for Biotechnology Information (US) EBI -European Bioinformatics Institute (EU) HGMP- Human Genome Mapping Project Resource Centre (UK ) ExPASy
14、- Expert of Protein Analysis System (Switzerland ) CMBI- Centre of Molecular and Biomolecule (The Netherlands),51,ExPASy 网络资源 /,52,国内部分生物信息学服务器,北京大学生物信息中心 中国生物信息 / 华大基因 中国科学院微生物研究所 天津大学生物信息中心 中科院计算所智能信息处理重点实验室生物信息学研究组 中国科学院基因组信息学中心 ,53,54,上海中国生物信息中心 http:/www.
15、/,55,NCBI-为分子生物学数据库及软件提供国际化的信息资源,其中包括人类基因工程,并且为计算生物学的研究以及生物医学信息的传播服务。 NCBI 已经帮助建立了一些新的数据库,这些数据库可以将已有的分子生物学数据库联合起来,以此来增强它们的功能,并且研发这些数据库之间的联接。 NCBI于1992年承担了GenBank DNA序列数据库。,56,57,NCBI科研人员组成,58,NCBI结构组成图,NCBI,59,60,以NCBI为例,61,62,数据库资源概览,63,64,65,66,67,单一信息查询 在某一个数据库中进行一类信息查询(序列、结构、文献等) 多信息查
16、询 同时在多个数据库中进行信息查询(核酸,蛋白,结构,高通量数据库等) 综合信息查询 在一个数据库中查询相关的多种信息(GENE 、GEO等),数据库查询,68,关键词 ACCESSION Gene Symbol Protein Name Author Name Journal Title E.C Number Organism 。,单一信息查询,69,多信息查询,70,Gene数据库综合信息查询实例,以人波形蛋白Vinmentin基因为例,71,NCBI主页,72,查询结果,73,Vinmentin在Gene数据库的记录,74,75,76,Vinmentin在核酸数据库的Genbank格式记
17、录,77,Vinmentin在核酸数据库的FASTA格式记录,78,79,数据提交,80,81,82,数据下载,83,84,85,数据库使用的学习,86,87,88,数据分析,89,90,基因表达分析,基因表达数据库(GEO、SMD、CGED、ArrayExpress等),91,GEO是NCBI网站中的一个基因表达数据库 GEO包括五种主要的记录 平台记录GPL* 样品记录GSM* 系列记录GSE* 数据集记录GDS* 表达谱Profile,基因表达数据库(gene expression omnibus, GEO),92,平台、样本、数据集、表达谱和基因,93,实例:查看并分析胃癌相关基因表达
18、数据集,94,GDS1210页面,下载文件,95,Vinmentin在各样本中的表达谱,96,聚类分析图,97,98,研究分支,99,100,2001_2010年结直肠癌易感基因的生物信息学分析 85种转化基因的过敏原性生物信息学评价 代谢性心血管病变_生物信息学的应用 帕金森病路易(小)体的蛋白质生物信息学数据分析 蛋白质相互作用网络进化分析研究进展 可变剪接与疾病的生物信息学研究概况 DNA甲基化的生物信息学研究进展 新型长链非编码RNA_lncRNA_的生物信息学研究进展 生物信息技术加速开发旧药新用途 基于生物信息学方法发现潜在药物靶标 生物信息学技术在食物过敏原表位预测中的应用 生物信息学在免疫学上的应用,101,供常规临床应用的数据库,dbMHC 是有关主要组织相容性复合体(MHC)的数据库。它收录了各种MHC等位基因的变异信息,这些信息与器官移植以及个体对感染性疾病的易感性有非常重要的关系。 dbLRC 是全面收录白细胞受体复合物(LRC)等位基因信息,主要关注LRC中的KIR基因。 dbRBC 是与红细胞抗原或血型有关的基因及其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026河南郑州大学影视创研中心招聘3人考试备考试题及答案解析
- 2026广东东莞中学洪梅学校招聘在编教师7名考试备考题库及答案解析
- 四川中烟工业有限责任公司2026年度高层次人才招聘考试备考试题及答案解析
- 2026福建兴银理财春季社会招聘考试备考题库及答案解析
- 2026北京建筑大学第一批次聘用制岗位招聘16人考试参考题库及答案解析
- 2026河北廊坊市中级人民法院招聘劳务派遣人员2名考试参考题库及答案解析
- 2026年云南省影视协会招聘工作人员(2人)考试备考试题及答案解析
- 2026年彭泽县红光港管理服务中心招聘海关协管员考试参考试题及答案解析
- 2026年靖宇县公开招聘城市社区工作者专职岗位人员(12人)笔试参考题库及答案解析
- 2026北京海淀区妇幼保健院人才招聘考试备考试题及答案解析
- 智慧健康养老服务与管理专业教学标准(高等职业教育专科)2025修订
- 珠宝首饰售后服务与保修合同
- 2025年广东省惠州市惠城区中考一模英语试题(含答案无听力原文及音频)
- 煤矿皮带输送机跑偏原因和处理方法
- 征兵体检超声诊断
- 创伤后应激障碍的心理护理
- 云南省大理白族自治州2025届高三上学期二模考试 英语 含解析
- 医疗项目年度总结模板
- 武器装备科研生产单位保密自检报告
- 南京师范大学中北学院《无机及分析化学实验实验》2023-2024学年第一学期期末试卷
- 2024-2025学年上学期上海六年级英语期末复习卷3
评论
0/150
提交评论