




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、生物信息学主讲教师: 高雪峰E-mail:gaoxf吉林大学生命科学学院10/10/1第1页课程安排1、时间:每七天一下午58节 教室:第三教学楼第二阶梯教室 课时:每七天4课时(总计44=16课时)2、学分:2学分3、成绩考评方式(笔试)4、E-mail: gaoxf (办公室地址:理三341室)10/10/2第2页参考文件1、生物信息学概论 罗静初 北京大学 北京大学出版社2、生物信息学 D.R. Westhead 科学出版社3、生物信息学基因和蛋白质分析使用指南 李衍达 清华大学 清华大学出版社4、生物信息学中计算机技术 孙超 中国电力出版社5、生物信息学手册 郝柏林 中科院物理所 上海
2、科学技术出版社6、简明生物信息学 钟扬 复旦大学 高等教育出版社10/10/3第3页第一章生物信息学引论10/10/4第4页介绍 引言 生物信息学发展历史 人类基因组计划和基因组信息学 蛋白质结构与功效关系研究当前生物信息学主要研究内容 生物信息学所用方法和技术10/10/5第5页 第一节 引言生命信息组织、传递、表示物理化学分子生物学遗传学信息技术10/10/6第6页1、 生物信息学概念 HGP生物数据激增(每15个月翻一番)生物学家数学家计算机科学家生物信息学(bioinfomatics)诞生10/10/7第7页概念(广义)生物体系和过程中信息存贮、传递和表示细胞、组织、器官生理、病理、药
3、理过程中各种生物信息信息科学生命科学中信息科 学 10/10/8第8页概念(狭义)深层次生物学知识分子生物信息学 Molecular Bioinformatics挖掘获取生物分子信息获取、存贮、分析和利用生物分子数据10/10/9第9页Bioinformatics生物分子数 据 计算机计 算 + 10/10/10第10页 高性能计算服务器,图形工作站10/10/11第11页 高端计算集群10/10/12第12页高度灵活可扩展计算集群10/10/13第13页10/10/14第14页2、生物分子信息 细胞分子存贮、复制、传递和表示遗传信息系统生物信息载体10/10/15第15页生物信息学主要研究两
4、种信息载体DNA分子蛋白质分子10/10/16第16页10/10/17第17页Protein Machines 10/10/18第18页From the Cell to Protein Machines 10/10/19第19页生物分子最少携带着三种信息遗传信息与功效相关结构信息进化信息10/10/20第20页(1)遗传信息载体DNA 遗传信息载体主要是DNA 控制生物体性状基因是一系列DNA片段 生物体生长发育本质就是遗传信息传递和表示 10/10/21第21页DNA经过自我复制,在生物体繁衍过程中传递遗传信息 基因经过转录和翻译,使遗传信息在生物个体中得以表示,并使后代表现出与亲代相同生物
5、性状。 基因控制着蛋白质合成 DNARNA蛋白质转录翻译10/10/22第22页基因DNA序列DNA前体RNAmRNA多肽链蛋白质序列对应关系遗传密码10/10/23第23页(2)蛋白质结构决定其功效蛋白质功效取决于蛋白质空间结构 蛋白质结构决定于蛋白质序列(这是当前基本共认假设),蛋白质结构信息隐含在蛋白质序列之中。10/10/24第24页(3) DNA分子和蛋白质分子都含有进化信息经过比较相同蛋白质序列,如肌红蛋白和血红蛋白,能够发觉因为基因复制而产生分子进化证据。经过比较来自于不一样种属同源蛋白质,即直系同源蛋白质,能够分析蛋白质甚至种属之间系统发生关系,推测它们共同祖先蛋白质。10/1
6、0/25第25页生物分子信息DNA序列数据 蛋白质序列数据 生物分子结构数据 生物分子功效数据 最基本直观复杂生物分子数据类型10/10/26第26页 DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功效最基本生物信息维持生命活动机器遗传密码生命体系千姿百态改变生物分子数据及其关系10/10/27第27页第一部遗传密码已被破译,但对密码转录过程还不清楚,对大多数DNA非编码区域功效还知之甚少 对于第二部密码,当前则只能用统计学方法进行分析不论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量生物分子数据之中。生物分子数据是宝藏,生物信息数据库是金矿,等候我们去挖掘和利用。10/10/28第28页
7、生物分子信息特征生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着亲密联络10/10/29第29页3、生物信息学目标和任务 搜集和管理生物分子数据数据分析和挖掘开发分析工具和实用软件生物分子序列比较工具基因识别工具生物分子结构预测工具基因表示数据分析工具 10/10/30第30页 试验 数据 信息 知识 搜集 表示 分析 建模 刻画特征 比较 推理 应 用基因工程蛋白质设计疾病诊疗疾病治疗开发新药生物分子信息处理流程10/10/31第31页分子生物学三大关键数据库 GenBank核酸序列数据库 SWISS-PROT蛋白质序列数据库 PDB生物大分子结构数据库 10/10/32第32
8、页数据源数据量生物信息学任务DNA序列11.5百万条序列125.0 亿个碱基 分离编码与非编码区域识别内含子与外显子基因产物预测基因功效注释基因调控信息分析 蛋白质序列40.0万条序列(每条序列平都有300氨基酸 )序列比较多重序列比对识别保守序列模式进化分析 大分子结构1.5 万个结构(每个结构平均1000个原子坐标) 二级结构、空间结构预测三维结构比对蛋白质几何学度量表面和形态计算分子间相互作用分析分子模拟 基因组300个基因组 标重视复序列基因结构分析系统发生分析基因与疾病连锁分析基因组比较遗传语言分析 基因表示酵母6000个基因在约20时间点表示值 达模式相关分析基因表基因调控网络分析
9、表示调控信息分析 表1.1 至初已经得到各类数据及基本数据处理任务10/10/33第33页生物信息学研究意义认识生物本质了解生物分子信息组织和结构,破译基因组信息,说明生物信息之间关系。改变生物学研究方式 改变传统研究方式,引进当代信息学方法在医学上主要意义为疾病诊疗和治疗提供依据为设计新药提供依据生物信息学将是二十一世纪生物学核心 10/10/34第34页主要研究内容 破译遗传语言、识别基因 预测蛋白质结构和功效 认识生物界信息存贮和传递本质 研究药品作用机制和开发新药10/10/35第35页第二节 生物信息学发展历史生物信息学基本思想产生 生物信息学 快速发展二十世纪50年代二十世纪80-
10、90年代生物科学和技术发展人类基因组计划推进 10/10/36第36页20世纪50年代,生物信息学开始孕育20世纪60年代,生物分子信息在概念上将计算 生物学和计算机科学联络起来20世纪70年代,生物信息学真正开端20世纪70年代到80年代早期 ,出现了一系列著 名序列比较方法和生物信息分析方法 20世纪80年代以后,出现一批生物信息服务机 构和生物信息数据库20世纪90年代后 ,HGP促进生物信息学快速 发展10/10/37第37页关于生物信息学发展历程中主要大事,请参见下面两个网站介绍:/Education/BLASTinfo/milestones.html、/bioinformatics
11、/。10/10/38第38页生物信息学发展现实状况PubMed中与生物信息学相关论文统计 90002%10/10/39第39页第三节 人类基因组计划和基因组信息学 1、人类基因组计划介绍 人类基因组计划准备用时间,投入30亿美元,完成人类全部24条染色体3109脱氧核苷酸对(bp)序列测定,主要任务包含作图(遗传图谱、物理图谱建立及转录图谱绘制)、测序和基因识别。其中还包含模型生物(如大肠杆菌、酵母、线虫、小鼠等)基因组作图和测序,以及信息系统建立。作图和测序是基本任务,在此基础上解读和破译生物体生老病死以及和疾病相关遗传信息10/10/40第40页模式生物酵母大肠杆菌果蝇线虫老鼠10/10/
12、41第41页曼哈顿原子弹计划(1942-46)阿波罗登月计划(1961-69)人类基因组计划(1990-)20世纪三大科学计划10/10/42第42页1961年,美国总统Kennedy提出两个科学计划:登月计划攻克肿瘤计划 人类遗传信息复杂性人类基因组计划(HGP,Human Genome Project)目标:整体上破解人类遗传信息奥秘“我们选择登月”(1962年Kennedy在Rice大学演讲)为何提出HGP?10/10/43第43页生命活动三要素:物质、能量、信息 DNA: 遗传物质(遗传信息载体) 双螺旋结构 A, C, G, T四种基本字符复杂文本 基因(Gene):含有遗传效应DN
13、A分子片段DNA、基因、基因组10/10/44第44页 基因组(Genome):包含细胞或生物体全套遗传信息全 部遗传物质 原核生物(细菌、病毒等) 真核生物(真菌、植物、动物等)人类基因组: 含有约3万个 基因10/10/45第45页1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列意义1986.3 杜尔贝科(Dulbecco )在Science撰文 “肿瘤研 究转折点:人类基因组测序” 美国能源部(DOE)提出“人类基因组计划”草案1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨开启经费约550万美元1989 美国成立“国家人类基因组研
14、究中心”,Watson担任 第一任主任1990.10 经美国国会同意,人类基因组计划正式开启James WatsonWalter GilbertHGP历史回顾10/10/46第46页尽管比之于人类登月,HGP投入资金要少得多,但HGP对人类生活影响要更为深远。因为伴随这个计划完成,DNA分子中编码遗传信息将对人类存在化学基础作出最终回答。这将不但帮助我们了解我们是怎样作为健康人发挥正常功效,而且也将在化学水平上解释遗传因子在各种疾病,如癌症、早老痴呆症、精神分裂症等一些严重危害人类健康疾病中作用。毕竟对人类本身更深入了解是人类活动中最主要一个部分。Watson ,1990,Science10/
15、10/47第47页HGP最初目标经过国际合作,用时间(19902005)最少投入30亿美元,构建详细人类基因组遗传图和物理图,确定人类DNA全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。4张图:遗传图 物理图 序列图 基因图HGP终极目标说明人类基因组全部DNA序列;识别基因;建立储存这些信息数据库;开发数据分析工具;研究HGP实施所带来伦理、法律和社会问题。 10/10/48第48页1995 第一个自由生物体流感嗜血菌(H. inf)全基因组测序完成1996 完成人类基因组计划遗传作图 开启模型生物基因组计划H.Inf 全基因组Saccharomyces cerevisiae酿
16、酒酵母Caenorhabditis elegans秀丽线虫10/10/49第49页1997 大肠杆菌(E. coli)全基因组测序完成1998 完成人类基因组计划物理作图 开始人类基因组大规模测序 赛立拉(Celera)企业加入,与公共领域竞争 开启水稻基因组计划1999.7 第5届国际公共领域人类基因组测序会议,加紧测序速度大肠杆菌及其全基因组水稻基因组计划10/10/50第50页 Celera企业宣告完结果蝇基因组测序 国际公共领域宣告完成第一个植物基因组拟南芥全基 因组测序工作.6.26 公共领域和Celera企业同时宣告完成人类基因组工作草图.2.15 Nature刊文发表国际公共领域
17、结果.2.16 Science刊文发表Celera企业及其合作者结果Drosophila melanogaster果蝇Arabidopsis thaliana拟南芥10/10/51第51页2月15日Nature封面2月16日Science封面10/10/52第52页At the White House on June 26, Francis Collins (r), Director of the National Human Genome Research Institute, President Clinton, and J. Craig Venter, President of Cela
18、ra Genomics, lauded the thousands of scientists who contributed to the genome sequence.10/10/53第53页10/10/54第54页8月26日 人类基因组“中国卷”绘制工作宣告完成。年 水稻、小鼠、疟原虫等基因组测序完成204月14日 中、美、日、德、法、英等6国科学家宣告人类基因组序列图绘制成功,人类基因组计划全部目标全部实现。 2010月人类基因组完成图公布。 10/10/55第55页10/10/56第56页10/10/57第57页种类数目备注古细菌(Archaea)35真细菌(Bacteria)42
19、1其中有测定了2个以上菌株真核生物(Eukaryo)47包含酵母、线虫、果蝇、蚊子、拟南芥、人等病毒(Virus)1,275包含不一样亚类或不一样株系类病毒(Viroid)39包含不一样亚类或不一样株系噬菌体(Phage)347包含不一样亚类或不一样株系细胞器(Organelle)1,097包含线粒体和叶绿体质粒(Plasmid)480(http:/www.ebi.ac.uk/genomes/,2月)已完成测序3,000多个基因组10/10/58第58页1、大协作研究: 以学科为中心, 以问题为中心,多学科合作2、研究计划性和有序性: 各方共同参加,制订更科学、更全方面研究计划4、政府与国家作
20、用: 美:领导与推进 英:始于1989年2月,贡献为1/3左右 法:始于1990年6月,贡献为3左右 日:始于1990年,贡献为7左右 德:始于1995年,贡献为7左右 中:始于1999年9月,贡献为1左右3、商业竞争促进基础研究: 1998年Celera企业加入HGP研究特色10/10/59第59页5、可连续性:太空观察和基因组计划都是科学上出众计划,每一个都是科学上迈出一大步。不过二者之间存在着一个刺眼差异:开支方面有四十倍差异。开支差异是至关主要,因为这意味着可连续性。当一个计划足够廉价到成为一条能够无限向未来延伸系列第一个时,它是可连续。而当一个计划太昂贵,以至不经过重大政治斗争就无法
21、重复时,它就是不可连续。可连续计划带来新计划开始,不可连续计划则标志着老时代结束。The Sun, the Genome, and the InternetTools of Scientific RevolutionFreeman Dyson 10/10/60第60页各学科参加、协作:生命科学、数学、物理学、化学、计算机科学、材料科学以及伦理、法律等社会科学HGP带来科学挑战HGP:Pandoras Box 10/10/61第61页 首要科学问题 怎样找到记载在基因组DNA一维结构上控制生命时间、空间调控信息编码方式和调整规律。 应用数学、复杂系统理论、信息论、非线性科学 催生生物信息学、计算
22、生物学、系统生物学 DNA芯片技术 交叉性技术领域:物理学、微电子信息技术、生化技术、信息技术 结构生物学 前沿领域之一:生物物理学、生物化学、晶体学、波谱学、光谱学以及X射线晶体衍射技术、核磁共振技术10/10/62第62页人类基因组计划详细任务能够概括为建立四张图谱 遗传图谱物理图谱 序列图谱转录图谱10/10/63第63页遗传图谱(genetic map)又称连锁图谱(linkage map),它是以含有遗传多态性(在一个遗传位点上含有一个以上等位基因,在群体中出现频率皆高于1%)遗传标识为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组百分率,1%重组率称为1cM)为
23、图距基因组图。遗传图谱建立为基因识别和完成基因定位创造了条件。遗传图谱 10/10/64第64页遗传连锁图:经过计算连锁遗传标志之间重组频率,确定它们相对距离,普通用厘摩(cM,即每次减数分裂重组频率为1%)表示。10/10/65第65页物理图谱物理图谱(physical map)是指相关组成基因组全部基因排列和间距信息,它是经过对组成基因组DNA分子进行测定而绘制。绘制物理图谱目标是把相关基因遗传信息及其在每条染色体上相对位置线性而系统地排列出来。10/10/66第66页1998 年完成了含有52,000个序列标签位点(STS),并覆盖人类基因组大部分区域连续克隆系物理图谱。敲碎基因组,分析
24、研究内容所处染色体位置细菌人工染色体(80300 kb)酵母人工染色体(数百 kb)中心粒一对紧密相邻标志一对相邻较远标志染色体图10/10/67第67页序列图谱伴随遗传图谱和物理图谱完成,测序就成为重中之重工作。DNA序列分析技术是一个包含制备DNA片段化及碱基分析、DNA信息翻译多阶段过程。经过测序得到基因组序列图谱 10/10/68第68页大规模基因组测序 Megabace 测序仪3700 测序仪10/10/69第69页大规模测序基本策略逐一克隆法:对连续克隆系中排定BAC克隆逐一进行亚克隆测序并进行组装(国际合作测序计划)全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系构建而
25、直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera企业)10/10/70第70页利用计算机软件进行序列拼接10/10/71第71页转录图谱 转录图谱是在识别基因组所包含蛋白质编码序列基础上绘制结合相关基因序列、位置及表示模式等信息图谱。 10/10/72第72页10/10/73第73页基因识别 基因识别(gene identification)是HGP主要内容之一,其目标是识别全部人类基因。基因识别包含:识别基因组编码区识别基因结构基因识别当前常采取有二种方法:从基因组序列中识别那些转录表示DNA片段从cDNA文库中挑取并克隆。 10/10/74第74页人类基因组计划实
26、现对医学事 业影响 对致病基因克隆也是人类基因组计划内容。疾病与基因直接或间接相关,经过生物学、医学等技术对相关基因进行抑制或调控,即可到达治疗某一疾病效果。假如掌握了与某种疾病相关基因及突变,则能够对该疾病进行预测、诊疗,甚至治疗。 10/10/75第75页基因变异与疾病10/10/76第76页10/10/77第77页人类基因组计划实施意义 人类基因组计划为我们硕士物信息组织、结构、遗传、表示带来了极大方便,使人类对本身有一个根本了解。人类是最高级、最复杂、最主要生物,假如搞清楚人类基因组,那么再研究其它生物就轻易得多。研究各种模式生物基因组将有利于研究地球生物进化史。10/10/78第78
27、页5、我国对人类基因组计划贡献10/10/79第79页又一次成功! 水稻基因研究10/10/80第80页2、人类基因组计划给生物信息学提出挑战伴随试验数据和可利用信息急剧增加,信息管理和分析成为HGP一项主要工作 发觉生物学规律解读生物遗传密码认识生命本质研究基因组数据之间关系分析现有基因组数据利用数学模型和人工智能技术10/10/81第81页10/10/82第82页功效基因组学 HGP完成后,我们将进入“后基因组学”(post-genomics)时代基因组学研究重心已开始从揭示生命全部遗传信息转移到在分子整体水平对功效研究上,即功效基因组学(functional genomics)功效基因组
28、学任务是进行基因组功效注释(Genome annotation)认识基因与疾病关系掌握基因产物及其在生命活动中作用10/10/83第83页功效基因组学研究内容深入识别基因,识别基因转录调控信息,分析遗传语言。注释全部基因产物功效,这是当前基因组功效注释主要层次。研究基因表示调控机制,研究基因在生物体代谢路径中地位,分析基因、基因产物之间相互作用关系,绘制基因调控网络图。比较基因组学研究,在基因组水平对各个生物进行对照比较,能够揭示生命起源和进化、发觉蛋白质功效。10/10/84第84页人类基因组与其它生物基因组比较10/10/85第85页例:人与鼠染色体差异10/10/86第86页生物信息学与
29、新药研制未来药品研究过程将是基于生物信息知识挖掘过程数据处理和关联分析发觉药品作用对象确定靶目标分子针对靶目标进行合理药品设计10/10/87第87页生物信息学与疾病检测基因组计划产生基因及基因多态性数据与临床医学检验结果之间关系需要利用生物信息学方法去分析、去揭示依据这么分析结果,科学家能够更准确地了解疾病产生根本原因,更准确地预测某个人患癌症、糖尿病或者心脏病可能性,从而彻底改变我们诊疗、治疗和预防疾病方式 10/10/88第88页第四节 蛋白质结构与功效关系研究 蛋白质结构 蛋白质序列 蛋白质功效关系 10/10/89第89页基因组计划不停推进,其结果不但造成DNA序列数据快速增加,也造
30、成蛋白质序列数据快速增加。生物信息学在蛋白组学研究中主要任务是产生和分析蛋白质结构,并将结构知识应用于生物学、医学、药学等生命科学领域。蛋白质空间结构预测。蛋白质结构是合理药品分子设计基础。蛋白质结构是蛋白质工程基础。10/10/90第90页基于生物信息学新药设计10/10/91第91页第五节 当前生物信息学主要研究内容1、 生物分子数据搜集与管理2、 数据库搜索及序列比较 3、 基因组序列分析 4、基因表示数据分析与处理 5、蛋白质结构预测 10/10/92第92页基因组数据库 蛋白质序列数据库 蛋白质结构数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR1、 生物分子
31、数据搜集与管理10/10/93第93页2、 数据库搜索及序列比较 搜索同源序列在一定程度上就是经过序列比较寻找相同序列 序列比较一个基本操作就是比对(Alignment),即将两个序列各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有排列次序,这是序列相同程度一个定性描述多重序列比对研究是多个序列共性。序列多重比对可用来搜索基因组序列功效区域,也可用于研究一组蛋白质之间进化关系。 10/10/94第94页发觉同源分子10/10/95第95页3、 基因组序列分析 遗传语言分析基因组结构分析基因识别基因功效注释基因调控信息分析基因组比较10/10/96第
32、96页4、基因表示数据分析与处理基因表示数据分析是当前生物信息学研究热 点和重点 当前对基因表示数据处理主要是进行聚类分 析,将表示模式相同基因聚为一类,在此基 础上寻找相关基因,分析基因功效。 所用方法主要有:相关分析方法模式识别技术中层次式聚类方法人工智能中自组织映射神经网络主元分析方法 10/10/97第97页基因芯片10/10/98第98页10/10/99第99页10/10/100第100页5、蛋白质结构预测 蛋白质生物功效由蛋白质结构所决定 ,蛋白质结构预测成为了解蛋白质功效主要路径。蛋白质结构预测分为:二级结构预测空间结构预测 蛋白质折叠10/10/101第101页二级结构预测在一
33、定程度上二级结构预测能够归结为模式识别问题 在二级结构预测方面主要方法有:立体化学方法图论方法统计方法最邻近决议方法基于规则教授系统方法分子动力学方法人工神经网络方法 预测准确率超出70%第一个软件是基于神经网络PHD系统10/10/102第102页空间结构预测在空间结构预测方面,比较成功理论方法是同源模型法 该方法依据是:相同序列蛋白质倾向于折叠成相同三维空间结构 利用同源模型方法能够完成全部蛋白质10-30%空间结构预测工作 10/10/103第103页第六节 生物信息学所用方法和技术 1、数学统计方法 2、动态规划方法 3、机器学习与模式识别技术 4、数据库技术及数据挖掘 5、人工神经网
34、络技术6、教授系统 7、分子模型化技术8、量子力学和分子力学计算 9、生物分子计算机模拟10、因特网(Internet)技术 10/10/104第104页1、数学统计方法生物活动经常以大量、重复形式出现,既受到内在原因制约,又受到外界环境随机干扰。所以概率论和数学统计是当代生物学研究中一个惯用分析方法 数据统计、原因分析、多元回归分析是生物学研究必备工具隐马尔科夫模型(Hidden Markov Models)在序列分析方面有着主要应用。与隐马尔科夫模型相关技术是马尔科夫链(Markov Chain) 10/10/105第105页2、动态规划方法动态规划(Dynamic Programming
35、)是一个处理多阶段决议过程最优化方法或复杂空间优化搜索方法 动态规划处理问题基本过程是:将一个问题全局解分解为局部解,逆序递推求出局部最优解,伴随执行过程推进,“局部”逐步靠近“全局”,最终取得全局最优解 10/10/106第106页3、机器学习与模式识别技术机器学习机器学习是模拟人类学习过程,以计算机为工具获取知识、积累经验 1、遗传算法采取随机搜索方法,含有自适应能力和便于并行计算 2、神经网络理论是基于人脑结构,其目标是揭示一个系统是怎样向环境学习,这一个方法被称为联接主义。 模式识别模式识别是机器学习一个主要任务。模式是对感兴趣客体定量或者结构描述,而模式识别就是利用计算机对客体进行判别,将相同或者相同客体归入同种类别中模式识别主要有两种方法:依据对象统计特征进行识别,依据对象结构特征进行识别 10/10/107第107页环境学习知识库执行机器学习系统基本结构 反 馈10/10/108第108页4、数据库技术及数据挖掘数据库技术 数据仓库 虚拟数据库技术(Virtual Database,简称 VDB) 数据挖掘(data mining) 又称作数据库中知识发觉 (Knowledge Discovery in Database),它是从数据库或数据仓库中发觉并提取隐
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年杭州市卫生健康委员会所属事业单位真题
- 架梁安全考试试题及答案
- 触摸屏考试题及答案
- 购房协议书丢失怎么办
- 技术实务考试试题及答案
- 年产5万吨钢材生产线可行性研究报告
- 机场驱鸟考试试题及答案
- 2025店铺租赁合同格式模板
- 广州市槎头看守所监区卫生间改造工程可行性研究报告-广州咨询
- 2025年仓储部安全培训安全防护知识测试试卷
- 《八段锦教学》PPT课件
- 中国联通IMS接口规范 第三分册:Sh接口 V1.0
- GB∕T 4162-2022 锻轧钢棒超声检测方法
- 浙江省建筑设备安装工程提高质量的若干意见(安装300条)新版
- 住宅产业化发展情况汇报
- 有限空间作业安全培训
- 七年级(上 )生物实验通知单
- 湿式报警阀概述(课堂PPT)
- 中国瓷器发展史(课堂PPT)
- cvc和picc导管的维护ppt课件
- (完整word版)结核分枝杆菌危害评估报告
评论
0/150
提交评论