版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
IP地址由国际组织按级别一致分配,机构用户在恳求入网时可以获取相应的IP地址。1)NetworkInformationCenter(NIC)。最高一级IP地址由国际网络信息中心(NIC)担任分配。其职责是分配A类IP地址、授权分配B类IP地址的组织并有权刷新IP地址。2)InterNIC、APNIC和ENIC。分配B类IP地址的国际组织有三个:ENIC担任欧洲地域的分配任务,InterNIC担任北美地域,设在日本东京大学的APNIC担任亚太地域。我国的Internet地址由APNIC分配(B类地址),由邮电部数据通讯局或相应网管机构向APNIC恳求地址。3)分配C类地址。由地域网络中心向国家级网管中心(如CHINANET的NIC)恳求分配。12/26/20231域名系统〔domainnamesystem,DNS〕域名末尾部分为一级域,代表国家或机构等节点;域名的倒数第二部分为二级域,代表部门或隶属于一级域的下级机构;如:,其中cn为最高域,代表中国edu为第二级域,代表中国教育与科研网为第三级域,代表南京林业大学12/26/202322.2.7与Internet的衔接方式用户终端远程效力器ModemModem线局域网远程效力器公用通讯线路路由器拨号上网衔接局域网直接衔接12/26/202332.2.8Internet提供的效力主机远程登录FTP:远程文件传送FTP(文件转输协议)安装和运用Serv-U(Ftp效力器软件)安装和运用AbsoluteFtp〔Ftp客户端软件〕USENET:电子公告板12/26/20234www(worldwideweb)由欧洲粒子研讨中心发起。其初衷是为了让科学家们以更方便的方式彼此交流思想和研讨成果,目前已成为一种最受欢迎的游览工具。WWW主要由一些运用软件以及一系列协议和商定组成,运用超文本和多媒体技术,在计算机网络上进展超文本信息的发布和阅读。12/26/20235提供:文本、图像、声音和视频等信息也提供根本的Internet效力12/26/20236WWW运用的几项关键技术和根本元素包括:1.HTML(hypertextmarkuplanguage,超文本标志言语)设计HTML言语的目的是为了能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联络在一同,构成有机的整体,人们不用思索详细信息是在当前电脑上还是在网络的其他电脑上。这样他只需运用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息能够存放在网络的另一台电脑中。HTML可以阐明文字、图形、动画、声音、表格、链接等。12/26/202372、URL〔uniformresourcelocator,一致资源定位器)是WWW上简单的寻址机制,使得W可以衔接世界各地计算机上的信息。URL的格式从左到右由下面各部分组成:方式、效力器地址、端口、途径等组成。:8080/index.html12/26/202383、:是WWW阅读器和效力器之间传送音讯的协议,它基于客户机/效力器模型的信息分布方式,按本来设计意思“恳求/呼应模型〞,即信息文件存放在效力器上,用户经过程序向效力器发出恳求并访问效力器上的数据。12/26/202394.MINE类型:计算机上的数据文件只是二进制数位的集合,必需经过解释才有用。例如,为了正确显示文件“index.html",阅读器必需知道它是HTML格式。12/26/2023105、网页网页是用户经过客户端阅读器察看到的超文本信息内容。简单的静态网页图文并茂网页动态网页12/26/2023112.3Internet上的高级信息管理Web上的数据最大特点就是构造化特征较弱.往往是半构造化的,有时还能够是无构造的。为有效利用WWW上的数据,需求处置半构造化数据源,处理半构造化数据的查询与集成问题。寻觅一个半构造化的数据模型是处理问题的关键所在。12/26/202312从WWW到XML(extensiblemarkuplanguage)以XML为根底的新一代WWW环境可以更好地实现Web中的信息共享与交换,XML可看作一种半构造化的数据模型,可以很容易地将XML的文档描画与关系数据库中的属性对应起来,实施准确的查询与模型抽取。12/26/202313XML是由W3C设计的一种元标注言语,可提供资料的构造化描画才干。详细来说,XML类似于HTML,被设计用来描画数据,但XML提供了一种独立的运转程序的方法来共享数据。XML与HTML更大的区别能够表达在它明确地域分了文档的内容和表现这两个概念。XML文档专注于内容,而这些内容的表现那么有相应的扩展款式表XSL来规定。因此,同样的内容可以有不同的表现,甚至还可以对内容进展不同的取舍。12/26/202314在寻求有效管理网上海量信息的探求中,人们还提出了数字图书馆的处理方案。数字图书馆可了解为有组织的信息收藏及相关效力,信息以数字化方式保管,并经过网络进展访问。数字图书馆包含各式各样的可用数据,供不同用户运用,规模可大可小,并可运用各类计算设备和相关软件。但一切数字图书馆都有着共同的特点:信息在计算机内得以组织并经过网络加以利用,数字图书馆带有选择信息、组织信息、存储信息和发布信息的程序。12/26/202315建立数字图书馆的主要缘由是人们置信数字图书馆可以比过去的方式更好地运用信息。其潜在的优点有:(1)可及时获取世界任何地方发布的信息;(2)强大的信息搜索和阅读才干;(3)信息共享和信息交流;(4)易于坚持最新信息;(5)支持数据模型、运用程序、仿真软件等新型信息。12/26/2023162.4JAVA及挪动计算从事生物信息学研讨与开发,普通需采用计算机软件从大量的数据中挑选出所需信息。目前有多种计算机程序设计言语可供用户选择。如VisualBasic言语、C言语、Perl言语、PHP言语、Java言语和FORTRAN言语等。其中,Perl和PHP两种言语由于执行效率高、可移植性好及在网络上有着丰富的免费代码等特点使得他们成为生物信息学软件编程的主要脚本言语。12/26/202317目前,数据库研讨和运用中一个很重要的问题就是如何有效地利用既存数据,发现和提取有价值的信息和知识,而不仅仅是处置和保管数据。数据仓库、数据发掘和数据库中的知识发现就是处理上述问题的重要技术。数据仓库一词尚没有一个一致的定义。著名的数据仓库专家W.H.Inmon在其著作<BuildingtheDataWarehouse>一书中给予如下描画:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持战略决策的制定。2.5数据仓库与数据发掘12/26/202318数据仓库概念的两个层次功能上:数据仓库用于支持决策,面向分析型数据处置,它不同于企业现有的操作型数据库;内容和特征上:数据仓库是对多个异构的数据源有效集成,集成后按照主题进展了重组,并包含历史数据,而且存放在数据仓库中的数据普通不再修正。12/26/202319数据仓库的组成:数据库为整个数据仓库环境的中心,是数据存放的地方,其提供对数据检索的支持。相对于支配型数据库来说,其突出特点是对海量数据的存储和快速的检索技术。数据抽取工具、元数据、访问工具、数据集市、数据仓库管理、信息发表系统12/26/202320数据发掘的概念:就是从数据库中抽取具有潜在运用价值的隐含信息的过程。与传统分析工具不同的是,数据发掘属于基于知识发现的方法,它运用方式匹配和其他算法决议数据之间的联络。数据发掘技术综合了机器学习、统计分析和数据库技术,主要内容包括规那么生成、分类、聚类、序列分析等。12/26/202321数据发掘的目的:趋势预测数据发掘自动在大型数据库中寻觅预测性信息,以往需求进展大量手工分析的问题如今可以迅速直接由数据本身得出结论。例子:市场预测问题——数据发掘运用过去有关促销的数据来寻觅未来投资中报答最大的用户,其它可预测的问题包括预告破产以及认定对指定事件最能够作出反响的群体。12/26/202322数据发掘的目的:关联分析假设两个或多个变量的取值之间存在某种规律性的景象称为关联,可分为简单关联、时序关联、因果关联目的:找出数据库中隐藏的关联关系。因有时并不知数据库中数据的关联函数,因此关联分析生成的规那么带有可信度。12/26/202323数据发掘的目的:聚类分析数据库中的记录可被划分为一系列有意义的子集,即聚类。聚类加强了人们对客观现实的认识,是概念描画和偏向分析的先决条件。聚类技术主要包括传统的方式识别方法和数学分类学。12/26/202324数据发掘的目的:概念描画概念描画就是对某类对象的内涵进展描画,并概括这类对象的有关特征。概念描画分为特征性描画和区别性描画,前者描画某类对象的共同特征,后者描画不同类对象之间的区别。12/26/202325数据发掘的目的:偏向检测数据库中的数据常有一些异常记录或称为偏向。偏向包括很多潜在的知识,如分类中的反常实例、不符合规那么的特例、观测结果与模型预测值的偏向、量值随时间的变化等。偏向检测的根本方法是,寻觅观测结果与参照值之间有意义的差别。12/26/20232612/26/2023272.6其他的计算机知识2.6.1算法和算法分析2.6.2类似性度量2.6.3配对算法2.6.4分类与聚类2.6.5隐马尔可夫模型2.6.6人工神经网络12/26/2023282.6.1算法和算法分析生物信息学中涉及大量的计算,不可防止地用到算法的概念。算法是一个定义良好并会终止的计算过程,它接纳一组输人数据并输出一组数据。算法的好坏普通是经过称作算法分析的过程来评定的。算法分析是一种在笼统的计算模型上对算法所需资源进展评价的过程,它有助于比较某个问题的不同求解算法的资源耗费,剔除无效方案而不用真正地编写程序,更不用在计算机上实践运转。算法的复杂度是指当问题的规模增大时,算法的代价增长的速度。复杂度研讨中所谓的代价通常指的是算法所用的时间和所要的储存空间,即算法的时空复杂性。12/26/2023292.6.2类似性度量序列比较,包括同一序列内不同片断的比较和多个序列的对比在生物信息学任务中占有重要的位置。普通而言,在涉及两个对象的比较和匹配问题时,需求度量(或间隔)的概念。例如,生物信息学任务中广泛存在的序列和构造的类似性计算就需求思索度量或间隔函数的问题。12/26/202330对于DNA或蛋白质序列,可以根据字符串来构造间隔函数。从生物学的意义上来说,核酸和蛋白质序列对位的根底是假定这两个序列同源,但在各自的演化过程中由于变异的积累构成了不同的序列。假设将每个序列看做是有限字符集组成的字符串,那么变异就可以借用字符串的编辑(插人、删除、修正)来表达。于是,编辑间隔就是一个最简单断定序死类似度的目的。所谓编辑间隔指的是一个字符串变到另一个字符串时插人、删除和置换的最少个数。12/26/2023312.6.3配对算法选择适宜的类似性度量是胜利的第一步。在此根底上找出序列最正确配对的算法设计才是开启胜利之门的钥匙。遗憾的是,由于“组合爆炸〞的缘由,序列的配对无法经过穷尽的搜索获得“最正确〞的结果。只能经过一些启发式的方法获得“可满足的〞解答。或在一定的计算代价下寻求较好的结果。12/26/202332为了尽快定位候选序列,排除无效的配对,可以在数据库中运用索引技术或其他的一些限制。这是一种启发式的方法。以BLAST为代表的一些算法为例,事先对数据库中的一切序列按一定的长度(如DNA序列长度取11,蛋白质序列长度取5)提取类型特征并建立索引。同时,对提交的序列按同样的方式提取特征。依托预先建立的索引,只需那些与提交序列的特征兼容的库中序列才参与比较,这可大幅度地减少比较次数。12/26/2023332.6.4分类与聚类生物信息学中涉及大量的分类和聚类任务。分类是根据预先设定的准那么将数据分成各自独立的类别,聚类那么是根据数据集本身的特性到达归类的目的。因此,它们有时也被分别称作“有监视的分类〞和“无监视的分类〞方法。聚类分析还可以自然离析出数据集合中包含的“另类〞对象12/26/2023342.6.5隐马尔可夫模型马尔可夫链模型经过构造离散随机过程,对未来事件的发生做出统计意义上的预测。马尔可夫链模型中需求初始概率分布和形状的转移矩阵,均由训练得到。隐马尔可夫模型(HMM)是由马尔可夫链开展扩展而来的一种随机模型。在马尔可夫链中,每一个形状对应一个可察看的事件。隐马尔可夫模型对马尔可夫链作了推行,使得可察看的是形状的一个概率函数,而形状本身那么是不可察看的。12/26/202335而隐马尔可夫模型能很好地对真核生物DNA序列建模。隐马尔可夫模型将DNA序列的构成看做一个随机过程。模型的统计规律是未知的,而隐马尔可夫模型能自动寻觅出其隐藏的统计规律,因此它具有独特的优越性。可以说,隐马尔可夫模型使基因预测从原来单纯的编码序列预测开展到了基
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 摆摊卖水果营销方案(3篇)
- 旅游大数据营销方案(3篇)
- 机械车库地面施工方案(3篇)
- 樊胜美营销方案(3篇)
- 污水处站施工方案(3篇)
- 浅基础降水施工方案(3篇)
- 班组应急预案演练报道(3篇)
- 盛京联谊活动策划方案(3篇)
- 空心桥墩施工方案(3篇)
- 纽约总领馆活动方案策划(3篇)
- 私募股权投资基金的团队组建流程
- 《GMP认证培训资料》课件
- 《船舶信号系统实训》课件-5.4主机车钟系统功能与操作
- 家族族谱模板
- QB/T 6019-2023 制浆造纸专业设备安装工程施工质量验收规范 (正式版)
- (正式版)QBT 2570-2024 贴标机
- 分式方程第2课时课件北师大版八年级数学下册
- 招投标专项检查报告
- 高速铁路桥隧建筑物病害及状态等级评定 涵洞劣化项目及等级
- 安徽省定远县公开选调教师(第二批)和教研员笔试历年高频考点试题含答案带详解
- 小针刀治疗腱鞘炎-课件
评论
0/150
提交评论