(材料加工工程专业论文)计算机辅助焊接信息搜索与控掘系统的研究与开发.pdf_第1页
(材料加工工程专业论文)计算机辅助焊接信息搜索与控掘系统的研究与开发.pdf_第2页
(材料加工工程专业论文)计算机辅助焊接信息搜索与控掘系统的研究与开发.pdf_第3页
(材料加工工程专业论文)计算机辅助焊接信息搜索与控掘系统的研究与开发.pdf_第4页
(材料加工工程专业论文)计算机辅助焊接信息搜索与控掘系统的研究与开发.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(材料加工工程专业论文)计算机辅助焊接信息搜索与控掘系统的研究与开发.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文分析了i n t e m e t 在当今社会生活中的作用和地位以及网络科技信 息搜索的重要性,探讨了著名的i n t e m e t 搜索引擎的发展过程及其存在的 问题,并针对这些问题研究开发出一个计算机辅助焊接信息搜索与挖掘系 统。该系统以目前流行的i n t e r a c t 搜索引擎为底层工具,采用面向对象编 程的v i s u a lc + 语言和数据库应用软件a c c e s s9 7 为主要编程工具,建立了 一个基于统计分析并具有良好独立性和开放性的焊接专业词库和一个基本 功能齐备的超文本浏览器。系统在w i n d o w s 环境下运行,具有简单友好 的人机界面。初步的开发及应用结果显示。该系统能帮助焊接工作者大幅 度提高焊接专业信息的搜索效率和搜索精度。文章还进一步讨论了该系统 的应用范围、完善措施及未来专业搜索引擎的发展方向。 , 关键词:焊接信息搜索警挖掘系统,焊接专业词库,超文本浏览器 a b s t r a c t i nt h i sp a p e r ,ai n t e m e t w e l d i n gi n f o r m a t i o n r e t r i e v a la n d m i n i n gs y s t e m i s i n t r o d u c e d t h es y s t e mi sc o m p o s e do ft w op a r t s :aw e l d i n gg l o s s a r yd a t a b a s e a n dah y p e r t e x tb r o w s e r i ti sf o rt h ef i r s tt i m et h a tt h ec o n c e p to faw e l d i n g g l o s s a r yd a t a b a s e ,w h i c hi s e s t a b l i s h e do ns t a t i s t i c a lc a l c u l a t i o n so fc o n t e x t - s e n s i t i v eh y p e r t e x t sr e t r i e v e d , i si n t r o d u c e di nt h es y s t e ma d v a n c e ds o f t w a r e d e v e l o p m e n t m e t h o d s a n d t o o l s a l e a d o p t e d t o e n s u r e t h e q u a l i t y o f t h e s o f t w a r e i n i t i a lw o r kh a ss h o w nt h a tt h es y s t e mc a l ls i g n i f i c a n t l yi m p r o v et h eq u a l i t yo f s p e c i a l t y s e a r c hr e s u l t s k e y w o r d :i n t e m e tw e l d i n gi n f o r m a t i o n r e t r i e v a la n d m i n i n gs y s t e m ,w e l d i n g g l o s s a r yd a t a b a s e ,h y p e r t e x t b r o w s e r 1 绪论 1 1 计算机技术在焊接中的应用和发展趋势 计算机技术、通信技术和网络技术的飞速发展,对人类生产和生活 的各个领域产生了深刻影响,人们在传统的生产中引进了先进的计算机技 术,不仅产生了巨大的经济效益,而且创造了新的生产思想、生产方法和 全新的产品【l 】。而计算机技术在焊接工程中应用的重要性、迫切性也显得 越来越突出。从1 9 8 6 年开始,国际焊接学会( i i w ) 、英国焊接研究所 ( 1 、i ) 、美国焊接学会( a w s ) ,先后多次分片区召开了关于计算机在 焊接中的应用的专门会议,推动了计算机在焊接工程中的广泛应用。1 9 9 7 年7 月,t 、a w s 、美国国家标准与技术研究所( n i s t ) 等单位联合, 在国际焊接学会l l w s 0 5 0 周年大会前召开了第七次c o m p u t e rt e c h n o l o g y i n w e l d i n g 的国际会议,就计算机在焊接中应用实例、软件开发、焊接过程 模拟与控制方面进行了交流,同时还举办了各种硬件及软件展览会圜。在 我国,1 9 8 9 年就曾召开过“焊接专家系统研讨会”,此后焊接学会和焊接 协会在1 9 9 2 年和1 9 9 6 年又联合召开了两次“全国计算机在焊接中应用 交流会”,对促进我国计算机在焊接工程中的应用起了很大的作用t 3 。 图1 1 列出了计算机在焊接工程中应用的主要方面。其中以汉字信息 数据库、焊接生产文档管理、生产过程计划以及管理的应用最为普遍。许 多企业在这些方面积极引入计算机技术,从而促进了生产过程管理的规范 化和标准化、大大提高了生产效率,缩短了生产周期,提高了产品质量, 降低了成本,特别是使焊接工程技术人员可以从繁重的日常事务工作中解 脱出来,将主要精力用于解决重要的技术问题上。但是同时我们也应当看 到,尽管在焊接工程中应用计算机技术已经相当普遍,但真正已形成商品 并且具有一定市场的焊接工程应用软件为数还不多,大部分焊接应用软件 只限于企业内部使用,或者仅仅作为试探性的开发,最终没有进入商品市 场;即使是已经商品化的软件,其销售量往往也很有限。根据国家焊接协 会的统计,国内焊接应用软件销售量一般仅数十份,最多也不过数百份, 这与通用的操作系统和开发工具类软件的销售量是无法相比的。 图1 1 计算机辅助焊接技术示意图 计算机软硬件的发展为焊接工艺过程模拟和理论预测创造了良好的条 件,人们目前已经可以在工作站平台上,甚至可以在pc 机平台上建立相 当不错的模拟或理论预测的系统【4 l 【5 】。与此同时,随着计算机网络技术的 理论研究和应用水平的不断提高,焊接工程中直接应用网络技术的机会和 要求也越来越多。图1 2 是焊接c i m s 计算机网络示意图悯。近年来,随 着i n m e t 迅速发展,国内外已有数以千计的焊接专业公司和研究机构在 i n t e m e t 上建立了自己的网站,而与焊接有关的网页数量已估计已多达以 几十万。下面介绍几个影响最大的焊接专业网址【7 】罔翻。 1 ) 美国爱迪生焊接研究所f e w r ) :h 卸:丛凸业曲d 。q r g e 皿是美国最主要 的焊接研究机构。美国焊接信息网w e l d n e t 就是由e w i 管理。这是 一个内容丰富的网站。w e l d n e t 汇集了与焊接有关的学术组织、教 育机构、公司以及标准、出版物、软件、学术活动等信息,其中还 特别着重介绍e w i 本身以及和e w i 紧密合作的美国海军连接中心 的项目情况,研究进展、技术资料和技术简报等有价值的信息。 2 管理信息系统工程技术信息 数据库管理数据库 i 管理信息系统工程技术信息管理 销生物财人产零产生物产 售产资务事 口口 产 资 品f | h部u h 管计供管工设件工调管质 理划应理资计制艺 度理量 管造管计管 理理划理 网络总线 图1 2 企业信息计算机网络示意图 2 ) 美国焊接学会( p l w s ) :h t t p :w w w a m w e l d o r g 在a w s 网站上可以 了解到a w s 组织的会议,学术活动,教育培训等信息,还可一检 索到a w s 出版的书刊目录和自1 9 9 2 年以来w e l d i n gj o u r n a l 上刊 登的所有文章的题目和作者的索引。 3 ) 英国焊接研究所( 1 、矾) :h t t p :1 w w w t w i c o u k t w i 是世界上最主要的 焊接机构之一。国际焊接学会秘书处原来曾设在刑i 。在这个网站 上介绍了t w i 的合作项目,工作进展、培训计划以及技术简报等。 2 1 世纪,世界将进入信息社会,人们的生活和生产将会发生根本性 的变化。知识经济作为新的经济模式正逐步改变全部经济结构。计算机技 术的发展必将使焊接工程发生根本性的变化。 1 2 焊接专家系统 焊接领域的专家系统研究约开始与8 0 年代中期。美国科罗拉多矿业 学院( c s w ) 与美国焊接研究所联合开发出了焊接材料选择系统 w e l d s e l e e t o r “。英国、日本、德国及其他一些国家相继都开展了这方面 的研究工作。一些国家和地区还单独或联合研制了专门的开发计划,如美 国焊接研究所的焊接信息网( w e l d i n gi n f o r m a f t o nn e t w o r k ) 计划i l ”、欧洲 尤里卡计划e u 2 5 9 ( e u r d w e l d ) 【】2 】 1 3 】。经过十多年的不懈努力,各国研 究机构从不同侧面,以不同形式、研制了多种类型的焊接专家系统,主要 涉及到工艺过程、缺陷分析、材料及设备选择等方面。这些系统中约有半 数达到了商品化水平f l 。 现有焊接专家系统分为下述几种类型: ( 1 ) 工艺选择与工艺制定 这是焊接专家系统最主要的应用领域。据文献【2 统计,近几年国外 开发的专家系统中,有关工艺选择及工艺制定的约占7 0 。国内这方面 专家系统的情况与国外大体类似。已开发的焊接工艺专家系统中,有些是 针对单一的工艺因素,如美国c s m & a w i 的w e l d s e l e c t o r ,有些则是综合 工艺设计或选择系统,如英国的t 、的w e l d g e n 。 ( 2 ) 焊接过程实时控制 这是焊接专家系统的一个重要发展方向,但目前开发的系统不多, 有待于进一步拓展。典型的系统如美国焊接研究所的w e l d e x c e l l 以及美国 通用数字公司的n e w c s 。 ( 3 ) 焊接缺陷预测与诊断 这类专家系统与m y c i n 等经典的诊断型专家系统相比,有许多成 熟的技术可资借鉴。开发此类系统的困难在于,有关的专家知识具有很强 的经验性,复杂而难以获取。此外,工程问题往往需要一些非常规的知识 表示及处理方法。这类系统可用于诊断焊接缺陷类型、缺陷致因,或进行 具体焊接工艺条件下的缺陷预测。最具有代表性的是英国t w i 的裂纹诊 断专家系统w e l d c r a c k e x p e r t 。 ( 4 ) 设备故障诊断 这方面的焊接专家系统比较少,一般用于特定的焊接设备。美国 m i l l e r 公司开发的m i l l e td 中e np r o g r a m ,专为该公司生产的m a x t r o n 3 0 0 、 d e l t a w e l d 4 5 1 及6 5 1 等产品服务,法国f r a m e t o n e 公司的h o t - w i r et i g e x p e r ts y s t e m ,用于热丝h g 雄焊设备,可分析2 0 0 种故障致因,系统将 这些故障致因分为电路、元件、部件族、部件等四个水平来处理。 ( 5 ) 计算机辅助设计 这方面的焊接专家系统不多。美国c s m & a w i 联合开发了一个焊接 标准符号生成系统w e l d s y m p l e , 已达到商品化水平。该软件利用 a u t o c a d ,可辅助创建符号a w sa 2 4 8 6 标准一“焊接、钎焊及无损 4 检查标准符号”的机械制图用焊接符号。瑞典焊接研究所开发的s a f e 系 统可用于机械结构设计,完成强度、寿命、安全性等方面的计算分析。瑞 士e p f l 开发的f r d 系统属于由里卡计划e u 2 5 9 项目,该软件按欧洲 e u r o e o d e 3 标准对结构进行分类,可完成有关疲劳计算,并可提出结构改 进后的疲劳估计。此外,我国上海交通大学与吉林工业大学合作开发的焊 接变压器设计专家系统也基本达到实用水平,该软件可对1 4 种系列的变 压器进行优化设计,并可对已有变压器作出评估( 1 ”。 ( 6 ) 标准解释 在介绍焊接应用软件的文献中,这类软件通常单列,不归入焊接专家 系统的范畴。但是,在解释和执行有关焊接标准时,专家系统及知识库常 常是不可缺少的。英国t 帆的l a c u s 在有关文献 t o 中指出,这类软件 的开发以采用专家系统技术为佳。现在,此类软件涉及与焊接工艺、焊工 资格、焊接工程项目以及焊接结构设计相关的多类焊接标准,可解释标准 内涵、检查有关内容是否符合标准,执行这些标准规定或按标准进行管理。 典型的标准解释类软件包括美国c s p e c 公司的t u r b oi x ,英国t w i 的 p r e h e a t 和f a t i g u e e a l c 。 ( 7 ) 其他 除以上类型外,专家系统技术在焊接结构安全评估、焊接冶金分析、 数控切割、设备配置、焊工考试、焊接定额及成本分析等方面也得到了一 定的应用。 上述资料表明,焊接专家系统已取得可喜的成果,具有广阔的发展 和应用前景。但值得指出的是,由于焊接专家系统的发展历史较短,以往 开发的系统在技术上不可避免地存在一些问题。比如,机器学习功能较为 薄弱,大多数系统不具备推理解释能力。许多系统因采用了普通的专家系 统开发工具,往往不能全面反映焊接领域的特点,难以实现某些特殊要求 的功能。未来的焊接专家系统将致力于新的应用领域的拓展,充分应用人 工神经元网络技术、模糊推理技术、多媒体技术等并且朝着集成化及网络 化方向发展。 从另一个角度出发,未来的专家系统开发人员应当把专家系统当成 - - i - j 技术来利用,而不是仅仅当成一种软件类型。在各类软件的开发过程 中,凡遇到较为复杂的、需要借助专家经验与专家知识来解决的问题,均 可考虑采用专家系统技术。这样开发出来的软件系统可以广义地被称为基 于知识的系统,其主要部分可以是专家系统,也可以是其他类型的系统, 比如事物管理系统,或小型的设各控制软件等。因此,只要焊接应用软件 中涉及到专家知识,专家系统技术就有其用武之地“”。可以预见,焊接 专家系统将获得持续不断的发展,并在焊接工程及科研土作中发挥重要的 重鏖奎堂堡主兰堡垒塞 = :! :塾垒 作用。 1 3 本课题的研究内容、目的及意义 1 3 1 研究的意义 随着科技的进步,各种信息的载体也发生巨大的变化,人们可以获得 的信息资源已不再局限于图书馆的各种书籍、期刊。依靠传统手段从图书 馆获取信息的时代己过去,现在人们可以借助光盘,i n t e m e t 得到更加丰 富的信息。过去科研工作者获取的信息往往受限于图书馆的库存,且不全 面不及时。借助于新的传播媒体,科研工作者可以自由地在信息的海洋 中遂游了。现在一张普通的c d - r o m 光盘的信息存储容量可以达到6 0 0 多兆字节,相当于2 5 万页的书。国外许多焊接应用软件公司为焊接工程 师提供了丰富的软件,这些软件包括焊接工程数据库、数值计算和数值模 拟、焊接手册及其解释程序、焊接专家系统、焊接培训软件以及焊接市场 销售预测软件等【1 8 1 。这无疑是对图书工业的一次革命。 随着i n t e m e t 的诞生,信息工业发生了翻天覆地的变化。目前联入 i n t e r n e t 的国家和地区越来越多,同时i n t e r n e t 上的信息量也以爆炸式的速 度在增长。截止至1 9 9 9 年8 月底,全球i n t e m e t 电子网页数量已超过8 0 0 , 0 0 0 ,0 0 0 页,并且以每天1 0 0 0 , 0 0 0 页的速度在增加。而目前最大的搜索 引擎所收录的网页数量约为1 4 1 ,0 0 0 ,0 0 0 页,约占i n t e r n e t 网页总数的 1 7 6 。就科学技术来说,目前每年世界上出版2 亿篇学术论文( 目前已有 5 0 0 万篇论文在i n t e m e t 上) 【1 9 】。对于焊接工作者和焊接工程师来说i n t e m e t 已经成为一种新的了解焊接技术发展并在网上与世界范围的焊接人员进行 广泛的交流的重要渠道。面对者这个知识爆炸的时代,如何正确、高效、 经济地检索与查询我们所需的文件资料,发现与挖掘有用的知识并加以利 用,从而加快我国的科技事业的发展速度,无疑具有十分重要的意义。 1 3 2 研究内容、目的 随着计算机技术、i n t e m e t 及相关技术的发展与成熟,网络上检索信 息己成为当今以致未来社会人们获取信息的重要手段。其中环球信息网 w v n r 是i n t e r n e t 的关键技术之一,也是i n t e m e t 上最受欢迎的信息检索 6 、 系统。它能够把各种类型的信息资源有机地组织起来,使用户能够在 i n t e m e t 上查找已建立在、 n 服务器上的超文本、超媒体资源文件。 、 m r 、v 上的信息量不断积累,未来的信息需求也不断增加,已经不能单 独地依靠手工查找所有的信息,人们迫切需要能够快速、准确、经济地查 找信息的信息检索系统。近年来,随着互联网用户的逐步增多和网上信息 的急剧增加国外一些著名搜索引擎如a n 州s t a 、y a h o o 、n o r t h e m l i g h t ,、 h o t b o t 、l y c o s 、i n f o s e e k , 、e x c i c c 、g o o 出e ,、d i r e c t h i t 、w e b c r a w l e r 、m a g e l l a n 、 f a s ts e a r c ha l lt h ew e b 以及国内的搜狐、北极星、搜索客、新浪、悠悠、 常青藤、天网、若比邻、网络指南针、司南( y i p p e e ) 等中文搜索引擎相 继出现,为人们在浩瀚的网海中冲浪提供了极大的方便。但同时我们也应 当看到,这些搜索引擎并非是无所不包和无所不能的。利用这些检索系统 检索到的信息在相关l 生和准确性方面还存在许多不足之处。除此之外,对 于国内用户来讲,随着上网人数的不断增加以及国内带宽的限制,网上经 常发生阻塞。利用以上信息搜索系统进行搜索时往往意味着会耗费大量的 时间和金钱。 当我们运用以上搜索系统进行搜索的时候,一般只能通过在网络浏览 器中输入关键词的办法单向发出请求,而检索系统并不知到用户确切需要 的是什么样的信息,它仅仅能做的是通过某种算法找到与用户所输入的关 键词尽量匹配的网站,其结果往往是:1 ) 若用户输入的关键词较多时,返 回的结果为零;2 ) 若输入的关键词较少时,返回的结果可能上万条甚至上 几十万条,用户很难有时间去一一浏览;3 ) 若用户真的花时间去一一浏览 返回结果时,会发现许多网页实际上根本与自己感兴趣内容无关。 本研究将爨重点放在增强系统的相关信息与人们的检索信息的双向交 流的功能方面,人们只需用约定的检索表达式向系统提出查询要求,即可 由搜索引擎完成查询过程,并将有关信息反馈回来。这样可提高网上信息 信息流动的效率,又可以免去查询者“上下求索”的苦处。 本课题的研究分为三部分:、 焊接专业词库的建立:焊接专业词库是进行网络搜索的基础,我们 通过对从网络上下载的大量网页的统计,找到与各焊接专业词汇最相 关的词,这样我们就能够根据焊接专业词库对从各个搜索引擎返回的 网页地址进行分析,剔除与我们的要求无关的网页地址,而把有用的 地址提交给用户。 网络检索:通过m t c r n c t 了解焊接及连接技术的研究现状及最新发 展情况。这种检索不是没有目的的,而是根据一定的规则进行检索。 对今后工作的展望:从以上分析我们可以看出,我们对焊接专业词 库以及焊接专业搜索引擎的研究只是刚剐起步,其功能受研究手段的 7 限制难免存在不足。为了提高系统的功能,对今后工作应从哪一方面 入手,提出建议。 重壅奎兰堡圭兰堡垒奎 ! 坠堡垒丝望塑垩堑墼耋:垦星 2i n t e r n e t 及i n t e r n e t 搜索工具 2 1i n t e r n e t 简介 2 1 1i n t e r n e t 的发展圾其在当今社会中的作用 1 9 6 9 年,美国国防高级计划研究署为实现各自独立的计算机之间数 据的相互传输和通信,建立了世界上最早的计算机网络之一: d a r p a n e t ,这便是i n t e m e t 的前身。 当时此网络还只是用于军方,用于在意外事故发生时,比如停电, 通信线路中断,甚至核攻击时,军方有能力保证稳定而可靠的通讯,并有 足够的能力恢复这些故障。 但渐渐地,d a r p a n e t 应用不再仅仅限于国防。随着t c p i p 协议 地研究和发展,异种网之间的相互通讯和连接成为可能。大约在1 9 8 0 年 左右,美国国防高级计划研究署以d a r p a n e t 为主干建立了i n t e m e t , 同时连入地还有美国多所大学。 之后,美国n s f ( n a t i o n a ls c i e n t i f i cf o u n d a t i o n 美国国家科学基金会) 介入,于1 9 8 6 年建立了远程主干网n s f n e t ,并与d a r p a n e t 相连, 使全美的主要研究机构都连入n s f n e t 。大约在1 9 9 0 年,它取代了 d a r p a n e t 而成为目前i n t e r n e t 的新的主干。 我国连入i n t e m e t 的时间较晚,大约在1 9 8 7 年才开始与i n t e m e t 有所 接触,也仅仅是采用各种方式间接地使用i n t e m e t ,一般也只有使用e - m a i l 的功能。 直到1 9 9 4 年5 月,由国家计算机和网络设施n c f c ( n a t i o n a l c o m p u t i n g a n d n e t w o r k i n gf a c i l i t yo fc h i n a ) 正式代表我国加入i n t e m e t ,建立了代表 我国域名的d n s ( d o m a i nn a m es e r v e r ) 。 目前,北京地区拥有直接连接i n t e m e t 际通信专线的国内机构有:邮 电部电信总局,中国科学计算机网络信息中心,中国教育科研计算机网, 中国科学院高能物理研究所计算机中心和北京化工大学例。 当我们把两台计算机互连起来,其中一台计算机就可以利用另外一台 计算机上的资源、设备,实现相互间的数据交换。当我们把三台计算机连 接起来,这便成了一个简单的计算机网络。计算机网络有很多种分类方式。 实际上用得最多的是按计算机网络的分布距离划分。按分布距离的大小我 们通常把计算机网络分为: 局域网阻a n ,l o c a l a r e a n e t w o r k ) 都市网( m a n ,m e t r o p o l i t a n a r e a n e t w o r k ) 广域网( w a n ,w i d e a r e a n e t w o r k ) 网间网( i n t e r n e t 又叫互联远程网、 其分类如表2 1 所示。 表21 网络分类 分布距离处理机住于同一网络分类 1 0 米房间 1 0 0 米建筑物局域网 1 公里校园 1 0 公里城市都市网 1 0 0 公里国家广域网 1 0 0 0 公里洲或洲际网间网 h a t e m e t 作为网间网,它实际上是一个网络的网络。世界各地局域网 通过电线、电话线、光纤电缆、微波传输以及卫星连到一起,这便形成了 i n t e r n e t 。 i n t e r n e t 上提供了大量的服务功能,包括e - m a i l 服务、文件传输服务、 远程登陆服务、a r c h i v e 文件寻找服务、b b s 电子公布拦、n e w s 讨论区 及w w f 服务等。而w w w 服务是当前i n t e m e t 网络上最热门的一套系 统】。 2 1 2 网络的传输协议 i n t e r n e t 是一组计算机的集合,他们之间通过t c p i p 协议进行通信 2 3 1 , 也就是说,t c p i p 协议相当于i n t e m e t 上计算机之间用来交流的语言。网 络协议是关于通信信道两端都能接收和执行的一组规定的规则,以便有序 的进行数据交换御。例如,在一个演讲环境中,一个被普遍接受的规则就 是不能同时有两个人发言。谁想发言需要举手。如果这个规则被所有参加 演讲的人接受,不遵守这个规则的人也许会被清除出场。同样,在通信过 1 0 重鏖奎堂堡圭兰堡垫塞 ! ! ! 墼! 壁塾望! 塑! ! 墼垂三叁 程中,需要有一组确定的规则被网络上所有参与设计的人所采用。 t c p i p 协议是指传输控制协议( t r a n s m i s s i o nc o n t r o lp r o t o c 0 1 ) 和网 际协议( i n t e m e tp r o t o c 0 1 ) 。它由美国国防部于1 9 6 0 年开始开发研制的, 其目的是指定和开发一纽卧议。这些协议能够为所有型号的计算机之间提 供可行的透明通信服务,而不管硬件设备或操作系统平台是否支持。i p 协议是t c p 协议的基础,t c p 的数据封装在伊的包中,l p 中还包括了 数据要送达的计算机地址。i p 地址是i n t e m e t 上每一台计算机均被赋予的 一个唯一的p 值,是一个分为四组、每组八位共三十二位二进制的数。i p 地址的分配通常按照网络、子网、计算机这 中层次的方式赋予。数据传送 时按p 地址的分层逐级在网络、子网、计算机中传送。但它不保证数据 是否按发送的先后顺序到达目标或数据是否真正到达目标。t c p 协议是 建立在p 协议的基础上的,它扩充了p 协议的功能,保证数据能可靠 地到达目的地,而且数据到达的顺序与发送的顺序相同,所以许多网络上 地客户、服务器程序均采用t c p 协议来发送请求和回送响应。t c p 还提 供了一个重要的特点:端口号。每台计算机有个唯一的口地址,但一 台计算机可能同时提供多种服务功能,各种服务功能有自己对应的服务进 程,端口号就是用来区分同一台计算机上的不同服务进程的,计算机收到 t c p 的数据包后,根据其中的端口号将数据交给响应的服务进程驯剐1 2 5 】。 多年来t c p i p 协议在全世界范围内得到了公认,因为它是世界上最 大的计算机网络i n t e m e t 的基础。t c p i p 普及的原因之一就是协议规范的 公用性和有效性。在这种意义上,t c p i p 完全可以被看作是一个开放的 系统 z a l 。通常用户依靠t c p i p 来完成文件交换、电子邮件( e - m a i l ) 和 远程注册工作。对用户而言,t c p 如同是利用网络执行这些任务的一组 程序,它在不涉及用户在基础过程中的细节和任何协议具体结构的情况下 来执行这些任务。如上所述,t c p f l p 已经成为一套更加综合、更加完善 的网络应用程序和服务。下面简要地描述使用t c p i p 的一些优点: t c p 仰提供了一个广泛的网络解法。因为它被指定连接任何两 个系统而不管它们是否支持的硬件和软件平台的自然情况如何, t c p i p 对很多企业需要的连接方式极为适应。目前更是如此 网络商同用户一样确信,单平台不能满足所有用户日益增长的 各种需要。因此,在企业网络上寻求一个混合平台已成为共同的 愿望。为了连接这样的环境,没有其它的解法比t c p i p 更为经 济有效。 t c p i p 是一个开放的系统。这意味着任何网络商和用户都可以 开发t c p i p 基本算法。在价格竞争目益激烈市场中,这种灵活 性意味着用户有很大的余地去选择产品和网络商,以及相关的配 套服务。 可以与i n t e m e t 连接,对于t c p i p 协议组是适应广域网的需要而 被确定的。因此,t c p i p 是众多广域网的有效方法之一,可以 连接地理上分散的机构,而且主张与i n t e m e t 连接的企业具有利 用i n t e m e t 网络连接分支机构到f “门总部的权利叨。 2 1 3 w w w 及w w w 文档简介 、 n 兀) i r 是一个遍及全世界的信息系统,也是i n t e m e t 上高效的检索工 具,能将位于i n t e m e te 不同站点上的信息资源以超文本、多媒体的方 式有机地“编织”在一起,从而提供全球范围的服务。这种编织是按超 文本的关键字组织起来的,对于相关文档的地址,只要用鼠标点击相应的 关键字,就可以方便地从信息地a 到达信息地b ( a 、b 可以是在不同的 主机上或不同的文档中) 。这些信息的连接是透明的。n r 的客户程序 - w w w 浏览器,有非常易于使用的界面,它可以阅读w ,、) i ,服务器 提供的众多超文本文件,并根据用户的选择去搜索信息。 网络上的系统机构多数是客户服务器模式闭,服务器端负责数据和 图象等的存储、维护、管理以及传递,客户端则负责人机界面的操作、送 出需要及显示取回的数据。通常由客户机启动与服务器的对话,客户机生 成请求并发送给服务器,服务器接到客户机的请求之后作出响应,并把处 理的结果传回客户机,由客户机向用户解释和显示结果。客户环境如何请 求服务器和服务器如何应答请求的各种方式称为协议,它相当于计算机之 间用来交互的语言。客户朋陵务器模式入图2 1 所示。 图2 1 简单的客户绡匪务器模型图 w w w 也是基于c s 模式的。在w e b 中,客户机的任务是: 1 帮助用户制作一个请求( 通常在用户单击某个超连接时) 。 2 将用户的请求发送给某个服务器。 1 2 重鏖查堂堡圭堂堡篁奎 ! 望! 塑坠星墅! 塑! 堡量墨:墨 3 接受服务器传来的文件并显示h t m l 文件和传送其它各种文件给 相应的外部实用程序。外部实用程序是可以被客户程序调用而呈现特 定类型文件的程序。 在w e b 中,服务器的任务是: 1 存放各种以h t m l 语言编写的超文本文件。 2 接受客户机发来的请求,并进行合法f 生检查,针对客户的请求进 行处理,把处理的结果制成数据包,然后把它发送给发送请求的 客户机。 龟) r r p 与i i t m l 图2 2 w w w 的客户n 务器模型 h t t p ( h y p e rt e x tt r a n s f e rp r o t o c 0 1 ) 协议是为分布式超媒体信息系 统设计的一个协议。它是无状态面向对象的协议,能够满足高速简单的需 要,是w w w 的通信协议。 其运行的过程是用户通过键入一个称为u r l 的地址来指定想要看的 网页,然后浏览器制作一个请求发给服务器( 使用端口号8 0 ) 。服务器监 测到8 0 端口有数据到达时,找到8 0 端口对应的服务功能,然后启动一个 h t t p 守护进程,h t t p 守护进程收到请求后创建一个新的子进程为该请 求服务。并把处理的数据结果转换成客户机指定的格式发给客户机,然后 终止进程。 h t m l 是一种描述语言而不是过程语言,他使用标签元素来说明信息 的排列格式,指出所显示的图像和超文本连接等。超文本文件不象传统的 “封闭式”文件,而是一种“开放式”文件,在阅读时同时可以获得文 内提及的相关信息,也就是说在文中插有连接到其它文件的“超连接” 一指针,只要在指针上点击鼠标,就会显示出连接的关联文件的内容。如 图2 3 所示 图2 3 超连接 h t i v l l 内还有许多代码,这些代码放置在文本中,使文本能被浏览器 以指定的格式显示出来,所有的浏览器都可以解释h t m l 代码,并以代 码来确定文档的结构。使用超连接可以在页面之间任意跳跃,这种方式既 能提供丰富的信息,又不会造成站点的混杂。h t m l 具有平台的独立性, 即服务器上的h t m l 文档无论用什么样的浏览器,什么样的配置都可以 得到同样的效果。 在、 ,、) 1 w ,服务中,每一个页面都是以h t m l 的格式进行编写,它包 含文字、图形、声音、动画及超连接所指向的文本所组成的信息。w 、 n j , 从当初用于文档浏览发展到当前用于电子贸易经历了三个阶段,下面介绍 这三个阶段的文档。 1 ) 静态文档阶段 此阶段w w w 主要用于静态页面的浏览,用户通过客户机上w w w 浏览器,可以访问i n t e m e t 上的w w w 站点,每一个站点都有个主页作 为进入该站点的人口。从服务器来看,每一个w 惭,站点由一台主机 w 、 ,、服务器以及许多w w w 页面所组成,以主页为首并以其它页面为 节点,形成一个树状结构,每一页面都是用h t m l 的格式编写的,h t m l 提供了控制超文本格式的信息,利用这些信息用户可以在屏幕上显示出特 定设计风格的w w w 页面,w 、) ln ) l r 服务器使用哪传输协议,将h t m l 文档从服务器传到用户的浏览器。 2 ) 动态页面阶段 数据库是管理信息最有效的方式,大量的信息总是存储在数据库中, 因此人们迫切需要将数据库与w w w 结合在一起,在w w w 上发布来自 数据库的信息。随着技术的发展,全球的主要数据库厂商竟相推出了一批 相关技术,以帮助用户在w w w 上发布数据和更有效地访问数据库中的 1 4 数据。以下几种方案可以使、) l ,、 n v 上访问数据库时,产生能显示数据库 中内容的动态、 n ,页面: a 公共网关接口( c g i ) 。c g i 是一种服务器功能扩展机制,c g i 应用 程序是由普通的编程语言编写的程序,他允许服务器运行它,按照不同的 考核需要来动态地构造w 、 ,、v 页面,或在、 w ,页面中对数据进行修改。 见图2 4 所示。 b 应用程序接口( a p i ) 。a p i 是驻留在w w w 服务器的程序代码,一 般与w w w 服务器软件处于内存的同一地址空间中,每次调用时是在内 存中运行相关的程序段。见图2 4 所示。 图2 4 提供c g i 和a p i 应用程序的w e b 服务器 c 服务器端嵌入法( s s i ) 。在h t m l 文档中插入程序语言,w v w ,服 务器在发送h t m l 页面之前,先扫描整个页面,如发现有s s i 语句,则 利用资源在相应位置插入动态相关信息,使得w w w 服务器将少量的动 态数据直接插入h t m l 文档中,然后才把页面发送给考核端。浏览器下 载了包含s s i 语句的h t m l 页面之后,利用其内含的解释器逐条解释执 行s s i 语句,从而完成交互功能。 d 与数据库直接连接。数据库厂商的与w 、】l 哪,连接产品里,使用了其 它数据库直接连接技术,例如,o r a c l e 公司的w w ws e r v e r 2 0 ,m i c r o s o f t 公。司的i n t e m e t 数据库连接器等。他们都能动态地查询和更新数据库,并 实时动态地产生h t m l 格式的数据。 3 ) 实时可伸缩的事物处理阶段 蒯鼢髓胤勰黼蝴础糖贿坷魁 一一一一一 b 枷:;旨鹃酚嬲端 一一一一一 重鏖奎兰堡圭堂堡垒塞 ! 坠! 些垦墅罂! 些耋三:叁 存在于全球网络的什么地方,只需知道对象的名字和对象接口。 2 2 搜索引擎简介 2 2 1 搜索引擎的基本原理 w w w 是一个巨大的“图书馆”,包含了任何一个可以想像的到的主 题。但是w w w 这个“图书馆”与人们熟悉的图书馆是有区别的,它没 有卡片目录和管理员,所有的书都是随意放的。因此,要想查找某一特定 的条目是很困难的,而且w ,、v 每天正以惊人的速度在不断增长,不断 的有许许多多心得和想象在加入,这将使查找变得更加困难。搜索引擎 ( s e a r c he n g i n e ) t 是为解决用户的查询问题而出现的。如果说i n t c m e t 上 的信息浩如烟海,那么搜索引擎就是海洋中的导航灯。只有通过搜索引擎 的查询结果,用户才会知道信息所在的地点,再去该网站获得详细资料。 搜索引擎工作过程基本一样,包括以下三个方面: 1 ) 派出绰号为“蜘蛛( s p i d e r ) ”、“爬行者( c r a w l e r ) ”或“机器人( r o b o t s ) ” 的网页搜索软件在各网址中爬行,自动访问网络中公开区域的每一个站点 并记录其网址,搜索其中的信息,并将它们带回搜索引擎 2 ) 将信息进行分类整理,建立搜索引擎数据库 3 ) 通过w 曲服务器端软件,为用户提供浏览器界面下的信息查询 2 2 2 流行的搜索引擎及其工作原理 就搜索引擎的发展来说,大致经历了两个阶段,第一个阶段是以y a h o o 和a l t a v i s u t 为代表的第一代搜索引擎,第二阶段是以g o o g l c 和d i r c c t h i t 为代表的第二代搜索引擎。有的搜索引擎以搜索速度快见长,有的以数据 库大见长,有的则以搜索精度高见长。下面分别把这些搜索引擎的特点作 一简要介绍: o y a i o o ! ( 雅虎) y a h o o 提供w w w 服务的节点,是一个面向主题 的大型索引,按主题词建立分类索引,并且有功能完备的检索方式, 非常有效,但也异常拥挤,每天约有5 0 0 万人次访问:严格说来y z z h o o 1 6 重鏖奎堂堡圭堂堡垒塞 ! 墅! ! 丝堡墅些! 堡童三墨 不足搜索引擎,而是严格的按层次组织的主题索引。雅虎的分类索 引由上千名编辑人员来维护,所以质量很高,深受用户欢迎。y a h o o ! 的使用很简单。只要输入查找单词,单击按钮即可。它将返回三种 信息:1 ) 满足查询条件的y a h o o 的目录( 用户可以利用它们进行 交叉引用) ;2 ) 满足条件的实际站点:3 ) 更广泛的含有页面索引 的y a h o o 目录,这是一种更广泛的交叉引用。虽然不能进行很高级 的搜索,但用户可以控制。其中收录了多达7 2 5 0 0 0 个站点。没有 找到的搜索,被y a h o o 自动指引到a l t av j s t a 的搜索引擎。y a h o o 在搜索引擎中占有率为将近5 6 ,远高于第二名a l t a v i s t a 的1 1 1 8 和e x c i t e 的9 6 6 。 a l 诅v i s t a 是美国d i s t a l 公司开发的一个大型、快速的搜索工具, 是且前因特网上最优秀的搜索工具之一。其数据库堪称业界最大 的。在这里用户往往可以找到其它网站搜索不到的内容。但是它的 缺点也很明显,它没有作任何分级整理工作,它的返回结果不是一 系列超连接的场所,而是一系列h t m l 文档。这样返回的结果就 有可能有重复成分。此外a i mv i s t a 的高级搜索功能把用户引入到 一个晦涩的命令行界面。 e x c i t e 使用的是基于关键词或基于概念的正文和主题搜索。概念 搜索不是只简单地查找含有要查找的单词的文档,同时还搜索同 要查找的概念相关的文档。缺省的查找是概念查找。在同一个搜索 框内可以输入简单的或更高级的搜索,包括布尔搜索和逻辑组。用 户不能像其它一些搜索引擎一样控镣 j 搜索结果的格式。对于所有的 搜索引擎来说,在搜索框内输入的描述单词越多,查得的相关结果 越少。按照它的分级算法,在搜索框内出现的一个单词的次数越多, 含有它的结果的等级越高:d o g d o g d o g c a t 将使含d o g 的结果的等级 比含c a t 的结果的等级高。当用户输入要查找的词后,e x c i t e 会提 示并建议和另外的词一起搭配起来搜索。 ( 互) g o o g l e 是借用“g o o g o l ”( 十的一百次方) 一词的词义的而派生 的名字,意在为天文数字的网页作索引。其独特的网页排序方法是 根据某网页被其它重要的网页链接的次数,而不是根据搜索关键词 在某网页中出现的次数。其优点是可以防止用各种靠技术手段以提 高网页被检索机率的投机行为。用户可以直接查看任何被检索网页 的“排序根据”,即该网页被哪些重要的网页所链接。这种排序上 1 7 的“透明”| 生是任何其它一种搜索引擎所不具备的。它最初只是美 国斯坦福大学的一个研究项目。从今年2 月开始,该项目步入商业 化发展阶段,由于科技含量高,搜索速度极快,很快便获得全面的 成功,被称为新二代的搜索引擎。 其它著名搜索引擎还有n o r t h e m l i g h t 、i n f o s e e k 、h o t b o t 、 w e b c m w l e r 、e l n e t 、g a l a r y 、l y c o s 、d i r e c t _ h i t 、f a s ts e a r c h a l l t h ew e b 等英文搜索引擎以及中文雅虎、中文a l t a v i s t a 、中文e x c i t e 、搜狐、 北极星、搜索客、新浪、悠悠、常青藤、天网、若比邻、网络指南 针、司南( y i p p e e ) 等中文搜索引擎,这些搜索引擎在搜索机制j 二 与上述几种搜索引擎大同小异,在这里就不一一介绍。 大部分搜索引擎的共同特点是它们使用的仍然是倒排文件索引并允许 使用布尔运算符和接近操作符、括号等,查找的结果按关键词排序。如输 入“a l u m i n u ma n dw e l d i n g ”即表示希望查找到的结果同时包含有 a l u m i n u m 和w e l d i n g 关键词,而输入“a l u m i n u mo rw e l d i n g ”则表示希 望查找到的结果只需包含有a l u m i n u m 或者w e l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论