




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
职业学院毕业论文(设计)题目搜索引擎中搜索器的研究与实现学生学号专业班级计算机应用技术系院名称计算机信息工程系指导教师二七年六月十日A2A0A1A3A4A0A5A6A9A10A7A12A8独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得XXX职业学院或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名年月日关于论文使用授权的说明本人完全了解XXX职业学院有关保留、使用学位论文的规定,即学校有权保留送交论文的复印件及电子版,允许论文被查阅和借阅G727学校G2499以G1856G5079论文的全G18108或G18108G2010G1881G4493,G2499以G18331用G5445印、G13565印或其他复G2058G6175G8585保G4396论文。保密论文在解密后应遵守此规定学生签名年月日导师签名年月日A11A13A14A15A16A13A17A18A19A20A21A22A23搜索引擎中搜索器的研究与实现摘要G6640G13046G5353G6818是G1186WWWG990G5567G17907而有G6940地获取G1461G5699G17176G9316的G6475G5464,而G13605G13488G15596G15535G6228G7427G2029是G6640G13046G5353G6818的关G19202。G20330G1820G1183G13473了G6640G13046G5353G6818的工作G2419G10714及其G13007G13491G13479构,G9994G2530G2010G7524了G6640G13046G5353G6818中G6640G13046G3132的地位和G18337G16213G5627,G7380G2530G6564G1998了G4466G10628一个中G4579G3423G13605G12461G7246G14033G6640G13046G5353G6818的G16786G16757G5617G17347。本文对G1122G7246G14033G6640G13046G3132的G16786G16757与G4466G10628,G1039G16213是在G10628有G13605G13488G15596G15535的G3534G11796G990,G6564G1998了以G13605G20041G16792G1227G1552或权G4053G5242为G1393G6466确定G6640G13046G12586G11065的G5617G17347,并G6564G1998了G7368G5567G6475、G7368全G19766的G6564取URL的G12586G11065。本文对G3926何G6564取文G7735G6700G16213做了研究,G6564G1998以G16833G2489位G13634、关G19202G16801、与标G20076G11468关G5242、G13059G16757G11468G1296G5242G3247个G2454G6980为G1393G6466,G6365所得G2052的G16833G2489权G1552对文中所有G16833G2489进行G6502G5219,确定G16833G2489在G6984个文G7735中的G18337G16213G5627,G11013G8504G6365G10043一定的G2399G13565G10587得G2052G6984个文G7735的G6700G16213。本文的研究G7094G1867有一定的G10714论意G1053和G6228G7427G1227G1552,G2460G1867有一定的G5078G3342G1227G1552,它G4570有G2173G1122G6640G13046G5353G6818G7246G14033G2282的G6564G20652,对G10995G8975G1461G5699、G4101G1060G1461G5699、G12197研G1461G5699、G2842业G1461G5699的G7828G13046和获取,G6205G3835G2842业机会,G1867有较G3835的社会和经济G6940益。关键词G6640G13046G3132,URL,G7246G14033,G6640G13046G12586G11065,文G7735G6700G16213A24A25A26A27A28A25A29A30A31A32A33A34A23A23目录G6640G13046G5353G6818中G6640G13046G3132的研究与G4466G10628I目录II第1章前言311课G20076的意G1053312国G1881外研究G10628状313课G20076的研究目标3第2章G6640G13046G5353G6818的工作G2419G10714和G13007G13491G13479构421G6640G13046G5353G6818的工作G2419G10714422G6640G13046G5353G6818的G13007G13491G13479构523本章G4579G134795第3章G6640G13046G5353G6818中G6640G13046G3132的G16786G16757G5617想631G6640G13046G3132G3534本概念的G10714解632G7246G14033G6640G13046G3132G13007G13491G13479构的G16786G16757633G6640G13046G12586G11065的G16786G16757G5617想634文G7735G6700G16213G6564取方法G16786G16757G5617想635本章G4579G134796第4章G7246G14033G6640G13046G3132的G16786G16757G4466G10628741G6640G13046G3132的G6640G13046程G5219的G16786G16757742文G7735G6700G16213G6564取的G1867体G16786G16757743本章G4579G134797第5章试验G13479果851G6640G13046算法的试验G13479果与G5627G14033G2010G7524853本章G4579G134798第6章总G13479961G1039G16213工作和创新点962G4396在的问G20076及未来的方向9G2454考文献10致谢11个人简历错误未定义书签。A24A25A26A27A28A25A29A30A31A32A33A34A35第1章前言11课题的意义因特G13605G990的G1461G5699呈几何级G6980增长,G19766向因特G13605的G1461G5699获取与处G10714G6228G7427是当前G16757算机G12197学与G6228G7427领域急需研究的课G20076。12国内外研究现状国G1881关G1122G6640G13046G5353G6818和G6640G13046G3132的研究始G1122对国外G11468关成果的G1183G13473,G2052G10628在渐渐成为热点,G1186论文G6980量的G2010支专G20076G2010G5079看,综合G5627研究论文的G6980量远远超过细G2010G2282专门领域的论文及成果G6980量。国外未来G6640G13046G5353G6818的发展应朝着G7246G14033G3423综合G2282的方向发展A36A37A38A36A39A38。13课题的研究目标通过对G6640G13046G5353G6818工作G2419G10714及G13007G13491G13479构的研究,以JAVA为开发工G1867,编写G7246G14033G6640G13046G3132来G6564G20652G6640G13046G5353G6818的G6640G13046G14033力。尤其是在G6564G20652全、准、G5567、省方G19766有明显的G6940果。拟解决的关G19202问G200761G18331用多线程编程G6228G7427G16786G16757中G4579G3423G13605G12461的爬行算法。2根G6466G16833G2489位G13634、关G19202G16801权G18337、G11468G1296G5242等对文G7735G1881G4493进行G6700G16213的G6564取。A24A25A26A27A28A25A29A30A31A32A33A34A40第2章搜索引擎的工作原理和系统结构21搜索引擎的工作原理211搜索引擎的工作原理G6640G13046G5353G6818一般G11013G6640G13046G3132、G13046G5353G3132、G7828G13046G3132和用户接口G3247个G18108G2010组成。1G6640G13046G3132其功G14033是在互联G13605中漫游、发G10628和G6640集G1461G5699。并行G16757算G6228G7427,以G6564G20652G1461G5699发G10628和G7368新的G17907G5242。2G13046G5353G31323G7828G13046G31324用户接口212搜索引擎的比较对几个著名G6640G13046G5353G6818G1186G7828G13046功G14033、G13479果显示格式、G13479果G6502G5219规G2029、标G5353G1881G4493、G1461G5699G18331集等方G19766作个总G13479。1G7828G13046功G14033几种G1039G16213的G6640G13046G5353G6818均支持单G16801、关G19202G16801的简单和G20652级查询功G14033。支持G5079尔运算,一般缺省为OR运算。2G13479果G6502G5219规列关G19202G16801、G7828G13046G16801在所有这些G6640G13046G5353G6818中均是G13479果G6502G5219的G18337G16213G1393G6466。3标G5353G1881G4493总之,G11013G20652G2052低的顺G5219是INFOSEEK、OPENTEXG87、G361G87AG57G76G86G87AO在用户G11040G19766G990G36G76G87AG57G76G86G87A和G43OG87G37OG87做得G8616较G3921。213搜索引擎存在的缺陷G7092论是G16786G16757G17836是G6925进G6640G13046G5353G6818,G18129G2494有一个G1998发点G2174力使G6640G13046G5353G6818发G6393G7380G3835的作用。214搜索引擎的特征G7246G14033G6640G13046G5353G6818G16786G16757G17873G8726的目标是根G6466用户的G16843G8726,G1186G2499以获得的G13605G13488G17176G9316中G7828G13046G1998对用户G7380有G1227G1552的G1461G5699。一般而言,G7246G14033G6640G13046G5353G6818有G989个G1039G16213的特G54611G13605G13488G15596G15535的G7246G14033G22822G14270G17878应用户的G14033力A24A25A26A27A28A25A29A30A31A32A33A34A413G6640G13046G5353G6818人机接口的G7246G14033G2282215搜索引擎的发展方向及研究热点22搜索引擎的系统结构221搜索引擎中的搜索器1G3534本机G20582G13605G13488G15596G15535222搜索引擎对网页的标引处理1G13605G13488G15596G15535对G13605G20041的G3534本标G5353方法223搜索引擎的数据组织和用户检索机制23本章小结G6640G13046G3132在G6640G13046G5353G6818中G2356有G18337G16213位G13634,G6640G13046G3132的功G14033是在互联G13605中漫游、发G10628和G6640集G1461G5699,G13605G13488G15596G15535是G18331用G14270G2172G18331集方式的G6640G13046G5353G6818的G7692G5527。它G18331用G2010G5079式、并行G16757算G6228G7427尽G2499G14033多、尽G2499G14033G5567地G6640集新G1461G5699和定G7411G7368新G7099G1461G5699,以G18003G1825G8527G17842接和G7092G6940G17842接,为G8504G6640G13046G3132的G4466G10628G5132以G1461G5699发G10628和G7368新G17907G5242的G6564G20652。A24A25A26A27A28A25A29A30A31A32A33A34A42第3章搜索引擎中搜索器的设计思想31搜索器基本概念的理解一个G6640G13046G3132G3534本G990G18331用G9157G5242G1260G1820或G5203G5242G1260G1820G1016种方式的G6640G13046G12586G11065来完成G13605G20041的G18331集,G1306是这G1016种方式G2520有所长、G2520有所G11713,本文G19036对G7588一G14551G3272G1881的G6640G13046G6564G1998了G1820G18331用G9157G5242G1260G1820G1889G5203G5242G1260G1820的G6640G13046G12586G11065,并应用G2052所G16786G16757的G6640G13046G3132中。32智能搜索器系统结构的设计在G2317G18209的过程中,尤其在增G5390的文G7735G16792G1227中,G2317G18209G12586G11065和G13044材是G1016个G18337G16213的G2454与对G16949。33搜索策略的设计思想G1186以G990G2520G18108G2010的作用G2499以看G1998,G16213G6564G20652G6640G13046G3132的G6640G13046G6940果G2494G16213增加其中G7588一G18108G2010的G6940G10587G4613G2499以增加G6640G13046G5353G6818的G6640G13046G6940果,本文G1039G16213通过通过G6640G13046G9157G5242的G6523G2058来G4466G10628较G3921的G6640G13046G6940果。331系统工作流程分析332搜索策略的设计思想34文档摘要提取方法设计思想341文档摘要实现思想342文档摘要实现流程35本章小结通过G2010G7524G2520种不同的G6640G13046G12586G11065G10995成。A24A25A26A27A28A25A29A30A31A32A33A34A43第4章智能搜索器的设计实现41搜索器的搜索程序的设计411网络机器人的工作过程G3926何解决顺G5219问G20076和G1260G1820问G20076是本文研究的G1039G16213G1881G4493之一。412URL的解析方法G1867体的算法是413搜索算法的实现414搜索算法的说明并在完成G2530G6930G1849完成G19443列中。415搜索算法的主要程序代码分析42文档摘要提取的具体设计|,JIJISETSETSETSETSJSISIMUI4G164G1122是G13059G16757G11468G1296G5242G2499以用下式G16757算MIJJJIISSSIMSSCORES1,4G16G2443本章小结G6640G4559程G5219G16213对G13605G12461G1881G18108的G56G53G47进行G13007G13491而全G19766的G17953历,G11013G1122处G10714的G6980G6466量G5468G3835G17885G6333下一个G56G53G47进行G6640G13046。A44A45A46A47A48A45A49A50A51A52A53A54A55第5章试验结果51搜索算法的试验结果与性能分析53本章小结A44A45A46A47A48A45A49A50A51A52A53A54A56第6章总结61主要工作和创新点本文G16764论的G1039G16213问G20076有以下几个方G197661G6640G13046G12586G11065的研究2在进行文G7735G6700G16213G7114确定关G19202G16801合G10714的权G15523G16757算文中G16833G2489的总体权G1552并G6564取G1998文G7735G6700G1621362存在的问题及未来的方向G11013G1122G13605G13488G990G13605G20041的G6980量成几何级G6980在增加,G3926何G6564G20652G6640G13046G3132的G6640G13046G6940G10587成为G6640G13046G3132G1139G5465解决的一个问G20076,本文研究的G6640G13046G3132在确定G6640G13046G17876G1998的G19412G1552G3835G4579及G13605G20041权G4053G5242G18129G2499以G1889进行细致的研究。A57A58A59A60A61A58A62A63A64A65A66A67A68A69参考文献G621G64G75G87G87PG29G18G18G90G90G90G171G253G17G70OG80G18G76G87G18G76G87EG80G18G19G1521G27G25G15G251G26G26G17G75G87G80G79G622G64G19484G1820G17G7246G14033G6640G13046G5353G6818关G19202G6228G7427与研究G17G62工学G11817G3775学位论文G64G17G2716尔G9404G17G2716尔G9404工业G3835学G172G19G193G623G64G14005G15005G15G
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2020-2025年中国核电机组行业市场运行态势及投资方向研究报告
- 2025年 宜宾市江安县考调机关事业单位人员考试试题附答案
- 2025年电子烟行业深度分析报告
- 2025年中国儿童学习桌椅行业发展监测及投资前景展望报告
- 2025年中国真菌灵行业市场发展前景及发展趋势与投资战略研究报告
- 2025年 广西中医药大学招聘笔试试题附答案
- 2025年中国车铣一体机行业市场全景评估及投资前景展望报告
- 中国上海市网红经济行业竞争格局分析及投资规划研究报告
- 中国菜种行业市场前景预测及投资战略研究报告
- 中国河南省煤化工行业市场全景调研调查报告
- 健身房预售培训课件
- 智能化热模锻技术
- 个人车位租赁合同电子版 个人车位租赁合同
- 普惠性托育机构申请托育中心情况说明基本简介
- 外轮理货业务基础-理货单证的制作
- 《水火箭制作》课件
- 网络安全预防电信诈骗主题班会PPT
- 优秀物业管理项目评选方案
- 图书管理系统毕业论文参考文献精选,参考文献
- 中国当代旧体诗选读幻灯片
- 吉林省全省市县乡镇卫生院街道社区卫生服务中心基本公共卫生服务医疗机构信息名单目录995家
评论
0/150
提交评论