




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中期检查报告,导师:答辩人:,论文概述,论文题目:分布式网络爬虫的研究应用主要工作:1、概述论文背景,简单介绍当前流行的分布式网络爬虫技术,例如Nutch分布式搜索系统。2、根据苏州贷后风险平台的需要,分析设计要点,实现分布式爬虫系统。3、将该分布式爬虫与普通爬虫进行对比实验,分析实验结果,进一步研究存在问题,提出改进措施,对本文进行总结。,已完成内容,1、完成了摘要、引言和相关技术基础的撰写;2、大体完成对分布式网络爬虫系统设计要点的分析及部分论文的撰写:整体结构:主从模式通信方式:Socket通信传输报文设计:信息类别+状态信息+URL信息信息传输:爬虫节点发起,中心节点应答异常处理:本地保存,信息回送,日志恢复3、已着手进行系统代码的编写,已完成内容,已完成,未完成内容,1、继续完成系统代码的编写;2、对系统进行测试,并通过与普通爬虫的对比,分析分布式爬虫的优势3、总结开发过程中的问题,提出改进方案4、论文总结与展望,下一步计划,4月中旬完成代码编写4月下旬进行系统测试与对比实验5月上旬完成系统改进,形成论文初稿5月中旬对论文进行修改并定稿,谢谢观看!,2015年3月23日,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论