就业扩展课-MongoDB-40TP01_第1页
就业扩展课-MongoDB-40TP01_第2页
就业扩展课-MongoDB-40TP01_第3页
就业扩展课-MongoDB-40TP01_第4页
就业扩展课-MongoDB-40TP01_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章使用idea开发网络爬虫,课程地位,2/22,本课目标,学完本门课程后,你能够,使用maven管理项目,使用网络爬虫爬取所需要的数据资源,开发微信公众号项目,使用MongoDB开发应用程序,3/22,课程项目展示,4/22,本章任务,任务1:使用新型IDE-intelliJIDEA开发项目任务2:使用网络爬虫爬取网络相关数据,5/22,本章目标,学会使用一款新型的编辑器IDEA了解网络爬虫的相关知识,6/22,IDEA下载和安装,下载地址,IDE多种多样,eclipse和idea是企业目前使用最广的两个IDE,7/22,IDEA项目管理,新建项目字体样式快捷键编译项目buildPathtomcatdebug项目打包,演示示例:使用idea创建,编译运行helloWorld项目,8/22,课堂练习,需求说明:使用idea创建演示案例中的helloWorld应用程序使用idea编译,调试,运行,打包helloWorld程序。,完成时间:7分钟,共性问题集中讲解,9/22,网络爬虫,360抢票二代/猎豹抢票百度/google搜索引擎一点资讯企业内部获取互联网数据,10/22,数据库,DOM解析,网络爬虫原理,11/22,请求URL,2,网络爬虫之网络请求,网络爬虫步骤,12/22,网络爬虫之DOM解析,javascript对DOM的操作,13/22,网络爬虫之DOM解析,jsoup,14/22,Element,Elements,Document,网络爬虫之DOM解析,15/22,Documentdocument=Jsoup.connect(URL).get();,/编写元素选择器类似于jquery选择器Stringselector=aclass=login;/选择元素Elementselements=document.select(selector);,jsoupAPI,网络请求DOM解析,16/22,Elementselements=document.select(selecter);selecter元素类型属性名称=属性值attr=value:包含属性且其值以value开头attr$=value:包含属性且其值以value结尾attr*=value:包含value的元素,元素1类型属性名称=属性值元素2类型属性名称=属性值,#id/Elementelement=document.select(#test);,jsoupAPI,按照属性选择元素根据多级元素选择按照ID选择,17/22,演示示例:使用jsoup基于idea开发挖段子网络爬虫,网络爬虫-开发流程,使用jsoup开发网络爬虫需求:爬取挖段子网的段子url:,18/22,演示示例:使用jsoup基于idea开发网易网络爬虫,网络爬虫-开发流程,使用jsoup开发网络爬虫需求:爬取挖网易的新闻url:,19/22,课堂练习,需求说明:使用idea爬取csdn的IT资讯使用idea爬取趣图网的趣图url:,完成时间:7分钟,共性问题集中讲解,20/22,总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论