高中信息技术 必修1 数据的采集 课件_第1页
高中信息技术 必修1 数据的采集 课件_第2页
高中信息技术 必修1 数据的采集 课件_第3页
高中信息技术 必修1 数据的采集 课件_第4页
高中信息技术 必修1 数据的采集 课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、教材版本:粤教版必修一数据与计算授课年级:高一课程名称:数据的采集授课教师:侯波所在单位:深圳市宝安中学(集团)高中部深圳市中小学在线教学托底课程5.2 数据的采集必修一 数据与计算侯波深圳市宝安中学(集团)学习资源包请预先下载第五章知识回顾:第一章常见的数据类型有哪些?这数据类型用什么设备可以获取?文本,图片,音频,视频等键盘,数码相机,麦克风,数码DV等高中信息技术必修1 数据与计算5.2 数据的采集1、明确数据应用项目的需求,能制定数据采集的需求清单;2、知道数据采集的方法和工具;1、了解数据采集的基本方法。学业要求学习目标高中信息技术必修1 数据与计算5.2 数据的采集1PART ON

2、E什么是数据采集什么是数据采集 数据采集是利用一种装置,从系统外部采集数据并输入到系统内部的一个接口。(百度百科) 数据采集是指根据需求采用适当的方法和工具获取所需要的数据。(课本描述)1 数据采集是目前一个重要的研究领域,有大量书籍和研究文献供我们学习。2 对于我们而言,从数据采集的过程、数据采集的方法和工具,来理解数据采集。3数据编码数据编码、现有数据获取高中信息技术必修1 数据与计算5.2 数据的采集体验数据采集 需要获取什么数据?经纬度去哪儿找经纬度?手机APP手机APP为什么能获取经纬度? GPS定位传感器动手:下载手机APP,获取经纬度。安装时注意,要允许APP获取“位置信息”权限

3、。高中信息技术必修1 数据与计算5.2 数据的采集如何记录当前自己的精确位置?体验数据采集高中信息技术必修1 数据与计算5.2 数据的采集如何记录当前自己的精确位置?2PART TWO数据采集的过程数据采集的过程明确数据应用的需求围绕项目主题,制定数据采集的需求清单和内容大纲。第1步选择适当的方法和工具针对不同数据类型,选择适当的工具,运用有效的方法,进行数据采集。第2步数据的存储和保护采集的数据要选择合适的存储方式并注意数据安全,为数据分析和可视化表达做准备。第3步经纬度手机APP+GPS传感器记录经纬度高中信息技术必修1 数据与计算5.2 数据的采集确定项目的数据需求 淘宝购物平台上各种商

4、品应有尽有,假如你在该平台开了一个零食网店,最近你要调整经营策略,以提高网店的盈利水平。 在调整经营策略之前你必须进行前期调研分析,比如通过分析淘宝网上各类零食的销量数据,去重新定位销售商品的种类和价格;通过分析网店销售数据订单,去了解客户的购物喜好,去判断哪些商品可以捆绑销售。从而下架一些销量不好商品和上架一些新的商品。 那么,你要完成前期调研工作,需要获取到哪些数据呢?完成下表中第2,3列。编号项目数据内容大纲数据来源采集方法和工具数据保存方式123各类零食销售数据:包括商品名称、店铺名称、商品价格、商品销量淘宝网-零食类别客户购物喜好数据:包括商品价格、商品销量、商品评论店铺销售订单数据

5、:包括每个订单购买的商品名称、数量淘宝网-零食类别淘宝网店铺后台高中信息技术必修1 数据与计算5.2 数据的采集3PART THREE数据采集的方法和工具数据采集的方法传感器采集法利用数据采集设备,检测、采集物理信息,并将其转换为电信号形式表示的一种采集方法。1高中信息技术必修1 数据与计算5.2 数据的采集数据采集的方法传感器采集法利用数据采集设备,检测、采集物理信息,并将其转换为电信号形式表示的一种采集方法。1系统日志采集法利用系统中记录硬件、软件和系统问题的信息文件来采集数据。有操作系统日志、应用程序日志、安全日志等。如:通过Web日志,获取网站点击率。2高中信息技术必修1 数据与计算5

6、.2 数据的采集网络数据采集法通过网络爬虫或网站API(应用程序接口)等方式从网站上获取数据信息。3网络爬虫网络数据采集的工具网络爬虫1、又称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。通常分为通用爬虫和聚焦爬虫。高中信息技术必修1 数据与计算5.2 数据的采集高中信息技术必修1 数据与计算5.2 数据的采集网络数据采集的工具网络爬虫又称全网爬虫,它将爬取对象从一些种子 URL扩充到整个Web上的网站,主要用途是为门户站点、搜索引擎和大型Web服务提供商采集数据。通用爬虫用户检索爬虫爬取高中信息技术必修1 数据与计算5.2 数据的采集网络数据采集的工具网络

7、爬虫又称全网爬虫,它将爬取对象从一些种子 URL扩充到整个Web上的网站,主要用途是为门户站点、搜索引擎和大型Web服务提供商采集数据。通用爬虫高中信息技术必修1 数据与计算5.2 数据的采集网络数据采集的工具网络爬虫又称主题网络爬虫,是指选择性地爬取那些与预先定义好的主题相关的页面的网络爬虫。聚焦爬虫网络爬虫网络数据采集的工具网络爬虫1、又称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。2、网页:是一个包含HTML标签的纯文本文件。3、用户浏览网页:浏览器提交请求-下载网页代码-解析/渲染成页面。4、爬虫程序:模拟浏览器发送请求-下载网页代码-只提取有用的

8、数据-存放于数据库或文件中。5、Robots协议:用来告知爬虫哪些页面能被抓取,哪些页面不能被抓取。以此为爬虫使用规范。高中信息技术必修1 数据与计算5.2 数据的采集爬虫程序实践搭建“网络商城”网站:安装、并运行XAMPP,启动Apache、MySQL;将文件“wholesale.html”复制到C:xampphtdocs目录下。安装Python扩展库:通过pip安装bs4、requests、xlwt、datetime等库。浏览抓取的数据:打开名如“nike*.xls”的excel文件。网站测试:浏览器输入/ wholesale.html ,访问网站,尝试查看网页源码。运行Python ID

9、LE调试:打开“程序5-3-2 爬取程序(教材范例).py”,阅读关键代码,调试运行。12345高中信息技术必修1 数据与计算5.2 数据的采集第1步、第3步可下载微课学习爬虫程序实践高中信息技术必修1 数据与计算5.2 数据的采集动手调试: 调试时,记录爬虫程序的关键语句,并说明作用,完成学习资源包中的记录表。思考: 如果将刚才爬虫程序中的” url = /wholesale.html ”,改成其它网络商城网址,能直接爬取数据吗?确定采集方法和工具 淘宝购物平台上各种商品应有尽有,假如你在该平台开了一个零食网店,最近你要调整经营策略,以提高网店的盈利水平。 在调整经营策略之前你必须进行前期调研分析,比如通过分析淘宝网上各类零食的销量数据,去重新定位销售商品的种类和价格;通过分析网店销售数据订单,去了解客户的购物喜好,去判断哪些商品可以捆绑销售。从而下架一些销量不好商品和上架一些新的商品。 确定数据需求清单后,对比各种采集方法和工具,选择哪种更合适呢?编号项目数据内容大纲数据来源采集方法和工具数据保存方式123各类零食销售数据:包括商品名称、店铺名称、商品价格、商品销量淘宝网-零食类别客户购物喜好数据:包括商品价格、商品销量、商品评论店铺销售订单数据:包

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论