《大数据技术在财务中的应用》课件 4.1 采集数据_第1页
《大数据技术在财务中的应用》课件 4.1 采集数据_第2页
《大数据技术在财务中的应用》课件 4.1 采集数据_第3页
《大数据技术在财务中的应用》课件 4.1 采集数据_第4页
《大数据技术在财务中的应用》课件 4.1 采集数据_第5页
已阅读5页,还剩9页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目四搭建Python数据分析基础任务一采集数据CONTENTS认识DataFrame01多源数据采集02目录PARTONE认识DataFrame一、利用字典生成DataFrame二、利用列表生成DataFrame认识DataFrameDataFrame数据结构类似与Excel表格数据,如下表所示的某品类商品订单数据。接下来分别利用字典和列表,生成表中数据。利用字典生成DataFrame在生成DataFrame数据时,字典是一种常用的方法。通常,会将每一列的字段作为字典的键(key),而字段下的数据则作为对应的值(value),以此来构建DataFrame。通过使用importpandasaspd语句导入pandas模块,可以方便地在后续代码中调用它的功能。设置别名为“pd”后,只需在函数名前加上“pd”即可调用相关函数。也可以利用AI助手,辅助完成数据的生成。利用列表生成DataFrame使用列表生成DataFrame格式的数据,也是常见的构造方式。下面展示了如何通过列表,生成相同数据。DataFrame可以使用同名函数DataFrame()创建,该函数包含3个参数。(1)data:数据参数,是一组数据的集合。(2)columns:列索引,是纵向索引的集合;如果不指定,则默认参数值为从0开始的正整数序列。(3)index:行索引,是横向索引的集合;如果不指定,则默认参数值为从0开始的正整数序列。也可以借助AI助手,利用列表和字典,构造同样的DataFrame。PARTTWO多源数据采集一、通过接口获取订单信息二、通过read_excel()函数,获取客户信息三、通过read_html()函数获取城市和产品数据通过接口获取订单信息在处理大规模订单数据时,利用公开的数据接口,能够高效地从数万条订单记录中精准检索所需信息,提升数据处理的效率与准确性。通过read_excel()函数,获取客户信息可以借助AI助手,学习读取本地excel文件。将“客户数据表.xls”和对应的ipynb代码文件,存储在同一目录下,可以直接使用相对路径,获取客户信息。通过read_html()函数获取城市和产品数据read_html()函数,能够直接读取网页中标签为table的数据,比如本例中的城市和产品表,可以采用通过read_html()函数获取。结果列表里,包含了产品和城市的数据。通过列表索引,可以获取需要的数据。通过read_html()函数获取城市和产品数据限于篇幅,仅进行部分数据展示,df_list[0]为获取的第一张表,对应产品数据。通过read_

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论