版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
任务4.3CSV文件的应用——数据采集技术
任务描述010203知识点CSV文件格式读写CSV文件
04CSV转JSON文件
任务描述01
任务描述建军用Python爬取数据后,想用文件保存数据,并做进一步的分析。他了解到CSV文件、JSON文件都是目前非常流行的文件格式,本任务将练习CSV文件的读写等操作,CSV文件与JSON文件之间的转换操作,具体思路为:(1)了解什么是CSV文件及其特点和优势。(2)学习使用CSV文件的读写函数。(3)用Python的pandas模块读写CSV文件。(4)学习CSV文件转JSON文件的方法。CSV文件格式02
CSV文件格式学号,姓名,性别,年龄,城市1,张三,男,18,济南2,李四,,19,烟台3,赵五,女,18,青岛01普通CSV格式学号,姓名,性别,年龄,地址1,张三,男,18,"济南市,历下区"2,李四,,19,"烟台市芝罘区""烟台北站"""3,赵五,女,18,"青岛市,市南区"02含逗号、双引号等特殊字符的CSV文件学号,姓名,地址1,张三,”山东省济南市历下区新泺大街,齐鲁软件园北门”2,李四,"山东省烟台市芝罘区北马路135号,""烟台火车站""北广场北站出口"03含回车换行符的CSV文件CSV(Comma-SeparatedValues,逗号分隔值)是一种纯文本文件格式。CSV文件的每一行都是一条数据记录,每条记录由一个或多个字段组成,字段间用逗号(或其他符号)分隔,设计简单,易于使用。
读写CSV文件03
读写CSV文件0102读CSV文件importpandasaspddf=pd.read_csv('data.csv',encoding="gbk")print(df.head())写CSV文件importpandasaspddf=pd.read_csv('data.csv',encoding="gbk",na_values=["N/A","-","null"])print(df.head())df.to_csv("output_na.csv",na_rep="",header=False,index=False)CSV转JSON文件04JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。JSON数据由两种主要类型的元素组成:对象(Object)和数组(Array)。对象(Object)以大括号{}表示,里面存放键值对组成的数据结构,键(Key)必须是字符串,值(Value)可以是任何类型的数据。
JSON文件{"name":"zhangsan","age":30,"city":"Beijing"}数组(Array)以方括号[]表示,是一组有序的值,可以是任何类型的对象,包括数字、字符串、布尔值、其他数组或对象等。在JSON文件中,一般用数组存放多个JSON对象。
JSON文件[{"name":"zhangsan","age":30,"city":"Beijing"},{"name":"lisi","age":29,"city":"Shanghai"},]
案例:CSV文件转JSON文件准备CSV文件datas.csv文件:sno,sanme,sex,age,city1,zhangs,male,18,JN2,lisi,female,19,YT3,zhaow,female,18,QD使用Python代码实现格式转换
#读取CSV文件并转换为JSON格式withopen(csv_file,'r',encoding='utf-8')ascsvfile:csv_reader=csv.DictReader(csvfile)json_data=list(csv_reader)检查程序运行结果运行上述代码后,在同一目录下会得到一个名为datas.json的文件。010203
#将数据写入JSON文件withopen(json_file,'w',encoding='utf-8')asjsonfile:json.dump(json_data,jsonfile,indent=4)#使用indent设置每行缩进的字符数,以美化显示格式datas.json文件
程序运行结果[{"sno":"1","sanme":"zhangs","sex":"male","age":"18","city":"JN"},{"sno":"2","sanme":"lisi","sex":"female","age":"19","city":"YT"},{"sno":"3","sanme":"zhaow","sex":"female","age":"18","city":"QD"}]文件的基本操作——数据采集技术主讲人:李爱菊
中国人民大学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论