Python文件和数据格式化基础知识解析_第1页
Python文件和数据格式化基础知识解析_第2页
Python文件和数据格式化基础知识解析_第3页
Python文件和数据格式化基础知识解析_第4页
Python文件和数据格式化基础知识解析_第5页
已阅读5页,还剩35页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python文件和数据格式化基础知识解析汇报人:XX2024-01-12Python文件操作基础数据格式化之字符串处理数据格式化之列表、元组与字典处理数据格式化之JSON处理数据格式化之XML处理数据格式化之CSV处理Python文件操作基础01文件打开与关闭打开文件使用`open()`函数打开文件,需要指定文件路径和打开模式。关闭文件使用`close()`方法关闭文件,释放资源。'r',用于读取文件内容。读取模式'w',用于写入文件内容,会覆盖原有内容。写入模式'a',用于在文件末尾追加内容。追加模式'b',用于以二进制方式读写文件。二进制模式文件读写模式文件指针指向当前读写位置的标记。定位方法seek()方法用于移动文件指针到指定位置;tell()方法返回当前文件指针位置。文件指针与定位FileNotFoundError(文件不存在)、IOError(输入/输出异常)等。常见异常使用`try...except`语句块捕获并处理异常。异常处理文件异常处理数据格式化之字符串处理02使用7位二进制数表示一个字符,共128个字符。ASCII编码Unicode编码UTF-8编码编码与解码方法统一不同语言字符的编码方式,采用16位或32位二进制数表示一个字符。可变长度的Unicode编码方式,用1到4个字节表示一个字符,兼容ASCII编码。Python中通过`encode()`方法进行编码,通过`decode()`方法进行解码。字符串编码与解码旧式字符串格式化01使用`%`操作符进行格式化,如`"Hello,%s!"%name`。str.format()方法02使用大括号`{}`作为占位符,通过`str.format()`方法进行格式化,如`"Hello,{}!".format(name)`。f-string格式化03在Python3.6及以上版本中引入,通过在字符串前加`f`或`F`来进行格式化,如`f"Hello,{name}!"`。字符串格式化方法字符串分割使用`split()`方法将字符串按照指定分隔符分割成列表。字符串替换使用`replace()`方法替换字符串中的某个子串。字符串查找使用`in`或`notin`操作符判断一个子串是否存在于另一个字符串中。字符串连接使用`+`操作符连接两个字符串。字符串截取使用切片操作截取字符串的一部分,如`string[start:end]`。字符串常用操作一种用于匹配字符串模式的强大工具,常用于文本搜索、替换等操作。正则表达式简介包括普通字符、元字符、限定符、定位符等,用于定义匹配规则。正则表达式语法Python中处理正则表达式的标准库,提供了一系列函数和方法进行正则表达式操作。re模块如匹配邮箱地址、提取网页中的链接等。正则表达式应用示例01030204正则表达式应用数据格式化之列表、元组与字典处理03列表推导式通过一行代码生成列表,常用于数据筛选、转换等操作。例如,`[x2forxinrange(10)]`生成一个包含0到9的平方的列表。生成器表达式类似于列表推导式,但生成的是一个生成器对象,可以节省内存。例如,`(x2forxinrange(10))`生成一个生成器,每次迭代计算一个平方值。列表推导式与生成器表达式VS元组是不可变序列,元素间用逗号分隔,常用于表示一组相关数据。元组支持索引、切片等操作,但不支持修改元素。应用场景元组适用于需要存储一组不可变数据的情况,如日期、时间、坐标等。此外,元组还可用作字典的键,以及用于集合中。元组特性元组特性及应用场景通过键值对创建字典,使用大括号`{}`或`dict()`函数。例如,`{'name':'Alice','age':25}`或`dict(name='Alice',age=25)`。通过键访问字典中的值,使用方括号`[]`或`get()`方法。例如,`dict['name']`或`dict.get('name')`返回`'Alice'`。如果键不存在,`[]`会引发`KeyError`异常,而`get()`方法返回`None`或指定默认值。字典创建字典访问字典创建与访问方法集合运算及去重功能Python中的集合支持交集、并集、差集等运算。例如,`set1&set2`返回两个集合的交集;`set1|set2`返回两个集合的并集;`set1-set2`返回属于`set1`但不属于`set2`的元素组成的集合。集合运算集合具有自动去重的特性,因此可以将列表或元组转换为集合以去除重复元素。例如,`list(set([1,2,2,3]))`返回`[1,2,3]`,去除了重复元素`2`。去重功能数据格式化之JSON处理04123JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,易于阅读和编写。JSON采用键值对的方式来组织数据,数据结构清晰明了。JSON支持的数据类型包括:数字、字符串、布尔值、数组、对象和null。JSON数据结构概述03使用`json.loads()`方法可以将JSON字符串转换为Python对象。01Python标准库中的`json`模块提供了对JSON数据的处理功能。02使用`json.dumps()`方法可以将Python对象转换为JSON字符串。Python中JSON模块使用方法编码过程将Python对象转换为JSON字符串,使用`json.dumps()`方法进行编码。要点一要点二解码过程将JSON字符串转换为Python对象,使用`json.loads()`方法进行解码。JSON数据编码与解码过程使用`json.JSONDecoder`类可以对JSON数据进行格式校验,确保数据符合JSON格式规范。在实例化`json.JSONDecoder`类时,可以传入自定义的解析函数,用于处理特殊的数据类型或格式。使用`json.JSONDecoder().decode()`方法可以对JSON字符串进行解码并进行格式校验,如果数据不符合JSON格式规范,则会抛出异常。JSON数据格式校验数据格式化之XML处理05XML文档组成XML文档由元素、属性、文本内容等构成,元素可嵌套形成层次结构。XML语法规则XML遵循严格的语法规则,如标签必须成对出现、大小写敏感等。XML命名空间XML命名空间用于区分不同来源的元素和属性,避免命名冲突。XML文档结构简介Python中XML模块使用方法第三方库,提供更强大、灵活的XML处理功能,兼容性好。lxml库提供轻量级、高效的XML处理功能,支持解析和创建XML文档。xml.etree.ElementTree模块实现DOM(文档对象模型)接口,支持对XML文档的复杂操作。xml.dom模块解析XML文档使用解析器将XML文档转换为内存中的对象模型,如DOM树或ElementTree。遍历XML文档通过遍历对象模型,访问XML文档中的元素、属性和文本内容。提取所需信息根据需要提取XML文档中的特定信息,如特定元素的文本内容或属性值。XML文档解析与遍历过程使用XML模块提供的API创建元素、属性和文本内容,构建XML文档结构。创建XML文档修改XML文档保存XML文档通过修改对象模型中的元素、属性和文本内容,实现对XML文档的修改。将修改后的对象模型转换回XML格式,并保存到文件或字符串中。030201XML文档创建与修改方法数据格式化之CSV处理06纯文本格式CSV文件的格式简单,易于阅读和编辑,可以用任何文本编辑器打开和查看。简单易读通用性强CSV文件是一种通用的数据交换格式,可以被大多数数据处理软件(如Excel、数据库等)读取和导入。CSV文件是一种纯文本格式的文件,它以逗号分隔不同的字段,并以换行符分隔不同的记录。CSV文件格式特点读取CSV文件使用csv模块的reader函数可以读取CSV文件的内容,返回一个reader对象,可以遍历文件中的每一行记录。写入CSV文件使用csv模块的writer函数可以将数据写入CSV文件,需要指定文件名和打开模式(如'w'表示写入模式)。导入csv模块在Python中处理CSV文件,需要首先导入csv模块。Python中CSV模块使用方法读取CSV文件示例importcsv```pythonCSV文件读写操作示例CSV文件读写操作示例withopen('example.csv','r')asfilereader=csv.reader(file)forrowinreaderCSV文件读写操作示例print(row)CSV文件读写操作示例CSV文件读写操作示例010203写入CSV文件示例```python```importcsvdata=[['Name','Age','City'],['Alice',25,'NewYork'],['Bob',30,'LosAngeles']]CSV文件读写操作示例CSV文件读写操作示例withopen('output.csv','w',newline='')asfile01writer=csv.writer(file)02writer.writerows(data)03```CSV文件读写操作示例CSV数据清洗与转换技巧数据转换根据需要,可以将CSV文件中的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论