




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
6.1数据类型变换学习内容1.astype()方法2.
to_numeric()方法6.1数据类型变换pandas中进行数据类型变换有两种基本方法:(1)使用astype()方法进行强制类型变换。(2)使用pandas提供的to_numeric()方法变换为数字类型。6.1.1用astype()方法进行强制类型变换astype()方法可以将pandas的DataFrame对象的一列或多列数据变换为指定的数据类型,返回值为变换后的数据,默认更改的是原始对象的副本,语法格式如下:1DataFrame.astype(dtype,copy=True,errors='raise')6.1数据类型变换6.1.1用astype()方法进行强制类型变换表6.1.1
astype()方法的参数说明序号参数说明1dtype数据类型或列名称,将整个pandas对象强制变换为相同的类型。或者,使用字典{col:dtype,...}用于将一列或多列数据变换为特定的类型。2copy布尔值,默认为True,返回更改对象的副本。设置为False表示直接修改对象。一般不要轻易设置为False。3errors默认为raise,表示允许引发异常。还可以设置为ignore,表示忽略异常,出错时返回原始对象(版本0.20.0中的新功能。)01importpandasaspd02df=pd.read_csv('data/ratings.csv',sep=',')03df.dtypes04df案例:电影评分数据集(data/ratings.csv)6.1数据类型变换6.1.1用astype()方法进行强制类型变换05df2=df.astype('int64')06df2.dtypes07df3=df.astype({'用户编号':'int64','项目编号':'int64'})08df3.dtypes案例:电影评分数据集(data/ratings.csv)第5行代码将df对象的所有列都变换为整数,并保存到对象df2。第7行代码通过传递字典的参数,只改变了用户编号和项目编号的类型。6.1数据类型变换6.1.1用astype()方法进行强制类型变换09df4=pd.read_csv('data/booksales.csv',sep=',')10df411df4.dtypes12df5=df4.astype({'价格':'float64'})案例:图书数据集(data/booksales.csv)astype()方法的功能有限,只能进行纯数字的类型转化,如果数据包含其他符号,例如人民币的符号¥,则无法进行类型变换。所以,如果数据列不是纯数字,就不能使用astype()方法进行类型变换6.1数据类型变换pandas中的to_numeric()方法可以将参数变换为数字类型,默认返回的数据类型为float64或int64,语法格式如下:1pandas.to_numerice(arg,errors='raise',downcast=None)表6.1.2
to_numeric()方法的参数说明序号参数说明1arglist(列表),(tuple)元组,一维数组或Series对象2errors默认为'raise',无效的解析将引发异常。还可以是‘coerce’或’ignore’,‘coerce’表示将无效解析设置为NaN,‘ignore’表示无效的解析将忽略异常。3downcastdowncast:默认为None,根据数据自动变换类型。如果不是None,则根据以下规则将结果数据变换为可能的最小数字类型:'integer'或'signed'表示变换为最小的有符号整数(最小值:8),'unsigned'表示变换为最小的无符号整数(最小值:numpy.uint8),'float'表示变换为最小的小数(最小值:numpy.float32)6.1.2用to_numeric()方法变换为数字类型6.1数据类型变换to_numeric()方法进行数据类型变换的代码示例:01importpandasaspd02s=pd.Series(['1.0','2',-3])03pd.to_numeric(s)04pd.to_numeric(s,downcast='float')05pd.to_numeric(s,downcast='signed')'float'表示变换为最小的小数(最小值:numpy.float32)第5行代码设置to_numeric()方法的downcast='signed',变换为最小的有符号整数(最小值:8)6.1数据类型变换to_numeric()方法进行数据类型变换的代码示例:06s2=pd.Series(['apple','1.0','2',-3])07pd.to_numeric(s2,errors='ignore')08pd.to_numeric(s2,errors='coerce')09pd
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 授权经营土地协议书范本
- 水泵使用安全协议书范本
- 合作钢渣加工协议书范本
- 广告文案的结构讲课文档
- 知道智慧树动车组总体及机械装置检修与维护满分测试答案
- 甘肃省白银市会宁县第四中学2019-2020学年高一上学期期中考试英语试题
- 产能规划与绿色制造理念融合应用考核试卷
- 运动员职业生涯中期调整与规划考核试卷
- 纺织品价格波动与供需关系考核试卷
- 乳品企业供应链的数字化转型路径考核试卷
- 特殊学生教育课题申报书
- 2025年高考数学复习(新高考专用)第02讲函数与基本初等函数(2022-2024高考真题)特训(学生版+解析)
- 近海生态环境高时空分辨观测与人工智能赋能的有害藻华预报
- 2024年鲁人新版三年级数学上册月考试卷
- 钢筋机械连接技术规程 JGJ 107-2016
- 上海市算力基础设施发展报告2024年
- 集团总部薪酬管理制度
- 新能源汽车电池更换技术手册
- LED户外屏施工方案
- 2024至2030年中国晶圆代工行业市场供需形势分析及投资前景评估报告
- 肿瘤化疗导致的中性粒细胞减少诊治中国专家共识(2023版)解读
评论
0/150
提交评论