Python数据分析基础与应用电子活页8-4对日期时间数据进行灵活处理_第1页
Python数据分析基础与应用电子活页8-4对日期时间数据进行灵活处理_第2页
Python数据分析基础与应用电子活页8-4对日期时间数据进行灵活处理_第3页
Python数据分析基础与应用电子活页8-4对日期时间数据进行灵活处理_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python数据分析基础与应用模块电子活页8-4对日期和时间数据进行灵活处理【任务8-1】对日期和时间数据进行灵活处理【任务描述】编写代码实现以下功能。①从Excel文件orderInfo.xlsx的第一个工作表中获取“订单完成时间”和“商品金额”两列数据。②查看获取的数据的列名、数据类型、记录数量等相关信息。③单独提取“订单完成时间”列数据,指定格式符为“'Y-%m-%d”,将无效的数据解析为NaN。④查看数据集中各列数据的数据类型。⑤随机获取DataFrame中的5条销售日期数据。⑥分别从“销售日期”列中获取无时/分/秒的日期、年、月、日、季度和星期。⑦输出步骤(6)中获取的数据及对应数据类型。⑧将年份2021和2022、月份2和3、天数4和15、小时数2和3通过DataFrame结构组合为日期和时间数据。⑨将前面从“销售日期”列中提取的年、月、日数据重新组合为日期和时间数据。⑩从“销售日期”列中提取由年、月组成的数据。【任务实现】在JupyterNotebook开发环境中创建t8-01.ipynb,然后在单元格中编写代码与输出对应的结果。(1)读取Excel文件orderInfo.xlsx中的数据代码如下:importpandasaspdpath=r'data\orderInfo.xlsx'#获取“订单完成时间”和“商品金额”两列数据#默认读取Excel文件的第一个工作表sales_df=pd.read_excel(path,usecols=['订单完成时间','商品金额'])(2)查看列名、数据类型、记录数量等相关信息代码如下:sales_()输出结果:<class'pandas.core.frame.DataFrame'>RangeIndex:9entries,0to8Datacolumns(total2columns):#ColumnNon-NullCountDtype0订单完成时间9non-nulldatetime64[ns]1商品金额9non-nullfloat64dtypes:datetime64[ns](1),float64(1)memoryusage:272.0bytes(3)单独提取“订单完成时间”列数据提取“订单完成时间”列数据时指定格式符为“'Y-%m-%d”,将无效的数据解析为NaN。代码如下:sales_df['销售日期']=pd.to_datetime(sales_df['订单完成时间'],format='%Y-%m-%d',errors='coerce')(4)查看数据集中各列数据的数据类型代码如下:print(sales_df.dtypes)输出结果:订单完成时间datetime64[ns]商品金额float64销售日期datetime64[ns]dtype:object(5)随机获取DataFrame中的5条销售日期数据代码如下:print(sales_df["销售日期"].sample(5))输出结果:52021-02-2518:21:0522021-02-2011:11:5762021-03-1215:12:2802021-03-0620:40:1082021-03-2210:11:26Name:销售日期,dtype:datetime64[ns](6)从“销售日期”列获取日期数据分别从“销售日期”列中获取不包含时/分/秒的日期以及年、月、日、季度、星期数据,并输出这些数据。代码如下:sales_df['日期']=sales_df['销售日期'].dt.datesales_df['年']=sales_df['销售日期'].dt.yearsales_df['月']=sales_df['销售日期'].dt.monthsales_df['日']=sales_df['销售日期'].dt.daysales_df['季度']=sales_df['销售日期'].dt.quartersales_df['星期']=sales_df['销售日期'].dt.weekdaysales_df输出结果:(7)输出日期和时间数据对应的数据类型代码如下:sales_df.dtypes输出结果:订单完成时间atetime64[ns]商品金额float64销售日期datetime64[ns]日期object年int64月int64日int64季度int64星期int64dtype:object(8)组合日期和时间数据将年份2021和2022、月份2和3、天数4和15、小时数2和3通过DataFrame结构组合为日期和时间数据。代码如下:#将多个DataFrame列组合成日期和时间数据importpandasaspddf1=pd.DataFrame({'year':[2021,2022],'month':[2,3],'day':[4,15],'hour':[2,3]})pd.to_datetime(df1)输出结果:02021-02-0402:00:0012022-03-1503:00:00dtype:datetime64[ns]代码如下:#只传递需要组合的列df1=pd.to_datetime(df1[['year','month','day']])df1输出结果:02021-02-0412022-03-15dtype:datetime64[ns](9)将年、月、日数据组合为日期和时间数据将前面从“销售日期”列中提取的年、月、日数据重新组合为日期和时间数据。代码如下:df2=pd.DataFrame({'year':sales_df['年'],'month':sales_df['月'],'day':sales_df['日']})df3=pd.to_datetime(df2[['year','month','day']])df3输出结果:02021-03-0612021-03-0522021-02-2032021-02-2042021-03-0452021-02-2562021-03-1272021-03-1282021-03-22dtype:datetime64[ns](10)从“销售日期”列中提取由年、月组成的数据代码如下:sales_df['year_month']=sales_df['销售日期'].apply(lambdax:x.strftime('%Y-%m'))sales_df

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论