



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Python数据分析基础与应用模块电子活页8-4对日期和时间数据进行灵活处理【任务8-1】对日期和时间数据进行灵活处理【任务描述】编写代码实现以下功能。①从Excel文件orderInfo.xlsx的第一个工作表中获取“订单完成时间”和“商品金额”两列数据。②查看获取的数据的列名、数据类型、记录数量等相关信息。③单独提取“订单完成时间”列数据,指定格式符为“'Y-%m-%d”,将无效的数据解析为NaN。④查看数据集中各列数据的数据类型。⑤随机获取DataFrame中的5条销售日期数据。⑥分别从“销售日期”列中获取无时/分/秒的日期、年、月、日、季度和星期。⑦输出步骤(6)中获取的数据及对应数据类型。⑧将年份2021和2022、月份2和3、天数4和15、小时数2和3通过DataFrame结构组合为日期和时间数据。⑨将前面从“销售日期”列中提取的年、月、日数据重新组合为日期和时间数据。⑩从“销售日期”列中提取由年、月组成的数据。【任务实现】在JupyterNotebook开发环境中创建t8-01.ipynb,然后在单元格中编写代码与输出对应的结果。(1)读取Excel文件orderInfo.xlsx中的数据代码如下:importpandasaspdpath=r'data\orderInfo.xlsx'#获取“订单完成时间”和“商品金额”两列数据#默认读取Excel文件的第一个工作表sales_df=pd.read_excel(path,usecols=['订单完成时间','商品金额'])(2)查看列名、数据类型、记录数量等相关信息代码如下:sales_()输出结果:<class'pandas.core.frame.DataFrame'>RangeIndex:9entries,0to8Datacolumns(total2columns):#ColumnNon-NullCountDtype0订单完成时间9non-nulldatetime64[ns]1商品金额9non-nullfloat64dtypes:datetime64[ns](1),float64(1)memoryusage:272.0bytes(3)单独提取“订单完成时间”列数据提取“订单完成时间”列数据时指定格式符为“'Y-%m-%d”,将无效的数据解析为NaN。代码如下:sales_df['销售日期']=pd.to_datetime(sales_df['订单完成时间'],format='%Y-%m-%d',errors='coerce')(4)查看数据集中各列数据的数据类型代码如下:print(sales_df.dtypes)输出结果:订单完成时间datetime64[ns]商品金额float64销售日期datetime64[ns]dtype:object(5)随机获取DataFrame中的5条销售日期数据代码如下:print(sales_df["销售日期"].sample(5))输出结果:52021-02-2518:21:0522021-02-2011:11:5762021-03-1215:12:2802021-03-0620:40:1082021-03-2210:11:26Name:销售日期,dtype:datetime64[ns](6)从“销售日期”列获取日期数据分别从“销售日期”列中获取不包含时/分/秒的日期以及年、月、日、季度、星期数据,并输出这些数据。代码如下:sales_df['日期']=sales_df['销售日期'].dt.datesales_df['年']=sales_df['销售日期'].dt.yearsales_df['月']=sales_df['销售日期'].dt.monthsales_df['日']=sales_df['销售日期'].dt.daysales_df['季度']=sales_df['销售日期'].dt.quartersales_df['星期']=sales_df['销售日期'].dt.weekdaysales_df输出结果:(7)输出日期和时间数据对应的数据类型代码如下:sales_df.dtypes输出结果:订单完成时间atetime64[ns]商品金额float64销售日期datetime64[ns]日期object年int64月int64日int64季度int64星期int64dtype:object(8)组合日期和时间数据将年份2021和2022、月份2和3、天数4和15、小时数2和3通过DataFrame结构组合为日期和时间数据。代码如下:#将多个DataFrame列组合成日期和时间数据importpandasaspddf1=pd.DataFrame({'year':[2021,2022],'month':[2,3],'day':[4,15],'hour':[2,3]})pd.to_datetime(df1)输出结果:02021-02-0402:00:0012022-03-1503:00:00dtype:datetime64[ns]代码如下:#只传递需要组合的列df1=pd.to_datetime(df1[['year','month','day']])df1输出结果:02021-02-0412022-03-15dtype:datetime64[ns](9)将年、月、日数据组合为日期和时间数据将前面从“销售日期”列中提取的年、月、日数据重新组合为日期和时间数据。代码如下:df2=pd.DataFrame({'year':sales_df['年'],'month':sales_df['月'],'day':sales_df['日']})df3=pd.to_datetime(df2[['year','month','day']])df3输出结果:02021-03-0612021-03-0522021-02-2032021-02-2042021-03-0452021-02-2562021-03-1272021-03-1282021-03-22dtype:datetime64[ns](10)从“销售日期”列中提取由年、月组成的数据代码如下:sales_df['year_month']=sales_df['销售日期'].apply(lambdax:x.strftime('%Y-%m'))sales_df
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 办事员要考试题目及答案
- 醉酒驾驶事故案例分析试题及答案
- 2025年大型商业综合体招商运营风险评估与社会稳定影响分析报告
- 押题宝典高校教师资格证之《高等教育心理学》考试题库带答案详解(培优a卷)
- 押题宝典高校教师资格证之《高等教育法规》模考模拟试题及参考答案详解(能力提升)
- 2025年环保设备市场环保设备检测服务竞争态势报告
- 股票购买合同
- 河北省任丘市中考数学真题分类(勾股定理)汇编达标测试试题(含答案及解析)
- 基础强化华东师大版7年级下册期末试题及参考答案详解【典型题】
- 2025版绿色环保产业园区规划与建设投标协议书
- 甘肃省民宿项目管理办法
- office办公软件培训课件
- 高中地理开学第一课高一上学期
- 1《中国人民站起来了》公开课一等奖创新教学设计统编版高中语文选择性必修上册
- 《儿科超声检查规范》课件
- 注射并发症及其处理
- 撬装加油站培训
- 2025年中国漂白水洗猪鬃市场调查研究报告
- 工艺报警值管理制度
- 社团外聘教师管理制度
- 征兵心理测试题及答案
评论
0/150
提交评论