《数据分析》课件-任务4.2 数据合并_第1页
《数据分析》课件-任务4.2 数据合并_第2页
《数据分析》课件-任务4.2 数据合并_第3页
《数据分析》课件-任务4.2 数据合并_第4页
《数据分析》课件-任务4.2 数据合并_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

任务4.2数据合并Python数据分析学习目标及重难点学习目标:了解什么是数据合并学习重点:轴向堆叠数据主键合并数据其他形式的合并数据目录学习内容1.轴向堆叠数据2.主键合并数据3.其它合并数据方法01轴向堆叠数据1.concat()函数concat()函数可以沿着一条轴将多个对象进行堆叠,其使用方式类似数据库中的数据表合并。函数格式为:pandas.concat(objs,axis=0,join=’outer’,join_axes=None,ignore_index=False,keys=None,levels=None,verify_integrity=False,sort=None,copy=True)1.concat()函数concat()函数个参数的含义2.轴向堆叠的分类根据轴方向的不同,可以将堆叠分成横向堆叠与纵向堆叠,默认采用的是纵向堆叠方式。AB横向AB纵向3.轴向堆叠的连接方式在堆叠数据时,默认采用的是外连接(join参数设为outer)的方式进行合并,当然也可以通过join=inner设置为内连接的方式。4.轴向堆叠数据举例当使用concat()函数合并时,若是将axis参数的值设为1,且join参数的值设为outer,代表着使用横向堆叠与外连接的方式进行合并。2.轴向堆叠数据举例当使用concat()函数合并时,若是将axis参数的值设为1,且join参数的值设为outer,代表着使用横向堆叠与外连接的方式进行合并。4.轴向堆叠数据举例当使用concat()函数合并时,若是将axis参数的值设为0,且join参数的值设为inner,则代表着使用纵向堆叠与内连接的方式进行合并。02主键合并数据1.merge()函数Pandas中提供了用于主键合并的merge()函数。left:参与合并的左侧DataFrame对象。right:参与合并的右侧DataFrame对象。how:表示连接方式,默认为inner。pandas.merge(left,right,how='inner',on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=False,suffixes=('_x','_y'),copy=True,indicator=False,validate=None)1.merge()函数参数how的取值可以为:left:使用左侧的DataFrame的键,类似SQL的左外连接。right:使用右侧的DataFrame的键,类似SQL的右外连接。outer:使用两个DataFrame所有的键,类似SQL的全连接。inner:使用两个DataFrame键的交集,类似SQL的内连接2.merge()函数举例在使用merge()函数进行合并时,默认使用重叠的列索引做为合并键,并采用内连接方式合并数据,即取行索引重叠的部分。如下示例:2.merge()函数举例内连接合并代码为:pd.merge(left,right,on=‘key’)结果如右图:2.merge()函数举例除此之外,merge()函数还支持对含有多个重叠列的DataFrame对象进行合并。2.merge()函数举例假设两张表中的行索引与列索引均没有重叠的部分,但依旧可以使用merge函数来合并,只需要将参数left_index与right_index的值设置为True即可。2.merge()函数举例左连接是以左表为基准进行连接,所以left表中的数据会全部显示,right表中只会显示与重叠数据行索引值相同的数据,合并后表中缺失的数据会使用NaN进行填充。右连接与左连接规则正好相反03其它合并数据方法1.根据行索引合并数据join()方法能够通过索引或指定列来连接多个DataFrame对象。on:名称,用于连接列名。how:可以从{''left'',''right'',''outer'',''inner''}中任选一个,默认使用左连接的方式。sort:根据连接键对合并的数据进行排序,默认为False。join(other,on=None,how='left',lsuffix='',rsuffix='',sort=False)2.合并重叠数据当DataFrame对象中出现了缺失数据,而我们希望使用其他DataFrame对象中的数据填充缺失数据,则可以通过combine_first()方法为缺失数据填充。combine_first(other)上述方法中只有一个参数other,用于接收填充缺失值的DataFrame对象。2.合并重叠数据假设现在有left表与right表,其中left

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论