版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Python与财经大数据分析基础第4章
股权性质信息整理——应用数据转置
CONTENTS目录4.1T转置4.2行列互换4.3数据透视4.4数组转置4.5应用实践“转置”是一个数学名词,常用于矩阵的计算过程中。设A为m×n阶矩阵(即m行n列),第i行j列的元素为Aij,把A的行列互相交换从而得到一个新的矩阵AT,这一过程称为矩阵的转置。在Python中,数据转置是将原数据的行列互换,以更符合研究逻辑,更方便地进行计算和分析,在数据预处理时经常使用,为之后的数据筛选、合并、统计操作提供方便。本章将介绍以下五个Pandas模块与数据转置有关的函数。4.1T转置4.1T转置最简单直接的转置操作是将数据沿对角线翻转,在这个过程中数据的形状发生了变化,数据逻辑也发生了变化,但是数据的对应关系保持不变。为了更方便地进行数据处理和分析,充分利用行列的关系表达,我们时常使用transpose()函数对原数据进行转置操作,转置效果如下图所示:4.1T转置transpose()函数的具体语法如下所示:DateFrame.T是DateFrame.transpose()的别名和简写方法。为方便起见,可以直接使用DateFrame.T进行转置操作。transpose()函数只能进行最简单的整体翻转操作,想要对数据进行更复杂的行列变换处理,需要其他的转置方式。4.2行列互换4.2行列互换如果数据结构比较复杂,索引层数较多,则需要使用stack()函数与unstack()函数进行操作。stack()是将数据的列索引转换为行索引,unstack()是将数据的行索引转换为列索引,从而改变数据样式,以更符合研究习惯和后续调用。4.2行列互换stack()函数与unstack()函数的基本语法类似,stack()函数将列中指定levels的列,堆叠到行索引中;unstack()函数将行中指定levels的行,堆叠到列索引中。具体语法如下所示:4.2行列互换4.3数据透视4.3数据透视4.3.1melt()函数与stack()函数和unstack()函数进行行列索引的互换不同,melt()函数是将列索引转化成数据,从而将DataFrame从宽格式转换为长格式。melt()函数的使用效果如下图所示,类似于Excel中的数据逆透视。4.3数据透视melt()函数的主要任务是将DataFrame压缩为一种格式,其中一列或多列是标识符变量,而其余列被认为是测量变量,且不会旋转到行轴,只剩下两个非标识符列,分别为变量variable和值value。具体语法如下所示:4.3数据透视4.3.2
pivot()函数与melt()函数相反,pivot()函数是将数据转化成行列索引,使用来自指定索引的唯一值来形成DataFrame的轴,进行数据重塑,从而将DataFrame从长格式转换为宽格式。pivot()函数的使用效果如下图所示,类似于Excel中的数据透视。具体语法如下所示:4.3数据透视4.4数据转置4.1数据转置本节主要针对Numpy模块的多维数组进行转置操作介绍。下图分别是二维数组和三维数组的转置效果图。Numpy模块中有三种方式能够对数组进行转置操作,分别是T属性、transpose()函数、swapaxes()函数。4.1数据转置4.4.1T属性T属性的使用十分简单,调用格式为array.T,比较适合对低维数组进行转置操作。因此,对二维数组的转置通常使用T属性。对于高维数组而言,T属性也可以应用,只不过只能使用默认的转置方式,即交换位置序列的第一个值和最后一个值。4.1
数据转置将转置前后两个三维数组各元素对应位置列在下表,从中可以清晰地看出高维数组T属性只交换位置序列的第一个值和最后一个值。4.1数据转置4.4.2transpose()函数对二维数组进行转置,除了使用T属性,还可以使用transpose()函数,两者效果完全一致。对于高维数组而言,T属性也可以应用,只不过只能使用默认的转置方式,即交换位置序列的第一个值和最后一个值。4.1数据转置4.4.3swapaxes()函数与transpose()函数不同的是,swapaxes()函数接受一对轴编号,如果想要达到transpose(2,1,0)的效果,只需要输入swapaxes(0,2)即可。4.5应用实践4.5应用实践出于研究需要,我们需要整理A股上市公司不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- nic绩效考核制度
- 采购部门公车使用制度
- 采购部门工时制度模板
- 采购销售存货管理制度
- 采购需求计划制度
- 采购领导制度
- 采购验收退货制度规定
- 铁路物资采购公告制度
- 比例(课件)-2025-2026学年六年级下册数学人教版
- 第19章 二次根式(单元培优卷)(原卷版)-人教版(2024)八下
- 2026年安徽工贸职业技术学院单招综合素质考试题库含答案详解(模拟题)
- 2026天津市宝坻区招聘事业单位29人笔试备考题库及答案解析
- 2026重庆万州区人民法院公开招聘书记员3人考试参考试题及答案解析
- 春季除四害防病知识科普
- 急性中毒总论
- 20.4 电动机 课件(内嵌视频) 2025-2026学年人教版物理九年级全一册
- 家政保洁服务标准化手册
- 学校饮用水污染事件应急报告与管理制度
- 2026年粤港澳大湾区建筑市场发展新机遇
- 2026年北大emba考试试题
- 幽门螺杆菌相关性胃炎中胃内菌群与抗菌肽表达的协同变化及临床意义
评论
0/150
提交评论