版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Python数据分析原理与应用
第1章大数据分析基础1.1课程概述1.2软件安装1.3基本操作1.1课程概述
1.1.1教学目的了解大数据分析的基本内涵掌握大数据分析的基本方法培养大数据分析的应用能力数据采集数据预处理数据存储分析和挖掘网络爬虫日志采集传感器RFID射频技术数据抽取数据清洗特征选择数据标准化HDFSNoSQLRDBMS等方法数据分析数据挖掘机器学习统计学等数据的异构性和不完备性问题。数据处理的时效性问题。数据的安全与隐私保护问题。大数据的数据类型:结构化数据(MySQL,Access),半结构化数据(HTML,JSON,日志文件),非结构化数据(文档,图片,视频,音频)(1)数据分析师如对非结构化大数据、各种电子文档数据、各种数据库数据的再加工、分析、展示。学了以后可以做什么?(2)人工智能开发工程师如视频、音频、图片的识别及应用如文字、符号等的处理及应用(3)数据科学家的科学研究如经济系统的仿真实验如管理建模与商务智能尚需努力:百尺竿头,更进一步!大数据挖掘分析师:学完本课程后,你初步具备了中级数据分析师的水平,可以解决日常大量结构化为主的数据业务处理问题。但是数据处理范围还包括了非结构化数据的处理,由此至少必须深入掌握一门关系数据库,如MySQL;另外,有的同学应该掌握NoSQL数据库,以处理大数据的存储及计算;还有一部分同学需要掌握分布式计算,如Spark、Hadoop等。人工智能开发工程师:需要研究专题视频识别库(如OpenCV库等)、自然语言处理,需要研究专业算法及语言,并通过C++、JAVA、Python、matlab、R等实现算法设计,集成到实际工程中,建议学习深度学习(Tensorflow、PyTorch库等)、
MicrosoftCNTK(深度学习工具包)、Theano(值计算库)、强化学习、博弈论等。数据科学家的科学研究:深入学习有关扩展库,研究数据挖掘、演化学习、集成学习、联邦学习、迁移学习等内容,并深入学习有关业务专题分析库。后续学习、研究方向1.1.2课程内容第1章大数据分析基础:课程描述、环境配置、Python回顾等第2章mumpy与数组运算:数组的建立、矩阵运算等第3章Matplotlib与可视化:图像构成要素、绘制图像等第4章pandas与数据挖掘:创建数据框、统计分析等第5章文件的读与写操作:txt、csv、xslx、doc等文件操作第6章sympy与符号计算:创建符号、符号运算等第7章scipy与科学计算:解方程组、优化问题等第8章
Sklearn与回归分析:标准化、线性回归、逻辑斯蒂回归等先修课程:高等数学、数理统计、Python等课程作业(知识掌握与基本分析能力)100分,占总评成绩20%。
1次作业。
课程实验(知识熟练与问题解决能力)100分,占总评成绩30%。1次综合实验。课程考试(知识熟练与灵活应用能力)100分,占总评成绩50%。闭卷,100分钟。1.1.3.考核方式4.教材与参考书目[美]罗伯特·约翰逊著,Python科学计算和数据科学应用,清华大学出版社,2020年6月。余本国,Python大数据分析与应用实战,电子工业出版社出版,2021年12月。李增刚,Python编程基础与科学计算,清华大学出版社,2022年3月。周志华等著,大数据分析研究进展,科学出版社,2022年10月。1.2软件安装1.2.1python回顾/downloads/(1)list[]:列表range()、append()、len()、max()、min()、sum()、connt()、pop()、sort()、reverse()、index()、copy()(2)dict{}:字典get()、items()、keys()、values()、Counter()、defaultdict()(3)判断与循环if,for,while(4)函数与类def(x),class(self)(5)文件操作1.2.2Anaconda的安装Anaconda包括了课程所要用到的所有库,Jupyter、Matplotlib、Numpy、Scipy、Pandas、Scikit-learn多个科学计算库。/anaconda/archive/在开始菜单选择AnacondaPrompt命令,弹出终端界面。anaconda扩展库的安装condainstallnumpy:安装numpy扩展库condalist:列示所有安装的扩展库condaupgradenumpy:更新numpy扩展库condaupgrade–all:更新所有的扩展库conda–version:检查conda的安装版本condaupgradeconda:升级conda到最新版本扩展库名-i镜像网站网址使用pip、conda工具安装扩展库。Bydatascientists,fordatascientistscondainstalljieba–i/simple1.3基本操作1.3.1JupyterNotebook的特点是一款以科学计算为主的,可以进行探索式(文学式)代码开发,基于Web的开发工具。常用于科学计算、数据分析、机器学习操作环境。编程时具有语法高亮、缩进、tab补全的功能以及各种快捷键可供使用。可直接通过浏览器运行代码,同时在代码块下方展示运行结果。以富媒体格式展示计算结果。富媒体格式包括:HTML,LaTeX,PNG,SVG等。支持numpy,pandas等嵌入开发。在“开始”菜单里找到Anaconda,点击启动编译软件,进入如下界面。也可以在终端运行:jupyternotebook--port88881.3.2Jupyter主界面使用主界面功能:主界面是代码文件的列表管理界面,为代码文件提供了建立、删除、复制、打开、排序、关闭运行、重命名、下载、上传等功能。1.3.3代码编辑界面将当前.ipynb文件保存为.py文件重新运行全部单元格运行所在单元格之前的全部单元格1.3.4单元格执行状态JupyterNotebook有两种模式:命令行模式(CommandMode,蓝色单元格);编辑模式(EditMode,绿色单元格)。对于代码对象的使用帮助,可以用?、help()来实现。importnumpyasnp?np.abs#?查看abs函数的使用帮助信息help(np.abs)#help()查看abs函数的使用帮助信息执行结果(略)
1.3.5JupyterNotebook快捷键(1)命令模式Y:单元格进入代码格式M:单元格进入Markdown模式1:一级标题;2:二级标题Shift+M:
合并单元格A/B:在上(下)插入单元格X:剪切单元格C:复制单元格Shift+L:全部代码块显示行号O:隐藏输出(2)编辑模式Ctrl+]:缩进Ctrl+/:注释Ctrl+M:进入命令模式Ctrl+Shift+-:切分代码块Shift+Enter:运行并选中下一块Ctrl+Enter:运行代码块Alt+Enter:运行并在下方插入新块例1-1古诗横排改竖排研读例1-2代码在第一段代码前添加1级标题:牛仔帽;在第一段代码后添加2级标题:瑞士卷;在第三段代码前添加3级标题:维度灾难;显示、取消行号;显示、取消目录;注释(缩进)第一段代码中33-38行;取消刚才的注释(缩进);运行全部单元格;清除全部单元格输出;删除所有空白单元格;在文档末尾添加单元格并进入Markdown模式,粘贴一副图片和文字。试着进入PPT模式。自行练习其他操作。例1-2课堂练习第2章numpy与数组运算经济管理学院大数据管理科学系主要内容2.1数组基础2.2数学计算2.3通用函数2.4矩阵运算2.5奇异分解2.1数组基础
importnumpyasnp导入numpyarr1=np.array([1,2,3,4])#创建一维数组数组参数:列表,元组等。元素类型:整型、字符型、布尔型、浮点型、复数型等。注意:若数值型与字符型混合,会全部转换为字符串。2.1.1创建数组创建三维数组:arr2=np.array([[[100,98,99],[88,78,95]],[[98,97,99],[89,91,68]]])班组员工1月份合格率2月份合格率3月份合格率甲张三1009899李四887895乙王五989799赵六899168989799899168axis=0:纵深axis=1:垂直axis=2:水平[[[1009899][887895]][[989799][899168]]]arr2=np.array([[[100,98,96],[88,78,95]],[[98,97,99],[89,91,68]]])三维数组的形态1009896887895axis=1:水平axis=0:垂直班组员工1月份合格率2月份合格率3月份合格率甲张三1009896李四887895乙王五989799赵六899168三维数组的显示二、三维数组的空间刻画①arange([start,]stop[,step,],dtype=None)np.arange(0,1,0.1)np.arange(5,0,-1)②linspace(start(起始值),stop(结束值),num=50(样本数),endpoint=True(包括结束值),retstep=False(返回数组里包含步长),dtype=None,axis=0):在指定的范围内返回均匀步长的样本数组。步长计算公式(stop-start)/(num-1)(endpoint=True)np.linspace(0,4,5)③logspace(start,stop,num=50,endpoint=True,base=10.0,dtype=None,axis=0)np.logspace(0,2,20)2.1.2数组属性a=np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]])维数:a.ndim
#2
形状:a.shape#(3,4)数据类型:a.dtype
#int32元素个数:a.size#12每个元素的大小:a.itemsize#42.1.3数组方法t=np.arange(9)t.reshape(3,3)t.astype(float)2.1.4数组连接c1=np.array([[100,99,100],[98,99,97]])c2=np.array([[88,88,87],[85,92,89]])print(np.hstack((c1,c2)))#水平对接行一致print(np.vstack((c1,c2)))#垂直对接列一致,(c1,c2)元组形式2.1.5数组分割arr=np.arange(16).reshape(4,4)水平方向分割:np.hsplit(arr,2)
np.split(arr,2,axis=1)垂直方向分割:np.vsplit(arr,2)np.split(arr,2,axis=0)2.1.6数组索引arr=np.arange(1,20,2)arr[5]arr[:5])arr[3:5]arr[:-1])arr[5:1:-2]arr[[4,3,0,6]]arr[[-3,-5,-7]]2.1.7数组切片arr=np.array([[1,2,3,4,5],[4,5,6,7,8],[7,8,9,10,11]])arr[0,3:5]arr[1:,2:]arr[:,2]121315141617191820212322a=np.arange(24).reshape(2,3,4)array([[[0,1,2,3],[4,5,6,7],[8,9,10,11]],[[12,13,14,15],[16,17,18,19],[20,21,22,23]]])01324576891110print(a[1,0,0])#下标1为第三维的第2行,中间0为第二维的第1行,最右边0为第一维的第1列
print(a[1,1,1])修改值a[1,0,2]=-1print(a)三维数组的索引与切片axis=2:水平axis=1:垂直axis=0:纵深2.2数学计算2.2.1四则运算one=np.arange(1,5).reshape(2,2)one+=4(赋值运算生成新数组)two=np.arange(6,10).reshape(2,2)print(two/2)print(two//2)print(one-two)print(one*two)print(one/two)print(one%two)2.2.2复合运算one5=np.arange(9).reshape(3,3)p1=np.full((3,3),2)print(one5**p1)print(np.power(one5,p1))print(one5**2)print(np.square(one5))2.2.3数组排序a1=np.array([[100,0,45],[12,89,35],[50,40,60]])print(np.sort(a1,axis=1))#按行(默认)排序,不改变原数组a1.sort(axis=0)#该函数改变原数组顺序2.3通用函数print(np.exp([1,2,3]))print(np.exp2([1,2]))print(np.log(10))print(np.log10(10))x=np.linspace(0,2*np.pi)y=np.sin(x)z=np.arcsin(y)xx=np.arange(4)print(np.sinh(xx))radian=[0,np.pi/6,np.pi/4]print(np.degrees(radian))degrees=[0,30,45,60,90,180]np.radians(degrees)/np.piprint(np.hypot(3,4))print(np.hypot([3,3,3],[4,4,4]))2.3.1初等函数2.3.2随机函数np.random.rand(2,6)#产生2乘6的[0,1)随机数组rn=np.random.randn(10)#产生10个标准状态分布的随机数np.round(rn,2)#保留两位小数np.random.randint(4,size=8)#产生8个在[0,4)内的随机整数np.random.randint(0,4,size=(2,5))#产生(2,5)个在[0,4)的整数np.random.choice(5,3,replace=False,p=[0.4,0.2,0.1,0.2,0.1])#随机抽样np.random.shuffle(arr)#洗牌,原地操作2.3.3统计函数a=np.array([[10,0,9],[8,9,9],[9,10,9]])b=np.array([[np.nan,10,9],[np.NaN,10,9],[10,10,10]])np.sum(a,axis=1)np.nansum(b)np.max(a,axis=0)np.nanmax(b,axis=1)np.nanmin(b,axis=1)np.mean(a,axis=1)#均值
np.median(a,axis=0)np.var(a,axis=1)np.std(a,axis=1)np.average(a1,axis=1,weights=[0.8,0,0.2])#加权平均2.4矩阵运算2.4.1求行列式importnumpyasnpd=np.array([[1,2],[3,4]])v1=np.linalg.det(d)np.around(v1,decimals=2)importnumpy.linalgasLAV2=LA.det(d)LA.det(np.random.randint(-5,6,size=(3,3,3)))#求三维矩阵行列式2.4.2矩阵转置①建立矩阵:matrix(data,dtype=None,copy=True)np.matrix(np.arange(9).reshape(3,3))np.matrix([[1,2,3],[4,5,6],[7,8,9]])np.matrix(((1,2),(3,4),(5,6)))
②矩阵转置:A.Tx=np.arange(16).reshape(2,2,4)
np.transpose(x,(1,0,2))#移动轴
2.4.3求逆矩阵
2.4.4求特征根与特征向量特征值、特征向量:eig(a)
A=np.matrix([[3,1],[1,3]])w,v=np.linalg.eig(A)print('特征值',w)print('特征向量',v)
2.4.5解方程组①矩阵(数组)乘积函数:dot(a,b)a=np.ones(8).reshape(2,4)b=np.array([[0,1],[0,2],[0,3],[0,4]])print(np.dot(a,b))②solve求线性方程组解:函数solve(A,b)
A=np.matrix([[1,-1,-1],[2,-1,-3],[3,2,-5]])b=[2,1,0]print(np.linalg.solve(A,b))
③求最小二乘解:函数lstsq(A,b)A=np.array([[3,1],[2,1],[1,1],[0,1]])b=np.array([-1,0.5,2,0.3])x=np.linalg.lstsq(A,b)x1,x2=np.linalg.lstsq(a,b,rcond=None)[0]print('x1=%.2f,x2=%.2f'%(x1,x2))回归系数残差平方和系数矩阵的秩系数矩阵的奇异值2.5奇异值分解奇异值分解(SingularValueDecomposition,SVD):函数svd(A,full_matrices=True,compute_uv=True)A(m,n)为二维或以上实数或复数数组,full_matrices确定返回矩阵u、vh的大小,默认值True,则返回(m,m)和(n,n),False则返回(m,k)和(k,n),其中k=min(m,n)。计算结果返回左奇异向量U、奇异值σ、右奇异向量V矩阵。U大小为(m,m),σ大小为(k),V大小为(n,n)。2.5.1奇异值分解的计算(1)求ATA的特征值和特征向量计算对称矩阵W=ATA求解特征方程,得到特征值
,并将特征值由大到小排列将特征值
代入特征方程求得对应的特征向量.(2)求n阶正交矩阵V将特征向量单位化,得到单位特征向量
,构成n阶正交矩阵V.(3)求
m
x
n
对角矩阵计算A的奇异值构造
mx
n
矩形对角矩阵
,主对角线元素是奇异值,其余元素是零.(4)求m阶正交矩阵U对A的前r个正奇异值,令得到求AT的零空间的一组标准正交基
并令(5)得到奇异值分解例:求下列矩阵的奇异值分解
importnumpyasnpA=np.array([[4,11,14],[8,7,-2]])u,s,vh=np.linalg.svd(A)print(u,s,vh)print(u.shape,s.shape,vh.shape)2.5.2图像处理初步scikit-image是基于scipy的一款图像处理包,将图片作为numpy数组进行处理。fromskimageimportio,data使用skimage.io.imread(fname)函数读取图片。使用skimage.io.imshow(arr)显示arr数组表示的图片。io.show()print(type(img))#类型print(img.shape)#形状print(img.shape[0])#图片高度print(img.shape[1])#图片宽度print(img.shape[2])#图片通道数print(img.size)#显示总像素个数print(img.max())#最大像素值print(img.min())#最小像素值print(img.mean())#像素平均值使用io.imsave(fname,arr)保存对彩色图片的像素点访问方式如下:img[i,j,c]其中:i表示图片的行数;j表示图片的列数;c表示图片的通道数(RGB三通道分别对应0,1,2)。坐标从左上角开始。图片裁剪:由于图片是以numpy数组进行存储,因此对于数组的裁剪,就是对图片的裁剪。fromskimageimportio,dataimg=data.astronaut()partial_img=img[50:150,170:270,:]io.imshow(partial_img)#生成图像io.show()62第3章matplotlib可视化经济管理学院大数据管理科学系《大数据分析技术》教学团队主要内容3.1准备工作3.2可视化的元素3.3二维图的绘制3.4三维图的绘制3.5可视化的应用%matplotlibinline#在单元格下面普通显示图像
%matplotlibtk#单独显示,有调图工具条
%matplotlibnotebook#在单元格下面显示,有调图工具条
%configInlineBackend.figure_format=‘svg’#矢量图设置
%configInlineBackend.figure_format=“retina”
图像保存格式:svg:可伸缩矢量图形jpg:位图,最常用的图片格式
bmp:位图,未压缩pdf:直接输出为pdfpng:位图,无损压缩
查看本机字体C:\Windows\Fonts3.1
准备工作复原、左移、右移、任意移动、放大、设置参数、保存例3-1
初识可视化1.绘制折线图实战【例3-2可视化销售情况】某商品进价49元,售价75元,现在商场新品上架搞促销活动,顾客每多买一件就给优惠1%,但是每人最多可以购买30件。计算并使用曲线图可视化顾客购买数量num与商家收益、顾客总消费以及顾客省钱情况的关系,并标记商场收益最大的销售数量和商场收益。3.2
可视化的元素①函数plot:展示变量变化趋势②函数scatter:寻找变量之间的关系③函数xlim:设置坐标轴的数值显示范围④函数xlabel:设置坐标轴的标签文本⑤函数grid:绘制刻度线的网格线⑥函数axhline:绘制平行坐标轴的参考线⑦函数axvspan:绘制垂直坐标轴的参考区域⑧函数annotate:添加注释文本⑨函数text:添加图像内容注释⑩函数title:添加图像内容的标题⑾函数legend:标示图像的文本标签图例回顾使用pyplot绘图的一般过程为:首先生成或读入数据,然后根据实际需要绘制折线图、散点图、柱状图、饼状图、条形图、雷达图或三维曲线和曲面,接下来设置坐标轴标签(可以使用matplotlib.pyplot模块的xlabel()、ylabel()函数或轴域的set_xlabel()、set_ylabel()方法)、坐标轴刻度(可以使用matplotlib.pyplot模块的xticks()、yticks()函数或轴域的set_xticks()、set_yticks()方法)、图例(可以使用matplotlib.pyplot模块的legend()函数)、标题(可以使用matplotlib.pyplot模块的title()函数)等图形属性,最后显示或保存绘图结果。每一种图形都有特定的应用场景,对于不同类型的数据和可视化要求,要选择最合适类型的图形进行展示,不能生硬地套用某种图形。
upperright:1upperleft:2lowerleft:3lowerright:4right:5centerleft:6centerright:7lowercenter:8uppercenter:9center:103.3二维图的绘制例3-4绘制柱状图:bar()7980例3-5绘制饼图8183箱线图84例3-6绘制箱线图85例3-7绘制直方图88例3-8绘制极坐标图89例3-9绘制多子图如果要绘制三维图形,首先需要使用下面的语句导入相应的对象:frommpl_toolkits.mplot3dimportAxes3D然后使用下面方式之一声明要创建三维子图:ax=fig.gca(projection='3d’)ax=plt.axes(projection='3d’)ax=plt.subplot(111,projection='3d')就可以使用ax的plot()方法绘制三维曲线、plot_surface()方法绘制三维曲面、scatter()方法绘制三维散点图或bar3d()方法绘制三维柱状图了。3.4三维图的绘制例3-10绘制三维柱状图例3-11绘制三维散点图例3-12绘制三维曲面图
103补充:例3-13绘制网络图课堂练习按示例绘制函数图像课堂练习按示例绘制函数图像
第4章pandas数据挖掘4.1Series4.2DataFrame4.3存取数据4.4数据清洗4.5数据挖掘大数据分析技术教学团队Pandas(AQRCapitalManagement于2008.4开发,2009年开源,来自于面板数据(paneldata)和python数据分析(dataanalysis)。PanelData,也叫“平行数据”,是指在时间序列上选取m个截面,同时选取n个样本观测值所构成的样本数据,即m×n的数据矩阵。Pandas主要有两部分组成:Series和DataFrame。Series的本质是只有一列的数据表,而DataFrame是由多个Series组合的多维表。最新版本
1.5.0(2022.9.19),Time-Series:以时间为索引的Series;Panel
:三维的数组,DataFrame的容器;Panel4D:Panel的4维数据容器;PanelND:可创建像Panel4D一样N维命名容器。4.1Series4.1.1创建Seriess=pd.Series(np.array([3,5,7,9]))importpandasaspd4.1.2Series索引4.2DataFrame4.2.1创建DataFrame4.2.2索引DataFramedf.iloc[]:只能使用整数索引,不能使用标签索引df.iloc[3]:索引位置为3的行,即第四行的值#print(E.iloc['Tom'])#语法错误df.iloc[[0,2,3]]:索引第一、三、四行切片df.iloc[0:3]:索引第一到第四行,切片选择数据时,前闭后开df.iloc[df.index!=0]:索引除第一行外所有行df.iloc[1:5,1:5]:会有最多4×4的df数据子集
df.loc[]:只能使用标签索引,不能使用整数索引,整数必须为标签名。loc[]:接受两个参数,并以‘,‘分隔,分别表示行、列。df.loc[1:5,1:5]:最多5×5的df数据子集,包括边界(开始和结束)。df.loc[‘abc’]:行标签为abc的行。
列表,df.loc[[‘a’,‘b’,‘c’]]:
索引行标签分别为a,b,c的行。
切片,df.loc[‘a’:‘b’]:
索引行标签为从a到b的行df.loc[:]:所有行。df.loc[:,:]:索引所有行和列。
布尔数组,与轴长度一致,df.loc[[True,True,False]]:索引为True的行。df.loc[df.index!=2,:]:索引除行标签为2外的所有行和列。4.2.3修改DataFrame数据4.2.4删除DataFrame数据4.2.5添加DataFrame数据4.2.6排序见示例4.2.7数据计算4.3读写数据4.3.1CSV格式导入导出参考:Pandas.read_csv()函数及全部参数使用方法一文详解+实例代码Mode:写入模式,默认为wr:只能读,文件必须存在,可在任意位置读取r+:可读可写,文件必须存在,可在任意位置读写w:只能写,文件可以不存在,必会擦掉原有内容从头写w+:可读可写,文件可以不存在,会擦掉原有内容从头写a:只能写,文件可以不存在,不修改原有内容,只能在结尾追加a+:可读可写,文件可以不存在,只在结尾追加写4.3.2Excel文件导入导出condainstallopenpyxl-i/pypi/simple参考:Pandas读取excel文件(pandas.read_excel)4.4数据清洗4.4.1重复值的处理4.4.2缺失值的处理缺失数据的识别:用NaN表示缺失示例:
学号班级姓名性别英语体育军训数分高代解几0230802424123080242成龙男7678.077.04023601230802424423080242周怡女6691.075.04747442230802425123080242张波男8581.075.04545603230802424923080242朱浩男6550.080.07262714230802421923080242封印女7388.092.06147465230802420123080242迟培男6050.089.07176716230802434723080243李毕女6761.084.06165787230802430723080243陈田男7679.086.06940698230802432623080243余皓男6667.085.06561719230802432023080243李嘉女62NaN90.060677710230802434223080243李上初男7690.084.060666011230802431023080243郭窦女7967.084.064647912230802443523080244姜毅涛男7771.0NaN61737613230802443223080244赵宇男7474.088.068707114230802444623080244周路女7680.077.061748015230802442123080244林建祥男7272.081.063907516230802443323080244李大强男7976.077.078707017230802442823080244李则通男6496.091.069607718230802440223080244王慧女7374.093.070717519230802442223080244李晓虎男8560.085.072728320230802420123080242迟培男6050.089.0717671删除数据为空所对应的行:df.dropna()用其他数值代替NaN:df.fillna(‘?’)用前一个数值替代NaN:df.fillna(method=‘pad’)用后一个数值替代NaN:df.fillna(method=‘bfill’)对不同的列填充不同的值:
df.fillna({‘军训':100,‘体育':0})只有行里的数据全部为空时才删除:df.dropna(how='all')删除列:df.dropna(how=‘all’,axis=1)4.4.3数据合并(1)mergeabcd041571657129912312931616321a_xbc_xd_xa_yc_yd_y001234571456767128910119123129abcd00123145672891011312131415a_xbc_xd_xa_yc_yd_y001234.05.07.0145676.07.01.028910119.0123.0129.0312131415NaNNaNNaN(2)appendprint(data1.append(data2,ignore_index=True))(3)joindata2.columns=list('pown')result=data1.join(data2)#右连接,列名不能重叠
abcd00123145672891011312131415441575657169912312971616321abcdpown0012341571456765712891011991231293121314151616321(4)concatabcddata100123145672891011312131415data2041571657129912312931616321data3041571657
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业人才流失原因与对策
- 职业规划师协会指南
- 教育咨询师岗位的求职要点与技巧!干货满
- 生物科技公司研发科长的职责与要求
- 房地产估价师岗位面试常见问题
- 医药卫生安全教育专业面试技巧
- 海港码头设施安全质量保障措施
- 新基建人工智能医疗:智慧医疗新篇章
- 食品饮料行业线上销售平台的推广计划书
- 信贷员工作计划的制定与执行技巧
- OpenClaw发展研究报告
- 2025中国东方资产管理股份有限公司总部部门分公司高级管理人员社会招聘笔试历年典型考题及考点剖析附带答案详解2套试卷
- 制造业生产安全操作规范
- 2026春统编版二年级下册道德与法治教学设计(附目录)
- 2026石嘴山市能达建设发展有限公司招聘3人笔试参考题库及答案解析
- 《冠心病诊断与治疗指南(2025年版)》
- 2026年春人教版八年级下册英语Unit 1~Unit 8全册教案
- 2025-2026学年人教PEP版(新教材)小学英语三年级下册教学计划及进度表
- 2026年-(教科版2026新教材)科学一年级下册全册教学设计-新版
- (081000)信息与通信工程专业考研复试高频面试题
- 2026届云南省普通高中学业水平选择性考试调研测试政治试题
评论
0/150
提交评论