




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三/四章:描述性统计和直观图形,1、概率密度及随机数2、统计量3、R的作图环境:图形分解、绘图命令4、统计图形:散点图、直方图、ecdf、QQ箱线图、多维图5、特殊图形,3.1概率密度及随机数,随机变量及其分布是概率统计研究中的重要基础,离散型:随机抽样【放回和不放回】sample,二项分布binom,泊松分布pois,几何分布geom,超几何分布hyper,连续型:均匀分布unif,指数分布exp,beta分布正态分布norm,卡方分布chisq,t分布t,F分布f,对数正态分布lnorm,伽玛分布gamma,柯西分布cauchy,注:加上p,d,r,q计算概率,密度,随机数,下分位点,3.1概率密度及随机数,例1:绘制标准正态分布密度图,区间3,3,x=seq(-3,3,length=200)plot(x,dnorm(x,0,1),type=l)或者plot(x,dnorm(x),type=l),3.1概率密度及随机数,例2:Xt(10),求P(|X|1.5),pt(1.5,10)-pt(-1.5,10)返回:0.8354927,例3:Xt(10),求y满足P(Xy)=0.9177463,qt(0.9177463,10)返回:1.5,例4:XN(60,42),模拟产生10个随机数,rx=rnorm(10,60,4)某次返回值:56.6110556.0493566.6327357.1502153.1449956.6760060.8409664.60479,62.3409266.46923,3.1概率密度及随机数,例5:验证关系Tt(n),F=T2F(1,n),从概率上验证:P(F0P(TN(0,1),例8:正态抽样的样本,,确定n的起点,3.2统计量,统计量是数理统计及应用统计中的一项基础工作也是富有创意的一项工作,是区间估计/假设检验/回归/方差分析等诸项工作的基础。,对于统计量的理解:,1.是样本的函数G(X1,X2,Xn)2.是随机变量r.v.3.具有值的特性G(x1,x2,xn),3.2统计量-基本统计量,1.样本均值,样本方差,样本中位数,极差,分位数,众数,中程数等。,R中的实现mean(x);mean(x,trim=0);apply(mat,1,mean)median(x);(min(x)+max(x)/2quantile(x,type=2)var(x);sd(x)range(x);max(x)-min(x)sd(x)/mean(x)#注意mean(x)0,3.2统计量-基本统计量,2.讨论均值与中位数的应用差异,模拟:来自标准正态总体的样本,加入扰动(异常值)看看,样本均值和中位数的变化。,3.2统计量-基本统计量,3讨论样本方差和有偏方差的区别,模拟:来自标准正态总体的样本,样本方差和有偏方差的取值变化。,3.2统计量-基本统计量,4偏度系数和峰度系数,利用包TSA和leaps两个包中的两个函数计算skewness(),kurtosis()问题:如何通过模拟数据理解和直观展示偏度和峰度,3.3图形分解,主标题,子标题,X轴标签,y轴标签,图例,四周边距,刻度,par(mai=c(0.6,0.6,0.6,0.1)#指定四周空白plot(1:10,1:10,type=n,main=主标题,sub=副标题,xlab=,ylab=,xlim=c(0,15),ylim=c(0,10),frame.plot=TRUE,axes=FALSE,mgp=c(0.3,0.3,0),cex.main=1,cex.sub=0.8)#不画坐标轴,标题的字体大小各不同,标题离坐标轴距离lines(c(1,11),c(8,8),lty=2);lines(c(1,11),c(6,6),lty=3);lines(c(1,11),c(4,4),lty=1)#画三种线legend(12.5,10,c(L1,L2,L3),lty=c(2,3,1),cex=0.75)#图例axis(1,0:15,labels=0:15,cex=0.75)#x坐标轴axis(2,0:10,labels=0:10,cex=0.75)#y坐标轴title(xlab=x轴标签,adj=1,mgp=c(0.3,0.3,0),cex=0.75)title(ylab=y轴标签,adj=1,mgp=c(0.3,0.3,0),cex=0.75)#x轴标签右对齐,y轴标签右对齐,3.3图形分解代码,通常一个统计图形的右侧边空是没有多大意义的,左侧边空也没有必要留太多,同理上下边空的空白也不能太大。而R默认绘制的图形的边空都比较大,这在截图编辑的时候总是造成麻烦。所以可以在绘图开始的时候进行统一边空控制。par(mai=c(bottom,left,top,right)单位:英寸,一英寸=2.539999918厘米,3.3图形分解边空统一控制,如果希望将所绘制的图形覆盖在一个有效的刻度范围内,则必须使用上例中参数:xlim=c()和ylim=c()例如:来自标准正态分布的100个随机数,画出其频数直方图x=rnorm(100);hist(x),3.3图形分解有效区域控制,改写代码:hist(x,xlim=c(-4,3),ylim=c(0,35),绘制不同数据图形的直观说明可通过legend图例实现比如上例中,绘制三种不同线型是用图例区别:legend(12.5,10,c(Line1,Line2,Lline3),lty=c(2,3,1)注意:12.5,10表示的相对于xlim和ylim的坐标位置,坐标起点(原点)是左下角(left,bottom),3.3图形分解图例的作用,如果希望对x,y轴标签的输出位置进行控制,可以使用几个参数:mgp(x,y,0):距离x刻度的英寸,距离y刻度的英寸adj=0,0.5,1:0左对齐0.5居中1右对齐,3.3图形分解坐标轴控制,如果希望对坐标轴刻度及刻度值进行控制,可以使用axisaxis(which,ticks,labels,las)which=1,2,3,4分别表示bottom,left,top,right坐标ticks表示刻度位置,向量labels表示刻度值文本,向量las=0,1,2,3分别表示labels的读方向:平行坐标轴,水行垂直坐标轴,垂直,main表示顶端的主标题sub表示底端的副标题(子标题)xlab表示x轴标签ylab表示y轴标签,3.3图形分解标题控制,另外:cex=0.75表示字体大小的缩放比例分类控制cex.main,cex.sub,cex.xlab,cex.ylablty表示线的类型,lwd表示线的宽度pch表示线以字符方式绘图,abline(v=x,lty,col);abline(h=y,lty,col)在当前图中添加x=x,y=y的直线abline(a,b,lty,col)在当前图中添加y=a+bxpoints(x,y,pch,col)在当前途中加入点其中:lty控制线的类型,col控制颜色pch控制点的形状,3.3图形分解直线或点绘制,plot(x,y)绘制y关于x的散点图plot(x)绘制x关于1:length(x)的散点图例如:plot(rnorm(100)abline(h=c(-2,-1,0,1,2)练习:绘制-3,3之间的标准正态分布,t(10)分布的密度图,要求分别用实线红色和虚线蓝色,并给出图例说明。,3.4统计图-散点图,hist(x,freq=TRUE)频数直方图hist(x,freq=FALSE)密度直方图问题:如何根据给定的分组来画直方图?,3.4统计图-直方图,使用参数:breaks1指定区间个数,R会自动调整breaks=6不好用2指定区间的端点,区间数等于端点个数减1例如:x=rnorm(100)hist(x)hist(x,breaks=6)hist(x,breaks=c(-4,-2,-1,0,1,2,4),3.4统计图-直方图求解众数,问题:请根据图形自行推导公式,3.4统计图经验分布图,格列文科定理给出,随机抽样的经验分布函数与分布函数之间的关系表达成:,R中绘制经验分布函数图的函数是ecdf和plotre=ecdf(x)plot(re,veticals=TRUE,do.p=FALSE)另外可以计算给定x0的经验分布函数值re(x0)练习:生成标准正态随机数100个,计算x=2处的ecdf.,3.4统计图正态QQ图,利用如下的关系式:,显然:k/n=1时,上式无法给出,故进行修正,R中给出:qqnorm(x);qqline(x)实现练习:请自行画出这个QQ图,3.4统计图箱线图,通过一个箱体来展现数据的对称性和离散性分布特征,可用于鉴别异常值数据,还可用于多组数据的差异性比较,非常直观有效。,3.4统计图箱线图,在R中,通过函数boxplot(x,range=1.5,horizontal=FALSE)实现箱线图的绘制。其中:x可以是一个数值向量,将绘制一组也可以是一个数据框,将绘制多组,例子:数据框A含有4个小组的同一门成绩变量g1score,g2score,g3score,g4score请按照均值为(65,70,75,80),标准差=4随机产生四组数据各30个,然后绘制箱线图,比较差异.,3.4统计图轮廓图多维,所谓轮廓图就是将数据矩阵中的每一行画成图上的一条折线。需将每列数据按比例换算到同一个坐标系中。注意:这使得轮廓图的绘制对各列数据的数值大小有一定的要求,比较适合分析各列数据量纲接近,数值相差在一定的范围内,即不太大也不太小的情况。,3.4统计图轮廓图多维,n=nrow(df);m=ncol(df)plot(c(1,m),c(min(df),max(df),type=n,main=轮廓图,xlab=序,ylab=值,sub=)for(iin1:n)lines(as.numeric(dfi,)points(c(1,m),c(dfi,1,dfi,m),type=p,pch=15+(i-1)%/%5)#针对成绩数据,网络教学平台实验材料中,3.4统计图调和曲线多维,第r条调和曲线定义为,3.4统计图雷达图多维,雷达图因其绘制的图象犹如雷达屏幕上看到的图象而得名,该图象又有些像蜘蛛网,故又称为蜘蛛图或者星图。R软件提供stars()函数用来绘制雷达图:stars(df,locations=c(0,0),radius=FALSE,key.loc=c(0,0),main=成绩数据,lty=2)stars(df,full=FALSE,draw.segments=TRUE,key.loc=c(5,0.5),mar=c(2,0,0,0)数据:网络教学平台的实验材料中,3.4统计图切尔诺夫脸多维,通过15个变量来定义脸型、微笑、嘴巴、眼睛、鼻子、耳朵和头发等的长度和宽度将多维数据的特征通过直观的人脸及表情表现出来在R中,专门给出这样的软件包和函数来进行脸谱的绘制。先安装软件包aplpack,然后加载该软件包,通过函数faces()将数据矩阵带入,编绘制出脸谱来。,3.4统计图切尔诺夫脸多维,install.packages(aplpack);library(aplpack)faces(matrix(sample(1:1000,240),16,15),main=“randomfaces”,face.type=1)#face.type=0黑白绘制,3.4统计图散布图多维,绘制多维数据中任意两个变量之间的散点图,直观展示多维数据两两之间的趋势关系。,有三种方法绘制散布图:1plot(data.frame()2paris(data.frame()3plot(x+y+z,data=data.frame(),3.4统计图条件散点图多维,函数coplot(expr,data=df)主要用来显示多元数据之间的条件散点图,df=data.frame(hei=rnorm(50,130,10),wei=rnorm(50,30,9),grade=as.factor(sample(3:6,50,replace=TRUE),class=as.factor(sample(1:3,50,replace=TRUE)coplot(weihei|grade,data=df)coplot(weihei|grade+class,data=df),3.5叠加图形,3.5叠加图形,x=runif(100,-1,1)y=runif(100,-1,1)opar=par(no.readonly=TRUE)par(fig=c(0,0.8,0,0.8)plot(x,y,xlab=xrunif,ylab=yrunif)par(fig=c(0,0.8,0.55,1),new=TRUE)boxplot(x,horizontal=TRUE,axes=FALSE)par(fig=c(0.65,1,0,0.8),new=TRUE)boxplot(y,axes=FALSE)mtext(叠加图形,side=3,outer=TRUE,line=-3)par(opar),利用:par函数中的fig=c(x1,x2,y1,y2)和new参数,4高密度散点图,当数据点重合度很高时,用plot绘制的二维图重叠严重,无法区分二者的关系。,n=10000 x=matrix(rnorm(n,0,0.5),ncol=2)y=matrix(rnorm(n,3,2),ncol=2)plot(x,y,pch=19,xlab=x,ylab=y),4高密度散点图,R提供一个smoothScatter()函数,利用核密度估计生成用颜色密度来表示点分布的散点图。,smoothScatter(x,y),4高密度散点图,R提供一个hexbin包,plot(hexbin(x,y,xbins=50),5三维散点图,R提供一个scatterplot3d包来实现三维图形的绘制,甚至可以旋转三维图形。,例:(x,y)落在-1,1*-1,1中的随机数,令z=exp(-x2+y2),绘制三维图,x=runif(100,-1,1)y=runif(100,-1,1)z=exp(-x2-y2)scatterplot3d(x,y,z),5三维散点图,scatterplot3d(x,y,z,type=h),5三维散点图旋转图,R提供rgl包中的plot3d函数用来通过鼠标旋转坐标轴,这样更有利于理解数据和图形。,plot3d(x,y,z,type=h),5三维散点图旋转图,还可以通过Rcmdr这个包中的scatter3d()函数实现更加美观的旋转三维图形。,scatter3d(x,y,z,type=h),5三维散点图旋转图,还可以通过rgl包实现旋转三维图形。library(rgl)library(Rcmdr)scatter3d(x,y,z),第三/四章:作业1,1、画出示意图形
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钻石保值增值协议书
- 餐饮加盟平台协议书
- 镇江双月协商协议书
- 门市转让手写协议书
- 高速施工安全协议书
- 非法集资合股协议书
- 鱼池防漏保修协议书
- 车位委托代售协议书
- 苗木临时收购协议书
- 菌种大棚承包协议书
- GB/T 18867-2014电子工业用气体六氟化硫
- GB/T 17793-1999一般用途的加工铜及铜合金板带材外形尺寸及允许偏差
- FZ/T 51011-2014纤维级聚己二酰己二胺切片
- ICU常见检查项目及课件
- 《月光下的中国》朗诵稿
- 土地荒漠化的防治(公开课)课件
- 中考备考应对中考历史学科的复习策略和解题技巧课件
- 第15课《驿路梨花》教学实录
- 思想道德修养与法律基础(完整版PPT)
- 全文解读中国式现代化解读学习PPT
- 动物英语俚语课件
评论
0/150
提交评论