R的简单介绍和线性回归.ppt_第1页
R的简单介绍和线性回归.ppt_第2页
R的简单介绍和线性回归.ppt_第3页
R的简单介绍和线性回归.ppt_第4页
R的简单介绍和线性回归.ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

R学习的分享,目录,一、R的介绍1.R的特点2.R的界面3.R的使用注意事项二、R中数据创建1.数据的输入1.1.向量1.1.1向量的赋值1.1.2有序向量的赋值1.2.矩阵的创建1.3.数据框的创建1.3.1表格输入1.3.2数据框的直接输入2.数据读入,目录,三、统计分析方法简介3.1方差分析和多重比较3.1.1方差分析和多重比较的命令调用3.2假设检验3.2.1假设检验的命令调用3.3主成分和因子分析3.3.1主成分和因子分析的命令调用3.4判别分析及命令3.5聚类分析3.5.1聚类分析函数的命令调用3.6回归分析3.6.1回归分析的详细解释,R的介绍,R是什么:R是一个有着统计分析功能及强大作图功能的软件系统,是由奥克兰大学统计学系的RossIhaka和RobertGentleman共同创立,并受到贝尔实验室s语言的影响。,R的特点,1.免费性:R是一个免费的统计分析软件;2.运算能力强大:同Matlab一样不需要编译就可执行代码;3.帮助功能完善:可通过help命令可随时了解R所提供的各类函数的使用方法或例子;4.R有顶尖水准的制图:在可视化方面,R的效果特别好,并能保存为各种形式的文件;5.统计分析能力尤为突出:R内嵌了许多统计分析函数,一些中间结果既可保存到专门的文件,也可直接用于进一步的分析。6.,R的界面,中文版的R界面,从后开始输入数据,代码等,R的使用注意事项,R的命令对大小写敏感,这在使用命令方式安装和载入程序包时应特别注意。输入R的命令中尽量使用英文字符,避免使用中文字符。同一行中可输入多个命令,需用;隔开,#认为是注释内容,不予执行。R中所有的函数后都带圆括号赋值一般用aa112345bb1onetwothreefourfive“dd1TRUEFALSE,1.1.2有序向量的赋值,生成有序的向量可以使用seq命令,s1s11-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.50.00.51.01.5152.02.53.03.54.04.55.0还有其他的赋值向量的命令不再详细举例。,1.2.矩阵创建,创建一个矩阵:MymatixcellsrnamescnamesmymatrixmymatrixC1C2R1126R22468,1.3.1表格输入,如果要输入以下表格的数据可以使用矩阵,也可用数据框的形式bloodtypejnbqcsxjtxjgspatientdatapatientdatabloodtypejnbqcsxjtxjgs1zc8.9012.0034.7144.002lj10.6318.0546.1867.243yc19.8430.5573.06116.82,1.3.2数据框的直接输入,同样的,可以在R中新建数据框,直接输入数据。命令格式如下:比如创建一个名为mydata的数据框,它含有三个变量,age(数值型)、gender(字符型)、weight(数值型)。命令为:mydatamydatachannelmydataframeodbcClose(channel)txt读取:mydatachoose.dir()或者file.choose()直接从弹出的对话框中了来查找文件。,三、统计分析方法简介,统计分析方法:常用的主要方法有:线性回归,方差分析与多重比较,假设检验,主成分和因子分析,判别分析,聚类分析。,3.1方差分析,方差分析:用于分析分类型自变量与数值型自变量之间的关系,即分析多各总体均值是否相等的方法。具体根据影响因素的不同,可以分为单因素方差分析,双因素方差分析例:某城市从4个排污口取水,进行某种处理后检测大肠杆菌数量,单位面积内菌落数如下表所示,请分析各个排污口的大肠杆菌数量是否有差别。排污口属于分类型自变量,大肠杆菌数量属于数值型因变量。分析的问题是:不同排污口大肠杆菌的数量是否相等。,方差分析代码,X-c(9,12,7,5,20,14,18,12,12,7,6,10,23,13,16,21)A-factor(rep(1:4,each=4)fcfx-data.frame(X,A)fcfxaov.fcfx-aov(XA,data=fcfx)summary(aov.fcfx)plot(fcfx$Xfcfx$A)pairwise.t.test(X,A,p.adjust.method=holm)TukeyHSD(aov(XA,fcfx),3.1多重比较,多重比较是在方差分析得到否定结论后,为确定是哪些组之间存在差异,两两之间进行的比较分析。假设上述问题经分析得到的结果是四个排污口的大肠杆菌的数量是有差异的。那么具体是哪些排污口数量不同造成的,可进行多重比较。,3.1.1方差分析与多重比较命令,函数的调用格式:aov.miss-aov(formula,data=Null,projections=FALSE,qr=TRUE,contrast=NULL,)多重比较的T检验命令pairwise.t.test(x,g,p.adjust.method=p.adjust.methods,poor.sd=TRUE,)x是影响变量构成的向量,g是分组向量(因子),方差分析的对象,数据框,是否返回逻辑预测值,是否返回QR分解,因素对比,合并方差,调整p值,3.2假设检验,假设检验是依据样本去推测总体特征。思想:是基于小概率事件在一次试验中不发生的原理。某车间用一台包装机包装精盐,额定标准每袋净重500g,设包装机包装出的盐每袋净重XN(,2)某天随机地抽取9袋,称得净重为490,506,508,502,498,511,510,515,512.问该包装机工作是否正常?H0:=500H1:500,3.2.1假设检验命令调用,z.test-function(x,n,sigma,alpha,u0=0,alternative=“two.sided”)类似的可以调用t.test,chisq.var.test检验,3.3主成分和因子分析,主成分分析:将多个变量通过线性变换以选出较少个数重要变量,而又尽可能多的保留原始样本的信息。因子分析:用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息。,3.3.1主成分分析,随机抽取30名某年级中学生,测量其身高(X1),体重(X2),胸围(X3),坐高(X4),数据如下表所示,试对这30名学生身体四项指标作主成分分析。序号X1X2X3X4序号X1X2X3X4114841727821393471763160497786414936677951594580866142316676715343768381504377799151427780101393168741114029647412161477884通过对以上四项指标做主成分分析,可以构造由四个指标的线性组合组成的主成分,来解释数据。本例中经过主成分分析中可构造出一个反应学生魁梧成度的主成分y1和反应学生胖瘦的主成分y2。,主成分分析代码,xfitsummary(fit)Call:lm(formula=fhlweight,data=womendata)Residuals:Min1QMedian3QMax-0.30590-0.166990.032690.124810.33128Coefficients:EstimateStd.ErrortvaluePr(|t|)(Intercept)-1.581541.27732-1.2380.2619weight0.093210.027413.4010.0145*-Signif.codes:0*0.001*0.01*0.05.0.11Residualstandarderror:0.2421on6degreesoffreedomMultipleR-squared:0.6584,A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论