R-语言实验指导书_第1页
R-语言实验指导书_第2页
R-语言实验指导书_第3页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、R-语言实验指导书(二)实验三创建和使用R语言数据集、实验目的:1. 了解R语言中的数据结构。2. 熟练掌握他们的创建方法,和函数中一些参数的使用。3. 对创建的数据结构进行,排序、查找、删除等简单的操作。实验内容:1.向量的创建及因子的创建和查看有一份来自澳大利业所有州和行政区的20个税务会计师的信息样本1以及他们各自所在地的州名。州名为:tas,sa,qld,nsw,nsw,nt,wa,wa,qld,vic,nsw,vic,qld,qld,sa,tas,sa,nt,wa,vic。1) 将这些州名以字符申的形式保存在state当中。2) 创建一个为这个向量创建一个因子statef。3) 使用

2、levels函数查看因子的水平Rversioi;3.3.L£201-06-21)r,sinYour可耳It"Copyrifft(C*dQIETAe以FondatorfcsStacisricalCcir.ptir:gPlatfcxe:135-mingw32/i3=&(32-btIR是号白软牛不带笠何担保=玉其些条件下乔巨以将其自圭散和:,用1licenseT)或,licence(来看散柞的详细条件R是个含卞计忍,有许多人为之更日了灵站.Scantzlbutora(),先看合作者的详缩情祝宅七工己二比以"会琶诉车如苴在兰成物中正醛地卓司点!主邑,-圣示范程子,

3、用,泄iBi矢同诿在线帮助文件,或'谚过3皿浏览器未看蒂勒文件.> sT.aceCcitasrsafadPri5Wrnswrr_H,*3wafa±dfv±cfnswFvicqcirq±dF.凭溟:找不到对素,SF5tate<-c"nf"gid",n-3wF,"ksv",nnz"f"va",'、心,"qld.",vic11,:2. f«ctor(state)(1rassaqldnawnawncwtwaqldvicnswviqldq

4、ld£&tasmant1Levels:nawm皂Idst匚巨目vicw*levels?ca&NULL*<-factolevels(statef):1气亍服,小匚”Trdld""Bi"”优E'nVlCT,”能t矩阵与数组。i. 创建一个4*5的数组如图,创建一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。L.l1.3L.41J1s913172J261014183J37111519L4J48121620.2UJ13laa9213J31rtyarrav<-err£y(1:20,iLyazza,11Z1567xG

5、s二;力i<-r:(3:;)cellB<-cix,y1rrj?r;atr1x<-r:atr1xryrfltr."x<-r-M:riu(rryrm匚*f-1J"J1,I3,rrow»3i:col«2fJ4£3,31%itvi.si?ivrRi-natiMi;3>n'/aza'-'fl369_tft*1tw-«7*,错误:意外的扣让>r=yar7r;inatrix二13土x:二;:3"r.yajraylx;1:3;rz;atr-x;1;3;,KT.fit3LX1;313

6、.将之前的state,数组,矩阵合在一起创建一个长度为3的的表。>HLC113E拷误:我不全.袖善耻xwv1itr*LxjasasWltaL39013>|sralfr.yarraferlx)fttashnqldnnn.swnf,elswh"nt11Hwa汁trqldwnnsw*1,“寸上巳11rtqld-I一一3'-J-4. 创建一个数据框如图。mpgcyldisphpdratMazdaRX421.06160.01103.90MazdaRX4Wag21.06160.01103,90Datsun71022.84108.0933,85Hornet4Drive21.46

7、258.01103.08IIan:eihtuadjitcarsvera皿度widran21.01102.62。3.?021.Q1102.8753-BO22.£2,3203*;521.41103.05ie.?二E3.4403.15IS1心3.4fiG2."2d£泌£KeEdsRX气和3Dm3*-,10orne4Drive己二二己二七r'b.Fnfflwtr'f5.将这个数据框按照mpg歹U进行排序。>rydatafiydata:,二:,我与牛金夕堂三工)fWU-drat:-IDetsr;Hornet4DriveMazda5X4i-Is

8、zdaSX46.访问数据框中drat列值为3.90的数据。>mydatawhich(evdarasds?ar-=3.90rhpdratMfiidaRX421110卫-42。3.9MX4Wag21110卫.寻53.3I实验要求要求学生熟练掌握向量、矩阵、数据框、列表、因子的创建和使用实验四数据的导入导出.2.实验目的熟练掌握从一些包中读取数据。熟练掌握csv文件的导入。创建一个数据框,并导出为csv格式。实验内容创建一个csv文件(内容自定),并用readtable函数导入该文件。查看R语言自带的数据集airquality(纽约1973年5-9月每日空气质.)o

9、歹0出airquality查看airquality查看airquality的前十歹0,并将这前十列保存到air中。中列的对象类型。数据集中各成分的名称将air这个数据框导出为csv格式文件。(write.table(x,file="”,sep="”,s=TRUE,s=TRUE,quote=TRUE)实验要求要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出。实验五R语言数据的清洗1. 实验目的查看数据集的缺失值,并学会对缺失值进行处理。2. 对异常变量重新赋值。3. 将某一列的字符型转化为日期型。4. 利用subset()获取

10、子集。1. 实验内容有一个数据框代码如下,使用summary函数查看,那一歹U含有缺失值,有几个。并查看wind歹U的最大值。2. Ozone<-c(41,36,12,18,NA,28)Solar.R<-c(190,118,149,313,NA,NA)wind<-c(7.4,8.0,12.6,11.5,14.3,14.9)Temp<-c(67,82,74,62,86,66)date<-c("1997/05/0T',”1997/05/02”,”1997/05/03”,”1997/05/04”,”1997/05/05”,”1997/05/06”)ai

11、r<-data.frame(date,Ozone,Solar.R,wind,Temp,stringsAsFactors=FALSE)使用class()函数查看date函数的类型,并将其转化为data型,格式为月/日/使用subset()根据TemgU获取air中Temp大丁60小丁70的数据。3. 将air中含有缺失值的列去掉。4. 找出Temp中大丁85的值将其设置为缺失值。5. 创建一个air1包含两个歹Uq1,q2。用cbind函数添加到air中。6. 使用names函数查看air的歹0名,并根据歹0自己创建一个数据框。使用rbind函数添加到air中实验要求要求学生会用subse

12、t获取子集,学会对缺失值进行一些简单的处理和对一些异常值的查找和修改。实验六高级数据管理1. 实验目的学会简单的数值和字符处理函数。2. 学会自己编写一个函数。1. 实验内容使用下面代码创建roster数据集。Student<-c("JohnDavis","AngelaWilliams","BullwinkleMoose","DavidJones","JaniceMarkhammer","CherylCushing","ReuvenYtzrhak",

13、"GregKnox","JoelEngland","MaryRayburn")Math<-c(502,600,412,358,495,512,410,625,573,522)Science<-c(95,99,80,82,75,85,80,95,89,86)2. English<-c(25,22,18,15,20,28,15,30,27,18)roster<-data.frame(Student,Math,Science,English,stringsAsFactors=FALSE)使用length函数查看Stu

14、dent的长度。3. 计算该班级数学的平均成绩,最高成绩。4. 将成绩单按照姓和名进行排序,将学生的各科考试成绩组合为单一的成绩衡量指标、基丁相对名次(前20%,下20%等等)给出从A到F的评分。1) 使用quantile函数按20%40%60%80%,求分位数。2) 使用变量重命名的方法将grade列分为A、BC口F几个等级。3) 使用strsplit函数将Student歹0的名字分割,存到name中。4) 创建一个函数x1,功能为实现返回值为传入参数的第一个值。5) 使用sapply函数将name中的firstname提取出来。(“sapply(data,function)”)同理即可提取

15、出lastname0将lastname和firstname与roster合并,同时去掉roster的第一歹0。6) 将成绩单用姓和名进行排序。实验要求要求学生学会一些简单的数值和字符处理函数。学会如何自己创建一个函数。和对一些简单问题的处理。实验七基本统计分析实验、实验目的1. 学会使用summary函数和Hmisc包中的describe函数来计算统计量。2. 使用table函数生成一维、二维、多维列联表。3. 学会用R实现卡方独立性检验。4. 学会用R进行相关性的度量。5. 学会用R进行Pearson、Spearman和Kendall相关。6. 学会用R进行相关性的显著性检验。7. 学会用R

16、进行组问差异的非参数检验。、实验内容描述性统计分析1)对R自带的数据集rock(48块石头的形态数据)使用summary函数、Himisc包中的describe函数、pastecs包中的stats.desc函数计算描述性统计量。2)使用aggregate、doby中的summaryBy对sleep数据集的group歹U分组获取描述性统计量。1. 频数表和列联表1)加载vcd包中的Arthritis数据集使用table生成简单的频数统计表。2)使用table、xtabs对Arthritis生成二维歹U联表。并使用addmargins为这些表格添加边际和(根据Treatment>Improved)。3)使用xtabs,table生成三维歹U联表(根据Treatment>sex、Improved三个因子)。4)使用chisq.testhan()函数对二维表的行和歹U进行卡方独立性检验,并观察他们是否独立。5)使用vcd包中的assocstats()函数计算二维歹U联表的phi系数、歹U联系数和Cramer'sV系数。2. 相关1)Pearson、Spearman和Kendall相关a)对state.x77数据集计算方差和协方差、Pearson积差相关系数、Spearman等级相关系数。b)使用psych包中的corr.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论