R语言期末知识点汇总.doc_第1页
R语言期末知识点汇总.doc_第2页
R语言期末知识点汇总.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、R区分大小写2、函数getwd()来查看当前的工作目录,setwd()设定当前的目录。使用引号”闭合这些目录名和文件名3、getwd()显示当前的工作目录 ls()列出当前工作空间的对象 rm(objectlist)移除(删除)一个或多个对象 help()显示可用选项说明 options()显示或者设置当前选项 history(#)显示最近使用过#个命令(默认值为25) savehistory(“myfile”)保存命令历史到文件myfile中(默认值为.Rhistory) loadhistory(“myfile”)载入一个命令历史文件(默认值为.Rhistory) save.image(“myfile”)保存工作空间到文件myfile中(默认值为.RData) save(objectlist,file=”myfile”)保存指定对象到一个文件中 load(“myfile”)读取一个工作空间到当前会话中(默认值为.RData) q()退出R。将会询问你是否保存工作空间4、R将反斜杠作为一个转义符5、setwd(“mydirectory”)修改当前的工作目录为mydirectory setwd()不会自动创建一个不存在的目录6、dir,create()来创建新目录7、函数source(“filename”)可在当前会话中执行一个脚本。如果文件名不包括路径,R将假设此脚本在当前工作目录中。8、函数sink(“filename”)将输出重定向到文件filename中。但是它对图形输出没有影响。9、参数append=TRUE可以将文本追加到文件后,而不是覆盖它。参数split=TRUE可将输出同时发送到屏幕和输出文件中。10、使用dev.off()将输出返回到终端。11、数据集通常是由数据构成的一个矩形组,行表示观测,列表示变量。12、单个向量中的数据必须拥有相同的类型或模式。同一向量中无法混杂不同模式的数据。13、标量是只含一个元素的向量。14、方括号中的数表示给定元素中所处的位置。15、创建矩阵。一般格式:myymatrix-matrix(vector,nrow=number_of_rows,ncol=number_of_coumns,byrow=logical_value,dimnames=list(char_vector_rownames,char_vectoe_colnames)其中vector包含了矩阵的元素,nrow和ncol用以指定的行和列的维数,diamnames包含了可选的以字符型向量表示的行名和列名。16、byrow表明矩阵按行填充(byrow=TRUE)还是按列填充(byrow=FALSE),默认情况下按列。17、Xi,指矩阵X中的第i行,X,j表示第j列,Xi,j表示第i行第j列。18、数组创建。一般格式:myarray-array(vrctor,dimensions,dimnames)其中vector包含了数组的数据,dimensions是一个数值型向量,给出了各维度下标的最大值,即几行几列也可是三维的,而dimnames是可选的、给维度名称标签的列表。19、数据框的创建。Mydata_data.from(col1,col2,)其中col1,col2,表示的是列向量20、函数attach()可将数据框添加到R的搜索路径中。detach()将数据框从搜索路径中移除,并且不会对数据框本身做任何处理。 21、类别(名义型)变量和有序类别变量在R中称为因子。22、函数factor()以一个整数向量的形式存储类别值,整数的取值范围是1k,同时一个由字符串(原始值)组成的内部向量将投影到这些数上。要表示有序型变量,需要为函数factor()指定参数order=TRUE。23、可以指定levels来途欢默认排序。24、双重括号中指明代表某个成分的数字或名称来访问列表中的元素。25、type=表示同时绘制点和线26、函数par()可以修改图形的参数。不加参数的执行par()将生成一个含有当前图形参数设置的列表。27、参数no.readonly=TRUE可以生成一个可以修改当前参数的列表。28、pch指定绘制点时使用的符号 lty指定线条类型 lwd指定线条宽度。默认值为129、col默认值的绘图颜色。例如:col=c(,) col.axis坐标轴刻度文字的颜色 col.lab坐标轴标签的颜色 col.main标题颜色 col.sub副标题的颜色 fg图形的前景色 bg图形的背景色30、cex指定符号的大小。cex是一个数值,表示绘图符号相对于默认大小的缩放倍数。默认大小为1,1.5表示放大为默认值的1.5倍,0.5表示缩小为默认值的50%。 cex.axis坐标轴刻度文字缩放的倍数 cex.lab坐标轴标签的缩放倍数。 cex.main标题的缩放倍数 cex.sub副标题缩放倍数31、font用于指定绘图使用的字体样式。1=常规,2=粗体,3=斜体,4=粗斜体,5=符号字体。 ps字体磅值 family绘制文本是使用的字体族32、某些高级绘图函数已经包含了默认的标签和标题。可以通过在plot()语句或者单独的par()语句中添加ann=FALSE来移除他们。33、为图形添加标题和坐标标签。调用格式:title(main=main title,sub=subtitle,xlab=x-axis label,ylab=y-axis label)34、可以使用axis()来创建自定义坐标轴。其格式:axis(side,at=,labels=,pos=,lty=,col=,las=,tck=,.) side一个整数,表示在图形的哪边绘制坐标轴(1=下,2=左,3=上,4=右) at一个数值型向量,表示需要绘制刻度线的位置 labels一个字符型向量,表示置于刻度线旁边的文字标签(如果我NULL,则将直接使用at中的值) pos坐标轴线绘制位置的坐标 las标签是否平行于(=0)或者垂直于(=2)坐标轴 tck刻度线长度,以相对于绘图区域大小的分数表示(负值在图形外侧,正值在内侧,0表示禁用刻度线,1表示绘制网格线),默认值为-0.01.35、创建自定义坐标轴时,你应当禁用高级绘图函数自动生成的坐标轴。参数axes=FALSE将禁用全部坐标轴。xaxt=”n”和yaxt=”n”将分别表示禁用x轴或y轴36、或*求幂 x%y求余 x%/%y整数除法 37、变量重命名。方法一:fix()来调用一个交互式的编辑器,单击变量,然后在弹出的对话框中将其重命名。方法二:rename(dataframe,c(oldname=”newname”,)38、在R中,缺失值以符号NA表示。不可能出现的值通过符号NaN来表示。39、is.na()允许你检测缺失值是否存在。40、na.rm=TRUE选项,可以在计算之前移除缺失值并使用剩余值进行计算。也可以用过函数na,omit()移除所含有的缺失值的观测即行。41、日期转化。函数as.Date(). %d数字表示的日期(031) %a缩写的星期名 %A非缩写星期名 %m月份(00-12) %b缩写的月份 %B非缩写月份 %y两位数的年份 %Y四位数的年份42、函数order()对一个数据框进行排序。默认的排序顺序是升序。在排列变量前加一个减号即可得到降序的排列结果。43、函数merge()可横向合并两个数据框。例如:total-merge(dataframeA,dateframeB,by”ID”)44、如果要直接横向合并两个矩阵或者数据框,并且不需要指定一个公共索引,那么可以直接使用cblind()函数。但每个对象必须拥有相同的行数并且要以相同的顺序排序。45、rbind()函数可以纵向合并两个数据框。46、abs(x)绝对值 sqrt(x)平方根 ceiling(x)不小于x的最小整数 floor(x)不大于x的最大整数 trunk(x)向0的方向截取的x中的整数部分 round(x,digits=n)将x舍入为指定位的小数 signif(x,digits=n)将x舍入为指定的有效数字位数 log(x,base=n)对x去以n为底的对数 mean(x)平均数 median(x)中位数 sd(x)标准差 var(x)方差 mad(x)绝对中位差 range(x)求值域 sum(x)求和 diff(x,lag=n)滞后差分,lag用以指定滞后几项。默认的lag值为1 scale(x,center=TRUE,scale=TRUE)为数据对象x按列进行中心化或者标准化。47、默认情况下,函数scale()对矩阵或者数据框的指定列进行均值为0、标准差为1的标准化。要对每一列进行任意均值和标准差的标准化可以使用如下代码:newdate-sacle(mydate)*SD+M 其中M是想要的均值,SD为想要的标准差。在非数值型的列上使用scale()函数将会报错。48、nchar(x)计算x中的字符数量。例如:x- c(“ab”,”cde”,”fghij”) nchar(x3返回值为5) substr(x,start,stop)提取或替换一个字符向量中的子串。例如:x- “abcdef” substr(x,2,4) -“22222”(x将变成”a222ef”) grep(pattern,x,ignore.case=FALSE,fixed=FALSE)在x中搜索某种模式。若fixed=FALSE,则pattern为一个正则表达式。若fixed=TRUE,则pattern为一个文本字符串。返回值为匹配的下标。如:grep(“A”,c(“b”,”A”,”c”,fixed=TRUE)返回值为2 sub(pattern,replacement,ignore.case=FALSE,fixed=FALSE)在x中搜索pattern,并以文本replacement将其替换。若fixed=FALSE,则pattern为一个正则表达式。若fixed=TRUE,则pattern为一个文本字符串。 strsplit(x,split,fixed=FALSE)在split处分割字符向量x中的元素。若fixed=FALSE,则pattern为一个正则表达式。反之,则为一个文本字符串。 paste(,sep=”)连接字符串,分隔符为sep。例如:paste(“x”,1:3,sep=”M”)返回值为(“xM1”,”xM2”,”xM3”) toupper()大写转换 tolower()小写转换49、length(x)对象x的长度 sep(from,to,by)生产一个序列,例如:indices- sep(1,10,2)返回值为c(1,3,5,7,9) rep(x,n)将x重复n次 cut(x,n)将连续型变量x分割为有着n个水平的因子,使用选项order_result=TRUE以创建一个有序因子 pretty(x,n)创建美观的分割点。通过选取n+1个等间距的取整值,将一个连续型变量x分割为n个区间 cat(,file=”myfile”,append=FALSE)连接中的对象,并将其输出到屏幕上或者文件中。例如:firstname- c(“Jane) cat(“Hello”,firstname,”n”)。当cat输出连接后的对象式,它会将每一个对象都有空格分开。50、n表示新行,t为制表符,为单引号,b为退格51、函数apply()可以将一个任意函数“应用”到矩阵、数组、数据框的任何维度上。apply(x,MARGIN,FUN,)其中,x为数据对象,MARGIN是维度下标,FUN是由你制定的函数,而则包括了任何想传递给FUN的参数。52、在矩阵或者数据框中,MARGIN=1表示行,MARGIN=2表示列。53、函数sapply()表示提取列表中每个成分的第一个元素。其使用格式为:sapply(x,FUN,options)其中的x是数据框或者举证。FUN为一个任意的函数。如果指定了options,它们将被传递给FUN。54、函数t()即可对一个矩阵或者一个数据框进行转置。20、条形图.barplot(height)其中height是一个向量或者一个矩阵。使用选项horiz=TRUE则会生成一幅水平条形图。55、如果height是一个矩阵而不是一个向量,则绘图结果将是一幅堆砌条形图或分组条形图。若beside=FALSE(默认值),则矩阵中的每一列都将生成图中的一个条形。各列中的值将给出堆砌的“子条”高度。若beside=TRUE则矩阵中的每一列都表示一个分组,各列中的值将是并列而不是堆砌。56、使用数据整合函数讲结果传递给barplot()函数,来创建表示均值、中位数、标准差等条形图。57、棘状图使用函数spine()绘制。58、饼状图。pie(x,labels)其中x是一个非负值向量,表示没个扇形的面积。59、在R中,扇形图通过fan.plot()函数实现的。60、直方图。hist(x)其中x是一个有数据值组成的数值向量。参数freq=FALSE表示根据概率密度而不是频数绘制图形。参数breaks用于控制组的数量。须轴rug61、describe()函数可返回变量,观测的数量、缺失

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论