R语言:数据集的创建_第1页
R语言:数据集的创建_第2页
R语言:数据集的创建_第3页
R语言:数据集的创建_第4页
R语言:数据集的创建_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,R语言:数据集的创建,1.范式的起源“范式”的概念和理论是美国著名科学哲学家托马斯库恩(Thomas,Kuhn)提出并在科学革命的结构(TheStructureofScientificRevolutions)(1962)中进行系统阐述并发展而来的。在库恩看来,范式也指一种对本体论、认识论和方法论的基本承诺,是科学家集团所共同接受的一组假说、理论、准则和方法的总和,这些东西在心理上形成科学家的共同信念。库恩说,范式也指那些公认的科学成就,它们在一段时间里为实践共同体提供典型的问题和解答”,这些成就一般具备两个基本特征,“一是它们空前地吸引一批坚定的拥护者,使他们脱离科学活动的其他竞争模式;同时,这些成就又足以无限制地为重新组成的一批实践者留下有待解决的问题。,1、从存储角度划分对象R的数据对象可以划分为数值型、字符串型和逻辑型等主要存储类型。(1)数值型数值型(numeric)是计算机存储诸如年龄、身高和体重等数字形式数据的类型。具体表现形式,如25、1.76以及1.67E2等。(2)字符串型字符串型(character)是计算机存储诸如姓名、地名等字符形式数据的类型。具体表现形式,如”LiMing”、“Hubei”等。(3)逻辑型逻辑型(logistic)是计算机存储诸如是否同意、是否真假等是非判断形式的数据类型。逻辑型数据只有真(是)、假(非)两个取值,具体形式为大写的英语单词TRUE和FALSE。他们之间的关系是TRUE等于!FALSE,FALSE等于!TRUE。其中,符号“!”表示反向操作。,一、R的数据对象,(二)从数据结构角度划分1、向量向量(vector)是用于存储数值型、字符型或逻辑型数据的一维数组。它是R数据组织的基本单位,用于组织多个数据。由于统计分析的基本单位是变量,变量具有多个变量值。因此,一个向量也可以视为一个变量,是多个具有相同存储类型的数据的集合。若无特殊说明,向量均为列向量。2、向量的赋值(1)标向量只含有一个元素的向量成为标量,创建标量的赋值语句的基本书写格式为:对象名V1V1V2V2V3V3(3)向量类型的判断“is.类型名”函数可用于判断数据对象是否为向量,基本书写格式为:is.vector(数据对象名称)is.numeric(数据对象名称)、is.character(数据对象名称)和is.logistic(数据对象名称)函数可用于判断对应的向量是否依次为数值型向量、字符串型向量或逻辑型向量。结果以TRUE或FALSE的形式出现。,操作实例:is.vector(V1)is.character(V2)3、多元素向量对象的赋值,赋值语句的基本书写格式为:对象名V3c(2:4),2、矩阵矩阵(matrix)用于组织多个具有相同存储类型(数值型、字符型或逻辑型)的变量,是二维表格形式。通常情况下,矩阵的列为变量,行为观测。(1)矩阵的创建可以通过is.matrix函数判断数据对象是否为矩阵,基本书写格式为:is.matrix(数据对象名称)若指定对象为矩阵,则结果为逻辑型常量TRUE或者FALSE。,(1)矩阵可视为多个向量合并的结果R向量默认为列向量。可通过合并函数将多个已有向量合并成矩阵。基本书写格式为:cbind(向量名列表)向量名之间用英文逗号隔开。各向量的存储格式应一致。行数取决于向量所包含元素个数,列数取决于向量的个数。可通过以下函数显示行列数:dim(矩阵名)因矩阵是通过列向量合并而成的,矩阵各列的名称默认为列向量名,各行尚未命名。可通过以下函数显示矩阵列的名称,或为列重新命名:colnames(矩阵名)或colnames(矩阵名,列常量位置1:列常量位置2。位置常量用于指定仅显示名称的列。以下函数用于显示矩阵各行的名称或为行命名:rownames(矩阵名)或rownames(矩阵名行常量位置1:行常量位置2,,实例操作:V1dim(V1)#显示矩阵的行列数str(V1)#显示对象结构colnames(V1)#显示矩阵各列名称colnames(V1,3:5)#显示矩阵制定列名称rownames(V1)rownames(V2)is.matrix(V1)#判断V1是否为矩阵。,说明:该矩阵为一个3行8列的矩阵。行数取决于列向量所包含的元素个数,列数取决于列向量的个数。矩阵显示中,第1行为各列标题,各行为行标题。列合并时各向量包含的元素个数相等,或者整数倍数。行合并函数rbind(向量名列表)也是创建矩阵的一种方式。(2)矩阵可由单个向量派生而来如果矩阵中的数据元素已经存在于一个向量中,则可以利用marix函数将改向量按制定方式派生为矩阵。基本书写格式为:marix(向量名,nrow=行数,ncol=列数,byrow=TRUE/FALSE,dimnames=list(行名称向量,列名称向量),实例操作:adim1dim2V2V2说明:dim项可以省略,表示所生成的矩阵没有行列名称。,访问矩阵中的元素(1)访问制定位置的元素,有三种基本书写格式,分别为:矩阵名行位置常量,列位置常量矩阵名行位置常量1:行位置常量2,列位置常量1:列位置常量2矩阵名c(行位置常量列表,列位置常量列表)实例操作:V12,3#访问第2行,第3列的位置上的元素V11:2,1:3#访问第12行,第13列位置上的元素V11:2,c(1,3)#访问第12行,第1,3列位置上的元素,访问指定行上的所有元素,有四种基本书写格式,分别为:矩阵名行位置常量,矩阵名行位置常量1:行位置常量2,矩阵名c(行位置常量列表),矩阵名行位置向量名,访问指定列上的所有元素,有四种基本书写格式,分别为:矩阵名,列位置常量矩阵名,行位置常量1:行位置常量2矩阵名,c(行位置常量列表)矩阵名,行位置向量名说明:省略英文逗号前面的行位置参数,表示访问指定列上的所有行。,实例操作:V12,#表示第2行上的所有元素V2c(1:3),#访问第1,3行上的所有元素aV1a,#利用逻辑型位置向量访问第1,3行上的所有元素。V1,1:3#访问第13列上的所有元素aadim1dim2dim3aa#逐张显示各张二维表的名称说明:数组显示以表格为单位,依次列出各表格的数据内容数组元素的访问方式与矩阵元素的访问方式类似,只是需要分别指定行号、列号3个位置参数。,(四)数据框的创建可以通过is.data.frame函数可判断数据对象是否为数据框,基本书写格式为:is.data.frame(数据对象名)如果指定对象为数据框,结果为逻辑型常量TRUE,否则为逻辑型常量FALSE。1、创建数据框数据框可以被视为多个存储类型不同的向量集合。创建数据框就是要指定数据框由哪些向量组成,这些向量对应数据框的哪些域(数据框是一张二维表格,行和列统计上分别成为观测和变量,计算机分别称为记录和域。其中,变量名称对应的称谓是域名,变量值对应域值)。基本书写格式为:data.frame(域名1=向量名1,域名2=向量名2,)数据框中的数据事先已经存储在各向量中,它们与各域一一对应。可以通过以下函数显示各个域名,具体书写格式为:names(数据框名),实例操作V5V5names(V5)#显示数据框的域名str(V5)#显示数据框的结构信息is.data.frame(V5)#判断V5是否为数据框数据框的访问有3中基本方式:数据框名$域名#表示访问指定数据框中的指定域数据框“域名“数据框域编号其中指定将访问的域是数据框的第几个域,域编号取决于数据框创建的顺序。,此外,还可以通过attach和detach函数简化访问时的域名书写,基本书写格式为:attach(数据框名)访问域名1访问域名2等detach(数据框名)attach为数据框绑定函数,detach为数据框解除绑定函数。attach和detach函数必须配对出现,实例操作V5V5$Fwind#访问Fwind域V5“Ftemp”#访问Ftemp域with函数的使用函数,基本书写格式为:with(数据框名,域访问函数1域访问函数2等等说明:with函数中的大括号必须成对出现。with函数允许读取域中的数据,但不允许修改,可改用within函数。,5、列表的创建与访问列表创建函数的基本书写格式为:list(成分名1=对象名2,成分名2=对象名2,)对象是空间已有的,与各成分一一对应。可以通过以下函数显示各个成分名,具体书写格式为:names(列表名)可通过is.list函数判断数据对象是否为列表,基本书写格式为:is.list(数据对象名)反馈结果为逻辑型常量TRUE和FALSE。,实例操作:创建访问一个名称为V6的列表。成分名称分别为L1,L2,L3,依次对应a,b,c三个对象。abb,1=seq(from=1,to=10,by=2)b,2=seq(from=10,to=1,by=-2)cV6name(V6)#显示列表V6的各成分名str(V6)#显示对象V6的存储类型和结构信息is.list(V6)#判断V6是否为列表,(2)列表的访问列表的访问有3中基本方式:列表名$成分#表示访问指定数据框中的指定成分列表名“成分”列表名成分二、数据的录入(一)键盘的录入两种录入方式:用R内置的文本编辑器和在代码中嵌入数据。R中的函数edit()会自动调用一个允许手动输入数据的文本编辑器。具体步骤如下:(1)创建一个空数据框(或矩阵),其中变量名和变量的模式需与理想中的最终数据集一致;(2)针对这个数据对象调用文本编辑器,输入你的数据,并将结果保存回此数据对象中。,实例操作:创建一个名为mydata的数据框,它含有三个变量:age(数值型)、gender(字符型)和weight(数值型)。然后你将调用文本编辑器,键入数据,最后保存结果。mydatamydata-edit(mydata)(2)在代码中嵌入数据mydatatxt-read.table(file=“ForestData.txt”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论