




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1 R语言数据集的创建语言数据集的创建 1.范式的起源范式的起源 “范式范式”的概念和理论是美国著名科学哲学家托马斯的概念和理论是美国著名科学哲学家托马斯库恩库恩 (Thomas,Kuhn) 提出并在科学革命的结构提出并在科学革命的结构(The Structure of Scientific Revolutions)(1962)中进行系统阐述并发展而来的)中进行系统阐述并发展而来的。在库恩看来,。在库恩看来,范式也范式也 指一种对本体论、认识论和方法论的基本承诺,是科学家集团所共同接受指一种对本体论、认识论和方法论的基本承诺,是科学家集团所共同接受 的一组假说、理论、准则和方法的总和,这
2、些东西在心理上形成科学家的的一组假说、理论、准则和方法的总和,这些东西在心理上形成科学家的 共同信念。库恩说,范式也共同信念。库恩说,范式也指那些公认的科学成就,它们在一段时间里为指那些公认的科学成就,它们在一段时间里为 实践共同体提供典型的问题和解答实践共同体提供典型的问题和解答”,这些成就一般具备两个基本特征,这些成就一般具备两个基本特征, “一是它们空前地吸引一批坚定的拥护者,使他们脱离科学活动的其他竞一是它们空前地吸引一批坚定的拥护者,使他们脱离科学活动的其他竞 争模式;同时,这些成就又足以无限制地为重新组成的一批实践者留下有争模式;同时,这些成就又足以无限制地为重新组成的一批实践者留
3、下有 待解决的问题。待解决的问题。 1、从存储角度划分对象、从存储角度划分对象 R的数据对象可以划分为数值型、字符串型和逻辑型等主要存储类型。的数据对象可以划分为数值型、字符串型和逻辑型等主要存储类型。 (1)数值型)数值型 数值型(数值型(numeric)是计算机存储诸如年龄、身高和体重等数字形式数据的类型。具体表现形式)是计算机存储诸如年龄、身高和体重等数字形式数据的类型。具体表现形式 ,如,如25、1.76以及以及1.67E2等。等。 (2)字符串型)字符串型 字符串型(字符串型(character)是计算机存储诸如姓名、地名等字符形式数据的类型。具体表现形式,如)是计算机存储诸如姓名、
4、地名等字符形式数据的类型。具体表现形式,如 ”Li Ming”、“Hubei”等。等。 (3) 逻辑型逻辑型 逻辑型(逻辑型(logistic)是计算机存储诸如是否同意、是否真假等是非判断形式的数据类型。逻辑型数)是计算机存储诸如是否同意、是否真假等是非判断形式的数据类型。逻辑型数 据只有真(是)、假(非)两个取值,具体形式为大写的英语单词据只有真(是)、假(非)两个取值,具体形式为大写的英语单词TRUE和和FALSE。他们之间的关系。他们之间的关系 是是TRUE等于!等于!FALSE,FALSE等于!等于!TRUE。其中,符号。其中,符号“!”表示反向操作。表示反向操作。 一、一、R的数据对
5、象的数据对象 第1页/共26页 (二)从数据结构角度划分(二)从数据结构角度划分 1、向量、向量 向量(向量(vector)是用于存储数值型、字符型或逻辑型数据的一维数组。它是)是用于存储数值型、字符型或逻辑型数据的一维数组。它是R数据组织的基本单位,用数据组织的基本单位,用 于组织多个数据。由于统计分析的基本单位是变量,变量具有多个变量值。因此,一个向量也可以视为于组织多个数据。由于统计分析的基本单位是变量,变量具有多个变量值。因此,一个向量也可以视为 一个变量,是多个具有相同存储类型的数据的集合。若无特殊说明,向量均为列向量。一个变量,是多个具有相同存储类型的数据的集合。若无特殊说明,向量
6、均为列向量。 2、向量的赋值、向量的赋值 (1)标向量)标向量 只含有一个元素的向量成为标量,创建标量的赋值语句的基本书写格式为:只含有一个元素的向量成为标量,创建标量的赋值语句的基本书写格式为: 对象名对象名 V1 V1 V2 V2 V3 V3 (3)向量类型的判断向量类型的判断 “is.类型名类型名”函数可用于判断数据对象是否为向量,基本书写格式为:函数可用于判断数据对象是否为向量,基本书写格式为: is.vector(数据对象名称数据对象名称) is.numeric(数据对象名称数据对象名称)、is.character(数据对象名称数据对象名称)和和is.logistic(数据对象名称数
7、据对象名称)函数可用函数可用 于判断对应的向量是否依次为数值型向量、字符串型向量或逻辑型向量。结果以于判断对应的向量是否依次为数值型向量、字符串型向量或逻辑型向量。结果以TRUE 或或FALSE 的形式出现。的形式出现。 第3页/共26页 操作实例:操作实例: is.vector(V1) is.character(V2) 3、多元素向量对象的赋值,、多元素向量对象的赋值, 赋值语句的基本书写格式为:赋值语句的基本书写格式为: 对象名对象名-R函数函数 赋值操作符的左侧为赋值操作符的左侧为R函数,其具体形式视具体情况而定。其中,常用的函数,其具体形式视具体情况而定。其中,常用的R函数是函数是c函
8、数函数,基本书基本书 写格式为:写格式为: c(常量或向量名列表常量或向量名列表) 其中,各常量或向量名之间需用逗号隔开。其中,各常量或向量名之间需用逗号隔开。 第4页/共26页 实例操作实例操作: V1-c(1,3,5,7,9,-2,-4,-6,-8,-0.1,0.5) V2-c(“red”,“black”,“green”) V3 V1c(4,6) 用于查找用于查找V1变量中的第变量中的第4个和第个和第6个元素。个元素。 V3c(2:4) 第5页/共26页 2、矩阵、矩阵 矩阵(矩阵(matrix)用于组织多个具有相同存储类型(数值型、字符型或逻辑型)的变量,是二维表格形式。通)用于组织多个
9、具有相同存储类型(数值型、字符型或逻辑型)的变量,是二维表格形式。通 常情况下,矩阵的列为变量,行为观测。常情况下,矩阵的列为变量,行为观测。 (1)矩阵的创建)矩阵的创建 可以通过可以通过is.matrix函数判断数据对象是否为矩阵,基本书写格式为函数判断数据对象是否为矩阵,基本书写格式为: is.matrix(数据对象名称数据对象名称) 若指定对象为矩阵,则结果为逻辑型常量若指定对象为矩阵,则结果为逻辑型常量TRUE或者或者FALSE。 第6页/共26页 (1)矩阵可视为多个向量合并的结果)矩阵可视为多个向量合并的结果 R向量默认为列向量。可通过合并函数将多个已有向量合并成矩阵。基本书写格
10、式为:向量默认为列向量。可通过合并函数将多个已有向量合并成矩阵。基本书写格式为: cbind(向量名列表向量名列表) 向量名之间用英文逗号隔开。各向量的存储格式应一致。行数取决于向量所包含元素个数,列数取决于向量向量名之间用英文逗号隔开。各向量的存储格式应一致。行数取决于向量所包含元素个数,列数取决于向量 的个数。可通过以下函数显示行列数:的个数。可通过以下函数显示行列数: dim(矩阵名矩阵名) 因矩阵是通过列向量合并而成的,矩阵各列的名称默认为列向量名,各行尚未命名。可通过以下函数显示矩因矩阵是通过列向量合并而成的,矩阵各列的名称默认为列向量名,各行尚未命名。可通过以下函数显示矩 阵列的名
11、称,或为列重新命名:阵列的名称,或为列重新命名: colnames(矩阵名矩阵名)或或colnames(矩阵名矩阵名,列常量位置列常量位置1:列常量位置:列常量位置2。位置常量用于指定仅显示名称的位置常量用于指定仅显示名称的 列。以下函数用于显示矩阵各行的名称或为行命名:列。以下函数用于显示矩阵各行的名称或为行命名: rownames(矩阵名矩阵名)或或rownames(矩阵名矩阵名行常量位置行常量位置1:行常量位置:行常量位置2, 第7页/共26页 实例操作:实例操作: V1dim(V1)#显示矩阵的行列数显示矩阵的行列数 str(V1)#显示对象结构显示对象结构 colnames(V1)#
12、显示矩阵各列名称显示矩阵各列名称 colnames(V1,3:5)#显示矩阵制定列名称显示矩阵制定列名称 rownames(V1)rownames(V2)is.matrix(V1)#判断判断V1是否为矩阵。是否为矩阵。 第8页/共26页 说明:该矩阵为一个说明:该矩阵为一个3行行8列的矩阵。行数取决于列向量所包含的元素个数,列数取决于列向量的个数。列的矩阵。行数取决于列向量所包含的元素个数,列数取决于列向量的个数。 矩阵显示中,第矩阵显示中,第1行为各列标题,各行为行标题。行为各列标题,各行为行标题。 列合并时各向量包含的元素个数相等,或者整数倍数。列合并时各向量包含的元素个数相等,或者整数倍
13、数。 行合并函数行合并函数rbind(向量名列表向量名列表)也是创建矩阵的一种方式。也是创建矩阵的一种方式。 (2)矩阵可由单个向量派生而来)矩阵可由单个向量派生而来 如果矩阵中的数据元素已经存在于一个向量中,则可以利用如果矩阵中的数据元素已经存在于一个向量中,则可以利用marix函数将改向量按制定方式派生为矩阵。基函数将改向量按制定方式派生为矩阵。基 本书写格式为:本书写格式为: marix(向量名,向量名,nrow=行数,行数,ncol=列数,列数,byrow=TRUE/FALSE,dimnames=list(行名称向量,列名称行名称向量,列名称 向量向量) 第9页/共26页 实例操作:实
14、例操作: adim1dim2V2V2 说明:说明:dim项可以省略,表示所生成的矩阵没有行列名称。项可以省略,表示所生成的矩阵没有行列名称。 第10页/共26页 访问矩阵中的元素访问矩阵中的元素 (1)访问制定位置的元素,有三种基本书写格式,分别为:)访问制定位置的元素,有三种基本书写格式,分别为: 矩阵名矩阵名行位置常量,列位置常量行位置常量,列位置常量 矩阵名矩阵名行位置常量行位置常量1:行位置常量:行位置常量2,列位置常量,列位置常量1:列位置常量:列位置常量2 矩阵名矩阵名c(行位置常量列表,列位置常量列表行位置常量列表,列位置常量列表) 实例操作实例操作: V12,3#访问第访问第2
15、行,第行,第3列的位置上的元素列的位置上的元素 V11:2,1:3#访问第访问第12行,第行,第13列位置上的元素列位置上的元素 V11:2,c(1,3)#访问第访问第12行,第行,第1,3列位置上的元素列位置上的元素 第11页/共26页 访问指定行上的所有元素,有四种基本书写格式,分别为:访问指定行上的所有元素,有四种基本书写格式,分别为: 矩阵名矩阵名行位置常量,行位置常量, 矩阵名矩阵名行位置常量行位置常量1:行位置常量:行位置常量2, 矩阵名矩阵名c(行位置常量列表行位置常量列表), 矩阵名矩阵名行位置向量名,行位置向量名, 访问指定列上的所有元素,有四种基本书写格式,分别为:访问指定
16、列上的所有元素,有四种基本书写格式,分别为: 矩阵名矩阵名,列位置常量,列位置常量 矩阵名矩阵名,行位置常量,行位置常量1:行位置常量:行位置常量2 矩阵名矩阵名,c(行位置常量列表行位置常量列表) 矩阵名矩阵名,行位置向量名,行位置向量名 说明:省略英文逗号前面的行位置参数,表示访问指定列上的所有行。说明:省略英文逗号前面的行位置参数,表示访问指定列上的所有行。 第12页/共26页 实例操作:实例操作: V12,#表示第表示第2行上的所有元素行上的所有元素 V2c(1:3),#访问第访问第1,3行上的所有元素行上的所有元素 aV1a,#利用逻辑型位置向量访问第利用逻辑型位置向量访问第1,3行
17、上的所有元素。行上的所有元素。 V1,1:3#访问第访问第13列上的所有元素列上的所有元素 aadim1dim2dim3aa#逐张显示各张二维表的名称逐张显示各张二维表的名称 说明:数组显示以表格为单位,依次列出各表格的数据内容说明:数组显示以表格为单位,依次列出各表格的数据内容 数组元素的访问方式与矩阵元素的访问方式类似,只是需要分别指定行号、列号数组元素的访问方式与矩阵元素的访问方式类似,只是需要分别指定行号、列号3个位置参数。个位置参数。 第15页/共26页 (四)数据框的创建(四)数据框的创建 可以通过可以通过is.data.frame函数可判断数据对象是否为数据框,基本书写格式为:函
18、数可判断数据对象是否为数据框,基本书写格式为: is.data.frame(数据对象名数据对象名) 如果指定对象为数据框,结果为逻辑型常量如果指定对象为数据框,结果为逻辑型常量TRUE,否则为逻辑型常量,否则为逻辑型常量FALSE。 1、创建数据框、创建数据框 数据框可以被视为多个存储类型不同的向量集合。创建数据框就是要指定数据框由哪些向量组成,这些向量对应数据框的哪些域(数据框是一张二维表格,行和列统计上分别成为观测和变量,计算机分别称为记录和域。其中,变量名称对应的称谓是域名,变量值对应域值)。基本书写格式为:数据框可以被视为多个存储类型不同的向量集合。创建数据框就是要指定数据框由哪些向量
19、组成,这些向量对应数据框的哪些域(数据框是一张二维表格,行和列统计上分别成为观测和变量,计算机分别称为记录和域。其中,变量名称对应的称谓是域名,变量值对应域值)。基本书写格式为: data.frame(域名域名1=向量名向量名1,域名,域名2=向量名向量名2,) 数据框中的数据事先已经存储在各向量中,它们与各域一一对应。可以通过以下函数显示各个域名,具体书写格式为:数据框中的数据事先已经存储在各向量中,它们与各域一一对应。可以通过以下函数显示各个域名,具体书写格式为: names(数据框名数据框名) 第16页/共26页 实例操作实例操作 V5V5 names(V5)#显示数据框的域名显示数据框
20、的域名 str(V5)#显示数据框的结构信息显示数据框的结构信息 is.data.frame(V5)#判断判断V5是否为数据框是否为数据框 数据框的访问有数据框的访问有3中基本方式:中基本方式: 数据框名数据框名$域名域名#表示访问指定数据框中的指定域表示访问指定数据框中的指定域 数据框数据框“域名域名“ 数据框数据框域编号域编号 其中指定将访问的域是数据框的第几个域,域编号取决于数据框创建的顺序。其中指定将访问的域是数据框的第几个域,域编号取决于数据框创建的顺序。 第17页/共26页 此外,还可以通过此外,还可以通过attach和和detach函数简化访问时的域名书写,基本书写格式为:函数简
21、化访问时的域名书写,基本书写格式为: attach(数据框名数据框名) 访问域名访问域名1 访问域名访问域名2 等等 detach(数据框名)(数据框名) attach为数据框绑定函数,为数据框绑定函数,detach为数据框解除绑定函数。为数据框解除绑定函数。attach和和detach函数必须配对出现函数必须配对出现 第18页/共26页 实例操作实例操作 V5 V5$Fwind#访问访问Fwind域域 V5“Ftemp”#访问访问Ftemp域域 with函数的使用函数,基本书写格式为:函数的使用函数,基本书写格式为: with(数据框名,数据框名,域访问函数域访问函数1 域访问函数域访问函数
22、2 等等等等 说明:说明:with函数中的大括号必须成对出现。函数中的大括号必须成对出现。with 函数允许读取域中的数据,但不允许修改,可改用函数允许读取域中的数据,但不允许修改,可改用within函数。函数。 第19页/共26页 5、列表的创建与访问列表的创建与访问 列表创建函数的基本书写格式为:列表创建函数的基本书写格式为: list(成分名成分名1=对象名对象名2,成分名,成分名2=对象名对象名2,) 对象是空间已有的,与各成分一一对应。可以通过以下函数显示各个成分名,具体书写对象是空间已有的,与各成分一一对应。可以通过以下函数显示各个成分名,具体书写 格式为:格式为: names(列
23、表名列表名) 可通过可通过is.list函数判断数据对象是否为列表,基本书写格式为:函数判断数据对象是否为列表,基本书写格式为: is.list(数据对象名数据对象名) 反馈结果为逻辑型常量反馈结果为逻辑型常量TRUE和和FALSE。 第20页/共26页 实例操作:实例操作: 创建访问一个名称为创建访问一个名称为V6的列表。成分名称分别为的列表。成分名称分别为L1,L2,L3,依次对应,依次对应a,b,c三个对三个对 象。象。 abb,1=seq(from=1,to=10,by=2) b,2=seq(from=10,to=1,by=-2) cV6name(V6)#显示列表显示列表V6的各成分名
24、的各成分名 str(V6)#显示对象显示对象V6的存储类型和结构信息的存储类型和结构信息 is.list(V6)#判断判断V6是否为列表是否为列表 第21页/共26页 (2)列表的访问列表的访问 列表的访问有列表的访问有3中基本方式:中基本方式: 列表名列表名$成分成分#表示访问指定数据框中的指定成分表示访问指定数据框中的指定成分 列表名列表名“成分成分” 列表名列表名成分成分 二、二、数据的录入数据的录入 (一)键盘的录入(一)键盘的录入 两种录入方式:用两种录入方式:用R内置的文本编辑器和在代码中嵌入数据。内置的文本编辑器和在代码中嵌入数据。 R中的函数中的函数edit()会自动调用一个允许手动输入数据的文本编辑器
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 客服问题记录及解决模板详解
- 透水混凝土铺装施工技术方案
- 排水管网设施设备应急抢修方案
- 粤教版信息技术基础必修 《6.1信息安全与系统维护措施》教学设计
- 2025不锈钢制品购销合同书
- 2.2.2海水的运动及影响教学设计-2024-2025学年高中地理鲁教版(2019)必修一
- 2025内蒙古自治区交通运输厅退休返聘人员劳动合同书
- 2025年整形美容科隆胸脂肪填充技术操作规范化检测试卷答案及解析
- 2.1 迎接蚕宝宝的到来 教学设计-2024-2025学年科学三年级下册教科版
- 退化林枯死木清理及卫生伐方案
- 2025年电梯安全总监职责培训考核试题及答案
- 2025年全国保密教育线上培训考试测试卷必考附答案详解
- 2025年陕西教师编制招聘考试笔试试题(含答案)
- 2025年供电所人员考试题(含答案)
- 药肥登记管理办法
- 深企投产业研究院:2025第三代半导体产业链研究报告
- 华为主数据管理办法
- 商混公司生产部管理制度
- 水果供应链协议
- 用别人资质中标合同范本
- 储备土地巡查管理办法
评论
0/150
提交评论