使用R中merge()函数合并数据的方法_第1页
使用R中merge()函数合并数据的方法_第2页
使用R中merge()函数合并数据的方法_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第使用R中merge()函数合并数据的方法目录使用R中merge()函数合并数据如何使用merge()获取数据集中交叉部分如何理解不同类型的合并如何实现完整合并(fullouterjoin)总结

使用R中merge()函数合并数据

在R中可以使用merge()函数去合并数据框,其强大之处在于在两个不同的数据框中标识共同的列或行。

如何使用merge()获取数据集中交叉部分

merge()最简单的形式为获取两个不同数据框中交叉部分。举例,获取cold.states和large.states完全匹配的数据。代码如下:

merge(cold.states,large.states)

NameFrostArea

1Alaska152566432

2Colorado166103766

3Montana155145587

4Nevada188109889

如果你属性数据库语法SQL,你可能想merge()和数据库中JOIN功能很相似。确实如此,merge()函数的不同参数可以实现内join,leftjoin,rightjoin以及完整join。

merge()函数有很多参数,看起来非常吓人。但他们都几中类型参数有关:

x:第一个数据框.y:第二个数据框.by,by.x,by.y:指定两个数据框中匹配列名称。缺省使用两个数据框中相同列名称。all,all.x,all.y:指定合并类型的逻辑值。缺省为false,all=FALSE(仅返回匹配的行).

最后一组参数all,all.x,all.y需要进一步解释,决定合并类型。

如何理解不同类型的合并

merge()函数支持4种类型数据合并:

Naturaljoin:仅返回两数据框中匹配的数据框行,参数为:all=FALSE.

Fullouterjoin:返回两数据框中所有行,参数为:all=TRUE.

Leftouterjoin:返回x数据框中所有行以及和y数据框中匹配的行,参数为:all.x=TRUE.

Rightouterjoin:返回y数据框中所有行以及和x数据框匹配的行,参数为:all.y=TRUE.

如何实现完整合并(fullouterjoin)

返回示例数据中美国的州,执行完整合并cold和largestate,使用参数all=TRUE.

merge(cold.states,large.states,all=TRUE)

NameFrostArea

1Alaska152566432

2ArizonaNA113417

3CaliforniaNA156361

13TexasNA262134

14Vermont168NA

15Wyoming173NA

两个数据框有不同的名称,所以R基于两者state的name进行匹配。Frost来自cold.states数据框,Area来自large.states.

上面代码执行了完整合并,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论