欢迎来到代码驿站!

当前位置:首页 >

R语言之左连接的三种实现操作

时间:2021-09-10 10:14:16|栏目:|点击:

数据处理中经常遇到表连接问题,本次介绍R语言中三种左连接方法,这三种是等价的,不过会有时间快慢问题,斟酌使用。

法一:

> data0 <- merge(a,c,all.x=TRUE,by='CELLPHONE')

法二:

> data1 <- sqldf('select a.*,b.* from a left join c on a.CELLPHONE=c.CELLPHONE')

法三:

> data2 <- c[a,on='CELLPHONE']

注意:第三种方法的顺序不能写反了。

补充:R语言中的inner_join, full_join, left_join, right_join

在R for Data Science中,作者用了非常直观的例子解释了上面的四个概念。说明如下:

我们的数据集是这样的:

x <- tribble(
 ~key, ~val_x,
 1, "x1",
 2, "x2",
 3, "x3"
)
y <- tribble(
 ~key, ~val_y,
 1, "y1",
 2, "y2",
 4, "y3"
)

可以看出,x与y的key都有1,2,但是x的key里面有3,y的key里面有4.

下面我们来看这四个概念:

1. inner_join

x %>%
 inner_join(y, by = "key")

其结果是

key val_x val_y
 <dbl> <chr> <chr>
   1 x1  y1  
   2 x2  y2

可以看出,此时基于key的连接只保留了共同的key值1与2对应的数据;

2. full_join

x %>%
 full_join(y, by = "key")

其结果是

key val_x val_y
 <dbl> <chr> <chr>
 1 x1  y1  
 2 x2  y2  
 3 x3  NA  
 4 NA  y3

可以看出,此时基于key的连接保留了所有key值对应的数据,当相应的值不存在的时候,用NA代替;

3. left_join

x %>%
 left_join(y, by = "key")

此时的结果为

<dbl> <chr> <chr>
  1 x1  y1  
  2 x2  y2  
  3 x3  NA 

可以看出, 此时基于key的连接只保留了x对应的key值的数据,当相应的值不存在的时候,用NA代替;

4. right_join

x %>%
 right_join(y, by = "key")

此时的结果为

key val_x val_y
 <dbl> <chr> <chr>
1 x1  y1  
2 x2  y2  
4 NA  y3

可以看出,此时基于key的连接只保留了y对应的key值的数据,当相应的值不存在的时候,用NA代替。

上一篇:Windows Powershell排序和分组管道结果

栏    目:

下一篇:docker 容器上编译 go 程序提示找不到文件问题

本文标题:R语言之左连接的三种实现操作

本文地址:http://www.codeinn.net/misctech/173931.html

推荐教程

广告投放 | 联系我们 | 版权申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:914707363 | 邮箱:codeinn#126.com(#换成@)

Copyright © 2020 代码驿站 版权所有