r语言group_by函数的用法是什么

avatar
作者
筋斗云
阅读量:3

group_by函数是dplyr包中的一个函数,用于按照指定的变量对数据进行分组。它通常与其他函数(如summarise、mutate和filter)一起使用,用于对每个组进行汇总、变换或筛选操作。

group_by的基本用法是:group_by(df, variable),其中df是要进行分组的数据框或数据表,variable是要分组的变量名。分组后,可以对每个组进行各种操作,如计算每组的平均值、总和、计数等。

以下是一个示例:

library(dplyr)  # 创建一个示例数据框 df <- data.frame(   group = c("A", "A", "B", "B", "B"),   value = c(1, 2, 3, 4, 5) )  # 按照group变量进行分组 df_grouped <- group_by(df, group)  # 对每个组计算平均值 df_avg <- summarise(df_grouped, avg_value = mean(value))  # 输出结果 print(df_avg) 

输出结果为:

# A tibble: 2 x 2   group avg_value   <chr>     <dbl> 1 A           1.5 2 B           4.0 

上述示例中,首先使用group_by函数按照group变量进行分组,然后使用summarise函数计算每个组的平均值。最后得到一个新的数据框df_avg,包含了每个组的平均值。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!