阅读量:1
R语言中subset函数用于从数据框中选择需要的观测值和变量,可以根据条件进行子集的选择。其基本用法如下:
subset(data, subset, select)
- data:要进行子集选择的数据框或矩阵。
- subset:子集选择的条件,可以是一个逻辑向量或逻辑表达式,表示需要满足的条件。
- select:选择需要的变量,可以是一个字符向量或数值向量,表示需要选择的列。
示例:
# 从数据框df中选择满足条件的观测值 new_df <- subset(df, subset = condition) # 从数据框df中选择满足条件的观测值,并选择需要的变量 new_df <- subset(df, subset = condition, select = variables)
其中,condition
可以是一个逻辑向量,也可以是一个逻辑表达式,例如df$var > 10
表示选择变量var
大于10的观测值。variables
可以是一个字符向量,也可以是一个数值向量,例如c("var1", "var2")
表示选择var1
和var2
这两个变量。
需要注意的是,subset函数会在选择变量时自动将结果转换为数据框,因此返回的结果仍然是一个数据框。