如何用Python crosstab函数分析数据

avatar
作者
筋斗云
阅读量:0

在Python中,crosstab函数是Pandas库中的一个功能,它可以用于创建交叉表格,也称为透视表

首先,确保已经安装了Pandas库。如果没有安装,可以使用以下命令进行安装:

pip install pandas 

接下来,我们将使用一个简单的示例来说明如何使用crosstab函数分析数据。假设我们有一个包含学生信息的数据集,其中包括学生的年级、性别和成绩等信息。我们想要分析每个年级和性别组合的平均成绩。

  1. 导入所需的库:
import pandas as pd 
  1. 创建一个示例数据集:
data = {     'Grade': ['A', 'B', 'A', 'C', 'B', 'A', 'C', 'B', 'A', 'C'],     'Gender': ['M', 'F', 'M', 'M', 'F', 'F', 'M', 'F', 'M', 'M'],     'Score': [90, 85, 92, 78, 88, 95, 76, 80, 91, 75] }  df = pd.DataFrame(data) 
  1. 使用crosstab函数创建交叉表格:
cross_tab = pd.crosstab(df['Grade'], df['Gender'], values=df['Score'], aggfunc='mean') 
  1. 打印交叉表格:
print(cross_tab) 

输出结果如下:

Gender   F   M Grade          A       93.5 NaN B       84.0 NaN C       NaN  77.0 

这个交叉表格显示了每个年级和性别组合的平均成绩。例如,在年级A中,男性(M)的平均成绩为NaN(因为没有男性学生在年级A),女性(F)的平均成绩为93.5。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!