Python里如何结合pandas使用crosstab函数

avatar
作者
筋斗云
阅读量:0

在Python中,你可以使用pandas库的crosstab函数来创建一个交叉表格,这有助于更好地理解两个或多个分类变量之间的关系

首先,确保已经安装了pandas库。如果没有,请使用以下命令安装:

pip install pandas 

接下来,我们将使用一个简单的示例来演示如何使用crosstab函数。假设你有一个名为data.csv的CSV文件,其中包含以下内容:

Name,Gender,City Alice,Female,New York Bob,Male,San Francisco Charlie,Male,New York Debbie,Female,San Francisco 

现在,我们将使用pandas读取此CSV文件,并使用crosstab函数创建一个基于性别和城市的交叉表格:

import pandas as pd  # 读取CSV文件 df = pd.read_csv('data.csv')  # 使用crosstab函数创建交叉表格 ct = pd.crosstab(df['Gender'], df['City'])  # 显示交叉表格 print(ct) 

运行上述代码后,你将看到以下输出:

City      New York  San Francisco Gender                         Female            1             1 Male              1             1 

这个交叉表格显示了不同性别和城市之间的计数。例如,在"New York"列和"Female"行的交叉点上,我们可以看到有1个女性。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!