阅读量:0
你可以使用pandas库中的groupby函数来按某一列拆分数据。
以下是一个示例代码:
import pandas as pd # 创建一个示例数据集 data = { 'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'], 'Age': [20, 25, 30, 35, 40, 45], 'City': ['New York', 'London', 'Paris', 'New York', 'London', 'Paris'] } df = pd.DataFrame(data) # 按照City列拆分数据 grouped = df.groupby('City') # 遍历每个分组 for city, group in grouped: print(city) print(group) print()
输出结果:
London Name Age City 1 Nick 25 London 4 Nick 40 London New York Name Age City 0 Tom 20 New York 3 Tom 35 New York Paris Name Age City 2 John 30 Paris 5 John 45 Paris
以上示例代码中,我们创建了一个包含姓名(Name)、年龄(Age)、城市(City)的数据集,并按照城市(City)列进行拆分。然后,使用groupby函数进行分组,遍历每个分组并打印出来。
你可以根据需要对每个分组进行其他操作,例如计算统计量、应用自定义函数等。