如何在Python中使用duplicated()检测重复数据

作者

首页»
云计算»
知识库»
如何在Python中使用duplicated()检测重复数据

发布时间:2024-10-01 19:15

阅读量:0

duplicated() 函数并不是 Python 的内置函数，但你可以使用 Python 的标准库或第三方库来实现类似的功能

方法1：使用 Python 标准库

def find_duplicates(data):     duplicates = set()     unique_elements = set()          for element in data:         if element in unique_elements:             duplicates.add(element)         else:             unique_elements.add(element)                  return duplicates  data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3] duplicates = find_duplicates(data) print("重复的数据：", duplicates)

方法2：使用 Pandas 库

首先，确保已经安装了 Pandas 库。如果没有安装，可以使用以下命令进行安装：

pip install pandas

然后，你可以使用 duplicated() 函数检测重复数据：

import pandas as pd  data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 2, 3] series = pd.Series(data)  # 找到重复的数据 duplicates = series[series.duplicated()]  # 输出重复的数据 print("重复的数据：") print(duplicates)