Pythonで重複データを抽出する方法

2年 ago

芽依, 雨夜

1 minute

重複を削除するには、集合（set）を使用します。集合は順番がなく、重複要素を持たないデータ構造です。

以下に、この概念を具現化する1つの方法があります。

def find_duplicates(data):
unique_elements = set()
duplicates = set()
for element in data:
if element in unique_elements:
duplicates.add(element)
else:
unique_elements.add(element)
return duplicates
data = [1, 2, 3, 4, 2, 3, 5, 6, 1]
duplicates = find_duplicates(data)
print(duplicates)

ネイティブな日本語で、文を言い換えてください。1つのオプションのみが必要です。アウトプット:

{1, 2, 3}

このコードでは、まず unique_elements と duplicates という２つの空の集合が作られます。次に、データのリストを繰り返し処理し、現在処理している要素が unique_elements にすでに入っていた場合に、その要素を duplicates の集合に追加します。まだ入っていなかった場合は、unique_elements の集合に追加します。最後に、重複している要素のセットである duplicates の集合が返されます。