Pythonで重複データを抽出する方法
重複を削除するには、集合(set)を使用します。集合は順番がなく、重複要素を持たないデータ構造です。
以下に、この概念を具現化する1つの方法があります。
def find_duplicates(data):
unique_elements = set()
duplicates = set()
for element in data:
if element in unique_elements:
duplicates.add(element)
else:
unique_elements.add(element)
return duplicates
data = [1, 2, 3, 4, 2, 3, 5, 6, 1]
duplicates = find_duplicates(data)
print(duplicates)
ネイティブな日本語で、文を言い換えてください。1つのオプションのみが必要です。アウトプット:
{1, 2, 3}
このコードでは、まず unique_elements と duplicates という2つの空の集合が作られます。次に、データのリストを繰り返し処理し、現在処理している要素が unique_elements にすでに入っていた場合に、その要素を duplicates の集合に追加します。まだ入っていなかった場合は、unique_elements の集合に追加します。最後に、重複している要素のセットである duplicates の集合が返されます。