重複したテキストフィールドをPythonで検索方法
重複しているテキストフィールドを検索するにはPython の集合(set) データ構造を使用できます。次のサンプルコードを参照してください:
def find_duplicates(text_list):
seen = set()
duplicates = set()
for text in text_list:
if text in seen:
duplicates.add(text)
else:
seen.add(text)
return duplicates
texts = ["apple", "banana", "orange", "apple", "grape", "orange"]
duplicate_texts = find_duplicates(texts)
print(duplicate_texts)
出力が得られます
{'apple', 'orange'}
この例では、テキストのリストを受け取り、中に重複するテキスト項目を返す、find_duplicates関数を定義しています。2つのセット、seenとduplicatesを使用します。テキストのリストを繰り返し処理し、現在のテキスト項目がseenセットにすでに存在する場合、duplicatesセットに追加し、そうでない場合はseenセットに追加します。最後に重複したテキスト項目を返します。
自分自身のニーズに合わせて、このサンプルコードを編集して拡張します。