Pythonで完全に重複する行を見つける方法は何ですか？

2年 ago

蓮, 翼

1 minute

PythonのcollectionsモジュールのCounterを使用して、完全に同じ行を見つけることができます。まず、ファイルを開き、行ごとにファイル内容を読み込む必要があります。次に、各行をリストに追加し、Counterを使用して各行の出現回数を計算します。最後に、カウントが1よりも大きい行を見つけると、それらの行が完全に同じ行です。

以下はサンプルコードです。

from collections import Counter

def find_duplicate_lines(file_path):
    lines = []
    
    with open(file_path, 'r') as file:
        for line in file:
            lines.append(line.strip())
    
    duplicates = [line for line, count in Counter(lines).items() if count > 1]
    
    return duplicates

file_path = 'file.txt'  # 替换为你的文件路径
duplicate_lines = find_duplicate_lines(file_path)

if duplicate_lines:
    print('完全重复的行：')
    for line in duplicate_lines:
        print(line)
else:
    print('没有找到完全重复的行。')

上記のコードは、各行がテキスト行（文字列）であることを前提としており、空白文字を無視しています。他のタイプの行を考慮する必要がある場合や、空白文字を区別する必要がある場合は、コードを適宜変更してください。