重複する行をCSVファイルからPythonで削除する方法

CSVファイルを扱うためPandasライブラリを使用すると、次の方法で重複したデータを削除できます。

まず、pandasライブラリをインポートします。

import pandas as pd

csvファイルを読み込み、データフレームオブジェクトとして保存するには、read_csv() 関数を使用します。

df = pd.read_csv("data.csv")

重複行を削除するには、ドロップ_重複()関数を使用します。

df.drop_duplicates(inplace=True)

最後に、処理されたデータを新しいcsvファイルとして保存する

df.to_csv("new_data.csv", index=False)

以下は完全なコードです。

import pandas as pd

df = pd.read_csv("data.csv")
df.drop_duplicates(inplace=True)
df.to_csv("new_data.csv", index=False)

そうすると、重複したデータをcsvファイルから削除できます。

bannerAds