pandasの欠損値の処理方法

Pandas DataFrame内の欠損値に対処する際には、以下の方法を検討できます。

  1. 欠損値を削除する
  2. どうして
df.dropna(axis=0, how='any')
df.dropna(axis=1, how='all')
  1. None値を埋める
df.fillna(0)  # 使用常数填充缺失值
df.fillna(df.mean())  # 使用均值填充缺失值
df.fillna(df.median())  # 使用中位数填充缺失值
df.fillna(method='ffill')  # 使用前向填充
df.fillna(method='bfill')  # 使用后向填充
  1. 文字列を挿入する
df.interpolate(method='linear')  # 线性插值
df.interpolate(method='polynomial', order=2)  # 二次多项式插值
df.interpolate(method='time')  # 时间插值

具体的なデータとニーズに応じて適切な解決策を選択する必要があります。

bannerAds