pandasの欠損値の処理方法
Pandas DataFrame内の欠損値に対処する際には、以下の方法を検討できます。
- 欠損値を削除する
- 軸
- どうして
df.dropna(axis=0, how='any')
df.dropna(axis=1, how='all')
- None値を埋める
df.fillna(0) # 使用常数填充缺失值
df.fillna(df.mean()) # 使用均值填充缺失值
df.fillna(df.median()) # 使用中位数填充缺失值
df.fillna(method='ffill') # 使用前向填充
df.fillna(method='bfill') # 使用后向填充
- 文字列を挿入する
df.interpolate(method='linear') # 线性插值
df.interpolate(method='polynomial', order=2) # 二次多项式插值
df.interpolate(method='time') # 时间插值
具体的なデータとニーズに応じて適切な解決策を選択する必要があります。