異常値を削除する Python のコード

外れ値を除去するための一般的な方法はPythonにおける統計学の標準偏差を使用することです。手順は以下のとおりです。

  1. 必要なライブラリをインポートします。
import numpy as np
  1. 外れ値を含むデータセットを作成します
data = np.array([1, 2, 3, 4, 5, 100])
  1. データセットの平均と標準偏差を計算します。
mean = np.mean(data)
std = np.std(data)
  1. 異常値のしきい値を定義します。一般的に、しきい値は平均±3σに設定できます。
threshold = 3 * std
  1. NumPyのブーリアンインデックスを使用して、閾値の範囲にない値を取得する:
filtered_data = data[(data >= mean - threshold) & (data <= mean + threshold)]
  1. フィルタされたデータセットを出力する:
print(filtered_data)

提示のコードは、データセットから外れ値を削除し、フィルタリングされたデータセットを出力します。一般的な方法に過ぎず、実際の外れ値処理手法はデータセットの特性によって異なる場合があることに注意してください。

bannerAds