Torchで欠損データをどのように処理しますか?

Torchで欠損データを処理する方法はさまざまですが、以下は一般的な方法のいくつかです:

  1. 欠損データを削除するには、torch.masked_select()関数を使用して欠損データをフィルタリングし、欠損していないデータのみを保持します。例:
data = torch.tensor([1, 2, float('nan'), 4, float('nan')])
mask = torch.isnan(data)
filtered_data = torch.masked_select(data, ~mask)
print(filtered_data)
  1. 欠損データの置き換え:torch.where()関数を使用して欠損データを指定した値で置き換えることができます。例:
data = torch.tensor([1, 2, float('nan'), 4, float('nan')])
mask = torch.isnan(data)
filled_data = torch.where(mask, torch.tensor(0), data)
print(filled_data)
  1. データ不足を補完するために補間法を使用する:torch.interp()関数を使用してデータ不足を補完することができます。例:
data = torch.tensor([1, 2, float('nan'), 4, float('nan')])
mask = torch.isnan(data)
indices = torch.arange(len(data))
interpolated_data = torch.interp(indices, indices[~mask], data[~mask])
print(interpolated_data)

具体の状況に応じて、適切な方法で欠損データを処理することができます。

bannerAds