PyTorchでデータセットをインポートする方法は何ですか?

PyTorchでデータセットをインポートする一般的な方法はいくつかあります。

  1. torchvision.datasets を使います。
  2. torchvision.datasets.CIFAR10データセット
  3. torchvision.datasets.MNISTを使用します。

例文:

import torchvision.datasets as datasets

# 导入 CIFAR10 数据集
train_dataset = datasets.CIFAR10(root='path/to/dataset', train=True, transform=None, download=True)

# 导入 MNIST 数据集
test_dataset = datasets.MNIST(root='path/to/dataset', train=False, transform=None, download=True)
  1. torch.utils.data.Datasetの同義語
  2. __len__は、アイテムの数を返すメソッドです。
  3. __getitem__を日本語で言うと__取得__です。

コード例:

from torch.utils.data import Dataset

class MyDataset(Dataset):
    def __init__(self, data, labels, transform=None):
        self.data = data
        self.labels = labels
        self.transform = transform

    def __len__(self):
        return len(self.data)

    def __getitem__(self, index):
        x = self.data[index]
        y = self.labels[index]
        
        if self.transform:
            x = self.transform(x)
        
        return x, y

# 使用自定义数据集
my_dataset = MyDataset(data, labels, transform=None)
  1. torch.utils.data.DataLoaderを日本語で表現すると、データローダーとなります。

サンプルコード:

from torch.utils.data import DataLoader

# 创建数据加载器
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

PyTorchでデータセットをインポートする一般的な方法がいくつかあります。具体的な選択は、データセットの種類と要件によって異なります。

bannerAds