PyTorchでデータセットをインポートする方法は何ですか?
PyTorchでデータセットをインポートする一般的な方法はいくつかあります。
- torchvision.datasets を使います。
- torchvision.datasets.CIFAR10データセット
- torchvision.datasets.MNISTを使用します。
例文:
import torchvision.datasets as datasets
# 导入 CIFAR10 数据集
train_dataset = datasets.CIFAR10(root='path/to/dataset', train=True, transform=None, download=True)
# 导入 MNIST 数据集
test_dataset = datasets.MNIST(root='path/to/dataset', train=False, transform=None, download=True)
- torch.utils.data.Datasetの同義語
- __len__は、アイテムの数を返すメソッドです。
- __getitem__を日本語で言うと__取得__です。
コード例:
from torch.utils.data import Dataset
class MyDataset(Dataset):
def __init__(self, data, labels, transform=None):
self.data = data
self.labels = labels
self.transform = transform
def __len__(self):
return len(self.data)
def __getitem__(self, index):
x = self.data[index]
y = self.labels[index]
if self.transform:
x = self.transform(x)
return x, y
# 使用自定义数据集
my_dataset = MyDataset(data, labels, transform=None)
- torch.utils.data.DataLoaderを日本語で表現すると、データローダーとなります。
サンプルコード:
from torch.utils.data import DataLoader
# 创建数据加载器
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)
PyTorchでデータセットをインポートする一般的な方法がいくつかあります。具体的な選択は、データセットの種類と要件によって異なります。