pythonのtrain_test_split関数の使い方は何ですか？

1年 ago

海斗, 葵

1 minute

train_test_split関数は、データセットをトレーニングセットとテストセットに分割するためのものです。Pythonでは、train_test_split関数は、model_selectionモジュールを使用してsklearnライブラリで利用することができます。以下は、簡単な例です：

from sklearn.model_selection import train_test_split
import numpy as np

# 生成一些示例数据
X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
y = np.array([0, 1, 0, 1])

# 将数据集划分为训练集和测试集，test_size指定测试集比例，random_state设置随机种子
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 打印划分后的训练集和测试集
print("训练集X:", X_train)
print("测试集X:", X_test)
print("训练集y:", y_train)
print("测试集y:", y_test)

この例では、4つのサンプルを含むデータセットXとその対応するラベルyが生成されます。その後、train_test_split関数を使用してデータセットをトレーニングセットとテストセットに分割し、test_sizeパラメーターでテストセットの割合を指定します（ここでは0.2、つまり20％）、random_stateパラメーターでランダムシードを設定して分割結果の一貫性を確保します。最後に、分割後のトレーニングセットとテストセットを表示します。