pythonのtrain_test_split関数の使い方は何ですか?

train_test_split関数は、データセットをトレーニングセットとテストセットに分割するためのものです。Pythonでは、train_test_split関数は、model_selectionモジュールを使用してsklearnライブラリで利用することができます。以下は、簡単な例です:

from sklearn.model_selection import train_test_split
import numpy as np

# 生成一些示例数据
X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
y = np.array([0, 1, 0, 1])

# 将数据集划分为训练集和测试集,test_size指定测试集比例,random_state设置随机种子
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 打印划分后的训练集和测试集
print("训练集X:", X_train)
print("测试集X:", X_test)
print("训练集y:", y_train)
print("测试集y:", y_test)

この例では、4つのサンプルを含むデータセットXとその対応するラベルyが生成されます。その後、train_test_split関数を使用してデータセットをトレーニングセットとテストセットに分割し、test_sizeパラメーターでテストセットの割合を指定します(ここでは0.2、つまり20%)、random_stateパラメーターでランダムシードを設定して分割結果の一貫性を確保します。最後に、分割後のトレーニングセットとテストセットを表示します。

コメントを残す 0

Your email address will not be published. Required fields are marked *


广告
広告は10秒後に閉じます。
bannerAds