Python train_test_split:データ分割の基本と実践
train_test_split関数の機能には、
- データセットをトレーニングセットとテストセットに分割することができます。分割の割合を指定することも可能です。
- 必要に応じてデータセットをランダムにシャッフルすることができます。
- 指定された乱数シードに基づいて、実行ごとに分割結果が一致することを保証できます。
- 複数の特徴量と目標変数を同時に分割することができます。
- 必要に応じて、分割されたデータをstratify層別サンプリングすることで、元のデータセットのカテゴリ比率を一貫性させることができます。