Python train_test_split:データ分割の基本と実践

train_test_split関数の機能には、

  1. データセットをトレーニングセットとテストセットに分割することができます。分割の割合を指定することも可能です。
  2. 必要に応じてデータセットをランダムにシャッフルすることができます。
  3. 指定された乱数シードに基づいて、実行ごとに分割結果が一致することを保証できます。
  4. 複数の特徴量と目標変数を同時に分割することができます。
  5. 必要に応じて、分割されたデータをstratify層別サンプリングすることで、元のデータセットのカテゴリ比率を一貫性させることができます。
bannerAds