Pythonのランダムフォレスト分類アルゴリズムのコードの書き方は?

以下にPythonのsklearnライブラリのランダムフォレスト分類アルゴリズムを使用して分類を行う簡単なサンプルコードを示します:

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 加载数据集
iris = load_iris()
X, y = iris.data, iris.target

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建随机森林分类器
rf_classifier = RandomForestClassifier(n_estimators=100, random_state=42)

# 在训练集上训练随机森林分类器
rf_classifier.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = rf_classifier.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, y_pred)
print("准确率:", accuracy)

irisという有名なアイリスデータセットを、上のコードでload_iris関数を使ってまず示例データとして読み込んでいます。そして、train_test_split関数を使って、データセットをトレーニングセットとテストセットに分割しています。 その次に、パラメーターの中で100の決定木が指定されたランダムフォレスト分類器を作成し、トレーニングセットでそれを訓練しています。最後に、訓練されたモデルでテストセットの予測を行い、予測精度を計算しています。

bannerAds