Pythonでk-meansクラスタリングのライブラリを使う方法

PythonではKMeansクラスタリングを実現する多くのパッケージがあります。主なものとしてscikit-learnとKMeansがあります。以下は、それらを使用してKMeansクラスタリングを行うコード例です。

scikit-learnパッケージを使用しています。

from sklearn.cluster import KMeans

# 创建KMeans模型,设置聚类个数为k
kmeans = KMeans(n_clusters=k)

# 训练模型
kmeans.fit(data)

# 预测样本的聚类标签
labels = kmeans.predict(data)

# 获取聚类的中心点
centers = kmeans.cluster_centers_

KMeansパッケージを使用します。

from kmodes.kmodes import KModes

# 创建KModes模型,设置聚类个数为k
km = KModes(n_clusters=k, init='Huang', n_init=5, verbose=1)

# 训练模型
clusters = km.fit_predict(data)

# 获取聚类的中心点
centers = km.cluster_centroids_

scikit-learnのKMeansは数値データに対応し、kmodes.kmodesのKModesは離散データに対応しています。データのタイプに応じて、適したパッケージを選択してクラスタリングを実施してください。

bannerAds