Pythonでk-meansクラスタリングのライブラリを使う方法
PythonではKMeansクラスタリングを実現する多くのパッケージがあります。主なものとしてscikit-learnとKMeansがあります。以下は、それらを使用してKMeansクラスタリングを行うコード例です。
scikit-learnパッケージを使用しています。
from sklearn.cluster import KMeans
# 创建KMeans模型,设置聚类个数为k
kmeans = KMeans(n_clusters=k)
# 训练模型
kmeans.fit(data)
# 预测样本的聚类标签
labels = kmeans.predict(data)
# 获取聚类的中心点
centers = kmeans.cluster_centers_
KMeansパッケージを使用します。
from kmodes.kmodes import KModes
# 创建KModes模型,设置聚类个数为k
km = KModes(n_clusters=k, init='Huang', n_init=5, verbose=1)
# 训练模型
clusters = km.fit_predict(data)
# 获取聚类的中心点
centers = km.cluster_centroids_
scikit-learnのKMeansは数値データに対応し、kmodes.kmodesのKModesは離散データに対応しています。データのタイプに応じて、適したパッケージを選択してクラスタリングを実施してください。