是否可以使用scikit-learn K-Means聚类来指定自己的距离函数?

当前回答

不幸的是没有:scikit-learn目前实现的k-means只使用欧几里得距离。

将k-means扩展到其他距离并不是一件简单的事情，denis上面的回答并不是对其他度量实现k-means的正确方法。

2011-04-03 17:17:02

其他回答

def distance_metrics(dist_metrics):
    kmeans_instance = kmeans(trs_data, initial_centers, metric=dist_metrics)

    label = np.zeros(210, dtype=int)
    for i in range(0, len(clusters)):
        for index, j in enumerate(clusters[i]):
            label[j] = i

2020-09-02 14:44:05

是的，你可以使用差分度量函数;然而，根据定义，k-means聚类算法依赖于每个聚类均值的欧几里得距离。

你可以使用不同的度量，所以即使你仍然在计算平均值你也可以使用像mahalnobis距离这样的东西。

2012-03-26 15:52:44

Spectral Python的k-means允许使用L1 (Manhattan)距离。

2013-03-31 00:14:34

只要在可以这样做的地方使用nltk即可，例如:

from nltk.cluster.kmeans import KMeansClusterer
NUM_CLUSTERS = <choose a value>
data = <sparse matrix that you would normally give to scikit>.toarray()

kclusterer = KMeansClusterer(NUM_CLUSTERS, distance=nltk.cluster.util.cosine_distance, repeats=25)
assigned_clusters = kclusterer.cluster(data, assign_clusters=True)

2016-09-12 01:38:45

Sklearn Kmeans使用欧几里得距离。它没有度量参数。也就是说，如果你在聚类时间序列，你可以使用tslearn python包，当你可以指定一个度量(dtw, softdtw，欧几里得)。

2019-05-27 10:45:28

是否可以使用scikit-learn K-Means聚类来指定自己的距离函数?

推荐文章

最新文章

标签