sklearn.metrics.completeness_score

sklearn.metrics.completeness_score()

La métrica de completitud de un etiquetado de conglomerado que identifica una verdad fundamental.

Un resultado de análisis de conglomerados satisface la completitud si todos los puntos de datos que son miembros de una clase dada son elementos del mismo conglomerado.

Está métrica es independiente de los valores absolutos de las etiquetas: una permutación de la clase o de los valores de las etiquetas de conglomerado no cambiará el valor de la puntuación de ninguna manera.

Esta métrica no es simétrica: cambiar label_true con label_pred devolverá el homogeneity_score que será diferente en general.

Más información en el Manual de usuario.

Parámetros
labels_truearreglo de enteros, forma = [n_samples]

las etiquetas clase de verdad fundamental a ser usadas como referencia

labels_predarray-like de forma (n_samples,)

etiquetas de clúster a evaluar

Devuelve
completenessflotante

puntaje entre 0.0 y 1.0. 1.0 significa etiquetado completamente perfecto

Referencias

1

Andrew Rosenberg and Julia Hirschberg, 2007. V-Measure: A conditional entropy-based external cluster evaluation measure

Ejemplos

Las etiquetas perfectas están completas:

>>> from sklearn.metrics.cluster import completeness_score
>>> completeness_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

Las etiquetas no perfectas que asignan a todos los miembros de las clases a los mismos conglomerados todavía están completas:

>>> print(completeness_score([0, 0, 1, 1], [0, 0, 0, 0]))
1.0
>>> print(completeness_score([0, 1, 2, 3], [0, 0, 1, 1]))
0.999...

Si los miembros de la clase están divididos en diferentes conglomerados, la tarea no puede completarse:

>>> print(completeness_score([0, 0, 1, 1], [0, 1, 0, 1]))
0.0
>>> print(completeness_score([0, 0, 0, 0], [0, 1, 2, 3]))
0.0

Ejemplos usando sklearn.metrics.completeness_score