sklearn.metrics.homogeneity_completeness_v_measure

sklearn.metrics.homogeneity_completeness_v_measure()

Calcula a la vez la homogeneidad, la completitud y la puntuación V-Measure.

Estas métricas se basan en medidas de entropía condicional normalizada del etiquetado de análisis de conglomerados a evaluar dado el conocimiento de las etiquetas de clase de Verdad Fundamental de las mismas muestras.

Un resultado de análisis de conglomerados satisface la homogeneidad si todos sus conglomerados contienen sólo puntos de datos que son miembros de una sola clase.

Un resultado de análisis de conglomerados satisface la completitud si todos los puntos de datos que son miembros de una clase dada son elementos del mismo conglomerado.

Ambos puntajes tienen valores positivos entre 0.0 y 1.0, valores más grandes siendo deseables.

Estás 3 métricas son independientes de los valores absolutos de las etiquetas: una permutación de la clase o de los valores de las etiquetas de conglomerado no cambiará el valor de la puntuación de ninguna manera.

Además, el V-Measure es simétrico: cambiar labels_true y label_pred dará la misma puntuación. Esto no se mantiene para la homogeneidad y la completitud. V-Measure es idéntico a normalized_mutual_info_score con el método de promediado aritmético.

Más información en el Manual de usuario.

Parámetros
labels_truearreglo de enteros, forma = [n_samples]

las etiquetas clase de verdad fundamental a ser usadas como referencia

labels_predarray-like de forma (n_samples,)

etiquetas de clúster a evaluar

betaflotante, default=1.0

Razón de ponderado atribuida a homogeneity vs completeness. Sí beta es mayor que 1, completeness es ponderado más fuertemente en el cálculo. Sí beta es menor que 1, homogeneity es ponderado con más fuerza.

Devuelve
homogeneityflotante

puntaje entre 0.0 y 1.0. 1.0 significa etiquetado perfectamente homogeneo

completenessflotante

puntaje entre 0.0 y 1.0. 1.0 significa etiquetado completamente perfecto

v_measureflotante

media armónica de los dos primeros