sklearn.metrics.fowlkes_mallows_score

sklearn.metrics.fowlkes_mallows_score()

Mide la similitud de dos agrupaciones de un conjunto de puntos.

Nuevo en la versión 0.18.

El índice Fowlkes-Mallows (FMI) se define como la media geométrica entre la precisión y la exhaustividad:

FMI = TP / sqrt((TP + FP) * (TP + FN))

Donde TP es el número de Verdaderos Positivos (es decir, el número de pares de puntos que pertenecen a los mismos conglomerados tanto en labels_true como en labels_pred), FP es el número de Falsos Positivos (es decir, el número de pares de puntos que pertenecen a los mismos conglomerados en labels_true y no en labels_pred) y FN es el número de Falsos Negativos (es decir, el número de puntos que pertenecen a los mismos conglomerados en labels_pred y no en labels_True).

La puntuación oscila entre 0 y 1. Un valor alto indica una buena similitud entre dos conglomerados.

Lee más en el Manual de usuario.

Parámetros
labels_true : arreglo entero, forma = (n_samples,)arreglo entero, forma = (

Una agrupación de los datos en subconjuntos disjuntos.

labels_pred : arreglo, forma = (n_samples, )arreglo, forma = (

Una agrupación de los datos en subconjuntos disjuntos.

sparsebooleano, default=False

Calcula la matriz de contingencia internamente con la matriz dispersa.

Devuelve
scoreflotante

El puntaje Fowlkes-Mallows resultante.

Referencias

1

E. B. Fowkles and C. L. Mallows, 1983. «A method for comparing two hierarchical clusterings». Journal of the American Statistical Association.

2

Entrada de Wikipedia para el Índice Fowlkes-Mallows

Ejemplos

Los etiquetados perfectos son homogéneos y completos, por lo que tienen una puntuación de 1,0:

>>> from sklearn.metrics.cluster import fowlkes_mallows_score
>>> fowlkes_mallows_score([0, 0, 1, 1], [0, 0, 1, 1])
1.0
>>> fowlkes_mallows_score([0, 0, 1, 1], [1, 1, 0, 0])
1.0

Si los miembros de las clases están completamente divididos en diferentes conglomerados, la asignación es totalmente aleatoria, por tanto el FMI es nulo:

>>> fowlkes_mallows_score([0, 0, 0, 0], [0, 1, 2, 3])
0.0