sklearn.metrics
.pairwise_distances_argmin_min¶
- sklearn.metrics.pairwise_distances_argmin_min()¶
Calcula distancias mínimas entre un punto y un conjunto de puntos.
Esta función calcula para cada fila en X, el índice de la fila de Y más cercana (según la distancia especificada). También se devuelven las distancias mínimas.
Esto es principalmente equivalente a llamar:
- (pairwise_distances(X, Y=Y, metric=metric).argmin(axis=axis),
pairwise_distances(X, Y=Y, metric=metric).min(axis=axis))
pero usa mucho menos memoria, y es más rápido para arreglos grandes.
- Parámetros
- X{array-like, sparse matrix} de forma (n_samples, n_features)
Arreglo que contiene puntos.
- Y{array-like, sparse matrix} de forma (n_samples_Y, n_features)
Arreglo que contiene puntos.
- axisentero, default=1
Eje a lo largo del cual se calculan los argmin y las distancias.
- metriccadena de caracteres o invocable, default=”euclidean”
Métrica a utilizar para el cálculo de la distancia. Se puede utilizar cualquier métrica de scikit-learn o scipy.spatial.distance.
Si la métrica es una función invocable, se llama a cada par de instancias (filas) y se registra el valor resultante. El invocable debe tomar dos arreglos como entrada y devolver un valor que indique la distancia entre ellos. Esto funciona para las métricas de Scipy, pero es menos eficiente que pasar el nombre de la métrica como una cadena.
Las matrices de distancia no son compatibles.
Valores válidos para la métrica son:
de scikit-learn: [“cityblock”, “cosine”, “euclidean”, “l1”, “l2”, “manhattan”]
de scipy.spatial.distance: [“braycurtis”, “canberra”, “chebyshev”, “correlation”, “dice”, “hamming”, “jaccard”, “kulsinski”, “mahalanobis”, “minkowski”, “rogerstanimoto”, “russellrao”, “seuclidean”, “sokalmichener”, “sokalsneath”, “sqeuclidean”, “yule”]
Consulta la documentación de scipy.spatial.distance para obtener detalles sobre estas métricas.
- metric_kwargsdict, default=None
Argumentos de la palabra clave para pasar a la función métrica especificada.
- Devuelve
- argminndarray
Y[argmin[i], :] es la fila en Y más cercana a X[i, :].
- distancesndarray
distances[i] es la distancia entre la fila i-th en X y la fila argmin[i]-th en Y.