sklearn.manifold
.trustworthiness¶
- sklearn.manifold.trustworthiness()¶
Expresa hasta qué punto se mantiene la estructura local.
La fiabilidad está dentro de [0, 1]. Se define como
\[T(k) = 1 - \frac{2}{nk (2n - 3k - 1)} \sum^n_{i=1} \sum_{j \in \mathcal{N}_{i}^{k}} \max(0, (r(i, j) - k))\]donde para cada muestra i, \(\mathcal{N}_{i}^{k}\) son sus vecinos k más cercanos en el espacio de salida, y cada muestra j es su \(r(i, j)\)-ésimo vecino más cercano en el espacio de entrada. En otras palabras, cualquier vecinos más cercanos inesperados en el espacio de salida son penalizados en proporción a su rango en el espacio de entrada.
«Neighborhood Preservation in Nonlinear Projection Methods: An Experimental Study» J. Venna, S. Kaski
«Learning a Parametric Embedding by Preserving Local Structure» L.J.P. van der Maaten
- Parámetros
- Xndarray de forma (n_samples, n_features) o (n_samples, n_samples)
Si la métrica es “precomputed” X debe ser una matriz de distancia cuadrada, de lo contrario contiene una muestra por fila.
- X_embeddedndarray de forma (n_samples, n_components)
Incrustación de los datos de entrenamiento en un espacio de baja dimensión.
- n_neighborsentero, default=5
Número de vecinos k que serán considerados.
- metriccadena de caracteres o invocable, default=”euclidean”
Qué métrica usar para calcular distancias pares entre muestras del espacio de entrada original. Si la métrica es “precomputed”, X debe ser una matriz de distancias pares o distancias cuadradas. De lo contrario, ver la documentación para el argumento metric en sklearn.pairwise.pairwise_distances para una lista de métricas disponibles.
Nuevo en la versión 0.20.
- Devuelve
- trustworthinessflotante
Confiabilidad de la incrustación de baja dimensión.