sklearn.manifold.trustworthiness

sklearn.manifold.trustworthiness()

Expresa hasta qué punto se mantiene la estructura local.

La fiabilidad está dentro de [0, 1]. Se define como

\[T(k) = 1 - \frac{2}{nk (2n - 3k - 1)} \sum^n_{i=1} \sum_{j \in \mathcal{N}_{i}^{k}} \max(0, (r(i, j) - k))\]

donde para cada muestra i, \(\mathcal{N}_{i}^{k}\) son sus vecinos k más cercanos en el espacio de salida, y cada muestra j es su \(r(i, j)\)-ésimo vecino más cercano en el espacio de entrada. En otras palabras, cualquier vecinos más cercanos inesperados en el espacio de salida son penalizados en proporción a su rango en el espacio de entrada.

  • «Neighborhood Preservation in Nonlinear Projection Methods: An Experimental Study» J. Venna, S. Kaski

  • «Learning a Parametric Embedding by Preserving Local Structure» L.J.P. van der Maaten

Parámetros
Xndarray de forma (n_samples, n_features) o (n_samples, n_samples)

Si la métrica es “precomputed” X debe ser una matriz de distancia cuadrada, de lo contrario contiene una muestra por fila.

X_embeddedndarray de forma (n_samples, n_components)

Incrustación de los datos de entrenamiento en un espacio de baja dimensión.

n_neighborsentero, default=5

Número de vecinos k que serán considerados.

metriccadena de caracteres o invocable, default=”euclidean”

Qué métrica usar para calcular distancias pares entre muestras del espacio de entrada original. Si la métrica es “precomputed”, X debe ser una matriz de distancias pares o distancias cuadradas. De lo contrario, ver la documentación para el argumento metric en sklearn.pairwise.pairwise_distances para una lista de métricas disponibles.

Nuevo en la versión 0.20.

Devuelve
trustworthinessflotante

Confiabilidad de la incrustación de baja dimensión.