sklearn.manifold.MDS

class sklearn.manifold.MDS

Escala multidimensional.

Más información en el Manual de usuario.

Parámetros
n_componentsint, default=2

Número de dimensiones en las que sumergir las disimilitudes.

metricbool, default=True

Si es True, realiza el MDS métrico; en caso contrario, realiza el MDS no métrico.

n_initint, default=4

Número de veces que se ejecutará el algoritmo SMACOF con diferentes inicializaciones. Los resultados finales serán la mejor salida de las ejecuciones, determinado por la ejecución con la menor tensión final.

max_iterint, default=300

Número máximo de iteraciones del algoritmo SMACOF para una sola ejecución.

verboseint, default=0

Nivel de verbosidad.

epsfloat, default=1e-3

Tolerancia relativa con respecto a la tensión a la que declarar la convergencia.

n_jobsint, default=None

El número de trabajos a utilizar para el cálculo. Si se utilizan múltiples inicializaciones (n_init), cada ejecución del algoritmo se calcula en paralelo.

None significa 1 a menos que esté en un contexto joblib.parallel_backend. -1 significa que se utilizan todos los procesadores. Consulta Glosario para más detalles.

random_stateentero, instancia de RandomState o None, default=None

Determina el generador de números aleatorios utilizado para inicializar los centros. Pasa un int para obtener resultados reproducibles a través de múltiples llamadas a la función. Ver :term: Glosario <random_state>.

dissimilarity{“euclidean”, “precomputed”}, default=”euclidean”

Medida de disimilitud a utilizar:

  • “euclidean”:

    Distancias euclidianas por pares entre los puntos del conjunto de datos.

  • “precomputed”:

    Las disimilitudes precalculadas se pasan directamente a fit y fit_transform.

Atributos
embedding_ndarray de forma (n_samples, n_components)

Almacena la posición del conjunto de datos en el espacio de embedding.

stress_float

El valor final de la tensión (suma de la distancia al cuadrado de las disparidades y las distancias de todos los puntos restringidos).

dissimilarity_matrix_ndarray de forma (n_samples, n_samples)

Disimilitudes por pares entre los puntos. Matriz simétrica que:

  • o bien utiliza una matriz de disimilitud personalizada estableciendo dissimilarity como “precomputed”;

  • o construye una matriz de disimilitud a partir de los datos utilizando las distancias euclidianas.

n_iter_int

El número de iteraciones correspondientes a la mejor tensión.

Referencias

«Modern Multidimensional Scaling - Theory and Applications» Borg, I.; Groenen P. Springer Series in Statistics (1997)

«Nonmetric multidimensional scaling: a numerical method» Kruskal, J. Psychometrika, 29 (1964)

«Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis» Kruskal, J. Psychometrika, 29, (1964)

Ejemplos

>>> from sklearn.datasets import load_digits
>>> from sklearn.manifold import MDS
>>> X, _ = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> embedding = MDS(n_components=2)
>>> X_transformed = embedding.fit_transform(X[:100])
>>> X_transformed.shape
(100, 2)

Métodos

fit

Calcula la posición de los puntos en el espacio de embedding.

fit_transform

Ajusta los datos de X, y devuelve las coordenadas incorporadas.

get_params

Obtiene los parámetros para este estimador.

set_params

Establece los parámetros de este estimador.

fit()

Calcula la posición de los puntos en el espacio de embedding.

Parámetros
Xarray-like de forma (n_samples, n_features) o (n_samples, n_samples)

Datos de entrada. Si dissimilarity=='precomputed', la entrada debe ser la matriz de disimilitud.

yIgnorado
initndarray de forma (n_samples,), default=None

Configuración inicial del embedding para inicializar el algoritmo SMACOF. Por defecto, el algoritmo se inicializa con un arreglo elegido al azar.

fit_transform()

Ajusta los datos de X, y devuelve las coordenadas incorporadas.

Parámetros
Xarray-like de forma (n_samples, n_features) o (n_samples, n_samples)

Datos de entrada. Si dissimilarity=='precomputed', la entrada debe ser la matriz de disimilitud.

yIgnorado
initndarray de forma (n_samples,), default=None

Configuración inicial del embedding para inicializar el algoritmo SMACOF. Por defecto, el algoritmo se inicializa con un arreglo elegido al azar.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como con objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia de estimador.

Ejemplos usando sklearn.manifold.MDS