sklearn.manifold
.MDS¶
- class sklearn.manifold.MDS¶
Escala multidimensional.
Más información en el Manual de usuario.
- Parámetros
- n_componentsint, default=2
Número de dimensiones en las que sumergir las disimilitudes.
- metricbool, default=True
Si es
True
, realiza el MDS métrico; en caso contrario, realiza el MDS no métrico.- n_initint, default=4
Número de veces que se ejecutará el algoritmo SMACOF con diferentes inicializaciones. Los resultados finales serán la mejor salida de las ejecuciones, determinado por la ejecución con la menor tensión final.
- max_iterint, default=300
Número máximo de iteraciones del algoritmo SMACOF para una sola ejecución.
- verboseint, default=0
Nivel de verbosidad.
- epsfloat, default=1e-3
Tolerancia relativa con respecto a la tensión a la que declarar la convergencia.
- n_jobsint, default=None
El número de trabajos a utilizar para el cálculo. Si se utilizan múltiples inicializaciones (
n_init
), cada ejecución del algoritmo se calcula en paralelo.None
significa 1 a menos que esté en un contextojoblib.parallel_backend
.-1
significa que se utilizan todos los procesadores. Consulta Glosario para más detalles.- random_stateentero, instancia de RandomState o None, default=None
Determina el generador de números aleatorios utilizado para inicializar los centros. Pasa un int para obtener resultados reproducibles a través de múltiples llamadas a la función. Ver :term:
Glosario <random_state>
.- dissimilarity{“euclidean”, “precomputed”}, default=”euclidean”
Medida de disimilitud a utilizar:
- “euclidean”:
Distancias euclidianas por pares entre los puntos del conjunto de datos.
- “precomputed”:
Las disimilitudes precalculadas se pasan directamente a
fit
yfit_transform
.
- Atributos
- embedding_ndarray de forma (n_samples, n_components)
Almacena la posición del conjunto de datos en el espacio de embedding.
- stress_float
El valor final de la tensión (suma de la distancia al cuadrado de las disparidades y las distancias de todos los puntos restringidos).
- dissimilarity_matrix_ndarray de forma (n_samples, n_samples)
Disimilitudes por pares entre los puntos. Matriz simétrica que:
o bien utiliza una matriz de disimilitud personalizada estableciendo
dissimilarity
como “precomputed”;o construye una matriz de disimilitud a partir de los datos utilizando las distancias euclidianas.
- n_iter_int
El número de iteraciones correspondientes a la mejor tensión.
Referencias
«Modern Multidimensional Scaling - Theory and Applications» Borg, I.; Groenen P. Springer Series in Statistics (1997)
«Nonmetric multidimensional scaling: a numerical method» Kruskal, J. Psychometrika, 29 (1964)
«Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis» Kruskal, J. Psychometrika, 29, (1964)
Ejemplos
>>> from sklearn.datasets import load_digits >>> from sklearn.manifold import MDS >>> X, _ = load_digits(return_X_y=True) >>> X.shape (1797, 64) >>> embedding = MDS(n_components=2) >>> X_transformed = embedding.fit_transform(X[:100]) >>> X_transformed.shape (100, 2)
Métodos
Calcula la posición de los puntos en el espacio de embedding.
Ajusta los datos de X, y devuelve las coordenadas incorporadas.
Obtiene los parámetros para este estimador.
Establece los parámetros de este estimador.
- fit()¶
Calcula la posición de los puntos en el espacio de embedding.
- Parámetros
- Xarray-like de forma (n_samples, n_features) o (n_samples, n_samples)
Datos de entrada. Si
dissimilarity=='precomputed'
, la entrada debe ser la matriz de disimilitud.- yIgnorado
- initndarray de forma (n_samples,), default=None
Configuración inicial del embedding para inicializar el algoritmo SMACOF. Por defecto, el algoritmo se inicializa con un arreglo elegido al azar.
- fit_transform()¶
Ajusta los datos de X, y devuelve las coordenadas incorporadas.
- Parámetros
- Xarray-like de forma (n_samples, n_features) o (n_samples, n_samples)
Datos de entrada. Si
dissimilarity=='precomputed'
, la entrada debe ser la matriz de disimilitud.- yIgnorado
- initndarray de forma (n_samples,), default=None
Configuración inicial del embedding para inicializar el algoritmo SMACOF. Por defecto, el algoritmo se inicializa con un arreglo elegido al azar.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de parámetros mapeados a sus valores.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto con estimadores simples como con objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia de estimador.