sklearn.random_projection
.GaussianRandomProjection¶
- class sklearn.random_projection.GaussianRandomProjection¶
Reduce la dimensionalidad mediante la proyección aleatoria gaussiana.
Los componentes de la matriz aleatoria se extraen de N(0, 1 / n_components).
Más información en el Manual de usuario.
Nuevo en la versión 0.13.
- Parámetros
- n_componentsint o “auto”, default=”auto”
Dimensionalidad del espacio de proyección objetivo.
n_components puede ajustarse automáticamente según el número de muestras del conjunto de datos y el límite dado por el lema de Johnson-Lindenstrauss. En ese caso, la calidad de la inserción(embedding) se controla con el parámetro
eps
.Hay que tener en cuenta que el lema de Johnson-Lindenstrauss puede producir una estimación muy conservadora del número de componentes necesarios, ya que no hace ninguna suposición sobre la estructura del conjunto de datos.
- epsfloat, default=0.1
Parámetro para controlar la calidad de la inserción según el lema de Johnson-Lindenstrauss cuando
n_components
se establece en “auto”. El valor debe ser estrictamente positivo.Los valores más pequeños conducen a una mejor inserción y a un mayor número de dimensiones (n_components) en el espacio de proyección objetivo.
- random_stateentero, instancia de RandomState o None, default=None
Controla el generador de números pseudoaleatorios utilizado para generar la matriz de proyección en el momento del ajuste. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- Atributos
- n_components_int
Número concreto de componentes calculado cuando n_components=»auto».
- components_ndarray de forma (n_components, n_features)
Matriz aleatoria utilizada para la proyección.
Ver también
Ejemplos
>>> import numpy as np >>> from sklearn.random_projection import GaussianRandomProjection >>> rng = np.random.RandomState(42) >>> X = rng.rand(100, 10000) >>> transformer = GaussianRandomProjection(random_state=rng) >>> X_new = transformer.fit_transform(X) >>> X_new.shape (100, 3947)
Métodos
Genera una matriz de proyección aleatoria dispersa.
Ajusta los datos y luego los transforma.
Obtiene los parámetros para este estimador.
Establece los parámetros de este estimador.
Proyecta los datos mediante el producto de matrices con la matriz aleatoria
- fit()¶
Genera una matriz de proyección aleatoria dispersa.
- Parámetros
- X{ndarray, sparse matrix} de forma (n_samples, n_features)
Conjunto de entrenamiento: sólo se utiliza shape para encontrar las dimensiones óptimas de la matriz aleatoria basándose en la teoría referida en los artículos mencionados anteriormente.
- y
Ignorado
- Devuelve
- self
- fit_transform()¶
Ajusta los datos y luego los transforma.
Ajusta el transformador a
X
ey
con los parámetros opcionalesfit_params
y devuelve una versión transformada deX
.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Muestras de entrada.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None
Valores objetivo (None para transformaciones no supervisadas).
- **fit_paramsdict
Parámetros de ajuste adicionales.
- Devuelve
- X_newarreglo ndarray de forma (n_samples, n_features_new)
Arreglo transformado.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de parámetros mapeados a sus valores.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto con estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia del estimador.
- transform()¶
Proyecta los datos mediante el producto de matrices con la matriz aleatoria
- Parámetros
- X{ndarray, sparse matrix} de forma (n_samples, n_features)
Los datos de entrada para proyectar en un espacio de menor dimensión.
- Devuelve
- X_new{ndarray, sparse matrix} de forma (n_samples, n_components)
Arreglo proyectado.