sklearn.random_projection.GaussianRandomProjection

class sklearn.random_projection.GaussianRandomProjection

Reduce la dimensionalidad mediante la proyección aleatoria gaussiana.

Los componentes de la matriz aleatoria se extraen de N(0, 1 / n_components).

Más información en el Manual de usuario.

Nuevo en la versión 0.13.

Parámetros
n_componentsint o “auto”, default=”auto”

Dimensionalidad del espacio de proyección objetivo.

n_components puede ajustarse automáticamente según el número de muestras del conjunto de datos y el límite dado por el lema de Johnson-Lindenstrauss. En ese caso, la calidad de la inserción(embedding) se controla con el parámetro eps.

Hay que tener en cuenta que el lema de Johnson-Lindenstrauss puede producir una estimación muy conservadora del número de componentes necesarios, ya que no hace ninguna suposición sobre la estructura del conjunto de datos.

epsfloat, default=0.1

Parámetro para controlar la calidad de la inserción según el lema de Johnson-Lindenstrauss cuando n_components se establece en “auto”. El valor debe ser estrictamente positivo.

Los valores más pequeños conducen a una mejor inserción y a un mayor número de dimensiones (n_components) en el espacio de proyección objetivo.

random_stateentero, instancia de RandomState o None, default=None

Controla el generador de números pseudoaleatorios utilizado para generar la matriz de proyección en el momento del ajuste. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Atributos
n_components_int

Número concreto de componentes calculado cuando n_components=»auto».

components_ndarray de forma (n_components, n_features)

Matriz aleatoria utilizada para la proyección.

Ver también

SparseRandomProjection

Ejemplos

>>> import numpy as np
>>> from sklearn.random_projection import GaussianRandomProjection
>>> rng = np.random.RandomState(42)
>>> X = rng.rand(100, 10000)
>>> transformer = GaussianRandomProjection(random_state=rng)
>>> X_new = transformer.fit_transform(X)
>>> X_new.shape
(100, 3947)

Métodos

fit

Genera una matriz de proyección aleatoria dispersa.

fit_transform

Ajusta los datos y luego los transforma.

get_params

Obtiene los parámetros para este estimador.

set_params

Establece los parámetros de este estimador.

transform

Proyecta los datos mediante el producto de matrices con la matriz aleatoria

fit()

Genera una matriz de proyección aleatoria dispersa.

Parámetros
X{ndarray, sparse matrix} de forma (n_samples, n_features)

Conjunto de entrenamiento: sólo se utiliza shape para encontrar las dimensiones óptimas de la matriz aleatoria basándose en la teoría referida en los artículos mencionados anteriormente.

y

Ignorado

Devuelve
self
fit_transform()

Ajusta los datos y luego los transforma.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like de forma (n_samples, n_features)

Muestras de entrada.

yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None

Valores objetivo (None para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devuelve
X_newarreglo ndarray de forma (n_samples, n_features_new)

Arreglo transformado.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia del estimador.

transform()

Proyecta los datos mediante el producto de matrices con la matriz aleatoria

Parámetros
X{ndarray, sparse matrix} de forma (n_samples, n_features)

Los datos de entrada para proyectar en un espacio de menor dimensión.

Devuelve
X_new{ndarray, sparse matrix} de forma (n_samples, n_components)

Arreglo proyectado.