`sklearn.decomposition`.MiniBatchSparsePCA¶

class sklearn.decomposition.MiniBatchSparsePCA¶

Análisis de Componentes Principales Dispersos en Mini Lotes

Encuentra el conjunto de componentes dispersos que pueden reconstruir los datos de forma óptima. La cantidad de dispersión es controlada por el coeficiente de penalización L1, dado por el parámetro alfa.

Lee más en el Manual de usuario.

Parámetros

n_componentsint, default=None: número de átomos dispersos a extraer
alphaint, default=1: Parámetro de control de la dispersión. Los valores más altos conducen a componentes más dispersos.
ridge_alphafloat, default=0.01: Cantidad de reducción de cresta a aplicar para mejorar el acondicionamiento al llamar al método de transformación.
n_iterint, default=100: número de iteraciones a realizar para cada mini lote
callbackinvocable, default=None: invocable que se invoca cada cinco iteraciones
batch_sizeint, default=3: el número de características a tomar en cada mini lote
verboseint o bool, default=False: Controla la verbosidad; cuanto más alto, más mensajes. El valor predeterminado es 0.
shufflebool, default=True: si se barajan, mezclan o revuelven los datos antes de dividirlos en lotes
n_jobsint, default=None: Número de trabajos paralelos a ejecutar. None significa 1 a menos que esté en un contexto joblib.parallel_backend. -1 significa utilizar todos los procesadores. Ver Glosario para más detalles.
method{“lars”, “cd”}, default=”lars”: lars: utiliza el método de regresión de ángulo mínimo para resolver el problema de lasso (linear_model.lars_path) cd: utiliza el método de descenso coordinado para calcular la solución de Lasso (linear_model.Lasso). Lars será más rápido si los componentes estimados son dispersos.
random_stateentero, instancia de RandomState o None, default=None: Se utiliza para revolver aleatoriamente cuando shuffle se establece en True, durante el aprendizaje de diccionario en línea. Pasa un número entero (int) para que los resultados sean reproducibles a través de múltiples llamadas a la función. Ver Glosario.

Atributos

components_ndarray de forma (n_components, n_features): Componentes dispersos extraídos de los datos.
n_components_int: Número estimado de componentes.

Nuevo en la versión 0.23.
n_iter_int: Número de iteraciones ejecutadas.
mean_ndarray de forma (n_features,): Media empírica por característica, estimada a partir del conjunto de entrenamiento. Igual a `` X.mean (axis = 0) “”.

Ver también

PCA
SparsePCA
DictionaryLearning

Ejemplos

>>> import numpy as np
>>> from sklearn.datasets import make_friedman1
>>> from sklearn.decomposition import MiniBatchSparsePCA
>>> X, _ = make_friedman1(n_samples=200, n_features=30, random_state=0)
>>> transformer = MiniBatchSparsePCA(n_components=5, batch_size=50,
...                                  random_state=0)
>>> transformer.fit(X)
MiniBatchSparsePCA(...)
>>> X_transformed = transformer.transform(X)
>>> X_transformed.shape
(200, 5)
>>> # most values in the components_ are zero (sparsity)
>>> np.mean(transformer.components_ == 0)
0.94

Métodos

`fit`	Ajusta el modelo a partir de los datos en X.
`fit_transform`	Ajusta a los datos y luego los transforma.
`get_params`	Obtiene los parámetros para este estimador.
`set_params`	Establece los parámetros de este estimador.
`transform`	Proyección por Mínimos Cuadrados de los datos sobre los componentes dispersos.

fit()¶

Ajusta el modelo a partir de los datos en X.

Parámetros

Xarray-like de forma (n_samples, n_features): Vector de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.
yIgnorado

Devuelve

selfobject: Devuelve la propia instancia.

fit_transform()¶

Ajusta a los datos y luego los transforma.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros

Xarray-like de forma (n_samples, n_features): Muestras de entrada.
yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None: Valores objetivo (None para transformaciones no supervisadas).
**fit_paramsdict: Parámetros de ajuste adicionales.

Devuelve

X_newarreglo ndarray de forma (n_samples, n_features_new): Arreglo transformado.

get_params()¶

Obtiene los parámetros para este estimador.

Parámetros

deepbool, default=True: Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve

paramsdict: Los nombres de los parámetros mapeados a sus valores.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia del estimador: Instancia del estimador.

transform()¶

Proyección por Mínimos Cuadrados de los datos sobre los componentes dispersos.

Para evitar problemas de inestabilidad en caso de que el sistema esté subdeterminado, se puede aplicar la regularización (Regresión de cresta) a través del parámetro ridge_alpha.

Ten en cuenta que la ortogonalidad de los componentes de Sparce PCA (Análisis de componentes principales dispersos) no se aplica como en el PCA por lo tanto no se puede utilizar una simple proyección lineal.

Parámetros

Xndarray de forma (n_samples, n_features): Los datos de prueba que se van a transformar, deben tener el mismo número de características que los datos utilizados para entrenar el modelo.

Devuelve

X_newndarray de forma (n_samples, n_components): Datos transformados.