sklearn.decomposition.sparse_encode

sklearn.decomposition.sparse_encode()

Codificación dispersa

Cada fila del resultado es la solución a un problema de codificación dispersa. El objetivo es encontrar un arreglo disperso code tal que:

X ~= code * dictionary

Más información en el Manual de usuario.

Parámetros
Xndarray de forma [n_samples, n_features)

Matriz de datos.

dictionaryndarray de forma (n_components, n_features)

La matriz diccionario con la que se resuelve la codificación dispersa de los datos. Algunos de los algoritmos asumen filas normalizadas para obtener una salida significativa.

gramndarray de forma (n_components, n_components), default=None

Matriz de Gram precalculada, dictionary * dictionary'.

covndarray de forma (n_components, n_samples), default=None

Covarianza precalculada, dictionary' * X.

algorithm{“lasso_lars”, “lasso_cd”, “lars”, “omp”, “threshold”}, default=”lasso_lars”

El algoritmo utilizado:

  • 'lars': utiliza el método de regresión de ángulo mínimo (linear_model.lars_path);

  • 'lasso_lars': utiliza Lars para calcular la solución Lasso;

  • 'lasso_cd': utiliza el método de descenso de coordenadas para calcular la solución Lasso (linear_model.Lasso). 'lasso_lars' será más rápido si los componentes estimados son dispersos;

  • 'omp': utiliza la búsqueda de correspondencias ortogonales para estimar la solución dispersa;

  • 'threshold': reduce a cero todos los coeficientes menores que la regularización de la proyección dictionary * data'.

n_nonzero_coefsint, default=None

Número de coeficientes distintos de cero para el objetivo en cada columna de la solución. Sólo se utiliza con algorithm='lars' y algorithm='omp' y se anula con alpha en el caso omp. Si es None, entonces n_nonzero_coefs=int(n_features / 10).

alphafloat, default=None

Si algorithm='lasso_lars' o `algorithm='lasso_cd', alpha es la penalización aplicada a la norma L1. Si algorithm='threshold', alpha es el valor absoluto del umbral por debajo del cual los coeficientes se reducirán a cero. Si algorithm='omp', alpha es el parámetro de tolerancia: el valor del error de reconstrucción al que se apunta. En este caso, anula n_nonzero_coefs. Si es None, por defecto es 1.

copy_covbool, default=True

Indica si se desea copiar la matriz de covarianza precalculada; si es False, se puede sobrescribir.

initndarray de forma (n_samples, n_components), default=None

Valor de inicialización de los códigos dispersos. Sólo se utiliza si algorithm='lasso_cd'.

max_iterint, default=1000

Número máximo de iteraciones a realizar si algorithm='lasso_cd' o 'lasso_lars'.

n_jobsint, default=None

Número de trabajos paralelos a ejecutar. None significa 1 a menos que esté en un contexto joblib.parallel_backend. -1 significa utilizar todos los procesadores. Ver Glosario para más detalles.

check_inputbool, default=True

Si es False, no se comprobarán los arreglos de entrada X y dictionary.

verboseint, default=0

Controla la verbosidad; cuanto más alto, más mensajes.

positivebool, default=False

Indica si se debe imponer la positividad al encontrar la codificación.

Nuevo en la versión 0.20.

Devuelve
codendarray de forma (n_samples, n_components)

Los códigos dispersos