sklearn.decomposition
.sparse_encode¶
- sklearn.decomposition.sparse_encode()¶
Codificación dispersa
Cada fila del resultado es la solución a un problema de codificación dispersa. El objetivo es encontrar un arreglo disperso
code
tal que:X ~= code * dictionary
Más información en el Manual de usuario.
- Parámetros
- Xndarray de forma [n_samples, n_features)
Matriz de datos.
- dictionaryndarray de forma (n_components, n_features)
La matriz diccionario con la que se resuelve la codificación dispersa de los datos. Algunos de los algoritmos asumen filas normalizadas para obtener una salida significativa.
- gramndarray de forma (n_components, n_components), default=None
Matriz de Gram precalculada,
dictionary * dictionary'
.- covndarray de forma (n_components, n_samples), default=None
Covarianza precalculada,
dictionary' * X
.- algorithm{“lasso_lars”, “lasso_cd”, “lars”, “omp”, “threshold”}, default=”lasso_lars”
El algoritmo utilizado:
'lars'
: utiliza el método de regresión de ángulo mínimo (linear_model.lars_path
);'lasso_lars'
: utiliza Lars para calcular la solución Lasso;'lasso_cd'
: utiliza el método de descenso de coordenadas para calcular la solución Lasso (linear_model.Lasso
).'lasso_lars'
será más rápido si los componentes estimados son dispersos;'omp'
: utiliza la búsqueda de correspondencias ortogonales para estimar la solución dispersa;'threshold'
: reduce a cero todos los coeficientes menores que la regularización de la proyeccióndictionary * data'
.
- n_nonzero_coefsint, default=None
Número de coeficientes distintos de cero para el objetivo en cada columna de la solución. Sólo se utiliza con
algorithm='lars'
yalgorithm='omp'
y se anula conalpha
en el casoomp
. Si esNone
, entoncesn_nonzero_coefs=int(n_features / 10)
.- alphafloat, default=None
Si
algorithm='lasso_lars' o `algorithm='lasso_cd'
,alpha
es la penalización aplicada a la norma L1. Sialgorithm='threshold'
,alpha
es el valor absoluto del umbral por debajo del cual los coeficientes se reducirán a cero. Sialgorithm='omp'
,alpha
es el parámetro de tolerancia: el valor del error de reconstrucción al que se apunta. En este caso, anulan_nonzero_coefs
. Si esNone
, por defecto es 1.- copy_covbool, default=True
Indica si se desea copiar la matriz de covarianza precalculada; si es
False
, se puede sobrescribir.- initndarray de forma (n_samples, n_components), default=None
Valor de inicialización de los códigos dispersos. Sólo se utiliza si
algorithm='lasso_cd'
.- max_iterint, default=1000
Número máximo de iteraciones a realizar si
algorithm='lasso_cd'
o'lasso_lars'
.- n_jobsint, default=None
Número de trabajos paralelos a ejecutar.
None
significa 1 a menos que esté en un contextojoblib.parallel_backend
.-1
significa utilizar todos los procesadores. Ver Glosario para más detalles.- check_inputbool, default=True
Si es
False
, no se comprobarán los arreglos de entrada X y dictionary.- verboseint, default=0
Controla la verbosidad; cuanto más alto, más mensajes.
- positivebool, default=False
Indica si se debe imponer la positividad al encontrar la codificación.
Nuevo en la versión 0.20.
- Devuelve
- codendarray de forma (n_samples, n_components)
Los códigos dispersos