sklearn.decomposition.sparse_encode¶
- sklearn.decomposition.sparse_encode()¶
Codificación dispersa
Cada fila del resultado es la solución a un problema de codificación dispersa. El objetivo es encontrar un arreglo disperso
codetal que:X ~= code * dictionary
Más información en el Manual de usuario.
- Parámetros
- Xndarray de forma [n_samples, n_features)
Matriz de datos.
- dictionaryndarray de forma (n_components, n_features)
La matriz diccionario con la que se resuelve la codificación dispersa de los datos. Algunos de los algoritmos asumen filas normalizadas para obtener una salida significativa.
- gramndarray de forma (n_components, n_components), default=None
Matriz de Gram precalculada,
dictionary * dictionary'.- covndarray de forma (n_components, n_samples), default=None
Covarianza precalculada,
dictionary' * X.- algorithm{“lasso_lars”, “lasso_cd”, “lars”, “omp”, “threshold”}, default=”lasso_lars”
El algoritmo utilizado:
'lars': utiliza el método de regresión de ángulo mínimo (linear_model.lars_path);'lasso_lars': utiliza Lars para calcular la solución Lasso;'lasso_cd': utiliza el método de descenso de coordenadas para calcular la solución Lasso (linear_model.Lasso).'lasso_lars'será más rápido si los componentes estimados son dispersos;'omp': utiliza la búsqueda de correspondencias ortogonales para estimar la solución dispersa;'threshold': reduce a cero todos los coeficientes menores que la regularización de la proyeccióndictionary * data'.
- n_nonzero_coefsint, default=None
Número de coeficientes distintos de cero para el objetivo en cada columna de la solución. Sólo se utiliza con
algorithm='lars'yalgorithm='omp'y se anula conalphaen el casoomp. Si esNone, entoncesn_nonzero_coefs=int(n_features / 10).- alphafloat, default=None
Si
algorithm='lasso_lars' o `algorithm='lasso_cd',alphaes la penalización aplicada a la norma L1. Sialgorithm='threshold',alphaes el valor absoluto del umbral por debajo del cual los coeficientes se reducirán a cero. Sialgorithm='omp',alphaes el parámetro de tolerancia: el valor del error de reconstrucción al que se apunta. En este caso, anulan_nonzero_coefs. Si esNone, por defecto es 1.- copy_covbool, default=True
Indica si se desea copiar la matriz de covarianza precalculada; si es
False, se puede sobrescribir.- initndarray de forma (n_samples, n_components), default=None
Valor de inicialización de los códigos dispersos. Sólo se utiliza si
algorithm='lasso_cd'.- max_iterint, default=1000
Número máximo de iteraciones a realizar si
algorithm='lasso_cd'o'lasso_lars'.- n_jobsint, default=None
Número de trabajos paralelos a ejecutar.
Nonesignifica 1 a menos que esté en un contextojoblib.parallel_backend.-1significa utilizar todos los procesadores. Ver Glosario para más detalles.- check_inputbool, default=True
Si es
False, no se comprobarán los arreglos de entrada X y dictionary.- verboseint, default=0
Controla la verbosidad; cuanto más alto, más mensajes.
- positivebool, default=False
Indica si se debe imponer la positividad al encontrar la codificación.
Nuevo en la versión 0.20.
- Devuelve
- codendarray de forma (n_samples, n_components)
Los códigos dispersos