sklearn.linear_model
.OrthogonalMatchingPursuitCV¶
- class sklearn.linear_model.OrthogonalMatchingPursuitCV¶
Modelo de búsqueda de coincidencias ortogonales (OMP) con validación cruzada.
Ver entrada de glosario para cross-validation estimator.
Más información en el Manual de usuario.
- Parámetros
- copybooleano, default=True
Si la matriz de diseño X debe ser copiada por el algoritmo. Un valor falso sólo es útil si X ya está ordenado por Fortran, de lo contrario se hace una copia de todos modos.
- fit_interceptbooleano, default=True
si se calcula el intercepto para este modelo. Si se establece en false, no se utilizará ningún intercepto en los cálculos (es decir, se espera que los datos estén centrados).
- normalizebooleano, default=True
Este parámetro se ignora cuando
fit_intercept
se establece en False. Si es True, los regresores X serán normalizados antes de la regresión restando la media y dividiendo por la norma l2. Si desea normalizar, por favor utiliceStandardScaler
antes de llamar afit
en un estimador connormalize=False
.- max_iterentero, default=None
Número máximo de iteraciones a realizar, por tanto, número máximo de características a incluir. 10% de
n_features
pero al menos 5 si están disponibles.- cventero, generador de validación cruzada o iterable, default=None
Determina la estrategia de división de la validación cruzada. Las posibles entradas para validación cruzada son:
None, para usar la validación cruzada de 5 partes por defecto,
entero, para especificar el número de pliegues.
Un iterable que produce divisiones (train, test) como arreglos de índices.
Para entradas None/de enteros se usa
KFold
.Consulta Manual de usuario para las diversas estrategias de validación cruzada que pueden ser utilizadas aquí.
Distinto en la versión 0.22:
cv
es el valor predeterminado si es None cambió de 3 partes a 5 partes.- n_jobsentero, default=None
Número de CPUs a usar durante la validación cruzada.
None
significa 1 a menos que esté en un contextojoblib.parallel_backend
.-1
significa utilizar todos los procesadores. Ver Glosario para más detalles.- verbosebooleano o entero, default=False
Establece la cantidad de la verbosidad.
- Atributos
- intercept_float o ndarray de la forma (n_targets,)
Término independiente en la función de decisión.
- coef_ndarray de forma (n_features,) o (n_features, n_targets)
Vector de parámetros (w en la formulación del problema).
- n_nonzero_coefs_entero
Número estimado de coeficientes no nulos que dan el mejor error cuadrático medio en los pliegues de validación cruzada.
- n_iter_entero o array-like
Número de características activas en cada objetivo para el modelo se reajustan con los mejores hiperparámetros obtenidos mediante la validación cruzada de todos los pliegues.
Ver también
Ejemplos
>>> from sklearn.linear_model import OrthogonalMatchingPursuitCV >>> from sklearn.datasets import make_regression >>> X, y = make_regression(n_features=100, n_informative=10, ... noise=4, random_state=0) >>> reg = OrthogonalMatchingPursuitCV(cv=5).fit(X, y) >>> reg.score(X, y) 0.9991... >>> reg.n_nonzero_coefs_ 10 >>> reg.predict(X[:1,]) array([-78.3854...])
Métodos
Ajusta el modelo usando X, y como datos de entrenamiento.
Obtiene los parámetros para este estimador.
Predice utilizando el modelo lineal.
Devuelve el coeficiente de determinación \(R^2\) de la predicción.
Establece los parámetros de este estimador.
- fit()¶
Ajusta el modelo usando X, y como datos de entrenamiento.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos del entrenamiento.
- yarray-like de forma (n_samples,)
Valores objetivos. Se convertirá al dtype de X si es necesario.
- Devuelve
- selfobject
devuelve una instancia de sí misma.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbooleano, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de parámetros mapeados a sus valores.
- predict()¶
Predice utilizando el modelo lineal.
- Parámetros
- Xarray-like o matriz dispersa, forma (n_samples, n_features)
Muestras.
- Devuelve
- Carreglo, forma (n_samples,)
Devuelve los valores predichos.
- score()¶
Devuelve el coeficiente de determinación \(R^2\) de la predicción.
El coeficiente \(R^2\) se define como \((1 - \frac{u}{v})\), donde \(u\) es la suma residual de cuadrados
((y_true - y_pred) ** 2).sum()
y \(v\) es la suma total de cuadrados((y_true - y_true.mean()) ** 2).sum()
. El mejor valor posible es 1.0 y puede ser negativo (porque el modelo puede ser arbitrariamente peor). Un modelo constante que siempre predice el valor esperado dey
, sin tener en cuenta las características de entrada, obtendría un valor \(R^2\) de 0,0.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Muestras de prueba. Para algunos estimadores puede ser una matriz de núcleo precalculada o una lista de objetos genéricos con forma
(n_samples, n_samples_fitted)
, donden_samples_fitted
es el número de muestras utilizadas en el ajuste para el estimador.- yarray-like de forma (n_samples,) o (n_samples, n_outputs)
Valores verdaderos para
X
.- sample_weightarray-like de forma (n_samples,), default=None
Ponderaciones de muestra.
- Devuelve
- scoreflotante
\(R^2\) de
self.predict(X)
con respecto ay
.
Notas
El valor \(R^2\) utilizado al llamar a
score
en un regresor utilizamultioutput='uniform_average'
desde la versión 0.23 para mantener la coherencia con el valor predeterminado der2_score`
. Esto influye en el métodoscore
de todos los regresores de salida múltiple (excepto paraMultiOutputRegressor
).
- set_params()¶
Establece los parámetros de este estimador.
El método funciona en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia del estimador.