sklearn.linear_model
.RidgeCV¶
- class sklearn.linear_model.RidgeCV¶
Regresión de cresta con validación cruzada incorporada.
Ver entrada de glosario para cross-validation estimator.
Por defecto, realiza una validación cruzada de dejar uno (Leave-One-Out Cross-Validation) eficiente.
Más información en el Manual de usuario.
- Parámetros
- alphasndarray de forma (n_alphas,), default=(0.1, 1.0, 10.0)
Arreglo de valores alpha para probar. Fuerza de la regularización; debe ser un flotante (float) positivo. La regularización mejora el condicionamiento del problema y reduce la varianza de las estimaciones. Los valores más grandes especifican una regularización más fuerte. Alpha corresponde a
1 / (2C)
en otros modelos lineales comoLogisticRegression
oLinearSVC
. Si se utiliza la validación cruzada Leave-One-Out, las alphas deben ser positivas.- fit_interceptbooleano, default=True
Si se calcula el intercepto para este modelo. Si se establece en false, no se utilizará ningún intercepto en los cálculos (es decir, se espera que los datos estén centrados).
- normalizebooleano, default=False
Este parámetro es ignorado cuando
fit_intercept
se establece como False. Si True, los regresores X serán normalizados antes de la regresión restando la media y dividiendo por la norma l2. Si tu deseas estandarizar, por favor utilizaStandardScaler
antes de llamarfit
en un estimador connormalize=False
.- scoringcadena de caracteres, invocable, default=None
Una cadena (string) -ver la documentación sobre la evaluación del modelo- o un objeto / función invocable scorer con la firma
scorer(estimador, X, y)
. Si es None, el error cuadrático medio negativo si cv es “auto” o None (es decir, cuando se utiliza la validación cruzada de dejar uno -leave-one-out cross-validation-), y la puntuación r2 en caso contrario.- cventero, generador de validación cruzada o un iterable, default=None
Determina la estrategia de división de la validación cruzada. Las posibles entradas para cv son:
None, para utilizar la validación cruzada Leave-One-Out eficiente
entero, para especificar el número de pliegues.
Un iterable que produce divisiones (train, test) como arreglos de índices.
Para entradas (inputs) integer/None, si
y
es binario o multiclase, se utilizaStratifiedKFold
, si no, se utilizaKFold
.Consulta Manual de usuario para las diversas estrategias de validación cruzada que pueden ser utilizadas aquí.
- gcv_mode{“auto”, “svd”, eigen”}, default=”auto”
Indicador de la estrategia que se utilizará cuando se realice la validación cruzada con exclusión (Leave-One-Out Cross-Validation). Las opciones son:
'auto' : use 'svd' if n_samples > n_features, otherwise use 'eigen' 'svd' : force use of singular value decomposition of X when X is dense, eigenvalue decomposition of X^T.X when X is sparse. 'eigen' : force computation via eigendecomposition of X.X^T
El modo “auto” es el predeterminado y pretende elegir la opción más adecuada (cheaper) de las dos en función de la forma de los datos de entrenamiento.
- store_cv_valuesbooleano, default=False
Indicador de si los valores de validación cruzada correspondientes a cada alpha deben almacenarse en el atributo
cv_values_
(ver más abajo). Este indicador sólo es compatible concv=None
(es decir, utilizando la validación cruzada Leave-One-Out).- alpha_per_targetbooleano, default=False
Indicador de si se optimiza el valor alpha (elegido de la lista de parámetros
alphas
) para cada objetivo por separado (para configuraciones de salida múltiple: múltiples objetivos de predicción). Cuando se establece comoTrue
, después del ajuste, el atributoalpha_
contendrá un valor para cada objetivo. Si se establece enFalse
, se utilizará un único alpha para todos los objetivos.Nuevo en la versión 0.24.
- Atributos
- cv_values_ndarray de forma (n_samples, n_alphas) o forma (n_samples, n_targets, n_alphas), opcional
Valores de validación cruzada para cada alpha (sólo disponible si
store_cv_values=True
ycv=None
). Después de llamar afit()
, este atributo contendrá los errores medios cuadráticos (por defecto) o los valores de la función{loss,score}_func
(si se proporciona en el constructor).- coef_ndarray de forma (n_features) o (n_targets, n_features)
Vector(es) de ponderación.
- intercept_float o ndarray de forma (n_targets,)
Término independiente en la función de decisión. Establecido como 0.0 si
fit_intercept = False
.- alpha_float o ndarray de forma (n_targets,)
Parámetro de regularización estimado o, si
alpha_per_target=True
, el parámetro de regularización estimado para cada objetivo.- best_score_float o ndarray de forma (n_targets,)
Puntuación del estimador base con el mejor alpha, o, si
alpha_per_target=True
, una puntuación para cada objetivo.Nuevo en la versión 0.23.
Ver también
Ridge
Regresión Ridge.
RidgeClassifier
Clasificador Ridge.
RidgeClassifierCV
Clasificador de cresta con validación cruzada incorporada.
Ejemplos
>>> from sklearn.datasets import load_diabetes >>> from sklearn.linear_model import RidgeCV >>> X, y = load_diabetes(return_X_y=True) >>> clf = RidgeCV(alphas=[1e-3, 1e-2, 1e-1, 1]).fit(X, y) >>> clf.score(X, y) 0.5166...
Métodos
Ajusta el modelo de regresión de Ridge con cv.
Obtiene los parámetros para este estimador.
Predice utilizando el modelo lineal.
Devuelve el coeficiente de determinación \(R^2\) de la predicción.
Establece los parámetros de este estimador.
- fit()¶
Ajusta el modelo de regresión de Ridge con cv.
- Parámetros
- Xndarray de forma (n_samples, n_features)
Datos de entrenamiento. Si se utiliza GCV, se convertirá en float64 si es necesario.
- yndarray de forma (n_samples,) o (n_samples, n_outputs)
Valores objetivo. Se convertirá al dtype de X si es necesario.
- sample_weightflotante o ndarray de forma (n_samples,), default=None
Ponderación individual para cada muestra. Si se le da un flotante (float), cada muestra tendrá el mismo peso.
- Devuelve
- selfobject
Notas
Cuando se proporciona sample_weight, el hiperparámetro seleccionado puede depender de si utilizamos la validación cruzada con exclusión (cv=None o cv=”auto”) u otra forma de validación cruzada, porque sólo la validación cruzada con exclusión (también llamada leave-one-out cross validation) tiene en cuenta los pesos de la muestra al calcular la puntuación de validación.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbooleano, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de parámetros mapeados a sus valores.
- predict()¶
Predice utilizando el modelo lineal.
- Parámetros
- Xarray-like o matriz dispersa, de forma (n_samples, n_features)
Muestras.
- Devuelve
- Carreglo, forma (n_samples,)
Devuelve los valores predichos.
- score()¶
Devuelve el coeficiente de determinación \(R^2\) de la predicción.
El coeficiente \(R^2\) se define como \((1 - \frac{u}{v})\), donde \(u\) es la suma de cuadrados de los residuos
((y_true - y_pred) ** 2).sum()
y \(v\) es la suma total de cuadrados((y_true - y_true.mean()) ** 2).sum()
. La mejor puntuación posible es 1.0 y puede ser negativa (porque el modelo puede ser arbitrariamente peor). Un modelo constante que siempre predice el valor esperado dey
, sin tener en cuenta las características de entrada, obtendría una puntuación \(R^2\) de 0.0.- Parámetros
- Xarray-like de forma (n_samples_X, n_features)
Muestras de prueba. Para algunos estimadores puede ser una matriz núcleo precalculada o una lista de objetos genéricos en su lugar con forma
(n_samples, n_samples_fitted)
, donden_samples_fitted
es el número de muestras utilizadas en el ajuste para el estimador.- yarray-like de forma (n_samples,) o (n_samples, n_outputs)
Valores True para X`.
- sample_weightarray-like de forma (n_samples,), default=None
Ponderaciones de la muestra.
- Devuelve
- scorefloat
\(R^2\) de
self.predict(X)
con respecto ay
.
Notas
La puntuación \(R^2\) utilizada al invocar a
score
en un regresor utilizamultioutput='uniform_average'
desde la versión 0.23 para mantener la consistencia con el valor por defecto der2_score
. Esto influye en el métodoscore
de todos los regresores de salida múltiple (excepto paraMultiOutputRegressor
).
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto con estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia de estimador
Instancia de estimador.