sklearn.linear_model.RidgeCV

class sklearn.linear_model.RidgeCV

Regresión de cresta con validación cruzada incorporada.

Ver entrada de glosario para cross-validation estimator.

Por defecto, realiza una validación cruzada de dejar uno (Leave-One-Out Cross-Validation) eficiente.

Más información en el Manual de usuario.

Parámetros
alphasndarray de forma (n_alphas,), default=(0.1, 1.0, 10.0)

Arreglo de valores alpha para probar. Fuerza de la regularización; debe ser un flotante (float) positivo. La regularización mejora el condicionamiento del problema y reduce la varianza de las estimaciones. Los valores más grandes especifican una regularización más fuerte. Alpha corresponde a 1 / (2C) en otros modelos lineales como LogisticRegression o LinearSVC. Si se utiliza la validación cruzada Leave-One-Out, las alphas deben ser positivas.

fit_interceptbooleano, default=True

Si se calcula el intercepto para este modelo. Si se establece en false, no se utilizará ningún intercepto en los cálculos (es decir, se espera que los datos estén centrados).

normalizebooleano, default=False

Este parámetro es ignorado cuando fit_intercept se establece como False. Si True, los regresores X serán normalizados antes de la regresión restando la media y dividiendo por la norma l2. Si tu deseas estandarizar, por favor utiliza StandardScaler antes de llamar fit en un estimador con normalize=False.

scoringcadena de caracteres, invocable, default=None

Una cadena (string) -ver la documentación sobre la evaluación del modelo- o un objeto / función invocable scorer con la firma scorer(estimador, X, y). Si es None, el error cuadrático medio negativo si cv es “auto” o None (es decir, cuando se utiliza la validación cruzada de dejar uno -leave-one-out cross-validation-), y la puntuación r2 en caso contrario.

cventero, generador de validación cruzada o un iterable, default=None

Determina la estrategia de división de la validación cruzada. Las posibles entradas para cv son:

  • None, para utilizar la validación cruzada Leave-One-Out eficiente

  • entero, para especificar el número de pliegues.

  • separador de CV,

  • Un iterable que produce divisiones (train, test) como arreglos de índices.

Para entradas (inputs) integer/None, si y es binario o multiclase, se utiliza StratifiedKFold, si no, se utiliza KFold.

Consulta Manual de usuario para las diversas estrategias de validación cruzada que pueden ser utilizadas aquí.

gcv_mode{“auto”, “svd”, eigen”}, default=”auto”

Indicador de la estrategia que se utilizará cuando se realice la validación cruzada con exclusión (Leave-One-Out Cross-Validation). Las opciones son:

'auto' : use 'svd' if n_samples > n_features, otherwise use 'eigen'
'svd' : force use of singular value decomposition of X when X is
    dense, eigenvalue decomposition of X^T.X when X is sparse.
'eigen' : force computation via eigendecomposition of X.X^T

El modo “auto” es el predeterminado y pretende elegir la opción más adecuada (cheaper) de las dos en función de la forma de los datos de entrenamiento.

store_cv_valuesbooleano, default=False

Indicador de si los valores de validación cruzada correspondientes a cada alpha deben almacenarse en el atributo cv_values_ (ver más abajo). Este indicador sólo es compatible con cv=None (es decir, utilizando la validación cruzada Leave-One-Out).

alpha_per_targetbooleano, default=False

Indicador de si se optimiza el valor alpha (elegido de la lista de parámetros alphas) para cada objetivo por separado (para configuraciones de salida múltiple: múltiples objetivos de predicción). Cuando se establece como True, después del ajuste, el atributo alpha_ contendrá un valor para cada objetivo. Si se establece en False, se utilizará un único alpha para todos los objetivos.

Nuevo en la versión 0.24.

Atributos
cv_values_ndarray de forma (n_samples, n_alphas) o forma (n_samples, n_targets, n_alphas), opcional

Valores de validación cruzada para cada alpha (sólo disponible si store_cv_values=True y cv=None). Después de llamar a fit(), este atributo contendrá los errores medios cuadráticos (por defecto) o los valores de la función {loss,score}_func (si se proporciona en el constructor).

coef_ndarray de forma (n_features) o (n_targets, n_features)

Vector(es) de ponderación.

intercept_float o ndarray de forma (n_targets,)

Término independiente en la función de decisión. Establecido como 0.0 si fit_intercept = False.

alpha_float o ndarray de forma (n_targets,)

Parámetro de regularización estimado o, si alpha_per_target=True, el parámetro de regularización estimado para cada objetivo.

best_score_float o ndarray de forma (n_targets,)

Puntuación del estimador base con el mejor alpha, o, si alpha_per_target=True, una puntuación para cada objetivo.

Nuevo en la versión 0.23.

Ver también

Ridge

Regresión Ridge.

RidgeClassifier

Clasificador Ridge.

RidgeClassifierCV

Clasificador de cresta con validación cruzada incorporada.

Ejemplos

>>> from sklearn.datasets import load_diabetes
>>> from sklearn.linear_model import RidgeCV
>>> X, y = load_diabetes(return_X_y=True)
>>> clf = RidgeCV(alphas=[1e-3, 1e-2, 1e-1, 1]).fit(X, y)
>>> clf.score(X, y)
0.5166...

Métodos

fit

Ajusta el modelo de regresión de Ridge con cv.

get_params

Obtiene los parámetros para este estimador.

predict

Predice utilizando el modelo lineal.

score

Devuelve el coeficiente de determinación \(R^2\) de la predicción.

set_params

Establece los parámetros de este estimador.

fit()

Ajusta el modelo de regresión de Ridge con cv.

Parámetros
Xndarray de forma (n_samples, n_features)

Datos de entrenamiento. Si se utiliza GCV, se convertirá en float64 si es necesario.

yndarray de forma (n_samples,) o (n_samples, n_outputs)

Valores objetivo. Se convertirá al dtype de X si es necesario.

sample_weightflotante o ndarray de forma (n_samples,), default=None

Ponderación individual para cada muestra. Si se le da un flotante (float), cada muestra tendrá el mismo peso.

Devuelve
selfobject

Notas

Cuando se proporciona sample_weight, el hiperparámetro seleccionado puede depender de si utilizamos la validación cruzada con exclusión (cv=None o cv=”auto”) u otra forma de validación cruzada, porque sólo la validación cruzada con exclusión (también llamada leave-one-out cross validation) tiene en cuenta los pesos de la muestra al calcular la puntuación de validación.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbooleano, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

predict()

Predice utilizando el modelo lineal.

Parámetros
Xarray-like o matriz dispersa, de forma (n_samples, n_features)

Muestras.

Devuelve
Carreglo, forma (n_samples,)

Devuelve los valores predichos.

score()

Devuelve el coeficiente de determinación \(R^2\) de la predicción.

El coeficiente \(R^2\) se define como \((1 - \frac{u}{v})\), donde \(u\) es la suma de cuadrados de los residuos ((y_true - y_pred) ** 2).sum() y \(v\) es la suma total de cuadrados ((y_true - y_true.mean()) ** 2).sum(). La mejor puntuación posible es 1.0 y puede ser negativa (porque el modelo puede ser arbitrariamente peor). Un modelo constante que siempre predice el valor esperado de y, sin tener en cuenta las características de entrada, obtendría una puntuación \(R^2\) de 0.0.

Parámetros
Xarray-like de forma (n_samples_X, n_features)

Muestras de prueba. Para algunos estimadores puede ser una matriz núcleo precalculada o una lista de objetos genéricos en su lugar con forma (n_samples, n_samples_fitted), donde n_samples_fitted es el número de muestras utilizadas en el ajuste para el estimador.

yarray-like de forma (n_samples,) o (n_samples, n_outputs)

Valores True para X`.

sample_weightarray-like de forma (n_samples,), default=None

Ponderaciones de la muestra.

Devuelve
scorefloat

\(R^2\) de self.predict(X) con respecto a y.

Notas

La puntuación \(R^2\) utilizada al invocar a score en un regresor utiliza multioutput='uniform_average' desde la versión 0.23 para mantener la consistencia con el valor por defecto de r2_score. Esto influye en el método score de todos los regresores de salida múltiple (excepto para MultiOutputRegressor).

set_params()

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia de estimador

Instancia de estimador.

Ejemplos con sklearn.linear_model.RidgeCV