sklearn.linear_model.RidgeClassifierCV

class sklearn.linear_model.RidgeClassifierCV

Clasificador de cresta con validación cruzada incorporada.

Ver entrada de glosario para cross-validation estimator.

Por defecto, realiza una validación cruzada de tipo «Leave-One-Out». Actualmente, sólo el caso n_features > n_samples se maneja eficientemente.

Más información en el Manual de usuario.

Parámetros
alphasndarray de forma (n_alphas,), default=(0.1, 1.0, 10.0)

Arreglo de valores alpha para probar. Fuerza de la regularización; debe ser un float positivo. La regularización mejora el condicionamiento del problema y reduce la varianza de las estimaciones. Los valores más grandes especifican una regularización más fuerte. Alpha corresponde a 1 / (2C) en otros modelos lineales como LogisticRegression o LinearSVC.

fit_interceptbool, default=True

Si se calcula el intercepto para este modelo. Si se establece como falso, no se usara ningún intercepto en los cálculos (es decir, los datos se espera que estén centrados).

normalizebool, default=False

Este parámetro es ignorado cuando fit_intercept se establece como False. Si True, los regresores X serán normalizados antes de la regresión restando la media y dividiendo por la norma l2. Si tu deseas estandarizar, por favor utiliza StandardScaler antes de llamar fit en un estimador con normalize=False.

scoringcadena de caracteres, invocable, default=None

Una cadena (ver la documentación sobre la evaluación del modelo) o un objeto / función invocable puntuador con la firma scorer(estimator, X, y).

cventero, generador de validación cruzada o un iterable, default=None

Determina la estrategia de división de la validación cruzada. Las posibles entradas para cv son:

  • None, para utilizar la validación cruzada Leave-One-Out eficiente

  • entero, para especificar el número de pliegues.

  • separador de CV,

  • Un iterable que devuelve divisiones (train, test) como arreglos de índices.

Consulta Manual de usuario para las diversas estrategias de validación cruzada que pueden ser utilizadas aquí.

class_weightdiccionario o “balanced”, default=None

Ponderaciones (weights) asociadas a las clases de la forma {class_label: weight}. Si no se proporciona, se supone que todas las clases tienen ponderación uno.

El modo «balanced» utiliza los valores de y para ajustar automáticamente las ponderaciones inversamente proporcionales a las frecuencias de clase en los datos de entrada como n_samples / (n_classes * np.bincount(y))

store_cv_valuesbool, default=False

Indicador de si los valores de validación cruzada correspondientes a cada alpha deben almacenarse en el atributo cv_values_ (ver más abajo). Este indicador sólo es compatible con cv=None (es decir, utilizando la validación cruzada Leave-One-Out).

Atributos
cv_values_ndarray de forma (n_samples, n_targets, n_alphas), opcional

Valores de validación cruzada para cada alpha (si store_cv_values=True y cv=None). Después de invocar a fit(), este atributo contendrá los errores medios cuadráticos (por defecto) o los valores de la función {loss,score}_func (si se proporciona en el constructor). Este atributo sólo existe cuando store_cv_values es True.

coef_ndarray de forma (n_features) o (n_targets, n_features)

Coeficiente de las características en la función de decisión.

coef_ es de forma (1, n_features) cuando el problema dado es binario.

intercept_float o ndarray de forma (n_targets,)

Término independiente en la función de decisión. Establecido como 0.0 si fit_intercept = False.

alpha_float

Parámetro de regularización estimado.

best_score_float

Puntuación del estimador base con mejor alpha.

Nuevo en la versión 0.23.

classes_ndarray de forma (n_classes,)

Las etiquetas de clases.

Ver también

Ridge

Regresión Ridge.

RidgeClassifier

Clasificador Ridge.

RidgeCV

Regresión de cresta con validación cruzada incorporada.

Notas

Para la clasificación multiclase, los clasificadores n_class se entrenan con un enfoque de uno contra todos (one-versus-all). Concretamente, esto se implementa aprovechando el soporte de respuesta multivariable en Ridge.

Ejemplos

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.linear_model import RidgeClassifierCV
>>> X, y = load_breast_cancer(return_X_y=True)
>>> clf = RidgeClassifierCV(alphas=[1e-3, 1e-2, 1e-1, 1]).fit(X, y)
>>> clf.score(X, y)
0.9630...

Métodos

decision_function

Predecir las puntuaciones de confianza (confidence scores) de las muestras.

fit

Ajustar el clasificador Ridge con cv.

get_params

Obtiene los parámetros para este estimador.

predict

Predice las etiquetas de clase para las muestras en X.

score

Devuelve la precisión media en los datos de prueba y las etiquetas dados.

set_params

Establece los parámetros de este estimador.

decision_function()

Predecir las puntuaciones de confianza (confidence scores) de las muestras.

La puntuación de confianza de una muestra es proporcional a la distancia con signo de esa muestra al hiperplano.

Parámetros
Xarray-like o matriz dispersa, de forma (n_samples, n_features)

Muestras.

Devuelve
arreglo, forma=(n_samples,) si n_classes == 2 de lo contrario (n_samples, n_classes)

Puntuaciones de confianza por combinación (sample, class). En el caso binario, la puntuación de confianza para self.classes_[1] donde >0 significa que esta clase sería predicha.

fit()

Ajustar el clasificador Ridge con cv.

Parámetros
Xndarray de forma [n_samples, n_features)

Vectores de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características. Si se utiliza GCV, se convertirá en float64 si es necesario.

yndarray de forma (n_samples,)

Valores objetivos. Se convertirá al dtype de X si es necesario.

sample_weightfloat o ndarray de forma (n_samples,), default=None

Ponderación individual para cada muestra. Si se le da un flotante (float), cada muestra tendrá el mismo peso.

Devuelve
selfobject
get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

predict()

Predice las etiquetas de clase para las muestras en X.

Parámetros
Xarray-like o matriz dispersa, de forma (n_samples, n_features)

Muestras.

Devuelve
Carreglo, forma [n_samples]

Etiqueta de clase predicha por muestra.

score()

Devuelve la precisión media en los datos de prueba y las etiquetas dados.

En la clasificación multietiqueta, se trata de la precisión del subconjunto, que es una métrica rigurosa, ya que se requiere para cada muestra que cada conjunto de etiquetas sea predicho correctamente.

Parámetros
Xarray-like de forma (n_samples_X, n_features)

Muestras de prueba.

yarray-like de forma (n_samples,) o (n_samples, n_outputs)

Etiquetas True para X.

sample_weightarray-like de forma (n_samples,), default=None

Ponderaciones de la muestra.

Devuelve
scorefloat

Precisión media de self.predict(X) con respecto a y.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia de estimador.