sklearn.model_selection.validation_curve

sklearn.model_selection.validation_curve()

Curva de validación.

*arrays

Calcula las puntuaciones de un estimador con diferentes valores de un parámetro especificado. Esto es similar a la búsqueda en cuadrícula con un parámetro. Sin embargo, esto también calculará las puntuaciones de entrenamiento y es simplemente una utilidad para trazar los resultados.

Más información en el Manual de usuario.

Parámetros
estimatortipo de objeto que implementa los métodos «fit» y «predict»

Un objeto de ese tipo que se clona para cada validación.

Xarray-like de forma (n_samples, n_features)

Vector de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.

yarray-like de forma (n_samples,) o (n_samples, n_outputs) o None

Objetivo relativo a X para la clasificación o la regresión; None para el aprendizaje no supervisado.

param_namestr

Nombre del parámetro que se va a variar.

param_rangearray-like de forma (n_values,)

Los valores del parámetro que se evaluarán.

groupsarray-like de forma (n_samples,), default=None

Etiquetas de grupo para las muestras utilizadas al dividir el conjunto de datos en conjunto de entrenamiento/prueba. Sólo se utiliza junto con una instancia de cv «Group» (por ejemplo, GroupKFold).

cventero, generador de validación cruzada o un iterable, default=None

Determina la estrategia de separación de la validación cruzada. Las entradas posibles para cv son:

  • None, para utilizar la validación cruzada de 5 veces por defecto,

  • int, para especificar el número de pliegues en un (Stratified)KFold,

  • separador de CV,

  • Un iterable que produce (train, test) se separa como arreglos de índices.

Para las entradas int/None, si el estimador es un clasificador y y es binario o multiclase, se utiliza StratifiedKFold. En todos los demás casos, se utiliza KFold.

Consulta Manual de usuario para las diversas estrategias de validación cruzada que pueden ser utilizadas aquí.

Distinto en la versión 0.22: cv es el valor predeterminado si None cambió de 3 partes a 5 partes.

scoringstr o callable, default=None

Una cadena (ver la documentación sobre la evaluación del modelo) o un objeto / función que se puede llamar scorer con la firma scorer(estimator, X, y).

n_jobsint, default=None

Número de trabajos a ejecutar en paralelo. El entrenamiento del estimador y el cálculo de la puntuación se paralelizan sobre las combinaciones de cada valor de parámetro y cada división de validación cruzada. None significa 1 a menos que esté en un contexto joblib.parallel_backend. -1 significa que se utilizan todos los procesadores. Ver Glosario para más detalles.

pre_dispatchint o str, default=”all”

Número de trabajos predespachados para la ejecución en paralelo (por defecto son todos). La opción puede reducir la memoria asignada. La cadena puede ser una expresión como “2*n_jobs”.

verboseint, default=0

Controla la verbosidad: cuanto más alta, más mensajes.

fit_paramsdict, default=None

Parámetros para pasar al método de ajuste del estimador.

Nuevo en la versión 0.24.

error_score“raise” o numérico, default=np.nan

Valor a asignar a la puntuación si se produce un error en el ajuste del estimador. Si se establece como “raise”, el error se eleva. Si se da un valor numérico, se plantea FitFailedWarning.

Nuevo en la versión 0.20.

Devuelve
train_scoresarreglo de forma (n_ticks, n_cv_folds)

Puntuaciones en los conjuntos de entrenamiento.

test_scoresarreglo de forma (n_ticks, n_cv_folds)

Puntuaciones en conjunto de pruebas.

Notas

Ver Graficando curvas de validación

Ejemplos utilizando sklearn.model_selection.validation_curve