sklearn.model_selection
.validation_curve¶
- sklearn.model_selection.validation_curve()¶
Curva de validación.
*arrays
Calcula las puntuaciones de un estimador con diferentes valores de un parámetro especificado. Esto es similar a la búsqueda en cuadrícula con un parámetro. Sin embargo, esto también calculará las puntuaciones de entrenamiento y es simplemente una utilidad para trazar los resultados.
Más información en el Manual de usuario.
- Parámetros
- estimatortipo de objeto que implementa los métodos «fit» y «predict»
Un objeto de ese tipo que se clona para cada validación.
- Xarray-like de forma (n_samples, n_features)
Vector de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs) o None
Objetivo relativo a X para la clasificación o la regresión; None para el aprendizaje no supervisado.
- param_namestr
Nombre del parámetro que se va a variar.
- param_rangearray-like de forma (n_values,)
Los valores del parámetro que se evaluarán.
- groupsarray-like de forma (n_samples,), default=None
Etiquetas de grupo para las muestras utilizadas al dividir el conjunto de datos en conjunto de entrenamiento/prueba. Sólo se utiliza junto con una instancia de cv «Group» (por ejemplo,
GroupKFold
).- cventero, generador de validación cruzada o un iterable, default=None
Determina la estrategia de separación de la validación cruzada. Las entradas posibles para cv son:
None, para utilizar la validación cruzada de 5 veces por defecto,
int, para especificar el número de pliegues en un
(Stratified)KFold
,Un iterable que produce (train, test) se separa como arreglos de índices.
Para las entradas int/None, si el estimador es un clasificador y
y
es binario o multiclase, se utilizaStratifiedKFold
. En todos los demás casos, se utilizaKFold
.Consulta Manual de usuario para las diversas estrategias de validación cruzada que pueden ser utilizadas aquí.
Distinto en la versión 0.22:
cv
es el valor predeterminado si None cambió de 3 partes a 5 partes.- scoringstr o callable, default=None
Una cadena (ver la documentación sobre la evaluación del modelo) o un objeto / función que se puede llamar scorer con la firma
scorer(estimator, X, y)
.- n_jobsint, default=None
Número de trabajos a ejecutar en paralelo. El entrenamiento del estimador y el cálculo de la puntuación se paralelizan sobre las combinaciones de cada valor de parámetro y cada división de validación cruzada.
None
significa 1 a menos que esté en un contextojoblib.parallel_backend
.-1
significa que se utilizan todos los procesadores. Ver Glosario para más detalles.- pre_dispatchint o str, default=”all”
Número de trabajos predespachados para la ejecución en paralelo (por defecto son todos). La opción puede reducir la memoria asignada. La cadena puede ser una expresión como “2*n_jobs”.
- verboseint, default=0
Controla la verbosidad: cuanto más alta, más mensajes.
- fit_paramsdict, default=None
Parámetros para pasar al método de ajuste del estimador.
Nuevo en la versión 0.24.
- error_score“raise” o numérico, default=np.nan
Valor a asignar a la puntuación si se produce un error en el ajuste del estimador. Si se establece como “raise”, el error se eleva. Si se da un valor numérico, se plantea FitFailedWarning.
Nuevo en la versión 0.20.
- Devuelve
- train_scoresarreglo de forma (n_ticks, n_cv_folds)
Puntuaciones en los conjuntos de entrenamiento.
- test_scoresarreglo de forma (n_ticks, n_cv_folds)
Puntuaciones en conjunto de pruebas.
Notas