sklearn.model_selection.PredefinedSplit

class sklearn.model_selection.PredefinedSplit

Validador cruzado de separación predefinido

Proporciona índices de entrenamiento/prueba para separar los datos en conjuntos de entrenamiento/prueba utilizando un esquema predefinido especificado por el usuario con el parámetro test_fold.

Más información en el Manual de usuario.

Nuevo en la versión 0.16.

Parámetros
test_foldarray-like de forma (n_samples,)

La entrada test_fold[i] representa el índice del conjunto de prueba al que pertenece la muestra i. Es posible excluir la muestra i de cualquier conjunto de prueba (es decir, incluir la muestra i en todos los conjuntos de entrenamiento) estableciendo test_fold[i] igual a -1.

Ejemplos

>>> import numpy as np
>>> from sklearn.model_selection import PredefinedSplit
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([0, 0, 1, 1])
>>> test_fold = [0, 1, -1, 1]
>>> ps = PredefinedSplit(test_fold)
>>> ps.get_n_splits()
2
>>> print(ps)
PredefinedSplit(test_fold=array([ 0,  1, -1,  1]))
>>> for train_index, test_index in ps.split():
...     print("TRAIN:", train_index, "TEST:", test_index)
...     X_train, X_test = X[train_index], X[test_index]
...     y_train, y_test = y[train_index], y[test_index]
TRAIN: [1 2 3] TEST: [0]
TRAIN: [0 2] TEST: [1 3]

Métodos

get_n_splits

Devuelve el número de iteraciones divididas en el validador cruzado

split

Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.

get_n_splits()

Devuelve el número de iteraciones divididas en el validador cruzado

Parámetros
Xobjeto

Siempre ignorado, existe por compatibilidad.

yobjeto

Siempre ignorado, existe por compatibilidad.

groupsobjeto

Siempre ignorado, existe por compatibilidad.

Devuelve
n_splitsint

Devuelve el número de iteraciones divididas en el validador cruzado.

split()

Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.

Parámetros
Xobjeto

Siempre ignorado, existe por compatibilidad.

yobjeto

Siempre ignorado, existe por compatibilidad.

groupsobjeto

Siempre ignorado, existe por compatibilidad.

Produce
trainndarray

El entrenamiento establece los índices para esa división.

testndarray

Los índices del conjunto de pruebas para esa división.