sklearn.model_selection
.RepeatedKFold¶
- class sklearn.model_selection.RepeatedKFold¶
Repetición del validador cruzado K-Fold.
Repite K-Fold n veces con diferente aleatoriedad en cada repetición.
Más información en el Manual de usuario.
- Parámetros
- n_splitsint, default=5
Número de pliegues. Debe ser al menos 2.
- n_repeatsint, default=10
Número de veces que debe repetirse el validador cruzado.
- random_stateentero, instancia de RandomState o None, por defecto=None
Controla la aleatoriedad de cada instancia repetida de validación cruzada. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
Ver también
RepeatedStratifiedKFold
Repite el K-Fold Estratificado n veces.
Notas
Los separadores de CV aleatorios pueden devolver resultados diferentes en cada llamada a separar. Puedes hacer que los resultados sean idénticos estableciendo
estado_aleatorio
a un número entero.Ejemplos
>>> import numpy as np >>> from sklearn.model_selection import RepeatedKFold >>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]]) >>> y = np.array([0, 0, 1, 1]) >>> rkf = RepeatedKFold(n_splits=2, n_repeats=2, random_state=2652124) >>> for train_index, test_index in rkf.split(X): ... print("TRAIN:", train_index, "TEST:", test_index) ... X_train, X_test = X[train_index], X[test_index] ... y_train, y_test = y[train_index], y[test_index] ... TRAIN: [0 1] TEST: [2 3] TRAIN: [2 3] TEST: [0 1] TRAIN: [1 2] TEST: [0 3] TRAIN: [0 3] TEST: [1 2]
Métodos
Devuelve el número de iteraciones divididas en el validador cruzado
Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.
- get_n_splits()¶
Devuelve el número de iteraciones divididas en el validador cruzado
- Parámetros
- Xobjeto
Siempre se ignora, existe por compatibilidad.
np.zeros(n_samples)
puede utilizarse como marcador de posición.- yobjeto
Siempre se ignora, existe por compatibilidad.
np.zeros(n_samples)
puede utilizarse como marcador de posición.- groupsarray-like de forma (n_samples,), default=None
Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.
- Devuelve
- n_splitsint
Devuelve el número de iteraciones divididas en el validador cruzado.
- split()¶
Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.
- yarray-like de forma (n_samples,)
La variable objetivo para los problemas de aprendizaje supervisado.
- groupsarray-like de forma (n_samples,), default=None
Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.
- Produce
- trainndarray
El entrenamiento establece los índices para esa división.
- testndarray
Los índices del conjunto de prueba para esa separación.