sklearn.model_selection
.RepeatedStratifiedKFold¶
- class sklearn.model_selection.RepeatedStratifiedKFold¶
Repite el validador cruzado K-Fold estratificado.
Repite K-Fold estratificado n veces con diferente aleatoriedad en cada repetición.
Más información en el Manual de usuario.
- Parámetros
- n_splitsint, default=5
Número de pliegues. Debe ser al menos 2.
- n_repeatsint, default=10
Número de veces que debe repetirse el validador cruzado.
- random_stateentero, instancia de RandomState o None, por defecto=None
Controla la generación de los estados aleatorios para cada repetición. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
Ver también
RepeatedKFold
Repite el K-Fold Estratificado n veces.
Notas
Los separadores de CV aleatorios pueden devolver resultados diferentes en cada llamada a separar. Puedes hacer que los resultados sean idénticos estableciendo
random_state
a un número entero.Ejemplos
>>> import numpy as np >>> from sklearn.model_selection import RepeatedStratifiedKFold >>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]]) >>> y = np.array([0, 0, 1, 1]) >>> rskf = RepeatedStratifiedKFold(n_splits=2, n_repeats=2, ... random_state=36851234) >>> for train_index, test_index in rskf.split(X, y): ... print("TRAIN:", train_index, "TEST:", test_index) ... X_train, X_test = X[train_index], X[test_index] ... y_train, y_test = y[train_index], y[test_index] ... TRAIN: [1 2] TEST: [0 3] TRAIN: [0 3] TEST: [1 2] TRAIN: [1 3] TEST: [0 2] TRAIN: [0 2] TEST: [1 3]
Métodos
Devuelve el número de iteraciones divididas en el validador cruzado
Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.
- get_n_splits()¶
Devuelve el número de iteraciones divididas en el validador cruzado
- Parámetros
- Xobjeto
Siempre se ignora, existe por compatibilidad.
np.zeros(n_samples)
puede utilizarse como marcador de posición.- yobjeto
Siempre se ignora, existe por compatibilidad.
np.zeros(n_samples)
puede utilizarse como marcador de posición.- groupsarray-like de forma (n_samples,), default=None
Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.
- Devuelve
- n_splitsint
Devuelve el número de iteraciones divididas en el validador cruzado.
- split()¶
Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.
- yarray-like de forma (n_samples,)
La variable objetivo para los problemas de aprendizaje supervisado.
- groupsarray-like de forma (n_samples,), default=None
Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.
- Produce
- trainndarray
El entrenamiento establece los índices para esa división.
- testndarray
Los índices del conjunto de pruebas para esa división.