sklearn.model_selection.RepeatedStratifiedKFold

class sklearn.model_selection.RepeatedStratifiedKFold

Repite el validador cruzado K-Fold estratificado.

Repite K-Fold estratificado n veces con diferente aleatoriedad en cada repetición.

Más información en el Manual de usuario.

Parámetros
n_splitsint, default=5

Número de pliegues. Debe ser al menos 2.

n_repeatsint, default=10

Número de veces que debe repetirse el validador cruzado.

random_stateentero, instancia de RandomState o None, por defecto=None

Controla la generación de los estados aleatorios para cada repetición. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Ver también

RepeatedKFold

Repite el K-Fold Estratificado n veces.

Notas

Los separadores de CV aleatorios pueden devolver resultados diferentes en cada llamada a separar. Puedes hacer que los resultados sean idénticos estableciendo random_state a un número entero.

Ejemplos

>>> import numpy as np
>>> from sklearn.model_selection import RepeatedStratifiedKFold
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([0, 0, 1, 1])
>>> rskf = RepeatedStratifiedKFold(n_splits=2, n_repeats=2,
...     random_state=36851234)
>>> for train_index, test_index in rskf.split(X, y):
...     print("TRAIN:", train_index, "TEST:", test_index)
...     X_train, X_test = X[train_index], X[test_index]
...     y_train, y_test = y[train_index], y[test_index]
...
TRAIN: [1 2] TEST: [0 3]
TRAIN: [0 3] TEST: [1 2]
TRAIN: [1 3] TEST: [0 2]
TRAIN: [0 2] TEST: [1 3]

Métodos

get_n_splits

Devuelve el número de iteraciones divididas en el validador cruzado

split

Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.

get_n_splits()

Devuelve el número de iteraciones divididas en el validador cruzado

Parámetros
Xobjeto

Siempre se ignora, existe por compatibilidad. np.zeros(n_samples) puede utilizarse como marcador de posición.

yobjeto

Siempre se ignora, existe por compatibilidad. np.zeros(n_samples) puede utilizarse como marcador de posición.

groupsarray-like de forma (n_samples,), default=None

Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.

Devuelve
n_splitsint

Devuelve el número de iteraciones divididas en el validador cruzado.

split()

Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.

Parámetros
Xarray-like de forma (n_samples, n_features)

Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.

yarray-like de forma (n_samples,)

La variable objetivo para los problemas de aprendizaje supervisado.

groupsarray-like de forma (n_samples,), default=None

Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.

Produce
trainndarray

El entrenamiento establece los índices para esa división.

testndarray

Los índices del conjunto de pruebas para esa división.

Ejemplos usando sklearn.model_selection.RepeatedStratifiedKFold