`sklearn.model_selection`.RepeatedStratifiedKFold¶

class sklearn.model_selection.RepeatedStratifiedKFold¶

Repite el validador cruzado K-Fold estratificado.

Repite K-Fold estratificado n veces con diferente aleatoriedad en cada repetición.

Más información en el Manual de usuario.

Parámetros

n_splitsint, default=5: Número de pliegues. Debe ser al menos 2.
n_repeatsint, default=10: Número de veces que debe repetirse el validador cruzado.
random_stateentero, instancia de RandomState o None, por defecto=None: Controla la generación de los estados aleatorios para cada repetición. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Ver también

RepeatedKFold: Repite el K-Fold Estratificado n veces.

Notas

Los separadores de CV aleatorios pueden devolver resultados diferentes en cada llamada a separar. Puedes hacer que los resultados sean idénticos estableciendo random_state a un número entero.

Ejemplos

>>> import numpy as np
>>> from sklearn.model_selection import RepeatedStratifiedKFold
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([0, 0, 1, 1])
>>> rskf = RepeatedStratifiedKFold(n_splits=2, n_repeats=2,
...     random_state=36851234)
>>> for train_index, test_index in rskf.split(X, y):
...     print("TRAIN:", train_index, "TEST:", test_index)
...     X_train, X_test = X[train_index], X[test_index]
...     y_train, y_test = y[train_index], y[test_index]
...
TRAIN: [1 2] TEST: [0 3]
TRAIN: [0 3] TEST: [1 2]
TRAIN: [1 3] TEST: [0 2]
TRAIN: [0 2] TEST: [1 3]

Métodos

`get_n_splits`	Devuelve el número de iteraciones divididas en el validador cruzado
`split`	Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.

get_n_splits()¶

Devuelve el número de iteraciones divididas en el validador cruzado

Parámetros

Xobjeto: Siempre se ignora, existe por compatibilidad. np.zeros(n_samples) puede utilizarse como marcador de posición.
yobjeto: Siempre se ignora, existe por compatibilidad. np.zeros(n_samples) puede utilizarse como marcador de posición.
groupsarray-like de forma (n_samples,), default=None: Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.

Devuelve

n_splitsint: Devuelve el número de iteraciones divididas en el validador cruzado.

split()¶

Generar índices para dividir los datos en conjunto de entrenamiento y de prueba.

Parámetros

Xarray-like de forma (n_samples, n_features): Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.
yarray-like de forma (n_samples,): La variable objetivo para los problemas de aprendizaje supervisado.
groupsarray-like de forma (n_samples,), default=None: Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.

Produce

trainndarray: El entrenamiento establece los índices para esa división.
testndarray: Los índices del conjunto de pruebas para esa división.

sklearn.model_selection.RepeatedStratifiedKFold¶

Ejemplos usando sklearn.model_selection.RepeatedStratifiedKFold¶

`sklearn.model_selection`.RepeatedStratifiedKFold¶

Ejemplos usando `sklearn.model_selection.RepeatedStratifiedKFold`¶