`sklearn.model_selection`.LeaveOneOut¶

class sklearn.model_selection.LeaveOneOut¶

Validador cruzado Leave-One-Out

Proporciona índices de entrenamiento/prueba para separar los datos en conjuntos de entrenamiento/prueba. Cada muestra se utiliza una vez como conjunto de prueba (singleton) mientras que las muestras restantes forman el conjunto de entrenamiento.

Nota: LeaveOneOut() es equivalente a KFold(n_splits=n) y LeavePOut(p=1) donde n es el número de muestras.

Debido al elevado número de conjuntos de pruebas (que es el mismo que el número de muestras) este método de validación cruzada puede ser muy costoso. Para conjuntos de datos grandes se debería favorecer KFold, ShuffleSplit o StratifiedKFold.

Más información en el Manual de usuario.

Ver también

LeaveOneGroupOut: Para separar los datos según una estratificación explícita y específica del dominio del conjunto de datos.
GroupKFold: Variante del iterador K-fold con grupos no superpuestos.

Ejemplos

>>> import numpy as np
>>> from sklearn.model_selection import LeaveOneOut
>>> X = np.array([[1, 2], [3, 4]])
>>> y = np.array([1, 2])
>>> loo = LeaveOneOut()
>>> loo.get_n_splits(X)
2
>>> print(loo)
LeaveOneOut()
>>> for train_index, test_index in loo.split(X):
...     print("TRAIN:", train_index, "TEST:", test_index)
...     X_train, X_test = X[train_index], X[test_index]
...     y_train, y_test = y[train_index], y[test_index]
...     print(X_train, X_test, y_train, y_test)
TRAIN: [1] TEST: [0]
[[3 4]] [[1 2]] [2] [1]
TRAIN: [0] TEST: [1]
[[1 2]] [[3 4]] [1] [2]

Métodos

`get_n_splits`	Devuelve el número de iteraciones divididas en el validador cruzado
`split`	Genera índices para dividir los datos en conjunto de entrenamiento y de prueba.

get_n_splits()¶

Devuelve el número de iteraciones divididas en el validador cruzado

Parámetros

Xarray-like de forma (n_samples, n_features): Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.
yobjeto: Siempre ignorado, existe por compatibilidad.
groupsobjeto: Siempre ignorado, existe por compatibilidad.

Devuelve

n_splitsint: Devuelve el número de iteraciones divididas en el validador cruzado.

split()¶

Genera índices para dividir los datos en conjunto de entrenamiento y de prueba.

Parámetros

Xarray-like de forma (n_samples, n_features): Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.
yarray-like de forma (n_samples,): La variable objetivo para los problemas de aprendizaje supervisado.
groupsarray-like de forma (n_samples,), default=None: Etiquetas de grupo para las muestras utilizadas al separar el conjunto de datos en conjunto de entrenamiento/prueba.

Produce

trainndarray: El entrenamiento establece los índices para esa división.
testndarray: Los índices del conjunto de pruebas para esa separación.