sklearn.utils
.shuffle¶
- sklearn.utils.shuffle()¶
Revuelve arreglos o matrices dispersas de forma coherente.
Este es un alias de conveniencia para
resample(*arrays, replace=False)
para hacer permutaciones aleatorias de las colecciones.- Parámetros
- *arrayssecuencia de estructuras de datos indexables
Las estructuras de datos indexables pueden ser arreglos, listas, dataframes o matrices dispersas scipy con una primera dimensión consistente.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios para revolver los datos. Pasa un número entero (int) para obtener resultados reproducibles a través de múltiples invocaciones a la función. Consulta el Glosario.
- n_samplesint, default=None
Número de muestras a generar. Si se deja en None se establece automáticamente a la primera dimensión de los arreglos. No debe ser mayor que la longitud de los arreglos.
- Devuelve
- shuffled_arrayssecuencia de estructuras de datos indexables
Secuencia de copias revueltas de las colecciones. Los arreglos originales no se ven afectados.
Ver también
Ejemplos
Es posible mezclar arreglos dispersos y densos en la misma ejecución:
>>> X = np.array([[1., 0.], [2., 1.], [0., 0.]]) >>> y = np.array([0, 1, 2]) >>> from scipy.sparse import coo_matrix >>> X_sparse = coo_matrix(X) >>> from sklearn.utils import shuffle >>> X, X_sparse, y = shuffle(X, X_sparse, y, random_state=0) >>> X array([[0., 0.], [2., 1.], [1., 0.]]) >>> X_sparse <3x2 sparse matrix of type '<... 'numpy.float64'>' with 3 stored elements in Compressed Sparse Row format> >>> X_sparse.toarray() array([[0., 0.], [2., 1.], [1., 0.]]) >>> y array([2, 1, 0]) >>> shuffle(y, n_samples=2, random_state=0) array([0, 1])