sklearn.utils.random.sample_without_replacement

sklearn.utils.random.sample_without_replacement()

Muestra de enteros sin reemplazo.

Selecciona n_samples enteras del conjunto [0, n_population) sin reemplazo.

Parámetros
n_populationint

El tamaño del conjunto del que se tomará la muestra.

n_samplesint

El número de enteros a muestrear.

random_stateentero, instancia de RandomState o None, default=None

Si es un número entero (int), random_state es la semilla utilizada por el generador de números aleatorios; Si es una instancia de RandomState, random_state es el generador de números aleatorios; Si es None, el generador de números aleatorios es la instancia de RandomState utilizada por np.random.

method{«auto», «tracking_selection», «reservoir_sampling», «pool»}, default=”auto”

Si method == «auto», se utiliza la proporción n_samples / n_population para determinar el algoritmo a utilizar: Si la proporción está entre 0 y 0.01, se utiliza la selección de seguimiento. Si la proporción está entre 0.01 y 0.99, se utiliza numpy.random.permutation. Si la proporción es mayor que 0.99, se utiliza el muestreo de reservorio. El orden de los enteros seleccionados no está definido. Si se desea un orden aleatorio, se debe revolver el subconjunto seleccionado.

Si method ==»tracking_selection», se utiliza una implementación basada en conjuntos que es adecuada para n_samples <<< n_population.

Si method == «reservoir_sampling», se utiliza un algoritmo de muestreo de reservorio que es adecuado para una alta restricción de memoria o cuando O(n_samples) ~ O(n_population). El orden de los enteros seleccionados no está definido. Si se desea un orden aleatorio, se debe revolver el subconjunto seleccionado.

Si method == «pool», un algoritmo basado en pool es particularmente rápido, incluso más rápido que el método de selección de seguimiento. Sin embargo, hay que inicializar un vector que contenga toda la población. Si n_samples ~ n_population, el método de muestreo de reservorio es más rápido.

Devuelve
outndarray de forma (n_samples,)

Los subconjuntos de enteros muestreados. El subconjunto de enteros seleccionados podría no ser aleatorio, ver el argumento del método.