sklearn.datasets.make_hastie_10_2

sklearn.datasets.make_hastie_10_2()

Genera datos para la clasificación binaria utilizada en Hastie et al. 2009, Ejemplo 10.2.

Las diez características son Gaussianas estándar independientes y el objetivo y está definido por:

y[i] = 1 if np.sum(X[i] ** 2) > 9.34 else -1

Leer más en el Manual de Usuario.

Parámetros
n_samplesint, default=12000

El número de muestras.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Devuelve
Xndarray de forma (n_samples, 10)

Las muestras de entrada.

yndarray de forma (n_samples,)

Los valores de salida.

Ver también

make_gaussian_quantiles

Una generalización de este enfoque de conjunto de datos.

Referencias

1

T. Hastie, R. Tibshirani and J. Friedman, «Elements of Statistical Learning Ed. 2», Springer, 2009.

Ejemplos usando sklearn.datasets.make_hastie_10_2