sklearn.datasets.make_gaussian_quantiles

sklearn.datasets.make_gaussian_quantiles()

Genera una Gaussiana isotrópica y etiqueta las muestras por cuantiles.

Este conjunto de datos de clasificación se construye tomando una distribución normal estándar multidimensional y definiendo clases separadas por esferas multidimensionales concéntricas anidadas, de forma que un número aproximadamente igual de muestras se encuentre en cada clase (cuantiles de la distribución χ2).

Leer más en el Manual de Usuario.

Parámetros
meanndarray de forma (n_features,), default=None

La media de la distribución normal multidimensional. Si es None, entonces utiliza el origen (0, 0, …).

covfloat, default=1.0

La matriz de covarianza será este valor por la matriz unitaria. Este conjunto de datos sólo produce distribuciones normales simétricas.

n_samplesint, default=100

El número total de puntos divididos equitativamente entre las clases.

n_featuresint, default=2

El número de características de cada muestra.

n_classesint, default=3

El número de clases

shufflebool, default=True

Revuelve las muestras.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Devuelve
Xndarray de forma (n_samples, n_features)

Las muestras generadas.

yndarray de forma (n_samples,)

Las etiquetas enteras para la pertenencia a los cuantiles de cada muestra.

Notas

El conjunto de datos es de Zhu et al [1].

Referencias

1
  1. Zhu, H. Zou, S. Rosset, T. Hastie, «Multi-class AdaBoost», 2009.