sklearn.datasets.make_gaussian_quantiles

sklearn.datasets.make_gaussian_quantiles()

Genera una Gaussiana isotrópica y etiqueta las muestras por cuantiles.

Este conjunto de datos de clasificación se construye tomando una distribución normal estándar multidimensional y definiendo clases separadas por esferas multidimensionales concéntricas anidadas, de forma que un número aproximadamente igual de muestras se encuentre en cada clase (cuantiles de la distribución \(\chi^2\)).

Leer más en el Manual de Usuario.

Parámetros
meanndarray de forma (n_features,), default=None

La media de la distribución normal multidimensional. Si es None, entonces utiliza el origen (0, 0, …).

covfloat, default=1.0

La matriz de covarianza será este valor por la matriz unitaria. Este conjunto de datos sólo produce distribuciones normales simétricas.

n_samplesint, default=100

El número total de puntos divididos equitativamente entre las clases.

n_featuresint, default=2

El número de características de cada muestra.

n_classesint, default=3

El número de clases

shufflebool, default=True

Revuelve las muestras.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Devuelve
Xndarray de forma (n_samples, n_features)

Las muestras generadas.

yndarray de forma (n_samples,)

Las etiquetas enteras para la pertenencia a los cuantiles de cada muestra.

Notas

El conjunto de datos es de Zhu et al [1].

Referencias

1
  1. Zhu, H. Zou, S. Rosset, T. Hastie, «Multi-class AdaBoost», 2009.