sklearn.datasets
.make_gaussian_quantiles¶
- sklearn.datasets.make_gaussian_quantiles()¶
Genera una Gaussiana isotrópica y etiqueta las muestras por cuantiles.
Este conjunto de datos de clasificación se construye tomando una distribución normal estándar multidimensional y definiendo clases separadas por esferas multidimensionales concéntricas anidadas, de forma que un número aproximadamente igual de muestras se encuentre en cada clase (cuantiles de la distribución \(\chi^2\)).
Leer más en el Manual de Usuario.
- Parámetros
- meanndarray de forma (n_features,), default=None
La media de la distribución normal multidimensional. Si es None, entonces utiliza el origen (0, 0, …).
- covfloat, default=1.0
La matriz de covarianza será este valor por la matriz unitaria. Este conjunto de datos sólo produce distribuciones normales simétricas.
- n_samplesint, default=100
El número total de puntos divididos equitativamente entre las clases.
- n_featuresint, default=2
El número de características de cada muestra.
- n_classesint, default=3
El número de clases
- shufflebool, default=True
Revuelve las muestras.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- Devuelve
- Xndarray de forma (n_samples, n_features)
Las muestras generadas.
- yndarray de forma (n_samples,)
Las etiquetas enteras para la pertenencia a los cuantiles de cada muestra.
Notas
El conjunto de datos es de Zhu et al [1].
Referencias
- 1
Zhu, H. Zou, S. Rosset, T. Hastie, «Multi-class AdaBoost», 2009.