sklearn.datasets
.make_gaussian_quantiles¶
- sklearn.datasets.make_gaussian_quantiles()¶
Genera una Gaussiana isotrópica y etiqueta las muestras por cuantiles.
Este conjunto de datos de clasificación se construye tomando una distribución normal estándar multidimensional y definiendo clases separadas por esferas multidimensionales concéntricas anidadas, de forma que un número aproximadamente igual de muestras se encuentre en cada clase (cuantiles de la distribución
).Leer más en el Manual de Usuario.
- Parámetros
- meanndarray de forma (n_features,), default=None
La media de la distribución normal multidimensional. Si es None, entonces utiliza el origen (0, 0, …).
- covfloat, default=1.0
La matriz de covarianza será este valor por la matriz unitaria. Este conjunto de datos sólo produce distribuciones normales simétricas.
- n_samplesint, default=100
El número total de puntos divididos equitativamente entre las clases.
- n_featuresint, default=2
El número de características de cada muestra.
- n_classesint, default=3
El número de clases
- shufflebool, default=True
Revuelve las muestras.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- Devuelve
- Xndarray de forma (n_samples, n_features)
Las muestras generadas.
- yndarray de forma (n_samples,)
Las etiquetas enteras para la pertenencia a los cuantiles de cada muestra.
Notas
El conjunto de datos es de Zhu et al [1].
Referencias
- 1
Zhu, H. Zou, S. Rosset, T. Hastie, «Multi-class AdaBoost», 2009.