sklearn.datasets
.make_blobs¶
- sklearn.datasets.make_blobs()¶
Genera manchas Gaussianas isotrópicas para el análisis de conglomerados.
Leer más en el Manual de Usuario.
- Parámetros
- n_samplesint o array-like, default=100
Si es int, es el número total de puntos dividido equitativamente entre los conglomerados. Si es array-like, cada elemento de la secuencia indica el número de muestras por conglomerado.
Distinto en la versión v0.20: ahora se puede pasar un array-like al parámetro
n_samples
- n_featuresint, default=2
El número de características de cada muestra.
- centersint o ndarray de forma (n_centers, n_features), default=None
El número de centros a generar, o las ubicaciones fijas de los centros. Si n_samples es un entero y centers es None, se generan 3 centros. Si n_samples es un array-like, centers debe ser None o un arreglo de longitud igual a la de n_samples.
- cluster_stdfloat o array-like de float, default=1.0
La desviación estándar de los conglomerados.
- center_boxtupla de flotantes (min, max), default=(-10.0, 10.0)
La caja delimitadora de cada centro de conglomerado cuando los centros se generan al azar.
- shufflebool, default=True
Revuelve las muestras.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- return_centersbool, default=False
Si es True, devuelve los centros de cada conglomerado
Nuevo en la versión 0.23.
- Devuelve
- Xndarray de forma (n_samples, n_features)
Las muestras generadas.
- yndarray de forma (n_samples,)
Las etiquetas enteras para la pertenencia a un conglomerado de cada muestra.
- centersndarray de forma (n_centers, n_features)
Los centros de cada conglomerado. Sólo se devuelve si
return_centers=True
.
Ver también
make_classification
Una variante más intrincada.
Ejemplos
>>> from sklearn.datasets import make_blobs >>> X, y = make_blobs(n_samples=10, centers=3, n_features=2, ... random_state=0) >>> print(X.shape) (10, 2) >>> y array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0]) >>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2, ... random_state=0) >>> print(X.shape) (10, 2) >>> y array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])