sklearn.datasets.make_blobs

sklearn.datasets.make_blobs()

Genera manchas Gaussianas isotrópicas para el análisis de conglomerados.

Leer más en el Manual de Usuario.

Parámetros
n_samplesint o array-like, default=100

Si es int, es el número total de puntos dividido equitativamente entre los conglomerados. Si es array-like, cada elemento de la secuencia indica el número de muestras por conglomerado.

Distinto en la versión v0.20: ahora se puede pasar un array-like al parámetro n_samples

n_featuresint, default=2

El número de características de cada muestra.

centersint o ndarray de forma (n_centers, n_features), default=None

El número de centros a generar, o las ubicaciones fijas de los centros. Si n_samples es un entero y centers es None, se generan 3 centros. Si n_samples es un array-like, centers debe ser None o un arreglo de longitud igual a la de n_samples.

cluster_stdfloat o array-like de float, default=1.0

La desviación estándar de los conglomerados.

center_boxtupla de flotantes (min, max), default=(-10.0, 10.0)

La caja delimitadora de cada centro de conglomerado cuando los centros se generan al azar.

shufflebool, default=True

Revuelve las muestras.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

return_centersbool, default=False

Si es True, devuelve los centros de cada conglomerado

Nuevo en la versión 0.23.

Devuelve
Xndarray de forma (n_samples, n_features)

Las muestras generadas.

yndarray de forma (n_samples,)

Las etiquetas enteras para la pertenencia a un conglomerado de cada muestra.

centersndarray de forma (n_centers, n_features)

Los centros de cada conglomerado. Sólo se devuelve si return_centers=True.

Ver también

make_classification

Una variante más intrincada.

Ejemplos

>>> from sklearn.datasets import make_blobs
>>> X, y = make_blobs(n_samples=10, centers=3, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0])
>>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])

Ejemplos usando sklearn.datasets.make_blobs