sklearn.datasets.make_low_rank_matrix

sklearn.datasets.make_low_rank_matrix()

Genera una matriz de rango mayoritariamente bajo con valores singulares en forma de campana.

La mayor parte de la varianza puede ser explicada por una curva en forma de campana de ancho effective_rank: la parte de bajo rango del perfil de valores singulares es:

(1 - tail_strength) * exp(-1.0 * (i / effective_rank) ** 2)

La cola de los valores singulares restantes es pesada, decreciendo así:

tail_strength * exp(-0.1 * i / effective_rank).

La parte de rango bajo del perfil puede considerarse la parte de la señal estructurada de los datos, mientras que la cola puede considerarse la parte ruidosa de los datos que no puede ser resumida por un número bajo de componentes lineales (vectores singulares).

Este tipo de perfiles singulares se ven a menudo en la práctica, por ejemplo:
  • imágenes de rostros en nivel gris

  • Vectores TF-IDF de documentos de texto rastreados desde la web

Leer más en el Manual de Usuario.

Parámetros
n_samplesint, default=100

El número de muestras.

n_featuresint, default=100

El número de características.

effective_rankint, default=10

El número aproximado de vectores singulares necesarios para explicar la mayoría de los datos mediante combinaciones lineales.

tail_strengthfloat, default=0.5

La importancia relativa de la cola pesada ruidosa del perfil de valores singulares. El valor debe estar entre 0 y 1.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Devuelve
Xndarray de forma (n_samples, n_features)

La matriz.