sklearn.datasets
.make_low_rank_matrix¶
- sklearn.datasets.make_low_rank_matrix()¶
Genera una matriz de rango mayoritariamente bajo con valores singulares en forma de campana.
La mayor parte de la varianza puede ser explicada por una curva en forma de campana de ancho effective_rank: la parte de bajo rango del perfil de valores singulares es:
(1 - tail_strength) * exp(-1.0 * (i / effective_rank) ** 2)
La cola de los valores singulares restantes es pesada, decreciendo así:
tail_strength * exp(-0.1 * i / effective_rank).
La parte de rango bajo del perfil puede considerarse la parte de la señal estructurada de los datos, mientras que la cola puede considerarse la parte ruidosa de los datos que no puede ser resumida por un número bajo de componentes lineales (vectores singulares).
- Este tipo de perfiles singulares se ven a menudo en la práctica, por ejemplo:
imágenes de rostros en nivel gris
Vectores TF-IDF de documentos de texto rastreados desde la web
Leer más en el Manual de Usuario.
- Parámetros
- n_samplesint, default=100
El número de muestras.
- n_featuresint, default=100
El número de características.
- effective_rankint, default=10
El número aproximado de vectores singulares necesarios para explicar la mayoría de los datos mediante combinaciones lineales.
- tail_strengthfloat, default=0.5
La importancia relativa de la cola pesada ruidosa del perfil de valores singulares. El valor debe estar entre 0 y 1.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- Devuelve
- Xndarray de forma (n_samples, n_features)
La matriz.