sklearn.datasets
.make_sparse_uncorrelated¶
- sklearn.datasets.make_sparse_uncorrelated()¶
Genera un problema de regresión aleatoria con diseño disperso no correlacionado.
Este conjunto de datos se describe en Celeux et al [1]. como:
X ~ N(0, 1) y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]
Sólo las 4 primeras características son informativas. El resto de las características son inútiles.
Leer más en el Manual de Usuario.
- Parámetros
- n_samplesint, default=100
El número de muestras.
- n_featuresint, default=10
El número de características.
- random_stateint, instancia RandomState o None, default=None
Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- Devuelve
- Xndarray de forma (n_samples, n_features)
Las muestras de entrada.
- yndarray de forma (n_samples,)
Los valores de salida.
Referencias
- 1
G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, «Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation», 2009.