sklearn.datasets.make_sparse_uncorrelated

sklearn.datasets.make_sparse_uncorrelated()

Genera un problema de regresión aleatoria con diseño disperso no correlacionado.

Este conjunto de datos se describe en Celeux et al [1]. como:

X ~ N(0, 1)
y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]

Sólo las 4 primeras características son informativas. El resto de las características son inútiles.

Leer más en el Manual de Usuario.

Parámetros
n_samplesint, default=100

El número de muestras.

n_featuresint, default=10

El número de características.

random_stateint, instancia RandomState o None, default=None

Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Devuelve
Xndarray de forma (n_samples, n_features)

Las muestras de entrada.

yndarray de forma (n_samples,)

Los valores de salida.

Referencias

1

G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, «Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation», 2009.