sklearn.datasets.make_friedman1

sklearn.datasets.make_friedman1()

Genera el problema de regresión «Friedman #1».

Este conjunto de datos se describe en Friedman [1] y Breiman [2].

Las entradas X son características independientes distribuidas uniformemente en el intervalo [0, 1]. La salida y se crea según la fórmula:

y(X) = 10 * sin(pi * X[:, 0] * X[:, 1]) + 20 * (X[:, 2] - 0.5) ** 2 + 10 * X[:, 3] + 5 * X[:, 4] + noise * N(0, 1).

De las características n_features, sólo 5 se utilizan realmente para calcular y. El resto de características son independientes de «y».

El número de características tiene que ser >= 5.

Leer más en el Manual de Usuario.

Parámetros
n_samplesint, default=100

El número de muestras.

n_featuresint, default=10

El número de características. Debe ser al menos 5.

noisefloat, default=0.0

La desviación estándar del ruido gaussiano aplicado a la salida.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para el ruido del conjunto de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Devuelve
Xndarray de forma (n_samples, n_features)

Las muestras de entrada.

yndarray de forma (n_samples,)

Los valores de salida.

Referencias

1

J. Friedman, «Multivariate adaptive regression splines», The Annals of Statistics 19 (1), pages 1-67, 1991.

2

L. Breiman, «Bagging predictors», Machine Learning 24, pages 123-140, 1996.