sklearn.datasets.make_regression

sklearn.datasets.make_regression()

Genera un problema de regresión aleatoria.

El conjunto de entrada puede estar bien condicionado (por defecto) o tener un perfil singular de cola de bajo rank-fat. Ver make_low_rank_matrix para más detalles.

La salida se genera aplicando un modelo de regresión lineal aleatorio (potencialmente sesgado) con n_informative regresores distintos de cero a la entrada previamente generada y algo de ruido gaussiano centrado con alguna escala ajustable.

Leer más en el Manual de Usuario.

Parámetros
n_samplesint, default=100

El número de muestras.

n_featuresint, default=100

El número de características.

n_informativeint, default=10

El número de características informativas, es decir, el número de características utilizadas para construir el modelo lineal utilizado para generar la salida.

n_targetsint, default=1

El número de objetivos de regresión, es decir, la dimensión del vector de salida y asociado a una muestra. Por defecto, la salida es un escalar.

biasfloat, default=0.0

El término de sesgo en el modelo lineal subyacente.

effective_rankint, default=None
si no es None:

El número aproximado de vectores singulares requeridos para explicar la mayor parte de los datos de entrada mediante combinaciones lineales. El uso de este tipo de espectro singular en la entrada permite al generador reproducir las correlaciones observadas a menudo en la práctica.

si es None:

El conjunto de entrada está bien condicionado, centrado y gaussiano con varianza unitaria.

tail_strengthfloat, default=0.5

La importancia relativa de la cola pesada ruidosa del perfil de valores singulares si effective_rank no es None. Cuando es un número de punto flotante (float), debe estar entre 0 y 1.

noisefloat, default=0.0

La desviación estándar del ruido gaussiano aplicado a la salida.

shufflebool, default=True

Mezcla las muestras y las características.

coefbool, default=False

Si es True, se devuelven los coeficientes del modelo lineal subyacente.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

Devuelve
Xndarray de forma (n_samples, n_features)

Las muestras de entrada.

yndarray de forma (n_samples,) o (n_samples, n_targets)

Los valores de salida.

coefndarray de forma (n_features,) o (n_features, n_targets)

El coeficiente del modelo lineal subyacente. Se devuelve sólo si coef es True.

Ejemplos usando sklearn.datasets.make_regression