sklearn.datasets
.make_regression¶
- sklearn.datasets.make_regression()¶
Genera un problema de regresión aleatoria.
El conjunto de entrada puede estar bien condicionado (por defecto) o tener un perfil singular de cola de bajo rank-fat. Ver
make_low_rank_matrix
para más detalles.La salida se genera aplicando un modelo de regresión lineal aleatorio (potencialmente sesgado) con
n_informative
regresores distintos de cero a la entrada previamente generada y algo de ruido gaussiano centrado con alguna escala ajustable.Leer más en el Manual de Usuario.
- Parámetros
- n_samplesint, default=100
El número de muestras.
- n_featuresint, default=100
El número de características.
- n_informativeint, default=10
El número de características informativas, es decir, el número de características utilizadas para construir el modelo lineal utilizado para generar la salida.
- n_targetsint, default=1
El número de objetivos de regresión, es decir, la dimensión del vector de salida y asociado a una muestra. Por defecto, la salida es un escalar.
- biasfloat, default=0.0
El término de sesgo en el modelo lineal subyacente.
- effective_rankint, default=None
- si no es None:
El número aproximado de vectores singulares requeridos para explicar la mayor parte de los datos de entrada mediante combinaciones lineales. El uso de este tipo de espectro singular en la entrada permite al generador reproducir las correlaciones observadas a menudo en la práctica.
- si es None:
El conjunto de entrada está bien condicionado, centrado y gaussiano con varianza unitaria.
- tail_strengthfloat, default=0.5
La importancia relativa de la cola pesada ruidosa del perfil de valores singulares si
effective_rank
no es None. Cuando es un número de punto flotante (float), debe estar entre 0 y 1.- noisefloat, default=0.0
La desviación estándar del ruido gaussiano aplicado a la salida.
- shufflebool, default=True
Mezcla las muestras y las características.
- coefbool, default=False
Si es True, se devuelven los coeficientes del modelo lineal subyacente.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios para la creación de conjuntos de datos. Pasa un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- Devuelve
- Xndarray de forma (n_samples, n_features)
Las muestras de entrada.
- yndarray de forma (n_samples,) o (n_samples, n_targets)
Los valores de salida.
- coefndarray de forma (n_features,) o (n_features, n_targets)
El coeficiente del modelo lineal subyacente. Se devuelve sólo si coef es True.