`sklearn.linear_model`.TweedieRegressor¶

class sklearn.linear_model.TweedieRegressor¶

Modelo lineal generalizado con una distribución de Tweedie.

Este estimador se puede utilizar para modelar diferentes GLMs dependiendo del parámetro power, que determina la distribución subyacente.

Más información en el Manual de usuario.

Nuevo en la versión 0.23.

Parámetros

powerfloat, default=0

La potencia determina la distribución del objetivo subyacente de acuerdo con la siguiente tabla:

Potencia	Distribución
0	Normal
1	Poisson
(1,2)	Compound Poisson Gamma
2	Gamma
3	Inverse Gaussian

Para 0 < power < 1, no existe ninguna distribución.

alphaflotante, default=1

Constante que multiplica el término de penalización y determina así la fuerza de regularización. alpha = 0 es equivalente a MLG no penalizados. En este caso, la matriz de diseño `X`debe tener rango de columna completo (sin colinealidades).

link{“auto”, “identity”, “log”}, default=”auto”

La función de enlace del GLM, es decir, la asignación del predictor lineal X @ coeff + intercept a la predicción y_pred. La opción “auto” establece el enlace dependiendo de la familia elegida como sigue:

“identity” para la Distribución Normal
“log” para las distribuciones Poisson, Gamma y Gaussiana Inversa

fit_interceptbool, default=True

Específica si una constante (también conocido como sesgo o intercepto) debería ser añadida al predictor lineal (X @ coef + intercept).

max_iterint, default=100

El número máximo de iteraciones para el solucionador.

tolfloat, default=1e-4

Criterio de parada. Para el solucionador lbfgs, la iteración se detendrá cuando max{|g_j|, j = 1, ..., d} <= tol donde g_j es el j-ésimo componente del gradiente (derivativo) de la función objetivo.

warm_startbool, default=False

Si se establece como True, reutiliza la solución de la llamada anterior a fit como inicialización para coef_ y intercept_.

verboseint, default=0

Con el solucionador lbfgs, establece verbose a cualquier número positivo para la verbosidad.

Atributos

coef_arreglo de forma (n_features,): Coeficientes estimados para el predictor lineal (X @ coef_ + intercept_) en el GLM.
intercept_float: Intercepto (o sesgo) añadido al predictor lineal.
n_iter_int: Número actual de iteraciones utilizadas en el solucionador.

Ejemplos

>>> from sklearn import linear_model
>>> clf = linear_model.TweedieRegressor()
>>> X = [[1, 2], [2, 3], [3, 4], [4, 3]]
>>> y = [2, 3.5, 5, 5.5]
>>> clf.fit(X, y)
TweedieRegressor()
>>> clf.score(X, y)
0.839...
>>> clf.coef_
array([0.599..., 0.299...])
>>> clf.intercept_
1.600...
>>> clf.predict([[1, 1], [3, 4]])
array([2.500..., 4.599...])

Métodos

`fit`	Ajuste de un Modelo Lineal Generalizado.
`get_params`	Obtiene los parámetros para este estimador.
`predict`	Predicción mediante GLM con la matriz de características X.
`score`	Calcula D^2, el porcentaje de desviación explicado.
`set_params`	Establece los parámetros de este estimador.

fit()¶

Ajuste de un Modelo Lineal Generalizado.

Parámetros

X{array-like, sparse matrix} de forma (n_samples, n_features): Datos de entrenamiento.
yarray-like de forma (n_samples,): Valores objetivo.
sample_weightarray-like de forma (n_samples,), default=None: Ponderaciones de muestra.

Devuelve

selfdevuelve una instancia de sí misma.

get_params()¶

Obtiene los parámetros para este estimador.

Parámetros

deepbool, default=True: Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve

paramsdict: Nombres de parámetros mapeados a sus valores.

predict()¶

Predicción mediante GLM con la matriz de características X.

Parámetros

X{array-like, sparse matrix} de forma (n_samples, n_features): Muestras.

Devuelve

y_predarreglo de forma (n_samples,): Devuelve los valores predichos.

score()¶

Calcula D^2, el porcentaje de desviación explicado.

D^2 es una generalización del coeficiente de determinación R^2. R^2 utiliza el error cuadrático y una desviación D^2. Note que los dos son iguales para family='normal'.

D^2 se define como \(D^2 = 1-\frac{D(y_{true},y_{pred})}{D_{null}\), \(D_{null}\) es la desviación nula, es decir, la desviación de un modelo con intercepción solo, que corresponde a \(y_{pred} = \bar{y}\). La media \(bar{y}\) es promediada por sample_weight. La mejor puntuación posible es 1.0 y puede ser negativa (porque el modelo puede ser arbitrariamente peor).

Parámetros

X{array-like, sparse matrix} de forma (n_samples, n_features): Muestras de prueba.
yarray-like de forma (n_samples,): Valores reales del objetivo.
sample_weightarray-like de forma (n_samples,), default=None: Ponderaciones de muestra.

Devuelve

scorefloat: D^2 of self.predict(X) w.r.t. y.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como con objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia de estimador: Instancia de estimador.

Ejemplos usando `sklearn.linear_model.TweedieRegressor`¶

sklearn.linear_model.TweedieRegressor¶

Ejemplos usando sklearn.linear_model.TweedieRegressor¶

`sklearn.linear_model`.TweedieRegressor¶

Ejemplos usando `sklearn.linear_model.TweedieRegressor`¶