sklearn.covariance.ShrunkCovariance

class sklearn.covariance.ShrunkCovariance

Estimador de covarianza con reducción

Más información en el Manual de usuario.

Parámetros
store_precisionbool, default=True

Especifica si se almacena la precisión estimada

assume_centeredbool, default=False

Si es True, los datos no se centrarán antes del calculó. Útil al trabajar con datos cuya media es casí, pero no igual a cero. Si es False, los datos se centrarán antes del cálculo.

shrinkagefloat, default=0.1

Coeficiente en la combinación convex utilizada para el cálculo de la estimación reducida. Su rango es [0, 1].

Atributos
covariance_ndarray de forma (n_features, n_features)

Matriz de covarianza estimada

location_ndarray de forma (n_features,)

Ubicación estimada, es decir, la media estimada.

precision_ndarray de forma (n_features, n_features)

Matrix pseudo inversa estimada. (almacenada sólo si store_precision es True)

Notas

La covarianza regularizada es dada por:

(1 - shrinkage) * cov + shrinkage * mu * np.identity(n_features)

donde mu = trace(cov) / n_features

Ejemplos

>>> import numpy as np
>>> from sklearn.covariance import ShrunkCovariance
>>> from sklearn.datasets import make_gaussian_quantiles
>>> real_cov = np.array([[.8, .3],
...                      [.3, .4]])
>>> rng = np.random.RandomState(0)
>>> X = rng.multivariate_normal(mean=[0, 0],
...                                   cov=real_cov,
...                                   size=500)
>>> cov = ShrunkCovariance().fit(X)
>>> cov.covariance_
array([[0.7387..., 0.2536...],
       [0.2536..., 0.4110...]])
>>> cov.location_
array([0.0622..., 0.0193...])

Métodos

error_norm

Calcula el Error Cuadrático Medio entre dos estimadores de covarianza.

fit

Encaja el modelo de covarianza reducida de acuerdo a los datos de entrenamiento y parámetros dados.

get_params

Obtiene los parámetros para este estimador.

get_precision

Colector para la matriz de precisión.

mahalanobis

Calcula las distancias de Mahalanobis cuadráticas de las observaciones dadas.

score

Calcula el logaritmo de la verosimilitud de un conjunto de datos Gaussiano con self.covariance_ como un estimador de su matriz de covarianza.

set_params

Establece los parámetros de este estimador.

error_norm()

Calcula el Error Cuadrático Medio entre dos estimadores de covarianza. (En el sentido de la norma Frobenius).

Parámetros
comp_covarray-like de forma (n_features, n_features)

La covarianza con la cual se compara.

norm{«frobenius», «spectral»}, default=»frobenius»

El tipo de norma utilizada para calcular el error. Tipos de error disponibles: - “frobenius” (predeterminado): sqrt(tr(A^t.)) - “spectral”: sqrt(max(eigenvalues(A^t.A)) donde A es el error (comp_cov - self.covariance_).

scalingbool, default=True

Si es True (predeterminado), la norma de error cuadrático es dividida por n_features. Si es False, la norma de error cuadrático no es reescalada.

squaredbool, default=True

Si se calcula la norma de error cuadrático o la norma de error. Si es True (predeterminado) se devuelve la norma de error cuadrático. Si es False, se devuelve la norma de error.

Devoluciones
resultfloat

El Error Cuadrático Medio (en el sentido de la norma Frobenius) entre los estimadores de covarianza self y comp_cov.

fit()

Encaja el modelo de covarianza reducida de acuerdo a los datos de entrenamiento y parámetros dados.

Parámetros
Xarray-like de forma (n_samples, n_features)

Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.

y: Ignorado

No se utiliza, está presente para la consistencia de la API por convención.

Devoluciones
selfobjeto
get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devoluciones
paramsdict

Nombres de parámetros asignados a sus valores.

get_precision()

Colector para la matriz de precisión.

Devoluciones
precision_array-like de forma (n_features, n_features)

La matriz de precisión asociada al objeto de covariancia actual.

mahalanobis()

Calcula las distancias de Mahalanobis cuadráticas de las observaciones dadas.

Parámetros
Xarray-like de forma (n_samples, n_features)

Las observaciones, las distancias Mahalanobis de lo que calculamos. Se asume que las observaciones se extraen de la misma distribución que utilizaron los datos en el ajuste.

Devoluciones
distndarray de forma (n_samples,)

Distancias de Mahalanobis cuadráticas de las observaciones.

score()

Calcula el logaritmo de la verosimilitud de un conjunto de datos Gaussiano con self.covariance_ como un estimador de su matriz de covarianza.

Parámetros
X_testarray-like de forma (n_samples, n_features)

Los datos de prueba de los cuales calculamos la probabilidad, donde n_samples es el número de muestras y n_features es el número de características. Se asume que X_test se extrae de la misma distribución que los datos utilizados (incluyendo el centrado).

yIgnorado

No se utiliza, está presente para la consistencia de la API por convención.

Devoluciones
resfloat

La probabilidad del conjunto de datos con self.covariance_ como un estimador de su matriz de covarianza.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devoluciones
selfinstancia del estimador

Instancia del estimador.