sklearn.feature_selection.VarianceThreshold

class sklearn.feature_selection.VarianceThreshold

Selector de características que elimina todas las características de baja varianza.

Este algoritmo de selección de características sólo tiene en cuenta las características (X), no los resultados deseados (y), por lo que puede utilizarse para el aprendizaje no supervisado.

Más información en el Manual de usuario.

Parámetros
thresholdfloat, default=0

Las características con una varianza del conjunto de entrenamiento inferior a este umbral se eliminarán. El valor predeterminado es mantener todas las características con varianza distinta de cero, es decir, eliminar las características que tienen el mismo valor en todas las muestras.

Atributos
variances_arreglo, forma (n_features,)

Varianzas de las características individuales.

Notas

Permite NaN en la entrada. Genera un ValueError si ninguna característica de X cumple con el umbral de varianza.

Ejemplos

El siguiente conjunto de datos tiene como características enteros, dos de los cuales son iguales en cada muestra. Estas se eliminan con la configuración predeterminada del umbral:

>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
>>> selector = VarianceThreshold()
>>> selector.fit_transform(X)
array([[2, 0],
       [1, 4],
       [1, 1]])

Métodos

fit

Aprende varianzas empíricas de X.

fit_transform

Ajusta a los datos y luego los transforma.

get_params

Obtiene los parámetros para este estimador.

get_support

Obtiene una máscara, o índice entero, de las características seleccionadas

inverse_transform

Revierte la operación de transformación

set_params

Establece los parámetros de este estimador.

transform

Reduce X a las características seleccionadas.

fit()

Aprende varianzas empíricas de X.

Parámetros
X{array-like, sparse matrix}, forma (n_samples, n_features)

Vectores de muestra a partir de los cuales se calculan las varianzas.

yany, default=None

Ignorado. Este parámetro sólo existe para compatibilidad con sklearn.pipeline.Pipeline.

Devuelve
self
fit_transform()

Ajusta a los datos y luego los transforma.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like de forma (n_samples, n_features)

Muestras de entrada.

yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None

Valores objetivo (None para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devuelve
X_newarreglo ndarray de forma (n_samples, n_features_new)

Arreglo transformado.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

get_support()

Obtiene una máscara, o índice entero, de las características seleccionadas

Parámetros
indicesbool, default=False

Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.

Devuelve
supportarreglo

Un índice que selecciona las características retenidas de un vector de características (feature vector). Si indices es False, se trata de un arreglo booleano de forma [# input features], en el cual un elemento es True si su característica correspondiente es seleccionada para ser retenida. Si indices es True, se trata de un arreglo de enteros de forma [# output features] cuyos valores son índices en el vector de características de entrada.

inverse_transform()

Revierte la operación de transformación

Parámetros
Xarreglo de forma [n_samples, n_selected_features]

Las muestras de entrada.

Devuelve
X_rarreglo de forma [n_samples, n_original_features]

X con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia del estimador.

transform()

Reduce X a las características seleccionadas.

Parámetros
Xarreglo de forma [n_samples, n_features]

Las muestras de entrada.

Devuelve
X_rarreglo de forma [n_samples, n_selected_features]

Las muestras de entrada con sólo las características seleccionadas.