sklearn.feature_selection
.VarianceThreshold¶
- class sklearn.feature_selection.VarianceThreshold¶
Selector de características que elimina todas las características de baja varianza.
Este algoritmo de selección de características sólo tiene en cuenta las características (X), no los resultados deseados (y), por lo que puede utilizarse para el aprendizaje no supervisado.
Más información en el Manual de usuario.
- Parámetros
- thresholdfloat, default=0
Las características con una varianza del conjunto de entrenamiento inferior a este umbral se eliminarán. El valor predeterminado es mantener todas las características con varianza distinta de cero, es decir, eliminar las características que tienen el mismo valor en todas las muestras.
- Atributos
- variances_arreglo, forma (n_features,)
Varianzas de las características individuales.
Notas
Permite NaN en la entrada. Genera un ValueError si ninguna característica de X cumple con el umbral de varianza.
Ejemplos
El siguiente conjunto de datos tiene como características enteros, dos de los cuales son iguales en cada muestra. Estas se eliminan con la configuración predeterminada del umbral:
>>> X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]] >>> selector = VarianceThreshold() >>> selector.fit_transform(X) array([[2, 0], [1, 4], [1, 1]])
Métodos
Aprende varianzas empíricas de X.
Ajusta a los datos y luego los transforma.
Obtiene los parámetros para este estimador.
Obtiene una máscara, o índice entero, de las características seleccionadas
Revierte la operación de transformación
Establece los parámetros de este estimador.
Reduce X a las características seleccionadas.
- fit()¶
Aprende varianzas empíricas de X.
- Parámetros
- X{array-like, sparse matrix}, forma (n_samples, n_features)
Vectores de muestra a partir de los cuales se calculan las varianzas.
- yany, default=None
Ignorado. Este parámetro sólo existe para compatibilidad con sklearn.pipeline.Pipeline.
- Devuelve
- self
- fit_transform()¶
Ajusta a los datos y luego los transforma.
Ajusta el transformador a
X
ey
con los parámetros opcionalesfit_params
y devuelve una versión transformada deX
.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Muestras de entrada.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None
Valores objetivo (None para transformaciones no supervisadas).
- **fit_paramsdict
Parámetros de ajuste adicionales.
- Devuelve
- X_newarreglo ndarray de forma (n_samples, n_features_new)
Arreglo transformado.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de parámetros mapeados a sus valores.
- get_support()¶
Obtiene una máscara, o índice entero, de las características seleccionadas
- Parámetros
- indicesbool, default=False
Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.
- Devuelve
- supportarreglo
Un índice que selecciona las características retenidas de un vector de características (feature vector). Si
indices
es False, se trata de un arreglo booleano de forma [# input features], en el cual un elemento es True si su característica correspondiente es seleccionada para ser retenida. Siindices
es True, se trata de un arreglo de enteros de forma [# output features] cuyos valores son índices en el vector de características de entrada.
- inverse_transform()¶
Revierte la operación de transformación
- Parámetros
- Xarreglo de forma [n_samples, n_selected_features]
Las muestras de entrada.
- Devuelve
- X_rarreglo de forma [n_samples, n_original_features]
X
con columnas de ceros insertadas donde las características habrían sido eliminadas portransform
.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia del estimador.
- transform()¶
Reduce X a las características seleccionadas.
- Parámetros
- Xarreglo de forma [n_samples, n_features]
Las muestras de entrada.
- Devuelve
- X_rarreglo de forma [n_samples, n_selected_features]
Las muestras de entrada con sólo las características seleccionadas.