sklearn.feature_selection.GenericUnivariateSelect¶
- class sklearn.feature_selection.GenericUnivariateSelect¶
Selector de características univariantes con estrategia configurable.
Lee más en el Manual de usuario.
- Parámetros
- score_funcinvocable, default=f_classif
Función que toma dos arreglos X e y, y devuelve un par de arreglos (scores, pvalues). Para los modos “percentile” o “kbest” puede devolver un único arreglo de puntuaciones.
- mode{“percentile”, “k_best”, “fpr”, “fdr”, “fwe”}, default=”percentile”
Modo de selección de características.
- paramfloat o int depending on the feature selection mode, default=1e-5
Parámetro del modo correspondiente.
- Atributos
- scores_array-like de forma (n_features,)
Puntuaciones de las características.
- pvalues_array-like de forma (n_features,)
Valores p de las puntuaciones de las características, None si
score_funcdevuelve sólo las puntuaciones.
Ver también
f_classifValor-F de ANOVA entre etiqueta/característica para las tareas de clasificación.
mutual_info_classifInformación mutua para un objetivo discreto.
chi2Estadísticas Chi-cuadrado de las características no negativas para las tareas de clasificación.
f_regressionValor-F entre etiqueta/característica para tareas de regresión.
mutual_info_regressionInformación mutua para un objetivo continuo.
SelectPercentileSelecciona las características en función del percentil de las puntuaciones más altas.
SelectKBestSelecciona características basándose en las k puntuaciones más altas.
SelectFprSelecciona las características basándose en una prueba de tasa de falsos positivos.
SelectFdrSelecciona características basándose en una tasa estimada de falsos descubrimientos.
SelectFweSelecciona características en función de la tasa de error por familias.
Ejemplos
>>> from sklearn.datasets import load_breast_cancer >>> from sklearn.feature_selection import GenericUnivariateSelect, chi2 >>> X, y = load_breast_cancer(return_X_y=True) >>> X.shape (569, 30) >>> transformer = GenericUnivariateSelect(chi2, mode='k_best', param=20) >>> X_new = transformer.fit_transform(X, y) >>> X_new.shape (569, 20)
Métodos
Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.
Ajusta a los datos y luego los transforma.
Obtiene los parámetros para este estimador.
Obtiene una máscara, o índice entero, de las características seleccionadas
Revierte la operación de transformación
Establece los parámetros de este estimador.
Reduce X a las características seleccionadas.
- fit()¶
Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.
- Parámetros
- Xarray-like de forma (n_samples_X, n_features)
Las muestras de entrada de entrenamiento.
- yarray-like de forma (n_samples,)
Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).
- Devuelve
- selfobjeto
- fit_transform()¶
Ajusta a los datos y luego los transforma.
Ajusta el transformador a
Xeycon los parámetros opcionalesfit_paramsy devuelve una versión transformada deX.- Parámetros
- Xarray-like de forma (n_samples_X, n_features)
Muestras de entrada.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None
Valores objetivo (None para transformaciones no supervisadas).
- **fit_paramsdict
Parámetros de ajuste adicionales.
- Devuelve
- X_newarreglo ndarray de forma (n_samples, n_features_new)
Arreglo transformado.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de los parámetros mapeados a sus valores.
- get_support()¶
Obtiene una máscara, o índice entero, de las características seleccionadas
- Parámetros
- indicesbool, default=False
Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.
- Devuelve
- supportarreglo
Un índice que selecciona las características retenidas de un vector de características. Si
indiceses False, se trata de un arreglo booleano de forma [# características de entrada], en el que un elemento es True si y solo si su característica correspondiente es seleccionada para ser retenida. Siindiceses True, se trata de un arreglo de enteros de forma [# características de salida] cuyos valores son índices en el vector de características de entrada.
- inverse_transform()¶
Revierte la operación de transformación
- Parámetros
- Xarreglo de forma [n_samples, n_selected_features]
Las muestras de entrada.
- Devuelve
- X_rarreglo de forma [n_samples, n_original_features]
Xcon columnas de ceros insertadas donde las características habrían sido eliminadas portransform.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline). Estos últimos tienen parámetros de la forma<component>__<parameter>para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia del estimador.
- transform()¶
Reduce X a las características seleccionadas.
- Parámetros
- Xarreglo de forma [n_samples, n_features]
Las muestras de entrada.
- Devuelve
- X_rarreglo de forma [n_samples, n_selected_features]
Las muestras de entrada con tan sólo las características seleccionadas.