`sklearn.feature_selection`.GenericUnivariateSelect¶

class sklearn.feature_selection.GenericUnivariateSelect¶

Selector de características univariantes con estrategia configurable.

Lee más en el Manual de usuario.

Parámetros

score_funcinvocable, default=f_classif: Función que toma dos arreglos X e y, y devuelve un par de arreglos (scores, pvalues). Para los modos “percentile” o “kbest” puede devolver un único arreglo de puntuaciones.
mode{“percentile”, “k_best”, “fpr”, “fdr”, “fwe”}, default=”percentile”: Modo de selección de características.
paramfloat o int depending on the feature selection mode, default=1e-5: Parámetro del modo correspondiente.

Atributos

scores_array-like de forma (n_features,): Puntuaciones de las características.
pvalues_array-like de forma (n_features,): Valores p de las puntuaciones de las características, None si score_func devuelve sólo las puntuaciones.

Ver también

f_classif: Valor-F de ANOVA entre etiqueta/característica para las tareas de clasificación.
mutual_info_classif: Información mutua para un objetivo discreto.
chi2: Estadísticas Chi-cuadrado de las características no negativas para las tareas de clasificación.
f_regression: Valor-F entre etiqueta/característica para tareas de regresión.
mutual_info_regression: Información mutua para un objetivo continuo.
SelectPercentile: Selecciona las características en función del percentil de las puntuaciones más altas.
SelectKBest: Selecciona características basándose en las k puntuaciones más altas.
SelectFpr: Selecciona las características basándose en una prueba de tasa de falsos positivos.
SelectFdr: Selecciona características basándose en una tasa estimada de falsos descubrimientos.
SelectFwe: Selecciona características en función de la tasa de error por familias.

Ejemplos

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import GenericUnivariateSelect, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> transformer = GenericUnivariateSelect(chi2, mode='k_best', param=20)
>>> X_new = transformer.fit_transform(X, y)
>>> X_new.shape
(569, 20)

Métodos

`fit`	Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.
`fit_transform`	Ajusta a los datos y luego los transforma.
`get_params`	Obtiene los parámetros para este estimador.
`get_support`	Obtiene una máscara, o índice entero, de las características seleccionadas
`inverse_transform`	Revierte la operación de transformación
`set_params`	Establece los parámetros de este estimador.
`transform`	Reduce X a las características seleccionadas.

fit()¶

Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.

Parámetros

Xarray-like de forma (n_samples_X, n_features): Las muestras de entrada de entrenamiento.
yarray-like de forma (n_samples,): Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).

Devuelve

selfobjeto

fit_transform()¶

Ajusta a los datos y luego los transforma.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros

Xarray-like de forma (n_samples_X, n_features): Muestras de entrada.
yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None: Valores objetivo (None para transformaciones no supervisadas).
**fit_paramsdict: Parámetros de ajuste adicionales.

Devuelve

X_newarreglo ndarray de forma (n_samples, n_features_new): Arreglo transformado.

get_params()¶

Obtiene los parámetros para este estimador.

Parámetros

deepbool, default=True: Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve

paramsdict: Nombres de los parámetros mapeados a sus valores.

get_support()¶

Obtiene una máscara, o índice entero, de las características seleccionadas

Parámetros

indicesbool, default=False: Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.

Devuelve

supportarreglo: Un índice que selecciona las características retenidas de un vector de características. Si indices es False, se trata de un arreglo booleano de forma [# características de entrada], en el que un elemento es True si y solo si su característica correspondiente es seleccionada para ser retenida. Si indices es True, se trata de un arreglo de enteros de forma [# características de salida] cuyos valores son índices en el vector de características de entrada.

inverse_transform()¶

Revierte la operación de transformación

Parámetros

Xarreglo de forma [n_samples, n_selected_features]: Las muestras de entrada.

Devuelve

X_rarreglo de forma [n_samples, n_original_features]: X con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia del estimador: Instancia del estimador.

transform()¶

Reduce X a las características seleccionadas.

Parámetros

Xarreglo de forma [n_samples, n_features]: Las muestras de entrada.

Devuelve

X_rarreglo de forma [n_samples, n_selected_features]: Las muestras de entrada con tan sólo las características seleccionadas.