sklearn.feature_selection.GenericUnivariateSelect

class sklearn.feature_selection.GenericUnivariateSelect

Selector de características univariantes con estrategia configurable.

Lee más en el Manual de usuario.

Parámetros
score_funcinvocable, default=f_classif

Función que toma dos arreglos X e y, y devuelve un par de arreglos (scores, pvalues). Para los modos “percentile” o “kbest” puede devolver un único arreglo de puntuaciones.

mode{“percentile”, “k_best”, “fpr”, “fdr”, “fwe”}, default=”percentile”

Modo de selección de características.

paramfloat o int depending on the feature selection mode, default=1e-5

Parámetro del modo correspondiente.

Atributos
scores_array-like de forma (n_features,)

Puntuaciones de las características.

pvalues_array-like de forma (n_features,)

Valores p de las puntuaciones de las características, None si score_func devuelve sólo las puntuaciones.

Ver también

f_classif

Valor-F de ANOVA entre etiqueta/característica para las tareas de clasificación.

mutual_info_classif

Información mutua para un objetivo discreto.

chi2

Estadísticas Chi-cuadrado de las características no negativas para las tareas de clasificación.

f_regression

Valor-F entre etiqueta/característica para tareas de regresión.

mutual_info_regression

Información mutua para un objetivo continuo.

SelectPercentile

Selecciona las características en función del percentil de las puntuaciones más altas.

SelectKBest

Selecciona características basándose en las k puntuaciones más altas.

SelectFpr

Selecciona las características basándose en una prueba de tasa de falsos positivos.

SelectFdr

Selecciona características basándose en una tasa estimada de falsos descubrimientos.

SelectFwe

Selecciona características en función de la tasa de error por familias.

Ejemplos

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import GenericUnivariateSelect, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> transformer = GenericUnivariateSelect(chi2, mode='k_best', param=20)
>>> X_new = transformer.fit_transform(X, y)
>>> X_new.shape
(569, 20)

Métodos

fit

Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.

fit_transform

Ajusta a los datos y luego los transforma.

get_params

Obtiene los parámetros para este estimador.

get_support

Obtiene una máscara, o índice entero, de las características seleccionadas

inverse_transform

Revierte la operación de transformación

set_params

Establece los parámetros de este estimador.

transform

Reduce X a las características seleccionadas.

fit()

Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.

Parámetros
Xarray-like de forma (n_samples_X, n_features)

Las muestras de entrada de entrenamiento.

yarray-like de forma (n_samples,)

Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).

Devuelve
selfobjeto
fit_transform()

Ajusta a los datos y luego los transforma.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like de forma (n_samples_X, n_features)

Muestras de entrada.

yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None

Valores objetivo (None para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devuelve
X_newarreglo ndarray de forma (n_samples, n_features_new)

Arreglo transformado.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de los parámetros mapeados a sus valores.

get_support()

Obtiene una máscara, o índice entero, de las características seleccionadas

Parámetros
indicesbool, default=False

Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.

Devuelve
supportarreglo

Un índice que selecciona las características retenidas de un vector de características. Si indices es False, se trata de un arreglo booleano de forma [# características de entrada], en el que un elemento es True si y solo si su característica correspondiente es seleccionada para ser retenida. Si indices es True, se trata de un arreglo de enteros de forma [# características de salida] cuyos valores son índices en el vector de características de entrada.

inverse_transform()

Revierte la operación de transformación

Parámetros
Xarreglo de forma [n_samples, n_selected_features]

Las muestras de entrada.

Devuelve
X_rarreglo de forma [n_samples, n_original_features]

X con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia del estimador.

transform()

Reduce X a las características seleccionadas.

Parámetros
Xarreglo de forma [n_samples, n_features]

Las muestras de entrada.

Devuelve
X_rarreglo de forma [n_samples, n_selected_features]

Las muestras de entrada con tan sólo las características seleccionadas.