`sklearn.feature_selection`.SelectFdr¶

class sklearn.feature_selection.SelectFdr¶

Filtro: Seleccionar los valores p para una tasa de falsos descubrimientos estimada

Esto utiliza el procedimiento Benjamini-Hochberg. alpha es un límite superior de la tasa de falsos descubrimientos esperada.

Más información en el Manual de usuario.

Parámetros

score_funcinvocable, default=f_classif: Función que toma dos matrices X e y, y devuelve un par de arreglos (puntuaciones, pvalores). Por defecto es f_classif (ver abajo «Ver también»). La función por defecto sólo funciona con tareas de clasificación.
alphafloat, default=5e-2: El valor p más alto no corregido para las características que hay que mantener.

Atributos

scores_array-like de forma (n_features,): Puntuaciones de las características.
pvalues_array-like de forma (n_features,): los valores p de las puntuaciones de las características.

Ver también

f_classif: Valor F de ANOVA entre etiqueta/característica para las tareas de clasificación.
mutual_info_classif: Información recíproca para un objetivo continuo.
chi2: Estadísticas Chi-cuadrado de las características no negativas para las tareas de clasificación.
f_regression: Valor F entre etiqueta/característica para tareas de regresión.
mutual_info_regression: Información mutua para un objetivo continuo.
SelectPercentile: Selecciona las características en función del percentil de las puntuaciones más altas.
SelectKBest: Selecciona características basándose en las k puntuaciones más altas.
SelectFpr: Selecciona características basándose en una prueba de tasa de falsos positivos.
SelectFwe: Selecciona las características en función de la tasa de error por familias.
GenericUnivariateSelect: Selector de características univariante con modo configurable.

Referencias

https://en.wikipedia.org/wiki/False_discovery_rate

Ejemplos

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import SelectFdr, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y)
>>> X_new.shape
(569, 16)

Métodos

`fit`	Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.
`fit_transform`	Ajustar a los datos y luego transformarlos.
`get_params`	Obtiene los parámetros de este estimador.
`get_support`	Obtiene una máscara, o índice entero, de las características seleccionadas
`inverse_transform`	Revertir la operación de transformación
`set_params`	Establece los parámetros de este estimador.
`transform`	Reduce X a las características seleccionadas.

fit()¶

Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.

Parámetros

Xarray-like de forma (n_samples, n_features): Las muestras de entrada de entrenamiento.
yarray-like de forma (n_samples,): Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).

Devuelve

selfobjeto

fit_transform()¶

Ajustar a los datos y luego transformarlos.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros

Xarray-like de forma (n_samples, n_features): Muestras de entrada.
yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None: Valores objetivo (None para transformaciones no supervisadas).
**fit_paramsdict: Parámetros de ajuste adicionales.

Devuelve

X_newarreglo ndarray de forma (n_samples, n_features_new): Arreglo transformado.

get_params()¶

Obtiene los parámetros de este estimador.

Parámetros

deepbooleano, default=True: Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.

Devuelve

paramsdict: Los nombres de los parámetros se asignan a sus valores.

get_support()¶

Obtiene una máscara, o índice entero, de las características seleccionadas

Parámetros

indicesbooleano, default=False: Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.

Devuelve

supportarreglo: Un índice que selecciona las características retenidas de un vector de características. Si indices es False, se trata de un arreglo booleano de forma [# características de entrada], en la que un elemento es True si su característica correspondiente es seleccionada para ser retenida. Si indices es True, se trata de un arreglo de enteros de forma [# características de salida] cuyos valores son índices en el vector de características de entrada.

inverse_transform()¶

Revertir la operación de transformación

Parámetros

Xarreglo de forma [n_samples, n_selected_features]: Las muestras de entrada.

Devuelve

X_rarreglo de forma [n_samples, n_original_features]: X` con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como con objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma ``<component>__<parameter>` para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia del estimador: Instancia del estimador.

transform()¶

Reduce X a las características seleccionadas.

Parámetros

Xarreglo de forma [n_samples, n_features]: Las muestras de entrada.

Devuelve

X_rarreglo de forma [n_samples, n_selected_features]: Las muestras de entrada sólo con las características seleccionadas.