sklearn.feature_selection
.SelectFdr¶
- class sklearn.feature_selection.SelectFdr¶
Filtro: Seleccionar los valores p para una tasa de falsos descubrimientos estimada
Esto utiliza el procedimiento Benjamini-Hochberg.
alpha
es un límite superior de la tasa de falsos descubrimientos esperada.Más información en el Manual de usuario.
- Parámetros
- score_funcinvocable, default=f_classif
Función que toma dos matrices X e y, y devuelve un par de arreglos (puntuaciones, pvalores). Por defecto es f_classif (ver abajo «Ver también»). La función por defecto sólo funciona con tareas de clasificación.
- alphafloat, default=5e-2
El valor p más alto no corregido para las características que hay que mantener.
- Atributos
- scores_array-like de forma (n_features,)
Puntuaciones de las características.
- pvalues_array-like de forma (n_features,)
los valores p de las puntuaciones de las características.
Ver también
f_classif
Valor F de ANOVA entre etiqueta/característica para las tareas de clasificación.
mutual_info_classif
Información recíproca para un objetivo continuo.
chi2
Estadísticas Chi-cuadrado de las características no negativas para las tareas de clasificación.
f_regression
Valor F entre etiqueta/característica para tareas de regresión.
mutual_info_regression
Información mutua para un objetivo continuo.
SelectPercentile
Selecciona las características en función del percentil de las puntuaciones más altas.
SelectKBest
Selecciona características basándose en las k puntuaciones más altas.
SelectFpr
Selecciona características basándose en una prueba de tasa de falsos positivos.
SelectFwe
Selecciona las características en función de la tasa de error por familias.
GenericUnivariateSelect
Selector de características univariante con modo configurable.
Referencias
https://en.wikipedia.org/wiki/False_discovery_rate
Ejemplos
>>> from sklearn.datasets import load_breast_cancer >>> from sklearn.feature_selection import SelectFdr, chi2 >>> X, y = load_breast_cancer(return_X_y=True) >>> X.shape (569, 30) >>> X_new = SelectFdr(chi2, alpha=0.01).fit_transform(X, y) >>> X_new.shape (569, 16)
Métodos
Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.
Ajustar a los datos y luego transformarlos.
Obtiene los parámetros de este estimador.
Obtiene una máscara, o índice entero, de las características seleccionadas
Revertir la operación de transformación
Establece los parámetros de este estimador.
Reduce X a las características seleccionadas.
- fit()¶
Ejecuta la función de puntuación en (X, y) y obtiene las características apropiadas.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Las muestras de entrada de entrenamiento.
- yarray-like de forma (n_samples,)
Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).
- Devuelve
- selfobjeto
- fit_transform()¶
Ajustar a los datos y luego transformarlos.
Ajusta el transformador a
X
ey
con los parámetros opcionalesfit_params
y devuelve una versión transformada deX
.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Muestras de entrada.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None
Valores objetivo (None para transformaciones no supervisadas).
- **fit_paramsdict
Parámetros de ajuste adicionales.
- Devuelve
- X_newarreglo ndarray de forma (n_samples, n_features_new)
Arreglo transformado.
- get_params()¶
Obtiene los parámetros de este estimador.
- Parámetros
- deepbooleano, default=True
Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.
- Devuelve
- paramsdict
Los nombres de los parámetros se asignan a sus valores.
- get_support()¶
Obtiene una máscara, o índice entero, de las características seleccionadas
- Parámetros
- indicesbooleano, default=False
Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.
- Devuelve
- supportarreglo
Un índice que selecciona las características retenidas de un vector de características. Si
indices
es False, se trata de un arreglo booleano de forma [# características de entrada], en la que un elemento es True si su característica correspondiente es seleccionada para ser retenida. Siindices
es True, se trata de un arreglo de enteros de forma [# características de salida] cuyos valores son índices en el vector de características de entrada.
- inverse_transform()¶
Revertir la operación de transformación
- Parámetros
- Xarreglo de forma [n_samples, n_selected_features]
Las muestras de entrada.
- Devuelve
- X_rarreglo de forma [n_samples, n_original_features]
X` con columnas de ceros insertadas donde las características habrían sido eliminadas por
transform
.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto con estimadores simples como con objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma ``<component>__<parameter>` para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia del estimador.
- transform()¶
Reduce X a las características seleccionadas.
- Parámetros
- Xarreglo de forma [n_samples, n_features]
Las muestras de entrada.
- Devuelve
- X_rarreglo de forma [n_samples, n_selected_features]
Las muestras de entrada sólo con las características seleccionadas.