`sklearn.feature_selection`.SelectPercentile¶

class sklearn.feature_selection.SelectPercentile¶

Seleccionar características según un percentil de las puntuaciones más altas.

Más información en el Manual de usuario.

Parámetros

score_funccallable, default=f_classif: Función que toma dos arrays X e y, y devuelve un par de arreglos (puntuaciones, pvalores) o un único arreglo con puntuaciones. Por defecto es f_classif (ver más abajo «Ver también»). La función por defecto sólo funciona con tareas de clasificación.

Nuevo en la versión 0.18.
percentileint, default=10: Porcentaje de características a conservar.

Atributos

scores_array-like de forma (n_features,): Puntuaciones de las características.
pvalues_array-like de forma (n_features,): valores p de las puntuaciones de las características, None si score_func devuelve sólo puntuaciones.

Ver también

f_classif: Valor F de ANOVA entre etiqueta/característica para tareas de clasificación.
mutual_info_classif: Información recíproca para un objetivo continuo.
chi2: Estadísticas Chi-cuadrado de las características no negativas para las tareas de clasificación.
f_regression: Valor F entre etiqueta/característica para tareas de regresión.
mutual_info_regression: Información recíproca para un objetivo continuo.
SelectKBest: Selecciona características basándose en las k puntuaciones más altas.
SelectFpr: Selecciona características basándose en una prueba de tasa de falsos positivos.
SelectFdr: Selecciona las características basándose en una tasa de falsos descubrimientos estimada.
SelectFwe: Selecciona las características en función de la tasa de error por familias.
GenericUnivariateSelect: Selector de características univariante con modo configurable.

Notas

Los vínculos entre características con puntuaciones iguales se romperán de forma no especificada.

Ejemplos

>>> from sklearn.datasets import load_digits
>>> from sklearn.feature_selection import SelectPercentile, chi2
>>> X, y = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> X_new = SelectPercentile(chi2, percentile=10).fit_transform(X, y)
>>> X_new.shape
(1797, 7)

Métodos

`fit`	Ejecutar la función de puntuación en (X, y) y obtener las características adecuadas.
`fit_transform`	Ajustar a los datos y luego transformarlos.
`get_params`	Obtiene los parámetros de este estimador.
`get_support`	Obtiene una máscara, o índice entero, de las características seleccionadas
`inverse_transform`	Revierte la operación de transformación
`set_params`	Establece los parámetros de este estimador.
`transform`	Reduce X a las características seleccionadas.

fit()¶

Ejecutar la función de puntuación en (X, y) y obtener las características adecuadas.

Parámetros

Xarray-like de forma (n_samples, n_features): Las muestras de entrada de entrenamiento.
yarray-like de forma (n_samples,): Los valores objetivo (etiquetas de clase en clasificación, números reales en regresión).

Devuelve

selfobjeto

fit_transform()¶

Ajustar a los datos y luego transformarlos.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros

Xarray-like de forma (n_samples, n_features): Muestras de entrada.
yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None: Valores objetivo (None para transformaciones no supervisadas).
**fit_paramsdict: Parámetros de ajuste adicionales.

Devuelve

X_newarreglo ndarray de forma (n_samples, n_features_new): Arreglo transformado.

get_params()¶

Obtiene los parámetros de este estimador.

Parámetros

deepbooleano, default=True: Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.

Devuelve

paramsdict: Los nombres de los parámetros se asignan a sus valores.

get_support()¶

Obtiene una máscara, o índice entero, de las características seleccionadas

Parámetros

indicesbooleano, default=False: Si es True, el valor de retorno será un arreglo de enteros, en lugar de una máscara booleana.

Devuelve

supportarreglo: Un índice que selecciona las características retenidas de un vector de características. Si indices es False, se trata de un arreglo booleana de forma [# características de entrada], en la que un elemento es True si su característica correspondiente es seleccionada para ser retenida. Si indices es True, se trata de un arreglo de enteros de forma [# características de salida] cuyos valores son índices en el vector de características de entrada.

inverse_transform()¶

Revierte la operación de transformación

Parámetros

Xarreglo de forma [n_samples, n_selected_features]: Las muestras de entrada.

Devuelve

X_rarreglo de forma [n_samples, n_original_features]: X` con columnas de ceros insertadas donde las características habrían sido eliminadas por transform.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como con objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma ``<component>__<parameter>` para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia del estimador: Instancia del estimador.

transform()¶

Reduce X a las características seleccionadas.

Parámetros

Xarreglo de forma [n_samples, n_features]: Las muestras de entrada.

Devuelve

X_rarreglo de forma [n_samples, n_selected_features]: Las muestras de entrada solo con las características seleccionadas.

Ejemplos usando `sklearn.feature_selection.SelectPercentile`¶

sklearn.feature_selection.SelectPercentile¶

Ejemplos usando sklearn.feature_selection.SelectPercentile¶

`sklearn.feature_selection`.SelectPercentile¶

Ejemplos usando `sklearn.feature_selection.SelectPercentile`¶