sklearn.impute.MissingIndicator

class sklearn.impute.MissingIndicator

Indicadores binarios para valores faltantes.

Ten en cuenta que este componente no debería usarse en una Pipeline vanilla formada por transformadores y un clasificador, sino que podría añadirse usando una FeatureUnion o ColumnTransformer.

Más información en el Manual de usuario.

Nuevo en la versión 0.20.

Parámetros
missing_valuesint, float, string, np.nan or None, default=np.nan

El marcador de posición para los valores faltantes. Todas las ocurrencias de missing_values serán imputadas. Para los dataframes de pandas con dtypes enteros anulables con valores faltantes, missing_values debe establecerse en np.nan, ya que pd.NA se convertirá en np.nan.

features{“missing-only”, “all”}, default=”missing-only”

Si la máscara de imputación debe representar todas las características o un subconjunto de ellas.

  • Si es “missing-only” (por defecto), la máscara de imputación sólo representará las características que contengan valores faltantes durante el tiempo de ajuste.

  • Si es “all”, la máscara de imputación representará todas las características.

sparsebool or “auto”, default=”auto”

Si el formato de la máscara de imputación debe ser disperso o denso.

  • Si “auto” (predeterminado), la máscara del imputador será del mismo tipo que la entrada.

  • Si es True, la máscara de imputación será una matriz dispersa.

  • Si es False, la máscara de imputación será un arreglo numpy.

error_on_newbool, default=True

Si es True, transform dará un error cuando haya características con valores faltantes en transform que no tengan valores perdidos en fit. Esto es aplicable sólo cuando features='missing-only'.

Atributos
features_ndarray, forma (n_missing_features,) o (n_features,)

Los índices de características que se devolverán al llamar a transform. Se calculan durante fit. Para features='all'`, es a ``range(n_features).

Ejemplos

>>> import numpy as np
>>> from sklearn.impute import MissingIndicator
>>> X1 = np.array([[np.nan, 1, 3],
...                [4, 0, np.nan],
...                [8, 1, 0]])
>>> X2 = np.array([[5, 1, np.nan],
...                [np.nan, 2, 3],
...                [2, 4, 0]])
>>> indicator = MissingIndicator()
>>> indicator.fit(X1)
MissingIndicator()
>>> X2_tr = indicator.transform(X2)
>>> X2_tr
array([[False,  True],
       [ True, False],
       [False, False]])

Métodos

fit

Ajustar el transformador en X.

fit_transform

Genera el indicador de valores faltantes para X.

get_params

Obtiene los parámetros para este estimador.

set_params

Establece los parámetros de este estimador.

transform

Genera el indicador de valores faltantes para X.

fit()

Ajustar el transformador en X.

Parámetros
X{array-like, sparse matrix}, forma (n_samples, n_features)

Datos de entrada, donde n_samples es el número de muestras y n_features es el número de características.

Devuelve
selfobject

Devuelve a sí mismo.

fit_transform()

Genera el indicador de valores faltantes para X.

Parámetros
X{array-like, sparse matrix}, forma (n_samples, n_features)

Los datos de entrada a completar.

Devuelve
Xt{ndarray or sparse matrix}, forma (n_samples, n_features) o (n_samples, n_features_with_missing)

El indicador de falta de datos de entrada. El tipo de datos de Xt será booleano.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia de estimador

Instancia del estimador.

transform()

Genera el indicador de valores faltantes para X.

Parámetros
X{array-like, sparse matrix}, forma (n_samples, n_features)

Los datos de entrada a completar.

Devuelve
Xt{ndarray or sparse matrix}, forma (n_samples, n_features) o (n_samples, n_features_with_missing)

El indicador de falta de datos de entrada. El tipo de datos de Xt será booleano.