`sklearn.impute`.MissingIndicator¶

class sklearn.impute.MissingIndicator¶

Indicadores binarios para valores faltantes.

Ten en cuenta que este componente no debería usarse en una Pipeline vanilla formada por transformadores y un clasificador, sino que podría añadirse usando una FeatureUnion o ColumnTransformer.

Más información en el Manual de usuario.

Nuevo en la versión 0.20.

Parámetros

missing_valuesint, float, string, np.nan or None, default=np.nan

El marcador de posición para los valores faltantes. Todas las ocurrencias de missing_values serán imputadas. Para los dataframes de pandas con dtypes enteros anulables con valores faltantes, missing_values debe establecerse en np.nan, ya que pd.NA se convertirá en np.nan.

features{“missing-only”, “all”}, default=”missing-only”

Si la máscara de imputación debe representar todas las características o un subconjunto de ellas.

Si es “missing-only” (por defecto), la máscara de imputación sólo representará las características que contengan valores faltantes durante el tiempo de ajuste.
Si es “all”, la máscara de imputación representará todas las características.

sparsebool or “auto”, default=”auto”

Si el formato de la máscara de imputación debe ser disperso o denso.

Si “auto” (predeterminado), la máscara del imputador será del mismo tipo que la entrada.
Si es True, la máscara de imputación será una matriz dispersa.
Si es False, la máscara de imputación será un arreglo numpy.

error_on_newbool, default=True

Si es True, transform dará un error cuando haya características con valores faltantes en transform que no tengan valores perdidos en fit. Esto es aplicable sólo cuando features='missing-only'.

Atributos

features_ndarray, forma (n_missing_features,) o (n_features,): Los índices de características que se devolverán al llamar a transform. Se calculan durante fit. Para features='all'`, es a ``range(n_features).

Ejemplos

>>> import numpy as np
>>> from sklearn.impute import MissingIndicator
>>> X1 = np.array([[np.nan, 1, 3],
...                [4, 0, np.nan],
...                [8, 1, 0]])
>>> X2 = np.array([[5, 1, np.nan],
...                [np.nan, 2, 3],
...                [2, 4, 0]])
>>> indicator = MissingIndicator()
>>> indicator.fit(X1)
MissingIndicator()
>>> X2_tr = indicator.transform(X2)
>>> X2_tr
array([[False,  True],
       [ True, False],
       [False, False]])

Métodos

`fit`	Ajustar el transformador en X.
`fit_transform`	Genera el indicador de valores faltantes para X.
`get_params`	Obtiene los parámetros para este estimador.
`set_params`	Establece los parámetros de este estimador.
`transform`	Genera el indicador de valores faltantes para X.

fit()¶

Ajustar el transformador en X.

Parámetros

X{array-like, sparse matrix}, forma (n_samples, n_features): Datos de entrada, donde n_samples es el número de muestras y n_features es el número de características.

Devuelve

selfobject: Devuelve a sí mismo.

fit_transform()¶

Genera el indicador de valores faltantes para X.

Parámetros

X{array-like, sparse matrix}, forma (n_samples, n_features): Los datos de entrada a completar.

Devuelve

Xt{ndarray or sparse matrix}, forma (n_samples, n_features) o (n_samples, n_features_with_missing): El indicador de falta de datos de entrada. El tipo de datos de Xt será booleano.

get_params()¶

Obtiene los parámetros para este estimador.

Parámetros

deepbool, default=True: Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve

paramsdict: Nombres de parámetros mapeados a sus valores.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia de estimador: Instancia del estimador.

transform()¶

Genera el indicador de valores faltantes para X.

Parámetros

X{array-like, sparse matrix}, forma (n_samples, n_features): Los datos de entrada a completar.

Devuelve

Xt{ndarray or sparse matrix}, forma (n_samples, n_features) o (n_samples, n_features_with_missing): El indicador de falta de datos de entrada. El tipo de datos de Xt será booleano.