sklearn.impute
.MissingIndicator¶
- class sklearn.impute.MissingIndicator¶
Indicadores binarios para valores faltantes.
Ten en cuenta que este componente no debería usarse en una
Pipeline
vanilla formada por transformadores y un clasificador, sino que podría añadirse usando unaFeatureUnion
oColumnTransformer
.Más información en el Manual de usuario.
Nuevo en la versión 0.20.
- Parámetros
- missing_valuesint, float, string, np.nan or None, default=np.nan
El marcador de posición para los valores faltantes. Todas las ocurrencias de
missing_values
serán imputadas. Para los dataframes de pandas con dtypes enteros anulables con valores faltantes,missing_values
debe establecerse ennp.nan
, ya quepd.NA
se convertirá ennp.nan
.- features{“missing-only”, “all”}, default=”missing-only”
Si la máscara de imputación debe representar todas las características o un subconjunto de ellas.
Si es “missing-only” (por defecto), la máscara de imputación sólo representará las características que contengan valores faltantes durante el tiempo de ajuste.
Si es “all”, la máscara de imputación representará todas las características.
- sparsebool or “auto”, default=”auto”
Si el formato de la máscara de imputación debe ser disperso o denso.
Si “auto” (predeterminado), la máscara del imputador será del mismo tipo que la entrada.
Si es True, la máscara de imputación será una matriz dispersa.
Si es False, la máscara de imputación será un arreglo numpy.
- error_on_newbool, default=True
Si es True, transform dará un error cuando haya características con valores faltantes en transform que no tengan valores perdidos en fit. Esto es aplicable sólo cuando
features='missing-only'
.
- Atributos
- features_ndarray, forma (n_missing_features,) o (n_features,)
Los índices de características que se devolverán al llamar a
transform
. Se calculan durantefit
. Parafeatures='all'`, es a ``range(n_features)
.
Ejemplos
>>> import numpy as np >>> from sklearn.impute import MissingIndicator >>> X1 = np.array([[np.nan, 1, 3], ... [4, 0, np.nan], ... [8, 1, 0]]) >>> X2 = np.array([[5, 1, np.nan], ... [np.nan, 2, 3], ... [2, 4, 0]]) >>> indicator = MissingIndicator() >>> indicator.fit(X1) MissingIndicator() >>> X2_tr = indicator.transform(X2) >>> X2_tr array([[False, True], [ True, False], [False, False]])
Métodos
Ajustar el transformador en X.
Genera el indicador de valores faltantes para X.
Obtiene los parámetros para este estimador.
Establece los parámetros de este estimador.
Genera el indicador de valores faltantes para X.
- fit()¶
Ajustar el transformador en X.
- Parámetros
- X{array-like, sparse matrix}, forma (n_samples, n_features)
Datos de entrada, donde
n_samples
es el número de muestras yn_features
es el número de características.
- Devuelve
- selfobject
Devuelve a sí mismo.
- fit_transform()¶
Genera el indicador de valores faltantes para X.
- Parámetros
- X{array-like, sparse matrix}, forma (n_samples, n_features)
Los datos de entrada a completar.
- Devuelve
- Xt{ndarray or sparse matrix}, forma (n_samples, n_features) o (n_samples, n_features_with_missing)
El indicador de falta de datos de entrada. El tipo de datos de
Xt
será booleano.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de parámetros mapeados a sus valores.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia de estimador
Instancia del estimador.
- transform()¶
Genera el indicador de valores faltantes para X.
- Parámetros
- X{array-like, sparse matrix}, forma (n_samples, n_features)
Los datos de entrada a completar.
- Devuelve
- Xt{ndarray or sparse matrix}, forma (n_samples, n_features) o (n_samples, n_features_with_missing)
El indicador de falta de datos de entrada. El tipo de datos de
Xt
será booleano.