sklearn.preprocessing.OrdinalEncoder¶
- class sklearn.preprocessing.OrdinalEncoder¶
Codifica las características categóricas como un arreglo de números enteros.
La entrada de este transformador debe ser un array-like de números enteros o cadenas, denotando los valores que toman las características categóricas (discretas). Las características se convierten en enteros ordinales. El resultado es una sola columna de enteros (de 0 a n_categories - 1) por característica.
Lee más en el Manual de usuario.
Nuevo en la versión 0.20.
- Parámetros
- categories“auto” o una lista de array-like, default=”auto”
Categorías (valores únicos) por característica:
“auto” : Determina las categorías automáticamente a partir de los datos de entrenamiento.
lista (list):
categories[i]contiene las categorías esperadas en la i-ésima columna. Las categorías pasadas no deben mezclar cadenas y valores numéricos, y deben ordenarse en caso de valores numéricos.
Las categorías utilizadas se encuentran en el atributo
categories_.- dtypetipo numérico, default np.float64
Tipo de salida (dtype) deseado.
- handle_unknown{“error”, “use_encoded_value”}, default=”error”
Cuando se establece en “error” se generará un error en caso de que una característica categórica desconocida esté presente durante la transformación. Cuando se establece en “use_encoded_value”, el valor codificado de categorías desconocidas se establecerá en el valor dado para el parámetro “unknown_value”. En
inverse_transform, una categoría desconocida se denotará como None.Nuevo en la versión 0.24.
- unknown_valueint o np.nan, default=None
Cuando el parámetro handle_unknown se establece en “use_encoded_value”, este parámetro es necesario y establecerá el valor codificado de las categorías desconocidas. Tiene que ser distinto de los valores utilizados para codificar cualquiera de las categorías en
fit. Si se establece en np.nan, el parámetrodtypedebe ser un dtype float (número de punto flotante).Nuevo en la versión 0.24.
- Atributos
- categories_lista de arreglos
Las categorías de cada característica determinadas durante
fit(en orden de las características en X y correspondientes con la salida detransform). Esto no incluye las categorías que no se vieron durantefit.
Ver también
OneHotEncoderRealiza una codificación one-hot de características categóricas.
LabelEncoderCodifica las etiquetas objetivo con valores entre 0 y
n_classes-1.
Ejemplos
Dado un conjunto de datos con dos características, dejamos que el codificador encuentre los valores únicos por característica y transforme los datos en una codificación ordinal.
>>> from sklearn.preprocessing import OrdinalEncoder >>> enc = OrdinalEncoder() >>> X = [['Male', 1], ['Female', 3], ['Female', 2]] >>> enc.fit(X) OrdinalEncoder() >>> enc.categories_ [array(['Female', 'Male'], dtype=object), array([1, 2, 3], dtype=object)] >>> enc.transform([['Female', 3], ['Male', 1]]) array([[0., 2.], [1., 0.]])
>>> enc.inverse_transform([[1, 0], [0, 1]]) array([['Male', 1], ['Female', 2]], dtype=object)
Métodos
Ajusta el OrdinalEncoder a X.
Ajusta a los datos y luego los transforma.
Obtiene los parámetros para este estimador.
Convierte los datos a la representación original.
Establece los parámetros de este estimador.
Transforma X en códigos ordinales.
- fit()¶
Ajusta el OrdinalEncoder a X.
- Parámetros
- Xarray-like, forma [n_samples, n_features]
Los datos para determinar las categorías de cada característica.
- yNone
Ignorado. Este parámetro sólo existe por compatibilidad con
Pipeline.
- Devuelve
- self
- fit_transform()¶
Ajusta a los datos y luego los transforma.
Ajusta el transformador a
Xeycon los parámetros opcionalesfit_paramsy devuelve una versión transformada deX.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Muestras de entrada.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None
Valores objetivo (None para transformaciones no supervisadas).
- **fit_paramsdict
Parámetros de ajuste adicionales.
- Devuelve
- X_newarreglo ndarray de forma (n_samples, n_features_new)
Arreglo transformado.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Los nombres de los parámetros mapeados a sus valores.
- inverse_transform()¶
Convierte los datos a la representación original.
- Parámetros
- Xarray-like o matriz dispersa, forma [n_samples, n_encoded_features]
Los datos transformados.
- Devuelve
- X_trarray-like, forma [n_samples, n_features]
Arreglo transformado inverso.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline). Estos últimos tienen parámetros de la forma<component>__<parameter>para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia del estimador.
- transform()¶
Transforma X en códigos ordinales.
- Parámetros
- Xarray-like, forma [n_samples, n_features]
Los datos a codificar.
- Devuelve
- X_outmatriz dispersa o un arreglo 2-d
Entrada transformada.