sklearn.preprocessing
.MinMaxScaler¶
- class sklearn.preprocessing.MinMaxScaler¶
Transforma las características escalando cada una de ellas a un rango determinado.
Este estimador escala y traduce cada característica individualmente de manera que se encuentre en el rango dado en el conjunto de entrenamiento, por ejemplo, entre cero y uno.
La transformación viene dada por:
X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0)) X_scaled = X_std * (max - min) + min
donde min, max = feature_range.
Esta transformación se utiliza a menudo como alternativa al escalamiento de media cero y varianza unitaria.
Lee más en el Manual de usuario.
- Parámetros
- feature_rangetupla (min, max), default=(0, 1)
Rango deseado de datos transformados.
- copybool, default=True
Establécelo en False para realizar la normalización de filas in place y evitar una copia (si la entrada ya es un arreglo numpy).
- clip: bool, default=False
Establécelo en True para recortar los valores transformados de los datos retenidos en el
feature range
proporcionado.Nuevo en la versión 0.24.
- Atributos
- min_ndarray de forma (n_features,)
Ajuste por característica para el mínimo. Equivalente a
min - X.min(axis=0) * self.scale_
- scale_ndarray de forma (n_features,)
Escalamiento relativo de los datos por característica. Equivalente a
(max - min) / (X.max(axis=0) - X.min(axis=0))
Nuevo en la versión 0.17: Atributo scale_.
- data_min_ndarray de forma (n_features,)
Por característica mínima vista en los datos
Nuevo en la versión 0.17: data_min_
- data_max_ndarray de forma (n_features,)
Por característica máxima vista en los datos
Nuevo en la versión 0.17: data_max_
- data_range_ndarray de forma (n_features,)
Por rango de características
(data_max_ - data_min_)
visto en los datosNuevo en la versión 0.17: data_range_
- n_samples_seen_int
El número de muestras procesadas por el estimador. Se restablecerá en las nuevas invocaciones a fit, pero se incrementará a través de las invocaciones a
partial_fit
.
Ver también
minmax_scale
Función equivalente sin la API del estimador.
Notas
Los NaNs son tratados como valores faltantes: no se tienen en cuenta en el ajuste y se mantienen en la transformación.
Para una comparación de los diferentes escaladores, transformadores y normalizadores, consulta examples/preprocessing/plot_all_scaling.py.
Ejemplos
>>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler() >>> print(scaler.fit(data)) MinMaxScaler() >>> print(scaler.data_max_) [ 1. 18.] >>> print(scaler.transform(data)) [[0. 0. ] [0.25 0.25] [0.5 0.5 ] [1. 1. ]] >>> print(scaler.transform([[2, 2]])) [[1.5 0. ]]
Métodos
Calcula el mínimo y el máximo que se utilizará para el escalamiento posterior.
Ajusta a los datos y luego los transforma.
Obtiene los parámetros para este estimador.
Deshace el escalamiento de X según feature_range.
Cálculo en línea de mínimos y máximos en X para su posterior escalamiento.
Establece los parámetros de este estimador.
Características escaladas de X según feature_range.
- fit()¶
Calcula el mínimo y el máximo que se utilizará para el escalamiento posterior.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Los datos utilizados para calcular el mínimo y el máximo por característica usados para el posterior escalamiento a lo largo del eje de las características.
- yNone
Ignorado.
- Devuelve
- selfobject
Escalador ajustado.
- fit_transform()¶
Ajusta a los datos y luego los transforma.
Ajusta el transformador a
X
ey
con los parámetros opcionalesfit_params
y devuelve una versión transformada deX
.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Muestras de entrada.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None
Valores objetivo (None para transformaciones no supervisadas).
- **fit_paramsdict
Parámetros de ajuste adicionales.
- Devuelve
- X_newarreglo ndarray de forma (n_samples, n_features_new)
Arreglo transformado.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Los nombres de los parámetros mapeados a sus valores.
- inverse_transform()¶
Deshace el escalamiento de X según feature_range.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos de entrada que serán transformados. No pueden ser dispersos.
- Devuelve
- Xtndarray de forma (n_samples, n_features)
Datos transformados.
- partial_fit()¶
Cálculo en línea de mínimos y máximos en X para su posterior escalamiento.
Todo X se procesa como un único lote. Esto está pensado para casos en los que
fit
no es factible debido a un número muy grande den_samples
o porque X se lee de un flujo continuo.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Los datos utilizados para calcular la media y la desviación estándar que se usan para el posterior escalamiento a lo largo del eje de las características.
- yNone
Ignorado.
- Devuelve
- selfobject
Escalador ajustado.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia de estimador
Instancia del estimador.
- transform()¶
Características escaladas de X según feature_range.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos de entrada que serán transformados.
- Devuelve
- Xtndarray de forma (n_samples, n_features)
Datos transformados.