sklearn.preprocessing.MinMaxScaler

class sklearn.preprocessing.MinMaxScaler

Transforma las características escalando cada una de ellas a un rango determinado.

Este estimador escala y traduce cada característica individualmente de manera que se encuentre en el rango dado en el conjunto de entrenamiento, por ejemplo, entre cero y uno.

La transformación viene dada por:

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

donde min, max = feature_range.

Esta transformación se utiliza a menudo como alternativa al escalamiento de media cero y varianza unitaria.

Lee más en el Manual de usuario.

Parámetros
feature_rangetupla (min, max), default=(0, 1)

Rango deseado de datos transformados.

copybool, default=True

Establécelo en False para realizar la normalización de filas in place y evitar una copia (si la entrada ya es un arreglo numpy).

clip: bool, default=False

Establécelo en True para recortar los valores transformados de los datos retenidos en el feature range proporcionado.

Nuevo en la versión 0.24.

Atributos
min_ndarray de forma (n_features,)

Ajuste por característica para el mínimo. Equivalente a min - X.min(axis=0) * self.scale_

scale_ndarray de forma (n_features,)

Escalamiento relativo de los datos por característica. Equivalente a (max - min) / (X.max(axis=0) - X.min(axis=0))

Nuevo en la versión 0.17: Atributo scale_.

data_min_ndarray de forma (n_features,)

Por característica mínima vista en los datos

Nuevo en la versión 0.17: data_min_

data_max_ndarray de forma (n_features,)

Por característica máxima vista en los datos

Nuevo en la versión 0.17: data_max_

data_range_ndarray de forma (n_features,)

Por rango de características (data_max_ - data_min_) visto en los datos

Nuevo en la versión 0.17: data_range_

n_samples_seen_int

El número de muestras procesadas por el estimador. Se restablecerá en las nuevas invocaciones a fit, pero se incrementará a través de las invocaciones a partial_fit.

Ver también

minmax_scale

Función equivalente sin la API del estimador.

Notas

Los NaNs son tratados como valores faltantes: no se tienen en cuenta en el ajuste y se mantienen en la transformación.

Para una comparación de los diferentes escaladores, transformadores y normalizadores, consulta examples/preprocessing/plot_all_scaling.py.

Ejemplos

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler()
>>> print(scaler.fit(data))
MinMaxScaler()
>>> print(scaler.data_max_)
[ 1. 18.]
>>> print(scaler.transform(data))
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print(scaler.transform([[2, 2]]))
[[1.5 0. ]]

Métodos

fit

Calcula el mínimo y el máximo que se utilizará para el escalamiento posterior.

fit_transform

Ajusta a los datos y luego los transforma.

get_params

Obtiene los parámetros para este estimador.

inverse_transform

Deshace el escalamiento de X según feature_range.

partial_fit

Cálculo en línea de mínimos y máximos en X para su posterior escalamiento.

set_params

Establece los parámetros de este estimador.

transform

Características escaladas de X según feature_range.

fit()

Calcula el mínimo y el máximo que se utilizará para el escalamiento posterior.

Parámetros
Xarray-like de forma (n_samples, n_features)

Los datos utilizados para calcular el mínimo y el máximo por característica usados para el posterior escalamiento a lo largo del eje de las características.

yNone

Ignorado.

Devuelve
selfobject

Escalador ajustado.

fit_transform()

Ajusta a los datos y luego los transforma.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like de forma (n_samples, n_features)

Muestras de entrada.

yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None

Valores objetivo (None para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devuelve
X_newarreglo ndarray de forma (n_samples, n_features_new)

Arreglo transformado.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Los nombres de los parámetros mapeados a sus valores.

inverse_transform()

Deshace el escalamiento de X según feature_range.

Parámetros
Xarray-like de forma (n_samples, n_features)

Datos de entrada que serán transformados. No pueden ser dispersos.

Devuelve
Xtndarray de forma (n_samples, n_features)

Datos transformados.

partial_fit()

Cálculo en línea de mínimos y máximos en X para su posterior escalamiento.

Todo X se procesa como un único lote. Esto está pensado para casos en los que fit no es factible debido a un número muy grande de n_samples o porque X se lee de un flujo continuo.

Parámetros
Xarray-like de forma (n_samples, n_features)

Los datos utilizados para calcular la media y la desviación estándar que se usan para el posterior escalamiento a lo largo del eje de las características.

yNone

Ignorado.

Devuelve
selfobject

Escalador ajustado.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia de estimador

Instancia del estimador.

transform()

Características escaladas de X según feature_range.

Parámetros
Xarray-like de forma (n_samples, n_features)

Datos de entrada que serán transformados.

Devuelve
Xtndarray de forma (n_samples, n_features)

Datos transformados.

Ejemplos utilizando sklearn.preprocessing.MinMaxScaler