sklearn.preprocessing.maxabs_scale

sklearn.preprocessing.maxabs_scale()

Escala cada característica al rango [-1, 1] sin romper la dispersión.

Este estimador escala cada característica individualmente de manera que el valor absoluto máximo de cada característica en el conjunto de entrenamiento sea 1.0.

Este escalador también se puede aplicar a matrices CSR o CSC dispersas.

Parámetros
X{array-like, sparse matrix} de forma (n_samples, n_features)

Los datos.

axisint, default=0

eje utilizado para escalar a lo largo. Si es 0, escala independientemente cada característica, de lo contrario (si es 1) escala cada muestra.

copybool, default=True

Establécelo en False para realizar el escalamiento in place y evitar una copia (si la entrada ya es un arreglo de numpy).

Devuelve
X_tr{ndarray, sparse matrix} de forma (n_samples, n_features)

Los datos transformados.

Advertencia

Riesgo de fuga de datos. No utilices maxabs_scale a menos que sepas lo que estás haciendo. Un error común es aplicarlo a todos los datos antes de dividirlos en conjuntos de entrenamiento y prueba. Esto sesgará la evaluación del modelo porque la información se habrá filtrado del conjunto de prueba al conjunto de entrenamiento. En general, recomendamos utilizar MaxAbsScaler dentro de un Pipeline para evitar la mayoría de los riesgos de fuga de datos: pipe = make_pipeline(MaxAbsScaler(), LogisticRegression()).

Ver también

MaxAbsScaler

Realiza el escalamiento al rango [-1, 1] utilizando la API Transformer (por ejemplo, como parte de un Pipeline de preprocesamiento).

Notas

Los NaNs son tratados como valores faltantes: no se tienen en cuenta para calcular las estadísticas y se mantienen durante la transformación de los datos.

Para una comparación de los diferentes escaladores, transformadores y normalizadores, consulta examples/preprocessing/plot_all_scaling.py.