sklearn.preprocessing
.maxabs_scale¶
- sklearn.preprocessing.maxabs_scale()¶
Escala cada característica al rango [-1, 1] sin romper la dispersión.
Este estimador escala cada característica individualmente de manera que el valor absoluto máximo de cada característica en el conjunto de entrenamiento sea 1.0.
Este escalador también se puede aplicar a matrices CSR o CSC dispersas.
- Parámetros
- X{array-like, sparse matrix} de forma (n_samples, n_features)
Los datos.
- axisint, default=0
eje utilizado para escalar a lo largo. Si es 0, escala independientemente cada característica, de lo contrario (si es 1) escala cada muestra.
- copybool, default=True
Establécelo en False para realizar el escalamiento in place y evitar una copia (si la entrada ya es un arreglo de numpy).
- Devuelve
- X_tr{ndarray, sparse matrix} de forma (n_samples, n_features)
Los datos transformados.
Advertencia
Riesgo de fuga de datos. No utilices
maxabs_scale
a menos que sepas lo que estás haciendo. Un error común es aplicarlo a todos los datos antes de dividirlos en conjuntos de entrenamiento y prueba. Esto sesgará la evaluación del modelo porque la información se habrá filtrado del conjunto de prueba al conjunto de entrenamiento. En general, recomendamos utilizarMaxAbsScaler
dentro de un Pipeline para evitar la mayoría de los riesgos de fuga de datos:pipe = make_pipeline(MaxAbsScaler(), LogisticRegression())
.
Ver también
MaxAbsScaler
Realiza el escalamiento al rango [-1, 1] utilizando la API Transformer (por ejemplo, como parte de un
Pipeline
de preprocesamiento).
Notas
Los NaNs son tratados como valores faltantes: no se tienen en cuenta para calcular las estadísticas y se mantienen durante la transformación de los datos.
Para una comparación de los diferentes escaladores, transformadores y normalizadores, consulta examples/preprocessing/plot_all_scaling.py.