sklearn.preprocessing.maxabs_scale¶
- sklearn.preprocessing.maxabs_scale()¶
Escala cada característica al rango [-1, 1] sin romper la dispersión.
Este estimador escala cada característica individualmente de manera que el valor absoluto máximo de cada característica en el conjunto de entrenamiento sea 1.0.
Este escalador también se puede aplicar a matrices CSR o CSC dispersas.
- Parámetros
- X{array-like, sparse matrix} de forma (n_samples, n_features)
Los datos.
- axisint, default=0
eje utilizado para escalar a lo largo. Si es 0, escala independientemente cada característica, de lo contrario (si es 1) escala cada muestra.
- copybool, default=True
Establécelo en False para realizar el escalamiento in place y evitar una copia (si la entrada ya es un arreglo de numpy).
- Devuelve
- X_tr{ndarray, sparse matrix} de forma (n_samples, n_features)
Los datos transformados.
Advertencia
Riesgo de fuga de datos. No utilices
maxabs_scalea menos que sepas lo que estás haciendo. Un error común es aplicarlo a todos los datos antes de dividirlos en conjuntos de entrenamiento y prueba. Esto sesgará la evaluación del modelo porque la información se habrá filtrado del conjunto de prueba al conjunto de entrenamiento. En general, recomendamos utilizarMaxAbsScalerdentro de un Pipeline para evitar la mayoría de los riesgos de fuga de datos:pipe = make_pipeline(MaxAbsScaler(), LogisticRegression()).
Ver también
MaxAbsScalerRealiza el escalamiento al rango [-1, 1] utilizando la API Transformer (por ejemplo, como parte de un
Pipelinede preprocesamiento).
Notas
Los NaNs son tratados como valores faltantes: no se tienen en cuenta para calcular las estadísticas y se mantienen durante la transformación de los datos.
Para una comparación de los diferentes escaladores, transformadores y normalizadores, consulta examples/preprocessing/plot_all_scaling.py.