sklearn.preprocessing
.Normalizer¶
- class sklearn.preprocessing.Normalizer¶
Normaliza las muestras individualmente a la norma unitaria.
Cada muestra (es decir, cada fila de la matriz de datos) con al menos un componente distinto de cero se reescala independientemente de las demás muestras para que su norma (l1, l2 o inf) sea igual a uno.
Este transformador es capaz de trabajar tanto con arreglos numpy densos como con matrices scipy.sparse (usa el formato CSR si quieres evitar la carga de una copia / conversión).
El escalamiento de las entradas a normas unitarias es una operación común para la clasificación de textos o el análisis de conglomerados, por ejemplo. Por ejemplo, el producto punto de dos vectores TF-IDF normalizados en l2 es la similitud coseno de los vectores y es la métrica de similitud base para el modelo de espacio vectorial que se utiliza habitualmente en la comunidad de Recuperación de Información.
Lee más en el Manual de usuario.
- Parámetros
- norm{“l1”, “l2”, “max”}, default=”l2”
La norma a utilizar para normalizar cada muestra distinta de cero. Si se utiliza norm=”max”, los valores se reescalarán por el máximo de los valores absolutos.
- copybool, default=True
establécelo en False para realizar la normalización de filas in place y evitar una copia (si la entrada ya es un arreglo numpy o una matriz scipy.sparse CSR).
Ver también
normalize
Función equivalente sin la API del estimador.
Notas
Este estimador no tiene estado (además de los parámetros del constructor), el método de ajuste no hace nada, pero es útil cuando se utiliza en un pipeline.
Para una comparación de los diferentes escaladores, transformadores y normalizadores, consulta examples/preprocessing/plot_all_scaling.py.
Ejemplos
>>> from sklearn.preprocessing import Normalizer >>> X = [[4, 1, 2, 2], ... [1, 3, 9, 3], ... [5, 7, 5, 1]] >>> transformer = Normalizer().fit(X) # fit does nothing. >>> transformer Normalizer() >>> transformer.transform(X) array([[0.8, 0.2, 0.4, 0.4], [0.1, 0.3, 0.9, 0.3], [0.5, 0.7, 0.5, 0.1]])
Métodos
No hace nada y devuelve el estimador sin cambios
Ajusta a los datos y luego los transforma.
Obtiene los parámetros para este estimador.
Establece los parámetros de este estimador.
Escala cada fila distinta de cero de X a la norma unitaria
- fit()¶
No hace nada y devuelve el estimador sin cambios
Este método sólo está ahí para implementar la API habitual y, por lo tanto, para trabajar en pipelines.
- Parámetros
- X{array-like, sparse matrix} de forma (n_samples, n_features)
Los datos para estimar los parámetros de normalización.
- yNone
Ignorado.
- Devuelve
- selfobject
Transformador ajustado.
- fit_transform()¶
Ajusta a los datos y luego los transforma.
Ajusta el transformador a
X
ey
con los parámetros opcionalesfit_params
y devuelve una versión transformada deX
.- Parámetros
- Xarray-like de forma (n_samples, n_features)
Muestras de entrada.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None
Valores objetivo (None para transformaciones no supervisadas).
- **fit_paramsdict
Parámetros de ajuste adicionales.
- Devuelve
- X_newarreglo ndarray de forma (n_samples, n_features_new)
Arreglo transformado.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Los nombres de los parámetros mapeados a sus valores.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia de estimador
Instancia del estimador.
- transform()¶
Escala cada fila distinta de cero de X a la norma unitaria
- Parámetros
- X{array-like, sparse matrix} de forma (n_samples, n_features)
Los datos a normalizar, fila por fila. Las matrices scipy.sparse deben estar en formato CSR para evitar una copia innecesaria.
- copybool, default=None
Copia la entrada X o no.
- Devuelve
- X_tr{ndarray, sparse matrix} de forma (n_samples, n_features)
Arreglo transformado.