sklearn.preprocessing.Normalizer

class sklearn.preprocessing.Normalizer

Normaliza las muestras individualmente a la norma unitaria.

Cada muestra (es decir, cada fila de la matriz de datos) con al menos un componente distinto de cero se reescala independientemente de las demás muestras para que su norma (l1, l2 o inf) sea igual a uno.

Este transformador es capaz de trabajar tanto con arreglos numpy densos como con matrices scipy.sparse (usa el formato CSR si quieres evitar la carga de una copia / conversión).

El escalamiento de las entradas a normas unitarias es una operación común para la clasificación de textos o el análisis de conglomerados, por ejemplo. Por ejemplo, el producto punto de dos vectores TF-IDF normalizados en l2 es la similitud coseno de los vectores y es la métrica de similitud base para el modelo de espacio vectorial que se utiliza habitualmente en la comunidad de Recuperación de Información.

Lee más en el Manual de usuario.

Parámetros
norm{“l1”, “l2”, “max”}, default=”l2”

La norma a utilizar para normalizar cada muestra distinta de cero. Si se utiliza norm=”max”, los valores se reescalarán por el máximo de los valores absolutos.

copybool, default=True

establécelo en False para realizar la normalización de filas in place y evitar una copia (si la entrada ya es un arreglo numpy o una matriz scipy.sparse CSR).

Ver también

normalize

Función equivalente sin la API del estimador.

Notas

Este estimador no tiene estado (además de los parámetros del constructor), el método de ajuste no hace nada, pero es útil cuando se utiliza en un pipeline.

Para una comparación de los diferentes escaladores, transformadores y normalizadores, consulta examples/preprocessing/plot_all_scaling.py.

Ejemplos

>>> from sklearn.preprocessing import Normalizer
>>> X = [[4, 1, 2, 2],
...      [1, 3, 9, 3],
...      [5, 7, 5, 1]]
>>> transformer = Normalizer().fit(X)  # fit does nothing.
>>> transformer
Normalizer()
>>> transformer.transform(X)
array([[0.8, 0.2, 0.4, 0.4],
       [0.1, 0.3, 0.9, 0.3],
       [0.5, 0.7, 0.5, 0.1]])

Métodos

fit

No hace nada y devuelve el estimador sin cambios

fit_transform

Ajusta a los datos y luego los transforma.

get_params

Obtiene los parámetros para este estimador.

set_params

Establece los parámetros de este estimador.

transform

Escala cada fila distinta de cero de X a la norma unitaria

fit()

No hace nada y devuelve el estimador sin cambios

Este método sólo está ahí para implementar la API habitual y, por lo tanto, para trabajar en pipelines.

Parámetros
X{array-like, sparse matrix} de forma (n_samples, n_features)

Los datos para estimar los parámetros de normalización.

yNone

Ignorado.

Devuelve
selfobject

Transformador ajustado.

fit_transform()

Ajusta a los datos y luego los transforma.

Ajusta el transformador a X e y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like de forma (n_samples, n_features)

Muestras de entrada.

yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None

Valores objetivo (None para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devuelve
X_newarreglo ndarray de forma (n_samples, n_features_new)

Arreglo transformado.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Los nombres de los parámetros mapeados a sus valores.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia de estimador

Instancia del estimador.

transform()

Escala cada fila distinta de cero de X a la norma unitaria

Parámetros
X{array-like, sparse matrix} de forma (n_samples, n_features)

Los datos a normalizar, fila por fila. Las matrices scipy.sparse deben estar en formato CSR para evitar una copia innecesaria.

copybool, default=None

Copia la entrada X o no.

Devuelve
X_tr{ndarray, sparse matrix} de forma (n_samples, n_features)

Arreglo transformado.

Ejemplos utilizando sklearn.preprocessing.Normalizer