sklearn.compose.make_column_transformer

sklearn.compose.make_column_transformer()

Construye un ColumnTransformer a partir de los transformadores dados.

Esto es una abreviatura para el constructor ColumnTransformer; no requiere, y no permite, nombrar a los transformadores. En su lugar, serán dados nombres automáticamente basados en sus tipos. Tampoco permite ponderar con transformer_weights.

Más información en el Manual de usuario.

Parámetros
*transformerstuples

Tuplas de la forma (transformer, columns) que especifican los objetos transformadores que se aplicarán a subconjuntos de los datos.

transformer{“drop”, “passthrough”} o estimador

El estimador debe soportar fit y transform. También se aceptan las cadenas especiales “drop” y “passthrough”, para indicar que se eliminen las columnas o que se pasen sin transformar, respectivamente.

columnsstr, array-like de cadena, int, array-like de int, slice, array-like de bool o invocable

Indexa los datos en su segundo eje. Los enteros se interpretan como columnas posicionales, mientras que las cadenas pueden hacer referencia a las columnas del DataFrame por su nombre. Se debe utilizar una cadena escalar o un int cuando transformer espera que X sea un array-like 1d (vector), de lo contrario se pasará un arreglo 2d al transformador. A un invocable se le pasan los datos de entrada X y puede devolver cualquiera de los anteriores. Para seleccionar varias columnas por nombre o tipo de datos, puede utilizar make_column_selector.

remainder{“drop”, “passthrough”} or estimator, default=”drop”

Por defecto, sólo las columnas especificadas en transformers son transformadas y combinadas en la salida, y las columnas no especificadas son descartadas. (por defecto 'drop'). Especificando remainder='passthrough', todas las columnas restantes que no fueron especificadas en transformers serán automáticamente pasadas. Este subconjunto de columnas se concatena con la salida de los transformadores. Al establecer que remainder sea un estimador, las columnas restantes no especificadas utilizarán el estimador remainder. El estimador debe soportar fit y transform.

sparse_thresholdfloat, default=0.3

Si la salida transformada consiste de una mezcla de datos dispersos y densos, serán apilados como una matriz dispersa si la densidad es menor que este valor. Utilice sparse_thershold=0 para siempre devolver densos. Cuando la salida trasnformada consiste de datos todos dispersos o todos densos, el resultado apilado sera disperso o denso, respectivamente, y esta palabra clave sera ignorada.

n_jobsint, default=None

Número de trabajos a ejecutar en paralelo. None significa 1 a menos que esté en un contexto joblib.parallel_backend. -1 significa utilizar todos los procesadores. Ver Glosario para más detalles.

verbosebool, default=False

Si es True, se mostrará el tiempo transcurrido durante el ajuste de cada transformador a medida que se vaya completando.

Devuelve
ctColumnTransformer

Ver también

ColumnTransformer

Clase que permite combinar las salidas de múltiples objetos transformadores utilizados en los subconjuntos de columnas de los datos en un único espacio de características.

Ejemplos

>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder
>>> from sklearn.compose import make_column_transformer
>>> make_column_transformer(
...     (StandardScaler(), ['numerical_column']),
...     (OneHotEncoder(), ['categorical_column']))
ColumnTransformer(transformers=[('standardscaler', StandardScaler(...),
                                 ['numerical_column']),
                                ('onehotencoder', OneHotEncoder(...),
                                 ['categorical_column'])])

Ejemplos usando sklearn.compose.make_column_transformer