sklearn.compose
.make_column_transformer¶
- sklearn.compose.make_column_transformer()¶
Construye un ColumnTransformer a partir de los transformadores dados.
Esto es una abreviatura para el constructor ColumnTransformer; no requiere, y no permite, nombrar a los transformadores. En su lugar, serán dados nombres automáticamente basados en sus tipos. Tampoco permite ponderar con
transformer_weights
.Más información en el Manual de usuario.
- Parámetros
- *transformerstuples
Tuplas de la forma (transformer, columns) que especifican los objetos transformadores que se aplicarán a subconjuntos de los datos.
- transformer{“drop”, “passthrough”} o estimador
El estimador debe soportar fit y transform. También se aceptan las cadenas especiales “drop” y “passthrough”, para indicar que se eliminen las columnas o que se pasen sin transformar, respectivamente.
- columnsstr, array-like de cadena, int, array-like de int, slice, array-like de bool o invocable
Indexa los datos en su segundo eje. Los enteros se interpretan como columnas posicionales, mientras que las cadenas pueden hacer referencia a las columnas del DataFrame por su nombre. Se debe utilizar una cadena escalar o un int cuando
transformer
espera que X sea un array-like 1d (vector), de lo contrario se pasará un arreglo 2d al transformador. A un invocable se le pasan los datos de entradaX
y puede devolver cualquiera de los anteriores. Para seleccionar varias columnas por nombre o tipo de datos, puede utilizarmake_column_selector
.
- remainder{“drop”, “passthrough”} or estimator, default=”drop”
Por defecto, sólo las columnas especificadas en
transformers
son transformadas y combinadas en la salida, y las columnas no especificadas son descartadas. (por defecto'drop'
). Especificandoremainder='passthrough'
, todas las columnas restantes que no fueron especificadas entransformers
serán automáticamente pasadas. Este subconjunto de columnas se concatena con la salida de los transformadores. Al establecer queremainder
sea un estimador, las columnas restantes no especificadas utilizarán el estimadorremainder
. El estimador debe soportar fit y transform.- sparse_thresholdfloat, default=0.3
Si la salida transformada consiste de una mezcla de datos dispersos y densos, serán apilados como una matriz dispersa si la densidad es menor que este valor. Utilice
sparse_thershold=0
para siempre devolver densos. Cuando la salida trasnformada consiste de datos todos dispersos o todos densos, el resultado apilado sera disperso o denso, respectivamente, y esta palabra clave sera ignorada.- n_jobsint, default=None
Número de trabajos a ejecutar en paralelo.
None
significa 1 a menos que esté en un contextojoblib.parallel_backend
.-1
significa utilizar todos los procesadores. Ver Glosario para más detalles.- verbosebool, default=False
Si es True, se mostrará el tiempo transcurrido durante el ajuste de cada transformador a medida que se vaya completando.
- Devuelve
- ctColumnTransformer
Ver también
ColumnTransformer
Clase que permite combinar las salidas de múltiples objetos transformadores utilizados en los subconjuntos de columnas de los datos en un único espacio de características.
Ejemplos
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> make_column_transformer( ... (StandardScaler(), ['numerical_column']), ... (OneHotEncoder(), ['categorical_column'])) ColumnTransformer(transformers=[('standardscaler', StandardScaler(...), ['numerical_column']), ('onehotencoder', OneHotEncoder(...), ['categorical_column'])])