sklearn.compose
.make_column_selector¶
- sklearn.compose.make_column_selector()¶
Crea un invocable para seleccionar columnas que se usarán con
ColumnTransformer
.make_column_selector
puede seleccionar columnas basadas en el tipo de datos o el nombre de las columnas con un regex. Cuando se utilizan varios criterios de selección, all los criterios deben coincidir para que una columna sea seleccionada.- Parámetros
- patternstr, default=None
Se incluirán los nombres de las columnas que contengan este patrón regex. Si es None, la selección de la columna no será seleccionada en base al patrón.
- dtype_includedtype de columna o lista de dtypes de columna, default=None
Una selección de dtypes a incluir. Para más detalles, ver
pandas.DataFrame.select_dtypes
.- dtype_excludedtype de columna o lista de dtypes de columna, default=None
Una selección de dtypes a excluir. Para más detalles, ver
pandas.DataFrame.select_dtypes
.
- Devuelve
- selectorcallable o invocable
Invocable para que la selección de columnas sea utilizada por un
ColumnTransformer
.
Ver también
ColumnTransformer
Clase que permite combinar las salidas de múltiples objetos transformadores utilizados en los subconjuntos de columnas de los datos en un único espacio de características.
Ejemplos
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> from sklearn.compose import make_column_selector >>> import pandas as pd >>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'], ... 'rating': [5, 3, 4, 5]}) >>> ct = make_column_transformer( ... (StandardScaler(), ... make_column_selector(dtype_include=np.number)), # rating ... (OneHotEncoder(), ... make_column_selector(dtype_include=object))) # city >>> ct.fit_transform(X) array([[ 0.90453403, 1. , 0. , 0. ], [-1.50755672, 1. , 0. , 0. ], [-0.30151134, 0. , 1. , 0. ], [ 0.90453403, 0. , 0. , 1. ]])