sklearn.compose.make_column_selector¶
- sklearn.compose.make_column_selector()¶
Crea un invocable para seleccionar columnas que se usarán con
ColumnTransformer.make_column_selectorpuede seleccionar columnas basadas en el tipo de datos o el nombre de las columnas con un regex. Cuando se utilizan varios criterios de selección, all los criterios deben coincidir para que una columna sea seleccionada.- Parámetros
- patternstr, default=None
Se incluirán los nombres de las columnas que contengan este patrón regex. Si es None, la selección de la columna no será seleccionada en base al patrón.
- dtype_includedtype de columna o lista de dtypes de columna, default=None
Una selección de dtypes a incluir. Para más detalles, ver
pandas.DataFrame.select_dtypes.- dtype_excludedtype de columna o lista de dtypes de columna, default=None
Una selección de dtypes a excluir. Para más detalles, ver
pandas.DataFrame.select_dtypes.
- Devuelve
- selectorcallable o invocable
Invocable para que la selección de columnas sea utilizada por un
ColumnTransformer.
Ver también
ColumnTransformerClase que permite combinar las salidas de múltiples objetos transformadores utilizados en los subconjuntos de columnas de los datos en un único espacio de características.
Ejemplos
>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder >>> from sklearn.compose import make_column_transformer >>> from sklearn.compose import make_column_selector >>> import pandas as pd >>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'], ... 'rating': [5, 3, 4, 5]}) >>> ct = make_column_transformer( ... (StandardScaler(), ... make_column_selector(dtype_include=np.number)), # rating ... (OneHotEncoder(), ... make_column_selector(dtype_include=object))) # city >>> ct.fit_transform(X) array([[ 0.90453403, 1. , 0. , 0. ], [-1.50755672, 1. , 0. , 0. ], [-0.30151134, 0. , 1. , 0. ], [ 0.90453403, 0. , 0. , 1. ]])