sklearn.compose.make_column_selector

sklearn.compose.make_column_selector()

Crea un invocable para seleccionar columnas que se usarán con ColumnTransformer.

make_column_selector puede seleccionar columnas basadas en el tipo de datos o el nombre de las columnas con un regex. Cuando se utilizan varios criterios de selección, all los criterios deben coincidir para que una columna sea seleccionada.

Parámetros
patternstr, default=None

Se incluirán los nombres de las columnas que contengan este patrón regex. Si es None, la selección de la columna no será seleccionada en base al patrón.

dtype_includedtype de columna o lista de dtypes de columna, default=None

Una selección de dtypes a incluir. Para más detalles, ver pandas.DataFrame.select_dtypes.

dtype_excludedtype de columna o lista de dtypes de columna, default=None

Una selección de dtypes a excluir. Para más detalles, ver pandas.DataFrame.select_dtypes.

Devuelve
selectorcallable o invocable

Invocable para que la selección de columnas sea utilizada por un ColumnTransformer.

Ver también

ColumnTransformer

Clase que permite combinar las salidas de múltiples objetos transformadores utilizados en los subconjuntos de columnas de los datos en un único espacio de características.

Ejemplos

>>> from sklearn.preprocessing import StandardScaler, OneHotEncoder
>>> from sklearn.compose import make_column_transformer
>>> from sklearn.compose import make_column_selector
>>> import pandas as pd  
>>> X = pd.DataFrame({'city': ['London', 'London', 'Paris', 'Sallisaw'],
...                   'rating': [5, 3, 4, 5]})  
>>> ct = make_column_transformer(
...       (StandardScaler(),
...        make_column_selector(dtype_include=np.number)),  # rating
...       (OneHotEncoder(),
...        make_column_selector(dtype_include=object)))  # city
>>> ct.fit_transform(X)  
array([[ 0.90453403,  1.        ,  0.        ,  0.        ],
       [-1.50755672,  1.        ,  0.        ,  0.        ],
       [-0.30151134,  0.        ,  1.        ,  0.        ],
       [ 0.90453403,  0.        ,  0.        ,  1.        ]])

Ejemplos usando sklearn.compose.make_column_selector