sklearn.datasets.fetch_covtype

sklearn.datasets.fetch_covtype()

Cargue el conjunto de datos de covertype (clasificación).

Descargar si es necesario.

Clases

7

Total de muestras

581012

Dimensionalidad

54

Características

int

Lee más en el Manual de usuario.

Parámetros
data_homestr, default=None

Especifica otra carpeta de descarga y caché para los conjuntos de datos. Por defecto, todos los datos de scikit-learn se almacenan en las subcarpetas “~/scikit_learn_data”.

download_if_missingbool, default=True

Si es False, lanza un IOError si los datos no están disponibles localmente en lugar de intentar descargar los datos desde el sitio de origen.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios para barajar el conjunto de datos. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

shufflebool, default=False

Si se baraja el conjunto de datos.

return_X_ybool, default=False

Si es True, devuelve (data.data, data.target) en lugar de un objeto Bunch.

Nuevo en la versión 0.20.

as_framebool, default=False

Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes adecuados (numéricos). El objetivo es un DataFrame de pandas o una Serie, dependiendo del número de columnas del objetivo. Si retorno_X_y es True, entonces (data, target) serán Pandas DataFrames o Series como se describe a continuación.

Nuevo en la versión 0.24.

Devuelve
datasetBunch

Objeto tipo diccionario, con los siguientes atributos.

datosndarray de forma (581012, 54)

Cada fila corresponde a las 54 características del conjunto de datos.

objetivondarray de forma (581012,)

Cada valor corresponde a uno de los 7 tipos de cobertura forestal con valores que van de 1 a 7.

framedataframe de forma (581012, 53)

Sólo está presente cuando as_frame=True. Contiene data y target.

DESCRstr

Descripción del conjunto de datos del tipo de cobertura forestal.

feature_nameslista

Los nombres de las columnas del conjunto de datos.

target_names: list

Los nombres de las columnas de destino.

(data, target) : tupla si return_X_y es Truetupla si

Nuevo en la versión 0.20.

Ejemplos con sklearn.datasets.fetch_covtype