sklearn.datasets
.fetch_covtype¶
- sklearn.datasets.fetch_covtype()¶
Cargue el conjunto de datos de covertype (clasificación).
Descargar si es necesario.
Clases
7
Total de muestras
581012
Dimensionalidad
54
Características
int
Lee más en el Manual de usuario.
- Parámetros
- data_homestr, default=None
Especifica otra carpeta de descarga y caché para los conjuntos de datos. Por defecto, todos los datos de scikit-learn se almacenan en las subcarpetas “~/scikit_learn_data”.
- download_if_missingbool, default=True
Si es False, lanza un IOError si los datos no están disponibles localmente en lugar de intentar descargar los datos desde el sitio de origen.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios para barajar el conjunto de datos. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.
- shufflebool, default=False
Si se baraja el conjunto de datos.
- return_X_ybool, default=False
Si es True, devuelve
(data.data, data.target)
en lugar de un objeto Bunch.Nuevo en la versión 0.20.
- as_framebool, default=False
Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes adecuados (numéricos). El objetivo es un DataFrame de pandas o una Serie, dependiendo del número de columnas del objetivo. Si
retorno_X_y
es True, entonces (data
,target
) serán Pandas DataFrames o Series como se describe a continuación.Nuevo en la versión 0.24.
- Devuelve
- dataset
Bunch
Objeto tipo diccionario, con los siguientes atributos.
- datosndarray de forma (581012, 54)
Cada fila corresponde a las 54 características del conjunto de datos.
- objetivondarray de forma (581012,)
Cada valor corresponde a uno de los 7 tipos de cobertura forestal con valores que van de 1 a 7.
- framedataframe de forma (581012, 53)
Sólo está presente cuando
as_frame=True
. Contienedata
ytarget
.- DESCRstr
Descripción del conjunto de datos del tipo de cobertura forestal.
- feature_nameslista
Los nombres de las columnas del conjunto de datos.
- target_names: list
Los nombres de las columnas de destino.
- (data, target) : tupla si
return_X_y
es Truetupla si Nuevo en la versión 0.20.
- dataset