sklearn.datasets.fetch_species_distributions

sklearn.datasets.fetch_species_distributions()

Cargador para el conjunto de datos de distribución de especies de Phillips et. al. (2006)

Lee más en el Manual de usuario.

Parámetros
data_homestr, default=None

Especifica otra carpeta de descarga y caché para los conjuntos de datos. Por defecto, todos los datos de scikit-learn se almacenan en las subcarpetas “~/scikit_learn_data”.

download_if_missingbool, default=True

Si es False, lanza un IOError si los datos no están disponibles localmente en lugar de intentar descargar los datos desde el sitio de origen.

Devuelve
dataBunch

Objeto tipo diccionario, con los siguientes atributos.

coberturasarreglo, forma = [14, 1592, 1212]

Representan las 14 características medidas en cada punto de la cuadrícula del mapa. Los valores de latitud/longitud de la cuadrícula se analizan a continuación. Los datos que faltan se representan con el valor -9999.

entrenararreglo de registros, forma = (1624,)

Los puntos de entrenamiento de los datos. Cada punto tiene tres campos:

  • train[“species”] es el nombre de la especie

  • train[“dd long”] es la longitud, en grados

  • train[“dd lat”] es la latitud, en grados

pruebaarreglo de registros, forma = (620,)

Los puntos de prueba de los datos. El mismo formato que los datos de entrenamiento.

Nx, Nyenteros

El número de longitudes (x) y latitudes (y) de la cuadrícula

x_left_lower_corner, y_left_lower_cornerflotantes

La posición (x,y) de la esquina inferior izquierda, en grados

grid_sizefloat

El espacio entre puntos de la cuadrícula, en grados

Notas

Este conjunto de datos representa la distribución geográfica de las especies. El conjunto de datos es proporcionado por Phillips et. al. (2006).

Las dos especies son:

Referencias

Ejemplos con sklearn.datasets.fetch_species_distributions