sklearn.datasets
.fetch_california_housing¶
- sklearn.datasets.fetch_california_housing()¶
Carga el conjunto de datos de vivienda de California (regresión).
Total de muestras
20640
Dimensionalidad
8
Características
real
Objetivo
real 0.15 - 5.
Más información en Manual de usuario.
- Parámetros
- data_homestr, default=None
Especificar otra carpeta de descarga y caché para los conjuntos de datos. Por defecto, todos los datos de scikit-learn se almacenan en las subcarpetas “~/scikit_learn_data”.
- download_if_missingbool, default=True
Si es False, lanza un IOError si los datos no están disponibles localmente en lugar de intentar descargar los datos desde el sitio de origen.
- return_X_ybool, default=False.
Si es True, devuelve
(data.data, data.target)
en lugar de un objeto Bunch.Nuevo en la versión 0.20.
- as_framebool, default=False
Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes adecuados (numérico, cadena o categórico). El objetivo es un DataFrame de pandas o una Serie, dependiendo del número de columnas del objetivo.
Nuevo en la versión 0.23.
- Devuelve
- dataset
Bunch
Objeto tipo diccionario, con los siguientes atributos.
- datosndarray, forma (20640, 8)
Cada fila corresponde a los 8 valores de la característica en orden. Si
as_frame
es True,data
es un objeto pandas.- objetivoarreglo de numpy de forma (20640,)
Cada valor corresponde al valor medio de la vivienda en unidades de 100.000. Si
as_frame
es True,target
es un objeto pandas.- feature_nameslista de longitud 8
Conjunto de nombres de características ordenadas utilizadas en el conjunto de datos.
- DESCRcadena
Descripción del conjunto de datos de viviendas de California.
- framepandas DataFrame
Sólo está presente cuando
as_frame=True
. DataFrame condata
ytarget
.Nuevo en la versión 0.23.
- (data, target) : tuple si
return_X_y
es Truetupla si Nuevo en la versión 0.20.
- dataset
Notas
Este conjunto de datos consta de 20.640 muestras y 9 características.