sklearn.datasets
.load_wine¶
- sklearn.datasets.load_wine()¶
Carga y devuelve el conjunto de datos de vino (clasificación).
Nuevo en la versión 0.18.
El conjunto de datos de vino es un conjunto de datos de clasificación multiclase clásico y muy sencillo.
Clases
3
Muestras por clase
[59,71,48]
Total de muestras
178
Dimensionalidad
13
Características
reales, positivos
Leer más en el Manual de Usuario.
- Parámetros
- return_X_ybool, default=False
Si es True, devuelve
(data, target)
en lugar de un objeto Bunch. Ver más abajo para más información sobre los objetosdata
ytarget
.- as_framebool, default=False
Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes apropiados (numéricos). El objetivo es un DataFrame o una Serie de pandas, dependiendo del número de columnas del objetivo. Si
return_X_y
es True, entonces (data
,target
) serán DataFrames o Series de Pandas como se describe más adelante.Nuevo en la versión 0.23.
- Devuelve
- data
Bunch
Objeto dictionary-like, con los siguientes atributos.
- data{ndarray, dataframe} de forma (178, 13)
La matriz de datos. Si
as_frame=True
,data
será un DataFrame de pandas.- target: {ndarray, Series} de forma (178,)
El objetivo de la clasificación. Si
as_frame=True
,target
será una Serie de pandas.- feature_names: list
Los nombres de las columnas del conjunto de datos.
- target_names: list
Los nombres de las clases objetivo.
- frame: DataFrame de forma (178, 14)
Sólo está presente cuando
as_frame=True
. DataFrame condata
ytarget
.Nuevo en la versión 0.23.
- DESCR: str
La descripción completa del conjunto de datos.
- (data, target) : tuple si
return_X_y
es Truetuple si - La copia del conjunto de datos de UCI ML Wine se descarga y se modifica para que se ajuste
- formato estándar de:
- https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data
- data
Ejemplos
Supongamos que estás interesado en las muestras 10, 80 y 140, y quieres saber su nombre de clase.
>>> from sklearn.datasets import load_wine >>> data = load_wine() >>> data.target[[10, 80, 140]] array([0, 1, 2]) >>> list(data.target_names) ['class_0', 'class_1', 'class_2']