sklearn.datasets
.load_iris¶
- sklearn.datasets.load_iris()¶
Carga y devuelve el conjunto de datos del iris (clasificación).
El conjunto de datos del iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo.
Clases
3
Muestras por clase
50
Total de muestras
150
Dimensionalidad
4
Características
reales, positivos
Leer más en el Manual de Usuario.
- Parámetros
- return_X_ybool, default=False
Si es True, devuelve
(data, target)
en lugar de un objeto Bunch. Ver más abajo para más información sobre los objetosdata
ytarget
.Nuevo en la versión 0.18.
- as_framebool, default=False
Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes apropiados (numéricos). El objetivo es un DataFrame o una Serie de pandas, dependiendo del número de columnas del objetivo. Si
return_X_y
es True, entonces (data
,target
) serán DataFrames o Series de Pandas como se describe más adelante.Nuevo en la versión 0.23.
- Devuelve
- data
Bunch
Objeto tipo dictionario, con los siguientes atributos.
- data{ndarray, dataframe} de forma (150, 4)
La matriz de datos. Si
as_frame=True
,data
será un DataFrame de pandas.- target: {ndarray, Series} de forma (150,)
El objetivo de la clasificación. Si
as_frame=True
,target
será una Serie de pandas.- feature_names: list
Los nombres de las columnas del conjunto de datos.
- target_names: list
Los nombres de las clases objetivo.
- frame: DataFrame de forma (150, 5)
Sólo está presente cuando
as_frame=True
. DataFrame condata
ytarget
.Nuevo en la versión 0.23.
- DESCR: str
La descripción completa del conjunto de datos.
- filename: str
La ruta de acceso a la ubicación de los datos.
Nuevo en la versión 0.20.
- (data, target) : tuple si
return_X_y
es Truetuple si Nuevo en la versión 0.18.
- data
Notas
Distinto en la versión 0.20: Se corrigieron dos puntos de datos erróneos según el documento de Fisher. La nueva versión es la misma que en R, pero no como en el Repositorio de Aprendizaje Automático de UCI.
Ejemplos
Supongamos que estás interesado en las muestras 10, 25 y 50, y quieres saber su nombre de clase.
>>> from sklearn.datasets import load_iris >>> data = load_iris() >>> data.target[[10, 25, 50]] array([0, 0, 1]) >>> list(data.target_names) ['setosa', 'versicolor', 'virginica']