sklearn.datasets.load_iris¶
- sklearn.datasets.load_iris()¶
Carga y devuelve el conjunto de datos del iris (clasificación).
El conjunto de datos del iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo.
Clases
3
Muestras por clase
50
Total de muestras
150
Dimensionalidad
4
Características
reales, positivos
Leer más en el Manual de Usuario.
- Parámetros
- return_X_ybool, default=False
Si es True, devuelve
(data, target)en lugar de un objeto Bunch. Ver más abajo para más información sobre los objetosdataytarget.Nuevo en la versión 0.18.
- as_framebool, default=False
Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes apropiados (numéricos). El objetivo es un DataFrame o una Serie de pandas, dependiendo del número de columnas del objetivo. Si
return_X_yes True, entonces (data,target) serán DataFrames o Series de Pandas como se describe más adelante.Nuevo en la versión 0.23.
- Devuelve
- data
Bunch Objeto tipo dictionario, con los siguientes atributos.
- data{ndarray, dataframe} de forma (150, 4)
La matriz de datos. Si
as_frame=True,dataserá un DataFrame de pandas.- target: {ndarray, Series} de forma (150,)
El objetivo de la clasificación. Si
as_frame=True,targetserá una Serie de pandas.- feature_names: list
Los nombres de las columnas del conjunto de datos.
- target_names: list
Los nombres de las clases objetivo.
- frame: DataFrame de forma (150, 5)
Sólo está presente cuando
as_frame=True. DataFrame condataytarget.Nuevo en la versión 0.23.
- DESCR: str
La descripción completa del conjunto de datos.
- filename: str
La ruta de acceso a la ubicación de los datos.
Nuevo en la versión 0.20.
- (data, target) : tuple si
return_X_yes Truetuple si Nuevo en la versión 0.18.
- data
Notas
Distinto en la versión 0.20: Se corrigieron dos puntos de datos erróneos según el documento de Fisher. La nueva versión es la misma que en R, pero no como en el Repositorio de Aprendizaje Automático de UCI.
Ejemplos
Supongamos que estás interesado en las muestras 10, 25 y 50, y quieres saber su nombre de clase.
>>> from sklearn.datasets import load_iris >>> data = load_iris() >>> data.target[[10, 25, 50]] array([0, 0, 1]) >>> list(data.target_names) ['setosa', 'versicolor', 'virginica']