sklearn.datasets.load_iris

sklearn.datasets.load_iris()

Carga y devuelve el conjunto de datos del iris (clasificación).

El conjunto de datos del iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo.

Clases

3

Muestras por clase

50

Total de muestras

150

Dimensionalidad

4

Características

reales, positivos

Leer más en el Manual de Usuario.

Parámetros
return_X_ybool, default=False

Si es True, devuelve (data, target) en lugar de un objeto Bunch. Ver más abajo para más información sobre los objetos data y target.

Nuevo en la versión 0.18.

as_framebool, default=False

Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes apropiados (numéricos). El objetivo es un DataFrame o una Serie de pandas, dependiendo del número de columnas del objetivo. Si return_X_y es True, entonces (data, target) serán DataFrames o Series de Pandas como se describe más adelante.

Nuevo en la versión 0.23.

Devuelve
dataBunch

Objeto tipo dictionario, con los siguientes atributos.

data{ndarray, dataframe} de forma (150, 4)

La matriz de datos. Si as_frame=True, data será un DataFrame de pandas.

target: {ndarray, Series} de forma (150,)

El objetivo de la clasificación. Si as_frame=True, target será una Serie de pandas.

feature_names: list

Los nombres de las columnas del conjunto de datos.

target_names: list

Los nombres de las clases objetivo.

frame: DataFrame de forma (150, 5)

Sólo está presente cuando as_frame=True. DataFrame con data y target.

Nuevo en la versión 0.23.

DESCR: str

La descripción completa del conjunto de datos.

filename: str

La ruta de acceso a la ubicación de los datos.

Nuevo en la versión 0.20.

(data, target) : tuple si return_X_y es Truetuple si

Nuevo en la versión 0.18.

Notas

Distinto en la versión 0.20: Se corrigieron dos puntos de datos erróneos según el documento de Fisher. La nueva versión es la misma que en R, pero no como en el Repositorio de Aprendizaje Automático de UCI.

Ejemplos

Supongamos que estás interesado en las muestras 10, 25 y 50, y quieres saber su nombre de clase.

>>> from sklearn.datasets import load_iris
>>> data = load_iris()
>>> data.target[[10, 25, 50]]
array([0, 0, 1])
>>> list(data.target_names)
['setosa', 'versicolor', 'virginica']

Ejemplos usando sklearn.datasets.load_iris