sklearn.datasets.load_breast_cancer

sklearn.datasets.load_breast_cancer()

Cargue y devuelva el conjunto de datos de cáncer de mama de Wisconsin (clasificación).

El conjunto de datos de cáncer de mama es un conjunto de datos de clasificación binaria clásico y muy sencillo.

Clases

2

Muestras por clase

212(M),357(B)

Total de muestras

569

Dimensionalidad

30

Características

real, positivo

Lee más en el Manual de usuario.

Parámetros
return_X_ybool, default=False

Si es True, devuelve (data, target) en lugar de un objeto Bunch. Véase más abajo para más información sobre los objetos data y target.

Nuevo en la versión 0.18.

as_framebool, default=False

Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes adecuados (numéricos). El objetivo es un DataFrame de pandas o una Serie, dependiendo del número de columnas del objetivo. Si return_X_y es True, entonces (data, target) serán DataFrames de Pandas o Series como se describe a continuación.

Nuevo en la versión 0.23.

Devuelve
dataBunch

Objeto tipo diccionario, con los siguientes atributos.

datos{ndarray, dataframe} de forma (569, 30)

La matriz de datos. Si as_frame=True, data será un DataFrame de pandas.

target: {ndarray, Series} de forma (569,)

El objetivo de la clasificación. Si as_frame=True, target será una Serie pandas.

feature_names: lista

Los nombres de las columnas del conjunto de datos.

target_names: lista

Los nombres de las clases objetivo.

frame: DataFrame de forma (569, 31)

Sólo está presente cuando as_frame=True. DataFrame con data y target.

Nuevo en la versión 0.23.

DESCR: str

La descripción completa del conjunto de datos.

nombre de archivo: str

La ruta de acceso a la ubicación de los datos.

Nuevo en la versión 0.20.

(data, target) : tuple si return_X_y es Truetupla si

Nuevo en la versión 0.18.

La copia del conjunto de datos UCI ML Breast Cancer Wisconsin (Diagnostic) es
descargado de:
https://goo.gl/U2Uwz2

Ejemplos

Supongamos que estás interesado en las muestras 10, 50 y 85, y quieres saber su nombre de clase.

>>> from sklearn.datasets import load_breast_cancer
>>> data = load_breast_cancer()
>>> data.target[[10, 50, 85]]
array([0, 1, 0])
>>> list(data.target_names)
['malignant', 'benign']

Ejemplos con sklearn.datasets.load_breast_cancer