sklearn.datasets
.load_breast_cancer¶
- sklearn.datasets.load_breast_cancer()¶
Cargue y devuelva el conjunto de datos de cáncer de mama de Wisconsin (clasificación).
El conjunto de datos de cáncer de mama es un conjunto de datos de clasificación binaria clásico y muy sencillo.
Clases
2
Muestras por clase
212(M),357(B)
Total de muestras
569
Dimensionalidad
30
Características
real, positivo
Lee más en el Manual de usuario.
- Parámetros
- return_X_ybool, default=False
Si es True, devuelve
(data, target)
en lugar de un objeto Bunch. Véase más abajo para más información sobre los objetosdata
ytarget
.Nuevo en la versión 0.18.
- as_framebool, default=False
Si es True, los datos son un DataFrame de pandas que incluye columnas con los dtypes adecuados (numéricos). El objetivo es un DataFrame de pandas o una Serie, dependiendo del número de columnas del objetivo. Si
return_X_y
es True, entonces (data
,target
) serán DataFrames de Pandas o Series como se describe a continuación.Nuevo en la versión 0.23.
- Devuelve
- data
Bunch
Objeto tipo diccionario, con los siguientes atributos.
- datos{ndarray, dataframe} de forma (569, 30)
La matriz de datos. Si
as_frame=True
,data
será un DataFrame de pandas.- target: {ndarray, Series} de forma (569,)
El objetivo de la clasificación. Si
as_frame=True
,target
será una Serie pandas.- feature_names: lista
Los nombres de las columnas del conjunto de datos.
- target_names: lista
Los nombres de las clases objetivo.
- frame: DataFrame de forma (569, 31)
Sólo está presente cuando
as_frame=True
. DataFrame condata
ytarget
.Nuevo en la versión 0.23.
- DESCR: str
La descripción completa del conjunto de datos.
- nombre de archivo: str
La ruta de acceso a la ubicación de los datos.
Nuevo en la versión 0.20.
- (data, target) : tuple si
return_X_y
es Truetupla si Nuevo en la versión 0.18.
- La copia del conjunto de datos UCI ML Breast Cancer Wisconsin (Diagnostic) es
- descargado de:
- https://goo.gl/U2Uwz2
- data
Ejemplos
Supongamos que estás interesado en las muestras 10, 50 y 85, y quieres saber su nombre de clase.
>>> from sklearn.datasets import load_breast_cancer >>> data = load_breast_cancer() >>> data.target[[10, 50, 85]] array([0, 1, 0]) >>> list(data.target_names) ['malignant', 'benign']