sklearn.datasets
.fetch_lfw_people¶
- sklearn.datasets.fetch_lfw_people()¶
Carga el conjunto de datos de personas Labeled Faces in the Wild (LFW) (clasificación).
Descargar si es necesario.
Clases
5749
Total de muestras
13233
Dimensionalidad
5828
Características
real, entre 0 y 255
Lee más en el Manual de usuario.
- Parámetros
- data_homestr, default=None
Especifique otra carpeta de descarga y caché para los conjuntos de datos. Por defecto, todos los datos de scikit-learn se almacenan en las subcarpetas “~/scikit_learn_data”.
- funneledbool, default=True
Descargue y utilice la variante con embudo del conjunto de datos.
- resizefloat, default=0.5
Ratio utilizado para redimensionar la imagen de cada cara.
- min_faces_per_personint, default=None
El conjunto de datos extraído sólo retendrá las imágenes de personas que tengan al menos
min_faces_per_person
diferentes.- colorbool, default=False
Mantener los 3 canales RGB en lugar de promediarlos en un solo canal de nivel de gris. Si color es True la forma de los datos tiene una dimensión más que la forma con color = False.
- slice_tupla de cortes, por default=(slice(70, 195), slice(78, 172))
Proporcionar un corte 2D personalizada (altura, anchura) para extraer la parte “interesante” de los archivos jpeg y evitar el uso de la correlación estadística del fondo
- download_if_missingbool, default=True
Si es False, lanza un IOError si los datos no están disponibles localmente en lugar de intentar descargar los datos desde el sitio de origen.
- return_X_ybool, default=False
Si es True, devuelve
(dataset.data, dataset.target)
en lugar de un objeto Bunch. Véase más abajo para más información sobre el objetodataset.data
ydataset.target
.Nuevo en la versión 0.20.
- Devuelve
- dataset
Bunch
Objeto tipo diccionario, con los siguientes atributos.
- datosarreglo de numpy de forma (13233, 2914)
Cada fila corresponde a una imagen de la cara biselada de tamaño original 62 x 47 píxeles. Si se cambian los parámetros
slice_
o redimensionamiento, cambiará la forma de la salida.- imágenesarreglo de numpy de forma (13233, 62, 47)
Cada fila es una imagen facial que corresponde a una de las 5749 personas del conjunto de datos. Si se cambian los parámetros
slice_
o resize se cambiará la forma de la salida.- objetivoarreglo de numpy de forma (13233,)
Etiquetas asociadas a cada imagen facial. Estas etiquetas van de 0 a 5748 y corresponden a las identificaciones de las personas.
- DESCRcadena
Descripción del conjunto de datos Labeled Faces in the Wild (LFW).
- (data, target) : tupla si
return_X_y
es Truetupla si Nuevo en la versión 0.20.
- dataset