sklearn.datasets.fetch_lfw_people

sklearn.datasets.fetch_lfw_people()

Carga el conjunto de datos de personas Labeled Faces in the Wild (LFW) (clasificación).

Descargar si es necesario.

Clases

5749

Total de muestras

13233

Dimensionalidad

5828

Características

real, entre 0 y 255

Lee más en el Manual de usuario.

Parámetros
data_homestr, default=None

Especifique otra carpeta de descarga y caché para los conjuntos de datos. Por defecto, todos los datos de scikit-learn se almacenan en las subcarpetas “~/scikit_learn_data”.

funneledbool, default=True

Descargue y utilice la variante con embudo del conjunto de datos.

resizefloat, default=0.5

Ratio utilizado para redimensionar la imagen de cada cara.

min_faces_per_personint, default=None

El conjunto de datos extraído sólo retendrá las imágenes de personas que tengan al menos min_faces_per_person diferentes.

colorbool, default=False

Mantener los 3 canales RGB en lugar de promediarlos en un solo canal de nivel de gris. Si color es True la forma de los datos tiene una dimensión más que la forma con color = False.

slice_tupla de cortes, por default=(slice(70, 195), slice(78, 172))

Proporcionar un corte 2D personalizada (altura, anchura) para extraer la parte “interesante” de los archivos jpeg y evitar el uso de la correlación estadística del fondo

download_if_missingbool, default=True

Si es False, lanza un IOError si los datos no están disponibles localmente en lugar de intentar descargar los datos desde el sitio de origen.

return_X_ybool, default=False

Si es True, devuelve (dataset.data, dataset.target) en lugar de un objeto Bunch. Véase más abajo para más información sobre el objeto dataset.data y dataset.target.

Nuevo en la versión 0.20.

Devuelve
datasetBunch

Objeto tipo diccionario, con los siguientes atributos.

datosarreglo de numpy de forma (13233, 2914)

Cada fila corresponde a una imagen de la cara biselada de tamaño original 62 x 47 píxeles. Si se cambian los parámetros slice_ o redimensionamiento, cambiará la forma de la salida.

imágenesarreglo de numpy de forma (13233, 62, 47)

Cada fila es una imagen facial que corresponde a una de las 5749 personas del conjunto de datos. Si se cambian los parámetros slice_ o resize se cambiará la forma de la salida.

objetivoarreglo de numpy de forma (13233,)

Etiquetas asociadas a cada imagen facial. Estas etiquetas van de 0 a 5748 y corresponden a las identificaciones de las personas.

DESCRcadena

Descripción del conjunto de datos Labeled Faces in the Wild (LFW).

(data, target) : tupla si return_X_y es Truetupla si

Nuevo en la versión 0.20.

Ejemplos utilizando sklearn.datasets.fetch_lfw_people