sklearn.utils.class_weight
.compute_sample_weight¶
- sklearn.utils.class_weight.compute_sample_weight()¶
Estima los pesos muestrales por clase para conjuntos de datos no balanceados.
- Parámetros
- class_weightdict, lista o dicts, «balanced», o None
Ponderaciones asociadas a las clases de la forma
{class_label: weight}
. Si no se da, se supone que todas las clases tienen una ponderación de uno. Para los problemas de salida múltiple, se puede proporcionar una lista de diccionarios en el mismo orden que las columnas de y.Ten en cuenta que para multisalida (incluyendo multietiqueta) las ponderaciones deben ser definidas para cada clase de cada columna en su propio diccionario. Por ejemplo, para la clasificación múltiple de cuatro clases debe ser [{0: 1, 1: 1}, {0: 1, 1: 5}, {0: 1, 1: 1}, {0: 1, 1: 1}] en lugar de [{1:1}, {2:5}, {3:1}, {4:1}].
El modo «balanced» utiliza los valores de y para ajustar automáticamente las ponderaciones inversamente proporcionales a las frecuencias de clase en los datos de entrada como
n_samples / (n_classes * np.bincount(y))
.Para la salida múltiple, las ponderaciones de cada columna de y se multiplicarán.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs)
Arreglo de etiquetas de clase originales por muestra.
- indicesarray-like de forma (n_subsample,) default=None
Arreglo de índices que se utilizarán en una submuestra. Puede tener una longitud inferior a n_samples en el caso de una submuestra, o ser igual a n_samples en el caso de una submuestra bootstrap con índices repetidos. Si es None, el peso de la muestra se calculará sobre la muestra completa. Sólo se admite «equilibrado» para class_weight si se proporciona.
- Devuelve
- sample_weight_vectndarray de forma (n_samples,)
Arreglo con los pesos de la muestra aplicados a la y original.