sklearn.utils.class_weight.compute_sample_weight

sklearn.utils.class_weight.compute_sample_weight()

Estima los pesos muestrales por clase para conjuntos de datos no balanceados.

Parámetros
class_weightdict, lista o dicts, «balanced», o None

Ponderaciones asociadas a las clases de la forma {class_label: weight}. Si no se da, se supone que todas las clases tienen una ponderación de uno. Para los problemas de salida múltiple, se puede proporcionar una lista de diccionarios en el mismo orden que las columnas de y.

Ten en cuenta que para multisalida (incluyendo multietiqueta) las ponderaciones deben ser definidas para cada clase de cada columna en su propio diccionario. Por ejemplo, para la clasificación múltiple de cuatro clases debe ser [{0: 1, 1: 1}, {0: 1, 1: 5}, {0: 1, 1: 1}, {0: 1, 1: 1}] en lugar de [{1:1}, {2:5}, {3:1}, {4:1}].

El modo «balanced» utiliza los valores de y para ajustar automáticamente las ponderaciones inversamente proporcionales a las frecuencias de clase en los datos de entrada como n_samples / (n_classes * np.bincount(y)).

Para la salida múltiple, las ponderaciones de cada columna de y se multiplicarán.

yarray-like de forma (n_samples,) o (n_samples, n_outputs)

Arreglo de etiquetas de clase originales por muestra.

indicesarray-like de forma (n_subsample,) default=None

Arreglo de índices que se utilizarán en una submuestra. Puede tener una longitud inferior a n_samples en el caso de una submuestra, o ser igual a n_samples en el caso de una submuestra bootstrap con índices repetidos. Si es None, el peso de la muestra se calculará sobre la muestra completa. Sólo se admite «equilibrado» para class_weight si se proporciona.

Devuelve
sample_weight_vectndarray de forma (n_samples,)

Arreglo con los pesos de la muestra aplicados a la y original.