`sklearn.utils.sparsefuncs`.incr_mean_variance_axis¶

sklearn.utils.sparsefuncs.incr_mean_variance_axis()¶

Calcula la media y la varianza incremental a lo largo de un eje en una matriz CSR o CSC.

last_mean, last_var son los estadísticos calculados en el último paso por esta función. Ambos deben ser inicializados en 0-arreglos del tamaño adecuado es decir, el número de características en X. last_n es el número de muestras encontradas hasta ahora.

Parámetros

XCSR o CSC matriz dispersa de forma (n_samples, n_features): Datos de entrada.
axis{0, 1}: Eje a lo largo del cual se debe calcular el eje.
last_meanndarray de forma (n_features,) o (n_samples,), dtype=floating: Arreglo de medias para actualizar con los nuevos datos X. Debe tener la forma (n_features,) si axis=0 o (n_samples,) si axis=1.
last_varndarray de forma (n_features,) o (n_samples,), dtype=floating: Arreglo de varianzas para actualizar con los nuevos datos X. Debe tener la forma (n_características,) si axis=0 o (n_samples,) si axis=1.
last_nfloat o ndarray de forma (n_features,) o (n_samples,), dtype=floating: Suma de las ponderaciones vistas hasta ahora, excluyendo los pesos actuales Si no es un número de punto flotante (float) debe ser de la forma (n_samples,) si axis=0 o (n_features,) si axis=1. Si es un número de punto flotante (float) corresponde a tener las mismas ponderaciones para todas las muestras (o características).
weightsndarray de forma (n_samples,) o (n_features,), default=None: Si axis se establece en 0 la forma es (n_samples,) o si axis se establece en 1 la forma es (n_features,). Si se establece como None, las muestras se ponderan por igual.

Nuevo en la versión 0.24.

Devuelve

meansndarray de forma (n_features,) o (n_samples,), dtype=floating

Medias actualizadas para cada característica si axis = 0 o para cada muestras si axis = 1.

variancesndarray de forma (n_features,) o (n_samples,), dtype=floating

Varianzas actualizadas para cada característica si axis = 0 o para cada muestras si axis = 1.

nndarray de forma (n_features,) o (n_samples,), dtype=integral

Número actualizado de muestras vistas por característica si axis=0 o el número de características vistas por muestra si axis=1.

Si las ponderaciones no son None, n es una suma de las ponderaciones de las muestras o características vistas en lugar del número real de muestras o características vistas.

Notas

Los NaN son ignorados en el algoritmo.

sklearn.utils.sparsefuncs.incr_mean_variance_axis¶

`sklearn.utils.sparsefuncs`.incr_mean_variance_axis¶