sklearn.kernel_approximation.SkewedChi2Sampler

class sklearn.kernel_approximation.SkewedChi2Sampler

Aproxima el mapa de características de un núcleo «chi-cuadrado sesgado» por la aproximación de Monte Carlo de su transformación Fourier.

Más información en el Manual de usuario.

Parámetros
sesgoflotante, default=1.0

parámetro «skewedness» del núcleo. Necesita ser validado cruzadamente.

n_componentsint, default=100

número de muestras de Monte Carlo por característica original. Igual a la dimensionalidad del espacio de características calculado.

random_stateentero, instancia de RandomState o None, default=None

Generador de números pseudo-aleatorios para controlar la generación de los ponderados aleatorios y el desplazamiento aleatorio al ajustar los datos de entrenamiento. Pasé un int para una salida reproducible a través de múltiples llamadas de función. Ver Glosario.

Atributos
random_weights_ndarray de forma (n_features, n_components)

Arreglo de peso, muestreado de una distribución hiperbólica secante, que se utilizará para transformar linealmente el log de los datos.

random_offset_ndarray de forma (n_features, n_components)

Término de sesgo, que sera añadido a los datos. Esta distribuido uniformemente entre 0 y 2*pi.

Ver también

AdditiveChi2Sampler

Un enfoque diferente para aproximar una variante aditiva del núcleo cuadrado de chi.

sklearn.metrics.pairwise.chi2_kernel

El núcleo chi cuadrado exacto.

Referencias

Ver «Random Fourier Approximations for Skewed Multiplicative Histogram Kernels» de Fuxin Li, Catalin Ionescu y Cristian Sminchisescu.

Ejemplos

>>> from sklearn.kernel_approximation import SkewedChi2Sampler
>>> from sklearn.linear_model import SGDClassifier
>>> X = [[0, 0], [1, 1], [1, 0], [0, 1]]
>>> y = [0, 0, 1, 1]
>>> chi2_feature = SkewedChi2Sampler(skewedness=.01,
...                                  n_components=10,
...                                  random_state=0)
>>> X_features = chi2_feature.fit_transform(X, y)
>>> clf = SGDClassifier(max_iter=10, tol=1e-3)
>>> clf.fit(X_features, y)
SGDClassifier(max_iter=10)
>>> clf.score(X_features, y)
1.0

Métodos

fit

Ajusta el modelo con X.

fit_transform

Lo ajusta a los datos, y después lo transforma.

get_params

Obtiene los parámetros para este estimador.

set_params

Establece los parámetros de este estimador.

transform

Aplica el mapa de características aproximado a X.

fit()

Ajusta el modelo con X.

Proyección aleatoria de muestras según n_features.

Parámetros
Xarray-like, forma (n_samples, n_features)

Datos de entrenamiento, donde n_samples es el número de muestras y n_features es el número de características.

Devuelve
selfobject

Devuelve el transformador.

fit_transform()

Lo ajusta a los datos, y después lo transforma.

Ajusta el transformador a X y y con los parámetros opcionales fit_params y devuelve una versión transformada de X.

Parámetros
Xarray-like de forma (n_samples, n_features)

Muestras de entrada.

yarray-like de forma (n_samples,) o (n_samples, n_outputs), default=None

Valores objetivo (None para transformaciones no supervisadas).

**fit_paramsdict

Parámetros de ajuste adicionales.

Devuelve
X_newarreglo ndarray de forma (n_samples, n_features_new)

Arreglo transformado.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbooleano, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter>` para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia de estimador

Instancia del estimador.

transform()

Aplica el mapa de características aproximado a X.

Parámetros
Xarray-like, forma (n_samples, n_features)

Nuevos datos, donde n_samples en el número de muestras y n_features es el número de características. Todos los valores de X deben ser estrictamente mayores que «-skewedness».

Devuelve
X_newarray-like, forma (n_samples, n_components)