sklearn.svm.OneClassSVM

class sklearn.svm.OneClassSVM

Detección de Valor Atípicos Sin Supervisión.

Estima el soporte de una distribución de alta dimensión.

La implementación se basa en libsvm.

Más información en el Manual de usuario.

Parámetros
kernel{“linear”, “poly”, “rbf”, “sigmoid”, “precomputed”}, default=”rbf”

Especifica el tipo de núcleo a ser usado en el algoritmo. Debe ser uno de “linear”, “poly”, “rby”, “sigmoid”, “precomputed” o un invocable. Si no se da ninguna, se utilizará “rbf”. Si un invocable es dado se utilizara para precalcular la matriz del núcleo.

degreeentero, default=3

Grado de la función de núcleo polinómico (“poly”). Ignorado por todos los otros núcleos.

gamma{“scale”, “auto”} o flotanto, default=”scale”

Coeficiente de núcleo para “rbf”, “poly” y “sigmoid”.

  • si se pasa gamma='scale' (valor predeterminado), entonces se usa 1 / (n_features * X.var()) como valor de gamma,

  • si es “auto”, utiliza 1 / n_features.

Distinto en la versión 0.22: El valor predeterminado de gamma cambió de “auto” a “scale”.

coef0flotante, default=0.0

Término independiente en la función del núcleo. Sólo es significativo en “poly” y “sigmoid”.

tolflotante, default=1e-3

Tolerancia para el criterio de parada.

nuflotante, default=0.5

Límite superior en la fracción de errores de entrenamiento y un límite inferior de la fracción de vectores de soporte. Debe estar en el intervalo (0, 1]. Por defecto se tomará 0.5.

shrinkingbooleano, default=True

Si se usa o no la heurística de reducción. Ver el Manual de usuario.

cache_sizeflotante, default=200

Específica el tamaño del caché del núcleo (en MB).

verbosebooleano, default=False

Activar salida detallada. Ten en cuenta que esta configuración toma ventaja de una configuración por proceso en el tiempo de ejecución en libsvm que, si está habilitada, puede no funcionar correctamente en un contexto multihilo.

max_iterentero, default=-1

Limite fuerte en iteraciones dentro del solucionador, o -1 para ningún límite.

Atributos
class_weight_arreglo de forma (n_classes,)

Multiplicadores del parámetro C para cada clase. Calculado basado en el parámetro class_weight.

coef_ndarray de forma (1, n_features)

Ponderaciones asignadas a las características (coeficientes en el problema primario). Esto solo está disponible en el caso de un kernel lineal.

coef_ es propiedad de solo lectura derivada de dual_coef_ y support_vectors_.

dual_coef_ndarray de forma (1, n_SV)

Coeficientes de los vectores de soporte en la función de decisión.

fit_status_entero

0 si se ajusta correctamente, 1 en caso contrario (producirá una advertencia)

intercept_ndarray de forma (1,)

Constantes en la función de decisión.

n_support_ndarray de forma (n_classes,), dtype=int32

Número de vectores de soporte para cada clase.

offset_de punto flotante (float)

Desplazamiento usado para definir la función de decisión de las puntuaciones crudas. Tenemos la relación: decision_function = score_samples - offset_. El desplazamiento es el opuesto de intercept_ y se provee para consistencia con otros algoritmos de detección de valores atípicos.

Nuevo en la versión 0.20.

shape_fit_tupla de int de la forma (n_dimensions_of_X,)

Dimensiones del arreglo del vector de entrenamiento X.

support_ndarray de forma (n_SV,)

Indices de vectores de apoyo.

support_vectors_ndarray de forma (n_SV, n_features)

Vectores de apoyo.

Ejemplos

>>> from sklearn.svm import OneClassSVM
>>> X = [[0], [0.44], [0.45], [0.46], [1]]
>>> clf = OneClassSVM(gamma='auto').fit(X)
>>> clf.predict(X)
array([-1,  1,  1,  1, -1])
>>> clf.score_samples(X)
array([1.7798..., 2.0547..., 2.0556..., 2.0561..., 1.7332...])

Métodos

decision_function

Distancia firmada al hiperplano separador.

fit

Detecta el límite suave del conjunto de muestras X.

fit_predict

Realiza el encaje en X y devuelve etiquetas para X.

get_params

Obtiene los parámetros para este estimador.

predict

Realiza la clasificación en las muestras en X.

score_samples

Función de puntuación cruda de las muestras.

set_params

Establece los parámetros de este estimador.

decision_function()

Distancia firmada al hiperplano separador.

La distancia firmada es positiva para un valor típico y negativo para un atípico.

Parámetros
Xarray-like de forma (n_samples_X, n_features)

La matriz de datos.

Devuelve
decndarray de forma (n_samples,)

Devuelve la función de decisión para las muestras.

fit()

Detecta el límite suave del conjunto de muestras X.

Parámetros
X{array-like, sparse matrix} de forma (n_samples, n_features)

Conjunto de muestras, donde n_samples es el número de muestras y n_features es el número de características.

sample_weightarray-like de forma (n_samples,) default=None

Ponderados por muestra. Reescalado de C por muestra. Los ponderados más altos obligan al clasificador a poner más énfasis en estos puntos.

yIgnorado

no se utiliza, está presente para la coherencia de la API por convención.

Devuelve
selfobjeto

Notas

Si X no es un arreglo contiguo ordenado en C, es copiada.

fit_predict()

Realiza el encaje en X y devuelve etiquetas para X.

Devuelve -1 para los valores atípicos y 1 para los valores típicos.

Parámetros
X{array-like, sparse matrix, dataframe} de forma (n_samples, n_features)
yIgnorado

No se utiliza, está presente para la coherencia de la API por convención.

Devuelve
yndarray de forma (n_samples,)

1 para los valores típicos, -1 para los valores atípicos.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbooleano, default=True

Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.

Devuelve
paramsdict

Los nombres de los parámetros asignados a sus valores.

predict()

Realiza la clasificación en las muestras en X.

Para un modelo de una clase, se devuelve +1 o -1.

Parámetros
X{array-like, sparse matrix} de forma (n_samples, n_features) o (n_samples_test, n_samples_train)

Para kernel=»precomputed», la forma esperada de X es (n_samples_test, n_samples_train).

Devuelve
y_predndarray de forma (n_samples,)

Etiquetas de clase para las muestras en X.

score_samples()

Función de puntuación cruda de las muestras.

Parámetros
Xarray-like de forma (n_samples_X, n_features)

La matriz de datos.

Devuelve
score_samplesndarray de forma (n_samples,)

Devuelve la función de puntuación (sin desplazar) de las muestras.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia de estimador.

Ejemplos usando sklearn.svm.OneClassSVM