sklearn.svm
.OneClassSVM¶
- class sklearn.svm.OneClassSVM¶
Detección de Valor Atípicos Sin Supervisión.
Estima el soporte de una distribución de alta dimensión.
La implementación se basa en libsvm.
Más información en el Manual de usuario.
- Parámetros
- kernel{“linear”, “poly”, “rbf”, “sigmoid”, “precomputed”}, default=”rbf”
Especifica el tipo de núcleo a ser usado en el algoritmo. Debe ser uno de “linear”, “poly”, “rby”, “sigmoid”, “precomputed” o un invocable. Si no se da ninguna, se utilizará “rbf”. Si un invocable es dado se utilizara para precalcular la matriz del núcleo.
- degreeentero, default=3
Grado de la función de núcleo polinómico (“poly”). Ignorado por todos los otros núcleos.
- gamma{“scale”, “auto”} o flotanto, default=”scale”
Coeficiente de núcleo para “rbf”, “poly” y “sigmoid”.
si se pasa
gamma='scale'
(valor predeterminado), entonces se usa 1 / (n_features * X.var()) como valor de gamma,si es “auto”, utiliza 1 / n_features.
Distinto en la versión 0.22: El valor predeterminado de
gamma
cambió de “auto” a “scale”.- coef0flotante, default=0.0
Término independiente en la función del núcleo. Sólo es significativo en “poly” y “sigmoid”.
- tolflotante, default=1e-3
Tolerancia para el criterio de parada.
- nuflotante, default=0.5
Límite superior en la fracción de errores de entrenamiento y un límite inferior de la fracción de vectores de soporte. Debe estar en el intervalo (0, 1]. Por defecto se tomará 0.5.
- shrinkingbooleano, default=True
Si se usa o no la heurística de reducción. Ver el Manual de usuario.
- cache_sizeflotante, default=200
Específica el tamaño del caché del núcleo (en MB).
- verbosebooleano, default=False
Activar salida detallada. Ten en cuenta que esta configuración toma ventaja de una configuración por proceso en el tiempo de ejecución en libsvm que, si está habilitada, puede no funcionar correctamente en un contexto multihilo.
- max_iterentero, default=-1
Limite fuerte en iteraciones dentro del solucionador, o -1 para ningún límite.
- Atributos
- class_weight_arreglo de forma (n_classes,)
Multiplicadores del parámetro C para cada clase. Calculado basado en el parámetro
class_weight
.- coef_ndarray de forma (1, n_features)
Ponderaciones asignadas a las características (coeficientes en el problema primario). Esto solo está disponible en el caso de un kernel lineal.
coef_
es propiedad de solo lectura derivada dedual_coef_
ysupport_vectors_
.- dual_coef_ndarray de forma (1, n_SV)
Coeficientes de los vectores de soporte en la función de decisión.
- fit_status_entero
0 si se ajusta correctamente, 1 en caso contrario (producirá una advertencia)
- intercept_ndarray de forma (1,)
Constantes en la función de decisión.
- n_support_ndarray de forma (n_classes,), dtype=int32
Número de vectores de soporte para cada clase.
- offset_de punto flotante (float)
Desplazamiento usado para definir la función de decisión de las puntuaciones crudas. Tenemos la relación: decision_function = score_samples -
offset_
. El desplazamiento es el opuesto deintercept_
y se provee para consistencia con otros algoritmos de detección de valores atípicos.Nuevo en la versión 0.20.
- shape_fit_tupla de int de la forma (n_dimensions_of_X,)
Dimensiones del arreglo del vector de entrenamiento
X
.- support_ndarray de forma (n_SV,)
Indices de vectores de apoyo.
- support_vectors_ndarray de forma (n_SV, n_features)
Vectores de apoyo.
Ejemplos
>>> from sklearn.svm import OneClassSVM >>> X = [[0], [0.44], [0.45], [0.46], [1]] >>> clf = OneClassSVM(gamma='auto').fit(X) >>> clf.predict(X) array([-1, 1, 1, 1, -1]) >>> clf.score_samples(X) array([1.7798..., 2.0547..., 2.0556..., 2.0561..., 1.7332...])
Métodos
Distancia firmada al hiperplano separador.
Detecta el límite suave del conjunto de muestras X.
Realiza el encaje en X y devuelve etiquetas para X.
Obtiene los parámetros para este estimador.
Realiza la clasificación en las muestras en X.
Función de puntuación cruda de las muestras.
Establece los parámetros de este estimador.
- decision_function()¶
Distancia firmada al hiperplano separador.
La distancia firmada es positiva para un valor típico y negativo para un atípico.
- Parámetros
- Xarray-like de forma (n_samples_X, n_features)
La matriz de datos.
- Devuelve
- decndarray de forma (n_samples,)
Devuelve la función de decisión para las muestras.
- fit()¶
Detecta el límite suave del conjunto de muestras X.
- Parámetros
- X{array-like, sparse matrix} de forma (n_samples, n_features)
Conjunto de muestras, donde n_samples es el número de muestras y n_features es el número de características.
- sample_weightarray-like de forma (n_samples,) default=None
Ponderados por muestra. Reescalado de C por muestra. Los ponderados más altos obligan al clasificador a poner más énfasis en estos puntos.
- yIgnorado
no se utiliza, está presente para la coherencia de la API por convención.
- Devuelve
- selfobjeto
Notas
Si X no es un arreglo contiguo ordenado en C, es copiada.
- fit_predict()¶
Realiza el encaje en X y devuelve etiquetas para X.
Devuelve -1 para los valores atípicos y 1 para los valores típicos.
- Parámetros
- X{array-like, sparse matrix, dataframe} de forma (n_samples, n_features)
- yIgnorado
No se utiliza, está presente para la coherencia de la API por convención.
- Devuelve
- yndarray de forma (n_samples,)
1 para los valores típicos, -1 para los valores atípicos.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbooleano, default=True
Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.
- Devuelve
- paramsdict
Los nombres de los parámetros asignados a sus valores.
- predict()¶
Realiza la clasificación en las muestras en X.
Para un modelo de una clase, se devuelve +1 o -1.
- Parámetros
- X{array-like, sparse matrix} de forma (n_samples, n_features) o (n_samples_test, n_samples_train)
Para kernel=»precomputed», la forma esperada de X es (n_samples_test, n_samples_train).
- Devuelve
- y_predndarray de forma (n_samples,)
Etiquetas de clase para las muestras en X.
- score_samples()¶
Función de puntuación cruda de las muestras.
- Parámetros
- Xarray-like de forma (n_samples_X, n_features)
La matriz de datos.
- Devuelve
- score_samplesndarray de forma (n_samples,)
Devuelve la función de puntuación (sin desplazar) de las muestras.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto con estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia de estimador.