SVM: Muestras ponderadas

Traza la función de decisión de un conjunto de datos ponderados, donde el tamaño de los puntos es proporcional a su ponderación.

La ponderación de la muestra reescala el parámetro C, lo que significa que el clasificador pone más énfasis en acertar estos puntos. El efecto puede ser a menudo sutil. Para enfatizar el efecto aquí, ponderamos especialmente los valores atípicos, haciendo muy visible la deformación del límite de decisión.

Constant weights, Modified weights

import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm

def plot_decision_function(classifier, sample_weight, axis, title):
    # plot the decision function
    xx, yy = np.meshgrid(np.linspace(-4, 5, 500), np.linspace(-4, 5, 500))

    Z = classifier.decision_function(np.c_[xx.ravel(), yy.ravel()])
    Z = Z.reshape(xx.shape)

    # plot the line, the points, and the nearest vectors to the plane
    axis.contourf(xx, yy, Z, alpha=0.75,
    axis.scatter(X[:, 0], X[:, 1], c=y, s=100 * sample_weight, alpha=0.9,
       , edgecolors='black')


# we create 20 points
X = np.r_[np.random.randn(10, 2) + [1, 1], np.random.randn(10, 2)]
y = [1] * 10 + [-1] * 10
sample_weight_last_ten = abs(np.random.randn(len(X)))
sample_weight_constant = np.ones(len(X))
# and bigger weights to some outliers
sample_weight_last_ten[15:] *= 5
sample_weight_last_ten[9] *= 15

# for reference, first fit without sample weights

# fit the model
clf_weights = svm.SVC(gamma=1), y, sample_weight=sample_weight_last_ten)

clf_no_weights = svm.SVC(gamma=1), y)

fig, axes = plt.subplots(1, 2, figsize=(14, 6))
plot_decision_function(clf_no_weights, sample_weight_constant, axes[0],
                       "Constant weights")
plot_decision_function(clf_weights, sample_weight_last_ten, axes[1],
                       "Modified weights")

Tiempo total de ejecución del script: (0 minutos 0.561 segundos)

Galería generada por Sphinx-Gallery