sklearn.dummy.DummyClassifier

class sklearn.dummy.DummyClassifier

DummyClassifier es un clasificador que hace predicciones utilizando reglas simples.

Este clasificador es útil como una simple línea de base para comparar con otros clasificadores (reales). No lo utilice para problemas reales.

Más información en el Manual de usuario.

Nuevo en la versión 0.13.

Parámetros
strategy{«stratified», «most_frequent», «prior», «uniform», «constant»}, default=»prior»

Estrategia a utilizar para generar predicciones.

  • «stratified»: genera predicciones respetando la distribución de las clases del conjunto de entrenamiento.

  • «most_frequent»: siempre predice la etiqueta más frecuente en el conjunto de entrenamiento.

  • «prior»: siempre predice la clase que maximiza la clase a priori (como «most_frequent») y predict_proba devuelve la clase a priori.

  • «uniform»: genera predicciones uniformemente al azar.

  • «constant»: siempre predice una etiqueta constante proporcionada por el usuario. Esto es útil para las métricas que evalúan una clase no mayoritaria

    Distinto en la versión 0.24: El valor predeterminado de strategy ha cambiado a «prior» en la versión 0.24.

random_stateentero, instancia de RandomState o None, default=None

Controla la aleatoriedad para generar las predicciones cuando strategy='stratified' o strategy='uniform'. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

constantint o str o array-like de forma (n_outputs,)

La constante explícita predicha por la estrategia «constant». Este parámetro sólo es útil para la estrategia «constant».

Atributos
classes_ndarray de forma (n_classes,) o una lista de dichos arreglos

Etiquetas de clase para cada salida.

n_classes_int o list de int

Número de etiquetas para cada salida.

class_prior_ndarray de forma (n_classes,) o una lista de dichos arreglos

Probabilidad de cada clase para cada salida.

n_outputs_int

Número de salidas.

sparse_output_bool

True si el arreglo devuelto por predict debe estar en formato CSC disperso. Se establece automáticamente en True si la entrada y se pasa en formato disperso.

Ejemplos

>>> import numpy as np
>>> from sklearn.dummy import DummyClassifier
>>> X = np.array([-1, 1, 1, 1])
>>> y = np.array([0, 1, 1, 1])
>>> dummy_clf = DummyClassifier(strategy="most_frequent")
>>> dummy_clf.fit(X, y)
DummyClassifier(strategy='most_frequent')
>>> dummy_clf.predict(X)
array([1, 1, 1, 1])
>>> dummy_clf.score(X, y)
0.75

Métodos

fit

Ajusta el clasificador aleatorio.

get_params

Obtiene los parámetros para este estimador.

predict

Realiza la clasificación en los vectores de prueba X.

predict_log_proba

Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.

predict_proba

Devuelve las estimaciones de probabilidad de los vectores de prueba X.

score

Devuelve la precisión media en los datos de prueba y las etiquetas dados.

set_params

Establece los parámetros de este estimador.

fit()

Ajusta el clasificador aleatorio.

Parámetros
Xarray-like de forma (n_samples, n_features)

Datos de entrenamiento.

yarray-like de forma (n_samples,) o (n_samples, n_outputs)

Valores objetivo.

sample_weightarray-like de forma (n_samples,), default=None

Ponderaciones de la muestra.

Devuelve
selfobject
get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve
paramsdict

Nombres de parámetros mapeados a sus valores.

predict()

Realiza la clasificación en los vectores de prueba X.

Parámetros
Xarray-like de forma (n_samples, n_features)

Datos de prueba.

Devuelve
yarray-like de forma (n_samples,) o (n_samples, n_outputs)

Valores objetivo predichos para X.

predict_log_proba()

Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.

Parámetros
X{array-like, object with finite length or shape}

Datos de entrenamiento, requiere length = n_samples

Devuelve
Pndarray de forma (n_samples, n_classes) o una lista de dichos arreglos

Devuelve la probabilidad logarítmica de la muestra para cada clase en el modelo, donde las clases se ordenan aritméticamente para cada salida.

predict_proba()

Devuelve las estimaciones de probabilidad de los vectores de prueba X.

Parámetros
Xarray-like de forma (n_samples, n_features)

Datos de prueba.

Devuelve
Pndarray de forma (n_samples, n_classes) o una lista de dichos arreglos

Devuelve la probabilidad de la muestra para cada clase en el modelo, donde las clases se ordenan aritméticamente para cada salida.

score()

Devuelve la precisión media en los datos de prueba y las etiquetas dados.

En la clasificación multietiqueta, se trata de la precisión del subconjunto, que es una métrica rigurosa, ya que se requiere para cada muestra que cada conjunto de etiquetas sea predicho correctamente.

Parámetros
XNone o array-like de forma (n_samples, n_features)

Muestras de prueba. Pasar None como muestras de prueba da el mismo resultado que pasar muestras de prueba reales, ya que DummyClassifier opera independientemente de las observaciones muestreadas.

yarray-like de forma (n_samples,) o (n_samples, n_outputs)

Etiquetas True para X.

sample_weightarray-like de forma (n_samples,), default=None

Ponderaciones de la muestra.

Devuelve
scorefloat

Precisión media de self.predict(X) con respecto a y.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia del estimador.