`sklearn.dummy`.DummyClassifier¶

class sklearn.dummy.DummyClassifier¶

DummyClassifier es un clasificador que hace predicciones utilizando reglas simples.

Este clasificador es útil como una simple línea de base para comparar con otros clasificadores (reales). No lo utilice para problemas reales.

Más información en el Manual de usuario.

Nuevo en la versión 0.13.

Parámetros

strategy{«stratified», «most_frequent», «prior», «uniform», «constant»}, default=»prior»

Estrategia a utilizar para generar predicciones.

«stratified»: genera predicciones respetando la distribución de las clases del conjunto de entrenamiento.
«most_frequent»: siempre predice la etiqueta más frecuente en el conjunto de entrenamiento.
«prior»: siempre predice la clase que maximiza la clase a priori (como «most_frequent») y predict_proba devuelve la clase a priori.
«uniform»: genera predicciones uniformemente al azar.
«constant»: siempre predice una etiqueta constante proporcionada por el usuario. Esto es útil para las métricas que evalúan una clase no mayoritaria

Distinto en la versión 0.24: El valor predeterminado de strategy ha cambiado a «prior» en la versión 0.24.

random_stateentero, instancia de RandomState o None, default=None

Controla la aleatoriedad para generar las predicciones cuando strategy='stratified' o strategy='uniform'. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.

constantint o str o array-like de forma (n_outputs,)

La constante explícita predicha por la estrategia «constant». Este parámetro sólo es útil para la estrategia «constant».

Atributos

classes_ndarray de forma (n_classes,) o una lista de dichos arreglos: Etiquetas de clase para cada salida.
n_classes_int o list de int: Número de etiquetas para cada salida.
class_prior_ndarray de forma (n_classes,) o una lista de dichos arreglos: Probabilidad de cada clase para cada salida.
n_outputs_int: Número de salidas.
sparse_output_bool: True si el arreglo devuelto por predict debe estar en formato CSC disperso. Se establece automáticamente en True si la entrada y se pasa en formato disperso.

Ejemplos

>>> import numpy as np
>>> from sklearn.dummy import DummyClassifier
>>> X = np.array([-1, 1, 1, 1])
>>> y = np.array([0, 1, 1, 1])
>>> dummy_clf = DummyClassifier(strategy="most_frequent")
>>> dummy_clf.fit(X, y)
DummyClassifier(strategy='most_frequent')
>>> dummy_clf.predict(X)
array([1, 1, 1, 1])
>>> dummy_clf.score(X, y)
0.75

Métodos

`fit`	Ajusta el clasificador aleatorio.
`get_params`	Obtiene los parámetros para este estimador.
`predict`	Realiza la clasificación en los vectores de prueba X.
`predict_log_proba`	Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.
`predict_proba`	Devuelve las estimaciones de probabilidad de los vectores de prueba X.
`score`	Devuelve la precisión media en los datos de prueba y las etiquetas dados.
`set_params`	Establece los parámetros de este estimador.

fit()¶

Ajusta el clasificador aleatorio.

Parámetros

Xarray-like de forma (n_samples, n_features): Datos de entrenamiento.
yarray-like de forma (n_samples,) o (n_samples, n_outputs): Valores objetivo.
sample_weightarray-like de forma (n_samples,), default=None: Ponderaciones de la muestra.

Devuelve

selfobject

get_params()¶

Obtiene los parámetros para este estimador.

Parámetros

deepbool, default=True: Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.

Devuelve

paramsdict: Nombres de parámetros mapeados a sus valores.

predict()¶

Realiza la clasificación en los vectores de prueba X.

Parámetros

Xarray-like de forma (n_samples, n_features): Datos de prueba.

Devuelve

yarray-like de forma (n_samples,) o (n_samples, n_outputs): Valores objetivo predichos para X.

predict_log_proba()¶

Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.

Parámetros

X{array-like, object with finite length or shape}: Datos de entrenamiento, requiere length = n_samples

Devuelve

Pndarray de forma (n_samples, n_classes) o una lista de dichos arreglos: Devuelve la probabilidad logarítmica de la muestra para cada clase en el modelo, donde las clases se ordenan aritméticamente para cada salida.

predict_proba()¶

Devuelve las estimaciones de probabilidad de los vectores de prueba X.

Parámetros

Xarray-like de forma (n_samples, n_features): Datos de prueba.

Devuelve

Pndarray de forma (n_samples, n_classes) o una lista de dichos arreglos: Devuelve la probabilidad de la muestra para cada clase en el modelo, donde las clases se ordenan aritméticamente para cada salida.

score()¶

Devuelve la precisión media en los datos de prueba y las etiquetas dados.

En la clasificación multietiqueta, se trata de la precisión del subconjunto, que es una métrica rigurosa, ya que se requiere para cada muestra que cada conjunto de etiquetas sea predicho correctamente.

Parámetros

XNone o array-like de forma (n_samples, n_features): Muestras de prueba. Pasar None como muestras de prueba da el mismo resultado que pasar muestras de prueba reales, ya que DummyClassifier opera independientemente de las observaciones muestreadas.
yarray-like de forma (n_samples,) o (n_samples, n_outputs): Etiquetas True para X.
sample_weightarray-like de forma (n_samples,), default=None: Ponderaciones de la muestra.

Devuelve

scorefloat: Precisión media de self.predict(X) con respecto a y.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto en estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia del estimador: Instancia del estimador.