sklearn.dummy
.DummyClassifier¶
- class sklearn.dummy.DummyClassifier¶
DummyClassifier es un clasificador que hace predicciones utilizando reglas simples.
Este clasificador es útil como una simple línea de base para comparar con otros clasificadores (reales). No lo utilice para problemas reales.
Más información en el Manual de usuario.
Nuevo en la versión 0.13.
- Parámetros
- strategy{«stratified», «most_frequent», «prior», «uniform», «constant»}, default=»prior»
Estrategia a utilizar para generar predicciones.
«stratified»: genera predicciones respetando la distribución de las clases del conjunto de entrenamiento.
«most_frequent»: siempre predice la etiqueta más frecuente en el conjunto de entrenamiento.
«prior»: siempre predice la clase que maximiza la clase a priori (como «most_frequent») y
predict_proba
devuelve la clase a priori.«uniform»: genera predicciones uniformemente al azar.
«constant»: siempre predice una etiqueta constante proporcionada por el usuario. Esto es útil para las métricas que evalúan una clase no mayoritaria
Distinto en la versión 0.24: El valor predeterminado de
strategy
ha cambiado a «prior» en la versión 0.24.
- random_stateentero, instancia de RandomState o None, default=None
Controla la aleatoriedad para generar las predicciones cuando
strategy='stratified'
ostrategy='uniform'
. Pase un int para una salida reproducible a través de múltiples llamadas a la función. Ver Glosario.- constantint o str o array-like de forma (n_outputs,)
La constante explícita predicha por la estrategia «constant». Este parámetro sólo es útil para la estrategia «constant».
- Atributos
- classes_ndarray de forma (n_classes,) o una lista de dichos arreglos
Etiquetas de clase para cada salida.
- n_classes_int o list de int
Número de etiquetas para cada salida.
- class_prior_ndarray de forma (n_classes,) o una lista de dichos arreglos
Probabilidad de cada clase para cada salida.
- n_outputs_int
Número de salidas.
- sparse_output_bool
True si el arreglo devuelto por predict debe estar en formato CSC disperso. Se establece automáticamente en True si la entrada y se pasa en formato disperso.
Ejemplos
>>> import numpy as np >>> from sklearn.dummy import DummyClassifier >>> X = np.array([-1, 1, 1, 1]) >>> y = np.array([0, 1, 1, 1]) >>> dummy_clf = DummyClassifier(strategy="most_frequent") >>> dummy_clf.fit(X, y) DummyClassifier(strategy='most_frequent') >>> dummy_clf.predict(X) array([1, 1, 1, 1]) >>> dummy_clf.score(X, y) 0.75
Métodos
Ajusta el clasificador aleatorio.
Obtiene los parámetros para este estimador.
Realiza la clasificación en los vectores de prueba X.
Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.
Devuelve las estimaciones de probabilidad de los vectores de prueba X.
Devuelve la precisión media en los datos de prueba y las etiquetas dados.
Establece los parámetros de este estimador.
- fit()¶
Ajusta el clasificador aleatorio.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos de entrenamiento.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs)
Valores objetivo.
- sample_weightarray-like de forma (n_samples,), default=None
Ponderaciones de la muestra.
- Devuelve
- selfobject
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los subobjetos contenidos que son estimadores.
- Devuelve
- paramsdict
Nombres de parámetros mapeados a sus valores.
- predict()¶
Realiza la clasificación en los vectores de prueba X.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos de prueba.
- Devuelve
- yarray-like de forma (n_samples,) o (n_samples, n_outputs)
Valores objetivo predichos para X.
- predict_log_proba()¶
Devuelve estimaciones de probabilidad logarítmica para los vectores de prueba X.
- Parámetros
- X{array-like, object with finite length or shape}
Datos de entrenamiento, requiere length = n_samples
- Devuelve
- Pndarray de forma (n_samples, n_classes) o una lista de dichos arreglos
Devuelve la probabilidad logarítmica de la muestra para cada clase en el modelo, donde las clases se ordenan aritméticamente para cada salida.
- predict_proba()¶
Devuelve las estimaciones de probabilidad de los vectores de prueba X.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Datos de prueba.
- Devuelve
- Pndarray de forma (n_samples, n_classes) o una lista de dichos arreglos
Devuelve la probabilidad de la muestra para cada clase en el modelo, donde las clases se ordenan aritméticamente para cada salida.
- score()¶
Devuelve la precisión media en los datos de prueba y las etiquetas dados.
En la clasificación multietiqueta, se trata de la precisión del subconjunto, que es una métrica rigurosa, ya que se requiere para cada muestra que cada conjunto de etiquetas sea predicho correctamente.
- Parámetros
- XNone o array-like de forma (n_samples, n_features)
Muestras de prueba. Pasar None como muestras de prueba da el mismo resultado que pasar muestras de prueba reales, ya que DummyClassifier opera independientemente de las observaciones muestreadas.
- yarray-like de forma (n_samples,) o (n_samples, n_outputs)
Etiquetas True para X.
- sample_weightarray-like de forma (n_samples,), default=None
Ponderaciones de la muestra.
- Devuelve
- scorefloat
Precisión media de self.predict(X) con respecto a y.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto en estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia del estimador.