sklearn.neighbors.KernelDensity

class sklearn.neighbors.KernelDensity

Estimación de densidad del núcleo.

Más información en el Manual de usuario.

Parámetros
bandwidthfloat, default=1.0

El ancho de banda del núcleo.

algorithm{“kd_tree”, “ball_tree”, “auto”}, default=”auto”

El algoritmo de árbol a utilizar.

kernel{“gaussian”, “tophat”, “epanechnikov”, “exponential”, “linear”, “cosine”}, default=”gaussian”

El núcleo a usar.

metricstr, default=”euclidian”

La métrica de distancia a utilizar. Tenga en cuenta que no todas las métricas son válidas con todos los algoritmos. Consulte la documentación de BallTree y KDTree para una descripción de los algoritmos disponibles. Tenga en cuenta que la normalización de la salida de la densidad es correcta sólo para la métrica de distancia euclidiana. Por defecto es “euclidean”.

atolfloat, default=0

La tolerancia absoluta deseada del resultado. Una tolerancia mayor generalmente conducirá a una ejecución más rápida.

rtolfloat, default=0

La tolerancia relativa deseada del resultado. Una tolerancia mayor generalmente conducirá a una ejecución más rápida.

breadth_firstbool, default=True

Si es verdadero (predeterminado), utiliza una aproximación al problema de tipo breadth-first. En caso contrario, utiliza un enfoque de profundidad.

leaf_sizeint, default=40

Especifica el tamaño de las hojas del árbol subyacente. Consulta BallTree o KDTree para más detalles.

metric_paramsdict, default=None

Parámetros adicionales que se pasan al árbol para su uso con la métrica. Para más información, consulta la documentación de BallTree o KDTree.

Atributos
tree_Instancia de BinaryTree

El algoritmo de árbol para problemas rápidos de N puntos generalizados.

Ver también

sklearn.neighbors.KDTree

Árbol de K dimensiones para problemas rápidos de N puntos generalizados.

sklearn.neighbors.BallTree

Árbol de bolas para problemas rápidos generalizados de N puntos.

Ejemplos

Calcula una estimación de la densidad del núcleo gaussiano con un ancho de banda fijo.

>>> import numpy as np
>>> rng = np.random.RandomState(42)
>>> X = rng.random_sample((100, 3))
>>> kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X)
>>> log_density = kde.score_samples(X[:3])
>>> log_density
array([-1.52955942, -1.51462041, -1.60244657])

Métodos

fit

Ajuste el modelo de Densidad núcleo en los datos.

get_params

Obtiene los parámetros para este estimador.

sample

Genera muestras aleatorias del modelo.

score

Calcula la densidad de probabilidad logarítmica total bajo el modelo.

score_samples

Evalua el modelo de densidad logarítmica en los datos.

set_params

Establece los parámetros de este estimador.

fit()

Ajuste el modelo de Densidad núcleo en los datos.

Parámetros
Xarray-like de forma (n_samples, n_features)

Lista de puntos de datos de la dimensión n_features. Cada fila corresponde a un único punto de datos.

yNone

Ignorado. Este parámetro sólo existe para compatibilidad con Pipeline.

sample_weightarray-like de forma (n_samples,), default=None

Lista de pesos de la muestra adjunta a los datos X.

Nuevo en la versión 0.20.

Devuelve
selfobject

Devuelve la instancia del objeto.

get_params()

Obtiene los parámetros para este estimador.

Parámetros
deepbool, default=True

Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.

Devuelve
Parámetrosdict

Nombres de parámetros mapeados a sus valores.

sample()

Genera muestras aleatorias del modelo.

Actualmente, esto se implementa sólo para los núcleos gaussianos y tophat.

Parámetros
n_samplesint, default=1

Número de muestras a generar.

random_stateentero, instancia de RandomState o None, default=None

Determina la generación de números aleatorios utilizada para generar muestras aleatorias. Pasa un int para obtener resultados reproducibles a través de múltiples llamadas a la función. Ver :term: Glosario <random_state>.

Devuelve
Xarray-like de forma (n_samples, n_features)

Lista de muestras.

score()

Calcula la densidad de probabilidad logarítmica total bajo el modelo.

Parámetros
Xarray-like de forma (n_samples, n_features)

Lista de puntos de datos de la dimensión n_features. Cada fila corresponde a un único punto de datos.

yNone

Ignorado. Este parámetro sólo existe para compatibilidad con Pipeline.

Devuelve
logprobfloat

Logaritmo de la verosimilitud total de los datos en X. Se normaliza para ser una densidad de probabilidad, por lo que el valor será bajo para datos de alta dimensión.

score_samples()

Evalua el modelo de densidad logarítmica en los datos.

Parámetros
Xarray-like de forma (n_samples, n_features)

Un arreglo de puntos a consultar. La última dimensión debe coincidir con la dimensión de los datos de entrenamiento (n_features).

Devuelve
densityndarray de forma (n_samples,)

La matriz de evaluaciones de log(densidad). Están normalizadas para ser densidades de probabilidad, por lo que los valores serán bajos para los datos de alta dimensión.

set_params()

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros
**paramsdict

Parámetros del estimador.

Devuelve
selfinstancia del estimador

Instancia de estimador.

Ejemplos usando sklearn.neighbors.KernelDensity