`sklearn.neighbors`.KernelDensity¶

class sklearn.neighbors.KernelDensity¶

Estimación de densidad del núcleo.

Más información en el Manual de usuario.

Parámetros

bandwidthfloat, default=1.0: El ancho de banda del núcleo.
algorithm{“kd_tree”, “ball_tree”, “auto”}, default=”auto”: El algoritmo de árbol a utilizar.
kernel{“gaussian”, “tophat”, “epanechnikov”, “exponential”, “linear”, “cosine”}, default=”gaussian”: El núcleo a usar.
metricstr, default=”euclidian”: La métrica de distancia a utilizar. Tenga en cuenta que no todas las métricas son válidas con todos los algoritmos. Consulte la documentación de BallTree y KDTree para una descripción de los algoritmos disponibles. Tenga en cuenta que la normalización de la salida de la densidad es correcta sólo para la métrica de distancia euclidiana. Por defecto es “euclidean”.
atolfloat, default=0: La tolerancia absoluta deseada del resultado. Una tolerancia mayor generalmente conducirá a una ejecución más rápida.
rtolfloat, default=0: La tolerancia relativa deseada del resultado. Una tolerancia mayor generalmente conducirá a una ejecución más rápida.
breadth_firstbool, default=True: Si es verdadero (predeterminado), utiliza una aproximación al problema de tipo breadth-first. En caso contrario, utiliza un enfoque de profundidad.
leaf_sizeint, default=40: Especifica el tamaño de las hojas del árbol subyacente. Consulta BallTree o KDTree para más detalles.
metric_paramsdict, default=None: Parámetros adicionales que se pasan al árbol para su uso con la métrica. Para más información, consulta la documentación de BallTree o KDTree.

Atributos

tree_Instancia de BinaryTree: El algoritmo de árbol para problemas rápidos de N puntos generalizados.

Ver también

sklearn.neighbors.KDTree: Árbol de K dimensiones para problemas rápidos de N puntos generalizados.
sklearn.neighbors.BallTree: Árbol de bolas para problemas rápidos generalizados de N puntos.

Ejemplos

Calcula una estimación de la densidad del núcleo gaussiano con un ancho de banda fijo.

>>>>>> import numpy as np
>>> rng = np.random.RandomState(42)
>>> X = rng.random_sample((100, 3))
>>> kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X)
>>> log_density = kde.score_samples(X[:3])
>>> log_density
array([-1.52955942, -1.51462041, -1.60244657])

Métodos

`fit`	Ajuste el modelo de Densidad núcleo en los datos.
`get_params`	Obtiene los parámetros para este estimador.
`sample`	Genera muestras aleatorias del modelo.
`score`	Calcula la densidad de probabilidad logarítmica total bajo el modelo.
`score_samples`	Evalua el modelo de densidad logarítmica en los datos.
`set_params`	Establece los parámetros de este estimador.

fit()¶

Ajuste el modelo de Densidad núcleo en los datos.

Parámetros

Xarray-like de forma (n_samples, n_features): Lista de puntos de datos de la dimensión n_features. Cada fila corresponde a un único punto de datos.
yNone: Ignorado. Este parámetro sólo existe para compatibilidad con Pipeline.
sample_weightarray-like de forma (n_samples,), default=None: Lista de pesos de la muestra adjunta a los datos X.

Nuevo en la versión 0.20.

Devuelve

selfobject: Devuelve la instancia del objeto.

get_params()¶

Obtiene los parámetros para este estimador.

Parámetros

deepbool, default=True: Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.

Devuelve

Parámetrosdict: Nombres de parámetros mapeados a sus valores.

sample()¶

Genera muestras aleatorias del modelo.

Actualmente, esto se implementa sólo para los núcleos gaussianos y tophat.

Parámetros

n_samplesint, default=1: Número de muestras a generar.
random_stateentero, instancia de RandomState o None, default=None: Determina la generación de números aleatorios utilizada para generar muestras aleatorias. Pasa un int para obtener resultados reproducibles a través de múltiples llamadas a la función. Ver :term: Glosario <random_state>.

Devuelve

Xarray-like de forma (n_samples, n_features): Lista de muestras.

score()¶

Calcula la densidad de probabilidad logarítmica total bajo el modelo.

Parámetros

Xarray-like de forma (n_samples, n_features): Lista de puntos de datos de la dimensión n_features. Cada fila corresponde a un único punto de datos.
yNone: Ignorado. Este parámetro sólo existe para compatibilidad con Pipeline.

Devuelve

logprobfloat: Logaritmo de la verosimilitud total de los datos en X. Se normaliza para ser una densidad de probabilidad, por lo que el valor será bajo para datos de alta dimensión.

score_samples()¶

Evalua el modelo de densidad logarítmica en los datos.

Parámetros

Xarray-like de forma (n_samples, n_features): Un arreglo de puntos a consultar. La última dimensión debe coincidir con la dimensión de los datos de entrenamiento (n_features).

Devuelve

densityndarray de forma (n_samples,): La matriz de evaluaciones de log(densidad). Están normalizadas para ser densidades de probabilidad, por lo que los valores serán bajos para los datos de alta dimensión.

set_params()¶

Establece los parámetros de este estimador.

El método funciona tanto con estimadores simples como en objetos anidados (como Pipeline). Estos últimos tienen parámetros de la forma <component>__<parameter> para que sea posible actualizar cada componente de un objeto anidado.

Parámetros

**paramsdict: Parámetros del estimador.

Devuelve

selfinstancia del estimador: Instancia de estimador.

Ejemplos usando `sklearn.neighbors.KernelDensity`¶

sklearn.neighbors.KernelDensity¶

Ejemplos usando sklearn.neighbors.KernelDensity¶

`sklearn.neighbors`.KernelDensity¶

Ejemplos usando `sklearn.neighbors.KernelDensity`¶