sklearn.neighbors
.KernelDensity¶
- class sklearn.neighbors.KernelDensity¶
Estimación de densidad del núcleo.
Más información en el Manual de usuario.
- Parámetros
- bandwidthfloat, default=1.0
El ancho de banda del núcleo.
- algorithm{“kd_tree”, “ball_tree”, “auto”}, default=”auto”
El algoritmo de árbol a utilizar.
- kernel{“gaussian”, “tophat”, “epanechnikov”, “exponential”, “linear”, “cosine”}, default=”gaussian”
El núcleo a usar.
- metricstr, default=”euclidian”
La métrica de distancia a utilizar. Tenga en cuenta que no todas las métricas son válidas con todos los algoritmos. Consulte la documentación de
BallTree
yKDTree
para una descripción de los algoritmos disponibles. Tenga en cuenta que la normalización de la salida de la densidad es correcta sólo para la métrica de distancia euclidiana. Por defecto es “euclidean”.- atolfloat, default=0
La tolerancia absoluta deseada del resultado. Una tolerancia mayor generalmente conducirá a una ejecución más rápida.
- rtolfloat, default=0
La tolerancia relativa deseada del resultado. Una tolerancia mayor generalmente conducirá a una ejecución más rápida.
- breadth_firstbool, default=True
Si es verdadero (predeterminado), utiliza una aproximación al problema de tipo breadth-first. En caso contrario, utiliza un enfoque de profundidad.
- leaf_sizeint, default=40
Especifica el tamaño de las hojas del árbol subyacente. Consulta
BallTree
oKDTree
para más detalles.- metric_paramsdict, default=None
Parámetros adicionales que se pasan al árbol para su uso con la métrica. Para más información, consulta la documentación de
BallTree
oKDTree
.
- Atributos
- tree_Instancia de BinaryTree
El algoritmo de árbol para problemas rápidos de N puntos generalizados.
Ver también
sklearn.neighbors.KDTree
Árbol de K dimensiones para problemas rápidos de N puntos generalizados.
sklearn.neighbors.BallTree
Árbol de bolas para problemas rápidos generalizados de N puntos.
Ejemplos
Calcula una estimación de la densidad del núcleo gaussiano con un ancho de banda fijo.
>>> import numpy as np >>> rng = np.random.RandomState(42) >>> X = rng.random_sample((100, 3)) >>> kde = KernelDensity(kernel='gaussian', bandwidth=0.5).fit(X) >>> log_density = kde.score_samples(X[:3]) >>> log_density array([-1.52955942, -1.51462041, -1.60244657])
Métodos
Ajuste el modelo de Densidad núcleo en los datos.
Obtiene los parámetros para este estimador.
Genera muestras aleatorias del modelo.
Calcula la densidad de probabilidad logarítmica total bajo el modelo.
Evalua el modelo de densidad logarítmica en los datos.
Establece los parámetros de este estimador.
- fit()¶
Ajuste el modelo de Densidad núcleo en los datos.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Lista de puntos de datos de la dimensión n_features. Cada fila corresponde a un único punto de datos.
- yNone
Ignorado. Este parámetro sólo existe para compatibilidad con
Pipeline
.- sample_weightarray-like de forma (n_samples,), default=None
Lista de pesos de la muestra adjunta a los datos X.
Nuevo en la versión 0.20.
- Devuelve
- selfobject
Devuelve la instancia del objeto.
- get_params()¶
Obtiene los parámetros para este estimador.
- Parámetros
- deepbool, default=True
Si es True, devolverá los parámetros para este estimador y los sub objetos contenidos que son estimadores.
- Devuelve
- Parámetrosdict
Nombres de parámetros mapeados a sus valores.
- sample()¶
Genera muestras aleatorias del modelo.
Actualmente, esto se implementa sólo para los núcleos gaussianos y tophat.
- Parámetros
- n_samplesint, default=1
Número de muestras a generar.
- random_stateentero, instancia de RandomState o None, default=None
Determina la generación de números aleatorios utilizada para generar muestras aleatorias. Pasa un int para obtener resultados reproducibles a través de múltiples llamadas a la función. Ver :term:
Glosario <random_state>
.
- Devuelve
- Xarray-like de forma (n_samples, n_features)
Lista de muestras.
- score()¶
Calcula la densidad de probabilidad logarítmica total bajo el modelo.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Lista de puntos de datos de la dimensión n_features. Cada fila corresponde a un único punto de datos.
- yNone
Ignorado. Este parámetro sólo existe para compatibilidad con
Pipeline
.
- Devuelve
- logprobfloat
Logaritmo de la verosimilitud total de los datos en X. Se normaliza para ser una densidad de probabilidad, por lo que el valor será bajo para datos de alta dimensión.
- score_samples()¶
Evalua el modelo de densidad logarítmica en los datos.
- Parámetros
- Xarray-like de forma (n_samples, n_features)
Un arreglo de puntos a consultar. La última dimensión debe coincidir con la dimensión de los datos de entrenamiento (n_features).
- Devuelve
- densityndarray de forma (n_samples,)
La matriz de evaluaciones de log(densidad). Están normalizadas para ser densidades de probabilidad, por lo que los valores serán bajos para los datos de alta dimensión.
- set_params()¶
Establece los parámetros de este estimador.
El método funciona tanto con estimadores simples como en objetos anidados (como
Pipeline
). Estos últimos tienen parámetros de la forma<component>__<parameter>
para que sea posible actualizar cada componente de un objeto anidado.- Parámetros
- **paramsdict
Parámetros del estimador.
- Devuelve
- selfinstancia del estimador
Instancia de estimador.