Distribución de Dirichlet

En teoría de la probabilidad y estadística, la distribución de Dirichlet (en honor a Peter Gustav Lejeune Dirichlet), generalmente denotada , es una familia de distribuciones de probabilidad continuas multivariada, parametrizadas por un vector alfa perteneciente al conjunto de los números reales positivos. Es la generalización multivariada de la distribución beta. Las distribuciones de Dirichlet frecuentemente se utilizan como distribuciones a priori en estadística Bayesiana, y de hecho la distribución de Dirichlet es el conjugado a priori de la distribución categórica y la distribución multinomial. Es decir, su función de densidad de probabilidad da como resultado la creencia de que la probabilidad de eventos rivales son dado que cada evento haya sido observado veces.

La generalización de dimensiones-infinitas de la distribución de Dirichlet es el proceso de Dirichlet.

Función de densidad de probabilidad

editar
 
Ilustrando el cambio del logaritmo de la función de densidad cuando K=3 mientras cambiamos el vector α de α=(0.3, 0.3, 0.3) a (2.0, 2.0, 2.0), manteniendo todos los  s iguales entre sí.

La distribución de Dirichlet de orden   con parámetros   tiene una función de densidad con respecto a la Medida de Lebesgue en el espacio euclidiano   dada por

 

donde   pertenece al   simplex abierto o en otras palabras:

 

La constante de normalización es la función beta multinomial, que puede expresarse en términos de la función gamma:

 

donde  .

Soporte

editar

El soporte de la distribución de Dirichlet es el conjunto de vectores de K dimensiones   cuyas entradas son números reales en el intervalo (0,1); además  , es decir, la suma de las coordenadas es 1. Estas pueden verse como las probabilidades de un evento categórico K. Otra manera de expresar esto, es que el dominio de la distribución de Dirichlet es en sí un conjunto de distribuciones de probabilidad, específicamente el conjunto de distribuciones discretas de dimensiones K. Cabe recalcar que el término técnico para el conjunto de puntos que soportan una distribución de Dirichlet de dimensiones K es el simplex (K−1) estándar abierto,[1]​ que es una generalización de un triángulo, embebido en la siguiente dimensión más alta. Por ejemplo, con K=3, el soporte es un triángulo equilátero embebido en un espacio tridimensional, con vértices en (1,0,0), (0,1,0) y (0,0,1), es decir, tocando cada uno de los ejes de coordenadas en un punto alejado en una unidad del origen.

Referencias

editar
  1. «Introduction to the Dirichlet Distribution and Related Processes». ece.uw.edu. Consultado el 23 de abril de 2019. 
  • SciencesPo: Un paquete R que contiene las funciones para simulación de los parámetros de la distribución de Dirichlet.