En teoría de la probabilidad y estadística, la distribución hipergeométrica es una distribución de probabilidad discreta relacionada con muestreos aleatorios y sin reemplazo. Suponga que se tiene una población de elementos de los cuales, pertenecen a la categoría y pertenecen a la categoría . La distribución hipergeométrica mide la probabilidad de obtener () elementos de la categoría en una muestra sin reemplazo de elementos de la población original.
Una variable aleatoria discreta tiene una distribución hipergeométrica con parámetros , y y escribimos si su función de probabilidad es
para valores de comprendidos entre y ; donde es el tamaño de población, es el tamaño de la muestra extraída, es el número de elementos en la población original que pertenecen a la categoría deseada y es el número de elementos en la muestra que pertenecen a dicha categoría.
La notación
hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar elementos de un total .
La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.