Distribución hipergeométrica

Distribución Hipergeométrica
Parámetros	;
Dominio
Función de probabilidad (fp)
Media
Moda
Varianza
Coeficiente de simetría
Curtosis
Función generadora de momentos (mgf)
Función característica
	[editar datos en Wikidata]

En teoría de la probabilidad y estadística, la distribución hipergeométrica es una distribución de probabilidad discreta relacionada con muestreos aleatorios y sin reemplazo. Suponga que se tiene una población de $N$ elementos de los cuales, $K$ pertenecen a la categoría $A$ y $N-K$ pertenecen a la categoría $B$ . La distribución hipergeométrica mide la probabilidad de obtener $x$ ( $0\leq x\leq K$ ) elementos de la categoría $A$ en una muestra sin reemplazo de $n$ elementos de la población original.

Definición

Función de probabilidad

Una variable aleatoria discreta $X$ tiene una distribución hipergeométrica con parámetros $N=0,1,\dots$ , $K=0,1,\dots ,N$ y $n=0,1,\dots ,N$ y escribimos $X\sim \operatorname {HG} (N,K,n)$ si su función de probabilidad es

\operatorname {P} [X=x]={\frac {{K \choose x}{N-K \choose n-x}}{N \choose n}},

para valores de $x$ comprendidos entre $\max\{0,n-N+K\}$ y $\min\{K,n\}$ ; donde $N$ es el tamaño de población, $n$ es el tamaño de la muestra extraída, $K$ es el número de elementos en la población original que pertenecen a la categoría deseada y $x$ es el número de elementos en la muestra que pertenecen a dicha categoría.

La notación

{b \choose a}={\frac {b!}{a!(b-a)!}}

hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar $a$ elementos de un total $b$ .

Fórmula recursiva

Si $X\sim \operatorname {HG} (N,K,n)$ entonces puede demostrarse que

{\begin{aligned}\operatorname {P} [X=x+1]&={\frac {(K-x)(n-x)}{(x+1)(N-K-n+x-1)}}\;\operatorname {P} [X=x]\end{aligned}}

Propiedades

Si $X\sim \operatorname {HG} (N,K,n)$ entonces $X$ cumple algunas propiedades:

El valor esperado de la variable aleatoria $X$ es

\operatorname {E} [X]={\frac {nK}{N}}

y su varianza está dada por

\operatorname {Var} [X]={\frac {nK}{N}}{\bigg (}{\frac {N-K}{N}}{\bigg )}{\bigg (}{\frac {N-n}{N-1}}{\bigg )}

La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.

Distribuciones relacionadas

Si una variable aleatoria $X\sim \operatorname {HG} (N,K,1)$ entonces $X\sim \operatorname {Bernoulli} \left({\frac {K}{N}}\right)$ .
Si $X\sim \operatorname {HG} (N,K,n)$ entonces $X\sim \operatorname {Binomial} (n,p)$ cuando $N\to \infty$ y $K\to \infty$ de forma tal que $K/N\to p$ .

Véase también

Enlaces externos

[1] (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última). Cálculo de la probabilidad de una distribución hipergeométrica con R (lenguaje de programación)

Datos: Q730600
Multimedia: Hypergeometric distribution / Q730600

Distribución Hipergeométrica
Parámetros	$N\in \{0,1,2,\dots \}$ $K\in \{0,1,2,\dots ,N\}$ $n\in \{0,1,2,\dots ,N\}\,$
Dominio	$\max\{0,n-N+K\}\leq x\leq \min\{K,n\}$
Función de probabilidad (fp)	${{{K \choose x}{{N-K} \choose {n-x}}} \over {N \choose n}}$
Media	$nK \over N$
Moda	$\left\lfloor {\frac {(n+1)(K+1)}{N+2}}\right\rfloor$
Varianza	${\frac {nK}{N}}\left({\frac {N-K}{N}}\right)\left({\frac {N-n}{N-1}}\right)$
Coeficiente de simetría	${\frac {(N-2K)(N-1)^{\frac {1}{2}}(N-2n)}{[nK(N-K)(N-n)]^{\frac {1}{2}}(N-2)}}$
Curtosis	$\left[{\frac {N^{2}(N-1)}{n(N-2)(N-3)(N-n)}}\right]$ $\cdot \left[{\frac {N(N+1)-6N(N-n)}{m(N-m)}}\right.$ $+\left.{\frac {3n(N-n)(N+6)}{N^{2}}}-6\right]$
Función generadora de momentos (mgf)	${\frac {{N-K \choose n}\scriptstyle {\,_{2}F_{1}(-n,-K;N-K-n+1;e^{t})}}{N \choose n}}\,\!$
Función característica	${\frac {{N-K \choose n}\scriptstyle {\,_{2}F_{1}(-n,-K;N-K-n+1;e^{it})}}{N \choose n}}$
[editar datos en Wikidata]