Prueba de Shapiro-Wilk
En estadística, la prueba de Shapiro-Wilk se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hipótesis nula que una muestra proviene de una población normalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk.[1] Se considera uno de las pruebas más potentes para el contraste de normalidad.
El estadístico de la prueba es:
donde
- (con el subíndice entre paréntesis) es el número que ocupa la -ésima posición en la muestra (con la muestra ordenada de menor a mayor);
- es la media muestral;
- las variables se calculan[2]
- donde
- siendo los valores medios del estadístico ordenado, de variables aleatorias independientes e identicamente distribuidas, muestreadas de distribuciones normales y denota la matriz de covarianzas de ese estadístico de orden.
La hipótesis nula se rechazará si es demasiado pequeño.[3] El valor de puede oscilar entre 0 y 1.
Interpretación: Siendo la hipótesis nula que la población está distribuida normalmente, si el p-valor es menor a alfa (nivel de significancia) entonces la hipótesis nula es rechazada (se concluye que los datos no vienen de una distribución normal). Si el p-valor es mayor a alfa, se concluye que no se puede rechazar dicha hipótesis.
La normalidad se verifica confrontando dos estimadores alternativos de la varianza σ²:
- un estimador no paramétrico al numerador, y
- un estimador paramétrico (varianza muestral), al denominador.
Véase también
editarReferencias
editar- ↑ Shapiro, S. S.; Wilk, M. B. (1965). «An analysis of variance test for normality (complete samples)». Biometrika 52 (3-4): 591-611. doi:10.1093/biomet/52.3-4.591. MR 205384.
- ↑ op cit p. 593
- ↑ op cit p. 605