Distribución T² de Hotelling

En estadística la distribución T² (T-cuadrado) de Hotelling es importante porque se presenta como la distribución de un conjunto de estadísticas que son una generalización natural de las estadísticas subayacentes distribución t de Student. En particular, la distribución se presenta en estadísticas multivariadas en pruebas de diferencias entre las medias (multivariadas) de diferentes poblaciones, donde las pruebas para problemas univariados usarían la Prueba t. Es proporcional a la distribución F.

Función de densidad de probabilidad.Parámetros:p - dimensión de las variables aleatorias.m - relacionado con el tamaño de la muestra.

La distribución recibe su nombre de Harold Hotelling, quien la desarrollo[1]​ como una generalización de la distribución t de Student.

Definición

editar

Si el vector   tiene distribución normal multivariada con media cero y matriz de covarianza unitaria   y   es una matriz de tamaño   con matriz unitaria escalada y   los grados de libertad con distribución de Wishart   entonces la forma cuadrática   tiene distribución de Hotelling con parámetros   y  :

 

Si la variable aleatoria   tiene distribución T-cuadrado de Hotelling con parámetros   y  ,  , entonces

 

donde   es la distribución F con parámetros   y  .

Estadística T-cuadrado de Hotelling

editar

La estadística T-cuadrado de Hotelling es una generalización de la estadística t de Student que se usa en las pruebas de hipótesis multivariadas, y se define como sigue:[1]

Sea  , que denota una distribución normal p-variada con vector de medias   y covarianza  . Sean

 

  variables aleatorias independientes, las cuales pueden representarse como un vector columna de orden   de números reales. Defínase

 

como la media muestral. Puede demostrarse que

 

donde   es una distribución ji-cuadrado con p grados de libertad. Para demostrar eso se usa el hecho que   y entonces, al derivar la función característica de la variable aleatoria  

 

Sin embargo,   es por lo general desconocida y se busca hacer una prueba de hipótesis sobre el vector de medias  .

Defínase

 

como la covarianza muestral. La traspuesta se ha denotado con un apóstrofo. Se demuestra que   es una matriz definida positiva y   sigue una distribución Wishart p-variada con n−1 grados de libertad.[2]​ La estadística T-cuadrado de Hotelling se define entonces como

 

porque se demuestra que [cita requerida]

 

es decir

 

donde   es una distribución   con parámetros   y  . Para calcular un p-valor, multiplique la estadística t2 y la constante anterior y use la distribución  .

Referencias

editar
  1. a b Hotelling, H. (1931). «The generalization of Student's ratio». Annals of Mathematical Statistics 2 (3): 360-378. doi:10.1214/aoms/1177732979. 
  2. K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press.