Análisis de la covarianza

El análisis de la covarianza o ANCOVA, acrónimo del inglés analysis of covariance, es un modelo lineal general con una variable cuantitativa y uno o más factores. El ANCOVA es una fusión del ANOVA y de la regresión lineal múltiple. Es un procedimiento estadístico que permite eliminar la heterogeneidad causada en la variable de interés (variable dependiente) por la influencia de una o más variables cuantitativas (covariables). Básicamente, el fundamento del ANCOVA es un ANOVA al que a la variable dependiente se le ha eliminado el efecto predicho por una o más covariables por regresión lineal múltiple. La inclusión de covariables puede aumentar la potencia estadística porque a menudo reduce la variabilidad.

Ecuaciones

editar

ANCOVA de un factor

editar

El análisis de un factor es apropiado cuando se dispone de tres o más grupos. En los diseños equilibrados, cada grupo tiene el mismo número de datos (individuos), los cuales idealmente han sido asignados al azar a cada grupo a partir de una muestra original preferiblemente homogénea.

Calculando la suma de las desviaciones al cuadrado para la variable independiente X y la variable dependiente Y

editar

Las sumas de las desviaciones al cuadrado o sumas de cuadrados (SS):  ,  , y   deben ser calculadas usando las siguientes ecuaciones para la variable dependiente, Y. La SS para la covariable también debe ser calculada; los dos valores necesarios son   y  .

La suma de cuadrados total define una la variabilidad del total de individuos  :

 

La suma de cuadrados para los tratamientos define la variabilidad entre las poblaciones o grupos.   representa el número de grupos.

 

La suma de cuadrados del error define la variabilidad residual dentro de cada grupo.   representa el número de individuos en un grupo dado:

 

La suma de cuadrados total es igual a la suma de cuadrados de los tratamientos y la suma de cuadrados del error (propiedad de aditividad de las sumas de cuadrados y de los grados de libertad, característica del ANOVA).

 

Cálculo de la covarianza de X e Y

editar

La sumas de las covarianzas (  y  ) definen la covarianza de X e Y.

 
 

Ajuste de SSTy

editar

Las correlaciones entre X e Y son   para el total y   para el error.

 
 

La proporción de covarianza es sustraída de la dependiente; valores de  :

 
 
 

Ajuste de las medias de cada grupo k

editar

La media de cada grupo es ajustada del siguiente modo:

 

Análisis usando los valores de la suma de cuadrados

editar

Finalmente obtenemos la varianza de los tratamientos libre de la covarianza, donde   (grados de libertad de los tratamientos) es igual a   y   (grados de libertad del error) es igual a  . Puede apreciarse que cada covariable elimina un grado de libertad.

 
 

El estadístico F se obtiene de:

 

Véase también

editar

Enlaces externos

editar