Coeficiente de correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
![](http://upload.wikimedia.org/wikipedia/commons/thumb/3/34/Correlation_coefficient.png/300px-Correlation_coefficient.png)
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas y continuas.
Definición
editarPara una población
editarEl coeficiente de correlación de Pearson cuando se aplica a una población típicamente se representa por la letra griega (rho) y se refiere a ella coeficiente de correlación poblacional o el coeficiente de correlación poblacional de Pearson.
Dado un par de variables aleatorias , el coeficiente de correlación poblacional de Pearson (también denotado por ) se define como
donde
- es la covarianza de
- es la desviación estándar de la variable
- es la desviación estándar de la variable
Para una muestra
editarEl coeficiente de correlación de Pearson cuando es aplicado a una muestra, se suele denotar por y se refiere a este como el coeficiente de correlación muestral o el coeficiente de correlación muestral de Pearson. Dados pares de datos , se define el coeficiente de correlación muestral de Pearson como
donde
- es el tamaño de la muestra.
- son puntos muestrales individuales indexados con .
- denota la media muestral definida por (análogamente para ).
El coeficiente de correlación muestral también puede ser escrito como
Interpretación
editarEl valor del índice de correlación varía en el intervalo , indicando el signo el sentido de la relación:
- Si , existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.
- Si entonces existe una correlación positiva.
- Si entonces no existe relación lineal pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.
- Si , existe una correlación negativa.
- Si , existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación opuesta: cuando una de ellas aumenta, la otra cambia su signo en proporción constante.
Véase también
editarEnlaces externos
editar- Correlación de Pearson en el Departamento de Psicología de la Universidad de Oviedo.
- Weisstein, Eric W. «Correlation Coefficient». En Weisstein, Eric W, ed. MathWorld (en inglés). Wolfram Research.