Correlación | |
---|---|
conceutu matemáticu | |
rellación | |
En probabilidá y estadística, la correlación indica la fuercia y la direición d'una rellación llinial y proporcionalidad ente dos variables estadístiques. Considérase que dos variables cuantitatives tán correlacionadas cuando los valores d'una d'elles varien sistemáticamente con al respective de los valores homónimos de la otra: si tenemos dos variables (A y B) esiste correlación ente elles si al menguar los valores d'A facer tamién los de B y viceversa. La correlación ente dos variables nun implica, por sigo mesma, nenguna rellación de causalidá (Vease cum hoc ergo propter hoc).
Fuercia, sentíu y forma de la correlación
La rellación ente dos variables cuantitatives queda representada por aciu la llinia de meyor axuste, trazada a partir de la nube de puntos. Los principales componentes elementales d'una llinia d'axuste y, poro, d'una correlación, son la fuercia, el sentíu y la forma:
- La fuercia estrema según el casu, mide'l grau en que la llinia representa a la nube de puntos: si la nube ye estrecha y allargada, representar por una llinia recta, lo qu'indica que la rellación ye fuerte; si la nube de puntos tien un enclín elípticu o circular, la rellación ye débil.
- El sentíu mide la variación de los valores de B con al respective de A: si al crecer los valores d'A facer los de B, la rellación ye direuta (pendiente positiva); si al crecer los valores d'A mengüen los de B, la rellación ye inversa (pendiente negativa).
- La forma establez el tipu de llinia que define'l meyor axuste: la llinia recta, la curva monotónica o la curva non monotónica
Coeficientes de correlación
Esisten diversos coeficientes que miden el grau de correlación, afechos a la naturaleza de los datos. El más conocíu ye'l coeficiente de correlación de Pearson (introducíu en realidá por Francis Galton), que se llogra estremando la covarianza de dos variables ente'l productu de les sos esviaciones estándar. Otros coeficientes son:
- Coeficiente de correlación de Spearman
- Correlación de Kendall
- Correlación canónica
- Coeficiente de Correlación Intraclase
- Coeficiente de Correlación Biserial
- Correlación Poliserial
- Correlación Tetracórica
- Correlación Policórica
- Correlación de Kendall
- Correlación de Jaspen
- Correlación de Fechner
Interpretación xeométrica
Daos los valores muestrales de dos variables aleatories y , que pueden ser consideraes como vectores nun espaciu a n dimensiones, pueden construyise los "vectores centraos" como:
y .
El cosenu del ángulu alfa ente estos vectores ye dau pola fórmula siguiente:
Pos ye'l coeficiente de correlación muestral de Pearson. El coeficiente de correlación ye'l cosenu del ángulu ente dambos vectores centraos:
- Si r = 1, l'ángulu °, dambos vectores son colineales (paralelos).
- Si r = 0, l'ángulu °, dambos vectores son ortogonales.
- Si r =-1, l'ángulu °, dambos vectores son colineales de direición opuestu.
Más xeneralmente: .
De xacíu, dende'l puntu vista xeométricu, nun falamos de correlación llinial: el coeficiente de correlación tien siempres un sentíu, cualesquier sía'l so valor ente -1 y 1. Infórmanos de manera precisa, non tantu sobre'l grau de dependencia ente les variables, sinón sobre la so distancia angular na hiperesfera a n dimensiones.
La Iconografía de les correllaciones ye un métodu d'analís multidimensional que reposa nesta idea. La correlación llinial dase cuando nuna nube de puntos atópense o se distribúin alredor d'una recta.
La fórmula de correlación pa dos series distintes con ciertu desfase "k", ta dada pola fórmula:
Distribución del coeficiente de correlación
El coeficiente de correlación muestral o analíticu d'una muestra ye de fechu una variable aleatoria, eso significa que si repitimos un esperimentu o consideramos distintes muestres van llograse valores distintos y por tanto'l coeficiente de correlación muestral calculáu a partir d'elles va tener valores llixeramente distintos. Pa muestres grandes la variación en dichu coeficiente va ser menor que pa muestres pequeñes. R. A. Fisher foi'l primeru en determinar la distribución de probabilidá pal coeficiente de correlación.
Si los dos variables aleatories que trata de rellacionase vienen de una distribución gaussiana bivariante entós el coeficiente de correlación r sigue una distribución de probabilidá dada por:[1][2]
onde:
- ye la distribución gamma
- ye la función gaussiana hipergeométrica.
Nótese que'l valor esperáu del coeficiente de correlación muestral r ye:
por tanto, r ye estimador sesgado de . Puede llograse un estimador averáu non sesgado resolviendo la ecuación:
pa
Anque, la solución:
ye subóptima. Puede llograse un estimador sesgado con mínima varianza pa grandes valores de n, con sesgu d'orde buscando'l máximu de la espresión:
, i.e.
Nel casu especial de que , la distribución orixinal pue ser reescrita como:
onde ye la función beta.
Referencies
- ↑ Kenney, J. F. and Keeping, Y. S., Mathematics of Statistics, Pt. 2, 2nd ed. Princeton, NJ: Van Nostrand, 1951.
- ↑ Correlation Coefficient - Bivariate Normal Distribution
Enllaces esternos
- Diccionariu Estadísticu - Divestadística (en castellán)
- Simulación de la correlación ente dos variables discretes con R (llinguaxe de programación)