|
Corelatia
Corelatia masoara variatia concomitenta (covariatia) a doi factori. Nu masoara cauzalitatea.
Se noteaza rxy = corelatia dintre variabilele x si y.
De fiecare dat se iau in calcul variabile perechi.
Exemplu:
Subiecti Note matematica Note fizica x2 y2 xy
x y
A 7 7 49 49 49
B 9 8 81 64 72
C 10 9 100 81 90
D 6 7 36 49 42
E 9 10 81 100 90
F 8 7 64 49 56
G 5 6 25 36 30
H 3 4 9 16 12
I 7 6 49 36 42
J 8 7 64 79 56
K 6 7 36 49 42
L 7 7 49 49 49
M 6 6 36 36 36
N 5 6 25 36 30
n=14; T1=96 T2=97 ax2=704;ay2=699; axy=696;
. daca este orientat spre dreapta - corelatie directa sau pozitiva (creste x, cretse si y);
. daca este orientat spre stanga - corelatie indirecta sau negativa (una creste, alta scade).
Coeficientul de corelatie variaza, indiferent de formula, intre -1 si 1. Cu cat este mai aproape de 1, cu atat corelatia este mai puternica. In jurul lui 0, relatia este de independenta.
1. Coeficienti de corelatie
- se aplica asupra unor siruri de valori
a) Coeficientul BRAVAIS - PIERSON (sau coeficientul de corelatie prin momentul produselor).
Formula de calcul este urmatoarea:
b) Coeficientul biserial (intre o variabila continua si una dihotomica).
. N>50
Cote la test 0 1 2 3 4 5 6 7 8 9 10 Total
Rezultate
la examen
Admisi 0 1 0 3 5 10 16 11 6 3 159
Respinsi 1 2 4 7 13 22 9 4 2 0 054
Total 1 3 4 10 18 32 25 15 8 3 1 113
Se calculeaza proportia celor admisi / respinsi.
p = Padmisi= q = Prespinsi=;
rbis=,
unde: m1 = media valorilor x pentru elementele clasei superioare
(variabila continua);
m2 = media valorilor x pentru elementele clasei inferioare;
s = abaterea standard a intregii colectivitati;
pq / y = se citeste intr-un tabel special, in care se ia ca reper
fie p, fie q.
In exemplul nostru, ; s = 1.88;
Cu cat este mai semnificativ numarul subiectilor (mai mare), cu atat rbis scade.
c) Coeficientul de corelatie triserial
. avem aceeasi variabila continua, iar variabila discreta este trihotomica.
rtris = ;
unde, m1 = mediile la testul X pentru cei buni;
m2 = mediile la testul X pentru cei slabi;
s = abaterea standard pentru intreaga populatie;
= proportia de buni;
= proportia de slabi.
d) Coeficientul eneahoric
Exemplu:
Pentru stabilirea relatiei dintre inteligenta si timpul de reactie, s-au folosit doua probe, obtinandu-se urmatoarele rezultate:
y Slabi Medii Buni
x
(7) (15) (3) D = 10
Buni n4 n1
Medii (9) (14) (7)
Slabi (5) n3 (12) (18) n2 C = 23
B = 12 A = 21
unde, A,B,C,D sunt totaluri pe orizontala si pe verticala, dar considerand numai colturile.
r =
Daca A+B = C+D
A = B formula lui COUMETOU: r = 2g, unde
C = D g = ;
e) Coeficientul de corelatie multipla ( R )
Se calculeaza atunci cand avem mai multi factori, ce concura la un anumit efect.
2. Coeficienti neparametrici
a) j - se aplica pentru doua distributii dihotomice.
Exemplu:
INITIATIVA
0 1
RAPIDITATE 1 30 50(c)
0 55 9
j = , unde a = (total ranul 1) / (total general)
b = (total coloana a doua) / (total general)
In exemplul nostru, T = 30+50+55+9=144;
a =
b =
c =
b) Coeficientul de corelatie a rangurilor (Spearman)
r=
Exemplu: Clasificarea dupa frecventa controlului si calitate.
Subiecti x y d d2
A 1 4 -3 9
B 2 2 0 0
C 3 10 -7 49
D 4 5 -1 1
E 5.5 1 4.5 20.25
F 5.5 3 2.5 6.25
G 7 8.5 -1.5 2.25
H 8 8.5 -0.5 0.25
I 9 7 2 4
J 10 6 4 16
r=0.36.
Daca avem mai multi coeficienti de corelatie si vrem sa ne referim la aceasta colectie, se foloseste mediana.