Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Marimi ale corelatiei la nivel nominal

MARIMI ALE CORELATIEI LA NIVEL NOMINAL


Cele mai utilizate marimi ale corelatiei dintre variabile masurate la nivel nominal sunt coeficientul φ, coeficientul de contingenta C, coeficientul V al lui Cramer si coeficientul λ.

Coeficientii φ, C si V sunt marimi ale corelatiei bazate pe χ2. Coeficientul φ se calculeaza cu ajutorul urmatoarei formule:


Formula 1




Sa consideram din nou tabelul 10.1, in care se prezentau datele (fictive) ale unui studiu privind sexul si dominanta functional-operativa a mainilor, reprodus aici ca tabelul 5.


Tabelul 5 Sexul si dominanta functional operativa a mainilor

Dominanta

Sexul

TOTAL

Masculin

Feminin

Dreapta

15

35

50

Stanga

30

10

40

Ambidextru

5

5

10

TOTAL

50

50

100


Dupa cum am constatat prin aplicarea testului χ2, relatia dintre cele doua variabile este statistic semnificativa, i.e valoarea χ2 (obtinut) = 18 s-a dovedit a fi semnificativa la un nivel de incredere de 95%. Ceea ce ne intereseaza acum este taria corelatiei. Aplicand formula 1, obtinem:



Valoarea φ = 0,42 indica o corelatie cel mult moderata intre sex si dominanta functional-operativa a mainilor. Relatia dintre aceste variabile este statistic semnificativa (χ2), dar nu este puternica. Problema este ca φ ia valori cuprinse intre 0 (nici o corelatie) si 1 (corelatie perfecta) numai pentru tabele 2 2. Pentru tabelele de mare dimensiune, φ poate depasi valoarea 1, ceea ce face ca interpretarea acestui coeficient sa devina problematica. Oricum, dupa cum vom vedea, valoarea lui φ obtinuta pentru exemplul de mai sus este foarte apropiata de valorile obtinute prin calcularea celorlalti coeficienti de corelatie mentionati.

Coeficientul C se calculeaza cu ajutorul urmatoarei formule:


Formula 2


Aplicand aceasta formula la datele din tabelul 5, obtinem:



Deficienta coeficientului C este aceea ca, fiind o marime subunitara, nu poate lua niciodata valoarea 1. Se demonstreaza ca pe masura ce dimensiunea tabelului creste, C tinde catre 1. De pilda, valoarea maxima a lui C este 0,82 pentru un tabel 3 3 si 0,87 pentru un tabel 4 4. De aceea, se recomanda folosirea acestui coeficient numai pentru tabele de mare dimensiune (aproximativ de la 10 linii sau/si coloane in sus).

Coeficientul V se calculeaza cu ajutorul urmatoarei formule:


Formula 3

in care q este cea mai mica dintre valorile numerice r (numar de randuri) si c (numar de coloane) pentru tabelul respectiv. Aplicand formula 3 la datele din tabelul 5 obtinem:



Dupa cum se poate constata, rezultatul obtinut prin calcularea coeficientului V este acelasi cu cel obtinut prin calcularea coeficientului φ. Coeficientul V are valoarea maxima 1, dar numai pentru tabele mai mari de 2 2.

Cu toate deficientele lor, intrucat sunt usor de calculat, coeficientii φ, C si V pot fi folositi in calitate de primi indici ai importantei unei corelatii.

In situatii de cercetare mai pretentioase se obisnuieste sa se utilizeze coeficientul λ., care ia valori cuprinse intre 0 si 1. In cazul in care nu se doreste sau nu se poate identifica variabila independenta, se foloseste varianta simetrica a coeficientului λ, a carui formula de calcul este urmatoarea:


Formula 4

in care nmx = cea mai mare frecventa in coloana x

nmy = cea mai mare frecventa in randul y

nmc = cel mai mare marginal de coloana

nmr = cel mai mare marginal de rand


Sa presupunem ca intr-o cercetare privind relatia dintre apartenenta religioasa si atitudinea fata de pedeapsa capitala s-au obtinut rezultatele din tabelul 6.


Tabelul 6 Apartenenta religioasa si atitudinea

fata de pedeapsa capitala

Atitudinea

Apartenenta religioasa

Crestin-ortodox

Catolic

Altele

Nici

una

TOTAL

Favorabila

5

10

9

14

38

Neutra

10

14

12

6

42

Impotriva

25

11

4

10

50

TOTAL

40

35

25

30

130


Pentru datele din acest tabel avem:



Aplicand formula 4, obtinem:



Daca se poate identifica variabila independenta, atunci se foloseste varianta asimetrica a coeficientului λ, notat λy, a carui formula de calcul este urmatoarea:


Formula 5


Considerand exemplul de mai sus, daca cercetatorul identifica drept variabila independenta apartenenta religioasa, atunci se obtine:



Pentru cele mai multe situatii de cercetare, interpretarea celor doua variante ale coeficientului λ este similara interpretarii coeficientilor C si V. Pentru exemplul considerat aici, putem conchide ca cele doua variabile sunt corelate, dar ca aceasta corelatie este foarte slaba[1].





[1] Pentru o prezentare detaliata a coeficientului λ ca o marime a reducerii proportionale a erorilor (RPE), vezi Healey, 1984, pp. 223-228.