|
NOTIUNEA DE CORELATIE
Se spune ca doua variabile sunt corelate, daca distributia scorurilor uneia dintre acestea se schimba sub influenta scorurilor celeilalte.
Sa presupunem ca ne intereseaza relatia dintre satisfactia fata de meseria practicata si productivitatea muncii pentru muncitorii unei fabrici. Daca aceste doua variabile sunt corelate, atunci nivelele de productivitate a muncii vor varia sub influenta nivelelor de satisfactie. Tabelul 1 prezinta relatia in discutie pentru un esantion de 173 de muncitori (date fictive).
Productivitatea
(Y)
Satisfactia fata de meserie (X)
TOTAL
Scazuta
Medie
Inalta
Inalta
10
15
27
52
Medie
20
25
18
63
Scazuta
30
21
7
58
TOTAL
60
61
52
173
Ca si pana acum, intr-un tabel cu dubla intrare vom urma conventia tacita de a lua denumirile categoriilor variabilei independente (X) drept capete de coloane, iar denumirile categoriilor variabilei dependente (Y) drept capete de randuri.
Intr-un astfel de tabel, distributiile de frecvente "pe coloana" sunt numite distributii conditionate ale variabilei dependente, deoarece prezinta distributia scorurilor variabilei dependente pentru fiecare scor (conditie) al (a) variabilei independente. De pilda, in tabelul 1, prima coloana din stanga arata ca din 60 de muncitori cu satisfactie scazuta fata de meseria practicata, 10 sunt inalt productivi, 20 sunt mediu productivi, iar 30 au o productivitate scazuta. Inspectarea acestor distributii conditionate ne permite sa observam efectele variabilei independente asupra variabilei dependente. Astfel, constatam ca distributiile conditionate ale variabilei productivitate se schimba in functie de diferitele scoruri ale variabilei satisfactie. De pilda, jumatate dintre muncitorii cu satisfactie scazuta fata de meserie (30) au o productivitate scazuta, in timp ce peste jumatate dintre muncitorii cu satisfactie inalta fata de meserie (27) au o productivitate inalta. Aceasta arata ca productivitatea in munca si satisfactia fata de meseria aleasa sunt corelate.
In tabelul 1, compararea distributiilor conditionate ale variabilei dependente este usor de facut, deoarece marginalele coloanelor au valori apropiate. In mod obisnuit, nu aceasta este situatia si de aceea este util sa controlam distributiile conditionate care dau totaluri diferite prin calcularea procentelor corespunzatoare in sensul variabilei independente (pe coloane) si apoi sa le comparam in sensul variabilei dependente (pe randuri). In tabelul 2 sunt prezentate procentele pentru datele din tabelul 1 (valori rotunjite), calculate in modul indicat.
Tabelul 2 Productivitatea si satisfactia fata de meseria practicata
(in procente)
Productivitatea
(Y)
Satisfactia fata de meserie (X)
Scazuta
Medie
Inalta
Inalta
17%
25%
52%
Medie
33
41
35
Scazuta
50
34
13
TOTAL
100%
(60)
100%
(61)
100%
(52)
Sa observam ca in tabelul 2, marginalele randurilor au fost omise, iar marginalele coloanelor, fata de care au fost calculate procentele, sunt prezentate intre paranteze.
Putem vedea imediat ca pozitia celulei cu cea mai mare frecventa relativa se schimba de la o coloana la alta. Astfel, pentru muncitorii cu un nivel de satisfactie scazut, celula cu cea mai mare frecventa relativa (50%) se afla pe ultimul rand; pentru muncitorii cu un nivel mediu de satisfactie, celula cu ea mai mare frecventa relativa (41%) se afla pe randul din mijloc; in fine, pentru muncitorii cu un nivel inalt de satisfactie, celula cu cea mai mare frecventa relativa se afla pe primul rand. Aceste rezultate intaresc concluzia ca exista o corelatie intre cele doua variabile.
Daca doua variabile nu sunt corelate, atunci distributiile conditionate ale variabilei dependente nu se vor modifica de la o coloana la alta sau, altfel spus, distributiile variabilei dependente vor fi aceleasi pentru fiecare conditie a variabilei independente. Daca, de pilda, in loc de variabila satisfactie am lua variabila culoarea parului, am obtine in fiecare celula, probabil, un procent de aproximativ 33,3%.
Daca doua variabile sunt corelate, iar variabilele respective se afla cel putin la nivel ordinal, atunci se poate indica un sens al corelatiei. Acesta poate fi pozitiv (direct) sau negativ (invers). De pilda, daca se constata ca performantele scolare ale unui esantion de elevi intr-o anumita perioada sunt cu atat mai bune cu cat elevii respectivi au afectat un numar mai mare de ore pe saptamana studiului individual in acea perioada, atunci se spune ca intre studiul individual si performantele scolare exista o corelatie pozitiva. Daca se constata ca performantele scolare ale unui esantion de elevi sunt cu atat mai slabe cu cat elevii respectivi au afectat un numar mai mare de ore pe saptamana vizionarii emisiunilor TV, atunci se spune ca intre vizionarea emisiunilor TV si performantele scolare exista o corelatie negativa. In general, doua variabile sunt corelate pozitiv la nivelul unui esantion, daca subiectii din esantion care au scoruri inalte in privinta unei variabile au scoruri inalte si in privinta celeilalte variabile, iar cei care au scoruri joase in privinta unei variabile au scoruri joase in privinta celeilalte variabile. Altfel spus, intr-o corelatie pozitiva, o variabila creste sau descreste in valoare dupa cum creste sau descreste cealalta. Tabelul 2. arata ca variabilele satisfactie si productivitatea muncii sunt corelate pozitiv: un nivel inalt de satisfactie este asociat cu un nivel inalt de productivitate, satisfactia medie este asociata cu productivitatea medie, iar satisfactia scazuta cu productivitatea scazuta. Doua variabile sunt corelate negativ la nivelul unui esantion, daca subiectii din esantion care au scoruri inalte in privinta unei variabile au scoruri joase in privinta celeilalte variabile. Altfel spus, intr-o corelatie negativa, cresterea valorii unei variabile este insotita de descresterea valorii celeilalte variabile. Tabelul 3 prezinta o corelatie negativa intre nivelul de educatie si vizionarea programelor TV (date fictive).
Tabelul 3 Nivelul de educatie si vizionarea programelor TV
(ilustrare pentru "corelatie negativa")
Gradul de urmarire a programelor TV
Nivelul de educatie
Scazut
Mediu
Inalt
Inalt
60%
20%
10%
Mediu
30
60
30
Scazut
10
20
60
TOTAL
100%
100%
100%
Orice corelatie, pozitiva sau negativa, poate fi apreciata dupa taria sau puterea sa. Un caz extrem este cel al corelatiei perfecte. Corelatia dintre doua variabile este perfecta, daca fiecare scor al unei variabile este asociat cu un singur scor al celeilalte variabile, astfel ca scorurile unei variabile pot fi determinate exact pe baza cunoasterii scorurilor celeilalte variabile. Daca, de pilda, intre nivelul de educatie si vizionarea programelor TV ar fi o corelatie (negativa) perfecta, atunci intr-un tabel cu dubla intrare pentru aceste variabile, toate cazurile de pe fiecare coloana ar fi localizate intr-o singura celula, ceea ce ar arata ca nu exista nici o variatie a variabilei Y pentru orice scor dat al variabilei X. O astfel de situatie este prezentata in tabelul 4.
Tabelul 4 Nivelul de educatie si vizionarea programelor TV
(ilustrare pentru "corelatie negativa perfecta")
Gradul de urmarire a programelor TV
Nivelul de educatie
Scazut
Mediu
Inalt
Inalt
100%
0%
0%
Mediu
0
100
0
Scazut
0
0
100
TOTAL
100%
100%
100%
O corelatie perfecta ar putea fi luata drept o dovada puternica pentru o relatie cauzala intre variabile, cel putin pentru esantionul respectiv. Rezultatele prezentate in tabelul 4 ar indica faptul ca, pentru esantionul considerat, este foarte probabil ca singura cauza a gradului de urmarire a programelor TV sa fie nivelul de educatie. De asemenea, o corelatie perfecta ar permite predictii fara eroare de la o variabila la alta. De pilda, daca am sti ca o persoana din esantion are un nivel inalt de educatie, am putea prezice cu exactitate ca gradul de urmarire a programelor TV pentru acea persoana este scazut. Corelatia perfecta este un caz ideal, care nu se intalneste in practica cercetarii psihologice, dar care este luat ca reper pentru aprecierea tariei corelatiilor dintre variabilele de interes.
In cele ce urmeaza, vom prezenta o serie de marimi ale corelatiei, numite coeficienti de corelatie, pentru diferite nivele de masura. Aproape toate aceste marimi sunt concepute astfel incat sa aiba limita inferioara 0, indicand cazul "nici o corelatie", si limita superioara 1 pentru nivelul nominal, respectiv 1 pentru celelalte nivele, indicand cazurile "corelatie pozitiva perfecta" (+1) sau cazul "corelatie negativa perfecta". Acum, valorile coeficientilor de corelatie diferite de 0 si 1 nu au o interpretare directa precisa. Sa presupunem, de pilda, ca valoarea unui astfel de coeficient pentru doua variabile este de 0,40. Aceasta inseamna ca intre cele doua variabile exista o corelatie importanta? A decide ce valoare a unui coeficient de corelatie indica o legatura importanta intre variabile este o chestiune care, pe de o parte, depinde de natura variabilelor considerate si care, pe de alta parte, este intrucatva arbitrara. In plus, dupa cum vom vedea, doi coeficienti de corelatie pot avea valori diferite pentru aceleasi date. Cu toate acestea, se admite ca o interpretare rezonabila a valorii unui coeficient de corelatie se poate da conform urmatorului tabel[1]:
Valoarea coeficientului
Interpretarea
+0,90 +0,99 ( 0,90 1,00)
Corelatie pozitiva (negativa) foarte puternica sau aproape perfecta
+0,70 +0,90 ( 0,70 0,90)
Corelatie pozitiva (negativa) puternica
+0,50 +0,70 ( 0,50 0,70)
Corelatie pozitiva (negativa) moderata
+0,30 +0,50 ( 0,30 0,50)
Corelatie pozitiva (negativa) slaba pana la moderat
+0,01 +0,30 ( 0,01 0,30)
Corelatie pozitiva (negativa) inexistenta sau foarte slaba
De notat ca intervalele de valori se suprapun la extremitati, ceea ce arata ca interpretarea valorii unui coeficient de corelatie ramane relativ vaga.