|
ANOVA PENTRU DOUA VARIABILE INDEPENDENTE
Testul ANOVA pentru doua variabile independente este o extindere a testului ANOVA pentru o singura variabila independenta, cu exceptia faptului ca formulele testului expus in aceasta sectiune sunt aplicabile doar in cazul grupurilor independente cu acelasi numar de subiecti in fiecare grup. Vom folosi aceeasi maniera de expunere ca mai sus: vom prezenta un exemplu ipotetic, un tabel de calcule initiale, formulele de calcul ale testului ANOVA pentru doua variabile independente, precum si modelul in patru pasi specific acestui test.
20 de elevi sunt supusi unui experiment privind metodele de instruire in matematica. Variabila independenta, A, este, deci, metoda de instruire. Elevii sunt repartizati aleatoriu in doua clase: o clasa la care se utilizeaza metoda traditionala (A1) si o clasa la care se utilizeaza o metoda moderna (A2). Variabila independenta, B, este nivelul IQ, cu categoriile : B1 (< 90) si B2 ( 90). Informatia prezentata la cele doua clase este aceeasi. La sfarsitul perioadei de instruire elevii dau acelasi test. Rezultatul (scorul) obtinut la acest test este variabila dependenta. Experimentul permite evaluarea a trei efecte: (i) efectul principal al variabilei A (daca una dintre metode conduce la rezultate diferite fata de cealalta), (ii) efectul principal al variabilei B (daca elevii cu un IQ superior obtin rezultate diferite fata de ceilalti), (iii) interactiunea A B (daca efectul unei variabile independente difera in functie de un anumit nivel al celeilalte variabile independente).
Dupa cum reiese si din cele de mai sus, un astfel de experiment are mai multe avantaje. Mai intai, prin analiza simultana a doua variabile independente se realizeaza, de fapt, doua cercetari altfel distincte. Pe langa investigarea modului in care diferitele categorii ale celor doua variabile independente afecteaza variabila dependenta, se poate verifica daca nivelele uneia dintre variabilele independente afecteaza variabila dependenta in acelasi fel ca si nivelele celeilalte variabile independente. Apoi, este vorba despre investigarea interactiunii dintre doua variabile independente. Intrucat, in situatiile reale, efectul unei variabile independente este adesea afectat de una sau mai multe variabile independente, studiul interactiunii dintre variabilele independente poate fi un obiectiv foarte important al cercetarii.
Revenind la exemplul nostru ipotetic, datele obtinute, impreuna cu marimile necesare pentru ANOVA sunt prezentate in urmatorul tabel:
Nivelul IQ (B)
TA1 = 804
nA1 = 10
A1 = 80,40
Traditionala (A1)
75
70
69
72
68
90
95
89
85
91
TA1B1 = 354
nA1B1 = 5
A1B1 = 70,80
ΣA1B1 = 25094
TA1B2 = 450
nA1B2 = 5
A1B2 = 90,00
ΣA1B2 = 40552
Moderna (A2)
85
87
83
90
89
87
94
93
89
92
TA2 = 788
nA2 = 10
A2 = 88,90
TA2B1 = 434
nA2B1 = 5
A2B1 = 86,80
ΣA2B1 = 37704
TA2B2 = 455
nA2B2 = 5
A2B2 = 91,00
ΣA2B2 = 41439
TB1 = 788
nB1 = 10
B1 = 78,80
TB2 = 905
nB2= 10
B2 = 90,50
In ANOVA pentru doua variabile independente se testeaza trei ipoteze de nul, fiecare corespunzand unei surse de variatie:
H01: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale
rezultatelor obtinute prin cele doua metode.
H02: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale
rezultatelor obtinute de elevii cu nivele IQ diferite.
H03: La nivelul populatiei nu exista interactiune intre cele doua variabile.
H01 corespunde variatiei mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei A. H02 corespunde variatiei mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei B. H03 corespunde variatiei mediilor aritmetice ale scorurilor variabilei dependente din categoriile combinate A B.
In acest caz, se calculeaza cinci sume de patrate: (1) SSTOTAL, (2) SSA, (3) SSB,
(4) SSA B si (5)SSEROARE.
SSTOTAL se calculeaza cu ajutorul formulei 1:
Si aici, atunci cand calculam SSTOTAL, este recomandabil sa retinem termenii diferentei, 144789 si 143312,45, pe care ii vom folosi pentru simplificarea calculelor ulterioare.
Formula 2 este modificata corespunzator pentru calculul SSA si SSB. Astfel, SSA se calculeaza cu ajutorul urmatoarei formule:
Formula 7
In aceasta formula, Ta este un simbol general pentru TA1 si TA2, iar na este un simbol general pentru nA1 si nA2. Prin urmare, atunci cand calculam SSA, luam in considerare doar grupurile variabilei independente A.
SSB se calculeaza cu ajutorul urmatoarei formule:
Formula 8
In aceasta formula, Tb este un simbol general pentru TB1 si TB2, iar nb este un simbol general pentru nB1 si nB2. Prin urmare, atunci cand calculam SSB, luam in considerare doar grupurile variabilei independente B.
Calculam acum SSA B, cu ajutorul urmatoarei formule:
Formula 9
In aceasta formula, Tab este un simbol general pentru TA1B1, TA1B2, TA2B1 si TA2B2, iar nab este un simbol general pentru nA1B1, nA1B2, nA2B1 si nA2B2. Prin urmare, atunci cand calculam SSA B, luam in considerare grupurile constituite dupa categoriile combinate
A B.
=
Si aici vom retine unul dintre termenii diferentei, si anume 144639,40, pe care il vom folosi pentru calculul SSEROARE, dupa urmatoarea formula:
Formula 10
Ambele cantitati cerute de aceasta formula au fost calculate anterior, cand am obtinut SSTOTAL si, respectiv, SSA B, asa incat vom prelua direct rezultatele respective in calculul SSEROARE:
De notat ca SSTOTAL = SSA + SSB + SSA B + SSEROARE. Aceasta relatie poate fi utilizata pentru a controla corectitudinea calculelor.
Mediile aritmetice ale sumelor de patrate pentru fiecare sursa de varianta se calculeaza prin impartirea sumei de patrate respectiva la numarul corespunzator de grade de libertate.
Formula 11
In aceasta formula, kA este numarul de grupuri constituite dupa categoriile variabilei A, iar kA - 1 este numarul de grade de libertate asociate SSA, notat cu glA. In exemplul nostru,
Formula 12
In formula 12, kB - 1 este numarul de grupuri constituite dupa categoriile variabilei B, iar kB - 1 este numarul de grade de libertate asociate SSB, notat cu glB. In exemplul nostru,
Formula 13
In formula 13, (kA - 1)(kB - 1) este numarul de grade de libertate asociat SSA B, notat cu glA B. In exemplul nostru,
Formula 14
In formula 14, N - kAkB este numarul de grade de libertate asociat SSEROARE, notat cu glEROARE.
Valoarea pentru F (obtinut) se calculeaza pentru fiecare sursa de varianta sistematica (efectele principale pentru A, pentru B si pentru interactiunea A B). Prezentam in continuare formulele de calcul pentru FA (obtinut), FB (obtinut) si FA B (obtinut), impreuna cu calculele respective, corespunzatoare exemplului nostru.
Formula 15
Formula 16
Formula 17
Pentru luarea deciziei, fiecare valoare pentru F (obtinut) se compara cu F (critic). Intrucat in fiecare caz din exemplul nostru, glEROARE = 16, iar numarul de grade de libertate din numarator pentru media aritmetica este egal cu 1 (glA = glB = glA B = 1), pentru α = 0,05, F (critic) = 4,4940 sau, rotunjit, 4,49[1]. Deoarece fiecare F (obtinut) este mai mare decat F (critic), toate cele trei ipoteze de nul pot fi respinse. De notat ca toate cele trei ipoteze de nul pot fi respinse (rezultatele experimentului sunt semnificative) si pentru α = 0,01, pentru care F (critic) = 8,53.
In termenii modelului in patru pasi, testul ANOVA pentru doua variabile independente decurge astfel:
H01: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale rezultatelor obtinute prin cele doua metode.
Ha1: La nivelul populatiei mediile aritmetice ale rezultatelor obtinute prin cele doua metode difera.
H02: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale rezultatelor obtinute de elevii cu nivele IQ diferite.
Ha2: La nivelul populatiei mediile aritmetice ale rezultatelor obtinute de elevii cu nivele IQ diferite difera.
H03: La nivelul populatiei nu exista interactiune intre cele doua variabile.
Ha3: La nivelul populatiei exista interactiune intre cele doua variabile.
Pasul 2 Selectarea distributiei de esantionare si stabilirea zonelor critice.
Distributia de esantionare = distributia F
α = 0,05
glEROARE = 16
glA = glB = glA B = 1
F (critic) = 4,49
Organizarea calculului ANOVA pentru doua variabile independente se face cu ajutorul unui tabel de calcule initiale (v. tabelul 3), precum si al unui tabel ANOVA rezumativ (tabel al surselor de variatie). In acest caz, forma generala a unui astfel de tabel este urmatoarea:
Sursa de
variatie
Sume de
patrate
Grade de
libertate
Medii ale
sumelor
F (obtinut)
SSA
kA 1
MSA
MSA/MSEROARE
SSB
kB 1
MSB
MSB/MSEROARE
SSA B
(kA 1)(kB 1)
MSA B
MSA B/MSEROARE
SSEROARE
N kAkB
MSEROARE
SSTOTAL
N 1
In exemplul nostru, avem urmatorul tabel:
Sursa de
variatie
Sume de
patrate
Grade de
libertate
Medii ale
sumelor
F (obtinut)
361,25
1
361,25
38,64
684,45
1
684,45
73,20
281,25
1
281,25
30,08
149,60
16
9,35
1476,55
19
Pasul 4 Luarea deciziei
Intrucat fiecare valoare pentru F (obtinut) este mai mare decat valoarea pentru F (critic), se resping cele trei ipoteze de nul. Pentru efectul principal al variabilei A, concluzia este ca la nivelul populatiei, mediile aritmetice ale rezultatelor obtinute prin cele doua metode difera semnificativ. Pentru efectul principal al variabilei B, concluzia este ca la nivelul populatiei, mediile aritmetice ale rezultatelor obtinute de elevii cu nivele IQ diferite difera semnificativ. Enuntul de probabilitate asociat ambelor concluzii este urmatorul: probabilitatea ca diferentele observate intre mediile aritmetice ale grupurilor constituite dupa categoriile unei variabile independente sa apara din intamplare, daca H0 respectiva ar fi in realitate adevarata, este mai mica de 0,05 (si dupa cum am vazut, chiar decat 0,01).
Pentru interactiune, concluzia este ca la nivelul populatiei exista o interactiune intre metoda de instruire si nivelul IQ al subiectilor. Enuntul de probabilitate asociat acestei concluzii este urmatorul: probabilitatea ca diferentele observate intre mediile aritmetice ale scorurilor din categoriile combinate ale celor doua variabile sa apara din intamplare, daca H03 ar fi in realitate adevarata, este mai mica de 0,05 (si decat 0,01).
[1] Evident, daca cele trei grade de libertate ar fi fost diferite, am fi avut trei valori pentru F (critic).