Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Anova pentru doua variabile independente

ANOVA PENTRU DOUA VARIABILE INDEPENDENTE

Testul ANOVA pentru doua variabile independente este o extindere a testului ANOVA pentru o singura variabila independenta, cu exceptia faptului ca formulele testului expus in aceasta sectiune sunt aplicabile doar in cazul grupurilor independente cu acelasi numar de subiecti in fiecare grup. Vom folosi aceeasi maniera de expunere ca mai sus: vom prezenta un exemplu ipotetic, un tabel de calcule initiale, formulele de calcul ale testului ANOVA pentru doua variabile independente, precum si modelul in patru pasi specific acestui test.

20 de elevi sunt supusi unui experiment privind metodele de instruire in matematica. Variabila independenta, A, este, deci, metoda de instruire. Elevii sunt repartizati aleatoriu in doua clase: o clasa la care se utilizeaza metoda traditionala (A1) si o clasa la care se utilizeaza o metoda moderna (A2). Variabila independenta, B, este nivelul IQ, cu categoriile : B1 (< 90) si B2 ( 90). Informatia prezentata la cele doua clase este aceeasi. La sfarsitul perioadei de instruire elevii dau acelasi test. Rezultatul (scorul) obtinut la acest test este variabila dependenta. Experimentul permite evaluarea a trei efecte: (i) efectul principal al variabilei A (daca una dintre metode conduce la rezultate diferite fata de cealalta), (ii) efectul principal al variabilei B (daca elevii cu un IQ superior obtin rezultate diferite fata de ceilalti), (iii) interactiunea A B (daca efectul unei variabile independente difera in functie de un anumit nivel al celeilalte variabile independente).



Dupa cum reiese si din cele de mai sus, un astfel de experiment are mai multe avantaje. Mai intai, prin analiza simultana a doua variabile independente se realizeaza, de fapt, doua cercetari altfel distincte. Pe langa investigarea modului in care diferitele categorii ale celor doua variabile independente afecteaza variabila dependenta, se poate verifica daca nivelele uneia dintre variabilele independente afecteaza variabila dependenta in acelasi fel ca si nivelele celeilalte variabile independente. Apoi, este vorba despre investigarea interactiunii dintre doua variabile independente. Intrucat, in situatiile reale, efectul unei variabile independente este adesea afectat de una sau mai multe variabile independente, studiul interactiunii dintre variabilele independente poate fi un obiectiv foarte important al cercetarii.

Revenind la exemplul nostru ipotetic, datele obtinute, impreuna cu marimile necesare pentru ANOVA sunt prezentate in urmatorul tabel:

Tabelul 3 Calcule initiale pentru ANOVA, doua variabile independente

Metoda (A)

Nivelul IQ (B)

B1

B2

TA1 = 804

nA1 = 10

*A1 = 80,40

Traditionala (A1)

75

70

69

72

68

90

95

89

85

91

TA1B1 = 354

nA1B1 = 5

A1B1 = 70,80

ΣA1B1 = 25094

TA1B2 = 450

nA1B2 = 5

*A1B2 = 90,00

ΣA1B2 = 40552

Moderna (A2)

85

87

83

90

89

87

94

93

89

92

TA2 = 788

nA2 = 10

*A2 = 88,90

TA2B1 = 434

nA2B1 = 5

*A2B1 = 86,80

ΣA2B1 = 37704

TA2B2 = 455

nA2B2 = 5

*A2B2 = 91,00

ΣA2B2 = 41439

TB1 = 788

nB1 = 10

*B1 = 78,80

TB2 = 905

nB2= 10

*B2 = 90,50

In ANOVA pentru doua variabile independente se testeaza trei ipoteze de nul, fiecare corespunzand unei surse de variatie:

H01: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale

rezultatelor obtinute prin cele doua metode.

H02: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale

rezultatelor obtinute de elevii cu nivele IQ diferite.

H03: La nivelul populatiei nu exista interactiune intre cele doua variabile.

H01 corespunde variatiei mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei A. H02 corespunde variatiei mediilor aritmetice ale scorurilor variabilei dependente din fiecare categorie a variabilei B. H03 corespunde variatiei mediilor aritmetice ale scorurilor variabilei dependente din categoriile combinate A B.

In acest caz, se calculeaza cinci sume de patrate: (1) SSTOTAL, (2) SSA, (3) SSB,

(4) SSA B si (5)SSEROARE.

SSTOTAL se calculeaza cu ajutorul formulei 1:

Si aici, atunci cand calculam SSTOTAL, este recomandabil sa retinem termenii diferentei, 144789 si 143312,45, pe care ii vom folosi pentru simplificarea calculelor ulterioare.

Formula 2 este modificata corespunzator pentru calculul SSA si SSB. Astfel, SSA se calculeaza cu ajutorul urmatoarei formule:

Formula 7

In aceasta formula, Ta este un simbol general pentru TA1 si TA2, iar na este un simbol general pentru nA1 si nA2. Prin urmare, atunci cand calculam SSA, luam in considerare doar grupurile variabilei independente A.

SSB se calculeaza cu ajutorul urmatoarei formule:

Formula 8

In aceasta formula, Tb este un simbol general pentru TB1 si TB2, iar nb este un simbol general pentru nB1 si nB2. Prin urmare, atunci cand calculam SSB, luam in considerare doar grupurile variabilei independente B.

Calculam acum SSA B, cu ajutorul urmatoarei formule:

Formula 9

In aceasta formula, Tab este un simbol general pentru TA1B1, TA1B2, TA2B1 si TA2B2, iar nab este un simbol general pentru nA1B1, nA1B2, nA2B1 si nA2B2. Prin urmare, atunci cand calculam SSA B, luam in considerare grupurile constituite dupa categoriile combinate

A B.

=

Si aici vom retine unul dintre termenii diferentei, si anume 144639,40, pe care il vom folosi pentru calculul SSEROARE, dupa urmatoarea formula:

Formula 10

Ambele cantitati cerute de aceasta formula au fost calculate anterior, cand am obtinut SSTOTAL si, respectiv, SSA B, asa incat vom prelua direct rezultatele respective in calculul SSEROARE:

De notat ca SSTOTAL = SSA + SSB + SSA B + SSEROARE. Aceasta relatie poate fi utilizata pentru a controla corectitudinea calculelor.

Mediile aritmetice ale sumelor de patrate pentru fiecare sursa de varianta se calculeaza prin impartirea sumei de patrate respectiva la numarul corespunzator de grade de libertate.

Formula 11

In aceasta formula, kA este numarul de grupuri constituite dupa categoriile variabilei A, iar kA - 1 este numarul de grade de libertate asociate SSA, notat cu glA. In exemplul nostru,

Formula 12

In formula 12, kB - 1 este numarul de grupuri constituite dupa categoriile variabilei B, iar kB - 1 este numarul de grade de libertate asociate SSB, notat cu glB. In exemplul nostru,

Formula 13

In formula 13, (kA - 1)(kB - 1) este numarul de grade de libertate asociat SSA B, notat cu glA B. In exemplul nostru,

Formula 14

In formula 14, N - kAkB este numarul de grade de libertate asociat SSEROARE, notat cu glEROARE.

Valoarea pentru F (obtinut) se calculeaza pentru fiecare sursa de varianta sistematica (efectele principale pentru A, pentru B si pentru interactiunea A B). Prezentam in continuare formulele de calcul pentru FA (obtinut), FB (obtinut) si FA B (obtinut), impreuna cu calculele respective, corespunzatoare exemplului nostru.

Formula 15

Formula 16

Formula 17

Pentru luarea deciziei, fiecare valoare pentru F (obtinut) se compara cu F (critic). Intrucat in fiecare caz din exemplul nostru, glEROARE = 16, iar numarul de grade de libertate din numarator pentru media aritmetica este egal cu 1 (glA = glB = glA B = 1), pentru α = 0,05, F (critic) = 4,4940 sau, rotunjit, 4,49[1]. Deoarece fiecare F (obtinut) este mai mare decat F (critic), toate cele trei ipoteze de nul pot fi respinse. De notat ca toate cele trei ipoteze de nul pot fi respinse (rezultatele experimentului sunt semnificative) si pentru α = 0,01, pentru care F (critic) = 8,53.

In termenii modelului in patru pasi, testul ANOVA pentru doua variabile independente decurge astfel:

Pasul 1 Enuntarea ipotezelor

H01: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale rezultatelor obtinute prin cele doua metode.

Ha1: La nivelul populatiei mediile aritmetice ale rezultatelor obtinute prin cele doua metode difera.

H02: La nivelul populatiei nu exista nici o diferenta intre mediile aritmetice ale rezultatelor obtinute de elevii cu nivele IQ diferite.

Ha2: La nivelul populatiei mediile aritmetice ale rezultatelor obtinute de elevii cu nivele IQ diferite difera.

H03: La nivelul populatiei nu exista interactiune intre cele doua variabile.

Ha3: La nivelul populatiei exista interactiune intre cele doua variabile.

Pasul 2 Selectarea distributiei de esantionare si stabilirea zonelor critice.

Distributia de esantionare = distributia F

α = 0,05

glEROARE = 16

glA = glB = glA B = 1

F (critic) = 4,49

Pasul 4 Calcularea statisticii testului

Organizarea calculului ANOVA pentru doua variabile independente se face cu ajutorul unui tabel de calcule initiale (v. tabelul 3), precum si al unui tabel ANOVA rezumativ (tabel al surselor de variatie). In acest caz, forma generala a unui astfel de tabel este urmatoarea:

Sursa de

variatie

Sume de

patrate

Grade de

libertate

Medii ale

sumelor

F (obtinut)

A

SSA

kA 1

MSA

MSA/MSEROARE

B

SSB

kB 1

MSB

MSB/MSEROARE

A B

SSA B

(kA 1)(kB 1)

MSA B

MSA B/MSEROARE

EROARE

SSEROARE

N kAkB

MSEROARE

TOTAL

SSTOTAL

N 1

In exemplul nostru, avem urmatorul tabel:

Tabelul 4 ANOVA rezumativ, doua variabile independente

Sursa de

variatie

Sume de

patrate

Grade de

libertate

Medii ale

sumelor

F (obtinut)

A

361,25

1

361,25

38,64

B

684,45

1

684,45

73,20

A B

281,25

1

281,25

30,08

EROARE

149,60

16

9,35

TOTAL

1476,55

19

Pasul 4 Luarea deciziei

Intrucat fiecare valoare pentru F (obtinut) este mai mare decat valoarea pentru F (critic), se resping cele trei ipoteze de nul. Pentru efectul principal al variabilei A, concluzia este ca la nivelul populatiei, mediile aritmetice ale rezultatelor obtinute prin cele doua metode difera semnificativ. Pentru efectul principal al variabilei B, concluzia este ca la nivelul populatiei, mediile aritmetice ale rezultatelor obtinute de elevii cu nivele IQ diferite difera semnificativ. Enuntul de probabilitate asociat ambelor concluzii este urmatorul: probabilitatea ca diferentele observate intre mediile aritmetice ale grupurilor constituite dupa categoriile unei variabile independente sa apara din intamplare, daca H0 respectiva ar fi in realitate adevarata, este mai mica de 0,05 (si dupa cum am vazut, chiar decat 0,01).

Pentru interactiune, concluzia este ca la nivelul populatiei exista o interactiune intre metoda de instruire si nivelul IQ al subiectilor. Enuntul de probabilitate asociat acestei concluzii este urmatorul: probabilitatea ca diferentele observate intre mediile aritmetice ale scorurilor din categoriile combinate ale celor doua variabile sa apara din intamplare, daca H03 ar fi in realitate adevarata, este mai mica de 0,05 (si decat 0,01).



[1] Evident, daca cele trei grade de libertate ar fi fost diferite, am fi avut trei valori pentru F (critic).