|
IPOTEZE STATISTICE
Procesul de luare a deciziei presupune testarea statistica a ipotezelor. Experimentul statistic are menirea de a raspunde asupra unui anumit aspect al realitatii. Raspunsul trebuie insotit intotdeauna de confidenta (increderea) ce o avem asupra sa. Cum e si normal, colectam date privind evidenta unei stari posibile sau a contrariului sau (logica bivalenta). O decizie normala se bazeaza pe evidenta ce o avem asupra starii de interes. Decizia este de respingere sau de evitare a respingerii ipotezei facute asupra realitatii. De obicei ipoteza se refera la ceva ce nu dorim sa aiba loc
Orice situatie de luare a unei decizii poate fi caracterizata prin urmatoarele:
1) exista patru variante posibile, derivate din cele doua decizii contrare (mutual exclusive) ce se pot lua si din cele doua stari posibile ale realitatii. Doua variante sunt corecte si alte doua sunt eronate;
2) decizia depinde de doi factori: (a) evidenta in favoarea uneia dintre cele doua decizii posibile, si (b) criteriul care ne spunem de cata evidenta avem nevoie pentru a lua o decizie si nu pe cealalta;
3) cele doua tipuri de erori sunt complementare, astfel incat schimbarea criteriului creste probabilitatea uneia dar o scade pe a celeilalte. Trebuie deci sa facem o ierarhizare a erorilor, sa stabilim ce este mai rau si trebuie evitat in primul rand.
In mod normal facem experimente pe esantioane si utilizam datele obtinute pentru a estima caracteristicile populatiei din care esantioanele au fost extrase. Aceasta abordare este permisa de teorema de limita centrala.
Trebuie sa introducem acum mai multe notiuni importante.
Ipoteza = o afirmatie presupusa adevarata.
Ipoteza nula, Ho, = ipoteza asupra careia ne focalizam atentia. In mod general aceasta este o presupunere privind o valoare specifica a unui parametru al populatiei. Uneori ipoteza nula se poate referi si la un atribut al populatiei (caracteristica calitativa).
Ipoteza alternativa, Ha = o afirmatie ce specifica ca parametrul populatiei are o valoare diferita fata de cea precizata de ipoteza nula. Valoarea stipulata de ipoteza alternativa poate fi mai mare decat cea stabilita de ipoteza nula - in cazul unui test orientat spre dreapta (unidirectionat dreapta), mai mica decat cea stabilita de ipoteza nula - in cazul unui test orientat spre stanga (unidirectionat stanga), sau numai diferita (fara nici o specificatie asupra diferentei) - in cazul unui test dublu orientat (bidirectionat)
Statistica testului: scorul statistic (statistica in terminologia prescurtata) a datelor referitoare la esantion ce urmeaza sa fie comparate cu o distributie teoretica.
Regiunea critica: setul valorilor pentru scorul statistic al testului ce vor cauza respingerea ipotezei nule.
Valoarea critica: 'prima' valoare din regiunea critica daca se foloseste un test orientat spre dreapta (ultima valoare fiind plus infinit), 'ultima' valoare din regiunea critica daca se foloseste un test orientat spre stanga (prima fiind minus infinit), sau cele doua limite finite ale regiunii critice la folosirea unui test dublu orientat.
Nivel de semnificatie: probabilitatea de a comite o eroare de tip 1. Aria totala a regiunii critice este α
Nivel de confidenta: probabilitatea de a lua decizia corecta, evident 1 - α
Regula de decizie: daca statistica testului cade in regiunea critica, respingem ipoteza nula, daca nu evitam sa o respingem. Evitarea respingerii ipotezei nule inseamna numai ca nu avem suficienta evidenta pentru respingere.
Regiunea critica.Stanga sus: test orientat spre stanga, dreapta sus: test orientat spre dreapta, jos: test dublu orientat.
|
CONSTRUCTIA CRITERIULUI
Efectuarea oricarei verificari statistice a unei concluzii se bazeaza pe un criteriu de respingere a ipotezei nule. In mod arbitrar s-a decis ca valoarea maxima acceptabila pentru α (adica a riscului de a respinge ipoteza nula cand aceasta este adevarata) sa fie in orice experiment statistic de 0,05. Aceasta este valoarea conventional aleasa. Pentru o situatie concreta se poate decide, in functie de necesitatea preciziei ridicate si de posibilitatile experimentale, o valoare diferita. O precizie mai mare presupune un risc mai mic dar si un numar mai mare de determinari. Ca intotdeauna trebuie sa facem un compromis intre precizie si comoditate.
Criteriul de testare presupune parcurgerea a cinci etape (pasi), fiecare avand de rezolvat o sarcina specifica.
Pasul 1: formularea ipotezei nule, Ho;
Pasul 2: formularea ipotezei alterantive, Ha; tipul de ipoteza alternativa decide tipul de test statistic ce trebuie folosit: unidirectionat (stanga sau dreapta) sau bidirectionat.
Pasul 3: alegerea distributiei teoretice de referinta: z, χ2, t, F . In acest pas se determina numarul gradelor de libertate, nivelul (pragul) de semnificatie α si regiunea critica.
Pasul 4: calcularea caracteristicilor statistice ale esantionului: media aritmetica <x>, deviatia standard s, si scorul statistic care vor fi comparate cu valoarea asteptata, deviatia standard si valorile probabilitatilor in distributia de referinta (ce poate fi z, χ2, t (Student), sau F (Fisher - Snedecor)).
Pasul 5: decizia de respingere sau de evitare a respingerii ipotezei nule, pe baza regulii de decizie.