|
ESTIMAREA PROPORTIILOR
Pe baza teoremei limitei centrale se demonstreaza ca proportiile pentru esantioane (p) au distributii de esantionare aproximativ normale, cu media aritmetica (μp) egala cu proportia pentru populatie (P) si abaterea standard (σp) egala cu . Teoretic, formula pentru construirea unui interval estimat bazat pe proportii ale esantioanelor este urmatoarea:
Formula 6.4
In aceasta formula, valorile pentru p si n provin de la esantion, iar valoarea lui Zα/2 se determina la fel ca mai sus. Problema cu aceasta formula este ca valoarea proportiei pentru populatie, P, nu este cunoscuta. Pentru a rezolva aceasta problema, se poate proceda in doua moduri.
Un prim mod de a rezolva problema consta in a stabili ca P = 0,5. In aceasta situatie, 1 P = 0,5 iar P(1 P) = 0,5 0,5 = 0,25. Este important de remarcat ca 0,25 este valoarea maxima pe care o poate lua numaratorul fractiei de sub radical, P(1 P). Stabilind pentru P orice alta valoare diferita de 0,5, valoarea expresiei P(1 P) va fi mai mica decat valoarea pentru P = 0,5. De pilda, daca P = 0,4, atunci 1 P = 0,6 si
P(1 P) = 0,4 0,6 = 0,24. Intrucat P(1 P) are valoarea maxima cand P = 0,5, ne asiguram ca intervalul obtinut va fi cel mai mare posibil pentru p, Zα/2 si n date. Practic, adoptand aceasta solutie, lucram cu formula urmatoare:
Formula 6.5
A doua solutie a problemei mentionate consta din a estima valoarea lui P prin p, lucrand cu formula urmatoare:
Formula 6.6
Oricum, formulele de mai sus pot fi folosite doar daca dimensiunea esantionului considerat estre destul de mare, astfel incat np 5 si n(1 p) 5.
Sa presupunem, de pilda, ca ne dorim sa estimam proportia de studenti de la universitatea X care au lipsit cel putin o zi pe motiv de boala intr-un anumit semestru si ca dintr-un esantion aleatoriu de 200 de studenti, gasim 30 in aceasta situatie. Astfel, proportia esantionului pe care ne bazam estimarea este p = 30/200 = 0,15. La un nivel de incredere de 95%, intervalul estimat cu ajutorul formulei 6.5 este urmatorul:
Pe baza proportiei de 0,30 a esantionului, estimam ca proportia cautata este cuprinsa intre 0,08 si 0,22. Estimarea poate fi exprimata si in termeni de procente, spunand ca intre 8% si 22% dintre studentii universitatii X au lipsit cel putin o zi pe motiv de boala in semestrul considerat.
Sa aplicam acum formula 6.6 la aceleasi date, pastrand nivelul de incredere de 95%:
In acest caz, estimam ca proportia cautata este cuprinsa intre 0,10 si 0,20 sau, altfel spus, ca intre 10% si 20% dintre studentii universitatii X au lipsit cel putin o zi pe motiv de boala in semestrul considerat.
De notat ca intervalul estimat cu ajutorul formulei 6.5 este mai larg decat cel estimat cu ajutorul formulei 6.6, astfel ca prima estimare este cea mai conservatoare solutie posibila, caci este mult mai probabil ca intervalele mai largi sa contina parametrul estimat. Prin urmare, din punct de vedere statistic, prima estimare este preferabila celei de-a doua estimari.