Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Dimensiuni ale esantioanelor si nivele de precizie

DIMENSIUNI ALE ESANTIOANELOR SI NIVELE DE PRECIZIE


Formulele 6.1 si 6.5 pot fi manipulate algebric pentru a determina dimensiunea unui esantion la orice nivel de precizie dorit sau, altfel spus, pentru orice limita de eroare stabilita.



1 CONTROLUL MARIMII INTERVALULUI ESTIMAT

Marimea unui interval de incredere estimat pentru medii aritmetice sau proportii poate fi controlat prin intermediul a doi termeni ai ecuatiei respective: nivelul de incredere, care determina scorul Zα/2 sau tα/2 corespunzator, si dimensiunea esantionului.

Relatia dintre nivelul de incredere si marimea intervalului este de proportionalitate directa: cu cat nivelul de incredere creste, cu atat intervalul este mai mare. Intuitiv, este mult mai probabil ca intervalele mai largi sa contina valoarea pentru populatie, prin urmare putem avea mai multa incredere in astfel de intervale. Pentru a ilustra aceasta relatie, sa consideram din nou exemplul privind estimarea venitului mediu al unei populatii: n = 500, , s = 125000. La un nivel de incredere de 95% am gasit intervalul 5000000 10967 (i.e. acest interval se extinde la 10967 lei in jurul mediei aritmetice a esantionului). Acum, daca luam un nivel de incredere de 99%, scorul Zα/2 corespunzator creste la 2,58, iar intervalul se mareste:



IE = 5000000 2,58 5595,34 = 5000000 14436

(intervalul estimat la un nivel de incredere de 99% se extinde la 14436 lei in jurul mediei). Exact aceeasi relatie se aplica si la proportii.

Relatia dintre dimensiunea esantionului si marimea intervalului este de proportionalitate inversa: cu cat dimensiunea esantionului este mai mare, cu atat intervalul este mai ingust. Intuitiv, esantioanele mai mari permit estimari mai precise. Pentru ilustrare, sa consideram din nou exemplul privind estimarea venitului mediu, modificand doar dimensiunea esantionului: n = 1000 (95%).

Pentru n = 500, la un nivel de incredere de 95%, intervalul estimat se extinde la 10967 lei in jurul mediei; pentru n = 1000, toate celelalte ramanand aceleasi, intervalul estimat se extinde doar la 7753 lei in jurul mediei. Exact aceeasi relatie se aplica si la proportii.

De notat ca ingustarea intervalului (= cresterea preciziei) nu depinde in mod liniar de dimensiunea esantionului. In exemplul nostru am dublat dimensiunea esantionului, dar cel de-al doilea interval nu este de doua ori mai ingust decat primul, ci de aproximativ 1,41 de ori mai ingust. Aceasta inseamna ca n trebuie sa creasca de trei sau patru ori pentru a obtine o dublare a preciziei. Intrucat costul unei cercetari este direct proportional cu dimensiunea esantionului, un esantion de, sa zicem, 10000 de persoane costa aproximativ de doua ori mai mult decat unul de 5000 de persoane, dar estimarea bazata pe esantionul mai mare nu va fi de doua ori mai precisa decat cea bazata pe esantionul mai mic.



2 DETERMINAREA DIMENSIUNII ESANTIONULUI PENTRU

ESTIMAREA MEDIILOR ARITMETICE


Sa consideram formula 6.1:



In aceasta formula, membrul reprezinta, in fapt, limita de eroare sau nivelul de precizie a estimarii: este limita inferioara, iar este limita superioara. Notand limita de eroare cu L, putem scrie urmatoarea ecuatie:


Ridicand la patrat ambii membri ai ecuatiei, egalitatea se pastreaza:



Din aceasta egalitate il putem obtine pe n:


Formula 6.7




Pentru a folosi aceasta formula trebuie sa cunoastem valoarea lui σ, or, dupa cum am mai mentionat, in aproape toate cazurile aceasta valoare nu este cunoscuta. Totusi, valoarea lui σ poate fi aproximata, daca cunoastem amplitudinea variabilei masurate, A. Astfel, o aproximare conservatoare a lui σ este σ A/4.

Sa ilustram. Un psiholog industrial doreste sa estimeze durata medie in care un muncitor de la o firma de produse electronice executa un anumit reglaj. Observand un numar de muncitori care executa reglajul respectiv, psihologul constata ca durata cea mai mica este de 10 minute, iar cea mai mare de 22 de minute. Cat de mare trebuie sa fie esantionul selectat, daca psihologul doreste sa estimeze durata medie de executie a acelui reglaj cu o precizie de 20 de secunde, la un nivel de incredere de 95%? In aceasta problema, L = 20 si amplitudinea variabilei masurate este A = 22 - 10 = 12 minute, astfel ca

σ A/4 = 12/4 = 3 minute = 180 secunde


Acum il putem obtine pe n:



Prin urmare, psihologul trebuie sa selecteze un esantion aleatoriu de aproximativ 300 de muncitori pentru a estima durata medie de executare a reglajului respectiv cu o precizie de 20 de secunde, la un nivel de incredere de 95%.

Sa presupunem acum ca se doreste dublarea preciziei de la 20 de secunde la 10 secunde, la acelasi nivel de incredere. In acest caz avem:



Se observa ca dimensiunea esantionului creste mai repede decat precizia: pentru a dubla precizia de la 20 de secunde la 10 secunde, dimensiunea esantionului trebuie sa creasca de aproximativ patru ori. Aceasta relatie este importanta pentru planificarea costurilor unei cercetari. Esantioanele impresionant de mari pot constitui o irosire de resurse fara un castig semnificativ in privinta preciziei, in raport cu esantioanele mai mici si deci mai ieftine.

3 DETERMINAREA DIMENSIUNII ESANTIONULUI PENTRU

ESTIMAREA PROPORTIILOR


Am vazut ca, practic, in construirea unui interval estimat pentru proportii lucram cu formula



Aici, limita de eroare a estimarii este . Notand tot cu L limita de eroare a estimarii, avem ecuatia:


Ridicand la patrat ambii membri, avem:





Din aceasta egalitate il obtinem pe n:

Formula 6.8


Sa presupunem ca un institut de sondare a opiniei publice doreste sa estimeze rezultatul unor alegeri prezidentiale inauntrul unei marje de eroare de 3%. Cat de mare trebuie sa fie esantionul cerut pentru a sigura acest nivel de precizie la un nivel de incredere de 95%? Exprimand limita de eroare sub forma de proportie, obtinem:



Prin urmare, pentru a obtine o precizie (o limita de eroare a estimarii) de 3%, este nevoie de un esantion de aproximativ 1000 de persoane.

Si aici se poate constata usor ca dimensiunea esantionului creste mai repede decat precizia. Tabelul urmator prezinta relatiile dintre precizie si dimensiunea esantionului pentru proportii ale esantioanelor:


Tabelul 6.3 Precizia si dimensiunea esantionului

(α = 0,05, P = 0,5)


Precizia

(Marimea intervalului)

Dimensiunea aproximativa

a esantionului

10%

100

7%

200

5%

400

3%

1000



2%

2400

1%

9600

Se poate observa, de pilda, ca pentru a dubla precizia de la 10% la 5%, dimensiunea esantionului trebuie sa creasca de patru ori.



GLOSAR



Curba t: grafic al unei distributii t; ca si curba normala, curba t este simetrica si are forma de clopot cu ambele extremitati extinse la infinit; spre deosebire curba normala, forma exacta a curbei t depinde de dimensiunea esantionului.

Distorsiune: criteriu folosit pentru selectarea unei marimi statistice ca estimator; o marime statistica este nedistorsionata, daca media aritmetica a distributiei sale de esantionare este egala cu media aritmetica a populatiei de referinta.

Distributia t: distributie teoretica ce descrie distributia de esantionare a mediilor aritmetice in cazul in care esantioanele sunt mici (n 30) si valoarea lui σ este necunoscuta.

Eficienta: criteriu folosit pentru selectarea unei marimi statistice ca estimator; o marime statistica este cu atat mai eficienta, cu cat distributia de esantionare este mai grupata in jurul mediei sale aritmetice sau, altfel spus, cu cat este mai mica abaterea standard a distributiei de esantionare.

Grade de libertate: concept care se refera la numarul de valori libere sa varieze intr-o distributie.

Interval de incredere estimat: amplitudine de valori in care este probabil sa se afle un parametru al populatiei de interes.

Nivel alfa (α): Probabilitatea ca un parametru sa nu se afle in intervalul estimat sau, altfel spus, probabilitatea de eroare a estimarii.

Nivel de incredere: probabilitatea ca intervalul estimat sa contina parametrul de interes.

Proceduri de estimare: tehnici statistice in care pe baza unei statistici calculate pentru un esantion, numita estimator, se face o apreciere despre parametrul corespunzator al populatiei de referinta.

Punct estimat: o singura valoare calculata pentru un esantion si folosita pentru a face o apreciere despre parametrul corespunzator al populatiei de referinta.