Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Procedee si modalitati de alcatuire a esantioanelor

PROCEDEE SI MODALITATI DE ALCATUIRE A ESANTIOANELOR

Un esantion este considerat reprezentativ daca reproduce in structura sa aceiasi structura pe care o prezinta si populatia.

Asigurarea reprezentativitatii esantionului se face respectand urmatoarele conditii :

1)     fiecare element component al populatiei generale are aceiasi probabilitate de a fi ales in esantion;

2)     volumul esantionului sa fie suficient de mare ca sa permita redarea trasaturilor esentiale ale populatiei originare, ceea ce va permite obtinerea, pe baza datelor de sondaj a unor indicatori cu grad mare de stabilitate;



3)     extragerea fiecarei unitati din populatia generala este independenta de oricare alta.

Dupa modul in care pot fi prelevate in esantion aceste unitati distingem preocedee de esantionare aleatoare, esantionare dirijata, esantionare mixta.

In cazul selectiei aleatoare, unitatile elementare ale populatiei generale sunt prelevate in esantion "la intamplare", adica toate elementele populatiei au aceiasi sansa de a fi alese. In mod analog vom vorbi de un esantion aleator, cand acesta a fost ales astfel incat, in procesul sondajului, toate esantioanele posibile, formate de pilda din cate n elemente aveau aceiasi probabilitate de a fi selectionate. Selectia aleatoare isi demonstreaza utilitatea prin faptul ca rezultatele obtinute pe baza ei pot fi apreciate in termeni probabilistici.

In selectiile dirijate alegerea unitatilor care trebuie sa faca parte din esantion este facuta de un observator bun cunoscator al populatiei cercetate care include in mod constient in esantion unitatile considerate ca fiind cele mai reprezentative. Oricat de bun cunoscator al populatiei ar fi observatorul se intelege ca alegerea sa personala poate da gres.

Sunt situatii cand esantionarea dirijata este preferabila pentru ca : este mult mai ieftina decat oricare alt tip de selectie aleatoare, esantioanele sunt atat de mici incat inferentele facute pe baza lor n-ar reprezenta oricum decat o simpla apreciere, se poate intampla ca datele existente sa fie atat de nesigure incat aprecierea unui expert sa dea rezultate mai nesigure decat o selectie riguroasa.

Fata de selectia aleatoare, cea dirijata prezinta dezavantajul ca nu exista nici o metoda pentru a stabili gradul preciziei unei estimatii facute pe baza ei.

Dintre metodele de esantionare dirijata cea mai folosita este metoda de esantionare pe cote. In acest caz, structura populatiei este stabilita dinainte iar in cadrul fiecarei grupe se include un anumit numar de unitati, alegerea lor fiind lasata la latitudinea operatorului cu conditia sa respecte numarul prestabilit care reda in esantion ponderea respectivei grupe in populatie.

Alte metode dirijate de formare a esantionului sunt:

a)          Metoda voluntariatului ce consta in publicarea chestionarului si rugamintea adresata cetatenilor de a expedia raspunsurile. Anchetele bazate pe voluntariat se aplica din ce in ce mai mult in studiul opiniei cititorilor de presa, a opiniilor aderentilor la unele societati si furnizeaza un bogat volum de informatii punandu-se problema extrapolarii rezultatelor.

b)         Esantionarea la fata locului vizeaza populatii care se gasesc in anumite locuri : muzee, manifestatii culturale, magazine, aeroporturi etc.

c)          Metoda itinerariilor consta in impunerea unui anumit itinerar de urmat de operator, avand puncte diferite de oprire pentru realizarea interviurilor.

d)         Metoda unitatilor tip al carui principiu de baza este urmatorul: diferite caracteristici ale unei unitati statistice fiind corelate, anumite variabile pot fi situate in apropierea mediei pentru mai multe caracteristici. Astfel populatia se grupeaza in subpopulatii omogene iar variabila de control reprezinta aceste subpopulatii prin media sa numita unitate tip.

Selectia mixta combina principiile selectiei dirijate cu cele ale selectiei aleatoare. Esenta acestei selectii consta in divizarea intregii populatii in straturi (grupe tipice in raport cu un principiu oarecare prestabilit) si apoi extragerea a cate unui esantion aleator din fiecare strat. Selectia mixta ne sugereaza ideea ca formarea unui esantion reprezentativ se poate face in faze sau secvential.

1. PROCEDEE DE ESANTIONARE ALEATOARE

Selectiile aleatoare acorda oricarei unitati din populatie o probabilitate nenula si cunoscuta de a face parte din esantion si se realizeaza prin mai multe procedee care difera din punct de vedere probabilistic.

Metoda de esantionare aleatoare conform careia diferite unitati au aceiasi probabilitate de a fi incluse in esantion se numeste esantionare cu probabilitati egale. Aceasta metoda este indicata in cazul in care unitatile din populatie sunt de dimensiuni mici si nu exista diferente semnificative intre marimea diferitelor unitati ale populatiei.

In practica se aplica metode de esantionare cu probabilitati inegale care desi uneori necesita cunoasterea unor date suplimentare despre populatie, se obtin estimari mai eficiente.

Procedeele de esantionare cu probabilitati egale cele mai folosite in teoria si tehnica sondajului sunt :

procedee absolut aleatoare (procedeul loteriei si procedeul numerelor aleatoare),

procedeul mecanic (sistematic).

a)          Procedeul loteriei sau al tragerii la sorti.

Acest procedeu consta in extragerea dintr-o urna a unor bile sau cartonase

identice reprezentand elementele populatiei, pana se obtine esantionul dorit.

Extragerea bilelor sau cartonaselor se face in doua variante :

cu reintroducerea bilelor sau cortonaselor'

fara reintroducerea bilelor sau cartonaselor.

In varianta "bilei revenite" esantionul format dupa acest procedeu se numeste sondaj aleator repetat, volumul populatiei ramanand constant pe durata selectiei esantionului. In finalul operatiei, volumul populatiei (N) este mai mic cu o unitate (N-1) iar probabilitatea de includere in esantion a fiecarei unitati este constanta (P=1/N).

In varianta "bilei nerevenite", bila sau cartonasul nu mai este reintrodus in urna deci avem de a face cu un sondaj aleator nerepetat. Pe masura ce se extrag bilele sau cartonasele, cresc sansele celor ramase in urna de a fi incluse in esantion. In finalul extragerilor, in urna au mai ramas (N - n) bile sau cartonase. Daca la prima extragere P1=1/N, apoi probabilitatea de includere in esantion creste P2=1/[N-1] ; Pn=1/[N - (n-1)].

O varianta la sondajul aleator nerepetat este extragerea simultana la intamplare a intregului lot din care este format esantionul.

Datorita faptului ca in cazul sondajului aleator nerepetat este exclusa posibilitatea extragerii de mai multe ori a aceleiasi bile, erorile sunt ai mici, rezultatele obtinute au un grad de precizie mai ridicat fata de sondajul aleator repetat.

Sondajul aleator se poate aplica direct populatiei totale sau fiecarei grupe, ceea ce inseamna ca se pot obtine sondaje simple sau stratificate. La procedeul de sondaj se pot folosi unitatile simple, deci numerotarea se face de la 1 la N sau unitati complexe, denumite serii, numerotate de la 1 la R. In al doilea caz avem de-a face cu un sondaj de serii.

b)          Procedeul tabelului cu numere aleatoare.

Aceste tabele se alcatuiesc cu ajutorul unei masini de amestecat numere. Plasarea numerelor este intamplatoare din orice parte a tabelului ar fi privite. Numerele sunt asezate in mod intamplator pe coloane si randuri. Utilizarea tabelelor cu numere aleatoare consta in extragerea din cadrul populatiei a unitatilor ale caror numere de ordine stabilite printr-o numerotare prealabila, au fost citite dupa o anumita ordine din tabelul numerelor aleatoare.



Tabelul numerelor aleatoare contine 10 coloane si 100 de randuri deci este compus din 10 x 100 = 1000 numere a cate patru cifre grupate cate doua.

Prima operatie este cea de numerotare a tuturor elementelor populatiei pentru ca sa nu fie atribuit acelasi numar la doua unitati.

Citirea numerelor se face de la stanga la dreapta si de sus in jos in ordinea crescatoare a numerelor de ordine ale coloanelor si ale randurilor si se reia citirea de la coloana 1 si randul 1 atunci cand s-a ajuns cu citirea la coloana 10 si randul 100.

Extragerea numerelor din tabelul cu numere intamplatoare se face printr-o citire simpla sau compusa.

Citirea simpla se aplica atunci cand numerele de ordine ale elementelor din populatie sunt compuse din cel mult trei cifre (N 999) si se caracterizeaza printr-un singur inceput al citirii.

Exemplul 1. Populatia este formata din 89 unitati si este necesar sa se formeze un esantion de n=9 unitati, iar citirea incepe intamplator din randul 19 coloana 6 de la stanga la dreapta: 4979, 8795, 9848, 8868, 6477, 2783, 6107, 4905, 4620. Retinem numai primele doua cifre: 49, 87, 98, 88, 64, 27, 61, 49, 46 si consideram ca 98>89 care nu are corespondent in cele 89 unitati ale populatiei initiale. In acest caz, sau in situatia cand un numar retinut se repeta, continuam citirea si completam datele in functie de numarul exceptiilor intalnite, concret in exemplul dat citim 3578, retinem 35 si esantionul va fi format din unitatile populatiei numerotate cu : 49, 87, 88, 64, 27, 61, 49, 46, 35.

Analog, cand numerele de ordine ale elementelor populatiei sunt compuse din trei cifre, se retin prin trei cifre ale fiecarui numar citit.

Citirea compusa se aplica in cazul in care numerele de ordine ale elementelor populatiei sunt compuse din cel putin patru cifre si cel mult sase cifre (0001 N 999999) si se caracterizeaza prin doua inceputuri ale citirilor (pot fi insa si trei sau mai multe) iar numerele se formeaza din diferite combinatii ale celor doua citiri.

Exemplul 2. Populatia este formata din N=95.500 unitati iar esantionul din n=250 unitati. Presupunem ca intamplator incepem prima citire din c

oloana 2 si randul 17 iar a doua citire incepe din coloana 10 randul 15 in jos si pentru exemplificare scriem cateva citiri in tabelul nr.2. Numarul este format din primele trei cifre de la prima citire si primele doua de la a doua citire.

Exemplu de utilizare a tabelului cu numere aleatoare pentru citirea compusa.

Tabelul nr.2

Numere din prima citire

Numere din a doua citire

Numere de ordine compuse

Numere de ordine retinute

99 61

17 47

996 17

57 50

59 56

575 59

57 559

52 55

12 23

525 12

52 512

61 07

96 64

610 96

61 096

69 15

64 77

69 164

69 164

89 66

29 77

896 29

89 629

59 54

82 98

595 82

59 582

46 54

10 00

465 10

46 510

82 79

26 06

827 26

82 726

58 70

08 67

587 08

58 708

Precizam ca numerele compuse care depasesc 95500 nu se retin.

c)          Procedeul mecanic (sistematic)

Acest procedeu este considerat in teoria sondajelor cvasi-aleatoriu.

Procedeul mecanic presupune ordonarea unitatilor dupa o caracteristica oarecare (ex.ordine alfabetica). Se stabileste pasul de numarare - care trebuie sa fie un numar intreg calculat ca raport intre volumul populatiei si volumul esantionului (N/n). Prin calculul pasului de numarare populatia este impartita in grupe de volum egale. Se trage la sorti o unitate din prima grupa la care se adauga succesiv pasul de numarare pana la obtinerea celor n unitati ale esantionului.



Deci se alege aleator un numar k , cuprins intre 1 si p (p fiind cel mai mare numar intreg mai mic decat N/n) si apoi se aleg unitatile cu numerele: k+p, k+2p, k+3p etc., pana la epuizarea listei.

Faptul ca ratia p a pasului de numarare poate coincide cu unele periodicitati ce pot exista in baza de sondaj si ca aranjarea unitatilor in baza de sondaj nu se face tocmai aleator, ci pe baza unor criterii, ii confera procedeului mecanic un caracter cvasi-aleator.

Ca baze de sondaj pot fi folosite liste electorale, carti de telefon, numerotarea locuintelor pe strazi etc.

2.Bazele de sondaj

Prin baza de sondaj se intelege orice sistematizare a unitatilor colectivitatii generale (liste, harti) astfel incat sa permita alegerea aleatoare a unitatilor ce vor intra in esantion.

Prin constituirea bazelor de sondaj se urmareste accelerarea proceselor de colectare, prelucrare si valorificarea datelor, eliminarea inregistrarilor repetate, asigurarea unui acces rapid la datele inmagazinate si selectionarea lor dupa criterii stabilite anterior, automatizarea informarii.

O baza autentica de sondaj trebuie sa indeplineasca mai multe conditii si anume:

a)             Sa fie adecvata scopului urmarit, adica sa cuprinda intreaga populatie care va fi supusa sondajului;

b)             Sa fie ferita de orice repetitie, cuprinderea unor unitati de mai multe ori ar compromite rezultatele. Un exemplu in acest sens este acela al locuitorilor care si-au schimbat domiciliul si care nu au fost stersi din listele de la vechile adrese.

c)             Sa fie exacta si actuala, evitand includerea unor persoane din zone demolate, decedate, etc.

Aceste conditii riguroase nu pot fi indeplinite pe deplin de nici o baza de

sondaj, fiind acceptata o marja de eroare din cauza deplasarilor, a schimbarilor de domiciliu, a deceselor, a imbolnavirilor.

Perfectionarea mijloacelor de prelucrare a informatiilor, impun reconsiderarea metodologiilor de lucru in toate fazele unei cercetari statistice in scopul obtinerii unor rezultate de mare precizie cu minim efort. Astfel apare necesitatea constituirii in baza de date a unor baze de sondaj corect elaborate incat sa corespunda cerintelor impuse de selectarea automata a unitatilor si de prelucrarea cu mijloace moderne a datelor obtinute prin efectuarea sondajelor.

Prelucrarea automata a datelor implica utilizarea unei mari cantitati de informatii clare, exacte si organizate corespunzator scopului propus. Aceste informatii se culeg, se prelucreaza, se codifica si se depoziteaza in baza de sondaj, putand fi folosite in realizarea unui nou sondaj, prin crearea unor fisiere de date. Fisierul de date trebuie astfel intocmit incat sa permita folosirea unui timp minim pentru alegerea unitatilor pentru care urmeaza sa se faca prelucrarea computerizata a informatiilor in functie de obiectivul urmarit.

Erori de sondaj

Se considera eroare de sondaj abaterea care exista intre valorile calculate prin prelucrarea datelor din esantion si ceea ce s-ar fi obtinut daca s-ar fi organizat o observare totala si se prelucrau datele de la toate unitatile populatiei.

Erorile intalnite in cadrul sondajelor sunt de doua feluri:

erori comune tuturor tipurilor de observari sau erori de inregistrare;

erori specifice cercetarii prin sondaj sau erori de reprezentativitate.

Erorile de inregistrare apar intr-un numar mic de cazuri si printr-un control riguros pot fi evitate.

Erorile de reprezentativitate pot fi de doua feluri: erori sistematice si erori intamplatoare.

Erorile de reprezentativitate sistematice pot fi evitate daca se respecta principiile teoriei sondajului prin inlaturarea cauzelor ce le produc dintre care cele mai frecvente sunt urmatoarele:

a)     Alegerea voita a unor date considerate reprezentative.

b)     Alegerea la "nimereala"a unitatilor din esantion si nu o alegere aleatoare (care presupune cunoasterea aproximativa a frecventelor relative).

c)     Dorinta preconceputa a cercetatorului de a obtine un anume rezultat.

d)     Substituirea unei unitati prin alta ce ofera o mai mare comoditate in obtinerea datelor.

e)     Cuprinderea incompleta in sondaj a unitatilor, din motive de comoditate.

Erorile de reprezentativitate intamplatoare apar in procesul sondajului daca esantionul nu reproduce decat cu aproximatie distributia variabilelor populatiei. In consecinta, media sau o alta valoare a esantionului va prezenta anumite abateri fata de parametrii populatiei. Procedeele cele mai simple pentru inlaturarea erorilor de reprezentativitate, constau in marirea volumului esantionului si alegerea unui tip de sondaj cat mai adecvat scopului cercetarii.

In practica sondajului, erorile de reprezentativitate se pot calcula ca erori efective si ca erori probabile.

Erorile efective de reprezentativitate se pot calcula numai pentru caracteristicile la care s-au obtinut date dintr-o observare totala. Eroarea efectiva de sondaj se calculeaza ca diferenta intre media esantionului si media populatiei si ne indica gradul de reprezentativitate a unui esantion in raport cu structura populatiei.

La verificarea reprezentativitatii esantionului se porneste de la compararea structurii pe grupe a esantionului sau a populatiei, denumita si structura programata. In cazul in care aceste structuri nu difera cu mai mult de 5% se accepta esantionul constituit ca fiind reprezentativ.

4. Non-raspunsurile

Prin non-raspuns intelegem atat lipsa raspunsurilor la anumite intrebari ale unui chestionar, cat si lipsa raspunsului la intregul chestionar

Operatorii de sondaje pot construi un esantion avand precizia ceruta si permisa de bugetul alocat, cu conditia ca toti cei cuprinsi in esantion sa poata fi gasiti si sa accepte sa raspunda la chestionare

Motivele non-raspunsurilor pot fi urmatoarele:

a)          unitati ce au disparut din baza de sondaj: case demolate, decese; numarul acestora trebuie scazut din marimea esantionului;



b)         diverse infirmitati ale celor inclusi in esantion: surdo-muti, bolnavi cu comotii cerebrale;

c)          schimbari de adrese;

d)         absenta de la domiciliu care poate fi de durata in cazul unei plecari in strainatate sau de scurta durata in cazul absentei in momentul vizitei operatorului;

e)          refuzul de a coopera.

Datorita non-raspunsurilor, un esantion E, ales in faza pregatitoare a cercetarii , se transforma intr-un esantion E',cel pe care se vor /prelucra rezultatele. Aceasta transformare este de structura caci cei care nu raspund pot avea alte opinii sau trasaturi, decat cei care raspund.

Efectele distorsionante ale non-raspunsurilor pot fi puse in forma matematica. Sa presupunem ca esantionul initial, de volum n, se descompune in doua subesantioane de volume n1 si n2 , primul reprezentand chestionatii care raspund si al doilea pe cei care nu raspund. Sau in termeni de proportii, vom avea p1 =n1 /n si p2 =n2 /n, respectiv proportia celor care raspund si a celor care nu raspund. Sa presupunem ca una dintre intrebarile chestionarului ne conduce la calcularea unei valori v (de exemplu procentul celor care simpatizeaza cu un partid politic sau numarul mediu de ore pe care un om le petrece zilnic in fata televizorului etc.). In cazul in care cei care raspund se deosebesc de cei care nu raspund, pe primul subesantion vom avea o valoarev1 diferita de cea care caracterizeaza lotul celor ce nu raspund, v2 , ceea ce inseamna, de fapt ca valoarea v1 (caracteristica celor ce raspund) difera de v ("adevarata"valoare, adica cea obtinuta daca ar raspunde toti).

Asadar, eroarea generata de non-raspuns este:

Insa, valoarea v se poate scrie:

Si deci eroarea devine:

Dar cum

vom avea:

Formula de mai sus exprima faptul ca eroarea provocata de non-raspunsuri este direct proportionala cu cei doi factori ai produsului:

, care reprezinta proportia nonraspunsurilor si

care reda diferenta de "comportament" intre cei care raspund si cei care nu raspund. Dintre cei doi factori, singurul asupra caruia poate actiona, intr-o anumita masura, cercetatorul este primul, in sensul ca va utiliza diferite mijloace pentru a minimiza proportia nonraspunsurilor.

Pentru a ilustra amploarea posibila luata de eroarea datorata non-raspunsurilor sa alegem un caz ipotetic. Sa presupunem ca urmarim, printr-un sondaj, sa determinam proportia persoanelor care intentioneaza sa participe la vot. Sa acceptam ca intre cei care raspund la aceasta intrebare a chestionarului si cei care nu raspund - inclusiv cei ce nu raspund de loc sau nu pot fi gasiti etc. - exista o diferenta mare, in sensul ca primii, asa cum rezulta din declaratiile lor, intentioneaza sa participe la vot in proportie de 85%, in vreme ce ceilalti, daca am putea avea raspunsul lor sincer, ar manifesta o astfel de intentie numai in proportie de 25%. Sa mai introducem ipoteza ca, in cursul cercetarii, s-a cumulat un efectiv relativ mare de non-raspunsuri, reprezentand 40% din esantionul proiectat.

In aceste conditii, procentul "real" de intentii de vot, la nivelul esantionului proiectat, in cazul realizarii sale integrale, ar fi fost:

Acest rezultat arata ca proportia gasita de 85% intentii de prezentare la vot supraestimeaza mult proportia reala, a carei valoare se asteapta a fi, conform principiilor esantionarii, pe un interval in jurul lui 61%. Diferenta, 85-61=24% este distorsiunea produsa de non-raspunsuri.

Valoarea obtinuta pentru eroarea de acest gen, ce putea fi dedusa si direct, cu ajutorul formulei:

poate fi considerata mare si se datoreaza unei deosebiri substantiale de "comportament" intre cei ce raspund si cei ce nu o fac. O asemenea situatie nu este prea frecventa in cercetarile reale, desi ea nu este neverosimila; pot fi cercetate teme ce provoaca eschivarea unei categorii de oameni de la raspuns, tocmai datorita opiniilor, atitudinilor, comportamentelor, aspiratiilor lor sau a altor trasaturi ce nu sunt compatibile cu valorile morale dominante, cu legile juridice, cu obiceiurile colectivitatii etc. Daca se intampla ca asemenea deosebiri serioase sa coincida si cu un mare camp de non-raspunsuri, situatia poate deveni grava. Daca in cazul de mai sus, ancheta s-ar fi realizat prin posta, un procent de raspunsuri in jurul lui 20 ar fi fost foarte "normal". Introducand deci o pondere de 0,8 a non-raspunsurilor, inlocul lui 0,4 din ultima formula scrisa mai sus, obtinem:

deci o eroare imensa de aproape 50%. Asta inseamna ca in loc sa ne asteptam la o participare la vot in jurul lui 85%, cat sugereaza esantionul nostru, deformat de o asemenea masa de non-raspunsuri, va trebui sa cautam proportia reala a probabililor alegatori in jurul lui 37% (85-48).

Proportiile efective de non-raspunsuri, in anchetele si sondajele reale, depind de foarte multi factori, incepand cu tara in care se efectueaza si sfarsind cu prestigiul institutiei care face investigatia, trecand printr-o serie de alte aspecte precum : tema cercetarii, tehnica de ancheta, subpopulatia vizata, calitatea operatorilor etc. O lucrare metodologica, datorata lui Bradburn si Sudman (1979) arata ca in SUA, anchetele efectuate de cunoscutul Bureau of the Census sau alte organisme federale beneficiaza de rate de raspuns cuprinse intre 85 si 95%, in timp ce multe alte investigatii obtin mult sub aceste procente. Astfel, anchetele comerciale sau cele ce beneficiaza de un buget redus reusesc sa colecteze in jur de 30-40% raspunsuri, pe cand cele prin posta si mai putin. Si alte lucrari metodologice atrag atentia asupra anchetei prin posta ca fiind cea mai afectata de problema non-raspunsurilor,

aproximativ 20-25% din chestionarele expediate au fost returnate.