|
Utilizarea softurilor statistice in cercetare: modalitati de reprezentare grafica, calculul indicatorilor tendintei centrale, ai dispersiei si ai distributiei.
Obiective operationale:
Dupa lectura acestui capitol, studentii ar trebui sa reuseasca sa:
reprezinte grafic distributia valorilor unei variabile (histograma)
calculeze indicatorii ce descriu o distributie: inclinarea si gradul de aplatizare
calculeze indicatorii tendintei centrale: medie, mediana si mod
calculeze indicatorii de dispersiei ai unei distributii: abaterea standard, varianta, eroarea standard a mediei, amplitudinea, minimul si maximul
In modulul anterior am parcurs pasii necesari configurarii unei baze de date (am definit variabilele independente si dependente) precum si cei necesari pentru introducerea datelor in aceasta. In continuare vom parcurge pasii pentru a obtine primele informatii de natura descriptiva despre esantionul nostru de date.
Modalitati de reprezentare grafica
Histograma este o forma de reprezentare grafica a distributiei unei variabile numerice care ne permite sa determinam intuitiv daca aceasta are o forma simetrica sau asimetrica. In masura in care distributia este simetrica, apropiata de distributia normala, putem utiliza teste statistice parametrice, iar in cazul unei distributii asimetrice vom utiliza teste statistice neparametrice. Pentru mai multe detalii vezi suportul de curs An I al disciplinei Psihologie experimentala si metode de analiza a datelor.
Sa presupunem ca am realizat o replicare in scop didactic a studiul anterior elaborat de Hyde & Jenkins (1973) si am obtinut pe un lot de 20 de subiecti ce au utilizat liste relationate semantic, cu instructiune de estimare a frecventei cuvintelor in limbaj, urmatoarele date:
Subiect |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
ndcr |
20 |
12 |
28 |
18 |
20 |
22 |
24 |
18 |
19 |
25 |
27 |
26 |
23 |
20 |
22 |
23 |
15 |
18 |
15 |
22 |
Pentru a realiza o histograma in
Precum se vede si din figura de mai sus pe axa X avem reprezentate valorile variabile, iar pe axa Y avem frecventa de aparitie a acestora in esantionul nostru de date. In partea dreapta a histogramei avem trecute valorile: abaterii standard (Std. Dev), a mediei (Mean) si numarul de subiecti / masuratori (N). De asemenea se poate observa ca SPSS-ul afiseaza etichetele variabilelor si nu acele nume de maxim 8 caractere, tocmai pentru a usura identificarea acestora.
Indicatori ce descriu forma unei distributii
Precum am precizat anterior histograma ne permite sa evaluam la modul intuitiv daca o anumita distributie de date este simetrica (cvasinormala) sau nu. Pentru o evaluare mai acurata avem la dispozitie doi indicatori statistici de descriu forma unei distributii: inclinarea (skewness) si gradul de aplatizare (kurtosis). Inclinarea este un indicator al simetriei unei distributii. Distributia normala este perfect simetrica si are un indicator de inclinare egal cu zero. Gradul de aplatizare este un indicator al gradului de grupare a valorilor in jurul tendintei centrale. In cazul distributiei normale valoarea acestuia este egala cu zero. Pentru a calcula acesti indicatori vom accesa meniul Analyze din care vom alege optiunea Descriptive statistics si mai apoi optiunea Frequencies . In fereastra activata alegem din lista de variabile, numele variabilei pentru care dorim sa calculam inclinarea si gradul de aplatizare si o adaugam in lista Variable(s):. Tot in aceasta fereastra accesam optiunea Statistics si bifam optiunile: Skewness si Kurtosis. Dand click pe butonul Continue si mai apoi pe butonul Ok, in fereastra de Output vom obtine urmatorul rezultat:
In tabelul de output pe langa valorile celor trei indicatori vom avea: numarul de subiecti inclusi in calcul si numarul de date lipsa (subiecti ce nu au valori introduse in baza de date pentru variabila in cauza). O valoare a indicelui de inclinare sau a gradului de aplatizare care este peste de doua ori valoarea erorii standard a acestuia ne indica o distributie asimetrica.
Indicatori ai tendintei centrale
Urmatorul pas in a obtine mai multe informatii legat de esantionul nostru de date este calcularea indicatorilor tendintei centrale. Cei trei indicatori ai tendintei centrale sunt: media, mediana si modul. Media este rezultatul impartirii sumei tuturor valorilor din esantionul de date la numarul de cazuri. In exemplul nostru acesta este totalul cuvintelor reactualizate de catre toti cei 20 de subiecti impartit la 20. Mediana este acea valoarea din esantionul de date, care se situeaza la jumatatea distantei dintre cea mai mica si cea mai mare valoare intr-o lista ordonata a acestora. Modul este acea valoare care are cea mai mare frecventa de aparitie in esantionul de date. Vom utiliza media ca si estimator al tendintei centrale in cazul in care distributia datelor este cvasinormala. In cazul in care avem o distributie asimetrica mediana si modul vor estima mai acurat tendinta centrala. Pentru a calcula acesti indicatori vom accesa meniul Analyze din care vom alege optiunea Descriptive statistics si mai apoi optiunea Frequencies . In fereastra activata alegem din lista de variabile, numele variabilei pentru care dorim sa calculam indicatorii tendintei centrale si o adaugam in lista Variable(s):. Accesam optiunea Statistics si bifam optiunile: Mean, Median, Mod si Sum. Dam click pe butonul Continue si mai apoi pe butonul Ok. In fereastra de Output vom obtine urmatorul rezultat:
In cazul unei distributii cvasinormale
valorile medie, medianei si modului vor fi apropiate. In tabelul de output
pe langa valorile celor trei indicatori vom avea: numarul de
subiecti inclusi in calcul si numarul de date lipsa
(subiecti ce nu au valori introduse in baza de date pentru variabila in
cauza). In cazul in care exista mai multe valori cu cea mai mare frecventa
de aparitie in esantionul de date si ca atare nu avem un mod
unic,
Indicatori ai dispersiei
In afara tendintei centrale care ne spune
unde se situeaza majoritatea datelor din esantion este foarte
important sa stim si cum sunt distribuite aceste valori in
cadrul esantionului.
Tabelul de output este similar cu cel obtinut pentru indicatorii ce descriu forma distributiei sau cel al tendintei centrale.