Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Statistici preliminare etalonarii testelor psihologice

STATISTICI PRELIMINARE ETALONARII TESTELOR PSIHOLOGICE


I. Tabelarea scorurilor la teste


Presupunem ca aplicandu-se un test de inteligenta la o clasa formata din 42 copii (N=42) au fost obtinute urmatoarele rezultate (= note, cote brute, scoruri):

6160505258386051556855624739

5842474248494846555158654535

4854525646655334485039595352

Examinatorul ar dori sa stie care este nivelul clasei si cat de mari sunt diferentele intre copii. Valorile primare (cotele la test, notele) nu ne spun nimic.

Primul pas pe care trebuie sa-l faca examinatorul este intocmirea tebelei de frecventa. Aceasta se poate realiza in doua variante: cu date negrupate si cu date grupate.



a)Varinta cu date negrupate: se intocmeste tabelul de mai jos.

Tabelul 1


Note obtinute

la test

Tabelarea frecventei

Frecventa

(f)

Frecventa cumulata

34


1

1

35


1

2

38


1

3

39



6

40




41




42


2

8

43




44




45


1

9

46


2

11

47


2

13

48


4

17

49


1

18

50




51


2

21

52


3

24

53


2

26

54


1

27

55


3

30

56


1

31

57




58


3

34

59


1

35

60


2

37

61


1

38

62


1

39

63




64




65


2

41

66




67






68


1

42

Scorul maxim obtinut la acest test este MAX=68, iar cel minim este MIN=34. In prima coloana se trec in ordine crescatoare toate valorile posibile cuprinse intre limitele 34 si 68. In a doua coloana, in dreptul fiecarei valori, se trage cate o linie de fiecare data cand gasim aceast scor in populatia noastra de date. In a teria coloana se trece in cifre numarul de aparitii al fiecarei valori. In a patra coloana se insumeaza frecventele de sus in jos.

b) Varianta cu date grupate:

Spre deosebire de prima varianta, in acest caz, prima coloana contine intervalele in care sunt cuprinse scorurile brute obtinute la test. Marimea intervalului se numeste amplitudine. Se doreste ca amplitudinea sa fie un numar impar (3, 5, 7) pentru ca ne intereseaza intotdeauna valoarea de mijloc a fiecarui interval, care este de dorit sa fie un numar intreg. Se recomanda ca valoarea minima a primului interval sa fie un multiplu al amplitudinii. Amplitudinea intervalului se stabileste astfel: Xmax - Xmin = 68 - 34 = 34. Alegem numarul de intervale cel mai convenabil. El nu trebuie sa fie mai mic de 10 si nu mai mare de 20. Optam pentru un numar de 13 intervale. Amplitudinea intervalului notata cu i va fi:

i = Xmax - Xmin =34 / 13 = 2.6 valoare care prin aproximare este 3. Construim primul interval (de jos in sus) alegand limita minima a celui mai mic interval astfel incat aceasta sa fie mai mica decat cea cel mai mic scor din populatia noastra de date.

Tabelarea frecventelor se realizeaza dupa procedura deja cunoscuta. Coloana xk inglobeaza valorile de mijloc ale fiecarui interval.


Tabelul 2

Interval

Tabelarea frecventei f

Xk

f

Sf

Xk · f

66-68


67

1

42

67

63-65


64

2

41

128

60-62


61

4

39

244

57-59


58

4

35

232

54-56


55

5

31

275

51-53


52

7

26

364

48-50


49

7

19

343

45-47


46

5

12

230

42-44


43

2

7

86

39-41


40

2

5

80

36-38


37

1

3

37

33-35


34

2

2

68



Coloanele f si Sf contin frecventele simple, respectiv, cumulate. Ultima colaoana contine produsul dintre mijlocul intervalului si frecventa. Suma lor este , ceea ce echivaleaza cu suma tuturor valorilor din populatia de scoruri la testul de inteligenta. Ea va putea fi utilizata in calcularea tendintelor centrale.

Deja tabelele, in special tabelul 2, ne ofera unele informatii: liniutele ne arata o anumita aproximare a curbei normale de distributie (forma de clopot este evidenta daca rotiti foia pe orizontala); 24 de valori se situeaza in intervalul de mijloc; extremele sunt rare.




II. Reprezentarea grafica a distributiei de frecvente

Un al doilea pas in interpretarea valorilor primare este reprezentarea grafica a distributiei de frecventa. Aceasta se poate realiza in doua moduri: poligonul frecventelor si histograma.


A. Poligonul frecventelor:

Pe abscisa sunt reprezentate valorile variabilei aleatoare (orice caracteristica psihica, fizica, fiziologica ce ia valori intr-un anumit domeniu de definitie). Exemplu inteligenta ia valori in totalitatea scorurilor obtinute la test, mai frecvent valorile din mijloc ale intervalului. Pe ordonata sunt reprezentate frecventele de aparitie in colectia de date ale acestor valori. Pe abscisa sunt reprezentate valorile de mijloc ale intervalelor.


B. Metoda histogramei

Pe abcisa sunt reprezentate intervalele din tabela de frecventa cu date grupate, pe ordonata sunt reprezentate frecventele. Histograma reprezinta o transpunere in trepte a distributiei de frecventa.

Avantaj: suprafata sa poate fi interpretata ca fiind numarul total de cazuri. Aria fiecarui dreptunghi este egala cu numarul de persoane, de cazuri, ce se situeaza la intervalul respectiv.

Daca numarul de subiecti ar tinde catre valorile obtinute ar fi foarte multe, incat suprafata s-ar diviza in n suprafete, ar capata aspectul de linie curba continua si s-ar apropia foarte mult de forma curbei normale de distributie a lui Gauss.


Graficul este sugestiv pentru deosebirea dintre curba care, teoretic (linia neagra accentuata), s-ar fi putut obtine obtine daca esantionul ar fi fost sufucient de mare, si curba reala obtinuta prin unirea cu o linie continua a conturului exterior al dreptunghiurilor din histograma.

Cu cat esantionul de subiecti (sau colectia de date) este mai mare, cu atat probabilitatea ca histograma sa aproximeze, curba distributiei normale este mai mare. Dupa curba lui Gauss, se distribuie marea majoritate a masuratorilor intreprinse in domeniul fenomenelor fizice si psihofiziologice, cu conditia sa existe un numar destul de mare de masuratori. Semnificatia acestei distributii este ca valorile foarte mari si foarte mici ale unei variabile (statura sau nivelul de inteligenta ), intr-un esantion ales la intamplare din populatia generala, sunt mai rare si situate la extremele abscisei curbei, in timp ce valorile mijlocii sunt mult mai numeroase si ''acopera'' zona de mijloc a curbei. Accentuam ca esantioanele de date trebuie sa fie extrase din populatie la intamplare, pentru a fi reprezentative pentru populatia de apartenenta.

In functie de caracteristicile curbei obtinute vor fi utilizate unele sau altele dintre instrumentele statistice. Sunt doi indici care descriu forma curbei prin raportare la modelul normal care este cel gaussian:

a) indicele de oblicitate (skewness) = masoara asimetria distributiei; o valoare pozitiva are semnificatia ca valorile extreme sunt mai numeroase decat cele medii; o valoare negativa are semnificatia ca valorile extreme ale unei variabile masurate sunt mai putine decat cele de marime medie, ceea ce se si intampla atunci cand populatia de date este obtinuta pe criterii aleatoare si este suficient de numeroasa.

b) indicile de curtoza (kurtosis) = semnifica gradul de ''turtire'' al curbei, comparativ cu o curba normala avand aceeasi abatere standard. Un indice pozitiv semnifica existenta mai multor cazuri in cozile extreme ale curbei decat in zona de mijloc.           Cand curba este bimodala, adica are doua maximuri (''cocoase''), inseamna ca in esantion au fost inclusi subiecti care provin din doua populatii distincte si ca urmare orice generalizare este fara valoare deoarece media se situeaza intre cele doua maximuri.

Inainte de a continua un experiment sau un program de testare este necesar sa studiem curba de distributie. Daca devierea de la forma curbei normale este excesiva, urmeaza unele consecinte privind decizia de a utiliza un anume gen de instrumente statistice sau altul. Asupra acestei chestiuni vom mai reveni.


Masuri ale tendintei centrale

Cand studiem o populatie de date este de dorit sa avem la dispozitie niste indici (numere) care sa exprime intr-o forma cat mai sintetica tendintele populatiei.

A. Unul dintre acesti indici este media aritmetica( x )

In mod obisnuit mediana este desemnata de simbolul . Pentru lejeritatea redactarii am preferat simbolul X.

.

In cazul nostru, pentru date negrupate, media va fi .

Metoda de calcul pentru date grupate.

X .

Media este masura cea mai precisa a tendintei centrale deoarece se bazeaza pe numarul total al valorilor individuale ale variabilei aleatoare. Cand colectia de date se reduce la citeva cazuri media este mai putin relevanta decat mediana.

B. Modulul (moda bruta). Este dat de valoarea cu frecventa cea mai mare. Exemplu : intr-o populatie de date 3, 9, 10, 11, 11, 11, 12, 12, 13, 18 moda bruta este 11. Reprezinta estimatia cea mai grosiera a tendintei centrale a unei colectii de date.

In tabelul 1 modul brut este val. 48 deoarece are frecventa cea mai mare, egala cu 4. In tabelul 2 modul brut este mijlocul intervalului cu frecventa cea mai mare, adica 50.5 (deoarece ''cade'' intre 49 si 52). Gruparea datelor, este un procedeu comod, dar poate duce la unele distorsiuni, cum este cazul valorii diferite a modei brute, mediei si medianei comparativ cu datele negrupate.

C. Mediana. Este punctul central al unei distributii a valorilor unei variabile aleatoare. Ea se defineste ca fiind punctul, dedesubtul si deasupra careia se situeaza 50% din totalitatea valorilor (valorile trebuie aranjate in ordinea marimii lor).



Determinarea medianei pentru date negrupate:

Cazul 1.

N este impar. Fie valorile: 6 9 10 11 12 13 15 17 20 Mediana este 12

Cazul 2.

N este par 3 6 9 10 11 12 13 15 17 20

Mediana este 11.5

Determinarea medianei (tabelul 1.):

Pe coloana frecventelor cumulate cautam valoarea lui 21, care este echivalentul lui 50% din populatie, adica:



In dreptul valorii 21, reperata pe coloana frecventelor cumulate, pe coloana notelor la test gasim valoarea 51. Deci 51 este mediana.


Determinarea medianei pe date grupate

Tabelul 2: Se vede ca 50% din cazuri reprezinta 21. Aceasta valoare este uneori numita quota. Ne situam pe coloana frecventelor cumulate. Valoarea 21 se situeaza intre 19 si 26. Mediana se va situa in jurul valorii de 50 (corespunzator frecventei 19) la care trebuie sa adunam o anumita cota, o corectie ce se determina prin interpolare lineara, corespunzator frecventei de 21. Deoarece de la 19 la 21 sunt doua unitati aplicam regula de trei simpla:

7 3

2 x

Daca unei cresteri de 7 unitati pe scara frecventelor (de la 19 la 26) ii corespunde o crestere de 3 unitati pe scara notelor la test, atunci unei cresteri de frecventa de doua unitati ii va corespunde o crestere, in coloana notelor la test de x.

Mediana = 50,8. Mediana prezinta fata de medie urmatoarele avantaje:

-este mai usor de calculat decat mediana.

poate fi mai reprezentativa decat media in unele situatii.

Intr-o colectie de date care se distribuie, aproximand pana la suprapunere curba normala de distributie media, mediana si moda bruta coincid.


Compararea si combinarea datelor la teste

Pentru a putea interpreta datele rezultate din administrarea instrumentului de psihodiagnoza recurgem la anumite procedee statistice.

Variabile normate. Reprezinta un procedeu statistic prin care pozitia subiectului, intr-o distributie data, privitoare la o anumita caracteristica psihologica, este exprimata atat in raport cu media, cat si in raport cu imprastierea. Acest fapt permite efectuarea unor comparatii intre insusiri, altfel, de necomparat: inteligenta cuiva cu greutatea sa.

Suntem nevoiti sa facem urmatoarele explicatii:

Indicatori pentru inprastiere:

1. Amplitudinea imprastierii = Xmax - Xmin . In cazul datelor noastre Xmax - Xmin =68 - 34 = 34

2. Abaterea medie este media abaterilor absolute

unde = media, X= valorile de la teste

3. Dispersia (s2

, unde - patratul abaterii valorii individuale de la medie.

Pentru esantioane mici, care reprezinta selectii aleatoare dintr-o populatie, dispersia si abaterea standard se calculeza impartind numaratorul la ; pentru populatiile totale utilizam ca numitor N - 1. In cazurile selectiilor din populatia totala abaterea standard se noteaza cu ''s''.

Pentru datele din tabelul 1 abaterea standard va fi:

Sunt mai multe tipuri de variabile normate (note standard). Cel mai intalnit tip de variabila normata este variabila Z care este definita prin catul dintre abaterea individuala de la medie si abaterea standard:

In cazul colectiei noastre de date s = 2,7. Sa luam cazul unui subiect care a obtinut la testul de inteligenta nota 56. Transformata in nota Z , performanta sa va fi, pentru abaterea standard, deja calculata, de 2.7:

Variabilele Z au abaterea standard teoretica egala cu 1.

Presupunand, ca nota Z al aceluiasi subiect la un alt test Y ar fi egala cu 2, am putea afirma ca subiectul respectiv este de doua ori mai bun la al doilea test decat la primul.

Atunci cand valoarea individuala este mai mica decat media rezulta o nota Z cu semn ( - ) ceea ce este un dezavantaj.

Variabila T elimina acest dezavantaj deoarece in formula se adauga o constanta egala cu 50:

.     In exemplul nostru variabilele T au abaterea standard teoretica egala cu 10 si media egala cu 50. Subiectul cu nota T egala cu 59.9 este un subiect situat deasupra mediei. Odata cu aceasta constatare am progresat, caci deja putem face asertiuni despre nivelul de inteligenta.

Valorile variabilei T merg de le 0 la 100 (media =50; abaterea standard= 10), dar in realitate variabila T se distribuie intre 15 si 85.

Variabila Hull. Spre deosebire de variabile normate au abaterea standard de 14.