|
DETERMINAREA 'VALORII CENTRALE' SAU A 'TENDINTEI CENTRALE'
In exemplul analizat in Modulul 2 (Fig. 2.2. si Tab. 2.5.) s-a putut constata cum datele tind sa se concentreze parca in jurul unei valori centrale; efectivele cele mai mari (16 si 10, respectiv 9) corespund in acest caz claselor situate la mijlocul sirului.
Acest aspect il intalnim destul de frecvent in experimentele psihologice. In anumite situatii, majoritatea rezultatelor pot sa graviteze fie in partea dreapta, fie in partea stanga a seriei de variatie. Se vorbeste atunci de distributii asimetrice. Si in aceste cazuri datele tind sa graviteze in jurul unor valori. Indicii prin care se determina in mod curent 'tendinta centrala' a rezultatelor sunt media, mediana si modul.
Media, pe care o notam cu m, nu este altceva decat suma valorilor, a datelor numerice, impartita la numarul acestora. Formula ei de definitie este m=∑x/N, in care ∑ inseamna 'suma de', x reprezinta valorile sau rezultatele individuale, iar N constituie efectivul grupei studiate. In capitolele ce urmeaza va fi vorba de formule de definitie, necesare pentru intelegerea unui indice statistic si de formule de calcul, care indica procedurile statistice aplicabile pentru determinarea unui indice (media, abaterea standard, varianta etc). Psihologul care beneficiaza de serviciile unui calculator, dotat cu programe informatice pentru prelucrarea statistica a datelor, se poate dispensa de cunoasterea si stapanirea formulelor de calcul. Calculatorul ofera la cerere, rezultatul calculului, indiferent de procedura aplicata. Ca exercitiu preliminar, parcurgerea acestor tehnici este utila pentru a ne da seama de transformarea ce se produce asupra datelor brute. De asemenea, in absenta serviciilor unui calculator sau a programelor informatice necesare, stapanirea formulelor de calcul devine necesara, eventual in vederea improvizarii unui program.
Revenind la formula de definitie a mediei, intrucat N este totdeauna dat, urmeaza sa stabilim procedee de calcul pentru ∑x (suma valorilor numerice), pe care o notam cu T (initiala cuvantului 'total').
Cand volumul datelor noastre este destul de restrans, pentru a-l determina pe T facem o simpla adunare fara sa mai grupam valorile.
Metoda da calcul presupune distributie statistica data, ca aceea din tabelul 3.1. Precizam ca, pentru a pastra notatia acreditata de lucrari clasice in domeniu, cu f am notat efectivele si nu frecventa relativa (proportiile), raportata la intreg.
Vom avea trei coloane: valorile lui x grupate in clase, valorile centrale xk, si efectivele corespunzatoare f. Pentru calcularea lui T adaugam o coloana in plus cu produsele fxxk. Asadar inmultim fiecare valoare centrala xk cu efectivul corespunzator clasei respective, iar produsele inscrise in coloana fxxk le adunam si obtinem totalul T.
Stiind ca m = T/N, vom efectua impartirea si vom obtine media.
In exemplu nostru: m = 672/51 = 13,17.
Tabelul 3.1
Calcularea mediei
xk
f
fxxk
3-5
4
3
12
6-8
7
5
35
9-11
10
9
90
12-14
13
16
208
15-17
16
10
160
18-20
19
4
76
21-23
22
3
66
24-26
25
1
25
N = 51
T = 672
Asa cum s-a precizat, media pune in evidenta tendinta centrala a rezultatelor constate intr-o experienta. Prin calcularea mediei obtinem o masura a nivelului mediu relativ la un esantion studiat, fapt care permite apoi comparatii intre grupe.
Mediana este un alt indice al tendintei centrale, care se utilizeaza mai ales cand avem de-a face cu distributii asimetrice. De exemplu, in cronometrari se inregistreaza succesiv timpul de executie a unei operatii de productie la un muncitor; distributia empirica obtinuta este, de regula, asimetrica si atunci se retine mediana ca masura a timpului de lucru.
Pentru a gasi mediana - pe care o notam cu med - trebuie sa aranjam, in cazuri mai simple, toate datele (valorile) in ordine crescanda sau descrescanda.
Mediana este acea valoare care imparte sirul ordonat in doua grupe egale ca numar. Cu alte cuvinte, mediana se gaseste la mijlocul sirului: jumatate din valori se afla deasupra, iar cealalta jumatate dedesubt. Locul sau rangul pe care il ocupa mediana in sirul ordonat se detrmina cu ajutorul formulei (N+1)/2 (care nu este formula de definitie pentru med).
Cand valorile constituie un numar fara sot, mediana va corespunde determinantei din mijloc. Astfel, in seria valorilor: 4, 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, med = 7 pentru ca 7 este valoarea care imparte sirul ordonat exact in doua. Formula (N + 1)/2 ne indica locul pe care se gaseste mediana. In cazul nostru med este valoarea situata pe locul al 6- lea in sirul ordonat [(11 + 1)/2 = 6].
Daca valorile ordonate sunt in numar cu sot, mediana se va gasi la mijlocul sirului, intre doua valori consecutive.
Fie datele ordonate: 3, 4, 4, 5, 6, 7, 7, 8, 8, 9; deci 10 valori. Mediana se va gasi pe locul 5,5 deoarece (N + 1)/2 este in cazul acesta (10 + 1/2) adica 5,5. Cautand in sirul dat valoarea situata pe locul 5,5 constatam ca ea se gaseste intre doua valori consecutive:6 si 7.In consecinta vom face media celor doua valori: med va fi egala cu 6,5.
Tabelul 3.2. Calculul medianei in cazul datelor grupate
Interval
xk
f
fc
24-26
25
1
51
21-23
22
3
50
18-20
19
4
47
15-17
16
10
43
12-14
13
16
33
9-11
10
9
17
6-8
7
5
8
3-5
4
3
3
i = 3
N = 51
Cand datele sunt grupate ca in tabelul 3.2 localizam mai intai intervalul in care se gaseste mediana luand ca reper N/2. In exemplul citat N/2 = 51/2 = 25,5 deci mediana se afla in intervalul (12 - 14) ale carui limite exacte sunt 11,5 si 14,5 (variabila fiind considerata continua). Formula care ne da valoarea medianei este urmatoarea:
in care:
l este limita inferioara a intervalului reperat,
Fs este totalul frecventelor situate sub l (in exemplul dat 3 + 5 + 9 = 17),
fi= frecventa corespunzatoare intervalului localizat, iar N si i sunt notatii cunoscute
In exemplul ales vom avea:
Spre deosebire de medie, mediana prezinta avantajul de a nu fi afectata de variatiile extreme ale seriei, fapt care o face potrivita pentru studiul distributiilor asimetrice.
Modul este valorea care se repeta mai des intr-un sir de rezultate, adica valoarea care prezinta frecventa cea mai mare.
De exemplu, in seria de date 4, 5, 6, 6, 7, 7, 7, 7, 8, 9 modul este 7, deoarece 7 este valoarea cu frecventa cea mai mare.
Cand datele sunt grupate, modul este clasa care reuneste cei mai multi din subiecti, mai precis - valoarea centarala a acestei clase. De exemplu, in tabelul 3.2., clasa care intruneste frecventa maxima este 12 - 14, a carei valoare centrala este 13.
Dupa cum se vede, modul poate fi determinat prin simpla examinare a valorilor, fara sa fie necesare operatii de calcul. Ca indice al tendintei centrale, modul este foarte aproximativ si se ia in considerare mai ales la prima inspectie a datelor. In cazul distributiilor normale modul, mediana si media coincid sau prezinta valori foarte apropiate.