Documente noi - cercetari, esee, comentariu, compunere, document
Documente categorii

Calitatile psihometrice (metrologice) ale testelor psihologice

CALITATILE PSIHOMETRICE (METROLOGICE) ALE TESTELOR PSIHOLOGICE


A) Validitatea. In sens larg indica daca proba masoara ceea ce isi propune, si cat de adecvat realizeaza acest lucru. Pana la validare orice proba (test) ramane o simpla ipoteza. Validitatea se exprima in indici de corelatie intre rezultatele la test si valorile criteriului, indici obtinuti prin prelucrarea scorurilor la test si la criteriu pe un anumit esantion. Testul va fi valid pentru populatia din care s-a extras in mod aleator acest esantion. " Despre nici un test nu se poate vorbi in mod abstract ca are o validitate mare sau mica. Validitatea sa trebuie sa fie stabilita in legatura cu o anumita utilizare care este conferita testului" (A. Anastasi, 1976, p.139).



Validarea poate fi verificata prin refacerea studiului de validitate pe un esantion diferit, extras din aceeasi populatie.

Functie de distanta care separa momentul masurarii performantelor la criteriu de momentul testarii psihologice distingem validitatea concurenta (nici o distanta) si validitatea predictiva (interval de cel putin cateva luni pana la un an sau mai mult).

Probele validate concurent ne spun ceva despre situatia prezenta a performantei profesionale, in timp ce validitatea predictiva justifica utilizarea lor ca predictori ai viitoarelor performante in scoala, munca, sport, etc (Blum si Naylor (1968). Anastasi (1976, 1979) accentueaza faptul ca este gresit sa substituim validitatii predictive validitatea concurenta, deoarece o validitate concurenta inalta nu garanteaza o validitate predictiva pe masura. Astfel, utilizarea unui test validat pe un lot de salariati nu poate avea valoare predictiva in selectia unor candidati noi care pot fi foarte diferiti fata de primii (Anastasi,1979). Utilizarea unui test, pe o alta populatie decat aceea pe care s-a realizat validarea, produce o restrangere a validitatii pe care o contracaram prin contravalidare (cross - validation). Pe de alta parte, astazi nu mai este agreata ideea unei predictii pe termen lung ( Radu,1993), datoritacaracterului dinamic, in continua schimbare al diferitelor activitati umane in beneficiul carorara se realizeaza testarea psihologica.

Ambele tipuri de validitati rezulta din confruntarea predictorului cu criteriu (criterion-related validity), si se exprima, asa cum am mai spus, in indici de corelatie. Aceste valori trebuie sa fie semnificative la praguri de probabilitate de cel putin .05 (Smith, 1971). Validitatea predictiva poate fi exprimata si in graficele de previziune (Radu,1993), care indica proportia de succes / insucces, functie de scorurile la test.

Validitatea de criteriu inregistreaza o mare variabiliate care este imputata criteriului de catre Ghiselli, faptului ca esantioanele pe care se intreprind studiile de validitate sunt prea mici, de catre Schmidt si Hunter, diferentelor dintre aceleasi posturi sau meserii in organizatii diferite, de catre Albright, Smith si Glennon sau schimbarilor care au loc in structura meseriilor.

Toate acestea sugereaza limitele validitatii de criteriu precum si motivatia cercetatorilor de a fundamenta noile tipuri de validitati, validitatea sintetica, validitatea de continut si validitatea de constructie.


Validitatea sintetica este definita ca fiind rezultatul analizei sistematice a elementelor activitatii, al determinarii validitatilor testelor pentru aceste elemente si al combinarii acestor validitati intr-un intreg (Anastasi , 1976). Validitatea sintetica si-a gasit aplicarea in situatiile in care companiile dispun de putini salariati ocupati in aceeasi meserie, iar validitatea unor teste nu poate fi generalizata datorita specificitatii elementelor meseriei in cauza. Astfel Guion, citat de Anastasi (1976), procedeaza la analiza detaliata a celor 48 de posturi specifice unei meserii din cadrul unei firme, posturi care, totusi, se deosebeau apreciabil din punctul de vedere al sarcinilor, si detaseaza sapte elemente comune Fiecare salariat a fost evaluat pe baza elementelor specifice postului sau. Aceste evaluari au constituit criteriul si au fost confruntate cu scorurile angajatilor la fiecare test dintr-o baterie ipotetica. A rezultat o baterie separata pentru fiecare post, luand doua dintre teste pentru fiecare element de munca al postului respectiv.




Validitatea de constructie (sau conceptuala) exprima gradul in care un test concorda cu teoria subiacenta, sau mai exact spus, faptul daca testul masoara constructul teoretic corelat.

Anastasi propune urmatoarele metode de control ale validitatii de constructie: corelarea, moderata cu un alt test; identificarea validitatii factoriale, respectiv stabilirea saturatiei testului in factorii identificati; controlul consistentei interne prin tehnica injumatatirii sau prin eliminarea itemilor care nu departajeaza suficient subiectii din lotul celor buni de aceia din lotul celor slabi; controlul validitatii divergente, respectiv, verificarea existentei unei corelatii ,obligatoriu nesemnificative, cu alte teste cu care testul in cauza nu trebuie sa coreleze (Anastasi , 1976).


Validitatea de continut indica gradul in care itemii testului sunt in adevar un esantion de comportament, respectiv masura in care testul acopera ansamblul de sarcini, conditii sau procese mintale care privesc domeniul condensat de acesta (Radu,1993). Validitatea de continut se realizeaza prin analiza de itemi.

Validitatea factoriala. Este capacitatea testului a corela inalt si semnificativ cu factorul masurat. Echivaleaza cu saturatia testului intr-un anumit factor si este furnizat in autput-ul analizei factoriale, avand de obicei forma unui tabel cu dubla intrare (Pe vericala sunt trecute testele bateriei iar desupra coloanelor sunt trecuti factorii identificati prin analiza factoriala. Saturatiile sunt prezentate in casutele tabelului.).


Problema criteriului

Validarea instrumentelor de psihodiagnoza nu poate fi realizata in afara criteriului. Criteriul este piatra unghiulara a utilizarii testelor psihologice. Desi importanta sa in psihologia aplicata este majora, in acest curs nu putem decat schita problematica ampla, creata in jurul sau, urmand ca acesta sa fie abordata mai pe larg in cursul de psihologia muncii, arie in care, de altfel aceasta problematica s-a diversificat.

Criteriul, intr-o prima aproximatie reprezinta, o expresie sintetica a realitatii psihocomportamentale investigate cu mijloacele de psihodiagnoza. El este, pe de alta parte, expresia principiului fundamental al psihodiagnozei, anume ca realitatea psihica, activitatea umana primeaza in raport cu instrumentele destinate investigarii ei. Nu testul valideaza realitatea ci dimpotriva el este valid doar in masura in care surprinde aceasta realitate.

In domeniul profesiilor, criteriul este expresia valorii profersionale ("a measure of goodness", Blum si Naylor,1968).Mc. Cormick il defineste ca pe o variabila dependenta, Leplat si Cuny ca pe o variabila care permite evaluarea unui fenomen (Pitariu, 1983) iar Guion impinge operationalizarea mai departe definind criteriul ca pe ceva despre care se pot face predictii (Blum si Naylor, 1968). Dupa A. Anastasi ''criteriul reprezinta o masuratoare directa si independenta a ceea ce testul isi propune sa masoare'' (Anastasi, 1976, p140).



Analiza atenta a acestor definitii, dincolo de constatarea eclectica potrivit careia criteriul este ceea ce afirma fiecare definitie, reliefeaza pluralitatea formelor de abordare a acestuia, si deopotriva faptul ca orice sistem de evaluare a reusitei (scolare, profesionale, etc.) este un criteriu potential (Pitariu, 93). Este insa necesar ca standardul selectat sa aiba o sensibilitate suficienta pentru a discrimina indivizii. (Blum si Naylor,1968).

Dupa Bellows, un criteriu bine ales trebuie sa fie: valid, realist, reprezentativ,constant de la o situatie la alta, si predictibil. La aceasta lista Blum si Naylor(1968) mai adauga urmatoarele cerinte: sa nu fie scump, sa fie usor de inteles, masurabil, relevant, necontaminat, discriminativ.


B) Fidelitatea exprima stabilitatea in timp a rezultatelor sub aspectul: constantei rezultatelor, cand aceesi subiecti au fost examinati de persoane diferite; constanta rezultatelor in timp; caracterul adecvat al tuturor probelor care constituie testul in ansamblu; omogenitatea probelor.

De asemenea fidelitatea ne arata daca diferentele individuale obtinute cu ajutorul testelor sunt rezultatul diferentelor reale sau daca sunt efectul unor factori exteriori trasaturii masurate, adica al unor factori variabili.

Stabilitatea in timp evaluata prin metoda examinarii - reexaminarii (La copii, intervalul nu gtrebuie sa fie lung deoarece intervine facorul dezvoltare. De exemplu, la copiii de 7 ani fidelitatea la bateria Stanford- Binet a fost de .90 dupa 4 ani, .74 dupa 11 ani si .68 dupa 11 ani. Pentru adulti testele de inteligenta au o scazuta valoare predictiva.

Najunsurile metodei testarii - retestarii sunt corectate prin aplicarea la aceeasi subiecti a doua forme echivalente ale testului.

Stabilitatea la examinatori diferiti. Acest tip de fidelitate se verifica prin compararea scorurilor obtinute de examinatori diferiti pe acelasi lot de subiecti. Un test suficient standardizat, avand o buna consistenta interna, cu proceduri bine elaborate poate produce scoruri care sunt slab influentate de catre particularitatile psihice ale examinatorului. De exemplu la testul Goodenough corelatiile intre rezultatele obtinute de trei examinatori au fost: .87, .90, .92. Influentele determinate de relatia examinat-examinator sunt mai evidente in testele de personalitate. Examinatorul este mai sensibil la acele tulburari la care el este mai vulnerabil. Trei examinatori care au adoptat experimental atitudini diferite la Rorscach au obtinut variatii in tipurile de raspuns. O noua metoda de administrare si de interpretare a testului Rorscach elaborata de J. Exner (1992) releva o constanta interevaluatori mult mai mare.

Stabilitatea scorurilor obtinute de examinatori diferiti este influentata de experienta lor legata de testul respectiv. Ea joaca un rol atat de important incat chiar la testele de inteligenta, examinatori diferiti pot obtine pe acelasi lot diferente de de 30-40 de puncte QI.




Omogenitatea testului se pune in evidenta prin procedeul divizarii, respectiv prin procedeul gruparilor itemilor pari si impari. Se administreaza testul pe esantionul de calibrare, se corecteaza prestatiile subiectilor si se obtin scorurile individuale, pe itemi si globale, dupa care se trece la aplicarea uneia sau alteia dintre cele proceduri, sau a ambelor, deodata. (In ambele situatii trebuie obtinute doua colectii de scoruri la test, intre care se calculeaza coeficientul de corelatie).

Consitenta se stabileste prin corelarea fiecarui subtest (parte componenta cu celelate). Aceasta exprima gradul de omogenitate al testului.

Fidelitatea formelor echivalente se stabileste in cazul probelor paralele. Numarul de itemi, dificultatea, conditiile de administrare si interpretare trebuie sa fie egale.

Fidelitatea depinde atat de calitatile testului dar si de natura trasaturii masurate. Testele de personalitate au o fidelitate mai mica.

Gradul de fideliate acceptat variaza cu scopul in care este utilizat testul respectiv:

- Cel putin .94, pentru clasificari dupa rang individual

- Cel putin .75, cand rezultatele unui test sunt verificate prin alte teste sau prin observatii.

In concluzie, fidelitatea unui test exprima consistenta rezultatelor in cele trei situatii evocate mai inainte. Constanta, echivalenta si omogenitatea notelor (cotelor) la test reprezinta diferite forme ale consistentei si exprima eroarea de masurare.

- Aceleasi exigente ca la validitate in publicarea testului.

C) Sensibilitatea semnifica finetea discriminativa, adica numarul de clase realizate de note intr-un grup de subiecti. Sensibilitatea difera la un test de dedezvoltare fata de un test de aptitudini. In cazul testelor de dezvoltare diferentele intre mediile a doua varste consecutive sunt mai mari decat in interiorul grupelor respective. Claparede considera ca o proba este caracteristica unei varste daca este reusita de 75% dintre sub. normali si nu este reusita de 75% dintre sub. cu un an mai mici (Schiopu, U., op.cit.). Invers, in cazul testelor de aptitudini, diferentele dintre indiviziii de aceeasi varsta depasesc pe cele dintre doua varste succesive.

Fidelitatea si sensibilitatea sunt, mai degraba, alte fatete ale validitatii si trebuie luate in considerare doar in legatura cu aceasta. Astfel, daca un test nu poate fi valid in afara unei fidelitati si a unei sensibilitati acceptabile, un test fidel si sensibil dar ivalid este lipsit de sens si de utilitate.


Intrebari pentru autoevaluare

-Care sunt criteriile care deosebesc un test psihologic de o colectie de sarcini ?

- Explicati importanta problemei criteriului pentru psihodiagnostic, in general si pentru teste in special.