|
CONSTRUIREA TESTELOR SI CALITATILE PSIHOMETRICE
Calitatile testelor
Desi foarte multi specialisti au incercat sa precizeze elementele fundamentale ce trebuie sa caracterizeze un test, sunt luate drept reper cele 18 calitati ale unui test definite de Claparede, ce vor fi prezentate in continuare (Neveanu 30-37):
Sa fie interesante
Sa fie obiective in aplicare
Sa aiba un instructaj clar, neechivoc
Sa excluda hazardul
Sa fie obiective in apreciere si interpretare
Sa fie gardabile
Sa fie etalonate
Sa prezinte o buna dispersie a rezultatelor
Sa fie rapide
Sa fie univoce
Rezultatele unei probe sa fie reprezentabile
Sa fie inedite
Sa nu faca apel la cunostintele scolare
Sa fie constante
Sa se aplice la toate varstele
Sa permita constructia de forme alternative sau paralele
Sa nu solicite pe cat posibil un instrumentar complex si costisitor
Sa nu masoare decat o singura variabila
Standardizarea testului este calitatea statistica ce exprima uniformitatea lucrului cu testul, uniformitate ce decurge dintr-un ansamblu de norme bine precizate si care trebuie respectate. Din chiar definitia sa, testul ni se propune ca un instrument standardizat sub trei aspecte: continut, aplicare si interpretare.
Standardizarea depinde de o serie de factori, cum ar fi:
uniformitatea stimulilor prezentati pentru a provoca reactiile subiectului (sarcina identica pentru toti);
uniformitatea instructajului dat subiectilor in legatura cu sarcina care trebuie executata;
respectarea timpilor de lucru prezenti pentru rezolvarea sarcinii si notarea precisa a timpului de lucru al fiecarui subiect daca timpul nu se masoara (acest lucru are o valoare simptomatica);
uniformitatea modului de cotare a reactiilor (raspunsurilor) astfel incat subiec-tivitatea examinatorului sa intervina cat mai putin;
uniformitatea interpretarii rezultatelor in functie de procedee statistico-matematice precise.
In concluzie, standardizarea este o cerinta statistica prin care se urmareste uniformizarea de ansamblu a examenului psihologic pe baza de test. Nivelul standardizarii exprima gradul de obiectivitate al testului si, prin urmare, exista o cerinta permanenta in psihodiagnoza si psihometrie pentru cresterea sa.
Esantionarea testelor: Populatie - Esantion - Lot
Interpretarea rezultatelor unui test bazata pe un intreg aparat matematic, presupune masurarea rezultatelor individuale prin raportarea lor la o populatie, la rezultatele unei populatii cat mai reprezentative din punct de vedere numeric si a compozitiei sale sub aspectul unor factori relevanti. Aceasta cerinta ne duce la problema etalonarii testelor. Performantele obtinute la teste in absenta unor indici interpretativi nu sunt operante, pierzandu-si valoarea. Semnificatia reala a rezultatelor o putem cunoaste in conditiile in care efectuam un studiu comparativ de raportare a performantei obtinute la test de catre un individ, la rezultatele unei populatii de referinta, care poate constitui un tabel de norme, un etalon.
Etalonul reprezinta performantele standard, prelucrate statistic, obtinute de un esantion reprezentativ de indivizi. Din punct de vedere statistic, populatie inseamna orice multime de obiecte, fiinte, grupuri de fiinte, fenomene, manifestari, observatii delimitate cu precizie pe baza unor criterii clare.
Populatia de referinta sau de baza defineste o multime din care s-a extras un esantion.
Esantionul este partea unei populatii a carei reprezentativitate in raport cu populatia din care a fost extras permite extinderea cu o precizie determinata a concluziilor obtinute din studiul esantionului pe ansamblul intregii populatii din care el a fost extras.
Lotul reprezinta o grupare de subiecti constituita pe alte criterii decat in baza unor tehnici de esantionare. Astfel, putem exemplifica: o clasa de elevi, grupa de studenti, angajatii unui departament. Criteriile de constituire ale unui lot lot sunt: vecinatatea spatiala, varsta identica, statutul educational si profesional, etc.
Avantajele realizarii unei cercetari pe esantion si nu pe toata populatia se circumscriu volumului de date culese si prelucrate ce poate fi redus de zeci, sute, mii de ori. Aceasta asigura executarea operativa si reduce costurile de realizare. In plus, datorita acestor implicatii de ordin operational o cercetare completa nu este posibila.
Esantionarea ridica pentru statistica 2 probleme esentiale:
o stabilirea unor tehnici de esantionare cat mai corecte;
o stabilirea acelor proceduri de analiza statistica care sa permita extinderea rezultatelor obtinute pe esantion asupra intregii populatii.
Prima cerinta se refera la tehnicile de alegere a esantionului din cadrul populatiei de baza astfel incat el sa reprezinte populatia respectiva cu o precizie determinata. Aceasta inseamna ca include in structura sa parti direct proportionale cu grupele ce constituie respectiva populatie de baza. Structura esantionului trebuie sa reproduca diversitatea calitativa a populatiei ca varsta, sex, profesie, etnie, religie, etc.
Esantionului i se calculeaza mai intai numarul (N), semnificativ pentru esantion: cati membri trebuie sa aiba esantionul. Pentru determinarea lor exacta exista 2 tehnici: esantionarea aleatoare (extragerea din urna la intamplare) si esantionarea cu pas statistic, ce presupune sortarea ,,in pasi" - in sensul ca se extrag de exemplu din 3 in 3, din 5 in 5, din 6 in 6.
Cea de a 2-a cerinta vizeaza stabilirea acelor proceduri de analiza statistica ce permit extinderea rezultatelor de la un esantion la o populatie.
Generalizarea rezultatelor are totdeauna o cota de eroare mai mare sau mai mica in functie de reprezentativitatea esantionului (corecta lui construire) cat si in functie de marimea lui. Cu cat esantionul este mai mic eroarea creste pentru ca exista riscul ca fenomene accidentale sau cu frecventa mai mica, dar reale, prezente in populatia de baza sa nu fie ,,developate" intr-un esantion foarte mic.
Calitatile psihometrice ale testelor
Cand alegem o procedura de masurare a unei calitati psihice sau a mai multora, instrumentul de masura utilizat trebuie sa posede o serie de calitati care sa-i confere o mai mare precizie in masurare, incredere si obiectivitate in rezultatele masurarii. Calitatile psihometrice ne raspund la intrebarea "cand este de bun un test?" si sunt date de urmatoarele caracteristici ale testului:
1. Validitate
2. Fidelitate
3. Sensibilitate
Conceptul de validitate
Validitate este unul din conceptele cheie pentru practica psihologica, fiind calitatea care afecteaza cel mai mult valoarea instrumentelor de masura psihologice.
Lafon (1973) definea validitatea unui test ca fiind calitatea acestuia "de a masura exact ceea ce trebuie sa masoare", iar Lindeman (1978) afirma ca "validitatea unui test este data de masura in care acesta isi indeplineste functia".
Daca pana nu de mult in definirea conceptului de validitate accentul era pus pe evaluarea scorurilor de test ca masura a unei caracteristici, trasaturi, ulterior scorurile la un test sunt receptate ca un predictor a ceva. Acum accentul nu mai cade pe integritatea testului, ci pe increderea pe care o putem avea in deductiile pe baza scorurilor, luand in considerare intregul proces prin care s-au obtinut aceste scoruri (Guion, 1986). Validitatea nu se mai refera atat la instrumentul in sine, ci la interpretarea datelor furnizate de el.
Pentru acceptiunea actuala a conceptului de validitate sunt relevante definitiile:
o Validitatea este gradul in care o anumita inferenta facuta plecand de la un test are inteles, este potrivita si utila (Standards for Educational and Psychological Tests, 1985).
o Validitatea se refera la cat de bine realizeaza un studiu, o procedura sau un instrument de masura ceea ce se presupune ca face (Graziano, Raulin, 1993).
o Validitatea unui test se refera la cat de potrivite sunt interpretarile descriptive, explicative sau predictive care se dau scorurilor sale (Silva, 1993).
o Nunnally si Bernstein (1994) definesc validitatea in termeni de utilizabilitate - 'cat de util stiintific' - este un instrument de masura, daca intradevar acesta masoara ceea ce si-a propus sa masoare.
Toate definiitiile enumerate releva noua semnificatie a validitatii ca o calitate a utilizarii date rezultatelor testului, nu ca o calitate a testului. Pentru o interpretare corecta a scorurilor unui test este necesar sa fie indeplinite doua conditii (Albu, 1995):
(1) Sa se stie exact ce reprezinta scorurile testului: scorurile unui test pot fi masuratori ale unei variabile construite de psihologi (construct psihologic) sau pot fi niste valori care trebuie sa se gaseasca intr-un anumit tip de relatie (de obicei, relatie liniara) cu rezultatele unei alte masuratori.
(2) Masurarile facute de test sa fie corecte: evaluarile facute de test sunt corecte daca ierarhia subiectilor realizata pe baza scorurilor testului este foarte asemanatoare clasamentului acestora pe baza variabilei masurate de test (ale carei valori sunt insa necunoscute) sau pe baza rezultatelor masuratorii cu care se compara testul.
APA Standards (1974) precizeaza ca nici un test nu este valid pentru toate scopurile sau in toate situatiile sau pentru toate esantioanele de indivizi, motiv pentru care sunt necesare demersuri de validare.
Validarea este procesul de investigare a validitatii, de obtinere si evaluare a evidentei validitatii.
Tipuri de validari
In practica psihologica se utilizeaza patru categorii esentiale de definire a validitatii denumite cele 'patru fete ale validitatii' si care in prezent au devenit patru strategii ale validarii inferentelor facute pe baza scorurilor de test (APA Standards, 1985):
1. Validitatea de continut
2. Validitatea conceptuala
3. Validitatea predictiva
4. Validitatea concurenta.
Standardele APA precizeaza ca 'tipurile' de validitate nu se refera la 'categorii disjuncte'; nu se poate afirma ca un tip de validitate este mai potrivit decat altul pentru o anumita utilizare a testelor sau pentru o categorie specifica de inferente bazate pe scoruri.
Validitatea testului relativa la constructul masurat
Validitatea relativa la construct se aplica in cazul testelor care masoara constructe psihologice, cum sunt chestionarele de personalitate.
Constructul psihologic este 'o eticheta pentru o grupare de comportamente care covariaza' (Silva, 1993). El este considerat ca 'o notiune teoretica derivata din cercetare si din alte experiente, care a fost construita cu scopul sa explice pattern-uri de comportament observabile' (Standardele APA, 1985). Termenul de "construct" apare adesea ca sinonim pentru 'concept': intre cei doi termeni exista insa o deosebire, evidentiata de Cronbach (1966): 'constructul' este 'o categorie creata intentionat pentru a organiza experienta in enunturi generale care se prezinta sub forma de legi'. Un construct este, deci, o notiune elaborata si utilizata intr-un cadru stiintific (teoretic, metodologic sau aplicativ).
Fiecare construct psihologic este fundamentat pe o teorie, care permite descrierea si predictia comportamentelor legate de el, in situatii specifice.
Validitatea relativa la construct a testului (construct validity) este denumita si 'validitate conceptuala' (concept validity) sau adesea 'validitate ipotetico-deductiva' (Albu, 1998, Bacher, 1981).
Validarea testului relativa la constructul masurat urmareste intelegerea dimensiunilor evaluate de test si se ocupa ca scorurile testului sa realizeze o masurare corecta a atributului psihic pentru care a fost construit. Numai intelegand constructul masurat de test se pot formula ipoteze asupra predictiilor pe care le face testul si asupra relevantei si a reprezentativitatii continutului sau. Deci, validarea constructului trebuie sa preceada validarea continutului testului si validarea relativa la criteriu.
Pentru a verifica gradul in care un test masoara bine un anumit construct, este necesar sa se realizeze o descriere a constructului in termeni comportamentali concreti. Operatia numita explicarea constructului consta din trei pasi (Murphy & Davidshofer, 1991):
Se identifica acele comportamente care au legatura cu constructul masurat de test.
Se identifica alte constructe si pentru fiecare se decide daca are sau nu legatura cu constructul masurat de test.
Se alcatuieste cate o lista de comportamente prin care se manifesta aceste constructe. Pentru fiecare din ele, pe baza relatiilor dintre constructe, se decide daca are sau nu legatura cu constructul masurat de test.
Operatia de validare a testului relativa la constructul masurat se descompune in trei componente:
validarea materialului testului (substantive validity), care necesita specificarea constructului masurat de test si se confunda uneori cu validarea continutului testului;
validarea structurii constructului aflat la baza testului (structural validity), care identifica elementele componente ale constructului si investigheaza legaturile dintre ele;
validarea externa (external validity), care urmareste sa determine relatiile constructului cu alte masuratori (constructe sau variabile observate).
Validarea externa se refera la calitatea testului de a avea relatii corecte cu alte masuratori psihologice si este denumita 'validitate convergenta si discriminanta' (Murphy & Davidshofer, 1991; Trochim, 2001). Validitatea convergenta se refera la masura in care conceptele care ar trebui relationate teoretic sunt interrelationate si in realitate. Validitatea discriminativa se refera la masura in care conceptele care nu ar trebui sa fie relationate teoretic, nu sunt interrelationate in realitate (D.T. Campbell si D.W. Fiske). Pentru a pretinde ca instrumentul pe care il utilizam are validitate de construct, trebuie demonstrate ambele tipuri de validitate.
Astfel, prin validarea testului relativa la constructul masurat se valideaza atat testul cat si ipotezele aflate la baza sa.
Validitatea testului relativa la continutul sau
Validitatea relativa la continut se analizeaza la testele care se utilizeaza pentru a estima "cum actioneaza o persoana in universul de situatii pe care testul intentioneaza sa il reprezinte" (Standards for Educational and Psychological Tests, 1974).
In literatura psihologica exista pareri contradictorii despre ceea ce se urmarese prin validarea testului relativa la continut. Opinia lui Anastasi (1976), concordanta si cu standardele APA, arata ca acest tip de validare implica 'examinarea sistematica a continutului testului pentru a determina daca el acopera un esantion reprezentativ din domeniul de comportamente pe care testul in cauza trebuie sa il masoare'. Itemii testului reprezinta un esantion extras dintr-o populatie larga de itemi posibili care desfinesc ceea ce testul trebuie sa masoare. Daca esantionul este reprezentativ pentru populatie, atunci se admite ca testul are validitate relativa la continut (Gregory, 1992). Silva (1993) arata ca trebuie luat in considerare nu numai continutul itemilor testului ci si procesul utilizat de subiect pentru a ajunge la formularea rapunsului.
Adoptand punctul de vedere formulat de Anastasi (1976) pasii de urmat in analiza validitatii relative la continutului unui test sunt:
Definirea si descrierea detaliata a domeniului de continut al testului; proiectarea unui esantion reprezentativ de itemi aferenti testului;
Analiza itemilor testului - sunt eliminati itemi care nu se refera la comportamente cuprinse in domeniul de continut;
Evaluarea itemilor de test ramasi de catre un grup de experti in ceea ce priveste relevanta si referirea la domeniul de continut al testului;
Experimentarea testului proiectat si analiza de itemi.
Procedura nu este simpla, fiecare pas presupune parcurgerea unor demersuri statistice adecvate care combina adesea validitatea de continut cu validitatea de constructie (Landy, 1989).
Validarea relativa la continut nu reprezinta o validare in sensul definitiei date de APA Standards (1985), fiind o simpla analiza a testului in privinta claritatii, a reprezentativitatii si a relevantei continutului sau. Validitatea relativa la continut se impune in cazul testelor utilizate la masurarea unui atribut ce nu poate fi exprimat printr-un construct (Murphy, Davidshofer, 1991), in cazul testelor de cunostinte, cand nu exista un criteriu extern potrivit pentru a analiza validitatea relativa la criteriu; in cazul testelor care verifica deprinderi sau cunostinte insusite in cadrul unui program de instruire etc.
Validitatea testului relativa la criteriu
Validarea relativa la criteriu se refera la gradul in care deductiile facute pornind de la scorurile testului - numit in acest caz predictor - concorda cu cele bazate pe scorurile unei alte masurari - numita criteriu.
Daca testele sunt utilizate pentru a se lua decizii, validarea relativa la criteriu urmareste daca deciziile bazate pe scorurile testului coincid cu cele care se refera la valorile variabilei criteriu, despre care se presupune ca permite luarea unor decizii corecte.
In teoria testelor psihologice, criteriul este "o variabila pe care incercam sa o prevedem in general cu ajutorul testelor" (Grand dictionnaire de la psychologie, 1994). Criteriul este "o masura a nivelului de performanta exprimata in termeni cantitativi, bazata pe o descriere completa a muncii prestate". Problema criteriului poate fi foarte simpla daca munca genereaza ceva cuantificabil.
Variabila criteriu poate fi unidimensionala sau multidimensionala, cu valori cantitative sau/si calitative. In selectia profesionala o variabila criteriu poate fi constituita din calificativul obtinut pentru o performanta anterioara, rezultatele unei probe de lucru (cu valori cantitative), dar si unele date demografice (apreciate dihotomic, de exemplu sexul, starea civila etc.).
Pentru ca aprecierea sa fie corecta, criteriul trebuie sa indeplineasca urmatoarele conditii (Albu, 1998):
Sa fie fidel - sa concorde cu diverse evaluari ale performantelor la care el se refera, facute la momente diferite si/sau cu alte instrumente similare de masura. Pentru verificarea acestei conditii se iau in considerare coeficientii de corelatie.
Sa fie practic - sa nu coste mult, sa fie acceptabil pentru cei care doresc sa il utilizeze la luarea deciziilor. Criteriul trebuie sa includa principalele aspecte care sunt avute in vedere la aprecierea performantei sau a marimii caracteristicii masurate.
Sa fie exprimat in aceleasi unitati sau in unitati comparabile pentru toate persoanele.
Pentru criteriile multidimensionale, valoarea criteriului pentru fiecare persoana trebuie sa reflecte importanta diverselor componente si nivelul individului la fiecare dintre ele.
Aprecierea validitatii relative la criteriu se face in mod obisnuit prin intermediul a doua abordari strategice: validarea predictiva si validarea concurenta.
Validarea predictiva
Validarea predictiva se aplica cand scorurile testului sunt folosite pentru a prezice valorile pe care o anumita variabila le va avea in viitor. Validitatea predictiva are ca obiectiv determinarea gradului de eficienta a unui test in prognoza comportamentului unei persoane intr-o anumita situatie data. Ea se realizeaza prin compararea scorurilor testului cu rezultatele obtinute la un criteriu, in general, de eficienta profesionala/scolara, dupa un interval de timp mai lung sau mai scurt.
Pentru validarea predictiva se folosesc loturi neselectionate: toate persoanele carora li s-a administrat testul urmeaza acelasi tratament si vor fi prezente la evaluarea variabilei criteriu. In acest fel, in lotul de subiecti care serveste la compararea testului cu criteriul vor exista atat scoruri mari cat si scoruri mici la test.
In practica determinarea validitatii predictive se dovedeste a fi o activitate greu de realizat. Sunt foarte reduse cazurile in care sa fie posibila, de pilda, examinarea psihologica a unor candidati in scop de angajare, angajarea lor si apoi, dupa un anumit timp, sa se evalueze reusita lor profesionala si sa se determine capacitatea predictiva a testului utilizat.
Coeficientul de validitate si interpretarea lui
Coeficientul de validitate este un coeficient de corelatie care demonstreaza existenta unei relatii intre scorurile unui test si scorurile care definesc rezultatele unei masuratori considerate drept variabila criteriu. Este un indice statistic care releva gradul de asociere dintre doua variabile. Corelatia dintre variabila predictor si variabila criteriu se refera la ceea ce obisnuit este numit 'coeficient de validitate'.
Coeficientii de corelatie utilizati pot fi corelatia liniara sau metoda Pearson, alti coeficienti alesi in functie de natura variabilelor studiate cum ar fi tipul acestora, marimea esantionului, forma distributiei. Corelatia rangurilor prin metoda Spearman se poate folosi in contextul utilizarii unei evaluari prin ierarhizare.
Se apreciaza ca un test are validitate buna atunci cand coeficientul de validitate este mare. Hull (Guilford, 1965) a impus conditia ca un test sa fie utilizat in practica doar daca are un coeficient de validitate mai mare de .45. Murphy si Davidshofer (1991) apreciaza ca un test bun rareori poate da, cu un criteriu important, un coeficient de corelatie mai mare de .5. Exista rare cazuri cand coeficientul de validitate depaseste .30 sau .40 (Nunnally & Bernstein, 1994). Explicatia autorilor este ca oamenii au o structura prea complexa ca sa se poata estima cu o precizie suficient de mare eficienta lor profesionala prin intermediul unor teste, oricat de bine ar fi acestea proiectate. In aceeasi masura, la fel de distorsionate sunt si masuratorile la criteriul prin care masuram performantele intr-un domeniu sau altul de aplicatie.
Fidelitatea
Conceptul de fidelitate in teoria testelor se refera la consistenta, stabilitatea in timp a performantelor scorurilor la teste.
Fidelitatea este 'gradul in care scorurile testului sunt consistente sau repetabile, adica masura in care ele nu sunt afectate de erorile de masura' (APA Standards, 1985).
Tehnicile prin care se studiaza consistenta masuratorilor facute prin teste, indiferent ca este vorba despre teste de aptitudini, inventare de personalitate sau teste de cunostinte, sunt cunoscute sub denumirea de tehnici de estimare a fidelitatii.
Masuratorile pe care le efectuam cand este vorba de factorul uman, nu sunt niciodata perfect stabile sau consistente. Comportamentul uman fluctueaza de la un moment la altul si de la o situatie la alta. Teoriile fidelitatii testelor au fost proiectate cu scopul de a estima efectele instabilitatii preciziei masurarilor psihologice. Un test este considerat fidel atunci cand este precis, lipsit de erori de masura si orice persoana obtine scoruri egale la test si la o forma paralela a acestuia, conditiile de administrare fiind astfel stabilite incat erorile de masura la cele doua teste, pentru orice persoana, sa fie independente (Albu, 1998).
Scorurile de test variaza in functie de rezultatele a doi factori: variabilitatea scorurilor adevarate si variabilitatea erorilor de masurare. Daca procedura de testare si testul insusi insumeaza un numar mare de erori, influentand performantele subiectilor, scorurile la test vor fi inconsistente; la o repetare a sesiunii de testare, scorurile vor fi diferite, adica, nu vor fi stabile. Daca erorile de masurare au un efect redus asupra scorurilor la test, testul va reflecta preponderent aspecte consistente ale performantei subiectilor etichetate ca 'scor real' sau 'scor adevarat'.
In practica, coeficientii de fidelitate pot servi unuia sau ambelor obiective:
(1) la estimarea preciziei masurarii realizate de o procedura particulara cum ar fi aceea a unui instrument de masura ori test psihologic;
(2) la estimarea consistentei performantei unei proceduri de masurare.
Dupa Wesman (1952) este posibil sa avem performante nefidele din partea unei persoane la un test considerat ca fiind fidel, dar obtinerea de performante fidele la un instrument nefidel este un lucru imposibil. Pitariu & Albu (1996) fac precizarea ca nu vorbim despre fidelitatea unui instrument de masura, ci despre fidelitatea acelui test aplicat la o anumita populatie si in anumite conditii. Fidelitatea testelor psihologice are repercusiuni nemijlocite asupra deciziilor pe care psihologul le ia cu privire la oameni.
Metode de evaluare a fidelitatii
Estimarea fidelitatii urmareste sa determine cat de mult din variabilitatea scorurilor observate la un test este atribuita erorilor de masurare si cat de mult este ea atribuita variabilitatii scorurilor adevarate.
Coeficientii de fidelitate care se calculeaza pentru un test variaza in functie de ceea ce masoara testul si conditiile in care a fost administrat. Literatura de specialitate recomanda utilizarea urmatoarelor metode de calcul a fidelitatii:
Metoda test-retest - utilizata in calculul coeficientilor de stabilitate pentru scorurile obtinute in doua instante de testare cu aceeasi proba; arata cat de stabile sunt scorurile in timp.
Metoda injumatatirii (split-half) - produce un coeficient de echivalenta, fiind o varianta a metodei testelor paralele.
Metoda analizei consistentei interne - coeficientul de fidelitate se calculeaza pe baza analizei consistentei interne a unui test administrat o singura data. Din aceasta catgorie fac parte coeficientii a al lui Cronbach, l3 al lui Guttman si coeficientii Kuder-Richardson (KR-20 si KR-21)
Coeficienti de fidelitate inter-evaluatori
In cazul testelor pentru care cotarea nu este obiectiva, evaluatorul devine o componenta a procesului de masurare realizat cu ajutorul testului. Chiar daca evaluatorii indeplinesc conditiile de cunostinte si experienta pentru a putea avea calitatea de "evaluator", apar cu siguranta diferente in ceea ce priveste aprecierea pe care o fac. Pentru a verifica masura in care scorurile testului sunt dependente de cel care a facut cotarea, se calculeaza coeficientul de corelatie liniara intre scorurile atribuite acelorasi subiecti de evaluatori diferiti. Astfel rezulta coeficientul de fidelitate inter-evaluatori.
La momentul alegerii metodei de estimare a fidelitatii unui test trebuie sa tineam cont de ceea ce masoara testul, de scopul pentru care va fi folosit si de conditiile concrete in care se poate face testarea, daca exista sau nu posibilitatea administrarii repetate a testului, daca exista forme paralele ale testului etc. (Albu, 1998).
Dintr-o multime de teste avand toate celelalte caracteristici egale, este de preferat testul care are cea mai mare fidelitate. Dar, pe de o parte, testul cel mai fidel poate fi si cel mai scump sau mai dificil de administrat. Pe de alta parte, caracteristicile testelor sunt rareori egale.
Este imposibil sa se specifice un nivel minim care sa fie impus coeficientilor de fidelitate ai tuturor testelor. Murphy si Davidshofer (1987) formuleaza urmatoarele recomandari:
se vor cere niveluri inalte de fidelitate acelor teste care sunt folosite pentru a se lua decizii importante asupra persoanelor si celor care impart indivizii in mai multe categorii pe baza unor diferente relativ mici intre ei;
se vor accepta niveluri scazute de fidelitate atunci cand testele se utilizeaza pentru a lua decizii preliminare, nu finale, si in cazul testelor care impart persoanele intr-un numar mic de categorii, pe baza unor diferente individuale mari.
T.L. Kelley (Guilford, 1965) sugereaza ca, in general, pentru a discrimina bine intre indivizi, un test trebuie sa aiba un coeficient de fidelitate de cel putin .94 (fiind patratul unui coeficient de corelatie, coeficientul de fidelitate este cuprins intotdeauna intre 0 si 1). Alti autori admit valoarea minima de .90. Exista, insa, mai multe teste foarte utile cu coeficienti de fidelitate mai mici de .80. In practica ne asteptam la coeficienti de fidelitate cuprinsi intre .70 si .98 (Guilford, 1965).
Sensibilitatea
Este calitatea statistica a testului care defineste finetea discriminativa a acestuia, adica numarul de clase pe care il permite in cadrul unui grup. Altfel spus sensibilitatea tine de capacitatea testului de a diferentia cat mai mult pe o plaja cat mai larga indivizii testati intre ei. Un test este cu atat mai sensibil cu cat imparte in mai multe categorii indivizii, aceasta desigur in concordanta si cu diferentele reale care exista intre ei.
Manualul testului
Predictia psihologica bazata pe teste a cunoscut o dezvoltare stiintifica riguroasa. Calitatea unui test de a fi valid si fidel reprezinta criterii esentiale pe care trebuie sa le urmarim atunci cand alegem sa folosim o proba psihologica intr-un anumit scop, in vederea fundamentarii unei decizii. Un aspect important legat de utilizarea testelor si procedurilor de testare psihologica se refera la calitatea intrinseca a acestora. In aceasta idee, un test nu este lansat pe piata fara ca anterior acesta sa nu fi fost verificat. Se pretinde ca orice test sa fie deci insotit de un manual de utilizare. Manualul testului este cel care ne da toate detaliile si conditiile de utilizare si eficienta a testului. Acest manual trebuie sa contina
Baza conceptuala a testului
Datele psihometrice aferente constructiei testului
Norme si standardele de interpretare
Valoarea si limitele testului in cauza
Studii de caz, anexe cu studii de validare, studii critice etc.