Teoria clasică a testului

Teoria clasică a testului / Psihologie experimentală

Un test este a instrument științific în măsura în care măsoară ceea ce intenționează, adică este valabil și măsoară bine, adică este precisă sau fiabilă. Dacă găsim un instrument din care nu putem avea încredere în măsurile pe care le oferă, deoarece ele variază din când în când atunci când măsurăm același obiect, atunci vom spune că nu este fiabil. Un instrument, pentru a măsura corect ceva, trebuie să fie precis, pentru că altfel, măsurați ceea ce măsurați, măsurați-l greșit. Prin urmare, a fi precis este o condiție necesară, dar nu suficientă. În plus, trebuie să fie valabilă, adică ceea ce măsoară cu precizie va fi ceea ce este destinat să măsoare și nimic altceva.

Ați putea fi, de asemenea, interesat: Teoria răspunsului elementului - aplicații și încercare

fiabilitate:

Fiabilitate absolută și relativă: putem aborda problema fiabilității unui test în două moduri diferite, deși în fundal coincid.

Fiabilitatea ca inexactitatea măsurătorilor sale: Când un subiect răspunde la un test, obține un scor empiric, care este afectat de o eroare. Dacă nu ar exista o eroare, subiectul ar obține scorul său adevărat. Testul este imprecis deoarece scorul empiric nu se potrivește cu adevăratul scor adevărat. Această diferență între cele două scoruri este eroarea de eșantionare, eroarea de măsurare. eroare tipică de măsurare va fi abaterea standard a erorilor de măsurare. eroare tipică de măsurare indică precizia absolută a testului, deoarece permite estimarea diferenței dintre măsurarea obținută și cea care ar fi obținută dacă nu s-a produs nicio eroare.

Fiabilitatea ca stabilitate a măsurătorilor: Un test va fi mai fiabil, mai constante sau mai stabile rezultatele pe care le oferă atunci când se repetă. Cu cât rezultatele sunt mai stabile, în două ocazii, cu atât este mai mare corelația dintre ele. Această corelație este numită coeficientul de fiabilitate. Aceasta ne exprimă nu valoarea erorii, ci coerența testului cu el însuși și constanța informațiilor pe care le oferă. coeficientul de fiabilitate exprimă fiabilitatea relativă a testului.

Coeficientul de fiabilitate și indicele de fiabilitate: - Coeficientul de fiabilitate a unui test este corelarea testului cu el însuși, obținut de exemplu în două forme paralele: rxx. - Indicele de precizie este corelația empirică între scorurile de testare și scorurile reale: RXV rata de precizie va fi întotdeauna mai mare decât coeficientul de fiabilitate pentru determinarea coeficientului de fiabilitate de nota trei metode clasice:

  • Găsirea corelația dintre test și repetarea: Metoda de repetiție sau test-retest Metoda: Acesta constă în aplicarea aceluiași test același grup de două ori și corelația se calculează între cele două seturi de scoruri. Această corelație este coeficientul de fiabilitate. Această metodă oferă, de obicei, un coeficient de fiabilitate mai mare decât cel obținut prin alte proceduri și poate fi contaminat de factori perturbatori.
  • Găsiți corelația între două forme paralele ale testului: Metoda formelor paralele: Pregătiți două forme paralele ale aceluiași test, adică două forme echivalente care oferă aceleași informații și se aplică aceluiași grup de subiecți. Corelația dintre cele două forme este coeficientul de fiabilitate. Prin această metodă, prin repetarea aceluiași test, sunt evitate sursele perturbatoare ale fiabilității retestării.
  • Găsiți corelația între două jumătăți paralele ale testului: Metoda celor două jumătăți: Împărțiți testul în două jumătăți echivalente și găsiți corelația dintre ele. Este metoda preferată, deoarece este simplă și ignoră limitările procedurilor anterioare. Puteți alege elementele ciudate ale testului, pentru a constitui o jumătate și elementele uniforme pentru a constitui cealaltă.

Coeficientul de fiabilitate și corelația dintre testele paralele

coeficientul de fiabilitate a unui test indică proporția că varianța reală este de varianță empirică: gráfico33 Coeficientul de fiabilitate al unui test variază între 0 și 1. De exemplu: dacă corelația dintre două teste paralele este rxx´ = 0,80, înseamnă că 80% din varianța testului se datorează măsurării reale, iar restul, adică 20% din varianța testului, se datorează erorii. indexul de fiabilitate a unui test este corelația dintre scorurile sale empirice și indicele fiabil al punctajului său fiabil = indicele de fiabilitate este egal cu rădăcina pătrată a coeficientului de fiabilitate

Odată ce au fost elaborate două forme paralele ale unui test, se aplică procedura de analiză a varianței pentru a verifica omogenitatea variațiilor și diferența dintre măsuri. Dacă varianțele sunt omogene, diferența dintre mijloacele nu este semnificativă, iar cele două forme sunt construite cu același număr de elemente de același tip și conținut psihologic, se poate spune că sunt paralele. Dacă nu, trebuie să le reformați până când sunt. Lipsa fiabilității este identificată cu valoarea rxx´= 0 4.- Eroarea tipică a măsurătorii: Diferența dintre scorul empiric și cel real este eroarea aleatoare, numită eroare de măsurare. Deviația standard a erorilor de măsurare se numește eroarea de măsurare tipică. eroare tipică de măsurare permite să se facă estimări cu privire la fiabilitatea absolută a testului, adică pentru a estima cât de multă eroare de măsurare afectează un scor.

Fiabilitate și lungime: Durata testului se referă la numărul elementelor sale. Fiabilitatea depinde de această lungime. Dacă un test constă din trei elemente, un subiect poate obține odată un scor de 1 și în altul sau în paralel un scor de

De la o ocazie la alta, scorul a variat cu un punct; un punct deasupra a trei este o variație de 33%, o variație mare. Dacă subiecții obțin variații aleatorii de acest tip, corelarea testului cu el însuși sau cu cele două forme paralele ale testului va fi mult redusă și nu poate fi mare. Dacă testul este mult mai lung, dacă aveți, de exemplu, 100 de articole, un subiect poate obține 70 de puncte într-o singură ocazie și 67 în paralel. De la unul la altul s-au schimbat 3 puncte; este o variație relativ mică în raport cu testul total, în special 3%. Aceste mici modificări ocazionale de această magnitudine, care apar în scorurile subiecților, atunci când merg de la o formă la alta, sunt relativ neimportante și nu se vor diminua la fel de mult ca înainte de corelarea dintre ambele.

Coeficientul de fiabilitate va fi mult mai mare decât în ​​cazul anterior. Ecuația Spearman-Brown exprimă relația dintre fiabilitate și lungime. Precizia unui test este zero când lungimea este de 0 și crește cu creșterea lungimii. Deși creșterea este relativ mai mică, deoarece lungimea unei părți este mai mare. Aceasta înseamnă că precizia crește foarte mult la început și relativ mai puțin mai târziu. Atunci când lungimea tinde spre infinit, coeficientul de fiabilitate tinde să

Creșterea lungimii unui test mărește precizia acestuia deoarece mărește varianța reală la o rată mai mare decât varianța de eroare. Aceasta înseamnă că precizia testului crește deoarece proporția de variație datorată erorii scade. Formula lui Rulon, precum și formula lui Flanagan și Guttman, se aplică în mod special în calcularea coeficientului de fiabilitate prin metoda celor două jumătăți. Acestea sunt formule care sunt folosite pentru a calcula coeficientul de fiabilitate.

Fiabilitate și coerență: Coeficientul de fiabilitate poate fi găsit și într-un alt mod, este așa-numitul coeficientul alfa sau coeficient de generalizabilitate sau de reprezentativitate (Cronbach). Acest coeficient alfa indică precizia cu care unele elemente măsoară un aspect al personalității sau comportamentului. Se poate interpreta ca: O estimare a corelării medii a tuturor elementelor posibile într-un anumit aspect. Măsurarea acurateței testului în funcție de coerența sau de consistența internă (interrelația dintre elementele sale, măsura în care elementele de măsură măsoară toate acestea) și lungimea sa. Indicarea reprezentativității testului, adică cantitatea în care eșantionul de articole care îl compune este reprezentativ pentru populația de posibile obiecte de același tip și de conținut psihologic. coeficientul alfa reflectă în principal două concepte de bază în exactitatea unui test: 1. Interdelarea dintre elementele sale: măsura în care toți aceștia măsoară același lucru.

Durata testului: prin creșterea numărului de cazuri dintr-un eșantion și dacă erorile sistematice sunt eliminate, eșantionul reprezintă mai bine populația din care este extrasă și este mai puțin probabil ca o eroare accidentală să fie implicată. În cazul în care elementele de testare sunt dihotomice (fie 1 sau 0, acord sau dezacord, etc), ecuația coeficient alfa este simplificat, rezultând ecuațiile Kuder-Richardson (KR20 și KR21). Având în vedere un anumit număr de elemente, un test va fi mai fiabil, atunci când este mai omogen. Coeficientul alfa ne spune fiabilitatea, deoarece reprezintă omogenitatea și consistența sau consistența internă a elementelor unui test.

Standarde și criterii de fiabilitate

În conformitate cu modelul spațiului eșantion al obiectelor, obiectivul testului este de a estima măsura care ar fi obținută dacă s-ar utiliza toate elementele din spațiul eșantion. Această măsură ar fi scorul adevărat, la care măsurile reale aproximează mai mult sau mai puțin. În funcție de gradul în care un eșantion de elemente se corelează cu scorurile reale, testul este mai mult sau mai puțin fiabil. In acest model este matricea de corelație centrală între toate elementele din modelul spațial eșantion muestral.Este insistă mai direct asupra consistenței interne, și în măsura în care se asigură în mod indirect atins stabilitatea.

Modelul liniar al testelor paralele insistă mai mult asupra stabilității scorurilor și, în măsura în care atinge stabilitatea, favorizează indirect consistența internă. Dacă aplicăm un test pentru a stabili diagnosticele și prognozele individuale, coeficientul de fiabilitate trebuie să fie de la 0.90 la mai sus. În previziunile și clasificările colective, cererea nu este atât de mare, deși nu este convenabil să scăpăm mult de la 0,90 la 0,80..

Uneori, în anumite tipuri de teste, cum ar fi testele de personalitate, este dificil să se obțină coeficienți mai mari de 0,70. Dacă se aplică formele paralele sau jumătățile paralele, după un interval mai mare sau mai mic, erorile aleatorii pot fi mai numeroase decât cele care afectează coeficientul alfa. Acest lucru se datorează faptului că ceea ce micșorează corelația nu reprezintă doar erorile aleatorii intrinseci ale testului și într-o singură ocazie, care sunt cele care iau în considerare coeficientul alfa, dar influențează, de asemenea, toate erorile care pot veni din cele două situații diferite , care pot diferi în numeroase detalii. De aceea, coeficientul alfa este de obicei mai mare decât ceilalți coeficienți.

Cu excepția coeficientului găsit prin repetarea aceluiași test, deoarece există mai multă probabilitate ca erorile aleatorii ale primei aplicații să fie repetate în al doilea și, în loc să diminueze corelația dintre cele două, ele o cresc. Trebuie să se asigure că a doua aplicație este complet independentă de prima aplicație. Dacă vom realiza acest lucru, aceasta va fi cea mai ușoară și mai ieftină metodă și recomandabilă atunci când încercăm să apreciem stabilitatea scorurilor, în special pe perioade lungi de timp și cu teste complexe. > Următorul: Valabilitatea testelor