Teoria răspunsului la element - Aplicații și test

Teoria răspunsului la element - Aplicații și test / Psihologie experimentală

În domeniul domeniului Teoria testelor psihometrice Au apărut denumiri diferite, care poartă în prezent denumirea de "teoria răspunsului elementului" (F. M. Lord, 1980). Această denominație prezintă unele diferențe cu privire la modelul clasic: 1. - relația dintre valoarea așteptată a scorurilor subiectului și trăsătură (caracteristică responsabilă pentru valori), nu este de obicei liniară. 2.- intenționează să facă previziuni individuale fără a fi nevoie să se refere la caracteristicile grupului normativ.

Ați putea fi, de asemenea, interesat de: Index teoria clasică de testare
  1. Teoria răspunsului la elementul sau modelele trăsăturilor latente în teoria testelor
  2. Modele de teorie a răspunsului la articole (tri)
  3. Estimarea parametrilor
  4. Testarea construcției
  5. Aplicații ale teoriei răspunsului elementului
  6. Interpretarea scorurilor

Teoria răspunsului la elementul sau modelele trăsăturilor latente în teoria testelor

Vedem deci că această teorie a răspunsului la articol oferă posibilitatea de a descrie separat atât elementele, cât și indivizii; De asemenea, consideră că răspunsul dat de subiect depinde de nivelul de calificare care are în intervalul considerat. Originea acestor modele se datorează lui Lazarsfeld, 1950, care a introdus termenul "trăsătură latentă" .

De aici se consideră că fiecare individ are un parametru individual care este responsabil de caracteristicile subiectului, numit și "trăsătură". Această caracteristică nu este direct măsurabilă, prin urmare parametrul individual este numit variabila latentă. Când aplicați testele puteți obține două lucruri diferite, scorul adevărat și scala de fitness; Acest lucru se realizează dacă treceți două teste pe aceeași capacitate de fitness în același grup.

În teoria Trasatului Latent sau în teoria răspunsului la element Scorul adevărat este acea valoare care este așteptată de la scorul observat. Potrivit Domnului, adevăratul punctaj și fitness sunt aceleași lucruri, dar sunt exprimate în scale diferite de măsurare.

Modele de teorie a răspunsului la articole (tri)

Modele binomiale de eroare: au fost introduse de Lord (1965), care presupun că scorul observat corespunde numărului de răspunsuri corecte obținute în test (ale căror elemente au aceleași dificultăți și au o independență locală, adică probabilitatea pentru a răspunde corect la un element nu este afectată de răspunsurile date altor elemente).

Modele Poisson: aceste modele sunt adecvate pentru acele teste care au un număr mare de articole și în care probabilitatea unui răspuns corect sau incorect este mică. În cadrul acestui grup, la rândul nostru, avem modele diferite:

  1. Modelul Rasch al lui Poisson, ale căror ipoteze sunt: ​​fiecare test are un număr mare de elemente binare care sunt independente la nivel local. probabilitatea de eroare în fiecare element este mică. Probabilitatea ca subiectul să facă o eroare depinde de două lucruri: dificultatea testului și aptitudinea subiectului. aditivitatea dificultăților, înțeleasă ca rezultat al amestecării a două teste echivalente într-un singur test a cărui dificultate este suma dificultăților celor două teste inițiale.
  2. Modelul Poisson pentru a evalua viteza: Acest model a fost de asemenea propus de Rasch și este caracterizat prin faptul că se ia în considerare viteza de execuție a testului. Modelul poate fi pus în două moduri: numără numărul de erori comise și cuvinte citite într-o unitate de timp. numără numărul de erori comise și timpul petrecut pentru terminarea citirii textului. Probabilitatea de a realiza un anumit număr de cuvinte ale unui test (i) de către un subiect (j), într-un timp (t)
  3. Modele normale Ojiva: este un model propus de Lord (1968), care este folosit în teste cu elemente dichotomice și cu o singură variabilă în comun. Graficul său ar fi după cum urmează: Ipotezele de bază care caracterizează acest model sunt:
  • spațiul variantei latente este unidimensional (k = 1).
  • independența locală între intems.
  • metrica pentru variabila latentă poate fi aleasă astfel încât curba fiecărui element să fie capul de cap normal.

Modele logistice; Este un model foarte asemănător celui anterior, dar are și mai multe avantaje comparativ cu tratamentul matematic. Funcția logistică are următoarea formă: Există diferite modele logistice în funcție de numărul de parametri care au:

  • 2 parametri logistic model, Birnbaum 1968, printre caracteristicile sale menționăm că este unidimensional, există independență locală, elementele sunt dihotomice etc.
  • 3 parametri logistic model, Domnul, este caracterizat deoarece probabilitatea de ghicire a dreptului este un factor care va influența performanța testului. 4.3. Model de logistică cu 4 parametri: model propus de McDonald 1967 și Barton-Lord în 1981, al cărui scop este de a explica acele cazuri în care subiecții care au un nivel ridicat de fitness nu răspund corect la element.
  • Modelul logistic al lui Rasch: Acest model este cel care a generat cel mai mare număr de locuri de muncă, în ciuda faptului că are un dezavantaj, și anume că ajustarea sa la datele reale este mai dificilă. Dar, spre deosebire de aceasta, avantajul care o face atât de folosit este că nu necesită mari Mărimea eșantionului pentru ajustarea dvs..

Estimarea parametrilor

Metoda cea mai folosită este probabilitatea maximă, lângă această metodă sunt utilizate proceduri de aproximare numerică, cum ar fi Newton-Raphson și Scoring (Rao). Metoda maximă de probabilitate se bazează pe principiul obținerii estimatorilor parametrilor necunoscuți care maximizează probabilitatea de a obține probele menționate. Pe lângă probabilitatea maximă, se utilizează și estimarea Bayesiană, bazată pe teorema lui Bayes, care constă în încorporarea a priori a tuturor informațiilor cunoscute relevante pentru procesul de deducere. Un studiu mai aprofundat al metodei Bayesian pentru estimarea parametrilor de fitness este cel realizat de Birnbaum (1996) și Owen (1975). .

INFORMAȚII FUNCȚIONALE

Cel mai bun test care poate fi construit este cel care oferă cele mai multe informații despre caracterul latent. Cuantificarea acestor informații se face prin intermediul "funcțiilor de informare". Formula funcției de informare, Birnbaum 1968, este următoarea: Trebuie să se ia în considerare faptul că informațiile obținute într-un test sunt suma informațiilor fiecărui element, pe lângă faptul că contribuția fiecărui element nu depinde de restul elementelor care alcătuiesc testul. În termeni generali, putem spune că informațiile, în toate modelele:

  • variază în funcție de nivelurile de fitness.
  • Cu cât este mai mare panta curbei, cu atât mai multe informații.
  • depinde de varianța scorurilor, cu cât este mai mare aceasta, cu atât mai puține informații.

Testarea construcției

Prima sarcină și una dintre cele mai importante în momentul construirii unui test este alegerea articolelor, coarda anterioară a ipotezelor teoretice care trebuie să definească trăsăturile pe care testul intenționează să le măsoare. Conceptul de "analiză a elementelor" se referă la setul de proceduri formale care se desfășoară pentru a selecta acele elemente care vor forma în cele din urmă testul. Informațiile considerate cele mai relevante cu privire la articole sunt:

  1. Dificultatea elementului, procentul persoanelor care îl corectează.
  2. Discriminarea, corelarea fiecărui element cu scorul total pe test.
  3. Distractori sau analiza erorilor, influența lor este relevantă, afectează dificultatea obiectului și face subestimarea valorilor de discriminare.

La momentul stabilirii indicatorilor de indicatori diferiți, statisticile sau indicii sunt de obicei utilizați, dintre care cele mai utilizate sunt următoarele:

Index de dificultate Index de discriminare Index de fiabilitate Index de valabilitate Indicatorii cunoscuți care trebuie luați în considerare pentru selectarea elementelor care vor forma testul, vom vedea ce pași sunt necesari pentru construirea unui test:

  1. Specificarea problemei.
  2. Expuneți un set larg de elemente și depanați-le.
  3. Alegerea modelului.
  4. Testați elementele pre-selectate.
  5. Selectați cele mai bune elemente.
  6. Studiați calitățile testului
  7. Stabiliți normele de interpretare a testului final obținut.

Din punctele anterioare trebuie menționat faptul că alegerea modelului, punctul 3, va depinde de obiectivele urmărite de test, de caracteristicile și calitatea datelor și de resursele disponibile. Când se alege un model, având în vedere condițiile teoretice în care acesta poate fi aplicat, nu în ciuda virtuților sale trebuie să fie analizate în fiecare caz și în circumstanțe specifice. Proprietățile atribuite acelor modele care alcătuiesc Teoria răspunsului la element (TRI), pot fi afectate de:

  • dimensionalitatea testului disponibilitatea scăzută a eșantionului de lipsă a resurselor de calculator Există o serie de preferințe atunci când se utilizează unul sau alt model, să le vedem: modelele normale ale capului de cap sunt, de obicei, folosite în aplicații, valoarea lor este teoretică.
  • Rasch: potrivită pentru compararea orizontală (teste comparabile privind nivelurile de dificultate cu distribuții de fitness similare). să aibă diferite forme ale aceluiași test. * 2 și 3 parametri: sunt cei care se potrivesc cel mai bine unei varietăți de probleme.
  • pentru a detecta modele de răspuns eronate. pentru egalizarea verticală a testelor (comparați testele cu diferite nivele de dificultate și diferite distribuții pentru fitness).

1 și 2:

  • potrivite pentru a construi o scară unică, astfel încât să puteți compara abilitățile la diferite niveluri.

Alegerea modelului, pe lângă finalul urmărit, poate fi influențată de mărimea eșantionului; În cazul în care eșantionul este mare și reprezentativ, nu va exista nici o problemă a modelului clasic sau a trăsăturilor latente. Dar în TRI ( teoria răspunsului elementului ) un eșantion mic vă forțează să alegeți modele cu un număr mic de parametri, chiar modelul uniparametru.

Aplicații ale teoriei răspunsului elementului

Să vedem care sunt cele mai frecvente aplicații: a) Egalarea testelor, uneori este necesar să se raporteze scorurile obținute în diferite teste, cu două scopuri posibile:

  • Echilibrarea orizontală: se caută să se obțină diferite forme ale aceluiași test.
  • Vertical Equalization: obiectivul este de a construi o scară unică de aptitudini cu diferite nivele de dificultate. În ceea ce privește testele de potrivire, Lord (1980) a introdus conceptul de „echitate“, ceea ce înseamnă că pentru fiecare subiect două teste pot fi interschimbate și aplicate la unul sau altul nu va varia în funcție de nivelul de fitness a fost estimat pentru subiect.

Studiul părtinitoare a elementelor, un element este înclinat atunci când, în medie, dă scoruri semnificativ diferite în anumite grupuri care ar trebui să facă parte din aceeași populație.

Teste adaptate sau medii , Prin TRI, pot fi construite teste individuale care să permită să deducă într-un mod mai precis adevărata valoare a trăsăturii în cauză. Elementele vor fi administrate secvențial, presetarea unui element sau a altui element va depinde de răspunsurile date mai sus. Există diferite tipuri de teste adaptate, subliniind următoarele:

  • în două etape, Lordul 1971; Bertz și Weiss 1973 - 1974. Un test este trecut mai întâi și în funcție de rezultate este administrat un al doilea test.
  • Procedura în mai multe etape este aceeași cu cea precedentă, numai procesul include mai multe etape.
  • Modelul ramificat fix, Lord 1970, 1971, 1974; Mussio 1973. Toate subiectele rezolvă același element, în funcție de răspuns, un set de elemente este rezolvat.
  • Modelul ramificat variabil se bazează pe independența dintre elementele și proprietățile estimatorilor de probabilitate maximă.

Banca de produse, Având un set mare de elemente este ceva care va îmbunătăți calitatea testului, dar pentru aceasta elementele trebuie să treacă mai întâi printr-un proces de depanare. Pentru a clasifica elementele, este necesar să se țină seama de ce caracteristică este destinată măsurării testului la care va face parte acest element..

Interpretarea scorurilor

cântare: scopul său este de a oferi un continuu ordinii, a clasifica sau a ști care este mărimea relativă a trăsăturii evaluate; acest lucru ne va permite să stabilim diferențe și asemănări în rândul oamenilor cu privire la această trăsătură. Cântarele utilizate în Psihologie sunt: ​​nominal, ordinal, interval și rațiune; aceste scale sunt construite din rezultatele testelor, rezultatele numite "scoruri directe" .

întruchipa : să exemplificăm un test este să transformăm scorurile directe în altele care sunt ușor de interpretat deoarece scorul tipizat va dezvălui poziția subiectului în raport cu grupul și ne va permite să facem comparații intra și interunitare. Există două tipuri de scriere:

  1. Linear, păstrați forma distribuției și nu modificați mărimea corelațiilor.
  2. Non-lineare, ele nu păstrează distribuția sau mărimea corelațiilor .

FITNESS SCALE În TRI, scara care este construită este cea care corespunde nivelurilor de fitness; Această scală este caracterizată deoarece estimările și referințele sunt făcute direct în ceea ce privește aptitudinea și amploarea acesteia. În plus, această aptitudine care este estimată depinde numai de forma curbei caracteristice a elementelor. În cadrul scalelor posibile, indicăm două:

  1. Scale, propus de Woodcock (1978) și este definită de următoarea formulă:
  2. Scara WITS, propusă de Wright (1977), această scală este o modificare a celei anterioare și este dată de următoarea relație: