Principal Altres Teoria de la resposta de l’ítem

Teoria de la resposta de l’ítem

Visió general

Programari

Descripció

Llocs web

Lectures

Cursos

Visió general

La teoria de la resposta de l’ítem (IRT), també coneguda com a teoria de la resposta latent, es refereix a una família de models matemàtics que intenten explicar la relació entre trets latents (característica o atribut no observables) i les seves manifestacions (és a dir, resultats observats, respostes o rendiment). Establixen un vincle entre les propietats dels ítems d’un instrument, les persones que responen a aquests ítems i el tret subjacent que es mesura. L’IRT assumeix que el constructe latent (per exemple, l’estrès, el coneixement, les actituds) i els ítems d’una mesura s’organitzen en un continu inobservable. Per tant, el seu propòsit principal se centra a establir la posició de l’individu en aquest continu.

Descripció

Teoria de les proves clàssiques
Classical Test Theory [Spearman, 1904, Novick, 1966] se centra en el mateix objectiu i abans de la conceptualització de l’IRT; s’utilitzava (i encara s’està) per predir el tret latent d’un individu a partir d’una puntuació total observada en un instrument. A CTT, la puntuació real prediu el nivell de la variable latent i la puntuació observada. L’error es distribueix normalment amb una mitjana de 0 i una SD de 1.

Teoria de la resposta dels ítems vs. Teoria de les proves clàssiques

Supòsits IRT

1) Monotonicitat: la suposició indica que a mesura que augmenta el nivell del tret, també augmenta la probabilitat d’una resposta correcta 2) Unidimensionalitat: el model assumeix que es mesura un tret latent dominant i que aquest tret és la força motriu de les respostes observades. per a cada ítem de la mesura 3) Independència local: les respostes donades als ítems separats d’una prova són mútuament independents donat un cert nivell de capacitat. 4) Invariancia: se’ns permet estimar els paràmetres de l’element des de qualsevol posició de la corba de resposta de l’ítem. En conseqüència, podem estimar els paràmetres d’un ítem de qualsevol grup de subjectes que hagin respost a l’ítem.
Si es mantenen les suposicions, les diferències en l'observació de respostes correctes entre els enquestats es deuran a la variació del seu tret latent.

Els models IRT prediuen les respostes dels enquestats als ítems d’un instrument en funció de la seva posició sobre el continu de trets latents i les característiques dels ítems, també coneguts com a paràmetres. La funció de resposta dels elements caracteritza aquesta associació. La suposició subjacent és que cada resposta a un ítem d’un instrument proporciona una certa inclinació sobre el nivell de la característica o capacitat latent de l'individu. La capacitat de la persona (θ) en termes senzills és la probabilitat d’aprovar la resposta correcta per a aquest ítem. Per tant, com més gran sigui la capacitat de l’individu, més gran és la probabilitat d’una resposta correcta. Aquesta relació es pot representar gràficament i es coneix com a corba característica de l’ítem. Com es mostra a la figura, la corba té forma de S (Sigmoide / Ogive). A més, la probabilitat d’admetre una resposta correcta de forma monòtona augmenta a mesura que la capacitat de l’enquestat augmenta. Cal assenyalar que, teòricament, la capacitat (θ) oscil·la entre -∞ i + ∞, tot i que en les aplicacions normalment oscil·la entre -3 i + 3.

Paràmetres de l'element

A mesura que les capacitats de les persones varien, la seva posició sobre el continu de la construcció latent canvia i la determina la mostra dels enquestats i els paràmetres dels ítems. Un ítem ha de ser prou sensible per puntuar els enquestats dins del continu no observable suggerit.


Dificultat d’element (bi) és el paràmetre que determina la manera com es comporta l’element al llarg de l’escala d’habilitats. Es determina en el punt de probabilitat mitjana, és a dir, en la capacitat en què el 50% dels enquestats aprova la resposta correcta. En una corba característica de l’ítem, els ítems difícils d’adossar es desplacen cap a la dreta de l’escala, cosa que indica la capacitat més alta dels enquestats que l’avalen correctament, mentre que aquells, que són més fàcils, es desplacen més a l’esquerra de l’escala de capacitat. .

La discriminació d’elements (ai) determina la velocitat amb què la probabilitat d’admetre un ítem correcte canvia donats els nivells d’habilitat. Aquest paràmetre és imprescindible per diferenciar entre individus que posseeixen nivells similars de la construcció d’interès latent. El propòsit final, per dissenyar una mesura precisa, és incloure elements amb alta discriminació per tal de poder cartografiar individus al llarg del continu del tret latent. D’altra banda, els investigadors haurien de tenir precaució si s’observa que un ítem presenta una discriminació negativa perquè la probabilitat d’acceptar la resposta correcta no hauria de disminuir a mesura que augmenta la capacitat de l’enquestat. Per tant, s'hauria de revisar aquests elements. L’escala per a la discriminació d’ítems, teòricament, oscil·la entre -∞ i + ∞; i normalment no supera els 2; per tant realment oscil·la entre (0,2)

Endevinar (ci) L’endevinació d’elements és el tercer paràmetre que explica l’endevinació d’un element. Restringeix la probabilitat d’acceptar la resposta correcta a mesura que la capacitat s’acosta a -∞.

Invariació de la població En termes senzills, els paràmetres dels ítems es comporten de manera similar en diferents poblacions. No és el cas quan es segueix el CTT en la mesura. Com que la unitat d’anàlisi és l’ítem de l’IRT, la ubicació de l’ítem (dificultat) es pot estandarditzar (experimentar una transformació lineal) entre les poblacions i, per tant, es poden comparar fàcilment els ítems. Una nota important que cal afegir és que, fins i tot després de la transformació lineal, les estimacions de paràmetres derivades de dues mostres no seran idèntiques, la invariància tal com fa el nom dels estats es refereix a la invariància de la població i, per tant, només s’aplica als paràmetres de població d’elements.

Tipus de models IRT

Models unidimensionals Els models unidimensionals prediuen la capacitat dels ítems que mesuren un tret latent dominant.
Els models dicotòmics d’IRT s’utilitzen quan les respostes als ítems d’una mesura són dicotòmiques (és a dir, 0,1)

El model logístic de paràmetres 1

El model és la forma més senzilla de models IRT. Està format per un paràmetre que descriu el tret latent (capacitat - θ) de la persona que respon als ítems, així com un altre paràmetre per a l’ítem (dificultat). La següent equació representa la seva forma matemàtica:

El model representa la funció de resposta de l’ítem per al Model logístic de 1 paràmetre que prediu la probabilitat d’una resposta correcta donada la capacitat i la dificultat de l’enquestat de l’ítem. En el model 1-PL, el paràmetre de discriminació es fixa per a tots els ítems i, per tant, totes les corbes de característiques de l’ítem corresponents als diferents ítems de la mesura són paral·leles al llarg de l’escala de capacitats. La figura mostra 5 ítems, el que es troba a la dreta més llunyà és el més difícil i probablement estaria recolzat per aquells amb una capacitat més alta.

Funció d'informació de prova
§ És la suma de probabilitats d'aprovar la resposta correcta per a tots els ítems de la mesura i, per tant, estima la puntuació esperada de la prova.
§ En aquesta figura, la línia vermella representa la probabilitat conjunta dels 5 ítems (negre)

La funció d'informació de l'element
Us mostra la quantitat d'informació que proporciona cada element i es calcula multiplicant la probabilitat d'aprovar una resposta correcta multiplicada per la probabilitat de respondre incorrectament.

Cal assenyalar que la quantitat d'informació a un nivell de capacitat determinat és la inversa de la seva variància, per tant, com més gran sigui la quantitat d'informació proporcionada per l'element, més gran serà la precisió de la mesura. A mesura que la informació de l'element es traça en funció de la capacitat, un gràfic revelador representa la quantitat d'informació que proporciona l'element. Els elements mesurats amb més precisió, proporcionen més informació i es mostren gràficament com a més llargs i estretes, en comparació amb els seus homòlegs que proporcionen menys informació. L'àpex de la corba es correspon amb el valor de bi - l'habilitat en el punt de probabilitat mitjana. La quantitat màxima d'informació proporcionada es donaria quan la probabilitat de respondre correctament o malament sigui igual, és a dir, el 50%. Els ítems són més informatius entre els enquestats que representen tot el continu latent i, especialment, entre aquells que tenen un 50% de possibilitats de respondre de qualsevol manera.

Estimació de la capacitat
L’assumpció de la independència local estableix que les respostes als ítems han de ser independents i només s’han d’associar mitjançant la capacitat. Això ens permet estimar la funció de probabilitat del patró de resposta individual per a la mesura administrada mitjançant la multiplicació de les probabilitats de resposta de l’ítem. A continuació, mitjançant un procés iteratiu, es calcula la màxima probabilitat de capacitat. Simplement, l'estimació de màxima probabilitat ens proporciona les puntuacions esperades per a cada individu.

Breu del cas New York Times vs Sullivan

El model Rasch vs. 1- Models logístics de paràmetres

El model logístic de 2 paràmetres


Es permet que el paràmetre de discriminació variï entre els elements. A partir d’ara, l’ICC dels diferents elements es pot creuar i tenir pendents diferents. Com més forta sigui la inclinació, major serà la discriminació de l’element, ja que serà capaç de detectar subtils diferències en la capacitat dels enquestats.

La funció d'informació de l'element
Com és el cas del model 1-PL, la informació es calcula com el producte entre la probabilitat d’una resposta correcta i una resposta incorrecta. No obstant això, el producte es multiplica pel quadrat del paràmetre de discriminació. La implicació és que, com més gran sigui el paràmetre de discriminació, major serà la informació proporcionada per l’ítem. Com que es permet que el factor discriminant variï entre els ítems, els gràfics de funcions d'informació dels ítems també poden tenir un aspecte diferent.

Estimació de la capacitat
Amb el model 2-PL, encara es manté la suposició de la independència local i s’utilitza l’estimació de màxima probabilitat de la capacitat. Tot i que encara es sumen les probabilitats dels patrons de resposta, ara es ponderen pel factor de discriminació per ítem de cada resposta. Les seves funcions de probabilitat, per tant, poden diferir entre si i ser màximes a diferents nivells de θ.

El model logístic de 3 paràmetres


El model prediu la probabilitat d’una resposta correcta, de la mateixa manera que el model 1-PL i el model 2 PL, però està restringit per un tercer paràmetre anomenat paràmetre d’endevinació (també conegut com a paràmetre pseudo casualitat), que restringeix la probabilitat d’aprovar una resposta correcta quan la capacitat de l’enquestat s’acosta a -∞. A mesura que els enquestats responen a un ítem endevinant, la quantitat d'informació proporcionada per aquest ítem disminueix i la funció dels ítems d'informació arriba a un nivell inferior en comparació amb altres funcions. A més, la dificultat ja no es limita a la probabilitat mitjana. Els ítems contestats endevinant indiquen que la capacitat de l’enquestat és menor que la seva dificultat.

Model Fit
Una manera d’escollir quin model s’adapta és avaluar l’ajust relatiu del model mitjançant els seus criteris d’informació. Es comparen les estimacions d'AIC i es tria el model amb l'AIC inferior. Alternativament, podem utilitzar el Chi-quadrat (Desviació) i mesurar el canvi en la proporció de log * versemblança 2 *. Com segueix una distribució chi-quadrat, podem estimar si els dos models són estadísticament diferents entre si.

Altres models IRT

Incloeu models que gestionin dades politòmiques, com ara el model de resposta graduada i el model de crèdit parcial. Aquests models prediuen la puntuació esperada per a cada categoria de resposta. D’altra banda, altres models d’IRT, com els models de resposta nominal, prediuen les puntuacions esperades d’individus que responen articles amb categories de resposta no ordenades (per exemple, sí, no, potser). En aquest breu resum, ens vam centrar en els models IRT unidimensionals, relacionats amb la mesura d’un tret latent, tot i que aquests models no serien adequats per mesurar més d’un tret o tret latent. En aquest darrer cas, s’aconsella l’ús de models IRT multidimensionals. Consulteu la llista de recursos següent per obtenir més informació sobre aquests models.

Aplicacions

Els models IRT es poden aplicar amb èxit en molts entorns que apliquen avaluacions (educació, psicologia, investigació de resultats en salut, etc.). També es pot utilitzar per dissenyar i perfeccionar escales / mesures incloent elements amb alta discriminació que se sumen a la precisió de l'eina de mesura i redueixen la càrrega de respondre qüestionaris llargs. Com que la unitat d’anàlisi del model IRT és l’ítem, es poden utilitzar per comparar elements de diferents mesures sempre que mesurin la mateixa construcció latent. A més, es poden utilitzar en el funcionament diferencial dels ítems, per tal d’avaluar per què els ítems calibrats i provar-se, encara es comporten de manera diferent entre els grups. Això pot conduir a la investigació per identificar els agents causants darrere de les diferències en les respostes i relacionar-les amb les característiques del grup. Finalment, es poden utilitzar en proves adaptatives computaritzades.

Lectures

Llibres de text i capítols

 • Hambleton, R. K. i Swaminathan, H. (1985). Principis i aplicacions de la teoria de la resposta d'ítems. Boston, MA: editorial Kluwer-Nijhoff. Disponible aquí i aquí

 • Embretson, Susan E. i Steven P. Reise. Teoria de la resposta dels ítems. Psychology Press, 2013. Disponible aquí

 • Van der Linden, W. J. i Hambleton, R. K. (Eds.). (1997). Manual de teoria moderna de resposta a ítems. Nova York, Nova York: Springer. Disponible aquí

Aquests tres llibres (Principis i aplicacions de la teoria de la resposta als ítems, Teoria de la resposta als ítems i Manual de teoria moderna de la resposta als ítems) proporcionen al lector els principis fonamentals dels models d’IRT. Tot i això, no inclouen actualitzacions recents ni paquets de programari IRT.

 • DeMars C. Teoria de la resposta dels ítems. Cary, NC, EUA: Oxford University Press, EUA; 2010. Disponible aquí i aquí

En 138 pàgines, DeMars C. ha aconseguit produir un recurs succint però extremadament informatiu que no deixa de desmitificar els conceptes més difícils d’IRT. El llibre és un llibre introductori que tracta els supòsits, els paràmetres i els requisits de l’IRT i, a continuació, explica com es poden descriure els resultats en els informes i com els investigadors haurien de considerar el context de l’administració de les proves, la població enquestada i l’ús efectiu de les puntuacions.

 • Ayala RJd. La teoria i la pràctica de la teoria de la resposta dels ítems. (2009). Notícies de llibres de referència i investigació, 24 (2). Disponible aquí

La teoria i la pràctica de la teoria de la resposta a ítems és un llibre aplicat orientat als professionals. Ofereix una explicació exhaustiva dels models IRT tant unideminsionals com multidimensionals, destacant el desenvolupament conceptual i els supòsits de cada model. A continuació, es demostra els principis subjacents del model mitjançant exemples vius.

 • Li Y, Baron J. Behavioral Research Data Analysis with R: Springer New York; 2012 (capítol 8)

El llibre es va desenvolupar tenint en compte els professionals de la investigació conductual. Els proporciona ajuda per navegar per mètodes estadístics mitjançant R. El capítol 8, se centra en la teoria de la resposta a ítems i ofereix un conjunt de notes i una gran quantitat d'exemples anotats.

 • Una guia visual de la teoria de la resposta a ítems per Ivailo Partchev, Friedrich-Schiller-Universität Jena (2004)

Com el seu nom indica, la guia proporciona una representació visual dels conceptes bàsics de l’IRT. Les miniaplicacions Java impregnen el text i faciliten el seguiment mentre s’expliquen aquests conceptes bàsics. Un recurs excel·lent i us recomanaria llegir-lo un parell de vegades i practicar-lo amb els applets.

 • Baker, Frank (2001). Els conceptes bàsics de la teoria de resposta a ítems. ERIC Clearinghouse on Assessment and Evaluation, Universitat de Maryland, College Park, MD

Un llibre únic que se centra a oferir al lector l’alegria d’adquirir els conceptes bàsics de la teoria de l’IRT sense aprofundir en les complexitats matemàtiques.

 • Thissen, D. i Wainer, H. (Eds.). (2001). Puntuació de proves. Mahwah, NJ: Lawrence Erlbaum. Disponible aquí i aquí

 • Lord, F.M. (1980). Aplicacions de la teoria de resposta d’elements a problemes de proves pràctiques. Hillsdale, NJ: Lawrence Erlbaum. Disponible aquí

 • Baker, F. B. i Kim, S. H. (2004). Teoria de la resposta d’ítems: tècniques d’estimació de paràmetres. Nova York, Nova York: Marcel Dekker. Disponible aquí i aquí

Articles metodològics

 • Lord, F. M. (1983). Estimadors imparcials de paràmetres d’habilitat, de la seva variància i de la seva fiabilitat en formes paral·leles. Psychometrika, 48, 233-245

 • Lord, F. M. (1986). Màxima probabilitat i estimació de paràmetres bayesians a la teoria de resposta a ítems. Journal of Educational Measurement 23 (2): 157-162

 • Stone CA. Recuperació de les estimacions de màxima probabilitat marginal en el model de resposta logística de dos paràmetres: una avaluació de MULTILOG. Mesura psicològica aplicada. 1992; 16 (1): 1-16

 • Green, D. R., Yen, W. M. i Burket, G. R. (1989). Experiències en l'aplicació de la teoria de resposta d'ítems en la construcció de proves. Mesura aplicada a l’educació, 2 (4), 297-312

Articles d'aplicació

 • Da Rocha NS, Chachamovich E Fau - de Almeida Fleck MP, de Almeida Fleck Mp Fau - Tennant A, Tennant A: Una introducció a l'anàlisi de Rasch per a la pràctica i la investigació psiquiàtrica. (1879-1379)

 • Cook KF, O'Malley KJ, Roddey TS. Avaluació dinàmica dels resultats en salut: és hora de deixar sortir el CAT de la bossa? Recerca en serveis sanitaris. 2005; 40 (5 Pt 2): 1694-711

 • Edwards MC. Una introducció a la teoria de la resposta d’elements mitjançant l’escala Need for Cognition. Brúixola de psicologia social i de la personalitat. 2009; 3 (4): 507-29

 • Choi SW, Swartz RJ. Comparació dels criteris de selecció d’elements CAT per a ítems politòmics. 2009 (0146-6216 (imprès)).

 • Rizopoulos, D. (2006). ltm: Un paquet R per al modelatge de variables latents i les anàlisis de la teoria de la resposta a ítems. Journal of Statistical Software, 17 (5). 1-25
  L’objectiu principal de l’article és presentar el paquet ltm en R, que és fonamental per ajustar els models IRT. El paquet ltm se centra tant en dades dicotòmiques com en dades politòmiques. El document proporciona il·lustracions amb exemples de dades reals de la prova d’admissió a la facultat de dret (LSAT) i de la secció de Medi ambient de l’Enquesta d’actituds socials britànica de 1990.

Programari

Per obtenir la llista completa, feu clic al següent enllaç: http://www.umass.edu/remp/software/CEA-652.ZH-IRTSoftware.pdf

Llocs web

Tutorials de Youtube (extremadament útils i informatius)

Cursos

Cursos oferts a Mailman School of Public Health

 • P8417 - Problemes seleccionats en la mesura

 • P8158 - Modelització d'equacions estructurals i variables latents per a ciències de la salut

Pròxims cursos i tallers en línia

Cursos i materials anteriors

 • Taller d’estiu ICPSR 9 de juliol de 2012 - 13 de juliol de 2012. Dr. Jonathan Templin (professor associat del Departament de Psicologia i Recerca en Educació de la Universitat de Kansas)

[pdfs eliminats]

Articles D'Interès

L'Elecció De L'Editor

Què és la nanotecnologia, definició, tipus
Què és la nanotecnologia, definició, tipus
la nanotecnologia ajuda els humans. La nanotecnologia és la branca de la ciència que s'ocupa de l'estudi de partícules d'entre 1 nanòmetre i 100 nm.
Els nous vídeos de rap tenen com a objectiu ajudar a augmentar la vacunació contra COVID-19 en comunitats de color
Els nous vídeos de rap tenen com a objectiu ajudar a augmentar la vacunació contra COVID-19 en comunitats de color
Inclou cinc vídeos animats amb el raper guanyador del premi Grammy Darryl DMC McDaniels de Run-DMC.
Índex d’estrès de l’aigua d’Amèrica
Índex d’estrès de l’aigua d’Amèrica
Servei d’Immigració de Nigèria i la càrrega de la protecció de dades
Servei d’Immigració de Nigèria i la càrrega de la protecció de dades
Columbia Global Freedom of Expression intenta avançar en la comprensió de les normes i institucions nacionals i internacionals que millor protegeixen el lliure flux d’informació i expressió en una comunitat global interconnectada amb grans reptes comuns a abordar. Per assolir la seva missió, la Llibertat d’expressió mundial realitza i encarrega projectes de recerca i polítiques, organitza esdeveniments i conferències i participa en debats globals sobre la protecció de la llibertat d’expressió i informació al segle XXI i hi contribueix.
Htc u11 preu, especificacions, data de llançament, preu a l'Índia, EUA
Htc u11 preu, especificacions, data de llançament, preu a l'Índia, EUA
HTC U11 HTC mobile Preu a l'Índia, EUA. Especificacions mòbils de HTC U11, data de llançament, característiques, informació de la bateria, colors, interfície d'interfície d'usuari de HTC, sensors, imatges
Els ovnis emergeixen, de nou
Els ovnis emergeixen, de nou
Més enllà de les fantàstiques teories de la conspiració i de la discussió, pot haver-hi un problema en intentar resoldre el trencaclosques d’objectes voladors no identificats.
Alumne universitari Tze Chun '02 Showrunner per a 'Gremlins: Secrets of the Mogwai
Alumne universitari Tze Chun '02 Showrunner per a 'Gremlins: Secrets of the Mogwai'
Warner Bros. Animation recupera la clàssica pel·lícula de 1984 Gremlins en un nou programa d'animació.