Principal Altres Anàlisi de factors exploratoris

Anàlisi de factors exploratoris

Visió general

Programari

Descripció

Llocs web

Lectures

Cursos

immanuel kant imperatiu categòric

Visió general

Aquesta pàgina descriu breument els mètodes d’anàlisi de factors exploratoris (EFA) i proporciona una llista de recursos anotats.

[La narració següent es basa fortament en James Neill (2013) i Tucker i MacCallum (1997) , però va ser destil·lat per a estudiants de doctorat Epi i investigadors júnior.]

Descripció

L’anàlisi de factors és una família de tècniques centenàries que s’utilitza per identificar l’estructura / dimensionalitat de les dades observades i revelar les construccions subjacents que donen lloc als fenòmens observats. Les tècniques identifiquen i examinen els clústers de variables intercorelades; aquests clústers s’anomenen factors o variables latents (vegeu la figura 1). En termes estadístics, l’anàlisi de factors és un mètode per modelar la matriu de covariància de la població d’un conjunt de variables mitjançant dades de mostra. L’anàlisi de factors s’utilitza per al desenvolupament de la teoria, el desenvolupament d’instruments psicomètrics i la reducció de dades.


Figura 1. Exemple d’estructura de factors dels trastorns psiquiàtrics comuns. Els trastorns comuns semblen representar dues dimensions latents, les alteracions interioritzadores i externes. De Krueger, R. F., 1999, L’estructura dels trastorns mentals comuns. Arxius de Psiquiatria General. 56: 921-926.

El psicòleg i estadístic Charles Spearman (de fama de coeficients de correlació de Spearman) va iniciar l’anàlisi de factors el 1904 en el seu treball sobre les dimensions subjacents de la intel·ligència. El seu ús es va veure obstaculitzat per càlculs pesats manuals fins a la introducció de la informàtica estadística; des de llavors la tècnica ha florit.

Hi ha dos tipus principals d’anàlisi de factors: exploratori i confirmatori. En l'anàlisi de factors exploratoris (EFA, el focus d'aquesta pàgina de recursos), cada variable observada és potencialment una mesura de cada factor i l'objectiu és determinar les relacions (entre variables i factors observats) que són més fortes. En l’anàlisi de factors confirmatoris (CFA), es planteja una estructura de factors senzilla, cada variable només pot ser una mesura d’un factor i l’estructura de correlació de les dades es prova amb l’estructura hipotetitzada mitjançant proves de bondat d’ajust. La figura 2 és una representació gràfica d’EFA i CFA.


Figura 2. EFA (esquerra) i CFA (dreta). Adaptat de Wall, M., 20 de setembre de 2012, Sessió 3 conferència convidada a Epidemiologia dels problemes de drogues i alcohol, Hassin, D., Universitat de Columbia Mailman School of Public Health

Hi ha diferents tècniques analítiques de factors per a diferents escenaris de mesurament i dades:

  1. Les variables observades són contínues, i les hipòtesis de les variables latents són contínues

  2. Les observacions són contínues, les latents són categòriques

  3. Les observacions són categòriques, les latents són contínues

  4. Les observacions són categòriques, les latents són categòriques

Aquesta pàgina de recursos se centrarà en els escenaris 1 i 3.

Les figures 3 i 4 següents il·lustren algunes premisses bàsiques de la teoria de la mesura en relació amb l’anàlisi del factor:

  1. Els factors o variables latents influeixen sistemàticament en les variables observades (és a dir, quan mesurem les variables observades, aquestes mesures / observacions són causades, almenys en part, per variables latents)

  2. Les diferències interindividuals (és a dir, la variància) en les variables observades es deuen a variables latents i a un error de mesura

  3. Cada tipus de factor (comú, específic - vegeu més avall), a més de l'error de mesura, contribueix a una part de la variància


Figura 3. Elements que influeixen en les variables observades. Figura adaptada de Tucker, LR i MacCallum, RC. 1997, Anàlisi de factors exploratoris: http://www.unc.edu/~rcm/book/factornew.htm

La figura 3 mostra que tres coses influeixen en les variables observades. Dos són tipus de variables o factors latents. Els primers són factors comuns, que donen lloc a més d’una de les variables observades (per exemple, la capacitat matemàtica pot donar lloc a la puntuació de la prova d’addició, la puntuació de la prova de multiplicació i la puntuació de la prova de divisió). El segon són factors específics, que donen lloc només a una de les variables observades (un factor comú pot convertir-se en un factor específic si elimineu totes les variables observades excepte una a les que donen lloc). La tercera cosa que influeix en les variables observades és l’error de mesura, que no és latent, sinó que sovint es deu a esdeveniments no sistemàtics que influeixen en la mesura. L’error de mesura està estretament lligat a la fiabilitat.

Cadascun dels elements que influeixen en les variables observades també contribueixen a la variància d’aquestes variables. La figura 4 mostra que la variància d'una determinada variable observada es deu en part a factors que influeixen en altres variables observades, a factors que només influeixen en la variable observada donada i a l'error de mesura. De vegades, la variància comuna es coneix com a comunalitat, i la variància específica i la variació d'errors sovint es combinen i es coneixen com a singularitat.


Figura 4. Estructura de la variant de les variables observades. Figura de James Neill, 2013, Anàlisi de factors exploratoris, conferència 5, Investigació i disseny d’enquestes en psicologia. http://www.slideshare.net/jtneill/exploratory-factor-analysis

La figura també mostra una diferència clau entre l'anàlisi de factors ianàlisi de components principals. En l'anàlisi de components principals, l'objectiu és explicar la major quantitat de la variància total de les variables observades com sigui possible; s’utilitzen combinacions lineals de variables observades per crear components. En l'anàlisi de factors, l'objectiu és explicar la covariància entre variables; les variables observades es defineixen com a combinacions lineals dels factors.

El punt principal és que la teoria analítica del factor tracta de tenir en compte la covariació entre variables observades. Quan les variables observades es correlacionen entre si, la teoria analítica del factor diu que la correlació es deu, almenys en part, a la influència de variables latents comunes.

Supòsits

L’anàlisi de factors té els següents supòsits, que es poden explorar amb més detall als recursos enllaçats a continuació:

  1. Mida de la mostra (per exemple, 20 observacions per variable)

  2. Nivell de mesura (per exemple, els escenaris de mesurament / dades anteriors)

  3. Normalitat

  4. Linealitat

  5. Valors atípics (l'anàlisi del factor és sensible als valors atípics)

  6. Factorabilitat

Valors propis i càrregues de factors

[Nota: aquesta revisió de l'àlgebra matricial us pot ajudar a entendre què passa sota el capó amb valors propis i càrregues de factors, però no és completament necessari per interpretar els resultats de l’anàlisi de factors.]

Els factors s’extreuen de les matrius de correlació mitjançant la transformació d’aquestes matrius per vectors propis. Un vector propi d'una matriu quadrada és un vector que, quan es multiplica per la matriu quadrada, produeix un vector que és un múltiple enter del vector original. Aquest múltiple enter és un valor propi.

El valor propi representa la quantitat de variància que té en compte cada factor. Cada factor extret tindrà un valor propi (el múltiple enter del vector original). El primer factor extret intentarà absorbir el màxim possible de la variància, de manera que els valors propis successius seran inferiors al primer. Els valors propis superiors a 1 són estables. El total de tots els valors propis és el nombre de variables observades al model.


Figura 5. Diagrama de tartera, de James Neill, 2013, Anàlisi de factors exploratoris, conferència 5, Investigació i disseny d’enquestes en psicologia. http://www.slideshare.net/jtneill/exploratory-factor-analysis

Cada variable aporta una variància de 1. Els valors propis s’assignen a factors segons la quantitat de variància explicada. Els gràfics de tartera (figura 5 següent) són una sortida comuna en el programari d’anàlisi de factors i són gràfics de valors propis. Representen la quantitat de variància explicada per cada factor i el tall és el nombre de factors just abans de la corba de la parcel·la de tarteres, per exemple, al voltant de 2 o 3 factors de la figura 5. Els valors propis i les parcel·les de tartera us poden guiar per determinar com hi ha molts factors que s’adapten millor a les vostres dades.

Les càrregues de factors són una matriu de com es relacionen les variables observades amb els factors que heu especificat. En termes geomètrics, les càrregues són els coeficients numèrics corresponents als camins direccionals que connecten factors comuns amb variables observades. Proporcionen la base per interpretar les variables latents. Les càrregues més altes signifiquen que la variable observada està més fortament relacionada amb el factor. Una regla general és considerar les càrregues superiors a 0,3.

Rotacions

Els factors es giren (literalment, en l'espai geomètric) per ajudar a la interpretació. Hi ha dos tipus de rotació: ortogonal (perpendicular), en la qual no es permet correlacionar els factors entre si, i obliqua, en què els factors són lliures de prendre qualsevol posició en l'espai del factor i es poden correlacionar entre si. Alguns exemples de rotació ortogonal inclouen varimax, quartimax i equamax. Alguns exemples de rotació obliqua inclouen oblimin, promax i geomin. Vegeu els recursos següents per triar un mètode de rotació.

Després de la rotació, els factors es reordenen per passar de manera òptima a través de grups de variància compartida, de manera que els factors es poden interpretar més fàcilment. Això s’assembla a escollir un grup de referència en regressió. La figura 6 il·lustra una rotació de factors mitjançant varimax, però només amb finalitats conceptuals. Les rotacions es produeixen sota el capó del vostre programari.


Figura 6. Exemple de rotació varimax ortogonal. Les variables observades corresponen a les característiques del vi. D’Abdi, Hervé. http://www.utdallas.edu/~herve/Abdi-rotations-pretty.pdf

EPT amb elements dicotòmics

Una matriu de correlació de Pearson no és adequada per a ítems categòrics o dicotòmics, de manera que, per realitzar EFA amb aquestes dades, heu de crear una matriu de correlació adequada, anomenada tetracòrica (per a ítems dicotòmics) o policòrica (per a altres ítems categòrics). Una matriu de correlació tetracòrica és la correlació inferida de Pearson a partir d’una taula 2 × 2 amb el supòsit de normalitat bivariada. Policoric ho generalitza en una taula n x m.

La idea, il·lustrada per la figura 7, és que representen els elements dicotòmics
construccions contínues subjacents. En crear una matriu de correlació tetracòrica, bàsicament estimeu un model basat en proporcions que cauen a cada àrea de l’angle inferior dret de la Figura 7. L’ordinador prova nombrosos llindars i combinacions.


Figura 7. Representació de la variable dicotòmica observada (sí / no deprimit) i una construcció latent contínua. A l'extrem inferior es mostra com es modela aquesta última per la primera.

A la primavera de 2013, MPlus és l’estàndard d’or per dur a terme EFA en articles dicotòmics, però també és possible implementar a R. Vegeu els recursos següents, en particular, la documentació del paquet Psych.

Lectures

Llibres de text i capítols

Articles metodològics

Metodològic (teoria i antecedents)

Metodològic (aplicat)

Articles d'aplicació

Programari

install.packages (psych)
biblioteca (psicologia)

? fa

# demo ràpida d'anàlisi de factors exploratoris

dades (Harman)

cap (Harman.Holzinger) # 9 × 9 matriu de correlació de proves d’aptitud cognitiva, N = 696

cor.plot (Harman.Holzinger)

pa<- fa(Harman.Holzinger, 4, fm=pa, rotate=varimax, SMC=FALSE)
imprimir (pa, sort = TRUE)

#prints results, sort = TRUE mostra les càrregues per valor absolut. u ^ 2 és singularitat i h ^ 2 és #fiabilitat. Consulteu els valors de? Fa per obtenir informació sobre com trucar a resultats específics

tartera (Harman.Holzinger, factors = TRUE, pc = TRUE, main = Trama de tartera, hline = NULL, afegir = FALS)

#crea un diagrama de tartera: gràfics lineals de valors propis. Representen la quantitat de variància #explicada per cada factor i el tall és el nombre de factors just abans de la corba # de la parcel·la de tartera, per exemple, al voltant de 2 o 3 factors de la figura 5. Els valors propis i les parcel·les de tartera poden # guiar-vos per determinar quants factors s’ajusten millor a les vostres dades.
diagrama fa. (pa, ordena = TRUE, talla = .3, simple = TRUE, errors = FALS, dígits = 1, e.size = .05, rsize = 0.15)

# un diagrama d’aspecte familiar de la relació entre factors i variables observades
#code per a elements dicotòmics

your.data<-read.csv(, header=TRUE, stringsAsFactors=FALSE)
vostre.fa<-fa.poly(your.data, nfactors=3, n.obs = 184, n.iter=1, rotate=geominQ, scores=tenBerge, SMC=TRUE, symmetric=TRUE, warnings=TRUE, fm=wls,
alfa = .1, p = .05, oblic.scores = TRUE)

# la principal diferència aquí és la rotació (heu de triar un mètode oblic): geominQ és el #més proper al que fa MPlus), el mètode de factorització (els mínims quadrats ponderats, o wls, és el més proper a #MPlus però no és exacte) i les puntuacions = tenBerge.

# Si voleu fer vosaltres mateixos la matriu de correlació tetracòrica, utilitzeu el paquet policor

install.packages (polycor)
biblioteca (policor)

? hetcor

Cursos

Articles D'Interès

L'Elecció De L'Editor

Què és la nanotecnologia, definició, tipus
Què és la nanotecnologia, definició, tipus
la nanotecnologia ajuda els humans. La nanotecnologia és la branca de la ciència que s'ocupa de l'estudi de partícules d'entre 1 nanòmetre i 100 nm.
Els nous vídeos de rap tenen com a objectiu ajudar a augmentar la vacunació contra COVID-19 en comunitats de color
Els nous vídeos de rap tenen com a objectiu ajudar a augmentar la vacunació contra COVID-19 en comunitats de color
Inclou cinc vídeos animats amb el raper guanyador del premi Grammy Darryl DMC McDaniels de Run-DMC.
Índex d’estrès de l’aigua d’Amèrica
Índex d’estrès de l’aigua d’Amèrica
Servei d’Immigració de Nigèria i la càrrega de la protecció de dades
Servei d’Immigració de Nigèria i la càrrega de la protecció de dades
Columbia Global Freedom of Expression intenta avançar en la comprensió de les normes i institucions nacionals i internacionals que millor protegeixen el lliure flux d’informació i expressió en una comunitat global interconnectada amb grans reptes comuns a abordar. Per assolir la seva missió, la Llibertat d’expressió mundial realitza i encarrega projectes de recerca i polítiques, organitza esdeveniments i conferències i participa en debats globals sobre la protecció de la llibertat d’expressió i informació al segle XXI i hi contribueix.
Htc u11 preu, especificacions, data de llançament, preu a l'Índia, EUA
Htc u11 preu, especificacions, data de llançament, preu a l'Índia, EUA
HTC U11 HTC mobile Preu a l'Índia, EUA. Especificacions mòbils de HTC U11, data de llançament, característiques, informació de la bateria, colors, interfície d'interfície d'usuari de HTC, sensors, imatges
Els ovnis emergeixen, de nou
Els ovnis emergeixen, de nou
Més enllà de les fantàstiques teories de la conspiració i de la discussió, pot haver-hi un problema en intentar resoldre el trencaclosques d’objectes voladors no identificats.
Alumne universitari Tze Chun '02 Showrunner per a 'Gremlins: Secrets of the Mogwai
Alumne universitari Tze Chun '02 Showrunner per a 'Gremlins: Secrets of the Mogwai'
Warner Bros. Animation recupera la clàssica pel·lícula de 1984 Gremlins en un nou programa d'animació.