Küsimus:
Millistel tingimustel peaks kasutama mitmetasandilist / hierarhilist analüüsi?
Patrick
2010-08-22 05:22:34 UTC
view on stackexchange narkive permalink

Millistel tingimustel peaks keegi kaaluma mitmetasandilise / hierarhilise analüüsi kasutamist erinevalt põhilisematest / traditsioonilisematest analüüsidest (nt ANOVA, OLS regressioon jne)? Kas on olukordi, kus seda võiks pidada kohustuslikuks? Kas on olukordi, kus mitmetasandilise / hierarhilise analüüsi kasutamine on kohatu? Lõpuks, millised on head vahendid algajatele mitmetasandilise / hierarhilise analüüsi õppimiseks?

Vaata ka: http://stats.stackexchange.com/a/38430/5739
Kaheksa vastused:
#1
+23
ars
2010-08-22 05:40:31 UTC
view on stackexchange narkive permalink

Kui teie andmete struktuur on loomulikult hierarhiline või pesastatud, on mitmetasandiline modelleerimine hea kandidaat. Üldisemalt on see üks meetod interaktsioonide modelleerimiseks.

Loomulik näide on see, kui teie andmed pärinevad organiseeritud struktuurist, näiteks riigist, osariigist, linnaosadest, kus soovite uurida nende tasemete mõju. Teine näide, kus saate sellist struktuuri sobitada, on pikisuunaline analüüs, kus teil on aja jooksul korratud paljude katsealuste mõõtmisi (nt teatav bioloogiline reaktsioon ravimi annusele). Teie mudeli ühel tasemel eeldatakse aja jooksul kõigi katsealuste rühma keskmist vastust. Teie mudeli teine ​​tase võimaldab individuaalsete erinevuste modelleerimiseks rühmakeskmisest häiringuid (juhuslikke efekte).

Alustuseks on populaarne ja hea raamat Gelmani regressiooni ja mitmetasandiliste / hierarhiliste mudelite abil kasutatav andmeanalüüs .

Sekundeerin selle vastuse ja tahaksin lihtsalt lisada selle teema kohta veel ühe suurepärase viite: Singeri rakendatud pikisuunaliste andmete analüüsi tekst . Kuigi see on spetsiifiline pikisuunalise analüüsi jaoks, annab see kena ülevaate MLMist üldiselt. Samuti leidsin, et Snidjers ja Boskeri mitmetasandiline analüüs on head ja loetavad . John Fox pakub neile mudelitele R-s ka kena sissejuhatuse .
Tänan kõiki vastuste eest :) Kas jätkuküsimusena ei saaks enamikku andmeid kontseptualiseerida kui loomulikult hierarhilisi / pesastatud? Näiteks on enamikus psühholoogilistes uuringutes üksikute sees pesitsetud mitmeid sõltuvaid muutujaid (küsimustikud, stiimulite vastused jne), mis pesitsevad edasi kahes või enamas rühmas (juhuslikult või juhuslikult määratud). Kas nõustute, et see esindab loomulikult hierarhilist ja / või sisestatud andmestruktuuri?
Kui keegi teist võiks mitmetasandilistest / hierarhilistest gurudest mõne minuti varuda, oleksin väga tänulik, kui saaksite kaaluda mõnes teises postituses esitatud küsimusi (http://stats.stackexchange.com/questions/1799/recommendations-or -parimate tavade analüüsimiseks-mitte-sõltumatute-andmete-spetsiifika). Täpsemalt, kas arvate, et selles postituses kirjeldatud valu tajumise andmeid analüüsiksid paremini hierarhilised analüüsid kui mittehierarhilised analüüsid? Või kas sellel poleks vahet või oleks see isegi kohatu? Aitäh: D
#2
+18
Andy W
2010-08-22 07:48:21 UTC
view on stackexchange narkive permalink

Mitmetasandilise modelleerimise keskusel on häid tasuta veebipõhiseid õpetusi mitmetasandiliseks modelleerimiseks ning neil on tarkvaraõpetused mudelite sobitamiseks nii nende MLwiN tarkvaras kui ka STATA-s.

Võtke seda ketserlusena, sest ma pole raamatust lugenud rohkem kui ühte peatükki, kuid hierarhilised lineaarsed mudelid: rakendused ja andmeanalüüsi meetodid Stephen W. Raudenbushi sõnul on väga soovitatav Anthony S. Bryk. Samuti vandusin, et Springer Use R! -Is on raamat mitmetasandilise modelleerimise kohta, kasutades tarkvara R! seeria, kuid tundub, et ma ei leia seda praegu (arvasin, et selle kirjutasid samad inimesed, kes kirjutasid raamatu A Beginner’s Guide to R).

redigeeri: R-i kasutamise mitmetasandiliste mudelite jaoks on Mixed Effect Models and Extensions in Ecology with R by Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM

õnne

#3
+9
Galit Shmueli
2010-12-13 11:08:36 UTC
view on stackexchange narkive permalink

Siin on veel üks perspektiiv mitmetasandiliste vs regressioonimudelite kasutamiseks: Afshartous ja de Leeuw huvitavas artiklis näitavad nad, et kui modelleerimise eesmärk on ennustav (st uute tähelepanekute ennustamine), on mudeli valik erineb sellest, kui eesmärk on järeldus (kus proovite mudelit sobitada andmestruktuuriga). Refereeritud artikkel on

Afshartous, D., de Leeuw, J. (2005). Ennustamine mitmetasandilistes mudelites. J. Educat. Käituma. Statist. 30 (2): 109–139.

Leidsin just nende autorite teise seotud dokumendi siit: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf

#4
+6
Cyrus S
2010-12-14 01:08:54 UTC
view on stackexchange narkive permalink

Siin on näide, kus mitmetasandiline mudel võib olla "oluline". Oletame, et soovite hinnata koolide komplekti pakutava hariduse "kvaliteeti", kasutades õpilaste testitulemusi. Üks võimalus kooli kvaliteedi määratlemiseks on testi keskmine tulemuslikkus pärast õpilaste omadustega arvestamist. Selle võiksite kontseptualiseerida järgmiselt: $$ y_ {is} = \ alpha_s + X_ {is} '\ beta_s + \ epsilon_ {is}, $$ kus $ y_ {is} $ on õpilase $ i $ pidev testiskoor kool $ s $, $ X_ {is} $ on koolis keskendatud õpilaste atribuudid, $ \ beta_s $ on nende omaduste jaoks koolipõhine koefitsient, $ \ alpha_s $ on "kooli efekt", mis mõõdab kooli kvaliteeti, ja $ \ epsilon_ {is} $ on õpilase tasemel eripärad testimise soorituses. Huvi keskendub siin $ \ alpha_s $ hindamisele, mis mõõdavad "lisaväärtust", mida kool õpilastele pakub, kui nende atribuudid on arvestatud. Tahate arvestada õpilaste omadustega, sest te ei soovi karistada head kooli, mis peab tegelema teatud puudustega õpilastega, seetõttu põlgasid masendavad keskmised testitulemused kõrget "lisaväärtust", mida kool oma õpilastele pakub.

Kui mudel on käes, saab küsimus hinnanguks. Kui teil on palju koole ja palju andmeid iga kooli kohta, soovitavad OLS-i head omadused (praeguse ülevaate saamiseks vaadake Angrist ja Pischke, Enamasti kahjutu ... ), mida soovite kasutada et koos tavaliste vigade sobivate kohandustega sõltuvuste arvestamiseks ning näivmuutujate ja vastastikmõjude kasutamisega koolitasandi efektide ja konkreetsete pealtkuulamiste saamiseks. OLS võib olla ebaefektiivne, kuid see on nii läbipaistev, et selle kasutamisel võib skeptiliste publikute veenmine olla lihtsam. Kuid kui teie andmeid on teatud viisil vähe - eriti kui teil on mõne kooli jaoks vähe tähelepanekuid - võite probleemile rohkem "struktuuri" peale suruda. Võiksite laenata jõudu suuremate valimite koolidest, et parandada mürarikkaid hinnanguid, mida saaksite väikeses valimis koolides, kui hindamine toimuks ilma struktuurita. Seejärel võite pöörduda juhuslike efektide mudeli poole, mis on hinnatud FGLS-i kaudu, või võib-olla lähendada tõenäosust otsese tõenäosusega, kui antud on teatud parameetriline mudel, või isegi Bayesi parameetrilise mudeli korral.

Selles näites on mitmetasandiline mudel (olenemata sellest, kas me lõpuks otsustame selle sobitada) on motiveeritud otsesest huvist koolitaseme pealtkuulamise vastu. Muidugi ei pruugi need rühmataseme parameetrid muudes olukordades olla muud kui häirivad. See, kas peate nende jaoks kohanduma (ja seetõttu ikkagi mingisuguse mitmetasandilise mudeliga töötama), sõltub sellest, kas teatud tingimusliku eksogeensuse eeldused kehtivad. Selle kohta soovitaksin uurida paneeliandmete meetodite ökonomeetrilist kirjandust; enamik sealseid teadmisi kandub üle üldisesse rühmitatud andmekonteksti.

See on vana teema, kuid juhul, kui loete seda: näivmuutujate ja interaktsioonidega OLS ei laena jõudu nagu teised mainitud tehnikad, eks? Mul on mõned andmed, kus olen oma analüüsi kaheks osaks ja kahe osa modelleerimiseks kasutanud kahte lm (R lineaarne mudel) käsklust. Tutvustasin kahe osa tähistamiseks näiv muutujat, seejärel kasutasin selle "ühtse" mudeli puhul uuesti lm-d ja vastused on lähedased, kuid mitte ühesugused. Minu küsimus oleks järgmine: kas see vastus on "parem" või on algoritmi tõttu lihtsalt erinev?
@Wayne:, kui kasutasite teises mannekeene ja kogu koostoime komplekti, peaksid punktihinnangud olema samad. Standardvead võivad erineda, kuna teine ​​meetod võib eeldada kõrgemaid vabadusastmeid, kuid soovite kontrollida, kas see on õige modelleerimise eeldus.
#5
+6
probabilityislogic
2011-05-22 09:40:26 UTC
view on stackexchange narkive permalink

Mitmetasandiline modelleerimine on sobiv, nagu nimigi ütleb, kui teie andmetel on mõjutusi erinevatel tasanditel (üksikisik, aja jooksul, üle domeenide jne). Ühetasandiline modelleerimine eeldab, et kõik toimub kõige madalamal tasemel. Teine asi, mida mitmetasandiline mudel teeb, on seoste sisseviimine pesastatud üksuste vahel. Nii et 1. taseme üksused sama 2. taseme üksustes on omavahel seotud.

Mõnes mõttes võite mitmetasandilisest modelleerimisest mõelda kui kesktee leidmisest "individualistliku eksituse" ja "ökoloogilise eksituse" vahel. ". Individualistlik eksitus on see, kui ignoreeritakse "kogukondlikke efekte", näiteks õpetaja stiili kokkusobivust õpilase õppimisstiiliga (eeldatakse, et efekt tuleneb ainult üksikisikust, nii et tehke regressioon lihtsalt 1. tasemel). arvestades, et "ökoloogiline eksitus" on vastupidine ja see oleks sama, kui oletada, et parim õpetaja on õpilastel, kellel on parimad hinned (ja et 1. taset poleks vaja, tehke lihtsalt regressioon täielikult 2. tasemel). Enamikus seadetes pole kumbki sobiv (õpilane-õpetaja on "klassikaline" näide).

Pange tähele, et kooli näites oli andmetes "loomulik" klastrite vorm või struktuur. Kuid see pole mitmetasandilise / hierarhilise modelleerimise oluline tunnus. Loomulik klastrite tegemine muudab matemaatika ja arvutused siiski lihtsamaks. Peamine koostisosa on eelnev teave, mis ütleb, et protsessid toimuvad erinevatel tasanditel. Tegelikult saate klastrialgoritme välja mõelda, kehtestades oma andmetele mitmetasandilise struktuuri ebakindlusega, milline üksus millises kõrgemas tasemes on. Nii et teil on $ y_ {ij} $ ja alaindeks $ j $ on tundmatu.

#6
+4
user28
2010-08-22 06:04:55 UTC
view on stackexchange narkive permalink

Üldiselt toob hierarhilise Bayesian (HB) analüüsi rääkimine tõhusate ja stabiilsete individuaalsete hinnangute andmise, välja arvatud juhul, kui teie andmed on sellised, et individuaalse taseme efektid oleksid täiesti homogeensed (ebareaalne stsenaarium). HB-mudelite efektiivsus ja stabiilsed parameetrite hinnangud muutuvad tõeliselt oluliseks siis, kui teil on vähe andmeid (nt üksikute tasemel on väiksem arv parameetreid kui parameetrite arv) ja kui soovite hinnata individuaalse taseme hinnanguid.

HB mudeleid pole aga alati lihtne hinnata. Seega, kuigi HB analüüs trumbib tavaliselt mitte-HB analüüsi, peate kaaluma suhtelisi kulusid vs tulusid, lähtudes oma varasematest kogemustest ja teie praegustest prioriteetidest aja ja kulude osas.

Olles öelnud, et kui te pole kui olete huvitatud individuaalsete taseme hinnangutest, saate lihtsalt hinnata koondtaseme mudelit, kuid isegi nendes kontekstides võib agregatsioonimudelite hindamine HB kaudu individuaalse taseme hinnangute abil olla väga mõttekas.

Seejärel saate oma HB mudeli toimivuse hindamiseks kasutada koondmudeleid.
Tänan teid üksikasjaliku vastuse eest Srikant :) Ma ei ole praegu Bayesi analüüsidega tuttav, kuid ma olen üks teemadest, mida olen uurimiseks mõelnud. Kas hierarhiline Bayesi analüüs erineb teistest sellel lehel käsitletud mitmetasandilistest / hierarhilistest analüüsidest? Kui jah, siis kas teil on huvitatud isikutele soovitatav lisateave?
Analüütilisest vaatenurgast HB analüüs = mitmetasandilised mudelid. Mõistet mitmetasandilised mudelid kasutatakse aga siis, kui teil on loomulikul tasandil erinevad tasemed (vt @ars näidet). Mõistet HB mudelid kasutatakse siis, kui teil pole olukorras tingimata erinevaid tasemeid. Näiteks kui modelleerite tarbija vastust erinevatele turundusteguritele (nt hind, eelarvekulud jne), võib teil olla tarbija tasandil järgmine struktuur: $ β_i \ sim N (\ bar {\ beta}, \ Sigma ) $ ja $ \ bar {\ beta} \ sim N (.,.) $ populatsiooni tasandil. Viited: vaadake teisi vastuseid.
#7
+4
Chris Beeley
2010-12-13 13:47:49 UTC
view on stackexchange narkive permalink

Snijdersilt ja Boskerilt õppisin, Mitmetasandiline analüüs: sissejuhatus põhi- ja edasijõudnud mitmetasandiliseks modelleerimiseks. Ma arvan, et see on algajale väga hea, see peab olema, sest ma olen nende asjadega paksuke ja see oli minu jaoks mõistlik.

Sekundeerin ka Gelmani ja Hilli, tõeliselt geniaalne raamat.

#8
+1
StatisticsDoc Consulting
2012-11-20 11:01:29 UTC
view on stackexchange narkive permalink

Kui andmed on sisestatud hierarhilises struktuuris, tuleks kasutada mitmetasandilisi mudeleid, eriti kui sõltuva muutuja kõrgema taseme üksuste vahel on olulisi erinevusi (nt õpilaste saavutuste orientatsioon varieerub õpilaste ja ka õpilastega klasside vahel) mille õpilased pesitsevad). Sellistes oludes on vaatlused pigem rühmitatud kui sõltumatud. Klastrite arvestamata jätmine viib parameetrite hinnangute vigade alahindamiseni, kallutatud olulisuse testimise ja kaldumiseni nullist keelduma, kui see peaks alles jääma. Põhjenduse mitmetasandiliste mudelite kasutamiseks, samuti põhjalike selgituste kohta, kuidas analüüse läbi viia, annab

Raudenbush, S. W. Bryk, A. S. (2002). Hierarhilised lineaarsed mudelid: rakendused ja andmete analüüsimeetodid. 2. väljaanne. Newbury Park, CA: Sage.

R & B raamat on hästi integreeritud ka autorite HLM-i tarkvarapaketiga, mis aitab paketi õppimisel palju kaasa. Selgitus selle kohta, miks mitmetasandilised mudelid on vajalikud ja eelistatumad mõnele alternatiivile (näiteks kõrgema taseme üksuste kodeerimine), on toodud klassikalises artiklis

Hoffman, D.A. (1997). Ülevaade hierarhiliste lineaarsete mudelite loogikast ja põhjendustest. Journal of Management, 23, 723-744.

Hoffmani paberit saab tasuta alla laadida, kui kasutate Google'i lehte "Hoffman 1997 HLM" ja pääsete pdf-failile juurde veebis.



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 2.0-litsentsi eest, mille all seda levitatakse.
Loading...