Küsimus:
Selgitage mitmekordse regressiooni ja mitmemõõtmelise regressiooni erinevust, kasutades sümboleid / matemaatikat minimaalselt
Neil McGuigan
2010-09-03 23:54:17 UTC
view on stackexchange narkive permalink

Kas mitme- ja mitmemõõtmeline regressioon on tõesti erinev? Mis on variatsioon üldse?

Viis vastused:
#1
+57
chl
2010-09-04 00:03:08 UTC
view on stackexchange narkive permalink

Ma ütleksin väga kiiresti: „mitu” kehtib ennustajate arvu kohta, kes sisenevad mudelisse (või samaväärselt kujundusmaatriksisse) ühe tulemusega (Y vastus), samas kui „mitmemuutuja” viitab vastusevektorite maatriksile . Ei mäleta autorit, kes selle kaalutlusega mitmemõõtmelise modelleerimise sissejuhatavat osa alustab, kuid arvan, et see on Brian Everitt tema õpikus An R and S-Plus Companion to Mitmemuutujaanalüüs. Selle kohta põhjalikuks aruteluks soovitaksin vaadata tema viimast raamatut Multivariable Modeling and Multivariate Analysis for the Behavioral Sciences.

'Variate' puhul ütleksin seda on levinud viis viidata mis tahes juhuslikule muutujale, mis järgib tuntud või oletatud jaotust, nt räägime gaussi variatsioonidest $ X_i $ kui normaaljaotusest saadud vaatluste jada (parameetritega $ \ mu $ ja $ \ sigma ^ 2 $). Tõenäosuslikus mõttes ütlesime, et need on mõned X juhuslikud teostused matemaatilise ootusega $ \ mu $ ja eeldatavasti umbes 95% neist jääb vahemikku $ [\ mu-2 \ sigma; \ mu + 2 \ sigma] $.

Isegi https://www.coursera.org/learn/machine-learning/home/week/2 kasutab mitmekordse regressiooni asemel mõistet mitmemõõtmeline regressioon ...
Ma arvan, et sama segadus tekib inimestega, kes kasutavad terminit GLM üldise lineaarse mudeli jaoks (nt neurokujutiste uuringutes) vs üldistatud lineaarset mudelit.Olen näinud palju "mitmemõõtmelise logistilise taandarengu" juhtumeid, kus on ainult üks tulemus, ja ma arvan, et see pole nii oluline, kui autor on selle mõiste selgelt määratlenud.
#2
+47
user28
2010-09-04 00:27:21 UTC
view on stackexchange narkive permalink

Siin on kaks tihedalt seotud näidet, mis illustreerivad ideid. Näited on mõnevõrra USA-kesksed, kuid ideid saab ekstrapoleerida teistele riikidele.

Näide 1

Oletame, et ülikool soovib oma vastuvõtukriteeriume täpsustada, nii et et nad lubavad "paremaid" õpilasi. Oletame ka, et üliõpilase hindepunktide keskmine (GPA) on see, mida ülikool soovib kasutada õpilaste tulemuslikkuse mõõdikuna. Neil on mitu kriteeriumit silmas pidades, näiteks keskkooli GPA (HSGPA), SAT skoor (SAT), sugu jne, ja nad sooviksid teada, milline neist kriteeriumidest on GPA osas oluline.

Lahendus: Mitu regressiooni

Ülaltoodud kontekstis on üks sõltuv muutuja (GPA) ja teil on mitu sõltumatut muutujat (HSGPA, SAT, Gender jne). Soovite teada saada, millised sõltumatutest muutujatest on teie sõltuva muutuja jaoks head ennustajad. Selle hinnangu andmiseks kasutaksite mitut regressiooni.

Näide 2

Ülaltoodud olukorra asemel oletame, et vastuvõtukontor soovib jälgida õpilaste tulemusi kogu aja vältel. ja soovib välja selgitada, milline neist kriteeriumidest mõjutab õpilaste tulemusi kogu aeg. Teisisõnu, neil on õpilase koolis viibimise nelja aasta jooksul GPA-skoorid (näiteks GPA1, GPA2, GPA3, GPA4) ja nad tahavad teada, milline iseseisvatest muutujatest prognoosib GPA-skoori aasta-aastalt paremini aasta baasil. Vastuvõtubüroo loodab leida, et samad sõltumatud muutujad ennustavad tulemuslikkust kõigi nelja aasta jooksul, nii et nende vastuvõtukriteeriumide valik tagab, et üliõpilaste tulemused on kõigi nelja aasta jooksul pidevalt kõrged.

Lahendus: Mitmemõõtmeline regressioon

Näites 2 on meil mitu sõltuvat muutujat (st GPA1, GPA2, GPA3, GPA4) ja mitu sõltumatut muutujat. Sellises olukorras kasutaksite mitmemõõtmelist regressiooni.

Alati on üks, mis vastab küsimusele õigesti näidetega :)
100% parim vastus, mida saate tegelikult mõista
#3
+26
stackoverflowuser2010
2016-07-18 08:29:33 UTC
view on stackexchange narkive permalink

Lihtne regressioon puudutab ühte sõltuvat muutujat ($ y $) ja ühte sõltumatut muutujat ($ x $): $ y = f (x) $

Mitu regressiooni (teise nimega mitmemuutuja regressioon) puudutab ühte sõltuvat muutujat ja mitut sõltumatut muutujat: $ y = f (x_1, x_2, ..., x_n) $

Mitmemõõtmeline regressioon hõlmab mitut sõltuvat muutujat ja mitut tugevad> sõltumatud muutujad: $ y_1, y_2, ..., y_m = f (x_1, x_2, ..., x_n) $. Teil võib tekkida probleeme, kus nii sõltuvad kui ka sõltumatud muutujad on paigutatud muutujate maatriksiteks (nt $ y_ {11}, y_ {12}, ... $ ja $ x_ {11}, x_ {12}, ... $ ), seega võib avaldise kirjutada kujul $ Y = f (X) $, kus suurtähed tähistavad maatriksit.

Lisalugemine:

Mõistan määratlust.Kuid milline on mitme variatsiooni taandarengu käsitlemine ühemuutujate taandarengute süsteemina?
@LKS: Võite seda küsida täiesti eraldi küsimuses.
https://stats.stackexchange.com/questions/254254/why-do-we-need-multivariate-regression-as-opposed-to-a-bunch-of-univariate-regr
Kas Quora vastus viitas sellele lehele?: P
#4
+4
thecity2
2017-03-04 03:44:58 UTC
view on stackexchange narkive permalink

Ma arvan, et peamine võrrand (ja diferentsiaator) siin, välja arvatud võrrandi mõlemal küljel olevate muutujate arv, on see, et mitmemõõtmelise regressiooni korral on eesmärk kasutada seda, et vastuse vahel on (üldiselt) korrelatsioonmuutujad (või tulemused).Näiteks meditsiinilises uuringus võivad ennustajad olla kehakaal, vanus ja rass ning tulemuse muutujad on vererõhk ja kolesterool.Teoreetiliselt võiksime luua kaks "mitmekordse regressiooni" mudelit, millest üks regresseerib vererõhku kehakaalule, vanusele ja rassile ning teine regenereerib kolesterooli samadele teguritele.Kuid alternatiivina võiksime luua ühe mitmemõõtmelise regressioonimudeli, mis prognoosib nii vererõhku kui ka kolesterooli samaaegselt kolme ennustava muutuja põhjal.Idee on see, et mitmemõõtmeline regressioonimudel võib olla parem (prognoositavam) sedavõrd, et see võib patsientide vererõhu ja kolesterooli korrelatsioonist rohkem teada saada.

Suurepärane punkt.Mõtlesin, kas mitmemõõtmelist regressiooni saab teha ka R. abil. Manova abil olen võimeline tegema mitmemõõtmelist ANOVA-d, kuid pole võimeline saama koefitsiente nagu ühemuutujaline regressioon.
#5
+1
Bhabesh Mahanta
2019-03-04 19:56:59 UTC
view on stackexchange narkive permalink

Mitmemõõtmelises regressioonis on rohkem kui üks erineva variansiga (või jaotusega) sõltuv muutuja.Ennustaja muutujad võivad olla rohkem kui üks või mitu.Seega võib see olla mitmekordne regressioon sõltuvate muutujate maatriksiga, s.t.e.mitu variatsiooni. Kuid kui me ütleme mitmekordset regressiooni, peame silmas ainult ühte sõltuvat muutujat, millel on üks jaotus või dispersioon.Ennustavaid muutujaid on rohkem kui üks. Mitme kokkuvõtte tegemine viitab mitmele ennustajale, kuid mitmemõõtmeline viitab mitmele sõltuvale muutujale.



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 2.0-litsentsi eest, mille all seda levitatakse.
Loading...