Küsimus:
Kui kahe rühma t-test ja ANOVA on samaväärsed, siis miks pole nende eeldused samaväärsed?
Chris Beeley
2010-08-13 14:41:13 UTC
view on stackexchange narkive permalink

Olen kindel, et mul on see pea ümber täielikult mähitud, kuid ma lihtsalt ei saa sellest aru.

T-test võrdleb kahte normaalset jaotust, kasutades Z-jaotust. Sellepärast on DATA-s eeldatud normaalsust.

ANOVA on samaväärne lineaarse regressiooniga mannekeenide muutujatega ja kasutab ruutude summasid, täpselt nagu OLS. Sellepärast eeldatakse JÄÄKIDE normaalsust.

Mul on kulunud mitu aastat, kuid ma arvan, et olen neist põhifaktidest lõpuks aru saanud. Miks on t-test samaväärne ANOVA-ga kahe rühmaga? Kuidas saavad need olla samaväärsed, kui nad isegi ei eelda andmete kohta samu asju?

Üks punkt: t-testides kasutatakse t jaotust, mitte Z jaotust
Kuigi küsimus pole õige, on see väga kasulik.Samuti arvan, et kusagil "kahe sabaga t-testi" mainimine muudab küsimused / vastused terviklikumaks.
Viis vastused:
#1
+32
Rob Hyndman
2010-08-13 14:52:45 UTC
view on stackexchange narkive permalink

Kahe rühmaga t-test eeldab, et iga rühm jaotub tavaliselt sama dispersiooniga (kuigi alternatiivse hüpoteesi korral võivad keskmised väärtused erineda). See on samaväärne näivmuutujaga regressiooniga, kuna regressioon võimaldab iga rühma keskmist erineda, kuid mitte dispersiooni. Seega on jääkidel (võrdne lahutatud rühma keskmistega saadud andmetega) jaotus sama - see tähendab, et need jaotatakse tavaliselt nullkeskmisega.

Ebavõrdsete variatsioonidega t-test ei ole samaväärne ühesuunaline ANOVA.

Võin otsida tsitaadi, kuid seda on piisavalt lihtne empiiriliselt testida. F kahe ANOVA rühmast koos kahe rühmaga on täpselt võrdne väärtusega t ^ 2 ja p-väärtused on täpselt samad. Ainus põhjus, miks see oleks ebavõrdsete erinevuste korral võrdväärne, on paranduse rakendamine. Muidu on nad samad.
F-test on t-testi üldistamine. t-test on mõeldud kahe ravi võrdlemiseks ja F-test on mitme ravi jaoks. Tuletus on Casella statistilise disaini peatükkides 3 ja 4. Kuid nagu prof Hyndman märgib, pole see ebavõrdsete variatsioonidega enam t-test. See on Fisher Behreni probleem. Me ei kasuta üldjuhul Fisheri lahendust, vaid Welchi testi või Bayesi lähenemist.
Kaheprooviline ebavõrdsete variatsioonidega t-test on tõepoolest võrdne ühesuunalise kahe rühmaga ANOVA-ga.Võib-olla mõtlesite seda, et t-test, kasutades ebavõrdsete dispersioonide korrigeerimist (st Welch), ei ole sama kui ühesuunaline ANOVA, mida ei korrigeerita (kuigi miks need oleksid)?
#2
+21
Brett
2010-08-13 20:24:20 UTC
view on stackexchange narkive permalink

t-test on lihtsalt F-testi erijuhtum, kus võrreldakse ainult kahte rühma. Kummagi tulemus on p-väärtuse osas täpselt sama ning ka F ja t statistika vahel on lihtne seos. F = t ^ 2. Need kaks testi on algebraliselt samaväärsed ja nende eeldused on samad.

Tegelikult laienevad need samaväärsused kogu ANOVA-de, t-testide ja lineaarse regressiooni mudelite klassile. T-test on ANOVA erijuhtum. ANOVA on regressiooni erijuhtum. Kõik need protseduurid kuuluvad üldise lineaarse mudeli alla ja jagavad samu eeldusi.

  1. Vaatluste sõltumatus.
  2. Jääkide normaalsus = normaalsus igas rühmas erijuhul. .
  3. Jääkide dispersioonide võrdus = erijuhtude võrdsed erinevused rühmade vahel.

Võite mõelda, et see on andmetes normaalsus, kuid kontrollite, kas normaalsus igas rühmas - mis on tegelikult sama mis normaalsuse kontrollimine jääkides, kui mudeli ainus ennustaja on rühma näitaja. Samamoodi võrdsete variatsioonidega.

Nagu kõrval, pole R-l ANOVA jaoks eraldi rutiine. Anova funktsioonid R-s on lihtsalt funktsiooni lm () mähised - sama asi, mida kasutatakse lineaarsete regressioonimudelite sobitamiseks - pakitud veidi erinevalt, et pakkuda seda, mida tavaliselt leidub ANOVA kokkuvõttes, mitte regressiooni kokkuvõttes. / p>

Oleks huvitatud teada, kuidas sobitada korduvate mõõtudega ANOVA mudeleid lm abil.
Kategooriliste muutujate kodeerimise, regressiooni ja ANOVA mudelite samaväärsuse ning korduvate mõõtmiste regressiooni kodeerimise küsimusi on kirjeldatud käesolevas artiklis. http://dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/Wendorf2004a.pdf Siin on viide ... Wendorf, C. A. (2004). Mitmekordse regressiooni kodeerimise alused: tavalised vormid ja korduvate kontrastide lisajuhtum. Statistika mõistmine 3, 47–57.
@AndyF Pole "lm ()", kui te ei liigu segamudelitele paketiga "nlme" või "lme4", kuid korduvate mõõtmiste tegemiseks on käepärane viis termini "Viga" asjakohase spetsifikatsiooni abil aov () , vaadake lisateavet Baron & Li juhendamise kohta, §6.9, http://j.mp/c5ME4u
@AndyF `aov ()` on ehitatud funktsiooni `lm () 'peale, kuid sisaldab täiendavat argumenti, mida nimetatakse * erilisteks tingimusteks, näiteks` Viga`.
aov () on lihtsalt lm () mähis. See teeb kulisside taga kontrastkodeeringut ja pakendab tulemuse ANOVA stiilis. Kõike seda modelleerib lm (). Eespool viidatud artiklis öeldakse teile, kuidas seadistada kodeerimine regressioonimudelites, sealhulgas lm (), korduvate kontrastide tegemiseks.
"Tegelikult laienevad need samaväärsused kogu ANOVA-de, t-testide ja lineaarse regressiooni mudelite klassile. T-test on ANOVA erijuhtum. ANOVA on regressiooni erijuhtum. Kõik need protseduurid on lahutatudÜldine lineaarne mudel ja jagavad samu eeldusi. "suurepärane kokkuvõte.siis on ANOVA üldisem juhtum, kui ainult meil on rohkem kui kaks rühma.
#3
+17
Henrik
2010-08-13 17:24:12 UTC
view on stackexchange narkive permalink

Nõustun täielikult Robi vastusega, kuid lubage mul seda teisiti öelda (kasutades vikipeediat):

Eeldused ANOVA:

  • Sõltumatus juhtumitest - see on mudeli oletus, mis lihtsustab statistilist analüüsi.
  • Normaalsus - jääkide jaotused on normaalsed.
  • Dispersioonide võrdsus (või "homogeensus"), nimetatakse homoscedastilisuseks

Eelduste t-test:

  • Mõlemad võrreldavad populatsioonid peaksid järgima normaalset jaotust ...
  • ... kahel võrreldaval populatsioonil peaks olema sama varieeruvus ...
  • Katse läbiviimiseks kasutatud andmete valimid tuleks võtta kahest võrreldavast populatsioonist sõltumatult.

Seega lükkaksin küsimuse ümber, kuna neil on ilmselt samad eeldused (kuigi erinevas järjekorras :-)).

Vaata Robi kommentaari.
@Alexis Ma pole kindel, et saan teie allakäigust aru. Hoolitse täpsustamiseks.
Teine * t * testi eeldus ei vasta tõele. Tudengi algne töö eeldas seda, kuid "ebavõrdsed erinevused" on hilisemas testis piisavalt tavaline eeldus.
#4
+5
dsimcha
2011-02-04 07:30:00 UTC
view on stackexchange narkive permalink

Üks ilmne punkt, millest igaüks on mööda vaadanud: ANOVA abil testite nullväärtust, et keskmine on identne sõltumata teie selgitavate muutujate väärtustest. T-testi abil saate testida ka ühepoolset juhtumit, et keskmine on teie selgitava muutuja ühe väärtuse korral konkreetselt suurem kui teine.

Kui ma ei eksi, pole see erinevus.Kui teete ANOVA kahele rühmale, saate teha "ühepoolse testi" täpselt nagu saate t-testis.Panin "ühepoolse testi" jutumärkidesse, sest tegelikult pole "testis" vahet "ühepoolse testi" ja "kahepoolse testi" vahel.Ainus erinevus on see, kuidas tõlgendate p-väärtuste statistilist olulisust.Nii et ühepoolsed vs kahepoolsed "testid" on täpselt sama "test".Ainult viis tulemuste õigeks tõlgendamiseks on erinev.
#5
-4
syed
2013-01-08 21:26:46 UTC
view on stackexchange narkive permalink

Eelistan kahe rühma võrdlemiseks kasutada t-testi ja põhjustel kasutan ANOVA-d rohkem kui 2 rühma jaoks. Oluline põhjus on võrdsete variatsioonide eeldamine.

Tere tulemast saidile @syed. Kas viitsiksite oma vastust laiendada? Näiteks millistele "põhjustele" viidate? Pange tähele, et * mõlemad * t-test ja ANOVA eeldavad võrdseid erinevusi.
Kas oleksite nõus oma põhjendusi täpsustama?Ma ei saanud seda järgida.


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 2.0-litsentsi eest, mille all seda levitatakse.
Loading...