Küsimus:
Kuidas kontrollida hüpoteesi rühmade erinevuste puudumise kohta?
Jeromy Anglim
2010-09-24 10:24:00 UTC
view on stackexchange narkive permalink

Kujutage ette, et teil on kahe rühmaga (nt isased ja naised) tehtud uuring, kus vaadeldakse numbrilist sõltuvat muutujat (nt intelligentsustestide tulemused) ja teil on hüpotees, et grupierinevusi pole.

Küsimus :

  • Mis on hea viis testida, kas grupierinevusi pole?
  • Kuidas määraksite valimi suuruse, mida on vaja piisavaks testida, kas grupierinevusi pole?

Esialgsed mõtted:

  • tavalise t-testi tegemisest ei piisa, sest nullhüpoteesi tagasilükkamine ei tähenda, et huvipakkuv parameeter oleks nulliga võrdne või lähedal; seda eriti väikeste proovide puhul.
  • Ma võiksin vaadata 95% usaldusintervalli ja kontrollida, kas kõik väärtused jäävad piisavalt väikesesse vahemikku; võib-olla pluss või miinus 0,3 standardhälvet.
mida sa mõtled selle all, et "see eeldab nullhüpoteesi tõeks olemist"?
Kui soovite, et saaksite kontrollida tõenäosust deklareerida valesti "on erinevus", peate need kaks hüpoteesi lahutama (kas ma juba mainisin, et mulle meeldib see tsitaat: http://stats.stackexchange.com/questions/726/ kuulus-statistik-tsitaadid / 728 # 728;))
@Robin nullhüpoteesi olulisuse testi p väärtus on tõenäosus näha äärmuslikke andmeid või rohkem kui need, mida täheldati eeldades, et nullhüpotees vastab tõele; aga võib-olla saaksin ülaltoodud väite paremini sõnastada.
@Robin Muutsin küsimust, et proovida oma mõtet selgemaks teha
Kaheksa vastused:
#1
+20
Thylacoleo
2010-09-24 10:50:39 UTC
view on stackexchange narkive permalink

Ma arvan, et te küsite samaväärsuse testimise kohta. Põhimõtteliselt peate otsustama, kui suur erinevus on teie jaoks vastuvõetav, et ikkagi järeldada, et need kaks rühma on tegelikult samaväärsed. Selles otsuses määratletakse 95% (või muu) usaldusintervalli piirid ja selle põhjal tehakse valimi suuruse arvutused.

Teemal on terve raamat.

Väga tavaline ekvivalentsustestide kliiniline "ekvivalent" on mitte alaväärsustest prooviversioon. Sel juhul eelistate ühte rühma teisele (väljakujunenud ravi) ja kujundate oma testi näitamaks, et uus ravi ei ole mingil statistiliste tõendite tasemel madalam kehtestatud ravist.

Ma arvan Pean krediteerima Harvey Motulsky saidi GraphPad.com eest (jaotises "Raamatukogu").

#2
+16
Henrik
2010-09-24 16:39:12 UTC
view on stackexchange narkive permalink

Lisaks juba mainitud võimalusele mingisuguse samaväärsuse testi jaoks, millest enamik minu teada on enamasti korraldatud vanas heas sagedasest traditsioonis, on võimalus testide läbiviimine, mis annab tõendite kvantifitseerimise null-hüpoteeside kasuks, nimelt bayesi testid .

Bayesi t-testi rakenduse leiate siit: Wetzels, R., Raaijmakers, JGW, Jakab, E., & Wagenmakers, E.-J. (2009). Kuidas nullhüpoteesi ja selle vastast tuge kvantifitseerida: Bayesi vaik t-testi paindlik WinBUGS-i juurutamine. Psychonomic Bulletin & Review, 16, 752-760.

On ka õpetus, kuidas seda kõike R-s teha:

http://www.ruudwetzels.com/index.php?src=SDtest


Alternatiivse (võib-olla kaasaegsema lähenemisviisi) Bayesi t-testile pakub (koos koodiga) Kruschke käesolev artikkel:

Kruschke, JK (2013). Bayesi hinnang asendab t-testi. Eksperimentaalse psühholoogia ajakiri: üldine , 142 (2), 573–603. doi: 10.1037 / a0029146


Kõik selle vastuse rekvisiidid (enne Kruschke lisamist) peaksid minema minu kolleeg David Kellenile. Ma varastasin tema vastuse sellelt küsimuselt.

Võib-olla tasub seda vastust värskendada, et lisada viide R-i vinge BayesFactori paketile.
#3
+13
Jeromy Anglim
2010-09-24 13:25:03 UTC
view on stackexchange narkive permalink

Pärast Thylacoleo vastust uurisin veidi.

R pakendis samaväärsus on funktsioon tost () .

Lisateavet leiate Robinson ja Frose (2004) " Mudeli valideerimine ekvivalentsustestide abil".

#4
+8
Henrik
2010-09-24 16:50:33 UTC
view on stackexchange narkive permalink

Minu teada on mõned üksikud dokumendid:

Tryon, W. W. (2001). Statistilise erinevuse, samaväärsuse ja määramatuse hindamine tuletatud usaldusvahemike abil: integreeritud alternatiivne meetod nullhüpoteeside statistiliste testide läbiviimiseks. Psychological Methods, 6, 371-386. ( TASUTA PDF)

Ja parandus:
Tryon, W. W., & Lewis, C. (2008). Statistilise samaväärsuse kindlakstegemise järeldav usaldusvahemiku meetod, mis parandab Tryoni (2001) reduktsioonifaktorit. Psychological Methods, 13, 272–278. ( TASUTA PDF-fail)

Lisaks:

Seaman, M. A. & Serlin, R. C. (1998). E kvivalentsuse usaldusvahemikud kahe rühma vahendite võrdlemiseks. Psychological Methods, Vol 3 (4), 403–411.

#5
+7
Stéphane Laurent
2013-06-05 23:08:13 UTC
view on stackexchange narkive permalink

Olen hiljuti mõelnud alternatiivsele viisile "samaväärsuse testimiseks", mis põhineb kahe jaotuse ja mitte nende keskmiste vahelisel kaugusel.

On olemas mõned meetodid, mis tagavad kahe Gaussi jaotuse kattumise usaldusvahemikud: enter image description here

Kattuvus $ O (P_1, P_2) $ kahest jaotusest (? Vahel) $ P_1 $ ja $ P_2 $ on kena tõenäosuslik tõlgendus: $$ 1-O (P_1, P_2) = TV (P_1, P_2) $$ kus $ TV (P_1, P_2) = \ sup_A \ big | P_1 (A) - P_2 (A) \ big | $ on variatsioonide kogu kaugus vahemikus $ P_1 $ ja $ P_2 $.

See tähendab, et kui näiteks $ O (P_1, P_2) >0.9 $, siis mis tahes sündmuse $ P_1 $ ja $ P_2 $ antud tõenäosused ei erine rohkem kui $ 0.1 $ . Jämedalt öeldes annavad need kaks jaotust samad prognoosid kuni $ 10 \% $.

Seega selle asemel, et kasutada keskmiste $ \ mu_1 $ ja $ \ erinevuse kriitilisel väärtusel põhinevat aktsepteerimiskriteeriumit mu_2 $, nagu ka klassikalises ekvivalentsustestimises, võiksime selle rajada kriitilisele väärtusele, mis on vajalik kahe jaotuse antud ennustuste tõenäosuste erinevuse vahel.

Ma arvan, et kriteeriumi "objektiivsuse" osas on eelis. Kriitilise väärtuse $ | \ mu_1 - \ mu_2 | $ peaks andma tegeliku probleemi ekspert: see peaks olema väärtus, mille ületamisel on erinevusel praktiline tähtsus. Kuid mõnikord pole kellelgi kindlaid teadmisi tegeliku probleemi kohta ja pole eksperti, kes suudaks pakkuda kriitilist väärtust. Tavapärase kriitilise väärtuse $ TV (P_1, P_2) $ omistamine võib olla viis kriteeriumini, mis ei sõltu vaadeldavast füüsilisest probleemist.

Gaussi juhtumi puhul, millel on samad erinevused, on kattuvus üks- ühele, mis on seotud standardiseeritud keskmise erinevusega $ \ frac {| \ mu_1- \ mu_2 |} {\ sigma} $.

Kas teil on mingeid ressursse, mis näitavad kattumist, mida mõnes reaalses probleemis _kasutatakse_?See kõlab uskumatult paljulubavalt, kuid mulle pole selge, kuidas seda reaalses probleemis rakendada (kus teie järeldused on potentsiaalselt mitu sammu eemaldatud "see jaotus on üsna sarnane X-iga", muutes seeläbi natuke raskeks, kuidas see10% telerist väljendab järelduste mõju suurust).
@StumpyJoePete Olen oma blogisse kirjutanud midagi samas vaimus: http://stla.github.io/stlapblog/posts/EquivalenceExceedanceProbilities.html
#6
+5
pmgjones
2010-09-24 14:43:09 UTC
view on stackexchange narkive permalink

Meditsiiniteadustes on eelistatav kasutada usaldusintervalli lähenemist, mitte kahte ühepoolset testi (tost). Samuti soovitan asjade väga selgeks joonistamiseks joonistada punktide hinnangud, CI-d ja eelnevalt kindlaksmääratud samaväärsusmarginaalid.

Sellise lähenemisviisiga tõenäoliselt teie küsimus lahendataks.

KONSORT mitte-alaväärsuse / samaväärsuse uuringute juhised on selles osas üsna kasulikud.

Vt Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ ja CONSORT Group. Madalamatust ja samaväärsust randomiseeritud uuringutest teatamine: väite CONSORT laiendus. JAMA. 2006, 8. märts; 295 (10): 1152-60. (Link terviktekstile.)

Ma ei ütleks tingimata, et eelistatakse usaldusvahemikke. Tegelikult vastavad usaldusvahemikud hüpoteesitestidele. TOST-i saab saavutada, vaadates usaldusvahemikke, mis on saadud kahe ühepoolse usaldusvahemiku lõikamisel, mis vastavad kahele protseduuris kasutatavale ühepoolsele t-testile.
#7
+4
Michael R. Chernick
2012-05-06 09:50:57 UTC
view on stackexchange narkive permalink

Jah. See on samaväärsuse testimine. Põhimõtteliselt tühistate null- ja alternatiivhüpoteesi ning võtate valimi suuruse aluseks jõu, et näidata, et keskmiste erinevus jääb samaväärsuse aknasse. Blackwelder nimetas seda "nullhüpoteesi tõestamiseks". Seda tehakse tavaliselt farmatseutilistes kliinilistes uuringutes, kus testitakse geneeriliste ravimite samaväärsust turustatud ravimitega või võrreldakse heakskiidetud ravimeid uue ravimvormiga (sageli nimetatakse bioekvivalentsuseks). Ühekülgset versiooni nimetatakse mitte-alaväärsuseks. Mõnikord võib ravimi heaks kiita, näidates lihtsalt, et uus ravim ei ole madalam turustatud konkurendist. Shao ja Pigeot on välja töötanud järjepideva lähenemisviisi bioekvivalentsusele, kasutades crossover-kujundusi.

#8
  0
babelproofreader
2010-10-02 04:13:10 UTC
view on stackexchange narkive permalink

Bootstrapi erinevused (nt keskmiste vahe) kahe valimisrühma vahel ja kontrollige statistilist olulisust. Selle lähenemise üksikasjalikuma kirjelduse, ehkki teises kontekstis, leiate siit http://www.automated-trading-system.com/a-different-application-of-the-bootstrap/

Te segate ekslikkust, kui nõustute nullhüpoteesiga, et erinevust pole *, ja leiate * tõendid, et kaks suurust on samaväärsed *.


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 2.0-litsentsi eest, mille all seda levitatakse.
Loading...