Küsimus:
Milliseid viiteid tuleks tuua, et toetada 30 kasutamist piisavalt suure valimina?
Lan
2010-09-10 22:07:39 UTC
view on stackexchange narkive permalink

Olen mitu korda lugenud / kuulnud, et valimi suurus vähemalt 30 ühikut loetakse "suureks valimiks" (normaalsuse eeldused keskmistest kehtivad tavaliselt CLT tõttu ...). Seetõttu genereerin oma katsetes tavaliselt 30 ühiku proovid. Kas saaksite palun anda mulle viite, mida tuleks kasutada valimi 30 kasutamisel?

Ilma et viitaksite parameetrite arvule, mida proovite hinnata, või samaväärsele mudelile, millega töötate, tundub teile üsna raske anda selget vastust.
N = 30 aktsepteerimist väikeste ja suurte proovide piirina ei toeta ükski statistiline tehnika hästi.
Neli vastused:
#1
+43
Carlos Accioly
2010-09-11 00:42:17 UTC
view on stackexchange narkive permalink

Tegelikult on "maagiline number" 30 eksitus. Vaadake Jacobi Coheni veetlevat artiklit Asjad, mida olen õppinud (siiani) (Am. Psych. Detsember 1990 45 # 12, lk 1304–1312). See müüt on tema esimene näide selle kohta, kuidas "mõned asjad, mida õpite, pole nii".

[mu] mu doktorikandidaatidest viisid läbi väitekirja, milles oli ainult 20 juhtumit rühma kohta. ... [L] ater avastasin ... et kahe sõltumatu grupi keskmise võrdluse jaoks $ n = 30 $ grupi kohta pühitsetud kahe- saba $. 05 $ tasemel, oli tõenäosus, et keskmise suurusega efekti märgistab oluliseks ... t test oli ainult $. 47 $ . Seega oli umbes mündi klapp, kas saada märkimisväärne tulemus, kuigi tegelikkuses oli efekti suurus tähendusrikas. ... [mu sõber] jõudis ebaoluliste tulemusteni - millega ta lammutas psühhoanalüütilise teooria olulise haru.

Ilus viide - ja asjakohasel kohal. Aitäh.
@whuber Kas mäletate, mis paber see oli?Link on praeguseks katki.Võib-olla on see http://psych.colorado.edu/~willcutt/pdfs/Cohen_1990.pdf "Asjad, mida olen siiani õppinud (siiani)"?Aasta vastab katkise lingi URL-is olevale aastale.
@Amoeba Salvestasin selle raamatu, kui seda lugesin, et saaksin kinnitada, mis teie arvates on mõeldud.Värskendasin seda vastust, et lisada viide koos teie lingiga.
@Carlos Accioly Olen värskendanud seda uue lingiga, kuna eelmine oli katki.
#2
+39
user1108
2010-09-10 22:44:59 UTC
view on stackexchange narkive permalink

Väikeste ja suurte proovide vahelise piiri valimine n = 30 on ainult rusikareegel. Selle väärtuse (ümber) on tsiteeritud palju raamatuid, näiteks Hoggi ja Tanise Tõenäosuste ja statistiliste järelduste (7e) lause on „suurem kui 25 või 30“.

See tähendab, et mulle räägitud lugu oli see, et ainus põhjus, miks 30-d heaks piiriks peeti, oli see, et see pani õpikute tagumises osas asuvad üliõpilaste t tabelid kenasti ühele lehele mahtuma. See ja kriitilised väärtused (üliõpilase t ja normaalse vahel) on igatahes välja lülitatud ainult umbes 0,25-ga, alates df = 30 kuni df = lõpmatuseni. Käsitsi arvutamiseks ei olnud erinevus tegelikult oluline.

Tänapäeval on igasuguste asjade jaoks kriitilisi väärtusi lihtne arvutada 15 kümnendkohani. Pealegi on meil resampling ja permutatsioonimeetodid, mille puhul me ei piirdu isegi parameetriliste populatsioonijaotustega.

Praktikas ei tugine ma kunagi n = 30-le. Andmete joonistamine . Kui soovite, asetage normaaljaotus peale. Hinnake visuaalselt, kas tavaline lähendamine on sobiv (ja küsige, kas lähendamist on tegelikult vaja). Kui uuringute jaoks valimite genereerimine ja lähendamine on kohustuslik, genereerige valimi suurusest piisavalt , et lähend oleks võimalikult lähedal (või arvutuslikult teostatav).

Siin on leht selle kohta, kui hea t = jaotuse normaalne ligikaudne väärtus on n = 30. http://www.johndcook.com/normal_approx_to_t.html
#3
+9
bhm
2010-09-10 23:41:43 UTC
view on stackexchange narkive permalink

IMO, kõik sõltub sellest, milleks soovite oma näidist kasutada. Kaks "rumalat" näidet, et selgitada, mida ma mõtlen: kui peate hindama keskmist, on 30 vaatlust enam kui piisav. Kui peate hindama lineaarset regressiooni 100 ennustajaga, pole 30 vaatlust piisavalt lähedal.

#4
+9
user603
2010-09-11 00:05:05 UTC
view on stackexchange narkive permalink

Enamasti meelevaldne rusikareegel. See väide sõltub mitmest tõeseks tegurist. Näiteks andmete levitamise kohta. Kui andmed pärinevad näiteks Cauchy'st, ei piisa keskmise hindamiseks isegi 30 ^ 30 vaatlust (sel juhul ei piisaks $ lõpmatust vaatlustest) mu} ^ {(n)} $ lähenemiseks). See arv (30) on vale ka siis, kui teie joonistatud väärtused ei ole üksteisest sõltumatud (jällegi võib juhtuda, et lähenemist pole üldse, olenemata valimi suurusest).

Üldisemalt on CLT vajab hoidmiseks peamiselt kahte samba:

  1. et juhuslikud muutujad on sõltumatud: et saate oma vaatlused järjestada ilma informatsiooni kaotamata *.
  2. et rv pärinevad lõpliku teise momendiga jaotusest: see tähendab, et keskmise ja sd klassikalised hindajad kipuvad valimi suuruse kasvades lähenema.

(Mõlemad neist seisunditest võivad mõnevõrra nõrgeneda, kuid erinevused on suures osas teoreetilised)

Teie näide illustreerib usaldusväärse statistika väärtust. * Proovi mediaan * hindab Cauchy jaotuse kaevu asukoha parameetrit. Võib väita, et 30 prooviga t-testi kasutamisel on kõige nõrgem lüli t-test, mitte 30 proovi.
John:> "Võib väita, et 30 prooviga t-testi kasutamisel on nõrgim lüli t-test, mitte 30 proovi". Väga õige ja ka eeldus, et andmed on * iid *. Samuti on Cauchy jaotatud juhuslike muutujate mediaan MLE (ja seega efektiivne), kuid üldiselt võiksite vajada rohkem kui 30 vaatlust.
Kõik CLT versioonid ei tugine identsele levitamisele ega isegi sõltumatusele. Alaealistele õpetatavad põhilised teevad seda sageli, kuid on versioone, mis ei tee mõlemat eeldust nt. [Ljapunovi CLT] (http://et.wikipedia.org/wiki/Central_limit_theorem#Lyapunov_CLT) eeldab sõltumatust, kuid mitte identset jaotust, samuti võib sõltumatustingimust leevendada, näiteks [vaata siit] (http: // et .wikipedia.org / wiki / Central_limit_theorem # CLT_under_weak_dependence). Ka see "ümberkorraldamine" ei ole sama mis iseseisvus. Mõni sõltuvuse vorm ei tugine korrale.
Valimi suurus 50 000 ei ole piisav, et CLT töötaks log-normaaljaotuse keskmise usaldusvahemiku arvutamiseks piisavalt hästi.


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 2.0-litsentsi eest, mille all seda levitatakse.
Loading...