Küsimus:
Miks on keskmine vanus parem statistika kui keskmine vanus?
Lazer
2010-09-11 01:26:57 UTC
view on stackexchange narkive permalink

alt text

alt text

Selgelt mediaan näib olevat valitud statistika vanuste osas.

Ma ei suuda endale selgitada, miks oleks aritmeetiline keskmine halvem statistika. Miks see nii on?

Algselt postitati siia, kuna ma ei teadnud, et see sait olemas on.

Tundub, et teil oli teisel saidil juba mõistlik vastus?
@Shane: Kuid võib-olla on erinevatel saitidel potentsiaali koguda erinevaid vastuseid erinevatest vaatenurkadest?
Neliteist vastused:
#1
+47
whuber
2010-09-11 03:17:24 UTC
view on stackexchange narkive permalink

Minu arvates ei anna statistika sellele küsimusele head vastust. Keskmine võib olla asjakohane näiteks suremuse uuringutes, kuid vanust pole nii lihtne mõõta, kui võite arvata. Vanemad, kirjaoskamatud ja mõnes kolmanda maailma riikides elavad inimesed kipuvad oma vanuse ümardama näiteks 5 või 10 kordajani.

Mediaan on selliste vigade suhtes keskmisest vastupidavam. Pealegi on keskmine vanus tavaliselt 20–40, kuid inimesed võivad elada 100 ja enamgi (üha suurem ja märgatav osa tänapäevaste riikide elanikkonnast elab nüüd üle 100). Sellises vanuses inimestel on keskmist mõju 1,5–4 korda suurem kui mediaanil, võrreldes väga noorte inimestega. Seega on mediaan riigi vanuselise jaotuse kohta veidi ajakohasem statistika ja on keskmisest madalam pisut suremuse määradest ja eeldatavast elueast.

Lõpuks annab mediaan meile pisut parem pilt sellest, kuidas vanusjaotus ise välja näeb: kui näete näiteks mediaani 35, teate, et pool elanikkonnast on vanemad kui 35 ja võite järeldada mõningaid asju sündivuse, vanemate vanuse ja muu kohta ; aga kui keskmine on 35, ei saa te nii palju öelda, sest seda 35-d võib mõjutada näiteks suur 70-aastase elanikkonna mõhk või võib-olla rahvastiku erinevus mõnes vanusevahemikus vanale sõjale või epideemiale.

Seega näib mediaan demograafilistel, mitte statistilistel põhjustel omnibussi väärtuse rolli väärilisemaks suhteliselt suure elanikkonna vanuse kokkuvõtete tegemiseks.

Ma arvasin, et mõtlesite seda: "Mediaan on selliste vigade suhtes vastupidavam kui keskmine". Nõustun siiski teie kommentaaridega ja usun, et USA loendus esitab ametlikes aruannetes (mitte ainult vanuses) tavaliselt paljude kategooriate mediaanid põhimõtteliselt kõigil samadel põhjustel. Sissetulek on võib-olla isegi parem näide kui vanus selliste punktide illustreerimiseks.
Olete asendanud fakti - keskmine on tundlik kõrvalarvude / kallutatud jaotuste suhtes - väärtuslausega, mis käsitleb mediaani eelistamist keskmisele. Tegelikult olete väitnud, et keskmist ei tohiks eelistada, kuna see ei ole mediaan (umbes nagu need, kes ütlevad, et keskmist tuleks kasutada ainult sümmeetrilistel jaotustel, st kui keskmine ja mediaan on võrdsed).
@Alexis Ma ei järgi teie kriitikat. Kas saaksite täpsustada? Lõppude lõpuks annab see vastus palju enamat kui "fakt": see sisaldab neid üsna vähe koos nende tagajärgede analüüsiga. Ja konkreetselt, millisele "väärtusavaldusele" viidate?
Minu mure on see, et keskmise ja mediaani faktilised omadused (nt esimene on tundlik kõrvaltoimete suhtes, nimelt "Sellises vanuses inimestel on keskmine mõju keskmiselt 1,5–4 korda suurem kui mediaanil võrreldes väga noorte inimestega.") muutuvad * väärtuseks * nende väärtuse kohta, nimelt "mediaan annab meile veidi parema pildi sellest, kuidas vanusjaotus ise välja näeb". Esimene on fakt, hiljem selle fakti hindamine. Minu mure on nende kahe vahel vahetamine. Veel: http://stats.stackexchange.com/questions/96371/should-the-mean-be-used-when-data-are-skewed
@Alexis Aitäh. Ma olen ikka veel hädas, et mõista, mida sa mõtled "väärtuste" all. Tegin avalduse truuduse kohta, millega statistika annab meile teavet jaotuste kohta, mitte selle kohta, kui palju inimesed erinevatest vanustest hoolivad (mida see "väärtus" tavaliselt sellises kontekstis tähendaks). Toetan seda väidet tundlikkuse (mõju) standardmõõduga. Kui aitaksite mul oma murest paremini aru saada, siis selgitaksin sellega seoses hea meelega postitust. (Mõnel lingitud küsimuse vastajal on teie murest aru saades sarnased probleemid.)
@whuber (aitäh kannatlikkuse eest), see on minu eelmise kommentaari tsitaadis selliste sõnade nagu "parem" kasutamine, mis minu arvates kannab siin tähendust "kui palju inimesed hoolivad". Püüan vist tõstatada küsimuse "Kas me ei mõtle teistsugust, mitte paremat?"
@Alexis Pidage meeles, et see küsimus ei puuduta keskmise ega mediaani kasutamist, vaid nende kasulikkust * vanuselise jaotuse hindamisel. * Pange tähele, et kohe alguses tunnistan minu vastuses imerohtu: et keskmine on kasulik ja asjakohane * konkreetsetel eesmärkidel. * Ma ei usu, et olen toime pannud patu, milles te mind süüdistate, mis on "parema" ebamäärane kohaldamine: ma olen hoolikalt sätestanud * kuidas * mediaan ja keskmine selles kontekstis erinevad * *. Mulle tundub, et teil on probleeme vehkimisega seoses vahenditega * vs * mediaanidega, kuid see pole koht, kus seda teha.
#2
+17
Dirk Eddelbuettel
2010-09-11 01:48:50 UTC
view on stackexchange narkive permalink

John andis teile õe saidil hea vastuse.

Üks aspekt, mida ta sõnaselgelt ei maininud, on vastupidavus: mediaan keskse asukoha näitajana on parem kui keskmine, kuna selle lagunemiskoht on kõrgem (50%), keskmine on 0-st väga madal (vt üksikasju vikipeediast).

Intuitiivselt tähendab see seda, et üksikud halvad tähelepanekud ei moonuta mediaani, samas kui need tähendavad keskmist.

Jaotus ei ole kogu populatsiooni kirjeldava statistika küsimus.
#3
+12
John D. Cook
2010-09-11 19:20:44 UTC
view on stackexchange narkive permalink

Siin on minu vastus, mis postitati esmakordselt saidile math.stackexchange:

Keskmine on see, mida paljud inimesed tegelikult mõtlevad, kui nad ütlevad „kuri”. Mediaani on lihtsam tõlgendada: pool elanikkonnast on üle selle vanuse ja pool alla selle. Mean on veidi peenem.

Inimesed otsivad sümmeetriat ja mõnikord kehtestavad sümmeetriat, kui seda pole. Vanusjaotus populatsioonis pole kaugeltki sümmeetriline, mistõttu keskmine võib olla eksitav. Vanuselised jaotused on umbes nagu püramiid. Palju lapsi, vanureid vähe. (Või vähemalt on see nii, nagu on mingis püsivas olekus. USA-s on II maailmasõja järgne beebibuumi põlvkond seda vananemist moonutanud. Mõned inimesed on seda nimetanud "püramiidi ruudukujuliseks muutmiseks", sest buumid on teinud püramiidi tipp laiem kui varem.)

Asümmeetrilise jaotuse korral võib olla parem teatada mediaan, kuna see on sümmeetriline statistika. Mediaan on sümmeetriline, isegi kui valimi jaotus pole.

Mis mõttes on mediaan "sümmeetriline" statistika? Kindlasti pole nii, et jaotused kipuvad olema sümmeetriliselt jaotatud nende mediaanide (ega ka nende keskmiste) kohta. Kui mõtlete ainult seda, mida kirjutasite teises kommentaaris, et "mediaan jagab populatsiooni pooleks" (mis * määratleb mediaani), kõlab teie argument ringikujuliselt: mediaan on hea, sest mediaan on mediaan!
#4
+7
John
2010-09-11 05:30:30 UTC
view on stackexchange narkive permalink

Miks on kirves parem kui kirves?

See sarnaneb teie küsimusega. Nad lihtsalt mõtlevad ja teevad erinevaid asju. Kui räägitakse mediaanidest, on lugu, mida nad püüavad edastada, mudel, mida proovitakse andmetele rakendada, teistsugune kui vahenditega.

#5
+4
ars
2010-09-12 10:01:58 UTC
view on stackexchange narkive permalink

Konkreetse näitena võtke arvesse Kongo (KDV) ja Jaapani keskmist vanust. Ühte laastab kodusõda, teine ​​on vananeva elanikkonnaga hästi arenenud. Keskmine ei ole õunte ja õunte võrdluse jaoks eriti huvitav. Teisest küljest võib mediaan olla keskse tendentsi mõõdupuuna informatiivne, kuna definitsiooni järgi oleme pooled ülal, pooled allpool. Vikipeedia artikkel rahvastikupüramiidi kohta võib olla valgustav (vt jaotisi noorte mõhk, elanikkonna vananemine).

#6
+3
Henry
2011-03-27 10:39:31 UTC
view on stackexchange narkive permalink

Ma arvan, et vanuselise jaotuse mediaani üle keskmise valimiseks pole head kirjeldavat põhjust. Esitatud andmete võrdlemisel on üks praktilisus.

Paljud riigid teatavad oma elanikkonnast 5-aastaste intervallidega, kusjuures tippbänd on avatud. See põhjustab mõningaid raskusi intervallide keskmise arvutamisel, eriti kõige noorema intervalli (mõjutatud imikute suremuse määr), ülemise "intervalli" (mis on 80+ "intervalli keskmine"?) Ja lähimate intervallide ( iga intervalli keskmine on tavaliselt keskmisest madalam).

Mediaani on palju lihtsam hinnata interpoleerides mediaanintervalli piires, sageli lähenedes eeldades lamedat või trapetsiaalset vanuselist jaotust selles intervallis (paljudes riikides on suremus keskmise vanuse paiku suhteliselt madal, mis muudab see on mõistlikum lähendus kui noortele või vanadele).

#7
+3
Richard E. Gilder
2012-01-02 21:18:02 UTC
view on stackexchange narkive permalink

Ameerika Ühendriikide rahvatervise andmete hoidlad liiguvad vanuseastmesse viie aasta kaupa, kuna HIPAA eeskirjad mõjutavad andmete tahtlikku pimestamist ja varjamist isikliku privaatsuse huvides.

Arvestades seda väljakutset minevikus (enne HIPAA-d) olnud sündmuskuupäeva ja surmakuupäeva erinevusel põhineva mõõteandmete elemendi üsna skaalal, peame võib-olla kaaluma AGE-d skaalamuutujana, mis võib tuleb rahvatervise andmekogumites üldse parameetriliselt kirjeldada, eelistades mudeleid, mis kirjeldavad AGE-d mitteparameetriliselt kui järjekorrataset. Ma tean, et see võib paljudele biomeditsiinilise informaatika kogukonna fraktsioonidele tunduda "üle mõistuse", kuid sellel ideel võib olla mõningaid eeliseid ülaltoodud kommentaarides kirjeldatud tõlgendamise osas.

Aga kogu analüütiline jõud, mis on saadaval mitteparameetriliste lähenemisviiside jaoks? Jah, on tõsi, et igaüks meist üritab peaaegu universaalselt rakendada GLM (üldine lineaarne mudel) tehnikaid muutujale, mis esitleb meid jaotustes, mis käituvad nii nagu AGE.

Samal ajal tuleb arvestada selle jaotuse kuju ja seda, kuidas seda kuju määravad mitmete dimensioonide koostoime mõjud jaotuses esinevatele mitmemõõtmelistele tsentriididele ja alamrühmade tsentriididele. Mida teha nende väga keerukate andmekogumitega?

Kui andmeelement ei vasta mudeli eeldustele, skaneerime järk-järgult (ütlesin üle, mitte alla; peaksime olema meetodi võrdsete võimaluste tööandjad, iga tööriist tuleb tehasest koos vorm järgib funktsioonireegleid) loetelu muudest võimalikest mudelitest, et leida need mudelid, mis eelduste teste "ei jäta alt"

Praeguses rahvatervise andmekogumite vormingus peame tõepoolest (andmete visualiseerimise kogukonnana) välja töötama standardse mudeli vanuse vanuse käsitlemiseks viie aasta kaupa (5YI). Minu hääletus AGE andmete visualiseerimise poolt (arvestades uut 5YI vormingut) on histogrammide ning kasti- ja vuntsitükkide kasutamine. Jah, see tähendab mediaani. (Ükski sõnamäng pole ette nähtud!)

Mõnikord on pilt tõesti tuhande sõna väärt ja abstrakt on kokkuvõte tuhandest sõnast. Kast ja vurrudiagramm näitab jaotuse "kuju" histogrammi tähendusliku sümboolse esitusena peaaegu ikoonilisel eraldusvõime tasemel. Viie aasta vanuse juurdekasvu jaotuste võrdlemine, näidates kasti- ja vuntsitükke "kõrvuti", kus saab koheselt visuaalselt võrrelda 75. kuni 50. (mediaan) ja 25. ntiliuse mustreid, oleks elegantne "universaalne standard" vanuse võrdlemiseks maailm. Neile meist, kes naudivad jätkuvalt andmete esitamise põnevust tabelekraanil kuvamise tekstimehaanika kaudu, võib "tüve ja lehe" diagramm olla kasulik ka siis, kui seda kasutatakse animeeritud visuaalse graafika elemendina variatsiooni kujutavas "säde" lähenemisviisis. jaotuste kuju ajas.

VANUS on täisealiseks saanud. Seda tuleb edasi uurida võimsamate arvutusalgoritmidega, mis on nüüd saadaval.

See on hästi kirjutatud postitus, kuid tundub, et sellel pole algse küsimusega mingit seost.
Ma arvan, et see käsitleb kaudselt, kuid asjakohaselt küsimuse @Andy näilist kavatsust. Võimalik süü on küsimuses endas, mis on mitmetähenduslik, kuna see ei täpsusta tähendust, milles keskmine võiks olla mediaanist "halvem". Hea vastus peab seetõttu seda uurima ja kaaluma vanusjaotuse kokkuvõtmise eesmärki ühe statistikaga. Siinkohal viib see loomulikult aruteluni selle üle, mida "vanus" võib tähendada ja kui asjakohaselt vanuselisi jaotusi võrrelda.
#8
+3
Emil Friedman
2012-05-23 20:34:40 UTC
view on stackexchange narkive permalink

Selleks, et anda algsele küsimusele kasulik vastus, on meil vaja teada selle taga olevat küsimust. Teisisõnu: "Miks soovite mingisugust kokkuvõtvat statistikat, milles võrreldakse eri riikide vanuselist jaotust?" Mediaan võib olla mõnes küsimuses kõige kasulikum. Keskmine võib olla teiste jaoks kõige kasulikum. Ja ilmselt on küsimusi, kus kõige kasulikum statistika oleks "protsent, mis ületab (või alla) teatud vanust".

#9
+2
Mike Dunlavey
2010-09-14 05:23:26 UTC
view on stackexchange narkive permalink

Saate siin häid vastuseid, kuid lubage mul lihtsalt lisada 2 senti. Töötan farmakomeetrias, mis tegeleb selliste asjadega nagu vere maht, eliminatsiooni määr, ravimi toime põhitase, maksimaalne ravimi toime ja muud sellised parameetrid.

Me eristame muutujaid, mis võivad omandada mis tahes väärtuse pluss või miinus versus väärtused, mis võivad olla ainult positiivsed. Muutuja näide, mis võib omandada mis tahes väärtuse, pluss või miinus, oleks ravimi toime, mis võib olla positiivne, null või negatiivne. Muutuja näide, mis võib olla ainult realistlikult positiivne, on veremaht või ravimi eliminatsiooni määr.

Me modelleerime neid asju jaotustega, mis on tavaliselt kas normaalsed või lognormaalsed, normaalsed kõigi väärtusega ja lognormaalsed ainsate positiivsete jaoks. Lognormaalne arv on arv E, mis võetakse normaalselt jaotatud arvu astmeks, ja seetõttu võib see olla ainult positiivne.

Tavaliselt jaotatud muutuja puhul on mediaan, keskmine ja režiim sama number, seega pole vahet, kumba te kasutate. Lognormaalselt jaotunud muutuja puhul on keskmine aga suurem kui mediaan ja režiim, seega pole see tegelikult eriti kasulik. Tegelikult on mediaan seal, kus aluseks oleval normaalsusel on oma keskmine, seega on see palju atraktiivsem näitaja.

Kuna vanus (arvatavasti) ei saa kunagi olla negatiivne, on lognormaalne jaotus tõenäoliselt selle parem kirjeldus kui tavaliselt, seega on mediaan (E aluseks oleva normi keskmise järgi) kasulikum.

Vanuse jaotus pole kindlasti log normaalne.
Ma ei usu, et võite järeldada, et vanus jaotub logaritmiliselt tavapärasest ainult sellest, et see on alati positiivne. Gamma ja Weibulli jaotused on samuti alati positiivsed, miks mitte neid valida?
@Rob: @nico: Olen kindel, et sul on õigus. See oli kehv näite valik. Tavaliselt modelleerime farmakomeetrilisi parameetreid, nagu maht ja kliirens.
#10
+2
Susanne
2015-02-12 22:34:32 UTC
view on stackexchange narkive permalink

Mulle on õpetatud, et mediaani tuleks kasutada vahemiku ja keskmise standardhälbega. Kui me räägime vanusest, siis ma arvan, et vahemik on leviku väljendamiseks asjakohasem viis ja enamiku jaoks lihtsam mõista. Näiteks uuritavas populatsioonis oli keskmine vanus 53 (SD 5,4) või keskmine vanus 48 (vahemik 23–77). Sel põhjusel eelistaksin kasutada pigem mediaani kui keskmist. Kuid mind huvitaks siinkohal, mida ütleks statistik või statistikaprogramm keskmise kasutamise vahemikuga kasutamise kohta? Näen seda teadusartiklites üsna vähe.

Tere tulemast CV-le, Susanne.Kui olete selle postitanud vastuste saamiseks, siis kustutage see ja postitage uuesti uue küsimusena.Juhised selle saidi kasutamiseks on saadaval meie [abi].
#11
+1
user28
2010-09-11 02:33:58 UTC
view on stackexchange narkive permalink

Johni vastust saidil math.stackexchange saab vaadata järgmiselt:

Kui teil on viltune jaotus, võib mediaan olla parem kokkuvõtlik statistika kui keskmine.

Pange tähele, et kui ta ütleb, et imikuid on rohkem kui täiskasvanuid, soovitab ta sisuliselt, et vanuseline jaotus on viltu.

Tegelikult arvan, et tänapäeval on paljudes riikides kalduvus pigem eakate, mitte totside poole.
Võib-olla on see kaldu teistpidi, kuid üldine mõte jääb paika. Viltuste jaotuste korral võib mediaan olla mõistlikum kui keskmine.
Värskendasin just oma vastust saidil math.stackexchange, et just sellele punktile rõhutada. Inimesed otsivad sümmeetriat ja võivad sümmeetriat valesti kehtestada, kui seda pole. Mediaanist teatades annate vastuse, mis on sümmeetriline - mediaan jagab populatsiooni pooleks - kuigi jaotus pole sümmeetriline.
See vastus tundub minu jaoks alati mõnevõrra varjatud: kui jaotused ei ole viltu (st need on sümmeetrilised), on keskmine * võrdne * mediaaniga, seega öeldes, et mediaan on "parem", kui jaotus on viltu, on tagaukseviis " kasutage ainult mediaani. "
#12
+1
Eustache
2012-03-10 16:27:28 UTC
view on stackexchange narkive permalink

Loodan, et keskmist vanust mõjutaksid teie andmekogumi välised näitajad, kuigi see ei kehti keskmise vanuse puhul. Võtame näite vaktsineeritud patsientide andmebaasist: 1,2,3,4,4,5,6,6,6,78 aasta keskmine oleks: 11,5 ja nende patsientide keskmine vanus 4,5. seda keskmist vanust on mõjutanud väärarv 78. mediaan on parim, kui tegeleda viltu jaotuse andmekogumitega.

Vaadake minu vastust kasutajale28.
#13
  0
Matt L.
2014-05-28 21:18:26 UTC
view on stackexchange narkive permalink

Kindlasti arvan demograafilise analüüsi puhul, et nii keskmine kui ka mediaan oleksid väärtuslikud, eriti kombinatsioonis üksteisega, kui otsite kõrvalekaldeid või kasvupiirkondi, mida ainuüksi mediaan võib valesti märgistada. Suure pensionikogukonnaga kogukondades või sündimuse plahvatuslikus piirkonnas ei pruugi ainuüksi mediaan anda teile tervikpilti ja see võib olla keskmine, võrreldes sellega, väga kasulik.

#14
  0
brethvoice
2020-03-31 19:21:02 UTC
view on stackexchange narkive permalink

LÜHIVASTUS: Keskmine vanus pole lihtsalt parem kui keskmine vanus; aga võite olla märganud, et rohkem inimesi kasutab seda. Seega võiks olla parem küsimus: "Miks peaks rohkem demograafe kasutama keskmist vanust kui keskmine vanus?"

Statistika kui sõnavaramõiste algus on riik (nominaalselt juriidiline isik), kes püüab mõista oma inimpopulatsiooni. Mõelge siis nende valitsuste elanikele ja sellele, kui palju teavet nad tahavad või vajavad, samuti kui palju aega tuleb neile pühendada teadussõnade täpse matemaatilise tähenduse mõistmiseks.

Lihtsaim viis paljude andmete kokkuvõtmiseks ilma pilti kasutamata on teatada ühest numbrist; seda tuntakse kui kõnealuse parameetri hindajat (selles puuris on inimese sünnist möödunud aeg täpselt aastate tasemel). Komplekt. Jaynes näitas oma raamatus Ptõenäosusteooria: Teaduse loogika võiks valida, kas utilitaristliku kadumisfunktsiooni põhjal koostatakse hinnang, mis võtab kokku vea tegemise tagajärjed, tuginedes ühe numbri kasutamisele terve numbri asemel. selle teabe põhjal otsuste tegemisel andmekogum.

Jaynesi raamatus näitab ta matemaatiliste tõendite abil, et režiim ehk maksimaalse tõenäosuse hindaja on hinnang, mis minimeerib kaotuse, mis on Diraci delta funktsioon. Keskmine minimeerib ruutkadumisfunktsioonid, nii et kui hinnangust lähemale jõuab, suureneb kahjum (soovimatu tagajärg) väga kiiresti, kui läbite ühiku skaala.

Mediaan seevastu minimeerib tagurpidi kolmnurgana kujundatud kadumisfunktsiooni, nii et ainult viis korda vähem soovitav on olla 25 täpsuse asemel üks täpsusühik (näiteks juhul, kui kasutatakse keskmine). Tegelikult pole täpsusühikul mingit vahet, sest sellises kolmnurkse terava kadu funktsioonis pole kumerust.

Selle teoreetilise aluse põhjal võiks sõna otseses mõttes joonistada kahjumifunktsioonid, mis pole üldse sümmeetrilised, ja moodustada lõpmatu arv uusi hindajaid, mis sobivad nende tarbijate / kasutajate vajadustega. Teine alternatiiv ühe numbri kultuurilise ootusega tegelemisele on nende samade teabe kasutajate / tarbijate harimine, et keskse suundumuse mõõdik võib anda rohkem teavet, kui see on ühendatud jaotuse muude parameetritega, nagu dispersioon, viltus ja kurtoos ( võiksite alustada lihtsalt varieerumisest ja kaldumisest, et neid selles hõlbustada.

Dispersioon on vaid üks näide dispersioonimõõdust; teine ​​Jaynes soovitab (teistes kirjutistes) moodustada Bayesi tagumine jaotus ja arvutada lühima usaldusväärse intervalli laius väärtusega 0,5 (või usaldusvahemik / standardhälve jne., kui te ei osta Bayesi teooriasse - palun, ärgem mitte saada kõrvalrada). Intuitiivsem meetod, mida on võimalik paljudel inimestel hõlpsamini mõista, oleks kvartiilidevaheline vahemik, eriti kui sellest teatatakse mediaanina kui vastava keskse kalduvuse mõõduna.

Ma pole kindel, kas on olemas mitteparameetriline viltuse või kurtoosi vorm, kuid kui need on olemas, on neid peaaegu kindlasti lihtsam mõista kui neid parameetrilisi analooge. Mul on aimdus, et peamine, kui mitte domineeriv osa põhjusest, miks keskmine vanus kasvab keskmisest vanusest, tuleneb sellest, et see lihtsalt meeldib rohkem inimestele, kellel on vähem aega või soov minna teoreetilistesse üksikasjadesse näiteks sigma-algebratest, Lebesgue'i mõõteteooria jms, mis on kõik tehniliselt vajalikud tõenäosusliku arutluse levinumate aluste mõistmiseks.

Ehkki hinnangute jms kohta on siin palju häid mõtteid, arvan, et need ilmuvad vales kohas: see küsimus puudutab ainult * kirjeldavat * statistikat.See pole tingimata mõeldud millegi hindajaks.
@whuber mis on mis tahes statistika eesmärk, kui mitte kirjeldada ühe numbriga andmekogumi huvipakkuvat omadust?Olen nõus, et dispersioon, viltus, kurtoos või kõrgema järgu momentidega seotud suurused ei ole tavaliselt hinnangud, vaid keskse kalduvuse mõõtme kvalifitseerijad.Kuid loodan, et me ei ignoreeri sõna "tõenäosus" tähendust tavakeeles.Rakenduskava kontekstis näib keegi küsivat: "kui vanad on inimesed sellises ja sellises asukohas?"seega on mediaan hinnanguline, kuna see iseloomustab huvitavat suurust (parameetrit) ühe numbriga.
Kirjeldava statistika ja hinnangu eristamine seisneb osaliselt selle kasutamises: esimene on andmekogumi omadus, puhas ja lihtne.Tõenäosus pole sellega seotud, samuti pole see vajalik kirjeldava statistika loomiseks või kasutamiseks.Hinnanguline, vastupidi, üritab iseloomustada hoopis midagi muud: nimelt "populatsiooni", millest andmed on hüpoteetiliselt tuletatud.


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 2.0-litsentsi eest, mille all seda levitatakse.
Loading...