Küsimus:
Bayesi ja sagedased tõenäosuse tõlgendused
BYS2
2012-07-05 19:41:27 UTC
view on stackexchange narkive permalink

Kas keegi suudab põhjalikult kirjeldada erinevusi Bayesi ja sagedase tõenäosuse lähenemise vahel?

Minu arusaamist mööda:

Sagedaste esindajate arvates on andmed korratav juhuslik valim (juhuslik muutuja) kindla sageduse / tõenäosusega (mis on määratletud sündmuse suhtelise sagedusena, kui katsete arv läheneb lõpmatusele). Põhiparameetrid ja tõenäosused jäävad selle korratava protsessi käigus konstantseks ja variatsioon tuleneb varieeruvusest $ X_n $ ja mitte tõenäosusjaotusest (mis on fikseeritud teatud sündmuse / protsessi jaoks).

Bayesi seisukoht on, et andmed on fikseeritud, samas kui teatud sündmuse sagedus / tõenäosus võib muutuda, see tähendab, et jaotuse parameetrid muutuvad. Tegelikult muudavad saadud andmed parameetri varasemat jaotust, mida värskendatakse iga andmekogumi jaoks.

Mulle tundub, et sagedasuskäik on praktilisem / loogilisem, kuna tundub mõistlik, et sündmused on konkreetne tõenäosus ja et variatsioon on meie valimis.

Lisaks sellele tehakse enamasti uuringute andmete analüüs tavaliselt sagedase lähenemisviisi abil (nt usaldusvahemikud, hüpoteeside testimine p-väärtustega jne), kuna see on kergesti mõistetav.

Mõtlesin lihtsalt, kas keegi võiks anda mulle kiire kokkuvõtte oma tõlgendusest bayesi ja sagedase lähenemisviisi kohta, sealhulgas ka sagedase p-väärtuse ja usaldusintervalli Bayesi statistilised vasted. Lisaks on teretulnud konkreetsed näited selle kohta, kus üks meetod oleks teisele eelistatavam.

Mõnes kohas ründab teid vihane rahvahulk, kui ütlete, et sagedane lähenemine statistilistele järeldustele on otstarbekam. (OK, võib-olla on selles väites _home_ hüperbool.) Ma ei nõustu, et usaldusvahemikke on lihtsam mõista kui tagumisi tõenäosusintervalle. (Igatahes vaadake minu vastust allpool. Ma arvan, et see jõuab otse asja sisuni, kuigi pole midagi matemaatikat, kui teada, mis on $ 1/2 $.)
@DilipSarwate jah, ma pean seda järgmiseks korraks silmas. aga tundub, et sain seekord paar head vastust, nii et ehk proovin siin lõpetada: D
Vaadake ka https://stats.stackexchange.com/q/173056/35989
Kuus vastused:
Chris Taylor
2012-07-05 20:45:47 UTC
view on stackexchange narkive permalink

Sagedase lähenemisviisis väidetakse, et tõenäosustel on tähendus ainus mõttes kui katsete jada õnnestumiste arvu piirväärtus, st kui

$$ p = \ lim_ {n \ to \ infty} \ frac {k} {n} $$

kus $ k $ on õnnestumiste arv ja $ n $ katsete arv . Eelkõige pole mõtet seostada tõenäosusjaotust parameetriga.

Näiteks kaaluge Bernoulli jaotuse valimit $ X_1, \ dots, X_n $ parameetriga $ p $ (st nende väärtus on 1 tõenäosusega $ p $ ja 0 tõenäosusega $ 1-p $). Saame määratleda edukuse proovi

$$ \ hat {p} = \ frac {X_1 + \ cdots + X_n} {n} $$

ja räägime $ \ hat {p} $ jaotusest, mis sõltub $ p $ väärtusest, kuid pole mõtet küsimust pöörata ja hakata rääkima $ p $ tõenäosusjaotusest tingimusel, et vaadeldakse väärtus $ \ hat {p} $. Eelkõige tähendab see, et usaldusvahemiku arvutamisel tõlgendame usaldusvahemiku otsasid juhuslike muutujatena ja räägime pigem "tõenäosusest, et parameeter on usaldusvahemiku sees ".

Bayesi lähenemises tõlgendame tõenäosuse jaotusi kui kvantifitseerivat meie ebakindlust maailma suhtes. Eelkõige tähendab see, et saame nüüd sisukalt rääkida parameetrite tõenäosuse jaotustest, sest kuigi parameeter on fikseeritud, võivad meie teadmised selle tegelikust väärtusest olla piiratud. Ülaltoodud näites võime tõenäosuse jaotuse $ f (\ hat {p} \ mid p) $ ümber pöörata, kasutades Bayesi seadust, et anda

$$ \ overbrace {f (p \ mid \ hat {p})} ^ \ text {posterior} = \ underbrace {\ frac {f (\ hat {p} \ keskel p)} {f (\ hat {p})}} _ \ text {tõenäosuse suhe} \ overbrace {f (p)} ^ \ text {prior} $$

Häbi on see, et peame oma analüüsi lisama eelmise jaotuse - see peegeldab meie veendumust $ p $ väärtuses enne $ X_i $ tegelike väärtuste nägemist. Tihti kritiseeritakse prioristi rolli sagedasuses, kuna väidetakse, et see viib subjektiivsuse muidu karmisse ja objektiivsesse tõenäosusemaailma.

Bayesi käsitluses ei räägita enam usaldusvahemikest, kuid usaldusväärsemate intervallide asemel, millel on loomulikum tõlgendus - arvestades 95% usaldusväärset intervalli, võime määrata 95% tõenäosuse, et parameeter on intervalli sees.

Teisalt on sagedase lähenemise üks kriitika see, et see ei lähe kokku sellega, kuidas inimesed tõenäosusest mõtlevad. Mõelge, kuidas räägitakse ühekordsete sündmuste "tõenäosusest" nagu dinosauruste väljasuremine või "kindluse" "tõenäosus" nagu homme tõusev päike ...
Samuti võib olla hea mainida, et lõhe sagedase ja Bayesi lähenemise vahel ei ole praktilises plaanis sugugi nii suur: mis tahes kasulike ja enesekindlate tulemuste saamiseks kasutataval sagedasuse meetodil võib üldjuhul anda Bayesi tõlgenduse ja vastupidi. Eelkõige annab sagedase arvutuse ümbersõnastamine Bayesi mõistes reeglina tagumise _selle konkreetse priori_arvutamise. Seejärel võib küsida: "Noh, kas see on tegelikult mõistlik eeldada?"
Tänan teid selle vastuse eest, see on kooskõlas minu üldise arusaamaga. Kuid ma mõtlesin, kas saaksite ühte asja selgitada, kuidas leiaksite andmete / valimi edukuse määra (f (p-hat)) tõenäosuse Baye seaduse valemis? Olen läbi lugenud mõned töötanud näited ja saan üldiselt aru, kuidas tuletada f (p-hat | p) ja eelnev f (p), kuid f (p-hat) hoiab mind siiani mööda. Kui teil oleks mingeid linke mõne ressursiga, siis oleks see suurepärane: D. Aitäh!
@IlmariKaronen. Okei, kas te ütlete seda, kui ütleksin, et kui mul oleks uuring, mille tulemuseks oleks teatud usaldusvahemikena väljendatud tulemused, saaksin andmed uuesti sõnastada ja selle asemel teha bayesi analüüsi? ja tulemused oleksid enam-vähem järjepidevad?
See, mida @Karonen ütleb, pole päris täpne.Kaks kõige levinumat sagedasemat tehnikat on punkthinnangud (tavaliselt maksimaalse tõenäosuse hindamine) ja hüpoteesitestid ning kummalegi ei saa tegelikult anda Bayesi loomulikku tõlgendust.
See pole "tõenäosusraadio", vaid tõenäosus.Tõenäosusega raadio on kahe tõenäosusega raadio
Kas on võimalik rääkida parameetrite jaotusest, ilma et Priorsi kasutusele võtaks?
sydeulissie
2012-07-05 21:27:41 UTC
view on stackexchange narkive permalink

Teil on sageduse tõenäosuse tõlgenduse osas õigus: juhuslikkus selles seadistuses on tingitud ainult mittetäielikust valimist. Bayesi vaatenurgast on tõenäosused "subjektiivsed", kuna need peegeldavad agendi ebakindlust maailma suhtes. Pole päris õige öelda, et jaotuste parameetrid "muutuvad". Kuna meil pole parameetrite kohta täielikku teavet, muutub meie ebakindlus nende kohta, kui kogume rohkem teavet.

Mõlemad tõlgendused on rakendustes kasulikud ja kumb on kasulikum, sõltub olukorrast. Bayesi rakenduste kohta saate ideid vaadata Andrew Gelmani ajaveebist. Paljudes olukordades, mida Bayeslased nimetavad "prioriteks", nimetavad sagedased "seadustamiseks" ja nii (minu vaatenurgast) võib põnevus ruumist üsna kiiresti lahkuda. Tegelikult on Bernsteini-von Misesi teoreemi kohaselt Bayesi ja Frequentisti järeldused üsna asümptootiliselt samaväärsed üsna nõrkade eelduste korral (ehkki teoreem lõpmatute mõõtmete jaotuste korral ebaõnnestub). Selle kohta leiate hulgaliselt viiteid siit.

Kuna te palusite tõlgendusi: arvan, et Frequentisti vaatenurgal on teaduslike eksperimentide modelleerimisel sellisena mõte, nagu see oli mõeldud. Mõne masinõppes või induktiivse arutluse (või õppimise) modelleerimise rakenduste jaoks on Bayesi tõenäosus minu jaoks mõttekam. On palju olukordi, kus fikseeritud "tõelise" tõenäosusega sündmuse modelleerimine tundub ebausutav.

Mänguasja Laplace'i juurde naasmise näitena võtke arvesse homme päikese tõusu tõenäosust. Frequentistlikust vaatenurgast lähtudes peame tõenäosuse määratlemiseks midagi sellist nagu lõpmata palju universume. Bayeslastena on olemas ainult üks universum (või vähemalt ei pea neid olema palju). Meie ebakindluse tõusva päikese suhtes on meie väga-väga kindel usk, et homme tõuseb uuesti.

Michael Hardy
2012-07-05 22:52:37 UTC
view on stackexchange narkive permalink

Tõenäosuse Bayesi tõlgendus on usutunnistuse tõlgendus.

Bayeslane võib öelda, et tõenäosus, et miljard aastat tagasi oli Marsil elu, on 1/2 dollarit.

Sagedane esindaja keeldub sellele ettepanekule tõenäosust määramast. Poole juhtumite kohta ei saa öelda, et see vastab tõele, mistõttu ei saa määrata tõenäosust $ 1/2 $.

Tõenäoliselt pole paremat kohta, kui mõelda kitsama sagedase lähenemisviisi ja Bayesi lähenemisviisi (loogika laiendamine) piirangute üle kui RT [klassikaline paber] (https://doi.org/10.1119/1.1990764)Cox.
Cox kirjutas sellest ka raamatu, mille pealkiri oli _ Tõenäolise järelduse algebra, väljaandja Johns Hopkins.@gwr $ \ qquad $
Ian Hacking ütles seda hästi oma raamatus "Sissejuhatus tõenäosusse ja induktiivsesse loogikasse".Ta ütles: "Bayeslane suudab individuaalsete väidete külge kinnitada isiklikke tõenäosusi või usutunnuseid. Kõva joone dogmaatik arvab, et tõenäosused saab kinnitada ainult sündmuste reale."
Michael Chernick
2012-07-05 21:13:46 UTC
view on stackexchange narkive permalink

Chris annab kena lihtsustatud selgituse, mis eristab korralikult tõenäosuse kahte lähenemist. Kuid sagedane tõenäosusteooria on midagi enamat kui lihtsalt õnnestumiste kaugema osa vaatamine. Samuti arvestame jaotusest juhuslikult valitud andmeid ja hindame jaotuse parameetreid, näiteks keskmist ja dispersiooni, võttes teatud tüüpi andmete keskmised (nt keskmise jaoks on see vaatluste aritmeetiline keskmine. Frequentistlik teooria seob tõenäosust hinnanguga, mida nimetatakse valimijaotuseks.

Sagedusteoorias suudame näidata selliste parameetrite jaoks nagu keskmine, mis võetakse valimite keskmisena, et hinnang läheneb tõelisele parameetrile. jaotust kasutatakse kirjeldamaks, kui lähedane on hinnang kindla valimi suuruse n parameetri parameetrile. Sule määratakse täpsusmõõduga (nt keskmine ruutviga).

Chris osutab mis tahes parameetri puhul, näiteks kuna keskmine osutab Bayesian sellele eelneva tõenäosusjaotuse. Seejärel kasutatakse andmeid, et parameetri tagumise jaotuse arvutamiseks kasutatakse Bayesi reeglit. Bayesi korral põhineb kogu järeldus parameetri kohta sellel tagumisel jaotusel.

Frequentists konstrueerib usaldusvahemikud, mis on parameetri usutavate väärtuste intervallid. Nende ülesehitus põhineb sagedasel tõenäosusel, et kui intervalli genereerimiseks kasutatud protsessi korratakse sõltumatute valimite jaoks mitu korda, oleks intervallide osakaal, mis tegelikult sisaldaks parameetri tõelist väärtust, vähemalt teatud etteantud usaldustaset (nt 95% ).

Bayeslased kasutavad parameetri jaoks a posteriori jaotust usaldusväärsete piirkondade koostamiseks. Need on lihtsalt parameetriruumi piirkonnad, millele tagumine jaotamine on integreeritud, et saada etteantud tõenäosus (nt 0,95). Bayeslased tõlgendavad usaldusväärseid piirkondi piirkondadena, millel on suur tõenäosus parameetri tegeliku väärtuse lisamiseks (nt. Etteantud 0.95).

** Bayeslased tõlgendavad usaldusväärseid piirkondi kui piirkondi, millel on suur tõenäosus lisada parameetri tegelik väärtus ** (nt etteantud 0,95). Kuidas on see võimalik, kui parameeter on juhuslik muutuja?
@Procrastinator Olgu, eelistaksite, et ma ütleksin lihtsalt, et see hõlmab parameetrite jaotuse suurt ettemääratud osa. Kuid kui X on juhuslik muutuja jaotusega f ja me konstrueerime selle jaoks usaldusväärse piirkonna, esindab piirkond tõenäosust, et juhusliku muutuja realiseerimine asub selles piirkonnas.
Nõustun selle selgitusega. Oluline on selgitada, et juhusliku muutuja realiseerimine ei ole parameetri tegelik väärtus.
@Procrastinator, see on huvitav punkt, mille te tõstatate. Kuid minu arusaam bayesi tõenäosusest on see, et paljud bayeslased nõustuvad klassikaliste statistikutega, et kõnealusel parameetril on üks tõeline väärtus (see on fikseeritud, kuid teadmata). Selle parameetri _ ebakindlus_ on jaotatud meie ebatäiusliku teadmiste tõttu. Nii et kui te selle üle mõtlete sel viisil, siis Michael Chernicki esialgne väide on õige, kas te ei arva?
@BYS2 Olen osaliselt nõus. Ühelt poolt tõlgendatakse juhuslikkust Bayesi paradigmas ebakindlusena. Teiselt poolt, kui tõlgendate usaldusväärsuse piirkonda komplektina, mis sisaldab teatud tõenäosusega parameetri tõelist väärtust, ei võta te arvesse priori mõju, mis võib olla mis tahes jaotus (või kas see kehtib mis tahes enne? Mis siis, kui kasutan Diraci delta?).
@Procrastinator Deltafunktsiooniga priori jaoks on tagumine sama deltafunktsioon ja andmetel pole sissevoolu. Kuid loomulikult ei kasutaks Bayesi praktiline statistika ülitugevaid andmeid, mis tohutult üle jõu käivad. Usaldusväärne piirkond on Bayesianuse aposteriori tõenäosus, et parameetri tegelik väärtus langeb intervalli (aktsepteerides Bayesi tõlgenduse mõistmist BYS2-ga). Mõiste aposteriori tõenäosustihedus mõistab, et see saadakse eelneva tiheduse korrutamise tõenäosuse ja normaliseerimise teel.
@MichaelChernick Ma arvan, et tõlgendatakse valesti, mida tähendab Bayesi usaldusväärsuse piirkond. Oletame, et parameetri tõeline väärtus on $ \ theta_0 = 1 $ ja valite vormi enne $ (1100) $. Seetõttu ei sisaldaks ükski usaldusväärsuse intervall parameetri tõelist väärtust, mis oleks vastuolus teie põhjendustega.
@user10525 Statistiline järeldus mitte-eksperimentaalsetel juhtudel on alati induktiivne ja keegi ei saa kunagi teatud tõde teada (nt sagedane ei oota lõpmatult).Bayesi statistikas näitab seda asjaolu, et tõenäosused on alati tinglikud.Nii et prior on tõesti $ p (\ theta | I) $, kusjuures $ I $ tähistab tausta eeldusi, teadmisi jne. Sellest sõltub ka iga tagumine.Seega aitab Bayesi tõenäosusarvutus olla ainult järjepidev induktiivselt arutades ja olemasolevat teavet ratsionaalselt kasutades, kuid see ei paku otseteed tõele.
James J Finn
2016-05-25 18:13:43 UTC
view on stackexchange narkive permalink

"Reaalses maailmas" vaadates leian ühe suurema erinevuse sagedase ja klassikalise või Bayesi "lahenduse" vahel, mis kehtib vähemalt kolme peamise stsenaariumi kohta. Metoodika valiku erinevus sõltub sellest, kas vajate lahendust, mida mõjutab populatsiooni tõenäosus, või seda, mida mõjutab individuaalne tõenäosus. Allpool olevad näited:

  1. Kui on teada 5-protsendiline tõenäosus, et üle 40-aastased mehed surevad antud aastal ja vajavad elukindlustusmakseid, saab kindlustusselts kasutada 5-protsendilist rahvastiku protsenti selle kulude hindamiseks, kuid öelda, et igal üle 40-aastasel isasel on suremise tõenäosus ainult 5% ... on mõttetu ... Kuna 5% -l on 100% tõenäosus surra - see on sagedane lähenemine. Üksikisiku tasandil sündmus kas toimub (100% tõenäosus) või ei juhtu (0% tõenäosus). Selle piiratud teabe põhjal ei ole aga võimalik ennustada isikuid, kellel on 100% tõenäosus surra, ja 5 % "keskmise" populatsiooni tõenäosus on indiviidi tasandil kasutu.

  2. Eeltoodud argument kehtib ühtviisi hästi ka hoonete tulekahjude puhul, mistõttu on kõikides elanikkonna hoonetes vaja sprinklereid .

    Elanike protsent on kasutu, seega tuleb kõiki süsteeme kaitsta.
Ma ei tunnusta sagedast lähenemist ühelgi neist kolmest juhtumist.Tundub, et need kõik sõltuvad retrospektiivsest - ja seetõttu kasutust - tõenäosuse mõistest, mida klassikalistes mudelites ei kasutata.Näiteks väide, et "sündmus kas toimub ... või seda ei juhtu", on triviaalselt tõene, kuid pole tõenäosustega seotud.
Aviel Roy-Shapira
2018-10-20 13:26:17 UTC
view on stackexchange narkive permalink

Tõlgenduse valik sõltub küsimusest.Kui soovite teada õnnemängu koefitsiente, lahendab teie probleem klassikaline tõlgendus, kuid statistilised andmed on kasutud, kuna õiglastel täringutel pole mälu.

Kui soovite ennustada tulevast sündmust varasemate kogemuste põhjal, on sagedane tõlgendus õige ja piisav.

Kui te ei tea, kas mõni varasem sündmus on toimunud, ja soovite hinnata selle tõenäosust, peate lähtuma oma varasematest tõekspidamistest ehk sellest, mida juba teate sündmuse toimumise võimaluse kohta, ja värskendama oma veendumustuute andmete hankimisel.

Kuna küsimus puudutab teatud määral veendumusi ja igal inimesel võib olla preestrite kohta erinev ettekujutus, on tõlgendus tingimata subjektiivne, ka Bayesian.



See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...