Ma saan aru, et kui väärtused diagrammina koostame, saame kaksikpiike jälgides tuvastada bimodaalse jaotuse, kuid kuidas see programmiliselt leida? (Otsin algoritmi.)
Ma saan aru, et kui väärtused diagrammina koostame, saame kaksikpiike jälgides tuvastada bimodaalse jaotuse, kuid kuidas see programmiliselt leida? (Otsin algoritmi.)
Pideva levitamise režiimi tuvastamine nõuab andmete silumist või liimimist.
Binnimine on tavaliselt liiga prokreaalne: tulemused sõltuvad sageli prügikasti lõikepunktide paigutamise kohast.
Tuuma silumine (täpsemalt tuuma tiheduse hindamise kujul) on hea valik. Kuigi võimalikud on paljud tuuma kujundid, ei sõltu tulemus tavaliselt kujust palju. See sõltub tuuma ribalaiusest. Seega kasutavad inimesed kindlaksmääratud režiimide stabiilsuse kontrollimiseks kas adaptiivse tuuma siledust või viivad mitmesuguste fikseeritud ribalaiuste korral läbi tuuma silumise järjestuse. Ehkki adaptiivse või "optimaalse" sujuva kasutamise kasutamine on atraktiivne, pidage meeles, et enamik neist (kõik?) On mõeldud täpsuse ja keskmise täpsuse tasakaalu saavutamiseks: need ei ole mõeldud režiimide asukoha hindamise optimeerimiseks.
Mis puutub juurutamisse, siis tuuma sujuvamad kohad vahetavad ja skaleerivad etteantud funktsiooni andmetele vastavaks. Tingimusel, et see põhifunktsioon on diferentseeritav - Gaussians on hea valik, kuna saate neid eristada nii mitu korda kui soovite - siis peate sileduse tuletise saamiseks selle asendama ainult tuletisega. Siis on lihtsalt kriitiliste punktide avastamiseks ja testimiseks vaja kasutada standardset nullide leidmise protseduuri. ( Brenti meetod töötab hästi.) Muidugi võite sama tuletisega teha sama tuletise, et saada kiire test, kas mõni kriitiline punkt on kohalik maksimum - see tähendab režiim.
Selle teemaga tegeleb Silvermani tuntud paber. Selles kasutatakse tuuma tiheduse hindamist. Vt
B. W. Silverman, Kerneli tiheduse hinnangute kasutamine multimodaalsuse uurimiseks, J. Kuninglik stat. Soc. B , kd 43, nr. 1, 1981, lk 97–99.
Pange tähele, et paberi tabelites on mõned vead. See on alles lähtepunkt, kuid päris hea. See pakub hästi määratletud algoritmi kasutamiseks juhul, kui just seda kõige rohkem otsite. Võite vaadata Google Scholarist pabereid, mis viitavad sellele "kaasaegsemate" lähenemiste jaoks.
Tulin peole hilja, kuid kui teid huvitab lihtsalt see, kas see on multimodaalne või mitte, st režiimide arv ei huvita teid, peaksite vaatama lehte diptest.
Rakenduses R
nimetatakse paketti diptest
.
Vikis olev definitsioon on minu jaoks veidi segane. Ainult ühe režiimi pideva andmekogumi tõenäosus on null. Lihtne viis bimodaalse distrubitoni programmeerimiseks on kaks eraldatud normaaljaotust, mis on koondatud erinevalt. See loob kaks tippu või seda, mida wiki nimetab režiimideks. Tegelikult saate kasutada peaaegu kõiki kahte jaotust, kuid üks raskemaid statistilisi võimalusi on leida, kuidas andmekogum pärast kahe juhusliku andmejaotuse ühendamist moodustati.