Seda tüüpi küsimuste nõuded tunduvad mulle pisut veiderdavad. Siin on matemaatiline mõiste / valem, kuid siiski tahan sellest rääkida mõnes kontekstis, kus pole täielikult matemaatilisi sümboleid. Ma arvan ka, et tuleks öelda, et valemite mõistmiseks vajalikku tegelikku algebrat tuleks minu arvates õpetada enamusele üksikisikutest enne kõrgharidust (maatriksalgebra mõistmine pole vajalik, piisab lihtsalt lihtsast algebrast).
Niisiis, selle asemel, et valemit täielikult ignoreerida ja sellest rääkida mingites maagilistes ja heuristilistes analoogiatüüpides, laseb lihtsalt vaadata valemit ja proovida üksikuid komponente väikeste sammudega selgitada. Kovariantsuse ja korrelatsiooni erinevus valemite vaatlemisel peaks selguma. Analoogiate ja heuristikaga rääkides kahtlustan, et see segaks kaht suhteliselt lihtsat mõistet ja nende erinevusi paljudes olukordades.
Alustame siis valemiga kovariantsi näidis (need olen just võtnud ja kasutanud vikipeedias);
$ \ frac {1} {n-1} \ sum_ {i = 1} ^ {n} (x_i- \ bar {x}) (y_i- \ bar {y}) $
Kõigi kiiremaks muutmiseks laske määratlege selgesõnaliselt kõik valemi elemendid ja toimingud.
- $ x_i $ ja $ y_i $ on mõlemad sama vaatluse kahe eraldi atribuudi mõõtmised
- $ \ bar { x} $ ja $ \ bar {y} $ on iga atribuudi keskmine (või keskmine).
- $ \ frac {1} {n-1} $ puhul saab öelda, et see tähendab, et jagame lõpptulemus $ {n-1} $ võrra.
- $ \ sum_ {i = 1} ^ {n} $ võib olla mõne jaoks võõras sümbol, seega oleks tõenäoliselt kasulik seda toimingut selgitada. See on lihtsalt kõigi $ i $ eraldi vaatluste summa ja $ n $ tähistab vaatluste koguarvu.
Siinkohal tooksin sisse lihtsa näite, et nii-öelda elementidele ja toimingutele nägu panna. Näiteks laseb lihtsalt koostada tabeli, kus iga rida vastab vaatlusele (ja $ x $ ja $ y $ on asjakohaselt märgistatud). Tõenäoliselt muudaks need näited konkreetsemaks (nt öelge, et $ x $ tähistab vanust ja $ y $ tähistab kaalu), kuid meie siinse arutelu jaoks ei tohiks see oluline olla.
x y --- 2 54 89 35 60 8
Kui tunnete, et valemi summaarset toimingut ei pruugi veel täielikult mõista, saate selle uuesti märksa lihtsamas kontekstis sisse viia. Öelge lihtsalt, et $ \ sum_ {i = 1} ^ {n} (x_i) $ on sama mis selles näites öeldud;
x - 2 4 9 5+ 0 - 20
Nüüd tuleks see segadus klaarida ja saame liikuda valemi teise osa, $ (x_i- \ bar {x}) (y_i- \ bar { y}) $. Eeldades, et inimesed juba teavad, mida see tähendab, $ \ bar {x} $ ja $ \ bar {y} $ tähistavad, ja ma ütleksin, et olles silmakirjalik omaenda postituse varasemate kommentaaride suhtes, võib lihtsalt viidata keskmine lihtsa heuristika mõttes (nt jaotuse keskosa). Seejärel saab selle protsessi lihtsalt ühe toimingu kaupa teha. Lausel $ (x_i- \ bar {x}) $ uuritakse lihtsalt iga vaatluse vahelisi kõrvalekaldeid / kaugust ning kõigi selle konkreetse atribuudi kõigi vaatluste keskmist. Seega, kui vaatlus on keskmisest kaugemal, antakse sellele toimingule suurem väärtus. Seejärel võib viidata toodud tabelile ja lihtsalt näidata toimingut vaatluste vektoril $ x $.
x x_bar (x - x_bar) 2 4 -24 4 09 4 55 4 10 4 -4
Operatsioon on vektoriga $ y $ sama, kuid lihtsalt tugevdamiseks võite ka selle toimingu esitada.
y y_bar (y - y_bar) 5 6 -18 6 23 6 -36 6 08 6 2
Nüüd ei tohiks terminid $ (x_i- \ bar {x}) $ ja $ (y_i- \ bar {y}) $ olla mitmetähenduslikud ning võime minna järgmise toimingu juurde, korrutades need tulemused kokku $ (x_i- \ bar {x}) \ cdot (y_i- \ bar {y}) $. Nagu gung kommentaarides välja toonud, nimetatakse seda sageli ristproduktiks (võib-olla kasulik näide selle kohta, kui statistikat tutvustada põhimaatriksalgebrat).
Pange tähele, mis juhtub korrutamisel, kui kaks vaatlust on mõlemad keskmisest suure vahemaa kaugusel, on saadud vaatlusel veelgi suurem positiivne väärtus (sama kehtib ka siis, kui mõlemad vaatlused jäävad keskmisest suurele kaugusele, kuna kahe negatiivi korrutamine võrdub positiivsega). Pange tähele ka seda, et kui üks tähelepanek on keskmisest kõrgemal ja teine keskmisest kõvasti madalam, on saadud väärtus suur (absoluutarvudes) ja negatiivne (kui positiivne kord on negatiivne võrdne negatiivse arvuga). Lõpuks pange tähele, et kui väärtus on kummagi vaatluse keskmise lähedal, annab kahe väärtuse korrutamine väikese arvu. Jällegi saame selle toimingu lihtsalt tabelis esitada.
(x - x_bar) (y - y_bar) (x - x_bar) * (y - y_bar) -2 -1 2 0 2 0 5 -3 -15 1 0 0-4 2 -8
Kui ruumis on statistikuid, peaksid nad selles hetkes ootusärevusega keema. Näeme, kuidas mängu tulevad kõik eraldiseisvad elemendid, mis on kovariantsus ja kuidas see arvutatakse. Nüüd peame vaid kokku võtma eelmise tabeli lõpptulemuse, jagama $ n-1 $ ja voila ga, kovariantsus ei tohiks enam olla müstiline (kõik koos ainult ühe kreeka sümboli määratlemisega) .
(x - x_bar) * (y - y_bar) ----------------------- 2 0-15 0 + -8 ----- -21-21 / (5-1) = -5.25
Siinkohal võiksite tugevdada seda, kust 5 pärineb, kuid see peaks olema nii lihtne, kui viidata tagasi tabelile ja lugeda vaatluste arv (jätab valimi ja populatsiooni vahe taas teisele ajale) .
Nüüd ei ütle kovariantsus iseenesest meile kuigi palju (võib küll, kuid siinkohal on mõttetu käsitleda huvitavaid näiteid, ilma et kasutataks maagiliselt määratlemata viiteid publikule). Hea stsenaariumi korral ei pea te tegelikult müüma, miks me peaksime hoolima sellest, milline on kovariantsus, muudel asjaoludel peate võib-olla lihtsalt lootma, et teie publik on vangistatud ja võtate selle eest sõna. Kuid jätkates kovariantsuse ja korrelatsiooni erinevuse väljatöötamist, võime lihtsalt viidata korrelatsioonivalemile. Kreeka sümbolfoobia vältimiseks öelge lihtsalt korrelatsiooni tähistamiseks tavaline sümbol $ \ rho $.
$ \ rho = \ frac {Cov (x, y)} {\ sqrt {Var (x) Var (y)}} $
Kordamiseks on jällegi, et eelmises valemis olev lugeja on lihtsalt kovariants, nagu me just määratlesime, ja nimetaja on ruutjuur toote variatsioon iga üksiku sarja kohta. Kui peate ise dispersiooni määratlema, võiksite lihtsalt öelda, et dispersioon on sama asi kui seeria kovariantsus iseendaga (st $ Cov (x, x) = Var (x) $). Ja kehtivad kõik samad mõisted, mille kovariantsusega tutvustasite (st kui seerial on palju väärtusi keskmisest kaugel, on sellel suur dispersioon). Võib-olla märkige siin, et seerial ei saa olla ka negatiivset dispersiooni (mis peaks loogiliselt tulenema varem esitatud matemaatikast).
Nii et ainsad uued komponendid, mille oleme kasutusele võtnud, on nimega $ Var (x) Var (y) $. Niisiis jagame äsja arvutatud kovariantsuse iga seeria dispersioonide korrutisega. Võib käsitleda seda, miks jagamine $ \ sqrt {Var (x) Var (y)} $ -ga annab alati väärtuse vahemikus -1 kuni 1, kuid kahtlustan, et Cauchy – Schwarzi ebavõrdsus tuleks jätta selle arutelu päevakord. Nii et jällegi olen silmakirjalik ja kasutan mõnda, võtan sõna , kuid siinkohal võime tutvustada kõiki põhjuseid, miks me korrelatsioonikordajat kasutame. Seejärel võib need matemaatikatunnid seostada heuristikaga, mis on antud teistes väidetes, näiteks Peter Flomi vastus ühele teisele küsimusele. Kuigi seda kritiseeriti mõiste juurutamiseks põhjuslike väidete osas, peaks ka see õppetükk mingil hetkel päevakorda võtma.
Mõistan, et teatud tingimustel ei oleks selline ravitase asjakohane. Senat vajab kokkuvõtet . Sel juhul võite viidata lihtsatele heuristikatele, mida inimesed on teistes näidetes kasutanud, kuid Roomat ei ehitatud ühe päevaga. Ja senatile, kes soovib kokkuvõtet, kui teil on nii vähe aega, peaksite võib-olla lihtsalt minu sõna võtma ja loobuma analoogiate ja kuulipunktide formaalsustest.