Küsimus:
Kas saab CARETis parameetrite häälestamise (ruudustiku) funktsiooni keelata?
Ram Ahluwalia
2012-02-28 01:40:51 UTC
view on stackexchange narkive permalink

CARET kasutab enne lõpliku mudeli valimist ja lõpliku mudeli täielike treeningandmete põhjal koolitamiseks automaatselt eelnevalt määratud häälestusvõrku erinevate mudelite ehitamiseks. Ma saan oma häälestusvõrku varustada ainult ühe parameetrite kombinatsiooniga. Kuid isegi sel juhul valib CARET häälestusparameetrite hulgast parima mudeli (ehkki sel juhul on ainult üks) ja sobitab seejärel lõpliku mudeli kõigi treeningandmete hulka. See on lisasamm, mida tahaksin vältida.

Kuidas lihtsalt mudeliotsingu samm üle tuunimisruudustiku variatsioonide vahele jätta ja sundida CARET-i üles ehitama kõikidele treeninguandmetele (välja arvatud aluseks olevale helistamine) otse teegimudel)?

Küsimus on üsna ebaselge, mis ilmselt seletab, miks olete saanud vastuseid erinevatele küsimustele, nimelt 1) Kuidas öelda caretile, et jätaks mudeli valideerimise ja häälestamise vahele?ja 2) Kuidas saab välja lülitada ainult mudeli häälestamise?
Kolm vastused:
Peyton
2014-05-01 05:00:07 UTC
view on stackexchange narkive permalink

Saate method = "none" määrata trainControl -is. Näiteks:

  train (Liik ~., Data = iiris, method = "rf", tuneGrid = data.frame (mtry = 3), trControl = trainControl (method = "none") )  

Ma pole kindel, millal see rakendati.

Brent
2012-07-12 02:52:19 UTC
view on stackexchange narkive permalink

Parim viis oleks selgesõnaliselt edastada tuneGrid'i andmekaader. Näiteks juhuslikul metsal on ainult üks häälestusparameeter 'mtry', mis kontrollib iga puu jaoks valitud funktsioonide arvu.

Mtry määramiseks kindla väärtusega võite valida vaikimisi randomForest (? RandomForest ) tehke seda:

  mudel <- train (x = X, y = Y, method = 'rf', tuneGrid = data.frame (.mtry = M))  

kus M on kasutatava häälestusparameetri üks väärtus.

mitme häälestuse parameetri jaoks tehke seda:

  tuneGrid = data.frame (.par1 = P1, .par2 = P2, .par3 = P3)  
Tere tulemast meie saidile, Brent! Täname, et järgisite seda vana küsimust.
Parem lahendus on allpool toodud meetod = "none" ".
Yevgeny
2012-03-07 03:58:00 UTC
view on stackexchange narkive permalink

Ma arvan, et see pole võimalik (vähemalt polnud see mõne versiooni tagant võimalik). Jõudlusele avalduvat mõju saab vähendada, seadistades treeningandmetesse vaid ühe resampling partitsiooni (kuid caret treeniks ikkagi mudelit kaks korda).

See kõlab kui kasulik funktsioon, nii et pingutaksin pakett.

Vabandust, see vastus on nüüd vananenud


See küsimus ja vastus tõlgiti automaatselt inglise keelest.Algne sisu on saadaval stackexchange-is, mida täname cc by-sa 3.0-litsentsi eest, mille all seda levitatakse.
Loading...