Haaste: Päätöspuun Toteuttaminen
Tässä haasteessa käytät Titanic-aineistoa, joka sisältää tietoja Titanicin matkustajista, kuten iästä, sukupuolesta, perhekoon ja muista tekijöistä. Tavoitteena on ennustaa, selvisikö matkustaja hengissä vai ei.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Päätöspuun toteuttamiseen voit käyttää DecisionTreeClassifier-luokkaa kirjastosta sklearn:
Konstruktori:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— puun suurin sallittu syvyys. Oletusarvo on None;min_samples_leaf— pienin sallittu havaintojen määrä lehtisolmussa. Oletusarvo on 1;
Menetelmät:
fit(X, y)— Sovittaa mallin opetusaineistoon;predict(X)— Ennustaa luokan X:lle;score(X, y)— Palauttaa tarkkuuden X, y -aineistolle;
Attribuutit:
feature_importances_— Ominaisuuksien tärkeysarvot;feature_names_in_— Ominaisuuksien nimet, jotka havaittu .fit()-menetelmässä.
Tehtävänäsi on rakentaa päätöspuu ja löytää paras max_depth ja min_samples_leaf käyttämällä ruutuhakua.
Swipe to start coding
Sinulle on annettu Titanic-aineisto, joka on tallennettu DataFrame-muodossa muuttujaan df.
- Alusta Decision Tree -malli ja tallenna se muuttujaan
decision_tree. - Luo sanakirja
GridSearchCV:lle, jossa[1, 2, 3, 4, 5, 6, 7]saa arvotmax_depthja[1, 2, 4, 6]arvotmin_samples_leaf, ja tallenna se muuttujaanparam_grid. - Alusta ja kouluta
GridSearchCV-olio, aseta poimintojen määräksi10, ja tallenna koulutettu malli muuttujaangrid_cv.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 3.33
Haaste: Päätöspuun Toteuttaminen
Pyyhkäise näyttääksesi valikon
Tässä haasteessa käytät Titanic-aineistoa, joka sisältää tietoja Titanicin matkustajista, kuten iästä, sukupuolesta, perhekoon ja muista tekijöistä. Tavoitteena on ennustaa, selvisikö matkustaja hengissä vai ei.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Päätöspuun toteuttamiseen voit käyttää DecisionTreeClassifier-luokkaa kirjastosta sklearn:
Konstruktori:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— puun suurin sallittu syvyys. Oletusarvo on None;min_samples_leaf— pienin sallittu havaintojen määrä lehtisolmussa. Oletusarvo on 1;
Menetelmät:
fit(X, y)— Sovittaa mallin opetusaineistoon;predict(X)— Ennustaa luokan X:lle;score(X, y)— Palauttaa tarkkuuden X, y -aineistolle;
Attribuutit:
feature_importances_— Ominaisuuksien tärkeysarvot;feature_names_in_— Ominaisuuksien nimet, jotka havaittu .fit()-menetelmässä.
Tehtävänäsi on rakentaa päätöspuu ja löytää paras max_depth ja min_samples_leaf käyttämällä ruutuhakua.
Swipe to start coding
Sinulle on annettu Titanic-aineisto, joka on tallennettu DataFrame-muodossa muuttujaan df.
- Alusta Decision Tree -malli ja tallenna se muuttujaan
decision_tree. - Luo sanakirja
GridSearchCV:lle, jossa[1, 2, 3, 4, 5, 6, 7]saa arvotmax_depthja[1, 2, 4, 6]arvotmin_samples_leaf, ja tallenna se muuttujaanparam_grid. - Alusta ja kouluta
GridSearchCV-olio, aseta poimintojen määräksi10, ja tallenna koulutettu malli muuttujaangrid_cv.
Ratkaisu
Kiitos palautteestasi!
single