Utfordring: Implementering av et Beslutningstre
I denne utfordringen skal du bruke Titanic-datasettet, som inneholder informasjon om passasjerene på Titanic, inkludert alder, kjønn, familiestørrelse og mer. Målet er å forutsi om en passasjer overlevde eller ikke.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For å implementere beslutningstreet kan du bruke DecisionTreeClassifier fra sklearn:
Oppgaven er å bygge et beslutningstre og finne den beste max_depth og min_samples_leaf ved hjelp av grid search.
Swipe to start coding
Du har fått utdelt et Titanic-datasett lagret som en DataFrame i variabelen df.
- Initialiser en Decision Tree-modell og lagre den i variabelen
decision_tree. - Opprett en ordbok for
GridSearchCVsom itererer gjennom verdiene[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og lagre den i variabelenparam_grid. - Initialiser og tren et
GridSearchCV-objekt, sett antall fold til10, og lagre den trente modellen i variabelengrid_cv.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 4.17
Utfordring: Implementering av et Beslutningstre
Sveip for å vise menyen
I denne utfordringen skal du bruke Titanic-datasettet, som inneholder informasjon om passasjerene på Titanic, inkludert alder, kjønn, familiestørrelse og mer. Målet er å forutsi om en passasjer overlevde eller ikke.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For å implementere beslutningstreet kan du bruke DecisionTreeClassifier fra sklearn:
Oppgaven er å bygge et beslutningstre og finne den beste max_depth og min_samples_leaf ved hjelp av grid search.
Swipe to start coding
Du har fått utdelt et Titanic-datasett lagret som en DataFrame i variabelen df.
- Initialiser en Decision Tree-modell og lagre den i variabelen
decision_tree. - Opprett en ordbok for
GridSearchCVsom itererer gjennom verdiene[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og lagre den i variabelenparam_grid. - Initialiser og tren et
GridSearchCV-objekt, sett antall fold til10, og lagre den trente modellen i variabelengrid_cv.
Løsning
Takk for tilbakemeldingene dine!
single