Utfordring: Implementering av et Beslutningstre
I denne utfordringen skal du bruke Titanic-datasettet, som inneholder informasjon om passasjerene på Titanic, inkludert alder, kjønn, familiestørrelse og mer. Målet er å forutsi om en passasjer overlevde eller ikke.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For å implementere beslutningstreet kan du bruke DecisionTreeClassifier
fra sklearn
:
Oppgaven er å bygge et beslutningstre og finne den beste max_depth
og min_samples_leaf
ved hjelp av grid search.
Swipe to start coding
Du har fått utdelt et Titanic-datasett lagret som en DataFrame
i variabelen df
.
- Initialiser en Decision Tree-modell og lagre den i variabelen
decision_tree
. - Opprett en ordbok for
GridSearchCV
som itererer gjennom verdiene[1, 2, 3, 4, 5, 6, 7]
formax_depth
og[1, 2, 4, 6]
formin_samples_leaf
, og lagre den i variabelenparam_grid
. - Initialiser og tren et
GridSearchCV
-objekt, sett antall fold til10
, og lagre den trente modellen i variabelengrid_cv
.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
How do I build a Decision Tree with this dataset?
Can you explain how to use grid search to find the best parameters?
What do max_depth and min_samples_leaf mean in a Decision Tree?
Awesome!
Completion rate improved to 4.17
Utfordring: Implementering av et Beslutningstre
Sveip for å vise menyen
I denne utfordringen skal du bruke Titanic-datasettet, som inneholder informasjon om passasjerene på Titanic, inkludert alder, kjønn, familiestørrelse og mer. Målet er å forutsi om en passasjer overlevde eller ikke.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For å implementere beslutningstreet kan du bruke DecisionTreeClassifier
fra sklearn
:
Oppgaven er å bygge et beslutningstre og finne den beste max_depth
og min_samples_leaf
ved hjelp av grid search.
Swipe to start coding
Du har fått utdelt et Titanic-datasett lagret som en DataFrame
i variabelen df
.
- Initialiser en Decision Tree-modell og lagre den i variabelen
decision_tree
. - Opprett en ordbok for
GridSearchCV
som itererer gjennom verdiene[1, 2, 3, 4, 5, 6, 7]
formax_depth
og[1, 2, 4, 6]
formin_samples_leaf
, og lagre den i variabelenparam_grid
. - Initialiser og tren et
GridSearchCV
-objekt, sett antall fold til10
, og lagre den trente modellen i variabelengrid_cv
.
Løsning
Takk for tilbakemeldingene dine!
single