Udfordring: Implementering af et Beslutningstræ
I denne udfordring skal du bruge Titanic-datasættet, som indeholder information om passagerer på Titanic, herunder deres alder, køn, familiestørrelse og mere. Målet er at forudsige, om en passager overlevede eller ej.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For at implementere Decision Tree kan du bruge DecisionTreeClassifier fra sklearn:
Din opgave er at opbygge et Decision Tree og finde den bedste max_depth og min_samples_leaf ved hjælp af grid search.
Swipe to start coding
Du får et Titanic-datasæt, som er gemt som en DataFrame i variablen df.
- Initialiser en Decision Tree-model og gem den i variablen
decision_tree. - Opret en ordbog til
GridSearchCVfor at iterere gennem værdierne[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og gem den i variablenparam_grid. - Initialiser og træn et
GridSearchCV-objekt, sæt antallet af fold til10, og gem den trænede model i variablengrid_cv.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
How do I build a Decision Tree with this dataset?
Can you explain how to use grid search to find the best parameters?
What do max_depth and min_samples_leaf mean in a Decision Tree?
Awesome!
Completion rate improved to 4.17
Udfordring: Implementering af et Beslutningstræ
Stryg for at vise menuen
I denne udfordring skal du bruge Titanic-datasættet, som indeholder information om passagerer på Titanic, herunder deres alder, køn, familiestørrelse og mere. Målet er at forudsige, om en passager overlevede eller ej.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For at implementere Decision Tree kan du bruge DecisionTreeClassifier fra sklearn:
Din opgave er at opbygge et Decision Tree og finde den bedste max_depth og min_samples_leaf ved hjælp af grid search.
Swipe to start coding
Du får et Titanic-datasæt, som er gemt som en DataFrame i variablen df.
- Initialiser en Decision Tree-model og gem den i variablen
decision_tree. - Opret en ordbog til
GridSearchCVfor at iterere gennem værdierne[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og gem den i variablenparam_grid. - Initialiser og træn et
GridSearchCV-objekt, sæt antallet af fold til10, og gem den trænede model i variablengrid_cv.
Løsning
Tak for dine kommentarer!
single