Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Implementering af et Beslutningstræ | Sektion
Supervised Learning Essentials

bookUdfordring: Implementering af et Beslutningstræ

I denne udfordring skal du bruge Titanic-datasættet, som indeholder information om passagerer på Titanic, herunder deres alder, køn, familiestørrelse og mere. Målet er at forudsige, om en passager overlevede eller ej.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
copy

For at implementere Decision Tree kan du bruge DecisionTreeClassifier fra sklearn:

Konstruktør:

  • DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)
  • max_depth — maksimal trædybde. Standardværdi er None;
  • min_samples_leaf — minimum antal instanser i et bladnode. Standardværdi er 1;

Metoder:

  • fit(X, y) — Tilpas træningssættet;
  • predict(X) — Forudsig klassen for X;
  • score(X, y) — Returnerer nøjagtigheden for X, y-sættet;

Attributter:

  • feature_importances_ — Feature-vigtigheder;
  • feature_names_in_ — Feature-navne set under .fit().

Opgaven er at opbygge et Decision Tree og finde den optimale max_depth og min_samples_leaf ved hjælp af grid search.

Opgave

Swipe to start coding

Du får et Titanic-datasæt, som er gemt som en DataFrame i variablen df.

  • Initialiser en Decision Tree-model og gem den i variablen decision_tree.
  • Opret en ordbog til GridSearchCV for at iterere gennem værdierne [1, 2, 3, 4, 5, 6, 7] for max_depth og [1, 2, 4, 6] for min_samples_leaf, og gem den i variablen param_grid.
  • Initialiser og træn et GridSearchCV-objekt, sæt antallet af fold til 10, og gem den trænede model i variablen grid_cv.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 30
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

bookUdfordring: Implementering af et Beslutningstræ

Stryg for at vise menuen

I denne udfordring skal du bruge Titanic-datasættet, som indeholder information om passagerer på Titanic, herunder deres alder, køn, familiestørrelse og mere. Målet er at forudsige, om en passager overlevede eller ej.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
copy

For at implementere Decision Tree kan du bruge DecisionTreeClassifier fra sklearn:

Konstruktør:

  • DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)
  • max_depth — maksimal trædybde. Standardværdi er None;
  • min_samples_leaf — minimum antal instanser i et bladnode. Standardværdi er 1;

Metoder:

  • fit(X, y) — Tilpas træningssættet;
  • predict(X) — Forudsig klassen for X;
  • score(X, y) — Returnerer nøjagtigheden for X, y-sættet;

Attributter:

  • feature_importances_ — Feature-vigtigheder;
  • feature_names_in_ — Feature-navne set under .fit().

Opgaven er at opbygge et Decision Tree og finde den optimale max_depth og min_samples_leaf ved hjælp af grid search.

Opgave

Swipe to start coding

Du får et Titanic-datasæt, som er gemt som en DataFrame i variablen df.

  • Initialiser en Decision Tree-model og gem den i variablen decision_tree.
  • Opret en ordbog til GridSearchCV for at iterere gennem værdierne [1, 2, 3, 4, 5, 6, 7] for max_depth og [1, 2, 4, 6] for min_samples_leaf, og gem den i variablen param_grid.
  • Initialiser og træn et GridSearchCV-objekt, sæt antallet af fold til 10, og gem den trænede model i variablen grid_cv.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 30
single

single

some-alt