Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Implementierung eines Entscheidungsbaums | Abschnitt
Practice
Projects
Quizzes & Challenges
Quizze
Challenges
/
Grundlagen des Überwachten Lernens

bookHerausforderung: Implementierung eines Entscheidungsbaums

In dieser Aufgabe wird das Titanic-Datenset verwendet, das Informationen über Passagiere der Titanic enthält, darunter Alter, Geschlecht, Familiengröße und mehr. Ziel ist es, vorherzusagen, ob ein Passagier überlebt hat oder nicht.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
copy

Für die Implementierung des Entscheidungsbaums kann der DecisionTreeClassifier aus sklearn verwendet werden:

Konstruktor:

  • DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)
  • max_depth — maximale Tiefe des Baums. Standardwert ist None;
  • min_samples_leaf — minimale Anzahl von Instanzen in einem Blattknoten. Standardwert ist 1;

Methoden:

  • fit(X, y) — Trainingsdatensatz anpassen;
  • predict(X) — Klasse für X vorhersagen;
  • score(X, y) — Gibt die Genauigkeit für das X, y-Set zurück;

Attribute:

  • feature_importances_ — Merkmalswichtigkeiten;
  • feature_names_in_ — Merkmalsnamen, die während .fit() gesehen wurden.

Die Aufgabe besteht darin, einen Entscheidungsbaum zu erstellen und mittels Grid Search die optimalen Werte für max_depth und min_samples_leaf zu bestimmen.

Aufgabe

Swipe to start coding

Sie erhalten einen Titanic-Datensatz, der als DataFrame in der Variablen df gespeichert ist.

  • Initialisierung eines Decision-Tree-Modells und Speicherung in der Variablen decision_tree.
  • Erstellung eines Wörterbuchs für GridSearchCV, um die Werte [1, 2, 3, 4, 5, 6, 7] für max_depth und [1, 2, 4, 6] für min_samples_leaf zu durchlaufen, und Speicherung in der Variablen param_grid.
  • Initialisierung und Training eines GridSearchCV-Objekts, Festlegung der Anzahl der Folds auf 10 und Speicherung des trainierten Modells in der Variablen grid_cv.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 30
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookHerausforderung: Implementierung eines Entscheidungsbaums

Swipe um das Menü anzuzeigen

In dieser Aufgabe wird das Titanic-Datenset verwendet, das Informationen über Passagiere der Titanic enthält, darunter Alter, Geschlecht, Familiengröße und mehr. Ziel ist es, vorherzusagen, ob ein Passagier überlebt hat oder nicht.

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
copy

Für die Implementierung des Entscheidungsbaums kann der DecisionTreeClassifier aus sklearn verwendet werden:

Konstruktor:

  • DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)
  • max_depth — maximale Tiefe des Baums. Standardwert ist None;
  • min_samples_leaf — minimale Anzahl von Instanzen in einem Blattknoten. Standardwert ist 1;

Methoden:

  • fit(X, y) — Trainingsdatensatz anpassen;
  • predict(X) — Klasse für X vorhersagen;
  • score(X, y) — Gibt die Genauigkeit für das X, y-Set zurück;

Attribute:

  • feature_importances_ — Merkmalswichtigkeiten;
  • feature_names_in_ — Merkmalsnamen, die während .fit() gesehen wurden.

Die Aufgabe besteht darin, einen Entscheidungsbaum zu erstellen und mittels Grid Search die optimalen Werte für max_depth und min_samples_leaf zu bestimmen.

Aufgabe

Swipe to start coding

Sie erhalten einen Titanic-Datensatz, der als DataFrame in der Variablen df gespeichert ist.

  • Initialisierung eines Decision-Tree-Modells und Speicherung in der Variablen decision_tree.
  • Erstellung eines Wörterbuchs für GridSearchCV, um die Werte [1, 2, 3, 4, 5, 6, 7] für max_depth und [1, 2, 4, 6] für min_samples_leaf zu durchlaufen, und Speicherung in der Variablen param_grid.
  • Initialisierung und Training eines GridSearchCV-Objekts, Festlegung der Anzahl der Folds auf 10 und Speicherung des trainierten Modells in der Variablen grid_cv.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 30
single

single

some-alt