Lernen Entscheidungsbaum-Zusammenfassung

Schauen wir uns nun einige Besonderheiten des Entscheidungsbaums an.

Interpretierbarkeit.
Im Gegensatz zu den meisten Machine-Learning-Algorithmen sind Entscheidungsbäume leicht zu visualisieren und zu interpretieren;
Keine Datenvorbereitung erforderlich.
Der Entscheidungsbaum erfordert keine bis sehr wenig Datenvorbereitung. Es ist keine Skalierung/Normalisierung erforderlich. Er kann auch fehlende Werte verarbeiten und leidet nicht stark unter Ausreißern;
Bietet Feature-Wichtigkeiten.
Während des Trainings berechnet ein Entscheidungsbaum die Feature-Wichtigkeiten, die darstellen, wie einflussreich jedes Feature war, um den Baum zu bilden. Sie können die Feature-Wichtigkeiten mit dem Attribut .feature_importances_ abrufen;
Rechenkomplexität.
Angenommen, m ist die Anzahl der Merkmale und n ist die Anzahl der Trainingsinstanzen. Die Komplexität des Trainings eines Entscheidungsbaums ist O(n·m·log(m)), daher ist das Training ziemlich schnell, es sei denn, es gibt eine große Anzahl von Merkmalen. Auch die Komplexität der Vorhersage ist O(log(n)), daher sind die Vorhersagen schnell;
Nicht geeignet für große Datensätze.
Obwohl Entscheidungsbäume für kleine Datensätze gut funktionieren können, funktionieren sie normalerweise nicht gut für große Datensätze. Für große Datensätze ist die Verwendung von Random Forest vorzuziehen;
Entscheidungsbäume sind instabil.
Kleine Änderungen in den Hyperparametern oder den Daten können zu einem sehr unterschiedlichen Baum führen. Obwohl dies ein Nachteil für einen einzelnen Baum ist, wird es uns in einem Random Forest zugutekommen, wie Sie im nächsten Abschnitt sehen werden.

Und hier ist eine kleine Zusammenfassung:

Vorteile	Nachteile
Interpretierbar	Überanpassung
Schnelles Training	Instabil
Schnelle Vorhersagen	Nicht geeignet für große Datensätze
Keine Merkmalsskalierung erforderlich
Bietet Merkmalswichtigkeiten
Normalerweise robust gegenüber Ausreißern

War alles klar?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 5

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Fragen Sie mich Fragen zu diesem Thema

Zusammenfassen Sie dieses Kapitel

Zeige reale Beispiele

Awesome!

Completion rate improved to 3.57

Swipe um das Menü anzuzeigen

Schauen wir uns nun einige Besonderheiten des Entscheidungsbaums an.

Interpretierbarkeit.
Im Gegensatz zu den meisten Machine-Learning-Algorithmen sind Entscheidungsbäume leicht zu visualisieren und zu interpretieren;
Keine Datenvorbereitung erforderlich.
Der Entscheidungsbaum erfordert keine bis sehr wenig Datenvorbereitung. Es ist keine Skalierung/Normalisierung erforderlich. Er kann auch fehlende Werte verarbeiten und leidet nicht stark unter Ausreißern;
Bietet Feature-Wichtigkeiten.
Während des Trainings berechnet ein Entscheidungsbaum die Feature-Wichtigkeiten, die darstellen, wie einflussreich jedes Feature war, um den Baum zu bilden. Sie können die Feature-Wichtigkeiten mit dem Attribut .feature_importances_ abrufen;
Rechenkomplexität.
Angenommen, m ist die Anzahl der Merkmale und n ist die Anzahl der Trainingsinstanzen. Die Komplexität des Trainings eines Entscheidungsbaums ist O(n·m·log(m)), daher ist das Training ziemlich schnell, es sei denn, es gibt eine große Anzahl von Merkmalen. Auch die Komplexität der Vorhersage ist O(log(n)), daher sind die Vorhersagen schnell;
Nicht geeignet für große Datensätze.
Obwohl Entscheidungsbäume für kleine Datensätze gut funktionieren können, funktionieren sie normalerweise nicht gut für große Datensätze. Für große Datensätze ist die Verwendung von Random Forest vorzuziehen;
Entscheidungsbäume sind instabil.
Kleine Änderungen in den Hyperparametern oder den Daten können zu einem sehr unterschiedlichen Baum führen. Obwohl dies ein Nachteil für einen einzelnen Baum ist, wird es uns in einem Random Forest zugutekommen, wie Sie im nächsten Abschnitt sehen werden.

Und hier ist eine kleine Zusammenfassung:

Vorteile	Nachteile
Interpretierbar	Überanpassung
Schnelles Training	Instabil
Schnelle Vorhersagen	Nicht geeignet für große Datensätze
Keine Merkmalsskalierung erforderlich
Bietet Merkmalswichtigkeiten
Normalerweise robust gegenüber Ausreißern

War alles klar?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 5