Was ist Klassifikation
Klassifikation ist eine Aufgabe des überwachten Lernens, bei der das Ziel darin besteht, die Klasse einer Instanz anhand ihrer Merkmale vorherzusagen. Das Modell lernt aus gelabelten Beispielen in einem Trainingsdatensatz und ordnet anschließend neue, unbekannte Daten einer Klasse zu.
Regression sagt einen kontinuierlichen numerischen Wert voraus (z. B. Preis), der viele mögliche Werte annehmen kann. Klassifikation sagt einen kategorischen Wert voraus (z. B. Süßigkeitstyp) und wählt eine Option aus einer begrenzten Anzahl von Klassen aus.
Es gibt verschiedene Arten der Klassifikation:
- Binäre Klassifikation: Das Ziel hat zwei mögliche Ausprägungen (Spam/Nicht-Spam, Keks/Nicht-Keks);
- Mehrklassenklassifikation: Drei oder mehr mögliche Kategorien (Spam/Wichtig/Werbung/Andere; Keks/Marshmallow/Bonbon);
- Mehrlabel-Klassifikation: Eine Instanz kann mehreren Klassen gleichzeitig zugeordnet werden (ein Film kann Action und Komödie sein; eine E-Mail kann wichtig und arbeitsbezogen sein).
Für die meisten ML-Modelle muss das Ziel in eine Zahl kodiert werden. Bei der binären Klassifikation werden die Ausgänge üblicherweise als 0/1 kodiert (z. B. 1 - Keks, 0 - kein Keks). Bei einer Mehrklassen-Klassifikation werden die Ausgänge üblicherweise als 0, 1, 2, ... kodiert (z. B. 0 - Bonbon, 1 - Keks, 2 - Marshmallow).
Viele verschiedene Modelle können Klassifikationsaufgaben durchführen. Einige Beispiele sind:
- k-Nearest Neighbors;
- Logistische Regression;
- Entscheidungsbaum;
- Random Forest.
Glücklicherweise sind sie alle in der scikit-learn-Bibliothek implementiert und einfach zu verwenden.
Kein Machine-Learning-Modell ist einem anderen grundsätzlich überlegen. Welches Modell am besten abschneidet, hängt von der jeweiligen Aufgabe ab.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 3.33
Was ist Klassifikation
Swipe um das Menü anzuzeigen
Klassifikation ist eine Aufgabe des überwachten Lernens, bei der das Ziel darin besteht, die Klasse einer Instanz anhand ihrer Merkmale vorherzusagen. Das Modell lernt aus gelabelten Beispielen in einem Trainingsdatensatz und ordnet anschließend neue, unbekannte Daten einer Klasse zu.
Regression sagt einen kontinuierlichen numerischen Wert voraus (z. B. Preis), der viele mögliche Werte annehmen kann. Klassifikation sagt einen kategorischen Wert voraus (z. B. Süßigkeitstyp) und wählt eine Option aus einer begrenzten Anzahl von Klassen aus.
Es gibt verschiedene Arten der Klassifikation:
- Binäre Klassifikation: Das Ziel hat zwei mögliche Ausprägungen (Spam/Nicht-Spam, Keks/Nicht-Keks);
- Mehrklassenklassifikation: Drei oder mehr mögliche Kategorien (Spam/Wichtig/Werbung/Andere; Keks/Marshmallow/Bonbon);
- Mehrlabel-Klassifikation: Eine Instanz kann mehreren Klassen gleichzeitig zugeordnet werden (ein Film kann Action und Komödie sein; eine E-Mail kann wichtig und arbeitsbezogen sein).
Für die meisten ML-Modelle muss das Ziel in eine Zahl kodiert werden. Bei der binären Klassifikation werden die Ausgänge üblicherweise als 0/1 kodiert (z. B. 1 - Keks, 0 - kein Keks). Bei einer Mehrklassen-Klassifikation werden die Ausgänge üblicherweise als 0, 1, 2, ... kodiert (z. B. 0 - Bonbon, 1 - Keks, 2 - Marshmallow).
Viele verschiedene Modelle können Klassifikationsaufgaben durchführen. Einige Beispiele sind:
- k-Nearest Neighbors;
- Logistische Regression;
- Entscheidungsbaum;
- Random Forest.
Glücklicherweise sind sie alle in der scikit-learn-Bibliothek implementiert und einfach zu verwenden.
Kein Machine-Learning-Modell ist einem anderen grundsätzlich überlegen. Welches Modell am besten abschneidet, hängt von der jeweiligen Aufgabe ab.
Danke für Ihr Feedback!