Was ist Klassifikation
Klassifikation ist eine Aufgabe des überwachten Lernens, bei der das Ziel darin besteht, die Klasse einer Instanz anhand ihrer Merkmale vorherzusagen. Das Modell lernt aus gelabelten Beispielen in einem Trainingsdatensatz und ordnet anschließend neue, unbekannte Daten einer Klasse zu.
Regression sagt einen kontinuierlichen numerischen Wert voraus (z. B. Preis), der viele mögliche Werte annehmen kann. Klassifikation sagt einen kategorischen Wert voraus (z. B. Süßigkeitstyp) und wählt eine Option aus einer begrenzten Anzahl von Klassen.
Es gibt verschiedene Arten der Klassifikation:
- Binäre Klassifikation: Das Ziel hat zwei mögliche Ausprägungen (Spam/Nicht-Spam, Cookie/Nicht-Cookie);
- Mehrklassenklassifikation: Drei oder mehr mögliche Kategorien (Spam/Wichtig/Werbung/Andere; Cookie/Marshmallow/Bonbon);
- Mehrlabel-Klassifikation: Eine Instanz kann gleichzeitig mehreren Klassen angehören (ein Film kann Action und Komödie sein; eine E-Mail kann wichtig und arbeitsbezogen sein).
Für die meisten ML-Modelle muss das Ziel als Zahl codiert werden. Bei der binären Klassifikation werden die Ausprägungen üblicherweise als 0/1 codiert (z. B. 1 - Cookie, 0 - kein Cookie). Bei der Mehrklassenklassifikation werden die Ausprägungen üblicherweise als 0, 1, 2, ... codiert (z. B. 0 - Bonbon, 1 - Cookie, 2 - Marshmallow).
Viele verschiedene Modelle können Klassifikationsaufgaben durchführen. Einige Beispiele sind:
- k-Nearest Neighbors;
- Logistische Regression;
- Entscheidungsbaum;
- Random Forest.
Glücklicherweise sind sie alle in der scikit-learn-Bibliothek implementiert und einfach zu verwenden.
Kein Machine-Learning-Modell ist einem anderen grundsätzlich überlegen. Welches Modell die beste Leistung erbringt, hängt von der jeweiligen Aufgabe ab.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain the difference between binary, multi-class, and multi-label classification in more detail?
What are some common use cases for classification and regression?
How do I choose which classification model to use for my data?
Awesome!
Completion rate improved to 4.17
Was ist Klassifikation
Swipe um das Menü anzuzeigen
Klassifikation ist eine Aufgabe des überwachten Lernens, bei der das Ziel darin besteht, die Klasse einer Instanz anhand ihrer Merkmale vorherzusagen. Das Modell lernt aus gelabelten Beispielen in einem Trainingsdatensatz und ordnet anschließend neue, unbekannte Daten einer Klasse zu.
Regression sagt einen kontinuierlichen numerischen Wert voraus (z. B. Preis), der viele mögliche Werte annehmen kann. Klassifikation sagt einen kategorischen Wert voraus (z. B. Süßigkeitstyp) und wählt eine Option aus einer begrenzten Anzahl von Klassen.
Es gibt verschiedene Arten der Klassifikation:
- Binäre Klassifikation: Das Ziel hat zwei mögliche Ausprägungen (Spam/Nicht-Spam, Cookie/Nicht-Cookie);
- Mehrklassenklassifikation: Drei oder mehr mögliche Kategorien (Spam/Wichtig/Werbung/Andere; Cookie/Marshmallow/Bonbon);
- Mehrlabel-Klassifikation: Eine Instanz kann gleichzeitig mehreren Klassen angehören (ein Film kann Action und Komödie sein; eine E-Mail kann wichtig und arbeitsbezogen sein).
Für die meisten ML-Modelle muss das Ziel als Zahl codiert werden. Bei der binären Klassifikation werden die Ausprägungen üblicherweise als 0/1 codiert (z. B. 1 - Cookie, 0 - kein Cookie). Bei der Mehrklassenklassifikation werden die Ausprägungen üblicherweise als 0, 1, 2, ... codiert (z. B. 0 - Bonbon, 1 - Cookie, 2 - Marshmallow).
Viele verschiedene Modelle können Klassifikationsaufgaben durchführen. Einige Beispiele sind:
- k-Nearest Neighbors;
- Logistische Regression;
- Entscheidungsbaum;
- Random Forest.
Glücklicherweise sind sie alle in der scikit-learn-Bibliothek implementiert und einfach zu verwenden.
Kein Machine-Learning-Modell ist einem anderen grundsätzlich überlegen. Welches Modell die beste Leistung erbringt, hängt von der jeweiligen Aufgabe ab.
Danke für Ihr Feedback!