Wat Is Classificatie
Classificatie is een taak binnen het begeleid leren waarbij het doel is om de klasse van een instantie te voorspellen aan de hand van diens kenmerken. Het model leert van gelabelde voorbeelden in een trainingsset en wijst vervolgens een klasse toe aan nieuwe, ongeziene data.
Regressie voorspelt een continue numerieke waarde (bijvoorbeeld prijs), die veel mogelijke waarden kan aannemen. Classificatie voorspelt een categorische waarde (bijvoorbeeld soort snoep), waarbij één optie wordt gekozen uit een beperkt aantal klassen.
Er zijn verschillende typen classificatie:
- Binaire classificatie: de target heeft twee mogelijke uitkomsten (spam/niet spam, koekje/niet koekje);
- Multi-class classificatie: drie of meer mogelijke categorieën (spam/belangrijk/reclame/overig; koekje/marshmallow/snoep);
- Multi-label classificatie: een instantie kan tot meerdere klassen tegelijkertijd behoren (een film kan actie en komedie zijn; een e-mail kan belangrijk en werkgerelateerd zijn).
Voor de meeste ML-modellen moet de target worden gecodeerd als een getal. Voor binaire classificatie worden uitkomsten meestal gecodeerd als 0/1 (bijv. 1 - koekje, 0 - geen koekje). Voor een multi-class classificatie worden uitkomsten meestal gecodeerd als 0, 1, 2, ... (bijv. 0 - snoep, 1 - koekje, 2 - marshmallow).
Veel verschillende modellen kunnen classificatie uitvoeren. Enkele voorbeelden zijn:
- k-Nearest Neighbors;
- Logistische regressie;
- Beslissingsboom;
- Random Forest.
Gelukkig zijn ze allemaal geïmplementeerd in de scikit-learn bibliotheek en eenvoudig te gebruiken.
Geen enkel machine learning-model is superieur aan een ander. Welk model het beste presteert, hangt af van de specifieke taak.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 4.17
Wat Is Classificatie
Veeg om het menu te tonen
Classificatie is een taak binnen het begeleid leren waarbij het doel is om de klasse van een instantie te voorspellen aan de hand van diens kenmerken. Het model leert van gelabelde voorbeelden in een trainingsset en wijst vervolgens een klasse toe aan nieuwe, ongeziene data.
Regressie voorspelt een continue numerieke waarde (bijvoorbeeld prijs), die veel mogelijke waarden kan aannemen. Classificatie voorspelt een categorische waarde (bijvoorbeeld soort snoep), waarbij één optie wordt gekozen uit een beperkt aantal klassen.
Er zijn verschillende typen classificatie:
- Binaire classificatie: de target heeft twee mogelijke uitkomsten (spam/niet spam, koekje/niet koekje);
- Multi-class classificatie: drie of meer mogelijke categorieën (spam/belangrijk/reclame/overig; koekje/marshmallow/snoep);
- Multi-label classificatie: een instantie kan tot meerdere klassen tegelijkertijd behoren (een film kan actie en komedie zijn; een e-mail kan belangrijk en werkgerelateerd zijn).
Voor de meeste ML-modellen moet de target worden gecodeerd als een getal. Voor binaire classificatie worden uitkomsten meestal gecodeerd als 0/1 (bijv. 1 - koekje, 0 - geen koekje). Voor een multi-class classificatie worden uitkomsten meestal gecodeerd als 0, 1, 2, ... (bijv. 0 - snoep, 1 - koekje, 2 - marshmallow).
Veel verschillende modellen kunnen classificatie uitvoeren. Enkele voorbeelden zijn:
- k-Nearest Neighbors;
- Logistische regressie;
- Beslissingsboom;
- Random Forest.
Gelukkig zijn ze allemaal geïmplementeerd in de scikit-learn bibliotheek en eenvoudig te gebruiken.
Geen enkel machine learning-model is superieur aan een ander. Welk model het beste presteert, hangt af van de specifieke taak.
Bedankt voor je feedback!