Wat Is Classificatie
Classificatie is een taak binnen het begeleid leren. Het doel is om te voorspellen tot welke klasse een instantie behoort op basis van een reeks parameters (kenmerken). Er moeten veel gelabelde voorbeelden van data (het trainingsset genoemd) worden aangeleverd zodat de computer kan leren voordat deze de klasse van een nieuwe instantie kan voorspellen.
Het verschil tussen classificatie en regressie is dat regressie een continue numerieke waarde voorspelt, bijvoorbeeld een prijs. Dit kan elk reëel (alleen positief voor een prijs) getal zijn.
Classificatie daarentegen voorspelt een categorische waarde, bijvoorbeeld het type van een snoepje. Er is een eindige set waarden en het model probeert elke instantie in een van deze categorieën te classificeren.
Afhankelijk van de formulering van een probleem zijn er verschillende typen classificatie:
-
Binaire classificatie: bij binaire classificatie is een doel één van twee mogelijke uitkomsten. Bijvoorbeeld, e-mail: spam/niet-spam, zoetigheid: koekje/geen koekje;
-
Multiclass-classificatie: bij multiclass-classificatie zijn er drie of meer mogelijke uitkomsten voor een doel. Bijvoorbeeld, e-mail: spam/belangrijk/reclame/overig, zoetigheid: koekje/marshmallow/snoep;
-
Multi-label classificatie: bij multi-label classificatie kan elke instantie tot meerdere klassen tegelijk behoren. Bijvoorbeeld, een film kan worden geclassificeerd als zowel actie als komedie, of een e-mail kan worden gemarkeerd als zowel belangrijk als werkgerelateerd.
Voor de meeste ML-modellen moet het doel worden gecodeerd als een getal. Voor binaire classificatie worden uitkomsten meestal gecodeerd als 0/1 (bijvoorbeeld, 1 - koekje, 0 - geen koekje). Voor een multiclass classificatie worden uitkomsten meestal gecodeerd als 0, 1, 2, ... (bijvoorbeeld, 0 - snoep, 1 - koekje, 2 - marshmallow).
Veel verschillende modellen kunnen classificatie uitvoeren. Enkele voorbeelden zijn:
- k-Nearest Neighbors;
- Logistische regressie;
- Beslissingsboom;
- Random Forest.
Deze zijn allemaal geïmplementeerd in de scikit-learn-bibliotheek en eenvoudig te gebruiken.
Geen enkel machine learning-model is superieur aan een ander. Welk model het beste presteert, hangt af van de specifieke taak.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 4.17
Wat Is Classificatie
Veeg om het menu te tonen
Classificatie is een taak binnen het begeleid leren. Het doel is om te voorspellen tot welke klasse een instantie behoort op basis van een reeks parameters (kenmerken). Er moeten veel gelabelde voorbeelden van data (het trainingsset genoemd) worden aangeleverd zodat de computer kan leren voordat deze de klasse van een nieuwe instantie kan voorspellen.
Het verschil tussen classificatie en regressie is dat regressie een continue numerieke waarde voorspelt, bijvoorbeeld een prijs. Dit kan elk reëel (alleen positief voor een prijs) getal zijn.
Classificatie daarentegen voorspelt een categorische waarde, bijvoorbeeld het type van een snoepje. Er is een eindige set waarden en het model probeert elke instantie in een van deze categorieën te classificeren.
Afhankelijk van de formulering van een probleem zijn er verschillende typen classificatie:
-
Binaire classificatie: bij binaire classificatie is een doel één van twee mogelijke uitkomsten. Bijvoorbeeld, e-mail: spam/niet-spam, zoetigheid: koekje/geen koekje;
-
Multiclass-classificatie: bij multiclass-classificatie zijn er drie of meer mogelijke uitkomsten voor een doel. Bijvoorbeeld, e-mail: spam/belangrijk/reclame/overig, zoetigheid: koekje/marshmallow/snoep;
-
Multi-label classificatie: bij multi-label classificatie kan elke instantie tot meerdere klassen tegelijk behoren. Bijvoorbeeld, een film kan worden geclassificeerd als zowel actie als komedie, of een e-mail kan worden gemarkeerd als zowel belangrijk als werkgerelateerd.
Voor de meeste ML-modellen moet het doel worden gecodeerd als een getal. Voor binaire classificatie worden uitkomsten meestal gecodeerd als 0/1 (bijvoorbeeld, 1 - koekje, 0 - geen koekje). Voor een multiclass classificatie worden uitkomsten meestal gecodeerd als 0, 1, 2, ... (bijvoorbeeld, 0 - snoep, 1 - koekje, 2 - marshmallow).
Veel verschillende modellen kunnen classificatie uitvoeren. Enkele voorbeelden zijn:
- k-Nearest Neighbors;
- Logistische regressie;
- Beslissingsboom;
- Random Forest.
Deze zijn allemaal geïmplementeerd in de scikit-learn-bibliotheek en eenvoudig te gebruiken.
Geen enkel machine learning-model is superieur aan een ander. Welk model het beste presteert, hangt af van de specifieke taak.
Bedankt voor je feedback!