Veeg om het menu te tonen

Classificatie is een taak binnen het supervised learning waarbij het doel is om de klasse van een instantie te voorspellen aan de hand van diens kenmerken. Het model leert van gelabelde voorbeelden in een trainingsset en wijst vervolgens een klasse toe aan nieuwe, ongeziene data.

Regressie voorspelt een continue numerieke waarde (bijvoorbeeld prijs), die veel mogelijke waarden kan aannemen. Classificatie voorspelt een categorische waarde (bijvoorbeeld soort snoep), waarbij één optie wordt gekozen uit een beperkt aantal klassen.

Er zijn verschillende typen classificatie:

Binaire classificatie: het doel heeft twee mogelijke uitkomsten (spam/niet-spam, koekje/niet-koekje);
Multi-class classificatie: drie of meer mogelijke categorieën (spam/belangrijk/reclame/overig; koekje/marshmallow/snoep);
Multi-label classificatie: een instantie kan tot meerdere klassen tegelijkertijd behoren (een film kan actie en komedie zijn; een e-mail kan belangrijk en werkgerelateerd zijn).

Voor de meeste ML-modellen moet de doelvariabele worden gecodeerd als een getal. Bij binaire classificatie worden uitkomsten meestal gecodeerd als 0/1 (bijvoorbeeld, 1 - koekje, 0 - geen koekje). Bij een multiklassen classificatie worden uitkomsten meestal gecodeerd als 0, 1, 2, ... (bijvoorbeeld, 0 - snoep, 1 - koekje, 2 - marshmallow).

Veel verschillende modellen kunnen classificatie uitvoeren. Enkele voorbeelden zijn:

k-Nearest Neighbors;
Logistische Regressie;
Beslissingsboom;
Random Forest.

Gelukkig zijn ze allemaal geïmplementeerd in de scikit-learn bibliotheek en eenvoudig te gebruiken.

Opmerking

Geen enkel machine learning-model is superieur aan een ander. Welk model het beste presteert, hangt af van de specifieke taak.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 14

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Wat Is Classificatie