Svep för att visa menyn

Förkunskaper

Klassificering är en övervakad inlärningsuppgift där målet är att förutsäga klassen för en instans med hjälp av dess egenskaper. Modellen lär sig från märkta exempel i en träningsmängd och tilldelar sedan en klass till ny, osedd data.

Regression förutspår ett kontinuerligt numeriskt värde (t.ex. pris), vilket kan anta många möjliga värden. Klassificering förutspår ett kategoriskt värde (t.ex. typ av godis), där ett alternativ väljs från en begränsad uppsättning klasser.

Det finns flera typer av klassificering:

Binär klassificering: målet har två möjliga utfall (spam/inte spam, kaka/inte kaka);
Flervalsklassificering: tre eller fler möjliga kategorier (spam/viktigt/annons/annat; kaka/marshmallow/godis);
Fleretikettsklassificering: en instans kan tillhöra flera klasser samtidigt (en film kan vara action och komedi; ett e-postmeddelande kan vara viktigt och arbetsrelaterat).

För de flesta ML-modeller behöver målet kodas till ett tal. Vid binär klassificering kodas utfallen vanligtvis som 0/1 (t.ex. 1 - kaka, 0 - inte en kaka). Vid flervalsklassificering kodas utfallen vanligtvis som 0, 1, 2, ... (t.ex. 0 - godis, 1 - kaka, 2 - marshmallow).

Många olika modeller kan utföra klassificering. Några exempel är:

k-närmaste grannar;
logistisk regression;
beslutsträd;
random forest.

Lyckligtvis är de alla implementerade i scikit-learn-biblioteket och är enkla att använda.

Notering

Ingen maskininlärningsmodell är överlägsen någon annan. Vilken modell som presterar bäst beror på den specifika uppgiften.

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 1

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Vad är klassificering