Vad är klassificering
Klassificering är en övervakad inlärningsuppgift där målet är att förutsäga klassen för en instans med hjälp av dess egenskaper. Modellen lär sig från märkta exempel i en träningsmängd och tilldelar sedan en klass till ny, osedd data.
Regression förutsäger ett kontinuerligt numeriskt värde (t.ex. pris), vilket kan anta många möjliga värden. Klassificering förutsäger ett kategoriskt värde (t.ex. typ av godis), och väljer ett alternativ från en begränsad uppsättning klasser.
Det finns flera typer av klassificering:
- Binär klassificering: målet har två möjliga utfall (spam/inte spam, cookie/inte cookie);
- Flervalsklassificering: tre eller fler möjliga kategorier (spam/viktigt/annons/annat; cookie/marshmallow/godis);
- Flermärkesklassificering: en instans kan tillhöra flera klasser samtidigt (en film kan vara action och komedi; ett e-postmeddelande kan vara viktigt och arbetsrelaterat).
För de flesta ML-modeller behöver målet kodas till ett tal. Vid binär klassificering kodas utfallen vanligtvis som 0/1 (t.ex. 1 - cookie, 0 - inte cookie). Vid flervalsklassificering kodas utfallen vanligtvis som 0, 1, 2, ... (t.ex. 0 - godis, 1 - cookie, 2 - marshmallow).
Många olika modeller kan utföra klassificering. Några exempel är:
- k-Nearest Neighbors;
- Logistisk regression;
- Beslutsträd;
- Random Forest.
Samtliga är implementerade i scikit-learn-biblioteket och är enkla att använda.
Ingen maskininlärningsmodell är överlägsen någon annan. Vilken modell som presterar bäst beror på den specifika uppgiften.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 4.17
Vad är klassificering
Svep för att visa menyn
Klassificering är en övervakad inlärningsuppgift där målet är att förutsäga klassen för en instans med hjälp av dess egenskaper. Modellen lär sig från märkta exempel i en träningsmängd och tilldelar sedan en klass till ny, osedd data.
Regression förutsäger ett kontinuerligt numeriskt värde (t.ex. pris), vilket kan anta många möjliga värden. Klassificering förutsäger ett kategoriskt värde (t.ex. typ av godis), och väljer ett alternativ från en begränsad uppsättning klasser.
Det finns flera typer av klassificering:
- Binär klassificering: målet har två möjliga utfall (spam/inte spam, cookie/inte cookie);
- Flervalsklassificering: tre eller fler möjliga kategorier (spam/viktigt/annons/annat; cookie/marshmallow/godis);
- Flermärkesklassificering: en instans kan tillhöra flera klasser samtidigt (en film kan vara action och komedi; ett e-postmeddelande kan vara viktigt och arbetsrelaterat).
För de flesta ML-modeller behöver målet kodas till ett tal. Vid binär klassificering kodas utfallen vanligtvis som 0/1 (t.ex. 1 - cookie, 0 - inte cookie). Vid flervalsklassificering kodas utfallen vanligtvis som 0, 1, 2, ... (t.ex. 0 - godis, 1 - cookie, 2 - marshmallow).
Många olika modeller kan utföra klassificering. Några exempel är:
- k-Nearest Neighbors;
- Logistisk regression;
- Beslutsträd;
- Random Forest.
Samtliga är implementerade i scikit-learn-biblioteket och är enkla att använda.
Ingen maskininlärningsmodell är överlägsen någon annan. Vilken modell som presterar bäst beror på den specifika uppgiften.
Tack för dina kommentarer!