Hvad er klassifikation
Klassifikation er en overvåget læringsopgave. Målet er at forudsige den klasse, som instansen tilhører, baseret på et sæt parametre (features). Du skal give mange mærkede eksempler på data (kaldet træningssæt), for at computeren kan lære, før den kan forudsige klassen for en ny instans.
Forskellen mellem klassifikation og regression er, at regression forudsiger en kontinuerlig numerisk værdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tal.
I modsætning hertil forudsiger klassifikation en kategorisk værdi, for eksempel typen af en slik. Der er et endeligt sæt af værdier, og modellen forsøger at klassificere hver instans i en af disse kategorier.
Baseret på formuleringen af et problem findes der flere typer klassifikation:
-
Binær klassifikation: Ved binær klassifikation er målet én af to mulige udfald. For eksempel, e-mail: spam/ikke spam, sødt: cookie/ikke cookie;
-
Multiklassifikation: Ved multiklassifikation er der tre eller flere mulige udfald for et mål. For eksempel, e-mail: spam/vigtig/reklame/andet, sødt: cookie/marshmallow/slik;
-
Multilabel-klassifikation: Ved multilabel-klassifikation kan hver forekomst tilhøre flere klasser på samme tid. For eksempel kan en film klassificeres som både action og komedie, eller en e-mail kan markeres som både vigtig og arbejdsrelateret.
For de fleste ML-modeller skal målet kodes som et tal. For binær klassifikation kodes udfald normalt som 0/1 (f.eks. 1 - cookie, 0 - ikke cookie). For multiklassifikation kodes udfald normalt som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).
Mange forskellige modeller kan udføre klassifikation. Nogle eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk regression;
- Beslutningstræ;
- Random Forest.
Alle disse er implementeret i scikit-learn-biblioteket og er nemme at anvende.
Ingen maskinlæringsmodel er overlegen i forhold til andre. Hvilken model der præsterer bedst, afhænger af den specifikke opgave.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 4.17
Hvad er klassifikation
Stryg for at vise menuen
Klassifikation er en overvåget læringsopgave. Målet er at forudsige den klasse, som instansen tilhører, baseret på et sæt parametre (features). Du skal give mange mærkede eksempler på data (kaldet træningssæt), for at computeren kan lære, før den kan forudsige klassen for en ny instans.
Forskellen mellem klassifikation og regression er, at regression forudsiger en kontinuerlig numerisk værdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tal.
I modsætning hertil forudsiger klassifikation en kategorisk værdi, for eksempel typen af en slik. Der er et endeligt sæt af værdier, og modellen forsøger at klassificere hver instans i en af disse kategorier.
Baseret på formuleringen af et problem findes der flere typer klassifikation:
-
Binær klassifikation: Ved binær klassifikation er målet én af to mulige udfald. For eksempel, e-mail: spam/ikke spam, sødt: cookie/ikke cookie;
-
Multiklassifikation: Ved multiklassifikation er der tre eller flere mulige udfald for et mål. For eksempel, e-mail: spam/vigtig/reklame/andet, sødt: cookie/marshmallow/slik;
-
Multilabel-klassifikation: Ved multilabel-klassifikation kan hver forekomst tilhøre flere klasser på samme tid. For eksempel kan en film klassificeres som både action og komedie, eller en e-mail kan markeres som både vigtig og arbejdsrelateret.
For de fleste ML-modeller skal målet kodes som et tal. For binær klassifikation kodes udfald normalt som 0/1 (f.eks. 1 - cookie, 0 - ikke cookie). For multiklassifikation kodes udfald normalt som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).
Mange forskellige modeller kan udføre klassifikation. Nogle eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk regression;
- Beslutningstræ;
- Random Forest.
Alle disse er implementeret i scikit-learn-biblioteket og er nemme at anvende.
Ingen maskinlæringsmodel er overlegen i forhold til andre. Hvilken model der præsterer bedst, afhænger af den specifikke opgave.
Tak for dine kommentarer!