Hvad Er Klassifikation
Klassifikation er en supervised learning-opgave, hvor målet er at forudsige klassen af en forekomst ved hjælp af dens egenskaber. Modellen lærer fra mærkede eksempler i et træningssæt og tildeler derefter en klasse til nye, ukendte data.
Regression forudsiger en kontinuerlig numerisk værdi (f.eks. pris), som kan antage mange mulige værdier. Klassifikation forudsiger en kategorisk værdi (f.eks. type af slik), hvor der vælges én mulighed fra et begrænset sæt af klasser.
Der findes flere typer af klassifikation:
- Binær klassifikation: målet har to mulige udfald (spam/ikke spam, cookie/ikke cookie);
- Multi-klasse klassifikation: tre eller flere mulige kategorier (spam/vigtig/reklame/andet; cookie/marshmallow/slik);
- Multi-label klassifikation: en forekomst kan tilhøre flere klasser samtidigt (en film kan være action og komedie; en e-mail kan være vigtig og arbejdsrelateret).
For de fleste ML-modeller skal målet kodes som et tal. Ved binær klassifikation kodes udfald typisk som 0/1 (f.eks. 1 - cookie, 0 - ikke en cookie). Ved multiklassifikation kodes udfald typisk som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).
Mange forskellige modeller kan udføre klassifikation. Nogle eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk Regression;
- Beslutningstræ;
- Random Forest.
Heldigvis er de alle implementeret i scikit-learn-biblioteket og er nemme at anvende.
Ingen maskinlæringsmodel er overlegen i forhold til andre. Hvilken model der præsterer bedst, afhænger af den specifikke opgave.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Fantastisk!
Completion rate forbedret til 3.33
Hvad Er Klassifikation
Stryg for at vise menuen
Klassifikation er en supervised learning-opgave, hvor målet er at forudsige klassen af en forekomst ved hjælp af dens egenskaber. Modellen lærer fra mærkede eksempler i et træningssæt og tildeler derefter en klasse til nye, ukendte data.
Regression forudsiger en kontinuerlig numerisk værdi (f.eks. pris), som kan antage mange mulige værdier. Klassifikation forudsiger en kategorisk værdi (f.eks. type af slik), hvor der vælges én mulighed fra et begrænset sæt af klasser.
Der findes flere typer af klassifikation:
- Binær klassifikation: målet har to mulige udfald (spam/ikke spam, cookie/ikke cookie);
- Multi-klasse klassifikation: tre eller flere mulige kategorier (spam/vigtig/reklame/andet; cookie/marshmallow/slik);
- Multi-label klassifikation: en forekomst kan tilhøre flere klasser samtidigt (en film kan være action og komedie; en e-mail kan være vigtig og arbejdsrelateret).
For de fleste ML-modeller skal målet kodes som et tal. Ved binær klassifikation kodes udfald typisk som 0/1 (f.eks. 1 - cookie, 0 - ikke en cookie). Ved multiklassifikation kodes udfald typisk som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).
Mange forskellige modeller kan udføre klassifikation. Nogle eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk Regression;
- Beslutningstræ;
- Random Forest.
Heldigvis er de alle implementeret i scikit-learn-biblioteket og er nemme at anvende.
Ingen maskinlæringsmodel er overlegen i forhold til andre. Hvilken model der præsterer bedst, afhænger af den specifikke opgave.
Tak for dine kommentarer!