Hva er klassifisering
Klassifisering er en oppgave innen overvåket læring. Målet er å forutsi hvilken klasse en instans tilhører basert på et sett med parametere (egenskaper). Det er nødvendig å gi mange merkede eksempler på data (kalt treningssett) for at datamaskinen skal kunne lære før den kan forutsi klassen til en ny instans.
Forskjellen mellom klassifisering og regresjon er at regresjon forutsier en kontinuerlig numerisk verdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tall.
I motsetning til dette forutsier klassifisering en kategorisk verdi, for eksempel typen av en søtsak. Det finnes et endelig sett med verdier, og modellen forsøker å klassifisere hver instans i én av disse kategoriene.
Basert på formuleringen av et problem finnes det flere typer klassifisering:
-
Binær klassifisering: I binær klassifisering er målet ett av to mulige utfall. For eksempel, e-post: spam/ikke spam, søtsak: kjeks/ikke kjeks;
-
Flerklasses klassifisering: I flerkasses klassifisering finnes det tre eller flere mulige utfall for et mål. For eksempel, e-post: spam/viktig/annonse/annet, søtsak: kjeks/marshmallow/godteri;
-
Fleretikett-klassifisering: I fleretikett-klassifisering kan hver forekomst tilhøre flere klasser samtidig. For eksempel kan en film klassifiseres som både action og komedie, eller en e-post kan merkes som både viktig og jobbrelatert.
For de fleste ML-modeller må du kode målet som et tall. For binær klassifisering kodes utfall vanligvis som 0/1 (f.eks. 1 - kjeks, 0 - ikke kjeks). For en flerklasses klassifisering kodes utfall vanligvis som 0, 1, 2, ... (f.eks. 0 - godteri, 1 - kjeks, 2 - marshmallow).
Mange ulike modeller kan utføre klassifisering. Noen eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk regresjon;
- Beslutningstre;
- Random Forest.
Heldigvis er alle implementert i scikit-learn-biblioteket og er enkle å bruke.
Ingen maskinlæringsmodell er overlegent en annen. Hvilken modell som gir best ytelse avhenger av den spesifikke oppgaven.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Can you explain more about the difference between classification and regression?
What are some real-world examples of multi-label classification?
How do I choose which classification model to use for my data?
Awesome!
Completion rate improved to 4.17
Hva er klassifisering
Sveip for å vise menyen
Klassifisering er en oppgave innen overvåket læring. Målet er å forutsi hvilken klasse en instans tilhører basert på et sett med parametere (egenskaper). Det er nødvendig å gi mange merkede eksempler på data (kalt treningssett) for at datamaskinen skal kunne lære før den kan forutsi klassen til en ny instans.
Forskjellen mellom klassifisering og regresjon er at regresjon forutsier en kontinuerlig numerisk verdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tall.
I motsetning til dette forutsier klassifisering en kategorisk verdi, for eksempel typen av en søtsak. Det finnes et endelig sett med verdier, og modellen forsøker å klassifisere hver instans i én av disse kategoriene.
Basert på formuleringen av et problem finnes det flere typer klassifisering:
-
Binær klassifisering: I binær klassifisering er målet ett av to mulige utfall. For eksempel, e-post: spam/ikke spam, søtsak: kjeks/ikke kjeks;
-
Flerklasses klassifisering: I flerkasses klassifisering finnes det tre eller flere mulige utfall for et mål. For eksempel, e-post: spam/viktig/annonse/annet, søtsak: kjeks/marshmallow/godteri;
-
Fleretikett-klassifisering: I fleretikett-klassifisering kan hver forekomst tilhøre flere klasser samtidig. For eksempel kan en film klassifiseres som både action og komedie, eller en e-post kan merkes som både viktig og jobbrelatert.
For de fleste ML-modeller må du kode målet som et tall. For binær klassifisering kodes utfall vanligvis som 0/1 (f.eks. 1 - kjeks, 0 - ikke kjeks). For en flerklasses klassifisering kodes utfall vanligvis som 0, 1, 2, ... (f.eks. 0 - godteri, 1 - kjeks, 2 - marshmallow).
Mange ulike modeller kan utføre klassifisering. Noen eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk regresjon;
- Beslutningstre;
- Random Forest.
Heldigvis er alle implementert i scikit-learn-biblioteket og er enkle å bruke.
Ingen maskinlæringsmodell er overlegent en annen. Hvilken modell som gir best ytelse avhenger av den spesifikke oppgaven.
Takk for tilbakemeldingene dine!