Hva er klassifisering
Klassifisering er en oppgave innen overvåket læring hvor målet er å forutsi klassen til en forekomst ved hjelp av dens egenskaper. Modellen lærer fra merkede eksempler i et treningssett og tildeler deretter en klasse til nye, ukjente data.
Regresjon forutsier en kontinuerlig numerisk verdi (f.eks. pris), som kan ha mange mulige verdier. Klassifisering forutsier en kategori (f.eks. type godteri), og velger ett alternativ fra et begrenset sett med klasser.
Det finnes flere typer klassifisering:
- Binær klassifisering: målet har to mulige utfall (spam/ikke spam, kjeks/ikke kjeks);
- Flerklasses klassifisering: tre eller flere mulige kategorier (spam/viktig/annonse/annet; kjeks/marshmallow/godteri);
- Fleretikett-klassifisering: en forekomst kan tilhøre flere klasser samtidig (en film kan være action og komedie; en e-post kan være viktig og jobbrelatert).
For de fleste ML-modeller må målet kodes som et tall. For binær klassifisering kodes utfall vanligvis som 0/1 (f.eks. 1 - cookie, 0 - ikke cookie). For en multiklasse klassifisering kodes utfall vanligvis som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).
Mange ulike modeller kan utføre klassifisering. Noen eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk regresjon;
- Beslutningstre;
- Random Forest.
Heldigvis er alle implementert i scikit-learn-biblioteket og er enkle å bruke.
Ingen maskinlæringsmodell er overlegent en annen. Hvilken modell som gir best ytelse avhenger av den spesifikke oppgaven.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 3.33
Hva er klassifisering
Sveip for å vise menyen
Klassifisering er en oppgave innen overvåket læring hvor målet er å forutsi klassen til en forekomst ved hjelp av dens egenskaper. Modellen lærer fra merkede eksempler i et treningssett og tildeler deretter en klasse til nye, ukjente data.
Regresjon forutsier en kontinuerlig numerisk verdi (f.eks. pris), som kan ha mange mulige verdier. Klassifisering forutsier en kategori (f.eks. type godteri), og velger ett alternativ fra et begrenset sett med klasser.
Det finnes flere typer klassifisering:
- Binær klassifisering: målet har to mulige utfall (spam/ikke spam, kjeks/ikke kjeks);
- Flerklasses klassifisering: tre eller flere mulige kategorier (spam/viktig/annonse/annet; kjeks/marshmallow/godteri);
- Fleretikett-klassifisering: en forekomst kan tilhøre flere klasser samtidig (en film kan være action og komedie; en e-post kan være viktig og jobbrelatert).
For de fleste ML-modeller må målet kodes som et tall. For binær klassifisering kodes utfall vanligvis som 0/1 (f.eks. 1 - cookie, 0 - ikke cookie). For en multiklasse klassifisering kodes utfall vanligvis som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).
Mange ulike modeller kan utføre klassifisering. Noen eksempler inkluderer:
- k-Nearest Neighbors;
- Logistisk regresjon;
- Beslutningstre;
- Random Forest.
Heldigvis er alle implementert i scikit-learn-biblioteket og er enkle å bruke.
Ingen maskinlæringsmodell er overlegent en annen. Hvilken modell som gir best ytelse avhenger av den spesifikke oppgaven.
Takk for tilbakemeldingene dine!