Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Hva er klassifisering | K-NN-Klassifikator
Klassifisering med Python

bookHva er klassifisering

Klassifisering er en oppgave innen overvåket læring. Målet er å forutsi hvilken klasse en instans tilhører basert på et sett med parametere (egenskaper). Det er nødvendig å gi mange merkede eksempler på data (kalt treningssett) for at datamaskinen skal kunne lære før den kan forutsi klassen til en ny instans.

Forskjellen mellom klassifisering og regresjon er at regresjon forutsier en kontinuerlig numerisk verdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tall.

I motsetning til dette forutsier klassifisering en kategorisk verdi, for eksempel typen av en søtsak. Det finnes et endelig sett med verdier, og modellen forsøker å klassifisere hver instans i én av disse kategoriene.

Basert på formuleringen av et problem finnes det flere typer klassifisering:

  • Binær klassifisering: I binær klassifisering er målet ett av to mulige utfall. For eksempel, e-post: spam/ikke spam, søtsak: kjeks/ikke kjeks;

  • Flerklasses klassifisering: I flerkasses klassifisering finnes det tre eller flere mulige utfall for et mål. For eksempel, e-post: spam/viktig/annonse/annet, søtsak: kjeks/marshmallow/godteri;

  • Fleretikett-klassifisering: I fleretikett-klassifisering kan hver forekomst tilhøre flere klasser samtidig. For eksempel kan en film klassifiseres som både action og komedie, eller en e-post kan merkes som både viktig og jobbrelatert.

For de fleste ML-modeller må du kode målet som et tall. For binær klassifisering kodes utfall vanligvis som 0/1 (f.eks. 1 - kjeks, 0 - ikke kjeks). For en flerklasses klassifisering kodes utfall vanligvis som 0, 1, 2, ... (f.eks. 0 - godteri, 1 - kjeks, 2 - marshmallow).

Mange ulike modeller kan utføre klassifisering. Noen eksempler inkluderer:

  • k-Nearest Neighbors;
  • Logistisk regresjon;
  • Beslutningstre;
  • Random Forest.

Heldigvis er alle implementert i scikit-learn-biblioteket og er enkle å bruke.

Note
Merk

Ingen maskinlæringsmodell er overlegent en annen. Hvilken modell som gir best ytelse avhenger av den spesifikke oppgaven.

question mark

Hva er hovedmålet med klassifisering i maskinlæring?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 1

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain more about the difference between classification and regression?

What are some real-world examples of multi-label classification?

How do I choose which classification model to use for my data?

Awesome!

Completion rate improved to 4.17

bookHva er klassifisering

Sveip for å vise menyen

Klassifisering er en oppgave innen overvåket læring. Målet er å forutsi hvilken klasse en instans tilhører basert på et sett med parametere (egenskaper). Det er nødvendig å gi mange merkede eksempler på data (kalt treningssett) for at datamaskinen skal kunne lære før den kan forutsi klassen til en ny instans.

Forskjellen mellom klassifisering og regresjon er at regresjon forutsier en kontinuerlig numerisk verdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tall.

I motsetning til dette forutsier klassifisering en kategorisk verdi, for eksempel typen av en søtsak. Det finnes et endelig sett med verdier, og modellen forsøker å klassifisere hver instans i én av disse kategoriene.

Basert på formuleringen av et problem finnes det flere typer klassifisering:

  • Binær klassifisering: I binær klassifisering er målet ett av to mulige utfall. For eksempel, e-post: spam/ikke spam, søtsak: kjeks/ikke kjeks;

  • Flerklasses klassifisering: I flerkasses klassifisering finnes det tre eller flere mulige utfall for et mål. For eksempel, e-post: spam/viktig/annonse/annet, søtsak: kjeks/marshmallow/godteri;

  • Fleretikett-klassifisering: I fleretikett-klassifisering kan hver forekomst tilhøre flere klasser samtidig. For eksempel kan en film klassifiseres som både action og komedie, eller en e-post kan merkes som både viktig og jobbrelatert.

For de fleste ML-modeller må du kode målet som et tall. For binær klassifisering kodes utfall vanligvis som 0/1 (f.eks. 1 - kjeks, 0 - ikke kjeks). For en flerklasses klassifisering kodes utfall vanligvis som 0, 1, 2, ... (f.eks. 0 - godteri, 1 - kjeks, 2 - marshmallow).

Mange ulike modeller kan utføre klassifisering. Noen eksempler inkluderer:

  • k-Nearest Neighbors;
  • Logistisk regresjon;
  • Beslutningstre;
  • Random Forest.

Heldigvis er alle implementert i scikit-learn-biblioteket og er enkle å bruke.

Note
Merk

Ingen maskinlæringsmodell er overlegent en annen. Hvilken modell som gir best ytelse avhenger av den spesifikke oppgaven.

question mark

Hva er hovedmålet med klassifisering i maskinlæring?

Select the correct answer

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 1
some-alt