Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Hvad er klassifikation | K-NN-Klassifikator
Klassifikation med Python

bookHvad er klassifikation

Klassifikation er en overvåget læringsopgave. Målet er at forudsige den klasse, som instansen tilhører, baseret på et sæt parametre (features). Du skal give mange mærkede eksempler på data (kaldet træningssæt), for at computeren kan lære, før den kan forudsige klassen for en ny instans.

Forskellen mellem klassifikation og regression er, at regression forudsiger en kontinuerlig numerisk værdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tal.

I modsætning hertil forudsiger klassifikation en kategorisk værdi, for eksempel typen af en slik. Der er et endeligt sæt af værdier, og modellen forsøger at klassificere hver instans i en af disse kategorier.

Baseret på formuleringen af et problem findes der flere typer klassifikation:

  • Binær klassifikation: Ved binær klassifikation er målet én af to mulige udfald. For eksempel, e-mail: spam/ikke spam, sødt: cookie/ikke cookie;

  • Multiklassifikation: Ved multiklassifikation er der tre eller flere mulige udfald for et mål. For eksempel, e-mail: spam/vigtig/reklame/andet, sødt: cookie/marshmallow/slik;

  • Multilabel-klassifikation: Ved multilabel-klassifikation kan hver forekomst tilhøre flere klasser på samme tid. For eksempel kan en film klassificeres som både action og komedie, eller en e-mail kan markeres som både vigtig og arbejdsrelateret.

For de fleste ML-modeller skal målet kodes som et tal. For binær klassifikation kodes udfald normalt som 0/1 (f.eks. 1 - cookie, 0 - ikke cookie). For multiklassifikation kodes udfald normalt som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).

Mange forskellige modeller kan udføre klassifikation. Nogle eksempler inkluderer:

  • k-Nearest Neighbors;
  • Logistisk regression;
  • Beslutningstræ;
  • Random Forest.

Alle disse er implementeret i scikit-learn-biblioteket og er nemme at anvende.

Note
Bemærk

Ingen maskinlæringsmodel er overlegen i forhold til andre. Hvilken model der præsterer bedst, afhænger af den specifikke opgave.

question mark

Hvad er hovedformålet med klassifikation i maskinlæring?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 4.17

bookHvad er klassifikation

Stryg for at vise menuen

Klassifikation er en overvåget læringsopgave. Målet er at forudsige den klasse, som instansen tilhører, baseret på et sæt parametre (features). Du skal give mange mærkede eksempler på data (kaldet træningssæt), for at computeren kan lære, før den kan forudsige klassen for en ny instans.

Forskellen mellem klassifikation og regression er, at regression forudsiger en kontinuerlig numerisk værdi, for eksempel en pris. Det kan være et hvilket som helst reelt (kun positivt for en pris) tal.

I modsætning hertil forudsiger klassifikation en kategorisk værdi, for eksempel typen af en slik. Der er et endeligt sæt af værdier, og modellen forsøger at klassificere hver instans i en af disse kategorier.

Baseret på formuleringen af et problem findes der flere typer klassifikation:

  • Binær klassifikation: Ved binær klassifikation er målet én af to mulige udfald. For eksempel, e-mail: spam/ikke spam, sødt: cookie/ikke cookie;

  • Multiklassifikation: Ved multiklassifikation er der tre eller flere mulige udfald for et mål. For eksempel, e-mail: spam/vigtig/reklame/andet, sødt: cookie/marshmallow/slik;

  • Multilabel-klassifikation: Ved multilabel-klassifikation kan hver forekomst tilhøre flere klasser på samme tid. For eksempel kan en film klassificeres som både action og komedie, eller en e-mail kan markeres som både vigtig og arbejdsrelateret.

For de fleste ML-modeller skal målet kodes som et tal. For binær klassifikation kodes udfald normalt som 0/1 (f.eks. 1 - cookie, 0 - ikke cookie). For multiklassifikation kodes udfald normalt som 0, 1, 2, ... (f.eks. 0 - candy, 1 - cookie, 2 - marshmallow).

Mange forskellige modeller kan udføre klassifikation. Nogle eksempler inkluderer:

  • k-Nearest Neighbors;
  • Logistisk regression;
  • Beslutningstræ;
  • Random Forest.

Alle disse er implementeret i scikit-learn-biblioteket og er nemme at anvende.

Note
Bemærk

Ingen maskinlæringsmodel er overlegen i forhold til andre. Hvilken model der præsterer bedst, afhænger af den specifikke opgave.

question mark

Hvad er hovedformålet med klassifikation i maskinlæring?

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 1
some-alt