Summary  
This chapter introduces the k-Nearest Neighbors classification algorithm, which predicts a new instance’s class by finding its k closest neighbors in feature space and choosing the most frequent class among them. It also demonstrates how different values of k influence prediction reliability.

General domain of usage  
Machine learning classification tasks

Vi starter klassifiseringsreisen med den enkleste oppgaven – **binær klassifisering**. Anta at vi ønsker å klassifisere søtsaker som kjeks/ikke kjeks basert på én **enkel egenskap**: vekten deres.

En enkel metode for å forutsi klassen til en ny forekomst er å se på dens **nærmeste nabo**. I vårt eksempel må vi finne en søtsak som veier mest likt den nye forekomsten.

Dette er ideen bak **k-Nearest Neighbors** (**k-NN**) – vi ser bare på naboene. 
k-NN-algoritmen antar at lignende objekter finnes i **nærhet** til hverandre. Med andre ord, lignende ting er nær hverandre. **k** i k-NN står for antall naboer vi vurderer når vi gjør en prediksjon.

I eksempelet ovenfor vurderte vi kun **1** nabo, så det var 1-Nærmeste Nabo. Men vanligvis settes k til et høyere tall, siden det å kun se på én nabo kan være **upålitelig**:

Hvis **k** (antall naboer) er større enn én, velges den **mest vanlige klassen** i nabolaget som prediksjon. Her er et eksempel på prediksjon av to nye forekomster med **k=3**:

Som du kan se, kan endring av **k** føre til ulike prediksjoner.

Av og til oppstår det en **uavgjort** i k-NN når flere klasser forekommer like ofte blant de nærmeste naboene. De fleste biblioteker, inkludert scikit-learn, løser uavgjort ved å **velge den første klassen** i sin interne rekkefølge – noe som er viktig å være oppmerksom på, siden det kan påvirke reproduserbarhet og tolkning på en subtil måte.

Merk

I k-Nearest Neighbors-algoritmen, hvordan predikeres klassen til en ny forekomst når k > 1?

Behersk de grunnleggende algoritmene innen overvåket læring og implementer dem ved hjelp av Scikit-learn. Utforsk lineær og polynomisk regresjon for prisestimering, og gå videre til klassifisering med k-NN, logistisk regresjon og beslutningstrær. Lær å evaluere modeller gjennom kryssvalidering, håndtere overtilpasning med regularisering og optimalisere hyperparametere. Bygg robuste prediktive systemer og definer komplekse beslutningsgrenser for oppgaver med multiklasseklassifisering.

Hva er k-NN