Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Wat is k-NN | K-NN-Classificator
Classificatie met Python

bookWat is k-NN

Laten we ons classificatie-avontuur beginnen met de eenvoudigste taak - binaire classificatie. Stel dat we snoepjes willen classificeren als koekjes/niet-koekjes op basis van één enkele eigenschap: hun gewicht.

Een eenvoudige manier om de klasse van een nieuw exemplaar te voorspellen is door te kijken naar de dichtstbijzijnde buur. In ons voorbeeld moeten we een snoepje vinden dat qua gewicht het meest lijkt op het nieuwe exemplaar.

Dat is het idee achter k-Nearest Neighbors (k-NN) - we kijken gewoon naar de buren. Het k-NN-algoritme gaat ervan uit dat vergelijkbare dingen zich in nabijheid bevinden. Met andere woorden, vergelijkbare dingen liggen dicht bij elkaar. k in k-NN staat voor het aantal buren dat we meenemen bij het maken van een voorspelling.

In het bovenstaande voorbeeld hebben we slechts 1 buurman overwogen, dus dit was 1-Nearest Neighbor. Meestal wordt k echter op een hoger getal ingesteld, omdat het bekijken van slechts één buurman onbetrouwbaar kan zijn:

Als k (aantal buren) groter is dan één, kiezen we de meest voorkomende klasse in de buurt als voorspelling. Hier is een voorbeeld van het voorspellen van twee nieuwe instanties met k=3:

Zoals je kunt zien, kan het wijzigen van de k tot verschillende voorspellingen leiden.

Note
Opmerking

Soms veroorzaakt k-NN een gelijkspel wanneer meerdere klassen even vaak voorkomen onder de dichtstbijzijnde buren. De meeste bibliotheken, waaronder scikit-learn, lossen gelijkspellen op door de eerste klasse in hun interne volgorde te kiezen - iets om rekening mee te houden, omdat dit subtiel invloed kan hebben op de reproduceerbaarheid en interpretatie.

question mark

In het k-Nearest Neighbors-algoritme, hoe wordt de klasse van een nieuw exemplaar voorspeld wanneer k > 1?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 2

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4.17

bookWat is k-NN

Veeg om het menu te tonen

Laten we ons classificatie-avontuur beginnen met de eenvoudigste taak - binaire classificatie. Stel dat we snoepjes willen classificeren als koekjes/niet-koekjes op basis van één enkele eigenschap: hun gewicht.

Een eenvoudige manier om de klasse van een nieuw exemplaar te voorspellen is door te kijken naar de dichtstbijzijnde buur. In ons voorbeeld moeten we een snoepje vinden dat qua gewicht het meest lijkt op het nieuwe exemplaar.

Dat is het idee achter k-Nearest Neighbors (k-NN) - we kijken gewoon naar de buren. Het k-NN-algoritme gaat ervan uit dat vergelijkbare dingen zich in nabijheid bevinden. Met andere woorden, vergelijkbare dingen liggen dicht bij elkaar. k in k-NN staat voor het aantal buren dat we meenemen bij het maken van een voorspelling.

In het bovenstaande voorbeeld hebben we slechts 1 buurman overwogen, dus dit was 1-Nearest Neighbor. Meestal wordt k echter op een hoger getal ingesteld, omdat het bekijken van slechts één buurman onbetrouwbaar kan zijn:

Als k (aantal buren) groter is dan één, kiezen we de meest voorkomende klasse in de buurt als voorspelling. Hier is een voorbeeld van het voorspellen van twee nieuwe instanties met k=3:

Zoals je kunt zien, kan het wijzigen van de k tot verschillende voorspellingen leiden.

Note
Opmerking

Soms veroorzaakt k-NN een gelijkspel wanneer meerdere klassen even vaak voorkomen onder de dichtstbijzijnde buren. De meeste bibliotheken, waaronder scikit-learn, lossen gelijkspellen op door de eerste klasse in hun interne volgorde te kiezen - iets om rekening mee te houden, omdat dit subtiel invloed kan hebben op de reproduceerbaarheid en interpretatie.

question mark

In het k-Nearest Neighbors-algoritme, hoe wordt de klasse van een nieuw exemplaar voorspeld wanneer k > 1?

Select the correct answer

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 2
some-alt