Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Waarom de data schalen? | Gegevens Preprocessen Met Scikit-learn
Introductie tot Machine Learning met Python

Waarom de data schalen?

Veeg om het menu te tonen

Na het verwerken van ontbrekende waarden en het coderen van categorische kenmerken, is de dataset vrij van problemen die fouten in het model zouden veroorzaken. Er blijft echter een andere uitdaging over: verschillende schalen van kenmerken.

Verschillende schaal

Dit probleem veroorzaakt geen fouten als je de huidige gegevens aan het model aanbiedt, maar het kan de prestaties van sommige ML-modellen aanzienlijk verslechteren.

Beschouw een voorbeeld waarbij één kenmerk 'age' is, variërend van 18 tot 50, en het tweede kenmerk 'income', variërend van $25,000 tot $500,000. Het is duidelijk dat een verschil van tien jaar in leeftijd belangrijker is dan een verschil van tien dollar in inkomen.

Sommige modellen, zoals k-NN (dat we in deze cursus zullen gebruiken), kunnen deze verschillen echter als even belangrijk beschouwen. Hierdoor zal de kolom 'income' een veel grotere invloed op het model hebben. Het is daarom essentieel dat kenmerken ongeveer hetzelfde bereik hebben zodat k-NN effectief kan functioneren.

Hoewel andere modellen minder gevoelig kunnen zijn voor verschillende schalen, kan het schalen van data de verwerkingssnelheid aanzienlijk verhogen. Daarom wordt dataschaling vaak als laatste stap in de preprocessing opgenomen.

Note
Opmerking

Zoals hierboven vermeld, is dataschaling meestal de laatste stap van de preprocessingfase. Dat komt omdat aanpassingen aan kenmerken na het schalen de data weer ongeschaald kunnen maken.

Het volgende hoofdstuk behandelt de drie meest gebruikte transformers voor dataschaling. Dit zijn StandardScaler, MinMaxScaler en MaxAbsScaler.

question mark

Waarom is het belangrijk om features te schalen in machine learning modellen zoals k-nearest neighbors (KNN)?

Selecteer het correcte antwoord

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 9

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 2. Hoofdstuk 9
some-alt