Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Varför Skala Data? | Förbehandling av Data med Scikit-learn
Introduktion till maskininlärning med Python

Varför Skala Data?

Svep för att visa menyn

Efter att ha hanterat saknade värden och kodat kategoriska variabler är datasettet fritt från problem som skulle orsaka fel i modellen. Dock återstår en annan utmaning: olika skalor på variablerna.

Olika skalor

Detta problem kommer inte att orsaka fel om du matar in data i nuvarande skick till modellen, men det kan avsevärt försämra vissa ML-modeller.

Tänk på ett exempel där en egenskap är 'age', med värden från 18 till 50, och den andra egenskapen är 'income', med värden från $25,000 till $500,000. Det är tydligt att en skillnad på tio år i ålder är mer betydelsefull än en skillnad på tio dollar i inkomst.

Vissa modeller, såsom k-NN (som vi kommer att använda i denna kurs), kan dock behandla dessa skillnader som lika viktiga. Därför kommer kolumnen 'income' att ha en mycket större inverkan på modellen. Det är därför viktigt att egenskaper har ungefär samma intervall för att k-NN ska fungera effektivt.

Även om andra modeller kan påverkas mindre av olika skalor, kan skalning av data avsevärt förbättra bearbetningshastigheten. Därför ingår datascalning ofta som ett sista steg i förbehandlingen.

Note
Notering

Som nämnts ovan är datascalning vanligtvis det sista steget i förbehandlingsfasen. Det beror på att förändringar av egenskaper efter skalning kan göra att datan inte längre är skalad.

Nästa kapitel kommer att behandla de tre mest använda transformatorerna för datascalning. Dessa är StandardScaler, MinMaxScaler och MaxAbsScaler.

question mark

Varför är det viktigt att skala funktioner i maskininlärningsmodeller som k-närmaste grannar (KNN)?

Vänligen välj det korrekta svaret

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 9

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 2. Kapitel 9
some-alt