Lære Datanormalisering | Kernekoncepter

Datanormalisering er et kritisk forbehandlingsskridt for mange klyngealgoritmer, herunder K-means. Funktioner i virkelige datasæt har ofte forskellige skalaer og enheder. Algoritmer, der er afhængige af afstandsberegninger, såsom K-means, kan blive stærkt påvirket af funktioner med større skalaer. Normalisering har til formål at bringe alle funktioner til en lignende skala og forhindre, at funktioner med større værdier dominerer klyngeprocessen.

StandardScaler

StandardScaler standardiserer funktioner ved at fjerne middelværdien og skalere til enhedsvarians. Den transformerer data, så de har en middelværdi på 0 og en standardafvigelse på 1. Dette opnås ved at trække middelværdien fra og dividere med standardafvigelsen for hver funktion.

StandardScaler er effektiv, når dine data er omtrent normalt fordelt. Det er meget anvendt og ofte en god standard normaliseringsmetode for mange algoritmer.

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
features = df[['feature1', 'feature2']]

df[['feature1', 'feature2']] = scaler.fit_transform(features)

MinMaxScaler

MinMaxScaler skalerer funktioner til et specifikt interval, typisk mellem 0 og 1. Den transformerer data ved at skalere og flytte hver funktion individuelt, så den ligger inden for det givne interval.

MinMaxScaler er nyttig, når du har brug for værdier inden for et specifikt interval, eller når dine data ikke er normalt fordelt. Den bevarer formen af den oprindelige fordeling, blot skaleret til det nye interval.

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()
features = df[['feature1', 'feature2']]

df[['feature1', 'feature2']] = scaler.fit_transform(features)

Valget mellem StandardScaler og MinMaxScaler afhænger af dine data og den specifikke algoritme. StandardScaler foretrækkes ofte til algoritmer som K-means, når funktionerne er nogenlunde normalt fordelt. MinMaxScaler kan være nyttig, når du har brug for afgrænsede værdier eller når data ikke er normalt fordelt.

Var alt klart?

Tak for dine kommentarer!

Sektion 2. Kapitel 3

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 2.94

Stryg for at vise menuen