Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Skalering af Funktionerne | Forbehandling af Data med Scikit-learn
ML Introduktion med Scikit-learn

bookUdfordring: Skalering af Funktionerne

I denne udfordring skal du skalere funktionerne i penguins-datasættet (allerede kodet og uden manglende værdier) ved hjælp af StandardScaler.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed_encoded.csv') print(df)
copy

Her er en lille påmindelse om StandardScaler-klassen.

Opgave

Swipe to start coding

Du har fået en DataFrame ved navn df, som indeholder kodede og imputerede pingvindata. Dit mål er at standardisere alle feature-værdier, så hver kolonne har et gennemsnit på 0 og en varians på 1. Dette sikrer, at alle features er på samme skala, inden du træner en maskinlæringsmodel.

  1. Importér klassen StandardScaler fra sklearn.preprocessing.
  2. Adskil feature-matrixen X og målvariablen y fra DataFrame.
  3. Opret et StandardScaler-objekt.
  4. Anvend scaleren på feature-matrixen X og gem de skalerede værdier tilbage i X.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 11
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Skalering af Funktionerne

Stryg for at vise menuen

I denne udfordring skal du skalere funktionerne i penguins-datasættet (allerede kodet og uden manglende værdier) ved hjælp af StandardScaler.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed_encoded.csv') print(df)
copy

Her er en lille påmindelse om StandardScaler-klassen.

Opgave

Swipe to start coding

Du har fået en DataFrame ved navn df, som indeholder kodede og imputerede pingvindata. Dit mål er at standardisere alle feature-værdier, så hver kolonne har et gennemsnit på 0 og en varians på 1. Dette sikrer, at alle features er på samme skala, inden du træner en maskinlæringsmodel.

  1. Importér klassen StandardScaler fra sklearn.preprocessing.
  2. Adskil feature-matrixen X og målvariablen y fra DataFrame.
  3. Opret et StandardScaler-objekt.
  4. Anvend scaleren på feature-matrixen X og gem de skalerede værdier tilbage i X.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 11
single

single

some-alt