Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Skalering av Funksjonene | Forbehandling av Data med Scikit-learn
Introduksjon til ML med Scikit-learn

bookUtfordring: Skalering av Funksjonene

I denne utfordringen skal du skalere egenskapene i penguins-datasettet (allerede kodet og uten manglende verdier) ved å bruke StandardScaler.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed_encoded.csv') print(df)
copy

Her er en liten påminnelse om StandardScaler-klassen.

Oppgave

Swipe to start coding

Du har fått en DataFrame kalt df som inneholder kodede og imputerte pingvindata. Målet ditt er å standardisere alle funksjonsverdier slik at hver kolonne har et gjennomsnitt på 0 og en varians på 1. Dette sikrer at funksjonene er på samme skala før du trener en maskinlæringsmodell.

  1. Importer klassen StandardScaler fra sklearn.preprocessing.
  2. Skill ut funksjonsmatrisen X og målvariabelen y fra DataFrame-en.
  3. Opprett et StandardScaler-objekt.
  4. Bruk skaleringen på funksjonsmatrisen X og lagre de skalerte verdiene tilbake i X.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 11
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 3.13

bookUtfordring: Skalering av Funksjonene

Sveip for å vise menyen

I denne utfordringen skal du skalere egenskapene i penguins-datasettet (allerede kodet og uten manglende verdier) ved å bruke StandardScaler.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed_encoded.csv') print(df)
copy

Her er en liten påminnelse om StandardScaler-klassen.

Oppgave

Swipe to start coding

Du har fått en DataFrame kalt df som inneholder kodede og imputerte pingvindata. Målet ditt er å standardisere alle funksjonsverdier slik at hver kolonne har et gjennomsnitt på 0 og en varians på 1. Dette sikrer at funksjonene er på samme skala før du trener en maskinlæringsmodell.

  1. Importer klassen StandardScaler fra sklearn.preprocessing.
  2. Skill ut funksjonsmatrisen X og målvariabelen y fra DataFrame-en.
  3. Opprett et StandardScaler-objekt.
  4. Bruk skaleringen på funksjonsmatrisen X og lagre de skalerte verdiene tilbake i X.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 11
single

single

some-alt