Sektion 3. Kapitel 4
single
Udfordring: Forbehandlingspipeline
Stryg for at vise menuen
Opgave
Swipe to start coding
Du får stillet Titanic-datasættet fra seaborn-biblioteket til rådighed.
Din opgave er at opbygge en fuldstændig forbehandlingspipeline, der udfører alle nødvendige datatransformationer før maskinlæring.
Følg disse trin:
- Indlæs datasættet med
sns.load_dataset("titanic"). - Håndter manglende værdier:
- Numeriske kolonner → udfyld med middelværdi.
- Kategoriske kolonner → udfyld med typetal.
- Kod de kategoriske variable
sexogembarkedved hjælp afpd.get_dummies(). - Skaler de numeriske kolonner
ageogfaremedStandardScaler. - Opret en ny feature
family_size = sibsp + parch + 1. - Kombinér alle transformationer i en funktion kaldet
preprocess_titanic(data), som returnerer det endeligt behandlede DataFrame. - Tildel det behandlede datasæt til en variabel kaldet
processed_data.
Udskriv de første 5 rækker af det endelige DataFrame.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 3. Kapitel 4
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat