Utfordring: Lage en Komplett ML-Pipeline
Lag nå en pipeline som inkluderer en slutt- estimator. Dette gir en trent prediksjonspipeline som kan generere prediksjoner for nye instanser ved å bruke .predict()-metoden.
Siden en prediktor krever målvariabelen y, må denne kodes separat fra pipelinen som bygges for X. Bruk LabelEncoder for å kode målet.
Siden prediksjonene er kodet som 0, 1 eller 2, kan .inverse_transform()-metoden til LabelEncoder brukes for å konvertere dem tilbake til de opprinnelige etikettene: 'Adelie', 'Chinstrap' eller 'Gentoo'.
Swipe to start coding
Du har fått en DataFrame kalt df som inneholder pingvindata.
Din oppgave er å bygge og trene en komplett maskinlærings-pipeline som forhåndsprosesserer dataene og bruker en KNeighborsClassifier-modell.
- Koder målvariabelen
yved hjelp av klassenLabelEncoder. - Opprett en
ColumnTransformerkaltctsom bruker enOneHotEncoderpå kolonnene'island'og'sex', mens de andre kolonnene forblir uendret (remainder='passthrough'). - Lag en pipeline som inkluderer følgende steg i rekkefølge:
ColumnTransformer-en du definerte (ct);
- En
SimpleImputermed parameterenstrategysatt til'most_frequent'; - En
StandardScalerfor skalering av funksjoner; - En
KNeighborsClassifiersom sluttmodell.
- Tren pipelinen på funksjonene
Xog målvariabeleny. - Generer prediksjoner for
Xved å bruke den trente pipelinen og skriv ut de dekodede klassenavnene.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
How do I use LabelEncoder to encode the target variable?
Can you show me how to add a final estimator to the pipeline?
What is the purpose of encoding the target variable separately from the features?
Awesome!
Completion rate improved to 3.13
Utfordring: Lage en Komplett ML-Pipeline
Sveip for å vise menyen
Lag nå en pipeline som inkluderer en slutt- estimator. Dette gir en trent prediksjonspipeline som kan generere prediksjoner for nye instanser ved å bruke .predict()-metoden.
Siden en prediktor krever målvariabelen y, må denne kodes separat fra pipelinen som bygges for X. Bruk LabelEncoder for å kode målet.
Siden prediksjonene er kodet som 0, 1 eller 2, kan .inverse_transform()-metoden til LabelEncoder brukes for å konvertere dem tilbake til de opprinnelige etikettene: 'Adelie', 'Chinstrap' eller 'Gentoo'.
Swipe to start coding
Du har fått en DataFrame kalt df som inneholder pingvindata.
Din oppgave er å bygge og trene en komplett maskinlærings-pipeline som forhåndsprosesserer dataene og bruker en KNeighborsClassifier-modell.
- Koder målvariabelen
yved hjelp av klassenLabelEncoder. - Opprett en
ColumnTransformerkaltctsom bruker enOneHotEncoderpå kolonnene'island'og'sex', mens de andre kolonnene forblir uendret (remainder='passthrough'). - Lag en pipeline som inkluderer følgende steg i rekkefølge:
ColumnTransformer-en du definerte (ct);
- En
SimpleImputermed parameterenstrategysatt til'most_frequent'; - En
StandardScalerfor skalering av funksjoner; - En
KNeighborsClassifiersom sluttmodell.
- Tren pipelinen på funksjonene
Xog målvariabeleny. - Generer prediksjoner for
Xved å bruke den trente pipelinen og skriv ut de dekodede klassenavnene.
Løsning
Takk for tilbakemeldingene dine!
single