Uitdaging: Het Creëren van een Volledige ML-Pijplijn
Maak nu een pipeline die een finale estimator bevat. Dit resulteert in een getrainde predictiepipeline die voorspellingen kan genereren voor nieuwe instanties met behulp van de .predict()-methode.
Omdat een voorspeller de doelvariabele y vereist, codeer deze afzonderlijk van de pipeline die voor X is gebouwd. Gebruik LabelEncoder om de doelvariabele te coderen.
Aangezien de voorspellingen gecodeerd zijn als 0, 1 of 2, kan de .inverse_transform()-methode van LabelEncoder worden gebruikt om deze terug te zetten naar de oorspronkelijke labels: 'Adelie', 'Chinstrap' of 'Gentoo'.
Swipe to start coding
Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Je opdracht is om een volledige machine learning-pijplijn te bouwen en te trainen die de data preprocesset en een KNeighborsClassifier-model toepast.
- Encodeer de doelvariabele
ymet behulp van de klasseLabelEncoder. - Maak een
ColumnTransformergenaamdctdie eenOneHotEncodertoepast op de kolommen'island'en'sex', terwijl de overige kolommen onveranderd blijven (remainder='passthrough'). - Maak een pijplijn die de volgende stappen in deze volgorde bevat:
- De door jou gedefinieerde
ColumnTransformer(ct); - Een
SimpleImputermet de parameterstrategyingesteld op'most_frequent'; - Een
StandardScalervoor feature scaling; - Een
KNeighborsClassifierals eindmodel.
- Train de pijplijn op de features
Xen de targety. - Genereer voorspellingen voor
Xmet de getrainde pijplijn en print de gedecodeerde klassenamen.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
How do I use LabelEncoder to encode the target variable?
Can you show me how to add a final estimator to the pipeline?
What is the purpose of encoding the target variable separately from the features?
Awesome!
Completion rate improved to 3.13
Uitdaging: Het Creëren van een Volledige ML-Pijplijn
Veeg om het menu te tonen
Maak nu een pipeline die een finale estimator bevat. Dit resulteert in een getrainde predictiepipeline die voorspellingen kan genereren voor nieuwe instanties met behulp van de .predict()-methode.
Omdat een voorspeller de doelvariabele y vereist, codeer deze afzonderlijk van de pipeline die voor X is gebouwd. Gebruik LabelEncoder om de doelvariabele te coderen.
Aangezien de voorspellingen gecodeerd zijn als 0, 1 of 2, kan de .inverse_transform()-methode van LabelEncoder worden gebruikt om deze terug te zetten naar de oorspronkelijke labels: 'Adelie', 'Chinstrap' of 'Gentoo'.
Swipe to start coding
Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Je opdracht is om een volledige machine learning-pijplijn te bouwen en te trainen die de data preprocesset en een KNeighborsClassifier-model toepast.
- Encodeer de doelvariabele
ymet behulp van de klasseLabelEncoder. - Maak een
ColumnTransformergenaamdctdie eenOneHotEncodertoepast op de kolommen'island'en'sex', terwijl de overige kolommen onveranderd blijven (remainder='passthrough'). - Maak een pijplijn die de volgende stappen in deze volgorde bevat:
- De door jou gedefinieerde
ColumnTransformer(ct); - Een
SimpleImputermet de parameterstrategyingesteld op'most_frequent'; - Een
StandardScalervoor feature scaling; - Een
KNeighborsClassifierals eindmodel.
- Train de pijplijn op de features
Xen de targety. - Genereer voorspellingen voor
Xmet de getrainde pijplijn en print de gedecodeerde klassenamen.
Oplossing
Bedankt voor je feedback!
single