Sfida: Codifica delle Variabili Categoriali
Per riassumere i precedenti tre capitoli, ecco una tabella che mostra quale codificatore dovresti utilizzare:
In questa sfida viene fornito il dataset dei pinguini (senza valori mancanti). Tutte le caratteristiche categoriche, inclusa la variabile target (colonna 'species'), devono essere codificate.
Ecco un promemoria della struttura del dataset:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Ricorda che 'island' e 'sex' sono feature categoriche e 'species' è un target categorico.
Swipe to start coding
Ti viene fornito un DataFrame chiamato df che contiene dati sui pinguini.
Il tuo compito è codificare tutte le caratteristiche categoriche affinché i dati possano essere utilizzati in un modello di machine learning.
- Importa le classi
OneHotEncodereLabelEncoderdasklearn.preprocessing. - Separa la matrice delle caratteristiche
Xe la variabile targetydalDataFrame. - Crea un oggetto
OneHotEncodere applicalo alle colonne'island'e'sex'inX. - Sostituisci le colonne categoriche originali con quelle codificate.
- Crea un oggetto
LabelEncodere applicalo alla colonna'species'per codificare la variabile targety.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Sfida: Codifica delle Variabili Categoriali
Scorri per mostrare il menu
Per riassumere i precedenti tre capitoli, ecco una tabella che mostra quale codificatore dovresti utilizzare:
In questa sfida viene fornito il dataset dei pinguini (senza valori mancanti). Tutte le caratteristiche categoriche, inclusa la variabile target (colonna 'species'), devono essere codificate.
Ecco un promemoria della struttura del dataset:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Ricorda che 'island' e 'sex' sono feature categoriche e 'species' è un target categorico.
Swipe to start coding
Ti viene fornito un DataFrame chiamato df che contiene dati sui pinguini.
Il tuo compito è codificare tutte le caratteristiche categoriche affinché i dati possano essere utilizzati in un modello di machine learning.
- Importa le classi
OneHotEncodereLabelEncoderdasklearn.preprocessing. - Separa la matrice delle caratteristiche
Xe la variabile targetydalDataFrame. - Crea un oggetto
OneHotEncodere applicalo alle colonne'island'e'sex'inX. - Sostituisci le colonne categoriche originali con quelle codificate.
- Crea un oggetto
LabelEncodere applicalo alla colonna'species'per codificare la variabile targety.
Soluzione
Grazie per i tuoi commenti!
single