Sfida: Codifica delle Variabili Categoriche
Per riassumere i tre capitoli precedenti, ecco una tabella che mostra quale encoder utilizzare:
In questa sfida, si lavora con il penguins dataset (nessun valore mancante). Tutte le caratteristiche categoriche — incluso il target 'species' — devono essere codificate per l'utilizzo nel ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Ricorda che 'island' e 'sex' sono feature categoriche e 'species' è un target categorico.
Swipe to start coding
Ti viene fornito un DataFrame df. Codifica tutte le colonne categoriche:
- Importa
OneHotEncodereLabelEncoderdasklearn.preprocessing. - Suddividi i dati in
X(feature) ey(target). - Crea un
OneHotEncodere applicalo alle colonne'island'e'sex'inX. - Sostituisci queste colonne originali con le loro versioni codificate.
- Utilizza
LabelEncodersulla colonna'species'per codificarey.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
What are the steps to encode the categorical features and target in this dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
How do I choose which encoder to use for each column in the penguins dataset?
Fantastico!
Completion tasso migliorato a 3.13
Sfida: Codifica delle Variabili Categoriche
Scorri per mostrare il menu
Per riassumere i tre capitoli precedenti, ecco una tabella che mostra quale encoder utilizzare:
In questa sfida, si lavora con il penguins dataset (nessun valore mancante). Tutte le caratteristiche categoriche — incluso il target 'species' — devono essere codificate per l'utilizzo nel ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Ricorda che 'island' e 'sex' sono feature categoriche e 'species' è un target categorico.
Swipe to start coding
Ti viene fornito un DataFrame df. Codifica tutte le colonne categoriche:
- Importa
OneHotEncodereLabelEncoderdasklearn.preprocessing. - Suddividi i dati in
X(feature) ey(target). - Crea un
OneHotEncodere applicalo alle colonne'island'e'sex'inX. - Sostituisci queste colonne originali con le loro versioni codificate.
- Utilizza
LabelEncodersulla colonna'species'per codificarey.
Soluzione
Grazie per i tuoi commenti!
single