Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Creazione di Caratteristiche di Interazione | Ingegneria delle Caratteristiche per l'Apprendimento Automatico
Preprocessing dei Dati e Feature Engineering

bookCreazione di Caratteristiche di Interazione

Note
Definizione

Le feature di interazione sono nuove variabili ottenute combinando due o più feature esistenti, spesso tramite operazioni matematiche come moltiplicazione, divisione o addizione, per riflettere come queste variabili influenzano congiuntamente il target.

La creazione di feature di interazione consente di catturare relazioni complesse tra variabili nel dataset Titanic, come Age, Fare, Pclass e Sex. L'influenza di una variabile sulla sopravvivenza può dipendere dal valore di un'altra variabile. Ad esempio, l'effetto della classe del passeggero sulla sopravvivenza può variare tra maschi e femmine, oppure i passeggeri più giovani potrebbero beneficiare maggiormente di tariffe più alte. Combinando feature come Age * Fare o Pclass * Sex_encoded, si permette al modello di apprendere questi pattern più sfumati, migliorando la capacità di prevedere chi è sopravvissuto in base all'interazione tra le variabili.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Quale delle seguenti opzioni illustra meglio una caratteristica di interazione utile nel dataset Titanic, come la combinazione di Age * Fare o Pclass * Sex_encoded per catturare le relazioni tra variabili?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 2

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain how these interaction features improve model performance?

What other interaction features could be useful for the Titanic dataset?

How do I interpret the values of these new features?

Awesome!

Completion rate improved to 8.33

bookCreazione di Caratteristiche di Interazione

Scorri per mostrare il menu

Note
Definizione

Le feature di interazione sono nuove variabili ottenute combinando due o più feature esistenti, spesso tramite operazioni matematiche come moltiplicazione, divisione o addizione, per riflettere come queste variabili influenzano congiuntamente il target.

La creazione di feature di interazione consente di catturare relazioni complesse tra variabili nel dataset Titanic, come Age, Fare, Pclass e Sex. L'influenza di una variabile sulla sopravvivenza può dipendere dal valore di un'altra variabile. Ad esempio, l'effetto della classe del passeggero sulla sopravvivenza può variare tra maschi e femmine, oppure i passeggeri più giovani potrebbero beneficiare maggiormente di tariffe più alte. Combinando feature come Age * Fare o Pclass * Sex_encoded, si permette al modello di apprendere questi pattern più sfumati, migliorando la capacità di prevedere chi è sopravvissuto in base all'interazione tra le variabili.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Quale delle seguenti opzioni illustra meglio una caratteristica di interazione utile nel dataset Titanic, come la combinazione di Age * Fare o Pclass * Sex_encoded per catturare le relazioni tra variabili?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 2
some-alt