Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Creazione di Caratteristiche di Interazione | Ingegneria delle Caratteristiche per l'Apprendimento Automatico
Preprocessing dei Dati e Feature Engineering

bookCreazione di Caratteristiche di Interazione

Note
Definizione

Le feature di interazione sono nuove variabili ottenute combinando due o più feature esistenti, spesso tramite operazioni matematiche come moltiplicazione, divisione o addizione, per riflettere come queste variabili influenzano congiuntamente il target.

La creazione di feature di interazione consente di catturare relazioni complesse tra variabili nel dataset Titanic, come Age, Fare, Pclass e Sex. L'influenza di una variabile sulla sopravvivenza può dipendere dal valore di un'altra variabile. Ad esempio, l'effetto della classe del passeggero sulla sopravvivenza può variare tra maschi e femmine, oppure i passeggeri più giovani potrebbero beneficiare maggiormente di tariffe più alte. Combinando feature come Age * Fare o Pclass * Sex_encoded, si permette al modello di apprendere questi pattern più sfumati, migliorando la capacità di prevedere chi è sopravvissuto in base all'interazione tra le variabili.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Quale delle seguenti opzioni illustra meglio una caratteristica di interazione utile nel dataset Titanic, come la combinazione di Age * Fare o Pclass * Sex_encoded per catturare le relazioni tra variabili?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 2

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain how these interaction features improve model performance?

What other interaction features could be useful for the Titanic dataset?

How do I interpret the values of these new features?

bookCreazione di Caratteristiche di Interazione

Scorri per mostrare il menu

Note
Definizione

Le feature di interazione sono nuove variabili ottenute combinando due o più feature esistenti, spesso tramite operazioni matematiche come moltiplicazione, divisione o addizione, per riflettere come queste variabili influenzano congiuntamente il target.

La creazione di feature di interazione consente di catturare relazioni complesse tra variabili nel dataset Titanic, come Age, Fare, Pclass e Sex. L'influenza di una variabile sulla sopravvivenza può dipendere dal valore di un'altra variabile. Ad esempio, l'effetto della classe del passeggero sulla sopravvivenza può variare tra maschi e femmine, oppure i passeggeri più giovani potrebbero beneficiare maggiormente di tariffe più alte. Combinando feature come Age * Fare o Pclass * Sex_encoded, si permette al modello di apprendere questi pattern più sfumati, migliorando la capacità di prevedere chi è sopravvissuto in base all'interazione tra le variabili.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Quale delle seguenti opzioni illustra meglio una caratteristica di interazione utile nel dataset Titanic, come la combinazione di Age * Fare o Pclass * Sex_encoded per catturare le relazioni tra variabili?

Select the correct answer

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 2
some-alt