Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Criando Recursos de Interação | Engenharia de Atributos para Aprendizado de Máquina
Pré-Processamento de Dados e Engenharia de Features

bookCriando Recursos de Interação

Note
Definição

Recursos de interação são novas variáveis formadas pela combinação de dois ou mais atributos existentes, frequentemente por meio de operações matemáticas como multiplicação, divisão ou adição, para refletir como essas variáveis influenciam conjuntamente o alvo.

A criação de recursos de interação permite capturar relações complexas entre variáveis no conjunto de dados do Titanic, como Age, Fare, Pclass e Sex. A influência de uma variável sobre a sobrevivência pode depender do valor de outra variável. Por exemplo, o efeito da classe do passageiro na sobrevivência pode ser diferente para homens e mulheres, ou passageiros mais jovens podem se beneficiar mais de tarifas mais altas. Ao combinar atributos como Age * Fare ou Pclass * Sex_encoded, o modelo pode aprender esses padrões mais sutis, melhorando sua capacidade de prever quem sobreviveu com base em como as variáveis interagem.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Qual das alternativas a seguir ilustra melhor uma característica de interação útil no conjunto de dados do Titanic, como combinar Age * Fare ou Pclass * Sex_encoded para capturar relações entre variáveis?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 2

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Suggested prompts:

Can you explain how these interaction features improve model performance?

What other interaction features could be useful for the Titanic dataset?

How do I interpret the values of these new features?

Awesome!

Completion rate improved to 8.33

bookCriando Recursos de Interação

Deslize para mostrar o menu

Note
Definição

Recursos de interação são novas variáveis formadas pela combinação de dois ou mais atributos existentes, frequentemente por meio de operações matemáticas como multiplicação, divisão ou adição, para refletir como essas variáveis influenciam conjuntamente o alvo.

A criação de recursos de interação permite capturar relações complexas entre variáveis no conjunto de dados do Titanic, como Age, Fare, Pclass e Sex. A influência de uma variável sobre a sobrevivência pode depender do valor de outra variável. Por exemplo, o efeito da classe do passageiro na sobrevivência pode ser diferente para homens e mulheres, ou passageiros mais jovens podem se beneficiar mais de tarifas mais altas. Ao combinar atributos como Age * Fare ou Pclass * Sex_encoded, o modelo pode aprender esses padrões mais sutis, melhorando sua capacidade de prever quem sobreviveu com base em como as variáveis interagem.

1234567891011121314151617181920
import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
copy
question mark

Qual das alternativas a seguir ilustra melhor uma característica de interação útil no conjunto de dados do Titanic, como combinar Age * Fare ou Pclass * Sex_encoded para capturar relações entre variáveis?

Select the correct answer

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 2
some-alt