Criando Recursos de Interação
Recursos de interação são novas variáveis formadas pela combinação de dois ou mais atributos existentes, frequentemente por meio de operações matemáticas como multiplicação, divisão ou adição, para refletir como essas variáveis influenciam conjuntamente o alvo.
A criação de recursos de interação permite capturar relações complexas entre variáveis no conjunto de dados do Titanic, como Age, Fare, Pclass e Sex. A influência de uma variável sobre a sobrevivência pode depender do valor de outra variável. Por exemplo, o efeito da classe do passageiro na sobrevivência pode ser diferente para homens e mulheres, ou passageiros mais jovens podem se beneficiar mais de tarifas mais altas. Ao combinar atributos como Age * Fare ou Pclass * Sex_encoded, o modelo pode aprender esses padrões mais sutis, melhorando sua capacidade de prever quem sobreviveu com base em como as variáveis interagem.
1234567891011121314151617181920import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Can you explain how these interaction features improve model performance?
What other interaction features could be useful for the Titanic dataset?
How do I interpret the values of these new features?
Awesome!
Completion rate improved to 8.33
Criando Recursos de Interação
Deslize para mostrar o menu
Recursos de interação são novas variáveis formadas pela combinação de dois ou mais atributos existentes, frequentemente por meio de operações matemáticas como multiplicação, divisão ou adição, para refletir como essas variáveis influenciam conjuntamente o alvo.
A criação de recursos de interação permite capturar relações complexas entre variáveis no conjunto de dados do Titanic, como Age, Fare, Pclass e Sex. A influência de uma variável sobre a sobrevivência pode depender do valor de outra variável. Por exemplo, o efeito da classe do passageiro na sobrevivência pode ser diferente para homens e mulheres, ou passageiros mais jovens podem se beneficiar mais de tarifas mais altas. Ao combinar atributos como Age * Fare ou Pclass * Sex_encoded, o modelo pode aprender esses padrões mais sutis, melhorando sua capacidade de prever quem sobreviveu com base em como as variáveis interagem.
1234567891011121314151617181920import pandas as pd # Sample Titanic-like dataset data = { "Age": [22, 38, 26, 35, 28], "Fare": [7.25, 71.28, 7.92, 53.10, 8.05], "Pclass": [3, 1, 3, 1, 3], "Sex": ["male", "female", "female", "female", "male"], "Survived": [0, 1, 1, 1, 0] } df = pd.DataFrame(data) # Encode 'Sex' as a numeric feature df["Sex_encoded"] = df["Sex"].map({"male": 0, "female": 1}) # Create interaction features df["Age_Fare_product"] = df["Age"] * df["Fare"] df["Pclass_Sex_interaction"] = df["Pclass"] * df["Sex_encoded"] print(df[["Age", "Fare", "Pclass", "Sex", "Age_Fare_product", "Pclass_Sex_interaction", "Survived"]])
Obrigado pelo seu feedback!