Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio: Implementando uma Random Forest | Random Forest
Classificação com Python

bookDesafio: Implementando uma Random Forest

No sklearn, a versão de classificação da Random Forest é implementada usando o RandomForestClassifier:

Você também calculará a acurácia da validação cruzada utilizando a função cross_val_score():

Ao final, será exibida a importância de cada atributo. O atributo feature_importances_ retorna um array com os escores de importância — esses escores representam o quanto cada atributo contribuiu para reduzir a impureza de Gini em todos os nós de decisão onde esse atributo foi utilizado. Em outras palavras, quanto mais um atributo ajuda a dividir os dados de forma útil, maior sua importância.

No entanto, o atributo fornece apenas os escores sem os nomes dos atributos. Para exibir ambos, é possível associá-los utilizando a função zip() do Python:

for feature, importance in zip(X.columns, model.feature_importances_):
    print(feature, importance)

Isso imprime cada nome de atributo junto com seu escore de importância, facilitando a compreensão de quais atributos o modelo mais utilizou.

Tarefa

Swipe to start coding

Você recebe um conjunto de dados do Titanic armazenado como um DataFrame na variável df.

  • Inicialize o modelo de Random Forest, defina random_state=42, treine-o e armazene o modelo ajustado na variável random_forest.
  • Calcule as pontuações de validação cruzada para o modelo treinado utilizando 10 divisões, e armazene os resultados na variável cv_scores.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 3
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 4.17

bookDesafio: Implementando uma Random Forest

Deslize para mostrar o menu

No sklearn, a versão de classificação da Random Forest é implementada usando o RandomForestClassifier:

Você também calculará a acurácia da validação cruzada utilizando a função cross_val_score():

Ao final, será exibida a importância de cada atributo. O atributo feature_importances_ retorna um array com os escores de importância — esses escores representam o quanto cada atributo contribuiu para reduzir a impureza de Gini em todos os nós de decisão onde esse atributo foi utilizado. Em outras palavras, quanto mais um atributo ajuda a dividir os dados de forma útil, maior sua importância.

No entanto, o atributo fornece apenas os escores sem os nomes dos atributos. Para exibir ambos, é possível associá-los utilizando a função zip() do Python:

for feature, importance in zip(X.columns, model.feature_importances_):
    print(feature, importance)

Isso imprime cada nome de atributo junto com seu escore de importância, facilitando a compreensão de quais atributos o modelo mais utilizou.

Tarefa

Swipe to start coding

Você recebe um conjunto de dados do Titanic armazenado como um DataFrame na variável df.

  • Inicialize o modelo de Random Forest, defina random_state=42, treine-o e armazene o modelo ajustado na variável random_forest.
  • Calcule as pontuações de validação cruzada para o modelo treinado utilizando 10 divisões, e armazene os resultados na variável cv_scores.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 3
single

single

some-alt