Desafio: Implementando uma Árvore de Decisão
Neste desafio, será utilizado o conjunto de dados Titanic, que contém informações sobre os passageiros do Titanic, incluindo idade, sexo, tamanho da família e outros dados. O objetivo é prever se um passageiro sobreviveu ou não.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar a Árvore de Decisão, pode-se utilizar o DecisionTreeClassifier da biblioteca sklearn:
Sua tarefa é construir uma Árvore de Decisão e encontrar os melhores valores para max_depth e min_samples_leaf utilizando busca em grade.
Swipe to start coding
Você recebe um conjunto de dados do Titanic armazenado como um DataFrame na variável df.
- Inicialize um modelo de Árvore de Decisão e armazene-o na variável
decision_tree. - Crie um dicionário para o
GridSearchCVpara iterar pelos valores[1, 2, 3, 4, 5, 6, 7]paramax_depthe[1, 2, 4, 6]paramin_samples_leaf, e armazene-o na variávelparam_grid. - Inicialize e treine um objeto
GridSearchCV, defina o número de folds como10e armazene o modelo treinado na variávelgrid_cv.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 4.17
Desafio: Implementando uma Árvore de Decisão
Deslize para mostrar o menu
Neste desafio, será utilizado o conjunto de dados Titanic, que contém informações sobre os passageiros do Titanic, incluindo idade, sexo, tamanho da família e outros dados. O objetivo é prever se um passageiro sobreviveu ou não.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar a Árvore de Decisão, pode-se utilizar o DecisionTreeClassifier da biblioteca sklearn:
Sua tarefa é construir uma Árvore de Decisão e encontrar os melhores valores para max_depth e min_samples_leaf utilizando busca em grade.
Swipe to start coding
Você recebe um conjunto de dados do Titanic armazenado como um DataFrame na variável df.
- Inicialize um modelo de Árvore de Decisão e armazene-o na variável
decision_tree. - Crie um dicionário para o
GridSearchCVpara iterar pelos valores[1, 2, 3, 4, 5, 6, 7]paramax_depthe[1, 2, 4, 6]paramin_samples_leaf, e armazene-o na variávelparam_grid. - Inicialize e treine um objeto
GridSearchCV, defina o número de folds como10e armazene o modelo treinado na variávelgrid_cv.
Solução
Obrigado pelo seu feedback!
single