Desafio: Implementando uma Árvore de Decisão
Neste desafio, será utilizado o conjunto de dados Titanic, que contém informações sobre os passageiros do Titanic, incluindo idade, sexo, tamanho da família e outros dados. O objetivo é prever se um passageiro sobreviveu ou não.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar a Árvore de Decisão, pode-se utilizar o DecisionTreeClassifier do sklearn:
Construtor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— profundidade máxima da árvore. Valor padrão é None;min_samples_leaf— instâncias mínimas em um nó folha. Valor padrão é 1;
Métodos:
fit(X, y)— Ajusta o conjunto de treinamento;predict(X)— Prediz a classe para X;score(X, y)— Retorna a acurácia para o conjunto X, y;
Atributos:
feature_importances_— Importância das variáveis;feature_names_in_— Nomes das variáveis vistos durante o .fit().
Sua tarefa é construir uma Árvore de Decisão e encontrar os melhores valores para max_depth e min_samples_leaf utilizando busca em grade.
Swipe to start coding
Você recebe um conjunto de dados do Titanic armazenado como um DataFrame na variável df.
- Inicialize um modelo de Árvore de Decisão e armazene-o na variável
decision_tree. - Crie um dicionário para o
GridSearchCViterar pelos valores[1, 2, 3, 4, 5, 6, 7]paramax_depthe[1, 2, 4, 6]paramin_samples_leaf, e armazene-o na variávelparam_grid. - Inicialize e treine um objeto
GridSearchCV, defina o número de folds como10e armazene o modelo treinado na variávelgrid_cv.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Incrível!
Completion taxa melhorada para 3.33
Desafio: Implementando uma Árvore de Decisão
Deslize para mostrar o menu
Neste desafio, será utilizado o conjunto de dados Titanic, que contém informações sobre os passageiros do Titanic, incluindo idade, sexo, tamanho da família e outros dados. O objetivo é prever se um passageiro sobreviveu ou não.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar a Árvore de Decisão, pode-se utilizar o DecisionTreeClassifier do sklearn:
Construtor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— profundidade máxima da árvore. Valor padrão é None;min_samples_leaf— instâncias mínimas em um nó folha. Valor padrão é 1;
Métodos:
fit(X, y)— Ajusta o conjunto de treinamento;predict(X)— Prediz a classe para X;score(X, y)— Retorna a acurácia para o conjunto X, y;
Atributos:
feature_importances_— Importância das variáveis;feature_names_in_— Nomes das variáveis vistos durante o .fit().
Sua tarefa é construir uma Árvore de Decisão e encontrar os melhores valores para max_depth e min_samples_leaf utilizando busca em grade.
Swipe to start coding
Você recebe um conjunto de dados do Titanic armazenado como um DataFrame na variável df.
- Inicialize um modelo de Árvore de Decisão e armazene-o na variável
decision_tree. - Crie um dicionário para o
GridSearchCViterar pelos valores[1, 2, 3, 4, 5, 6, 7]paramax_depthe[1, 2, 4, 6]paramin_samples_leaf, e armazene-o na variávelparam_grid. - Inicialize e treine um objeto
GridSearchCV, defina o número de folds como10e armazene o modelo treinado na variávelgrid_cv.
Solução
Obrigado pelo seu feedback!
single