Sfida: Implementazione di un Albero Decisionale
In questa sfida, utilizzerai il dataset Titanic, che contiene informazioni sui passeggeri del Titanic, inclusi età, sesso, dimensione della famiglia e altro ancora. L'obiettivo è prevedere se un passeggero è sopravvissuto o meno.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Per implementare l'albero decisionale, puoi utilizzare DecisionTreeClassifier da sklearn:
Il tuo compito è costruire un albero decisionale e trovare i valori ottimali di max_depth e min_samples_leaf utilizzando la ricerca a griglia.
Swipe to start coding
Ti viene fornito un dataset Titanic memorizzato come DataFrame nella variabile df.
- Inizializza un modello Decision Tree e salvalo nella variabile
decision_tree. - Crea un dizionario per
GridSearchCVper iterare sui valori[1, 2, 3, 4, 5, 6, 7]permax_depthe[1, 2, 4, 6]permin_samples_leaf, e salvalo nella variabileparam_grid. - Inizializza e addestra un oggetto
GridSearchCV, imposta il numero di fold a10e salva il modello addestrato nella variabilegrid_cv.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 4.17
Sfida: Implementazione di un Albero Decisionale
Scorri per mostrare il menu
In questa sfida, utilizzerai il dataset Titanic, che contiene informazioni sui passeggeri del Titanic, inclusi età, sesso, dimensione della famiglia e altro ancora. L'obiettivo è prevedere se un passeggero è sopravvissuto o meno.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Per implementare l'albero decisionale, puoi utilizzare DecisionTreeClassifier da sklearn:
Il tuo compito è costruire un albero decisionale e trovare i valori ottimali di max_depth e min_samples_leaf utilizzando la ricerca a griglia.
Swipe to start coding
Ti viene fornito un dataset Titanic memorizzato come DataFrame nella variabile df.
- Inizializza un modello Decision Tree e salvalo nella variabile
decision_tree. - Crea un dizionario per
GridSearchCVper iterare sui valori[1, 2, 3, 4, 5, 6, 7]permax_depthe[1, 2, 4, 6]permin_samples_leaf, e salvalo nella variabileparam_grid. - Inizializza e addestra un oggetto
GridSearchCV, imposta il numero di fold a10e salva il modello addestrato nella variabilegrid_cv.
Soluzione
Grazie per i tuoi commenti!
single