Sfida: Implementazione di un Albero Decisionale
In questa sfida, verrà utilizzato il dataset Titanic, che contiene informazioni sui passeggeri del Titanic, inclusi età, sesso, dimensione della famiglia e altro. L'obiettivo è prevedere se un passeggero sia sopravvissuto o meno.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Per implementare l'albero decisionale, è possibile utilizzare DecisionTreeClassifier da sklearn:
Costruttore:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— profondità massima dell'albero. Il valore predefinito è None;min_samples_leaf— numero minimo di istanze in un nodo foglia. Il valore predefinito è 1;
Metodi:
fit(X, y)— Adattamento al set di addestramento;predict(X)— Predizione della classe per X;score(X, y)— Restituisce l'accuratezza per il set X, y;
Attributi:
feature_importances_— Importanza delle caratteristiche;feature_names_in_— Nomi delle caratteristiche visti durante .fit().
Il compito consiste nel costruire un albero decisionale e individuare i valori ottimali di max_depth e min_samples_leaf utilizzando la ricerca a griglia.
Swipe to start coding
Ti viene fornito un dataset Titanic memorizzato come DataFrame nella variabile df.
- Inizializzare un modello Decision Tree e salvarlo nella variabile
decision_tree. - Creare un dizionario per
GridSearchCVper iterare sui valori[1, 2, 3, 4, 5, 6, 7]permax_depthe[1, 2, 4, 6]permin_samples_leaf, e salvarlo nella variabileparam_grid. - Inizializzare e addestrare un oggetto
GridSearchCV, impostare il numero di fold a10e salvare il modello addestrato nella variabilegrid_cv.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Fantastico!
Completion tasso migliorato a 3.33
Sfida: Implementazione di un Albero Decisionale
Scorri per mostrare il menu
In questa sfida, verrà utilizzato il dataset Titanic, che contiene informazioni sui passeggeri del Titanic, inclusi età, sesso, dimensione della famiglia e altro. L'obiettivo è prevedere se un passeggero sia sopravvissuto o meno.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Per implementare l'albero decisionale, è possibile utilizzare DecisionTreeClassifier da sklearn:
Costruttore:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— profondità massima dell'albero. Il valore predefinito è None;min_samples_leaf— numero minimo di istanze in un nodo foglia. Il valore predefinito è 1;
Metodi:
fit(X, y)— Adattamento al set di addestramento;predict(X)— Predizione della classe per X;score(X, y)— Restituisce l'accuratezza per il set X, y;
Attributi:
feature_importances_— Importanza delle caratteristiche;feature_names_in_— Nomi delle caratteristiche visti durante .fit().
Il compito consiste nel costruire un albero decisionale e individuare i valori ottimali di max_depth e min_samples_leaf utilizzando la ricerca a griglia.
Swipe to start coding
Ti viene fornito un dataset Titanic memorizzato come DataFrame nella variabile df.
- Inizializzare un modello Decision Tree e salvarlo nella variabile
decision_tree. - Creare un dizionario per
GridSearchCVper iterare sui valori[1, 2, 3, 4, 5, 6, 7]permax_depthe[1, 2, 4, 6]permin_samples_leaf, e salvarlo nella variabileparam_grid. - Inizializzare e addestrare un oggetto
GridSearchCV, impostare il numero di fold a10e salvare il modello addestrato nella variabilegrid_cv.
Soluzione
Grazie per i tuoi commenti!
single