Utfordring: Implementering av et Beslutningstre
I denne utfordringen skal du bruke Titanic-datasettet, som inneholder informasjon om passasjerene på Titanic, inkludert alder, kjønn, familiestørrelse og mer. Målet er å forutsi om en passasjer overlevde eller ikke.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For å implementere Decision Tree kan du bruke DecisionTreeClassifier fra sklearn:
Konstruktør:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— maksimal dybde på treet. Standardverdi er None;min_samples_leaf— minimum antall forekomster i et bladnode. Standardverdi er 1;
Metoder:
fit(X, y)— Tilpass treningssettet;predict(X)— Forutsi klassen for X;score(X, y)— Returnerer nøyaktigheten for X, y-settet;
Attributter:
feature_importances_— Viktighet av egenskaper;feature_names_in_— Egenskapsnavn sett under .fit().
Oppgaven er å bygge et beslutningstre og finne den beste verdien for max_depth og min_samples_leaf ved hjelp av grid search.
Swipe to start coding
Du har fått et Titanic-datasett lagret som en DataFrame i variabelen df.
- Initialiser en Decision Tree-modell og lagre den i variabelen
decision_tree. - Opprett en ordbok for
GridSearchCVsom itererer gjennom verdiene[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og lagre den i variabelenparam_grid. - Initialiser og tren et
GridSearchCV-objekt, sett antall fold til10, og lagre den trente modellen i variabelengrid_cv.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 3.33
Utfordring: Implementering av et Beslutningstre
Sveip for å vise menyen
I denne utfordringen skal du bruke Titanic-datasettet, som inneholder informasjon om passasjerene på Titanic, inkludert alder, kjønn, familiestørrelse og mer. Målet er å forutsi om en passasjer overlevde eller ikke.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
For å implementere Decision Tree kan du bruke DecisionTreeClassifier fra sklearn:
Konstruktør:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— maksimal dybde på treet. Standardverdi er None;min_samples_leaf— minimum antall forekomster i et bladnode. Standardverdi er 1;
Metoder:
fit(X, y)— Tilpass treningssettet;predict(X)— Forutsi klassen for X;score(X, y)— Returnerer nøyaktigheten for X, y-settet;
Attributter:
feature_importances_— Viktighet av egenskaper;feature_names_in_— Egenskapsnavn sett under .fit().
Oppgaven er å bygge et beslutningstre og finne den beste verdien for max_depth og min_samples_leaf ved hjelp av grid search.
Swipe to start coding
Du har fått et Titanic-datasett lagret som en DataFrame i variabelen df.
- Initialiser en Decision Tree-modell og lagre den i variabelen
decision_tree. - Opprett en ordbok for
GridSearchCVsom itererer gjennom verdiene[1, 2, 3, 4, 5, 6, 7]formax_depthog[1, 2, 4, 6]formin_samples_leaf, og lagre den i variabelenparam_grid. - Initialiser og tren et
GridSearchCV-objekt, sett antall fold til10, og lagre den trente modellen i variabelengrid_cv.
Løsning
Takk for tilbakemeldingene dine!
single