Desafío: Implementación de un Árbol de Decisión
En este desafío, se utilizará el conjunto de datos Titanic, que contiene información sobre los pasajeros del Titanic, incluyendo su edad, sexo, tamaño de la familia y más. El objetivo es predecir si un pasajero sobrevivió o no.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar el Árbol de Decisión, se puede utilizar DecisionTreeClassifier de sklearn:
Constructor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— profundidad máxima del árbol. El valor predeterminado es None;min_samples_leaf— instancias mínimas en un nodo hoja. El valor predeterminado es 1;
Métodos:
fit(X, y)— Ajustar el conjunto de entrenamiento;predict(X)— Predecir la clase para X;score(X, y)— Devuelve la precisión para el conjunto X, y;
Atributos:
feature_importances_— Importancia de las características;feature_names_in_— Nombres de las características vistas durante .fit().
La tarea consiste en construir un Árbol de Decisión y encontrar los mejores valores de max_depth y min_samples_leaf utilizando búsqueda en cuadrícula.
Swipe to start coding
Se proporciona un conjunto de datos del Titanic almacenado como un DataFrame en la variable df.
- Inicializar un modelo de Árbol de Decisión y almacenarlo en la variable
decision_tree. - Crear un diccionario para que
GridSearchCVitere sobre los valores[1, 2, 3, 4, 5, 6, 7]paramax_depthy[1, 2, 4, 6]paramin_samples_leaf, y guardarlo en la variableparam_grid. - Inicializar y entrenar un objeto
GridSearchCV, establecer el número de particiones en10y almacenar el modelo entrenado en la variablegrid_cv.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Genial!
Completion tasa mejorada a 3.33
Desafío: Implementación de un Árbol de Decisión
Desliza para mostrar el menú
En este desafío, se utilizará el conjunto de datos Titanic, que contiene información sobre los pasajeros del Titanic, incluyendo su edad, sexo, tamaño de la familia y más. El objetivo es predecir si un pasajero sobrevivió o no.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar el Árbol de Decisión, se puede utilizar DecisionTreeClassifier de sklearn:
Constructor:
DecisionTreeClassifier(max_depth=None, min_samples_leaf=1)max_depth— profundidad máxima del árbol. El valor predeterminado es None;min_samples_leaf— instancias mínimas en un nodo hoja. El valor predeterminado es 1;
Métodos:
fit(X, y)— Ajustar el conjunto de entrenamiento;predict(X)— Predecir la clase para X;score(X, y)— Devuelve la precisión para el conjunto X, y;
Atributos:
feature_importances_— Importancia de las características;feature_names_in_— Nombres de las características vistas durante .fit().
La tarea consiste en construir un Árbol de Decisión y encontrar los mejores valores de max_depth y min_samples_leaf utilizando búsqueda en cuadrícula.
Swipe to start coding
Se proporciona un conjunto de datos del Titanic almacenado como un DataFrame en la variable df.
- Inicializar un modelo de Árbol de Decisión y almacenarlo en la variable
decision_tree. - Crear un diccionario para que
GridSearchCVitere sobre los valores[1, 2, 3, 4, 5, 6, 7]paramax_depthy[1, 2, 4, 6]paramin_samples_leaf, y guardarlo en la variableparam_grid. - Inicializar y entrenar un objeto
GridSearchCV, establecer el número de particiones en10y almacenar el modelo entrenado en la variablegrid_cv.
Solución
¡Gracias por tus comentarios!
single