Modelos
Ya se han cubierto los fundamentos del preprocesamiento de datos y la construcción de pipelines. El siguiente paso es el modelado.
Un modelo en Scikit-learn es un estimador que proporciona los métodos .predict() y .score(), junto con .fit() heredado de todos los estimadores.
.fit()
Una vez que los datos han sido preprocesados y están listos para el modelo, el primer paso en la construcción de un modelo es el entrenamiento del modelo. Esto se realiza utilizando .fit(X, y).
Para aprendizaje supervisado (regresión, clasificación), .fit() requiere tanto X como y.
Para aprendizaje no supervisado (por ejemplo, clustering), solo se llama .fit(X). Pasar y no genera un error — simplemente se ignora.
Durante el entrenamiento, el modelo aprende los patrones necesarios para la predicción. Lo que aprende y la duración del entrenamiento dependen del algoritmo. El entrenamiento suele ser la parte más lenta del aprendizaje automático, especialmente con conjuntos de datos grandes.
.predict()
Después del entrenamiento, utilice .predict() para generar predicciones:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() evalúa un modelo entrenado, normalmente sobre un conjunto de prueba:
model.fit(X, y)
model.score(X_test, y_test)
Compara las predicciones con los valores reales. Por defecto, la métrica utilizada es la precisión para clasificación.
X_test se refiere al subconjunto del conjunto de datos, conocido como conjunto de prueba, utilizado para evaluar el rendimiento de un modelo después del entrenamiento. Contiene las características (datos de entrada). y_test es el subconjunto correspondiente de etiquetas reales para X_test. Juntos, permiten evaluar qué tan bien el modelo predice datos nuevos y no vistos.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Modelos
Desliza para mostrar el menú
Ya se han cubierto los fundamentos del preprocesamiento de datos y la construcción de pipelines. El siguiente paso es el modelado.
Un modelo en Scikit-learn es un estimador que proporciona los métodos .predict() y .score(), junto con .fit() heredado de todos los estimadores.
.fit()
Una vez que los datos han sido preprocesados y están listos para el modelo, el primer paso en la construcción de un modelo es el entrenamiento del modelo. Esto se realiza utilizando .fit(X, y).
Para aprendizaje supervisado (regresión, clasificación), .fit() requiere tanto X como y.
Para aprendizaje no supervisado (por ejemplo, clustering), solo se llama .fit(X). Pasar y no genera un error — simplemente se ignora.
Durante el entrenamiento, el modelo aprende los patrones necesarios para la predicción. Lo que aprende y la duración del entrenamiento dependen del algoritmo. El entrenamiento suele ser la parte más lenta del aprendizaje automático, especialmente con conjuntos de datos grandes.
.predict()
Después del entrenamiento, utilice .predict() para generar predicciones:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() evalúa un modelo entrenado, normalmente sobre un conjunto de prueba:
model.fit(X, y)
model.score(X_test, y_test)
Compara las predicciones con los valores reales. Por defecto, la métrica utilizada es la precisión para clasificación.
X_test se refiere al subconjunto del conjunto de datos, conocido como conjunto de prueba, utilizado para evaluar el rendimiento de un modelo después del entrenamiento. Contiene las características (datos de entrada). y_test es el subconjunto correspondiente de etiquetas reales para X_test. Juntos, permiten evaluar qué tan bien el modelo predice datos nuevos y no vistos.
¡Gracias por tus comentarios!