Modelos
Ya conoces los conceptos básicos de la preprocesamiento de datos y cómo construir pipelines. Ahora podemos pasar a la parte interesante, ¡el modelado!
Recapitulemos qué es un modelo. En Scikit-learn, es un estimador que dispone de los métodos .predict()
y .score()
(y, como es un estimador, también está presente el método .fit()
).
.fit()
Una vez que los datos están preprocesados y listos para ingresar al modelo, el primer paso para construir un modelo es el entrenamiento del modelo. Esto se realiza utilizando .fit(X, y)
.
Durante el entrenamiento, un modelo aprende todo lo necesario para realizar predicciones. Lo que el modelo aprende y la duración del entrenamiento dependen del algoritmo seleccionado. Para cada tarea, existen numerosos modelos disponibles, basados en diferentes algoritmos. Algunos entrenan más lentamente, mientras que otros lo hacen más rápido.
Sin embargo, el entrenamiento es generalmente el aspecto más lento del aprendizaje automático. Si el conjunto de entrenamiento es grande, un modelo podría tardar minutos, horas o incluso días en entrenarse.
.predict()
Una vez que el modelo ha sido entrenado utilizando el método .fit()
, puede realizar predicciones. Predecir es tan sencillo como llamar al método .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Normalmente, se desea predecir un objetivo para nuevas instancias, X_new
.
.score()
El método .score()
se utiliza para medir el rendimiento de un modelo entrenado. Generalmente, se calcula sobre el conjunto de prueba (los siguientes capítulos explicarán qué es). Aquí está la sintaxis:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
El método .score()
requiere valores reales del objetivo (y_test
en el ejemplo). Calcula la predicción para las instancias X_test
y compara esta predicción con el objetivo real (y_test
) utilizando alguna métrica. Por defecto, esta métrica es la precisión para clasificación.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Modelos
Desliza para mostrar el menú
Ya conoces los conceptos básicos de la preprocesamiento de datos y cómo construir pipelines. Ahora podemos pasar a la parte interesante, ¡el modelado!
Recapitulemos qué es un modelo. En Scikit-learn, es un estimador que dispone de los métodos .predict()
y .score()
(y, como es un estimador, también está presente el método .fit()
).
.fit()
Una vez que los datos están preprocesados y listos para ingresar al modelo, el primer paso para construir un modelo es el entrenamiento del modelo. Esto se realiza utilizando .fit(X, y)
.
Durante el entrenamiento, un modelo aprende todo lo necesario para realizar predicciones. Lo que el modelo aprende y la duración del entrenamiento dependen del algoritmo seleccionado. Para cada tarea, existen numerosos modelos disponibles, basados en diferentes algoritmos. Algunos entrenan más lentamente, mientras que otros lo hacen más rápido.
Sin embargo, el entrenamiento es generalmente el aspecto más lento del aprendizaje automático. Si el conjunto de entrenamiento es grande, un modelo podría tardar minutos, horas o incluso días en entrenarse.
.predict()
Una vez que el modelo ha sido entrenado utilizando el método .fit()
, puede realizar predicciones. Predecir es tan sencillo como llamar al método .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Normalmente, se desea predecir un objetivo para nuevas instancias, X_new
.
.score()
El método .score()
se utiliza para medir el rendimiento de un modelo entrenado. Generalmente, se calcula sobre el conjunto de prueba (los siguientes capítulos explicarán qué es). Aquí está la sintaxis:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
El método .score()
requiere valores reales del objetivo (y_test
en el ejemplo). Calcula la predicción para las instancias X_test
y compara esta predicción con el objetivo real (y_test
) utilizando alguna métrica. Por defecto, esta métrica es la precisión para clasificación.
¡Gracias por tus comentarios!