Contenido del Curso
Introducción al Aprendizaje por Refuerzo
Introducción al Aprendizaje por Refuerzo
RL Frente a Otros Paradigmas de Aprendizaje
El aprendizaje automático consta de tres paradigmas principales de aprendizaje, cada uno adecuado para diferentes tipos de problemas. El aprendizaje por refuerzo es uno de ellos, junto con el aprendizaje supervisado y el aprendizaje no supervisado.
Características clave del RL
- Sin datos etiquetados: RL no requiere pares de entrada-salida predefinidos, sino que aprende a partir de la experiencia;
- Aprendizaje por prueba y error: el agente explora diferentes acciones y perfecciona su estrategia en función de la retroalimentación;
- Toma de decisiones secuencial: RL está diseñado para tareas donde las decisiones actuales afectan los resultados futuros;
- Maximización de recompensas: el objetivo del aprendizaje es optimizar las recompensas a largo plazo en lugar de la corrección a corto plazo.
Comparación de los tres paradigmas de ML
Por qué el Aprendizaje por Refuerzo es Diferente
El aprendizaje por refuerzo comparte algunas similitudes con otros paradigmas, pero se destaca por su enfoque único en el proceso de aprendizaje.
Aprendizaje Supervisado
En el aprendizaje supervisado, un conjunto de datos proporciona instrucciones explícitas sobre cuál debe ser la salida correcta. En el aprendizaje por refuerzo, no existe una supervisión explícita—el agente debe descubrir las mejores acciones a través de la experiencia.
Aprendizaje No Supervisado
El aprendizaje no supervisado encuentra patrones ocultos en los datos sin objetivos específicos. El aprendizaje por refuerzo aprende a través de la interacción con un entorno para alcanzar un objetivo explícito (por ejemplo, ganar un juego).
¡Gracias por tus comentarios!