Kursusindhold
Introduktion til Reinforcement Learning
Introduktion til Reinforcement Learning
RL vs Andre Læringsparadigmer
Maskinlæring består af tre hovedparadigmer, som hver især er velegnede til forskellige typer problemer. Forstærkningslæring er et af dem, sammen med superviseret læring og usuperviseret læring.
Centrale egenskaber ved RL
- Ingen mærkede data: RL kræver ikke foruddefinerede input-output-par, men lærer i stedet af erfaring;
- Læring gennem forsøg og fejl: agenten udforsker forskellige handlinger og forfiner sin strategi baseret på feedback;
- Sekventiel beslutningstagning: RL er designet til opgaver, hvor nuværende beslutninger påvirker fremtidige resultater;
- Maksimering af belønning: læringsmålet er at optimere langsigtede belønninger frem for kortsigtet korrekthed.
Sammenligning af de tre ML-paradigmer
Hvorfor er Reinforcement Learning Forskellig
Reinforcement learning deler nogle ligheder med andre paradigmer, men adskiller sig gennem sin unikke tilgang til læringsprocessen.
Supervised Learning
I supervised learning giver et datasæt eksplicitte instruktioner om, hvad det korrekte output skal være. I reinforcement learning er der ingen eksplicit supervision—agenten skal selv finde de bedste handlinger gennem erfaring.
Unsupervised Learning
Unsupervised learning finder skjulte mønstre i data uden specifikke mål. Reinforcement learning lærer gennem interaktion med et miljø for at opnå et eksplicit mål (f.eks. at vinde et spil).
Tak for dine kommentarer!