Kursinnhold
Introduksjon til Forsterkende Læring
Introduksjon til Forsterkende Læring
RL Kontra Andre Læringsparadigmer
Maskinlæring består av tre hovedparadigmer, hver egnet for ulike typer problemer. Forsterkningslæring er ett av dem, sammen med overvåket læring og uovervåket læring.
Nøkkelfunksjoner ved RL
- Ingen merkede data: RL krever ikke forhåndsdefinerte input-output-par, men lærer i stedet fra erfaring;
- Læring gjennom prøving og feiling: agenten utforsker ulike handlinger og forbedrer strategien basert på tilbakemeldinger;
- Sekvensiell beslutningstaking: RL er utviklet for oppgaver der nåværende beslutninger påvirker fremtidige utfall;
- Maksimering av belønning: læringsmålet er å optimalisere langsiktige belønninger fremfor kortsiktig korrekthet.
Sammenligning av de tre ML-paradigmene
Hvorfor er forsterkningslæring annerledes
Forsterkningslæring har noen likheter med andre paradigmer, men skiller seg ut på grunn av sin unike tilnærming til læringsprosessen.
Veiledet læring
I veiledet læring gir et datasett eksplisitte instruksjoner om hva som skal være riktig utdata. I forsterkningslæring finnes det ingen eksplisitt veiledning—agenten må finne ut av de beste handlingene gjennom erfaring.
Uveiledet læring
Uveiledet læring finner skjulte mønstre i data uten spesifikke mål. Forsterkningslæring lærer gjennom interaksjon med et miljø for å oppnå et eksplisitt mål (f.eks. å vinne et spill).
Takk for tilbakemeldingene dine!