Kursinnhold
Introduksjon til Forsterkende Læring
Introduksjon til Forsterkende Læring
Hva er RL?
For å få mest mulig ut av dette kurset, bør du ha en solid forståelse av matematikk (særlig sannsynlighetsteori). Kjennskap til grunnleggende maskinlæring og NumPy vil også være fordelaktig.
Forsterkende læring (RL) er et maskinlæringsparadigme som hovedsakelig fokuserer på beslutningstaking og kontrolloppgaver, der en agent lærer optimale strategier ved å samhandle med et miljø og maksimere kumulative belønninger.
Forsterkningslæring er sterkt inspirert av atferdspsykologi, spesielt hvordan mennesker og dyr lærer gjennom erfaringer. Akkurat som en hund lærer å sitte når den får godbiter for riktig oppførsel, lærer en RL-agent ved å motta belønninger for sine handlinger.
Agent og miljø
Agenten er beslutningstakeren i RL-systemet. Den observerer miljøet, velger handlinger og lærer av tilbakemeldinger for å forbedre fremtidig ytelse.
Miljøet representerer alt agenten samhandler med. Det reagerer på agentens handlinger og gir tilbakemelding i form av nye tilstander og belønninger.
Agenten er kun ansvarlig for å ta beslutninger — velge handlinger basert på sine observasjoner og lære av de resulterende utfallene — mens miljøet fastsetter samhandlingsreglene.
Bruksområder for RL
Forsterkningslæring brukes mye innen ulike felt der beslutningstaking under usikkerhet er avgjørende. Noen sentrale bruksområder inkluderer:
- Robotikk: Forsterkningslæring hjelper roboter å lære komplekse oppgaver som å gripe objekter, bevegelse og industriell automatisering;
- Spill-AI: Forsterkningslæring driver AI-agenter i spill som sjakk, Go og Dota 2, og oppnår overmenneskelig ytelse;
- Finans: Forsterkningslæring optimaliserer handelsstrategier, porteføljeforvaltning og risikovurdering;
- Helsevesen: Forsterkningslæring bidrar til personlige behandlingsplaner, robotkirurgi og legemiddelutvikling;
- Autonome systemer: Forsterkningslæring muliggjør selvkjørende biler, droner og adaptive trafikksystemer;
- Anbefalingssystemer: Forsterkningslæring bidrar til å forbedre personlige innholdsanbefalinger på strømmeplattformer og i netthandel.
Takk for tilbakemeldingene dine!