Summary  
This chapter explains the internal mechanics of Long Short-Term Memory networks, detailing how forget, input, and output gates regulate information flow to capture long-term dependencies and prevent vanishing gradients.  

General domain of usage  
Time-series forecasting (e.g., predicting financial or production trends)

**Long short-term memory** (**LSTM**) netværk introduceres som en type RNN-arkitektur designet til at håndtere problemerne med **forsvindende gradienter** og **langtidshukommelse**. LSTM'er er i stand til at huske information i længere perioder, hvilket gør dem særligt nyttige til opgaver, der involverer sekvenser.


Definition

- **LSTM-struktur**: LSTM'er består af tre hovedkomponenter—**forget gate**, **input gate** og **output gate**. Disse gates styrer informationsflowet i netværket og gør det muligt at afgøre, hvad der skal huskes, og hvad der skal glemmes;  
- **Forget gate**: forget gate bestemmer, hvilken information fra det forrige tidssteg der skal kasseres. Den returnerer et tal mellem 0 og 1, hvor 0 betyder "glem" og 1 betyder "behold" informationen;  
- **Input gate**: input gate styrer, hvilken ny information der skal tilføjes til celle-tilstanden. Den returnerer også en værdi mellem 0 og 1 og afgør, hvor meget af de nye data der skal inkorporeres;  
- **Output gate**: output gate afgør, hvilken del af celle-tilstanden der skal sendes videre. Celle-tilstanden opdateres ved hvert tidssteg baseret på interaktionen mellem disse gates;  
- **Fordele ved LSTM'er**: LSTM'er er bedre til at håndtere langtidshukommelse sammenlignet med traditionelle RNN'er. Gates i en LSTM hjælper med at forhindre **forsvindende gradient-problemet**, hvilket gør det muligt for netværket at lære og huske information over mange tidssteg.



Sammenfattende er LSTM'er en kraftfuld udvidelse af RNN'er, der løser centrale begrænsninger ved traditionelle RNN'er, især når der arbejdes med lange sekvenser eller opgaver, der kræver at huske information over tid.

Hvilket af følgende er IKKE en komponent i LSTM-arkitekturen?

Fokus udelukkende på rekursive neurale netværk (RNN'er) og deres anvendelse til sekvensgenerering. Dette avancerede modul dækker den grundlæggende teori om RNN'er samt praktiske tilgange til modellering af sekventielle data og forbereder dig på praktisk arbejde med LSTM- og GRU-netværk i Python.

Long Short-Term Memory (LSTM) Netværk