Вивчайте Навчання та Оцінювання RNN

Свайпніть щоб показати меню

Розглядається навчання та оцінювання рекурентної нейронної мережі (RNN) на основі LSTM для прогнозування цін акцій. Модель навчається прогнозувати майбутні ціни акцій на основі історичних даних шляхом визначення архітектури, налаштування функції втрат і оптимізатора, навчання моделі та оцінювання її ефективності.

Визначення моделі: модель LSTM визначається за допомогою PyTorch з основними компонентами, такими як розмір вхідних даних, розмір прихованого шару та кількість шарів. Модель складається з шару LSTM, за яким слідує лінійний шар для прогнозування виходу. Модель призначена для отримання попередніх цін акцій як вхідних даних і прогнозування ціни на наступний часовий крок;

class LSTMModel(nn.Module):
def __init__(self, input_size=1, hidden_layer_size=50, num_layers=2, output_size=1):
super().__init__()
self.hidden_layer_size = hidden_layer_size
self.num_layers = num_layers
self.lstm = nn.LSTM(input_size, hidden_layer_size, num_layers, batch_first=True)
self.linear = nn.Linear(hidden_layer_size, output_size)

def forward(self, input_seq):
h0 = torch.zeros(self.num_layers, input_seq.size(0), self.hidden_layer_size).to(input_seq.device)
c0 = torch.zeros(self.num_layers, input_seq.size(0), self.hidden_layer_size).to(input_seq.device)
lstm_out, _ = self.lstm(input_seq, (h0.detach(), c0.detach()))
          last_time_step_out = lstm_out[:, -1, :]
predictions = self.linear(last_time_step_out)
return predictions

Навчання моделі: на цьому етапі модель навчається з використанням функції втрат mean squared error (MSE) та оптимізатора adam. Навчання моделі відбувається протягом декількох епох, при цьому втрата обчислюється та оновлюється для кожного батчу навчальних даних. Цикл навчання включає пряме та зворотне поширення, оптимізацію ваг для мінімізації втрат. Під час навчання відстежується значення втрат для контролю ефективності навчання моделі;

criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

Оцінювання: після навчання модель оцінюється на тестовому наборі даних. Прогнози моделі порівнюються з фактичними цінами акцій за допомогою метрики root mean squared error (RMSE). Ця метрика вимірює різницю між прогнозованими та фактичними значеннями, причому менше значення RMSE вказує на кращу ефективність. Процес оцінювання також включає зворотне перетворення масштабованих прогнозів для отримання фактичних цін для порівняння;
Метрика ефективності: для оцінки якості моделі на невідомих даних використовується RMSE. Менше значення RMSE свідчить про те, що прогнози моделі ближчі до фактичних значень. RMSE обчислюється після порівняння прогнозованих значень з фактичними немасштабованими значеннями з тестових даних.

Підсумовуючи, у цьому розділі описано процес навчання та оцінювання моделі LSTM для прогнозування часових рядів, з акцентом на прогнозування цін акцій. Основні етапи включають визначення моделі, навчання з використанням функції втрат MSE та оптимізатора Adam, а також оцінювання моделі за допомогою RMSE.

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 3. Розділ 4

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 3. Розділ 4