Русская Википедия:Управляемый рекуррентный блок

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Управляемые рекуррентные блоки (Шаблон:Lang-en, GRU) — механизм вентилей для рекуррентных нейронных сетей, представленный в 2014 году. Было установлено, что его эффективность при решении задач моделирования музыкальных и речевых сигналов сопоставима с использованием долгой краткосрочной памяти (LSTM).[1] По сравнению с LSTM у данного механизма меньше параметров, т.к. отсутствует выходной вентиль.[2]

Архитектура

<math>\circ</math> обозначает произведение Адамара. <math>h_0 = 0</math>.

<math>

\begin{align} z_t &= \sigma_g(W_{z} x_t + U_{z} h_{t-1} + b_z) \\ r_t &= \sigma_g(W_{r} x_t + U_{r} h_{t-1} + b_r) \\ h_t &= z_t \circ h_{t-1} + (1-z_t) \circ \sigma_h(W_{h} x_t + U_{h} (r_t \circ h_{t-1}) + b_h) \end{align} </math>

Переменные

  • <math>x_t</math>: входной вектор
  • <math>h_t</math>: выходной вектор
  • <math>z_t</math>: вектор вентиля обновления
  • <math>r_t</math>: вектор вентиля сброса
  • <math>W</math>, <math>U</math> и <math>b</math>: матрицы параметров и вектор

Функции активации

См. также

Примечания

Шаблон:Примечания

Шаблон:Типы искусственных нейронных сетей Шаблон:Машинное обучение