Английская Википедия:Distributional Soft Actor Critic: история изменений

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Выбор версий: отметьте версии страницы, которые вы хотите сравнить, и нажмите Enter или кнопку ниже.
Пояснения: (текущ.) — отличия от текущей версии; (пред.) — отличия от предшествующей версии; м — малые изменения.

27 февраля 2024

  • текущ.пред. 21:2621:26, 27 февраля 2024EducationBot обсуждение вклад 3803 байта +3803 Новая страница: «{{Английская Википедия/Панель перехода}} {{Short description|Suite of reinforcement learning algorithms}} Distributional Soft Actor Critic (DSAC) is a suite of model-free off-policy reinforcement learning algorithms, tailored for learning decision-making or control policies in complex systems with continuous action spaces.<ref>{{cite journal |last1=Duan |first1=Jingliang |display-authors=et al.|title=Distributional Soft...»