Google超快深度增強學習演算法Soft Actor-Critic，機器人只要訓練2小時就能於各類地形行走

為了增加機器人應對真實世界的能力，Google發展了深度增強學習Soft Actor-Critic，這是基於最大熵（Entropy）框架的深度學習演算法，能讓機器人更快學習技能以應付真實世界環境，由於規則直接從真實世界習得，因此機器人可以展現應對不同的環境的強健性。

臉書留言

(這個頁面共進入 1 次, 今天進入 1 次)