Google超快深度增強學習演算法Soft Actor-Critic,機器人只要訓練2小時就能於各類地形行走

為了增加機器人應對真實世界的能力,Google發展了深度增強學習Soft Actor-Critic,這是基於最大熵(Entropy)框架的深度學習演算法,能讓機器人更快學習技能以應付真實世界環境,由於規則直接從真實世界習得,因此機器人可以展現應對不同的環境的強健性。

臉書留言

胡 自文

(這個頁面共進入 1 次, 今天進入 1 次)