以建構式網路擴展之多機器人系統導航與避障之深度強化學習方法

本研究提出一種基於深度強化學習的多機器人系統導航與障礙物避讓策略網路。該網路首先在雙機器人架構下進行設計與訓練。透過納入非完整約束（nonholonomic constraints）與優先權規則，使強化學習能夠結合行動機器人的運動學特性進行訓練，從而實現有效的導航與碰撞避免。為了將此方法擴展至多機器人情境，研究中提出一種創新的建構式擴展架構，利用社會力模型（social-force model），在維持適中計算成本的前提下，將雙機器人策略延伸至多機器人系統。儘管該網路是在開放環境中訓練，仍可透過引入虛擬機器人來模擬牆面與隔間，使其應用於一般地圖式環境。透過模擬與室內實驗驗證了所提出多機器人導航與避碰策略之可行性與效能。