本發明提出了一種基于情景記憶的無人機控制決策方法,實現步驟為:構建無人機控制場景;獲取各個無人機的觀測信息;構建深度強化學習模型H并進行初始化;構建情節記憶探索表;對深度強化學習模型H迭代訓練;使用訓練后的深度強化學習模型H對無人機行為進行自主控制。本發明使用多智能體分布式情節記憶探索表存儲智能體過去相似經歷的最優回報,并在智能體實際的探索過程中采用隨機動作和情節記憶探索表中最優探索動作組合的形式進行動作選取,提高無人機控制任務的完成率和深度強化學習算法的收斂時間。
聲明:
“基于情景記憶的無人機控制決策方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)