本發明公開了一種面向多無人機碰撞規避的深度強化學習訓練加速方法,其包括:步驟S1:基于馬爾可夫決策過程對完全分布式的無人機集群避障問題進行形式化建模;步驟S2:構建深度神經網絡構建觀測輸入?動作輸出的映射、網絡更新方法;步驟S3:融合人類經驗以加速訓練。本發明具有原理簡單、訓練智能化程度高、可加速深度強化學習訓練過程等優點。
聲明:
“面向多無人機碰撞規避的深度強化學習訓練加速方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)