一種基于深度強化學習的水下自主航行器動態避障方法,涉及水下機器人避障技術領域。本發明是為了解決目前缺乏水下自主航行器對動態障礙物的避障研究的問題。本發明建立水下自主航行器模型與運動學模型,獲取周圍障礙物的信息;采集水下自主航行器周圍機動障礙物的運動狀態信息,并構造動態障礙物狀態方程;根據動態障礙物狀態方程預測動態障礙物運動學模型;根據水下自主航行器周圍障礙物的信息和動態障礙物運動學模型,融合多動態障礙物避障法生成避障策略并轉化為MDP模型;結合確定性深度策略梯度算法對MDP模型進行訓練,直至水下自主航行器能夠無碰撞的到達目標區域;利用訓練好的MDP模型引導水下自主航行器航行。
聲明:
“基于深度強化學習的水下自主航行器動態避障方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)