本發明提出一種基于強化學習的跨域異構集群路徑規劃方法,通過添加集群的特征作為個體觀測輸入,并通過面向集群路徑規劃而設定的獎勵函數,使得跨域的集群個體能夠在保持安全距離的前提下,進行路徑規劃。本發明構建了跨域異構集群機動的馬爾科夫決策過程和獎勵函數,利用MADDPG算法求解集群個體機動策略,從而實現跨域異構集群的路徑規劃。只要集群個體具備相關的傳感器,即能通過本發明的方法實現路徑規劃。該方法下,來自空域、海域、陸域等域的不同航行器可以共同地進行路徑規劃,從而實現“跨域異構路徑規劃”。
聲明:
“基于強化學習的跨域異構集群路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)