基于深度強化學習的艦載機出動回收在線調度方法涉及艦載機出動回收調度領域,解決航母甲板上的大規模艦載機出動回收在線調度問題。本發明通過將出動回收過程抽象為馬爾可夫決策過程,將艦載機群當前狀態作為輸入,調度的行為作為輸出,建立帶權重的特征向量作為獎賞函數,構造出艦載機出動回收調度模型。為得到安全高效的調度策略,確立多目標調度策略,以艦載機艦面位移、任務調度時間、艦面沖突次數和設備利用率作為目標,利用深度Q學習網絡訓練調度模型。經過實驗測試結果表明,該算法在遇到突發狀況時能迅速處理并且對后續任務執行不產生影響,同時得到安全性和靈活性都較高的調度策略。
聲明:
“基于深度強化學習的艦載機出動回收在線調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)