針對當前反無人機系統單一攔截裝備在暫時性的任務分配中無法有效壓制無人機的問題,本發明公開了一種基于強化學習的反無人機任務分配方法,包括:對改進的DQN算法初始化,改進的DQN算法是指相對于DQN算法,采用當前時刻的狀態來預測Q值;通過改進的DQN算法完成智能體的訓練與優化,在智能體訓練完備之后保存網絡參數;將無人機狀態信息S輸入強化學習模塊,通過強化學習輸出次優解X,即初期的分配策略;通過進化算法對強化學習生成的次優解進行優化,生成目標分配的最優解;對所述的最優解進行解碼,獲得反無人機的任務分配方案。本發明中通過改進的DQN算法訓練的智能體攔截表現更為精確,任務分配更加高效且適用。
聲明:
“基于強化學習的反無人機任務分配方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)