本發明公開一種基于無模型強化學習的多階段靈巧噪聲干擾方法,應用于雷達技術領域,為了解決干擾機在針對敵方火控雷達干擾識別方法、抗干擾措施和工作模式轉換規律等環境模型未知情況下的最優干擾功率分配問題,本發明首先將多階段干擾功率分配問題建模成一個未知環境模型的馬爾可夫決策過程;為了評估多階段噪聲干擾的性能,選擇火控雷達的平均搜索?鎖定時間作為評價指標;其次分析了噪聲干擾功率分配的原理,并針對未知環境模型的挑戰,建立了多階段干擾功率分配問題的強化學習框架;最后提出了一種基于Q?learning算法的多階段干擾功率分配方法;本發明方法有效解決了在實際應用中干擾功率的最優分配問題,提高了干擾成功率。
聲明:
“基于無模型強化學習的多階段靈巧噪聲干擾方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)