一種基于強化學習的行星軟著陸控制方法及系統和存儲介質,涉及軟著陸軌跡優化與控制領域,為了解決現有的行星軟著陸控制存在無法保證制導律最優、模型較復雜,訓練難以收斂等問題。本發明包括:一:基于著陸器的硬件構型和發動機動力配置等特征,建立著陸器動力下降段六自由度動力學模型;二:設計訓練交互環境的獎勵函數、觀測空間、動作空間和神經網絡結構;三:數值仿真環境的搭建,利用強化學習算法訓練得到軟著陸控制器;四:通過速度跟蹤測試和軟著陸測試對訓練控制效果評估。通過執行步驟一和步驟二獲得軟著陸強化學習環境模型,智能體與環境模型交互,從而獲得訓練數據。通過步驟三訓練可以得到軟著陸控制器,最后通過步驟四挑選出表現最佳的訓練結果,作為最優軟著陸控制器。本發明用于軟著陸軌跡優化與控制。
聲明:
“基于強化學習的行星軟著陸控制方法及系統和存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)