本發明涉及一種多任務深度強化學習的深空探測器軟著陸路徑規劃方法,屬于人工智能與深空探測技術領域。本發明基于深度確定性策略強化學習算法DDPG,采用多任務學習,充分利用智能體之間的對抗與協作關系,提升了每個智能體應對不確定情況的能力,提高模型整體的泛化性能。通過采用融合時間上下文信息的自注意力機制,不僅避免智能體陷入局部最優狀態,而且使智能體更加聚焦到有利于自身獲得最大回報的信息進行學習,進一步提高探測器著陸的成功率。本方法能夠實現深空探測器的穩定著陸,為后續實現小行星探測、自主取樣和航天員登陸活動奠定基礎。
聲明:
“多任務深度強化學習的深空探測器軟著陸路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)