本申請提供一種基于多智體強化學習的心智理論模型實現方法及裝置,該方法包括:基于心智理論模型建立原始聯合心智模型網絡以預測多個己方智能體的友方智能體的意圖特征信息;建立多智體強化學習的任務場景結合意圖特征信息,分級建模場景任務的主目標及其子目標;通過主目標的收斂后的主目標實現算法和子目標的規則化子目標實現算法收集待使用數據,以對原始聯合心智模型網絡進行訓練,通過目標聯合心智模型網絡預測當前己方智能體的意圖信息并將其添加至多智體算法的輸入信息,實現己方智能體的協同。本申請實施例提供的基于多智體強化學習的心智理論模型實現方法結合多智體強化學習、心智理論模型和任務場景,提升了多智能體的協同效果。
聲明:
“基于多智體強化學習的心智理論模型實現方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)