本發明公開了一種基于多智能體系統的深度強化學習方法,包括如下步驟:基于結合體框架建立算法,多智能體系統中每個獨立的智能體均為分類的誘發條件,智能體觸發誘發條件,判斷該智能體的觀測范圍內所有智能體能否成為合作者,當觸發誘發條件的智能體觀測范圍內具有成為合作者的智能體時,將其構成組,建立雙向的LSTM模型,并整合每個上述的通信組中所有智能體的信息,促成協作決策,智能體同時屬于至少兩個通信組時,建立通信通道連接該智能體所在的通信組;本方案應用在具有較多智能體的多智能體系統中,可在其判斷哪些智能體攝取的信息是有價值的,避免將這些沒有價值的信息帶入系統中時,降低了系統的運算量,極大地增加了通信的速率。
聲明:
“基于多智能體系統的深度強化學習方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)