本發明公開了一種基于群體博弈的多智能體交互方法及系統,所述方法包括:初始化智能體強化學習所需的預設參數,初始化智能體的Q表,并初始化學習周期;獲取常微分方程的求解閾值,并將常微分方程的求解閾值進行衰減處理;初始化系統狀態,采用貪婪策略選取智能體的聯合動作;每個智能體執行所選取的動作,并接收觀測樣本和獎勵;構建基于智能體的Q表的群體博弈,利用基于繼承的BNN群體博弈動態算法求解近似均衡策略;智能體基于得到的期望獎勵更新Q表。本發明不需要精確求解每個階段博弈的均衡策略,以相對較低的計算復雜度求得近似均衡,通過設計常微分方程求解加速機制,實現均衡復雜度和均衡精度的最優權衡,以及多智能體系統的最優性能。
聲明:
“基于群體博弈的多智能體交互方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)