本發明公開了一種基于多智能體強化學習的無線充電設備協作任務卸載策略,使用Q?Learning算法以及神經網絡來學習多個移動設備如何在有限的計算資源和電量資源環境下進行協作任務卸載。本發明首次將多用戶協作任務卸載建模為部分可觀測馬爾可夫決策過程(POMDP)的問題表述,視每個智能體為相互獨立的學習者,提出了一種在無線充電D2D網絡環境下基于多智能體深度確定性策略梯度(MADDPG)的協作任務執行方案(CACTE),其目標是使多個移動設備彼此有效地協作,從而執行更多任務,獲得更高的長期回報。并且,將本發明提出的策略與其他策略在不同實驗參數下進行對比,證明了本發明所提出策略的有效性。
聲明:
“基于多智能體強化學習的無線充電設備協作任務卸載策略” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)