基于分布式多智能體強化學習的電網多斷面功率自動控制方法,通過多智能體與電力仿真環境交互,能夠自主學習合適的用于復雜電網的多斷面功率控制策略。首先根據電網控制的需要選取N個目標斷面,并依此構建強化學習方法的環境、智能體、觀測狀態、動作、獎勵函數等基本元素;其次運行多斷面功率控制任務交互環境,創造初始潮流數據集;之后,為每個智能體構造基于深度神經網絡的決策網絡和估值網絡,構建MADDPG(多智能體深度確定性策略梯度)模型并引入分布式方法進行訓練自主學習最優控制策略;最后,應用訓練完成的策略網絡自動斷面控制。本發明的優點在于,采用多智能體強化學習方法處理復雜的電網多斷面功率控制問題,具有較高的控制成功率且無需專家經驗,同時引入分布式方法大幅提升了智能體訓練效率。
聲明:
“基于分布式多智能體強化學習的電網多斷面功率自動控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)