本發明公開了一種多智能體強化學習滾動調度方法、裝置、設備及存儲介質,所述方法通過構建高比例新能源電力系統對應日內有功的滾動調度模型;對滾動調度模型進行多智能體的去中心化部分可觀馬爾科爾夫決策過程建模,獲得多智能體調度架構;獲取多智能體調度架構的改進區域特征聚合圖的注意力網絡,并獲取支持時空多維特征聚合的多智能體強化學習算法,根據注意力網絡和多智能體強化學習算法構建基于多智能體強化學習的分布式日內滾動調度算法的訓練架構,建模求解速度快,訓練過程簡單,符合電網調度實際應用場景,提高了多智能體強化學習滾動調度的準確性,提升了多智能體強化學習滾動調度的速度和效率。
聲明:
“多智能體強化學習滾動調度方法、裝置、設備及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)