本發明涉及一種基于多模態強化學習的電網調控方法,包括以下步驟:步驟1、輸入電網的數據集;步驟2、構建出包含數據集中電網設備節點狀態和故障處置的知識圖譜;步驟3、獲得能對當前設備節點多模態狀態和故障處置動作進行的Embedding的多模態信息融合模塊;步驟4、選取步驟2中構建的知識圖譜,根據當前狀態到目標狀態的情況定義出多跳評分函數,用于評估兩個狀態之間的相關性;步驟5、構建故障處置的元路徑;步驟6、產生強化學習的獎勵函數;步驟7、定義強化學習的馬爾可夫過程生成基于policy?based的強化學習框架;步驟8、訓練產生基于多模態強化學習獲得的電網調控策略。本發明可解釋性強且預測準確性高。
聲明:
“基于多模態強化學習的電網調控方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)