本發明涉及一種基于遷移強化學習的碳排放指數預測與治理方法,是針對現有同類技術中碳排放指數遷移強化學習和預測治理方法較難準確精準預測,以及較難最大化治理的技術問題。其要點是該預測方法通過遷移學習方法對具有相似特征區域的碳排放模型進行遷移,共享碳排放指數預測的信息;將遷移學習預測到的碳排放指數作為強化學習狀態的輸入,結合強化學習MDP進行碳排放治理建模,構建獎賞函數,運用強化學習算法實現預測。該治理方法利用MDP構建大規模自適應動態治理工具選擇和組合,并利用強化學習的方法進行最優化策略求解,這個最優策略將引導整個治理工具組合過程達到最終目標,最優的工具組合方案即為MDP最優策略所對應的動作序列。
聲明:
“基于遷移強化學習的碳排放指數預測與治理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)