本發明公開了一種基于深度強化學習的智慧家庭能量管理方法及系統,方法的設計步驟如下:將在無建筑熱動力學模型和維持室內溫度在舒適范圍的情況下最小化智慧家庭能量成本這一能量管理問題建模為馬爾可夫決策過程并設計相應的環境狀態、行為、獎勵函數;利用深度確定性策略梯度算法訓練出不同環境狀態下能量存儲系統或/和可控負載的最優行為,進而最大化獎勵函數;將訓練好的深度神經網絡參數定期拷貝至智慧家庭能量管理系統本地的深度神經網絡,用于實際性能測試。本發明提出的方法無需知曉任何不確定性系統參數的先驗信息和建筑熱動力學模型,且采用本地測試與云端訓練相結合的在線學習模式來應對環境變化可能帶來的性能降級問題。
聲明:
“基于深度強化學習的智慧家庭能量管理方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)