本發明提出一種基于深度強化學習的容器云集群資源利用優化方法,包括:對原始負載數據進行預處理并組裝為輸入狀態s;構建深度Q網絡模型,將輸入狀態s輸入深度Q網絡模型中,深度Q網絡模型以一定概率隨機選取動作a,或選取使深度Q網絡模型最優的動作a,執行一次超賣比預測;通過獎勵函數對所選取的動作a進行評估,得到獎勵r并進入下一狀態s′;將輸入狀態s、動作a、獎勵r、下一狀態s′組成四元組并作為訓練樣本放入緩存中;當達到預設的訓練間隔時,從緩存中采樣e個訓練樣本并輸入深度Q網絡模型中進行訓練,更新深度Q網絡模型的參數;當深度Q網絡模型經過E輪訓練后,將完成參數更新的深度Q網絡模型應用于確定超賣策略。
聲明:
“基于深度強化學習的容器云集群資源利用優化方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)