本發明公開一種基于深度強化學習的頻譜資源管理方法。主要解決現有技術不能有效利用不完全信道狀態信息進行頻譜和功率分配以及頻譜資源管理多目標優化的問題。其實現方案是,以頻譜效率最大化為優化目標,構造以信道增益和噪聲功率為權值參數的自適應深度神經網絡;初始化權值參數,觀測用戶接入信息和干擾信息,根據通信網絡能量效率和公平性計算損失函數,沿著損失函數梯度下降方向逐層更新信道增益和噪聲功率,反復訓練自適應深度神經網絡,當滿足訓練結束條件,輸出最優頻譜資源管理策略。本發明能基于不完全信道狀態信息得到最優頻譜資源管理策略,有效提升了通信網絡的頻譜效率、能量效率和公平性,可用于無線通信中的頻譜和功率分配。
聲明:
“基于深度強化學習的頻譜資源管理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)