本發明提出一種基于深度強化學習的推薦算法,構建了MainNet神經網絡和TargetNet神經網絡的雙網絡結構模型,其中MainNet神經網絡是主神經網絡,用于得到戶對推薦列表,TargetNet神經網絡用于訓練模型參數,得到最優模型參數,并不斷更新模型參數,作為MainNet神經網絡的輸入的當前狀態不僅包括長期特征,而且包括外部條件特征,為用戶購物行為的準確預測奠定了基礎。本發明克服了傳統機器學習的缺點,不需要歷史數據積累,只要網站存在交易行為,該算法可以實現自我學習,自我優化和自我完善。
聲明:
“基于深度強化學習的推薦算法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)