本發明公開了一種基于強化學習的機器學習模型預測時機估計模型,首先采集一組時間序列數據輸入到LSTM模型中,得到預測結果;然后將預測結果和時間序列數據同時輸入到強化學習模型中,采用兩次預測結果交叉熵的差值作為強化學習的獎勵函數,得到強化學習模型的決策;最后根據決策數值判斷預測結果是否準確,如果不準確,讀取下一時刻數據與前述的時間序列數據組合形成新的時間序列數據輸入到LSTM模型中進行下一輪的預測,循環進行預測操作。
聲明:
“基于強化學習的機器學習模型預測時機估計模型” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)