用于訓練基于強化學習模型來檢測惡意軟件的系統的技術。這樣的已訓練系統檢測文件是惡意文件還是良性文件,并且確定在這種檢測中停止文件執行的最佳時間。強化學習模型與事件分類器和文件分類器相結合可以學習到是在已觀察到足夠的狀態信息之后停止執行,還是在需要更多事件來做出高置信的確定時繼續執行。所公開的算法允許系統基于每個文件來決定何時停止。
聲明:
“針對用于檢測惡意軟件的深度強化學習技術的訓練技術” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)