一種視頻行為時間軸定位及候選框提取的方法,該方法是基于未裁剪視頻數據的、深度強化學習的視頻行為時間軸候選框提取方法,具體步驟是:首先,在視頻行為時間軸定位任務上建立了馬爾科夫模型,將視頻行為時間軸定位任務轉化為求解馬爾科夫決策過程;然后,使用經典的深度強化學習算法DQN來求解馬爾科夫決策過程,使得算法自動調整時間軸窗口的長度與位置;最后,使用訓練出來的智能體模型和一個動作/背景二分類器,來定位視頻中的人類行為,產生時間軸候選框,以供后續更精確的定位和分析。本發明在效率與效果上超越了目前大多數先進算法,可用于定位視頻中的人類行為。
聲明:
“視頻行為時間軸定位及候選框提取的方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)