本發明公開了一種深度強化學習指導下基于連續移動的視覺跟蹤方法及裝置,其中,方法包括:預訓練預測網絡;根據預測網絡生成多個動作并得到相應的獎勵;獲取多個動作的每個動作的Q值,同時更新預測和生成動作的網絡。該方法可以將連續地并且累積地調整物體的目標框,同時動態地調整目標物體的外觀特征和模型,大大提高魯棒性。
聲明:
“深度強化學習指導下基于連續移動的視覺跟蹤方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)