視覺關系通常表示為一個三元組<subject,predicate,object>,其中包含兩個物體subject和object及它們之間的交互動作predicate。視覺關系學習是連通低水平的圖像感知任務和高水平的圖像認知任務之間的一道橋梁,屬于中等水平的圖像理解任務。視覺關系實例學習是在給定圖像及對應的視覺關系集合的情況下,確定每個視覺關系中涉及到的兩個物體實例的問題。本發明將該問題建模成兩個智能體關于subject和object的兩個實例搜索框在圖像上進行搜索時的序列決策過程,從而提出了一種基于深度強化學習的視覺關系實例學習方法。對于給定的測試圖像及關聯的視覺關系集合,能夠快速準確地找到每個視覺關系中subject和object物體所對應的實例框。
聲明:
“基于強化學習的視覺關系實例學習方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)