本發明屬于視覺技術領域,具體涉及一種基于深度強化學習仿人足球機器人的實時主動視覺方法,包括如下步驟:選擇方法、目標測定、訓練過程和細節,所述選擇方法通過定義馬爾可夫決策過程來將問題表述為一個情景性強化學習問題,同時從當前的環境狀態得到一個準確的信念;所述目標測定根據機器人和球的位置確定最佳視角,并采用基于熵的方法評估自定位視角的效率;所述訓練過程和細節基于熵的算法輸出用于機器人頭部的在線控制,使用深度Q?learning方法解決情景性強化學習問題。
聲明:
“基于深度強化學習仿人足球機器人的實時主動視覺方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)