本發明能夠提供基于深度強化學習的機器人導航方法及系統、設備、介質。該方法包括:獲取實時觀測數據,以構建環境地圖和確定機器人的當前位置和目標點相對位置。生成導航動作信息,依據導航動作信息控制機器人從當前位置向目標點相對位置移動。經過第一設定時長后判斷機器人是否到達目標點相對位置。根據未到達目標點生成新導航路徑,并控制機器人沿著新導航路徑移動,以及再經過第二設定時長后返回獲取實時觀測數據步驟;或根據到達目標點結束導航。本發明能夠在沒有初始地圖的環境下控制機器人在導航過程中靈活地避開靜態和動態障礙物,計算量較小。本發明創新地結合了全局信息和局部信息,有效避免了常規機器人在局部區域徘徊的問題。
聲明:
“基于深度強化學習的機器人導航方法及系統、設備、介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)