本發明涉及一種基于動態模型強化學習的倒水服務機器人控制方法,包括:步驟1:基于深度相機獲取三維空間的視覺信息;步驟2:利用深度神經網絡完成對機器人、源容器和目標容器的識別,同時獲得源容器、目標容器之間的相對位置信息、液體類型以及液位高度信息,完成狀態信息的獲??;步驟3:根據步驟2獲取的信息建立動態模型模擬當前環境,并利用動態模型對策略網絡進行訓練;步驟4:待策略網絡收斂后,將機器人的位姿信息和狀態信息輸入至策略網絡,輸出機器人動作策略;步驟5:使用步驟4預測出的機器人動作策略驅動機器人完成倒水動作。與現有技術相比,本發明具有對環境的泛化適應能力強、部署復雜度低等優點。
聲明:
“基于動態模型強化學習的倒水服務機器人控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)