本發明公開一種基于圖像特征深度強化學習的AUV管道循管方法。首先,將AUV循管控制問題建模為連續狀態、連續動作的Markov決策過程;其次,控制策略抽象為AUV觀測狀態(攝像頭獲取的圖像)到運動動作的映射,并利用深度神經網絡表達;最后,利用近端策略優化(PPO)方法自主采集數據并訓練深度神經網絡,最終獲得具有一定泛化能力的端到端的循管控制策略。仿真結果表明,本發明能夠有效控制AUV的循管動作,而且對于新的和未知的管道幾何結構具有較強的泛化能力。該方法是一種端到端(end?to?end)的視覺循管運動控制方法,無需知曉AUV的運動學/動力學模型,也無需人工特征提取。
聲明:
“基于圖像特征深度強化學習的AUV管道循管方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)