本發明公開了一種考慮累積誤差的AUV強化學習路徑規劃方法,首先計算AUV運行的累積誤差,再計算累計誤差的期望和方差,最后采用Q?Learning強化學習路徑規劃方法,并更改獎勵策略,對AUV沿著直線運動的動作進行獎勵,對AUV的轉彎動作不作獎勵懲罰;在每次迭代過程中生成每條路徑的累積誤差統計分析,選擇累積誤差最小的路徑作為規劃結果,生成最佳路徑。本發明使AUV在路徑規劃中定性和定量分析生成路徑的累積誤差統計,實現在規劃和控制的整個過程中有效減小定位誤差累積。
聲明:
“考慮累積誤差的AUV強化學習路徑規劃方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)