本申請公開了一種基于強化學習的無人車避障方法及裝置,利用強化學習算法,在預先獲取的環境約束下,對動態窗口避障模型進行訓練,得到預測窗口?;陬A測窗口和速度采樣約束,采樣多組速度,并針對每組采樣速度,生成一組軌跡。利用預先構建的避障懲罰函數和評價函數,對多組軌跡進行評分。從各組軌跡中選取評分最高的軌跡,作為目標軌跡。將目標軌跡所對應的采樣速度,輸出至無人車的控制系統中,使得無人車依據目標軌跡所對應的采樣速度進行驅動。利用強化學習對動態窗口避障模型進行訓練,并利用避障懲罰函數從各組軌跡中選出避障性能較高的軌跡??梢?,利用本申請所述的方法,能夠提高無人車的避障性能,實現無人車的主動避障。
聲明:
“基于強化學習的無人車避障方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)