本發明公開了一種基于深度強化學習的自動駕駛智能車軌跡跟蹤控制策略,針對智能車自動駕駛任務,根據深度確定性策略梯度(DDPG)算法中的“動作?評論家”結構,采用“雙動作”網絡分別輸出方向盤轉角命令和車速命令,并設計“主評論家”網絡用以指導“雙動作”網絡的更新過程,具體包括:將自動駕駛任務描述為馬爾可夫決策過程:<st,at,Rt,st+1>;采用行為克隆算法對改進DDPG算法中的“雙動作”網絡進行初始化;對深度強化學習DDPG算法中的“評論家”網絡進行預訓練;設計包含多種駕駛場景的訓練道路進行強化學習在線訓練;設置新的道路對訓練好的深度強化學習(DRL)模型進行測試。本發明通過模仿人學車過程設計控制策略,實現了智能車在簡單道路環境下的自動駕駛。
聲明:
“基于深度強化學習的自動駕駛智能車軌跡跟蹤控制策略” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)