本發明公開了一種用于相干合成的強化學習方法,包括以下步驟:根據相干合成光束路數建立動作空間和設置相干合成Q?learning學習參數;根據動作空間建立Q值表;選擇一個動作,智能體的輸出值為輸出值加減微小動作電壓或相位;根據光電探測器返回給智能體的環境狀態確定獎勵函數;更新Q值表;由于相干合成時域無限,所以智能體的學習訓練不會停止。該算法不需要大量時間進行訓練,而且因為其學習性,所以在相干合成中比傳統的算法更穩定,同時調整參數更加容易。
聲明:
“用于相干合成的強化學習方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)