本發明公開了一種基于軟啟動的非完美信息博弈智能策略求解方法,屬于人工智能領域。本方法包含如下步驟:1、構建初始智能博弈決策模塊;2、博弈信息預處理;3、博弈策略模型軟啟動;4、博弈策略模型自訓練;5、博弈決策后處理;6、模型輸出決策結果。本方法提出一種模型軟啟動方法與模型策略后處理方法,對已有博弈信息進行預處理,構建非完美信息博弈信息的高效、無損編碼,并通過已有策略生成狀態動作值函數,結合自博弈生成的狀態動作值函數,對模型進行軟啟動,訓練策略模型預測,從而增強訓練策略的多樣性,提升策略模型的訓練效果,最終模型根據當前狀態下的信息,進行后處理,選擇最符合當前狀態下的決策。
聲明:
“基于軟啟動的非完美信息博弈智能策略求解方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)