本發明涉及在預定地理區域中分配資源的方法,其包括:檢索(S102)一組度量,該度量指示與至少兩方的資源的操作相關的關注因素,每一方具有多個資源;檢索(S104)指示每一方的優選度量值的優化政策;檢索(S106)包括用于在預定區域中分配資源的策略的至少一個模型,該至少一個模型基于從用于分配資源的一組場景中學習;從實時系統中檢索(S108)至少指示當前交通狀況的環境數據;在考慮到至少一個模型和環境數據的情況下,在至少兩方的優化政策中的度量之間建立(S110)納什均衡;根據已建立的納什均衡的結果在地理區域中分配(S112)資源。
聲明:
“基于強化學習使用半合作納什平衡來協調多方服務的方法和系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)