本發明公開了一種基于強化學習訓練施工管理決策模型的方法,包括:獲取目標施工項目的初始施工參數和所述目標施工項目所在地區的歷史環境參數;其中,所述目標施工項目為待規劃工人工時和物料購買量的施工項目;以所述初始施工參數和所述歷史環境參數為基礎數據構造出施工項目模擬器;根據所述施工項目模擬器模擬出與施工過程相關的觀測軌跡、行動軌跡、狀態軌跡和激勵序列;根據所述觀測軌跡、所述行動軌跡、所述狀態軌跡和所述激勵序列對預設結構的決策模型進行優化,以使優化后的決策模型可用于規劃工人工時和物料購買量。本發明還公開了一種基于強化學習規劃工人工時和物料購買量的方法、一種施工項目模擬器以及一種計算機可讀存儲介質。
聲明:
“基于強化學習訓練施工管理決策模型的方法和介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)