本公開提供了一種移動順序確定模型的訓練方法、確定移動順序的方法、裝置、電子設備和存儲介質,涉及人工智能領域,具體涉及時空大數據領域和強化學習領域。移動順序確定模型的訓練方法的具體實現方案為:針對多個第一對象中的未移動對象,確定針對未移動對象的環境信息;將環境信息輸入移動順序確定模型,獲得針對多個第一對象的預測概率信息;根據預測概率信息,確定針對移動順序確定模型的第一獎勵信息;以及根據第一獎勵信息,訓練移動順序確定模型,其中,預測概率信息包括多個第一對象中的每個第一對象作為目標對象的概率值。
聲明:
“移動順序確定模型的訓練方法和確定移動順序的方法、裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)