本發明提供一種基于強化學習作業布局的深度學習訓練方法,其包括:S1:對用戶提交的作業進行代碼完整性測試;S2:判斷測試是否成功,若是,則進步下一步,若否,則將作業打回給用戶;S3:計算作業的優先級,并將優先級計算完成的作業放入優先級隊列中;S4:調度器判斷集群資源是否充足,若是,進入下一步,若否,調度器根據優先級對當前運行的作業進行搶占,并進入下一步;S5:調度器從優先級隊列中取作業進行調度;S6:被調度的作業通過布局算法對作業的任務進行優化布局;S7:判斷調度間隔時間片是否耗盡,若是,進入步驟S3;若否,繼續執行作業??捎行Ы鉀Q由于作業調度器的不合理導致作業阻塞遲遲不能執行的問題,提高GPU資源利用率。
聲明:
“基于強化學習作業布局的深度學習訓練系統及方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)