本發明公開了一種基于強化學習的路徑可控的藥物分子生成方法,由初始分子R0,通過Agent尋找最佳反應模版T0和反應物a0,再通過environment搜索與最佳反應物相似的反應物集,返回該集合中受益最大的中間反應產物R1,同時將中間產物加入分子庫中,反復循環,直至搜索結束找到最佳反應產物;該方法不僅可結合傳統藥物生成的經驗模版,同時利用強化學習的搜索不斷尋找最佳的反應類型,得到最高回報價值的藥物分子;還結合傳統基于經驗搜索、測驗的方法和基于深度生成模型兩者的優勢,不僅能得到有效的藥物合成路徑,還能擴大搜索空間,生成更多樣化的分子結構,能大幅度地降低全新藥物分子的研發時間,所得藥物分子具有極高的可行性。
聲明:
“基于強化學習的路徑可控的藥物分子生成方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)