本申請涉及化學技術領域,公開了一種構建方法、分析方法、裝置、存儲介質和計算機設備,其中,構建方法包括:獲取多個化合物樣本的SMILES序列;對所述多個化合物樣本的SMILES序列進行拼接處理,確定拼接SMILES序列;根據訓練樣本序列對BERT模型進行訓練,構建所述預訓練模型,所述訓練樣本序列包括所述多個化合物樣本的SMILES序列和所述拼接SMILES序列。本申請的方法,能夠從無標簽的樣本數據對BERT模型進行有監督學習得到相應的機器學習模型,不僅節約模型訓練時間,而且模型泛化能力較強。
聲明:
“構建方法、分析方法、裝置、存儲介質和計算機設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)