本發明提供了一種基于連詞標記和強化學習的自然語言推理方法,包括以下步驟:(1)在連詞預測任務上訓練一個連詞預測模型;(2)在自然語言推理模型中,輸入前提和猜想文本并使用編碼器對其編碼,得到表達矩陣;(3)將連詞預測模型的編碼器嵌入到自然語言推理模型中,將步驟(2)編碼過程中得到的前提和猜想的詞向量送入預訓練好的編碼器并輸出表達向量;(4)將自然語言推理模型的編碼器和嵌入的連詞預測模型中的編碼器在注意力機制中交互,得到一個注意力向量;(5)將注意力向量轉化為概率分布并輸出結果。利用本發明,通過遷移其他監督學習任務所學到的知識,大大提升了在大規模數據集上進行自然語言推理任務的準確率。
聲明:
“基于連詞標記和強化學習的自然語言推理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)