本發明公開了一種基于動作采樣的強化學習知識圖譜推理方法。該發明針對傳統知識圖譜強化學習推理算法中表征能力不足、無效冗余動作選取以及無記憶組件問題,根據表示學習方法在數據集上的原始事實預測評分,針對性地選取適應性更強的表示學習方法來表示強化學習環境以增強算法表征能力;設計動作采樣器以減少智能體在游走過程中的無效冗余動作選擇;以LSTM為記憶組件,將歷史信息進行編碼以增加模型精度,這使得本算法可以在擺脫預訓練的情況下取得優于基于路徑的推理算法的效果。該方法將智能體在環境中游走得到的路徑映射到三層LSTM策略網絡,通過動作采樣促進智能體選擇更有意義的路徑,最終實現較為準確的實體關系路徑學習。
聲明:
“基于動作采樣的強化學習知識圖譜推理方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)