本發明公開了一種對抗樣本生成方法、裝置、終端及可讀存儲介質,所述方法包括:基于對抗樣本生成策略確定本次采樣對應的目標教師模型以及目標攻擊算法,基于目標教師模型以及目標攻擊算法進行強化學習,得到中間對抗樣本,并基于所述中間對抗樣本優化對抗樣本生成策略,基于中間對抗樣本確定參與學生模型訓練的對抗樣本,基于優化后的對抗樣本生成策略進行迭代強化學習訓練,直到檢測到迭代停止條件,迭代強化學習訓練結束。通過強化學習算法針對當前學生模型動態地找到攻擊強度最大的一種或幾種攻擊算法以及對應的參數,進而高效生成包含難樣本的對抗樣本用來訓練學生模型,在加速模型訓練的同時,顯著提升了模型面對攻擊的魯棒性。
聲明:
“對抗樣本生成方法、裝置、終端及可讀存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)