本申請涉及航空機器學習領域,為一種免模型強化學習的軟件測試方法,包括根據要測試的功能集,構建測試條件集C,構建被測軟件的觀測空間O,構建測試動作空間A,形成測試模擬環境;構建對動作序列執行效果進行獎賞的獎賞函數;構建能夠作用于軟件本身的動作執行驅動接口;構建能夠自我學習的測試策略網絡;構建免模型的強化學習損失函數;驅動測試策略網絡實時生成軟件操作動作并通過動作執行驅動接口作用于軟件,進行計算并記錄數據元組,存入數據集;所述強化學習損失函數利用數據集優化測試策略網絡參數。具有測試效率高、測試時間短、準確性高的技術效果。
聲明:
“基于免模型強化學習的軟件測試方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)