本發明公開了一種基于強化學習的風控模型構建方法及裝置,屬于個人信貸風控技術領域。所述方法包括:接收用戶信貸請求,獲取風控決策需要的數據,進行驗證;對數據進行處理,構建狀態向量,并根據狀態向量和預定義的動作空間,結合強化學習模型,生成回報預測網絡;計算得到動作空間中每個動作實施后的預測回報,并采用預設的搜索策略選擇期望回報最大的動作并實施;根據用戶的實際還款結果,計算動作實施后的真實回報,并根據真實回報和預測回報,以回報最大化為目標,對回報預測網絡的參數進行更新。本發明可使風控模型優化目標與商業目標一致,并且能夠迅速應對行業或者市場的變化。
聲明:
“基于強化學習的風控模型構建方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)