本發明涉及人工智能技術領域,具體公開了一種基于樣本包絡多層聚類的數據集平衡化學習方法,包括步驟:選擇不平衡訓練集,該不平衡訓練集由少數類樣本和多數類樣本組成;對少數類樣本和多數類樣本構造對應的包絡化少數類樣本和包絡化多數類樣本;對包絡化少數類樣本進行深度樣本變換,得到對應的L層包絡化少數類深度樣本,L≥1;將包絡化少數類樣本與每層包絡化少數類深度樣本進行融合,得到樣本數目與包絡化多數類樣本平衡的包絡化少數類平衡樣本;將包絡化少數類平衡樣本與包絡化多數類樣本融合,得到平衡訓練集。本發明增加了少數類樣本的多樣性,提高了少數類樣本的質量,從而增加了模型對少數類樣本的學習能力,提升了其分類或預測的準確性。
聲明:
“基于樣本包絡多層聚類的數據集平衡化學習方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)