本發明涉及圖像識別領域,特別涉及一種基于深度學習的復雜文字識別方法。通過分析文字復雜性的原因,使用隨機樣本生成器產生的包含待識別圖片噪聲模型和扭曲特征模型的訓練樣本來訓練深度神經網絡;這樣的訓練樣本中包含復雜的噪聲和扭曲變形,可以滿足各種復雜文字識別的需要;將少量人工標注的第一訓練樣本集和隨機生成的大量第二訓練樣本集混合后輸入所述深度神經網絡中,解決了通過深度神經網絡來識別文字時需要大量人工標注訓練樣本的問題;并且在保留了待識別圖片的噪聲、扭曲等復雜性的前提下,使用最先進的深度神經網絡進行自動化學習,避免了現有OCR方法中需要去噪而導致的信息丟失的問題,提高了識別的準確率。
聲明:
“基于深度學習的復雜文字識別方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)