本發明公開了一種基因測序數據壓縮預處理方法、系統及計算機可讀介質,方法實施步驟包括獲取參考基因組數據,獲取短串K?mer及其預測字符c之間的映射關系,得到包含參考基因組的正鏈及負鏈中任意短串K?mer及其對應相鄰位的預測字符c的預測數據模型P1;系統為包含編程以執行前述方法的計算機系統,計算機可讀介質包含執行前述方法的計算機程序。本發明能夠面向無損基因測序數據壓縮的參考基因組數據預處理方法,為基因測序數據的高性能無損壓縮和解壓算法提供充分有效的信息,能夠實現對任意基因組數據樣本中的短串K?mer的相鄰位的預測字符c進行預測,預測信息越準確,則可以實現對基因組數據樣本實現越低的壓縮率。
聲明:
“基因測序數據壓縮預處理方法、系統及計算機可讀介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)