本發明公開一種LncRNA和環境因素關聯關系的高效預測方法,主要包括以下步驟:1、下載數據集,得到LncRNA和環境因素(EF)的列表,和二者關聯關系的關聯矩陣A;然后分別計算出LncRNA和EF的高斯相互作用屬性核相似矩陣KL、KE。2、計算EF之間的化學結構相似性矩陣E。3、將KL進行邏輯斯蒂函數轉換,得到相似矩陣SL;且利用E和KE構建EF的相似矩陣SE。4、融合A、SL和SE構建一個全局異構網絡G;利用重啟隨機游走計算擴散特征,并使用奇異值分解降維。5、計算lncRNA?EF對的Hetesim得分。6、結合擴散特征和HeteSim得分得到特征數據集并用于訓練梯度提升樹分類器去預測LncRNA?EF的關聯關系。7、使用10折交叉驗證方法對提出的方法進行驗證。應用本發明預測LncRNA和EF關聯關系的精度高。
聲明:
“LncRNA和環境因素關聯關系的高效預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)