本發明公開了基于深度森林的蛋白質?蛋白質相互作用預測方法,屬于生物信息技術領域。所述方法融合偽氨基酸組成、自相關描述符、互信息描述符、組成、分布和轉化描述符、氨基酸組成位置特異性得分矩陣和二肽組成位置特異性得分矩陣將蛋白質序列轉化為數值向量,融合蛋白質對的序列信息、物理化學性質信息和進化信息作為樣本的初始特征;使用彈性網進行特征選擇,剔除冗余和不相關的特征;將融合后的最優特征向量輸入到構建的多粒度級聯深度森林中,預測蛋白質?蛋白質相互作用。本發明簡單有效,深度森林能夠表征蛋白質對的高水平特征信息,在訓練集和測試集上的結果明顯優于其它預測方法,可以為藥物靶點預測和人類疾病治療提供一定借鑒。
聲明:
“基于深度森林的蛋白質-蛋白質相互作用預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)