本發明公開了一種基于深度學習的蛋白質相互作用位點預測方法,屬于生物信息學分析技術領域,首先,從PDB數據庫獲取公開的蛋白質數據集,基于數據集中蛋白質的序列信息生成位置特異性得分矩陣并提取給定蛋白質序列的物理化學特征,從而形成蛋白質中每一個氨基酸殘基的表示。由于蛋白質序列中非相互作用殘基遠遠多于相互作用殘基,采用下采樣策略來消除類別不平衡性以獲得高質量且低偏差的數據集。將平衡后的數據集分為訓練集和測試集,對于訓練集利用變分自編碼器進一步提取蛋白質序列的高級抽象特征,再利用多層感知機對氨基酸殘基進行分類。將訓練好的模型在測試集上測試,得到預測結果。本發明計算成本低且預測精度較高。
聲明:
“基于深度學習的蛋白質相互作用位點預測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)