蛋白質亞細胞定位預測的超級學習機方法
大?。?/span>0.29 MB 人氣: 2018-01-03 需要積分:1
蛋白質一級序列的亞細胞定位在基因組注釋、蛋白質功能預測、藥物發現等領域起著重要作用。超級學習機是近年來新興的機器學習方法。本文探討了超級學習機在蛋白質亞細胞定位預測中的潛力。為此,我們首先給出了一種新的特征提取策略,將每個蛋白質一級序列表示成25維的數值向量。在此基礎上,我們將852組分枝桿菌蛋白質數據分別用基于新特征的支持向量機方法、基于新特征的超級學習機方法和已有的基于偽氨基酸組成特征的支持向量機方法做數值試驗。這852組數據從Swiss-Prot 48數據庫中選取,分屬于四個不同種類。通過在這些數據上做五折交叉數值比較發現,基于新特征提取策略的超級學習機方法的準確率最高,達到了97.2%,超過基于新特征的支持向量機方法的96.4%的準確率以及基于偽氨基酸組成特征的支持向量機方法的95.2%的準確率。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%