Skip to main content

Advertisement

Table 5 Descriptor sets ranked and grouped by MCC (Matthews correlation coefficient), before and after removal of homologous sequences at 90% and 70% identity, respectively.

From: Efficacy of different protein descriptors in predicting protein functional families

Protein family % HRS* Prediction performance
   Exceptional > 0.85 Good = 0.85
EC2.4 NR D10 > D8> D9 > D3 D5 > D4 = D6 > D2 > D1 > D7
  90% D10 D8 > D3 = D9 > D5 > D2 = D4 > D6 > D7 > D1
  70%   D10 > D8 > D3 = D9 > D5 > D2 > D4 > D6 > D7 > D1
GPCR NR D8 > D10 > D1 = D2 = D3 = D4 = D6 = D9 > D5 > D7  
  90% D8 = D10 > D2 = D9 > D3 = D4 = D6 > D1 > D5 > D7  
  70% D10 > D8 = D9 > D2 > D6 > D1 = D3 = D4 > D5 D7
TC8.A NR   D8 = D10 > D6 > D7 > D2 = D3 = D9 > D4 = D5 > D1
  90%   D8 = D10 > D6 > D7 > D2 = D3 = D4 = D5 = D9 > D1
  70%   D8 = D10 > D6 > D2 = D7 = D9 > D3 > D4 = D5 > D1
Chlorophyll NR D8 = D10 > D4 > D3 = D9 D5 > D2 > D6 > D7 > D1
  90% D8 = D10 > D3 = D4 D9 > D5 > D2 > D6 > D1 > D7
  70%   D8 = D10 > D3 = D4 > D9 > D5 > D2 > D6 > D1 > D7
Lipid synthesis NR D10 > D6 D7 > D2 = D3 = D9 > D4 = D8 > D5 > D1
  90% D6 = D10 D3 = D7 > D4 = D9 > D5 = D8 > D2 > D1
  70%   D10 > D3 = D6 = D7 > D2 = D4 = D9 > D5 = D8 > D1
rRNA binding NR D10 > D8 = D9 > D2 = D3 = D6 > D1 > D7> D4 = D5  
  90% D6 = D10 > D8 > D2 = D9 > D1 = D3 > D5 > D4> D7  
  70% D6 = D10> D8 > D9 > D2 > D3 = D5 > D1 > D4 > D7  
  1. *HSR: homologous sequence removed
  2. NR: (homologous sequences) Not Removed