Skip to main content

Table 5 Descriptor sets ranked and grouped by MCC (Matthews correlation coefficient), before and after removal of homologous sequences at 90% and 70% identity, respectively.

From: Efficacy of different protein descriptors in predicting protein functional families

Protein family

% HRS*

Prediction performance

  

Exceptional > 0.85

Good = 0.85

EC2.4

NR

D10 > D8> D9 > D3

D5 > D4 = D6 > D2 > D1 > D7

 

90%

D10

D8 > D3 = D9 > D5 > D2 = D4 > D6 > D7 > D1

 

70%

 

D10 > D8 > D3 = D9 > D5 > D2 > D4 > D6 > D7 > D1

GPCR

NR

D8 > D10 > D1 = D2 = D3 = D4 = D6 = D9 > D5 > D7

 
 

90%

D8 = D10 > D2 = D9 > D3 = D4 = D6 > D1 > D5 > D7

 
 

70%

D10 > D8 = D9 > D2 > D6 > D1 = D3 = D4 > D5

D7

TC8.A

NR

 

D8 = D10 > D6 > D7 > D2 = D3 = D9 > D4 = D5 > D1

 

90%

 

D8 = D10 > D6 > D7 > D2 = D3 = D4 = D5 = D9 > D1

 

70%

 

D8 = D10 > D6 > D2 = D7 = D9 > D3 > D4 = D5 > D1

Chlorophyll

NR

D8 = D10 > D4 > D3 = D9

D5 > D2 > D6 > D7 > D1

 

90%

D8 = D10 > D3 = D4

D9 > D5 > D2 > D6 > D1 > D7

 

70%

 

D8 = D10 > D3 = D4 > D9 > D5 > D2 > D6 > D1 > D7

Lipid synthesis

NR

D10 > D6

D7 > D2 = D3 = D9 > D4 = D8 > D5 > D1

 

90%

D6 = D10

D3 = D7 > D4 = D9 > D5 = D8 > D2 > D1

 

70%

 

D10 > D3 = D6 = D7 > D2 = D4 = D9 > D5 = D8 > D1

rRNA binding

NR

D10 > D8 = D9 > D2 = D3 = D6 > D1 > D7> D4 = D5

 
 

90%

D6 = D10 > D8 > D2 = D9 > D1 = D3 > D5 > D4> D7

 
 

70%

D6 = D10> D8 > D9 > D2 > D3 = D5 > D1 > D4 > D7

 
  1. *HSR: homologous sequence removed
  2. NR: (homologous sequences) Not Removed