Skip to main content

Advertisement

Table 2 Average classification error rates yielded by Random Forest, k Nearest Neighbors and Support Vector Machine classifiers on ‘Leukaemia’ dataset over all the 50 repetitions of 10‐fold cross validation

From: A feature selection method for classification within functional genomics experiments based on the proportional overlapping score

  RF kNN SVM
N. genes Wil‐RS mRMR MP POS Wil‐RS mRMR MP POS Wil‐RS mRMR MP POS
1 0.126 0.211 0.015 0.003 0.141 0.220 0.019 0.005 0.133 0.238 0.022 0.005
2 0.083 0.197 0.017 0.001 0.110 0.195 0.059 0.047 0.099 0.197 0.053 0.026
3 0.068 0.185 0.020 0.003 0.086 0.198 0.070 0.073 0.078 0.198 0.064 0.044
4 0.044 0.180 0.016 0.001 0.082 0.194 0.076 0.069 0.068 0.178 0.070 0.050
5 0.043 0.168 0.015 0.002 0.077 0.191 0.084 0.075 0.060 0.172 0.079 0.060
6 0.037 0.170 0.018 0.005 0.074 0.188 0.087 0.065 0.052 0.171 0.082 0.065
7 0.036 0.161 0.018 0.004 0.077 0.182 0.090 0.065 0.049 0.162 0.086 0.069
8 0.035 0.158 0.020 0.004 0.081 0.186 0.092 0.063 0.047 0.166 0.090 0.074
9 0.032 0.161 0.015 0.003 0.082 0.176 0.090 0.067 0.049 0.162 0.092 0.083
10 0.031 0.157 0.018 0.003 0.078 0.181 0.094 0.067 0.050 0.159 0.092 0.079
20 0.030 0.141 0.028 0.001 0.085 0.162 0.102 0.064 0.062 0.145 0.088 0.068
30 0.030 0.131 0.029 0.001 0.085 0.155 0.108 0.070 0.058 0.139 0.093 0.066
40 0.031 0.118 0.031 0.000 0.084 0.142 0.105 0.078 0.053 0.127 0.094 0.069
50 0.031 0.119 0.029 0.001 0.083 0.135 0.107 0.078 0.049 0.126 0.101 0.062
Avg. 0.041 0.157 0.021 0.002 0.087 0.179 0.085 0.063 0.065 0.167 0.079 0.059
Min. 0.030 0.118 0.015 0.000 0.074 0.135 0.019 0.005 0.047 0.126 0.022 0.005
  1. Boldface numbers indicate the minimum average of classification error rates (the highest accuracy) achieved with the corresponding classifier at each size of selected gene sets, reported in the first column.