Skip to main content

Table 3 The effect of Hamming distance on the candidate motif number and occurrence probability for a pair of l-mers under the protein data

From: RefSelect: a reference sequence selection algorithm for planted (l, d) motif search

i = d H (x, x') (13, 6) (15, 7) (17, 8) (19, 9)
|M d (x, x')| p i |M d (x, x')| p i |M d (x, x')| p i |M d (x, x')| p i
18 - - - - - - 4.9 × 104 3.8 × 10−1
17 - - - - - - 4.0 × 106 1.8 × 10−1
16 - - - - 1.3 × 104 3.7 × 10−1 1.4 × 108 5.3 × 10−2
15 - - - - 9.4 × 105 1.6 × 10−1 2.6 × 109 1.1 × 10−2
14 - - 3.4 × 103 3.7 × 10−1 2.8 × 107 4.1 × 10−2 3.1 × 1010 1.8 × 10−3
13 - - 2.2 × 105 1.4 × 10−1 4.6 × 108 7.6 × 10−3 2.4 × 1011 2.2 × 10−4
12 9.2 × 102 3.5 × 10−1 5.6 × 106 3.1 × 10−2 4.5 × 109 1.0 × 10−3 1.3 × 1012 2.1 × 10−5
11 5.1 × 104 1.1 × 10−1 7.6 × 107 4.9 × 10−3 2.9 × 1010 1.1 × 10−4 5.4 × 10 12 1.7 × 10 −6
10 1.1 × 106 2.1 × 10−2 6.0 × 108 5.6 × 10−4 1.3 × 1011 9.1 × 10−6 1.8 × 10 13 1.1 × 10 −7
9 1.2 × 107 2.8 × 10−3 3.0 × 109 4.9 × 10−5 4.4 × 10 11 6.0 × 10 −7 5.0 × 10 13 5.7 × 10 −9
8 7.0 × 107 2.7 × 10−4 1.1 × 1010 3.3 × 10−6 1.3 × 10 12 3.2 × 10 −8 1.2 × 10 14 2.5 × 10 −10
7 2.7 × 108 1.9 × 10−5 3.2 × 10 10 1.8 × 10 −7 3.1 × 10 12 1.3 × 10 −9 2.8 × 10 14 8.6 × 10 −12
6 8.3 × 10 8 9.9 × 10 −7 8.0 × 10 10 7.2 × 10 −9 7.1 × 10 12 4.4 × 10 −11 5.9 × 10 14 2.4 × 10 −13
5 2.1 × 10 9 3.9 × 10 −8 1.8 × 10 11 2.3 × 10 −10 1.5 × 10 13 1.2 × 10 −12 1.2 × 10 15 5.5 × 10 −15
4 4.7 × 10 9 1.1 × 10 −9 3.8 × 10 11 5.4 × 10 −12 3.0 × 10 13 2.4 × 10 −14 2.3 × 10 15 9.6 × 10 −17
3 9.8 × 10 9 2.4 × 10 −11 7.5 × 10 11 9.5 × 10 −14 5.7 × 10 13 3.6 × 10 −16 4.3 × 10 15 1.3 × 10 −18
2 2.0 × 10 10 3.4 × 10 −13 1.5 × 10 12 1.2 × 10 −15 1.1 × 10 14 3.8 × 10 −18 8.0 × 10 15 1.2 × 10 −20
1 4.1 × 10 10 3.0 × 10 −15 2.9 × 10 12 8.7 × 10 −18 2.1 × 10 14 2.5 × 10 −20 1.6 × 10 16 6.9 × 10 −23
0 8.4 × 10 10 1.2 × 10 −17 6.0 × 10 12 3.1 × 10 −20 4.3 × 10 14 7.6 × 10 −23 3.1 × 10 16 1.9 × 10 −25