Skip to main content

Table 7 Performance of the algorithms depending on the hardware architecture

From: Protein alignment algorithms with an efficient backtracking routine on multiple GPUs

algorithm

avg.

# of

1 GT200 GPU

1 Fermi GPU

2 Fermi GPUs

 

length

sequences

GCUPS

speedup

GCUPS

speedup

GCUPS

speedup

  

4000

2,58

1,00

5,13

1,99

10,02

3,88

 

51

8000

2,68

1,00

5,21

1,95

10,13

3,78

  

12000

2,71

1,00

5,25

1,94

10,28

3,79

  

2000

2,65

1,00

5,37

2,03

10,55

3,98

 

154

4000

2,80

1,00

5,57

1,99

10,87

3,88

SW

 

6000

2,86

1,00

5,65

1,97

11,07

3,87

  

2000

2,68

1,00

5,12

1,91

9,91

3,69

 

257

4000

2,83

1,00

5,25

1,85

10,21

3,60

  

6000

2,90

1,00

5,20

1,80

10,10

3,48

  

2000

2,71

1,00

4,26

1,57

8,02

2,96

 

459

4000

2,84

1,00

4,57

1,61

8,46

2,98

  

6000

2,85

1,00

4,64

1,63

8,56

3,01

  

4000

3,04

1,00

5,68

1,87

11,13

3,66

 

51

8000

3,15

1,00

5,76

1,83

11,21

3,56

  

12000

3,17

1,00

5,81

1,83

11,36

3,58

  

2000

3,10

1,00

5,88

1,90

11,46

3,69

 

154

4000

3,29

1,00

6,16

1,87

12,06

3,67

  

6000

3,36

1,00

6,28

1,87

12,24

3,64

global NW

 

2000

3,15

1,00

5,68

1,80

10,85

3,44

 

257

4000

3,33

1,00

5,80

1,74

11,15

3,35

  

6000

3,55

1,00

5,78

1,63

11,15

3,14

  

2000

3,19

1,00

4,84

1,52

9,07

2,84

 

459

4000

3,35

1,00

5,14

1,54

9,63

2,88

  

6000

3,36

1,00

5,17

1,54

9,68

2,89

  

4000

2,88

1,00

5,50

1,91

10,75

3,74

 

51

8000

2,97

1,00

5,58

1,88

10,86

3,66

  

12000

3,01

1,00

5,62

1,87

11,04

3,67

  

2000

3,00

1,00

5,81

1,94

11,36

3,79

 

154

4000

3,18

1,00

6,02

1,90

11,87

3,74

  

6000

3,25

1,00

6,17

1,90

12,00

3,69

semiglobal NW

 

2000

3,05

1,00

5,60

1,84

10,90

3,57

 

257

4000

3,23

1,00

5,77

1,79

11,10

3,44

  

6000

3,39

1,00

5,73

1,69

11,03

3,26

  

2000

3,09

1,00

4,78

1,54

9,04

2,92

 

459

4000

3,24

1,00

5,04

1,56

9,55

2,95

  

6000

3,25

1,00

5,14

1,58

9,56

2,94

  1. Mean performance (in GCUPS) for different versions of the algorithm running on two architectures: GT200 (Tesla S1070) and Fermi (GeForce GTX480). The columns with speedup always refer to the configuration with one GT200 GPU.