Skip to main content

Table 3 Datasets used for scaffolding and evaluations for SLR and SLR1

From: SLR: a scaffolding algorithm based on long reads and contig classification

Dataset

 

Genome

Contig set

Long read set

 

Misassemblies

 

NGA50

      

SLR

SLR1

 

SLR

SLR1

E. coli_1_SMRT

 

E. coli

E. coli_1

E. coli_SMRT

 

4

12

 

723,879

295,999

E. coli_2_SMRT

 

E. coli

E. coli_2

E. coli_SMRT

 

10

11

 

565,864

197,175

S. cerevisiae_1_SMRT

 

S. cerevisiae

S. cerevisiae_1

S. cerevisiae_SMRT

 

52

57

 

374,744

232,712

S. cerevisiae_2_SMRT

 

S. cerevisiae

S. cerevisiae_2

S. cerevisiae_SMRT

 

71

67

 

270,402

201,922

Chr X_1_SMRT

 

Chr X

Chr X_1

Chr X_SMRT

 

83

82

 

2,390,483

2,165,615

E. coli_1_ONT

 

E. coli

E. coli_1

E. coli_ONT

 

4

8

 

2,927,247

674,408

E. coli_2_ONT

 

E. coli

E. coli_2

E. coli_ONT

 

9

14

 

733,062

361,345

S. cerevisiae_1_ONT

 

S. cerevisiae

S. cerevisiae_1

S. cerevisiae_ONT

 

46

66

 

374,835

244,417

S. cerevisiae_2_ONT

 

S. cerevisiae

S. cerevisiae_2

S. cerevisiae_ONT

 

68

85

 

270,362

201,066

  1. Each dataset includes one contig set and one long-read set, and corresponds to one genome.