Tecnologia de Sequenciamento: Illumina, Pacbio e Nanopore - lmigueel/Bioinformatica GitHub Wiki

1. Sobre

Existem agora três tecnologias principais de sequenciamento disponíveis e comumente usadas: Illumina, PacBio e Oxford Nanopore. Compreender os pressupostos e limitações de cada uma dessas tecnologias pode auxiliar no planejamento do projeto experimental.

2. Illumina

Os dados brutos da Illumina são reads entre 100 e 300 bps de tamanho e possuem alta qualidade para reads menores que 200 bp. Valores de qualidade para bases em reads entre 250-300 bp geralmente são de qualidade significativamente inferior. A qualidade da read diminui à medida que o comprimento aumenta. Essa tendência de qualidade não muda com a duração da corrida de sequenciamento.

Os valores de cada corrida, as bases geradas por cada flow cell e suas qualidades podem ser encontradas no SITE DA ILLUMINA, no qual resume muito bem as dúvidas. Mas, para o sequenciador NovaSeq 6000 System, gostaria de trazer:

Total de reads que passam no filtro por flow cell

Flow Cell Type SP S1 S2 S4
Single-end Reads 650–800 M 1.3–1.6 B 3.3 B–4.1 B 8-10 B
Paired-end Reads 1.3–1.6 B 2.6–3.2 B 6.6–8.2 B 16–20 B

Tamanho do output por cada flow cell dado o tamanho do read

Flow Cell Type SP S1 S2 S4
1 × 35 bp N/A N/A N/A 280-350 Gb
2 × 50 bp 65–80 Gb 134–167 Gb 333–417 Gb N/A
2 × 100 bp 134–167 Gb 266–333 Gb 667–833 Gb 1600–2000 Gb
2 × 150 bp 200–250 Gb 400–500 Gb 1000–1250 Gb 2400–3000 Gb
2 x 250 bp 325-400 Gb N/A N/A N/A

Vídeo explicativo AQUI

2. PacBio

Os dados brutos do PacBio são longos (~ 13.000-20.000 bp) com comprimentos máximos de reads em torno de 300.000 bp.

Os tipos são:

  • HiFi = reads de alta fidelidade têm tamanhos de inserção de biblioteca mais curtos e os movies são normalmente mais longos, resultando em mais passes.

  • CLR = reads longas contínuas, lidas uma vez, mas capaz de ler reads muito mais longas.

System Gb Millions of Reads Tech
Sequel II ~100 ~400 HiFi
Sequel II ~50 ~40 CLR
Sequel I ~15 ~0.5 HiFi

Vídeo explicativo AQUI.

Preparação e sequenciamento AQUI.

Estimativa de saída AQUI.

Preparação de DNA AQUI.

3. Nanopore

Os dados brutos de Nanopore são longos (10.000 - 30.000 bp) com a read confirmada mais longa de 2,3 milhões de bases. Nanopore é a tecnologia de evolução mais rápida das três tecnologias de sequenciamento e, portanto, esses dados estão continuamente se tornando desatualizados. Em dezembro de 2020, foi anunciado um grande salto na qualidade da base calling com média acima do Q20 (99,13%) usando o base calleer Bonito.

Saída das corridas com Nanopore

System Gb Millions of Reads
Minion ~40 ~2.5
Promethion ~180 11.5

Acesse o ARTIGO CIENTÍFICO AQUI.

Comparação dos produtos ACESSE AQUI.

Vídeo explicativo ACESSE AQUI.

Referências

Jain, M., Olsen, H. E., Paten, B., & Akeson, M. (2016). The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community. Genome biology, 17(1), 1-11.

https://www.illumina.com/systems/sequencing-platforms/novaseq/specifications.html

https://bioinformaticsworkbook.org/'/sequencingTechnology.html#gsc.tab=0