Tecnologia de Sequenciamento: Illumina, Pacbio e Nanopore - lmigueel/Bioinformatica GitHub Wiki
1. Sobre
Existem agora três tecnologias principais de sequenciamento disponíveis e comumente usadas: Illumina, PacBio e Oxford Nanopore. Compreender os pressupostos e limitações de cada uma dessas tecnologias pode auxiliar no planejamento do projeto experimental.
2. Illumina
Os dados brutos da Illumina são reads entre 100 e 300 bps de tamanho e possuem alta qualidade para reads menores que 200 bp. Valores de qualidade para bases em reads entre 250-300 bp geralmente são de qualidade significativamente inferior. A qualidade da read diminui à medida que o comprimento aumenta. Essa tendência de qualidade não muda com a duração da corrida de sequenciamento.
Os valores de cada corrida, as bases geradas por cada flow cell e suas qualidades podem ser encontradas no SITE DA ILLUMINA, no qual resume muito bem as dúvidas. Mas, para o sequenciador NovaSeq 6000 System, gostaria de trazer:
Total de reads que passam no filtro por flow cell
Flow Cell Type | SP | S1 | S2 | S4 |
---|---|---|---|---|
Single-end Reads | 650–800 M | 1.3–1.6 B | 3.3 B–4.1 B | 8-10 B |
Paired-end Reads | 1.3–1.6 B | 2.6–3.2 B | 6.6–8.2 B | 16–20 B |
Tamanho do output por cada flow cell dado o tamanho do read
Flow Cell Type | SP | S1 | S2 | S4 |
---|---|---|---|---|
1 × 35 bp | N/A | N/A | N/A | 280-350 Gb |
2 × 50 bp | 65–80 Gb | 134–167 Gb | 333–417 Gb | N/A |
2 × 100 bp | 134–167 Gb | 266–333 Gb | 667–833 Gb | 1600–2000 Gb |
2 × 150 bp | 200–250 Gb | 400–500 Gb | 1000–1250 Gb | 2400–3000 Gb |
2 x 250 bp | 325-400 Gb | N/A | N/A | N/A |
Vídeo explicativo AQUI
2. PacBio
Os dados brutos do PacBio são longos (~ 13.000-20.000 bp) com comprimentos máximos de reads em torno de 300.000 bp.
Os tipos são:
-
HiFi = reads de alta fidelidade têm tamanhos de inserção de biblioteca mais curtos e os movies são normalmente mais longos, resultando em mais passes.
-
CLR = reads longas contínuas, lidas uma vez, mas capaz de ler reads muito mais longas.
System | Gb | Millions of Reads | Tech |
---|---|---|---|
Sequel II | ~100 | ~400 | HiFi |
Sequel II | ~50 | ~40 | CLR |
Sequel I | ~15 | ~0.5 | HiFi |
Vídeo explicativo AQUI.
Preparação e sequenciamento AQUI.
Estimativa de saída AQUI.
Preparação de DNA AQUI.
3. Nanopore
Os dados brutos de Nanopore são longos (10.000 - 30.000 bp) com a read confirmada mais longa de 2,3 milhões de bases. Nanopore é a tecnologia de evolução mais rápida das três tecnologias de sequenciamento e, portanto, esses dados estão continuamente se tornando desatualizados. Em dezembro de 2020, foi anunciado um grande salto na qualidade da base calling com média acima do Q20 (99,13%) usando o base calleer Bonito.
Saída das corridas com Nanopore
System | Gb | Millions of Reads |
---|---|---|
Minion | ~40 | ~2.5 |
Promethion | ~180 | 11.5 |
Acesse o ARTIGO CIENTÍFICO AQUI.
Comparação dos produtos ACESSE AQUI.
Vídeo explicativo ACESSE AQUI.
Referências
Jain, M., Olsen, H. E., Paten, B., & Akeson, M. (2016). The Oxford Nanopore MinION: delivery of nanopore sequencing to the genomics community. Genome biology, 17(1), 1-11.
https://www.illumina.com/systems/sequencing-platforms/novaseq/specifications.html
https://bioinformaticsworkbook.org/'/sequencingTechnology.html#gsc.tab=0