A história do sequenciamento de DNA: como deciframos a linguagem da vida

Graças à revolucionária tecnologia de sequenciamento do nosso genoma, uma série de doenças passou a ser diagnosticada, tratada e, principalmente, prevenida

Pete Linforth/Pixabay
(foto: Pete Linforth/Pixabay)

Em 2001 foi publicada a primeira versão do genoma humano e, finalmente, pudemos então ler o DNA presente em humanos. O projeto é considerado por muitos como o de maior proporção na área biológica, tendo por volta de 30 anos de duração, financiamento de mais três bilhões de dólares e envolvendo pesquisadores do mundo inteiro. Nesse ano de 2021, pesquisadores da Universidade de Califórnia, Universidade de Washington e do Instituto Nacional de Pesquisa do Genoma Humano dos Estados Unidos finalmente afirmaram que, após mais de 30 anos de pesquisas, o DNA humano foi 100% sequenciado. Mas, como tudo começou?

Nossa história começa com um físico teórico chamado Walter Gilbert. Gilbert fez seu PhD na Universidade de Cambridge no final dos anos 1950, onde conheceu James Watson, de Watson e Crick, que ajudou a resolver a dupla estrutura helicoidal do DNA.

Depois de completar seu PhD, Gilbert mudou-se para a Universidade de Harvard em 1956, onde logo se tornou professor associado de física. Watson também se mudou para Harvard na mesma época, e os dois permaneceram amigos. Freqüentemente, falavam sobre os empolgantes desenvolvimentos da biologia molecular.

Depois de decidir que a física estava passando por um momento de tédio, Gilbert começou a se juntar aos experimentos no laboratório de biologia. Apesar de sua educação em física teórica, Gilbert não tinha medo de retornar ao básico em seu novo campo da biologia e muitas vezes incomodava os alunos no laboratório com suas perguntas. Ele logo descobriu que tinha um talento especial para biologia experimental, e não demorou muito para que ele e Watson estivessem administrando o grupo de biologia molecular juntos.

O trabalho de Gilbert logo o levou a um problema. Ele estava trabalhando em proteínas reguladoras que controlam como os genes são ligados e desligados nas células, ligando-se a sequências específicas de DNA próximas aos genes, e precisava descobrir a sequência de DNA à qual uma proteína específica chamada "repressor lac" se ligava.

Sem técnicas eficientes de sequenciamento de DNA disponíveis na época, ele confiou em métodos laboratoriais meticulosamente lentos e trabalhosos para resolvê-lo. Gilbert e seus colegas demoraram dois anos para decifrar a sequência de 24 bases, que publicaram em 1973. Sabendo que os genes tinham milhares ou dezenas de milhares de bases, Gilbert sabia que, se algum dia quisessem ter a esperança de compreender até mesmo o gene mais simples, precisariam de uma maneira mais rápida de ler o DNA.

Em fevereiro de 1977, Gilbert e seu aluno Allan Maxam publicaram um novo método de sequenciamento de DNA empolgante. A técnica deles, que rapidamente se tornou conhecida como Maxam-Gilbert ou método químico, envolvia marcar as extremidades do DNA que você deseja sequenciar com fósforo radioativo e então dividi-lo em quatro tubos separados. Cada tubo é então tratado com uma substância química diferente que quebra o DNA em uma base específica em uma pequena proporção das fitas de DNA, gerando um monte de fragmentos de comprimentos diferentes, cada um terminando em uma das quatro letras do DNA, A, C, T ou G dependendo do produto químico e exatamente onde foram cortados.

Esses fragmentos são então separados por tamanho, executando as quatro reações lado a lado através de uma placa de gel de poliacrilamida e visualizados por meio de raios-X para decifrar a sequência de DNA original. Então, por exemplo, o fragmento mais longo pode terminar em um T, o próximo mais longo em um C, o próximo em um A, o próximo em um C e assim por diante.

A nova técnica reduziu o tempo necessário para ler o DNA de uma base por mês para sequenciar centenas de bases em uma tarde. Mas, ao mesmo tempo que Maxam e Gilbert trabalhavam em seu método, outros cientistas também apresentavam suas próprias soluções para o problema do sequenciamento rápido de DNA.

Em 1975, os bioquímicos britânicos Fred Sanger e Alan Coulson publicaram um artigo descrevendo o que eles chamaram de método "mais e menos" de sequenciamento de DNA. Isso envolve basicamente oito reações separadas usando DNA polimerase e várias combinações de bases marcadas para gerar fragmentos de DNA de diferentes comprimentos que revelaram a sequência subjacente de forma semelhante ao método de Maxam e Gilbert.

Sanger e seus colegas conseguiram usá-lo para ler o primeiro genoma de DNA, todas as cinco mil ou mais bases do bacteriófago PhiX. Embora tenha funcionado, esse método era complicado e de difícil compreensão. Por isso Sanger e Coulson se juntaram a outro bioquímico, Steve Nicklen, para desenvolver uma técnica mais simples e rápida - o método de terminação de cadeia, que ficou conhecido como sequenciamento de Sanger.

Semelhante ao método mais e menos, esta técnica usa DNA polimerase para fazer novo DNA a partir de um modelo (que é o trecho de DNA que se deseja ler), configurado em quatro reações separadas, cada uma com uma base diferente marcada radioativamente mais uma mistura de todas as quatro bases não foram etiquetadas.

É importante ressaltar que essas bases marcadas radioativamente foram modificadas de uma forma que significa que não podem ter mais bases adicionadas depois delas. Assim, à medida que o modelo de DNA é copiado, esses nucleotídeos modificados de uma letra específica são incorporados em posições aleatórias, terminando as fitas e resultando em fragmentos de comprimentos diferentes com uma letra final conhecida. As quatro reações são então executadas lado a lado através de um gel, separando os fragmentos por tamanho como antes, permitindo o trabalho da sequência original dos fragmentos, de seu comprimento e da letra final.

Fred Sanger e Walter Gilbert ganharam uma parte do Prêmio Nobel de 1980 por seu trabalho em sequenciamento de DNA, e seus dois métodos foram rapidamente adotados por laboratórios em todo o mundo. Em um paralelo claro com a guerra travada naquela época no mundo dos eletrônicos de consumo entre o Betamax e o vídeo VHS, os dois métodos lutaram pelo domínio no início dos anos 1980.

Embora o sequenciamento Maxam-Gilbert fosse inicialmente mais popular, no final, o sequenciamento Sanger venceu graças à sua simplicidade e melhorias contínuas que o tornaram cada vez mais rápido, barato e seguro do que o sequenciamento Maxam-Gilbert, que acabou sendo esquecido.

Infelizmente, para Gilbert, esta não é a única vez que ele foi lançado para o cargo em uma corrida de biotecnologia. Alguns anos antes, ele também perdeu a batalha para se tornar o primeiro a produzir insulina sintética, um título que foi para Herbert Boyer e os cientistas da Genentech.

Ainda que considerado revolucionário, o sequenciamento de Sanger também era extremamente lento nos primeiros dias, produzindo cerca de 100 letras de DNA por vez. Ao longo da década de 1980, os pesquisadores descobriram como usar corantes fluorescentes em vez de radioatividade para rotular as letras finais e descobriram maneiras mais eficientes de separar os fragmentos de DNA de diferentes comprimentos.

Embora esses avanços tenham acelerado enormemente o processo e possibilitado a leitura de sequências de centenas de letras em uma fração do tempo, os genomas dos organismos mais simples podem ter milhares de letras.

Para se ler seções mais longas de DNA e decifrar genomas inteiros, os cientistas desenvolveram então uma técnica chamada sequenciamento shotgun, que envolve cortar o DNA em comprimentos sobrepostos aleatórios, sequenciar as seções e, em seguida, remontar o código combinando as sobreposições para voltar a toda a sequência original, um pouco como um quebra-cabeça muito complicado. O método foi usado pela primeira vez em 1981 para sequenciar todo o genoma de um vírus do mosaico da couve-flor, que continha cerca de 8 mil pares de bases.

O aumento da automação tornou a decodificação de genomas inteiros mais rápida e fácil. O primeiro organismo a ter todo o seu genoma lido foi a bactéria Haemophilus influenzae, publicada em 1995 e registrando apenas 1,8 milhão de letras. A essa altura, as rodas já estavam em movimento, sequenciando o genoma humano - ou o máximo possível das 3 bilhões de letras com a tecnologia da época.

Em 2001, após uma década de trabalho e bilhões de dólares, um rascunho do genoma humano foi montado. O primeiro-ministro do Reino Unido, Tony Blair, e o presidente dos Estados Unidos, Bill Clinton, se uniram por satélite para fazer o anúncio, durante o qual Clinton fez a afirmação um tanto anticientífica de que "hoje, estamos aprendendo a linguagem em que Deus criou a vida". E a era da genômica então nasceu. Graças a essa nova e revolucionária tecnologia de sequenciamento do nosso genoma, uma série de doenças passou a ser diagnosticada, tratada e, principalmente, prevenida como, por exemplo, o câncer. E esse será o assunto de nossas futuras colunas.