Ácido nucleicos

Essas biomoléculas complexas são encontradas em todas as células dos organismos vivos, sejam eles eucariontes ou procariotos, e são responsáveis pela codificação das instruções necessárias para a síntese de proteínas e a manutenção da estrutura e função celular. Existem dois principais tipos de ácidos nucleicos: o ácido desoxirribonucleico (DNA) e o ácido ribonucleico (RNA). O DNA é encontrado principalmente no núcleo das células e contém as informações genéticas que determinam as características hereditárias de um organismo. Já o RNA está presente tanto no núcleo quanto no citoplasma celular e desempenha diversos papéis na síntese de proteínas e na regulação dos processos celulares. Tanto o DNA quanto o RNA são compostos por unidades básicas chamadas nucleotídeos. Cada nucleotídeo é composto por três componentes principais: um açúcar (desoxirribose no DNA e ribose no RNA), um grupo fosfato e uma base nitrogenada. As bases nitrogenadas são de quatro tipos diferentes: adenina (A), timina (T) (ou uracila (U) no RNA), citosina (C) e guanina (G). A sequência dessas bases nos ácidos nucleicos é o que determina a informação genética. A estrutura do DNA é uma dupla hélice, na qual duas cadeias de nucleotídeos estão entrelaçadas. As bases nitrogenadas se ligam por meio de pontes de hidrogênio específicas: adenina (A) se liga com timina (T) (ou uracila (U) no RNA) e citosina (C) se liga com guanina (G). Essa complementaridade das bases permite que o DNA seja replicado de maneira precisa durante a divisão celular e que a informação genética seja transmitida de uma geração para outra. O RNA, por sua vez, possui uma única cadeia de nucleotídeos, mas também apresenta uma estrutura tridimensional complexa. Existem vários tipos de RNA com funções específicas, incluindo o RNA mensageiro (mRNA), o RNA transportador (tRNA) e o RNA ribossômico (rRNA), entre outros. Essas diferentes formas de RNA desempenham papéis cruciais na tradução da informação genética do DNA em proteínas funcionais.

Estrutura do ácido nucleico

O "ácido nucleico" indica que as moléculas de DNA e RNA (ácido ribonucleico) são substâncias ácidas e foram originalmente identificadas no núcleo das células. Atualmente, sabemos que o DNA é encontrado no núcleo, formando os cromossomos e parte dos nucléolos, além de ocorrer em pequena quantidade nas mitocôndrias e cloroplastos. O RNA é encontrado no nucléolo, nos ribossomos, no citosol, nas mitocôndrias e nos cloroplastos.

Tanto o DNA quanto o RNA são formados pela ligação de um grande número de moléculas menores chamadas nucleotídeos. Cada nucleotídeo é composto por três componentes: 

Existem cinco bases nitrogenadas principais: adenina, guanina, citosina, timina e uracila. As duas primeiras possuem um duplo anel de carbono e derivam de uma substância chamada purina, sendo denominadas bases purínicas. As outras três derivam de um composto com apenas um anel de carbono, chamado pirimidina, e são denominadas bases pirimidínicas. No DNA, as bases encontradas são adenina, guanina, citosina e timina. A uracila é exclusiva do RNA, enquanto a timina é exclusiva do DNA.

As pentoses encontradas nos ácidos nucleicos são de dois tipos: ribose e desoxirribose. O DNA recebe esse nome porque possui apenas desoxirribose em sua cadeia, enquanto o RNA contém apenas ribose. Nos ácidos nucleicos, os nucleotídeos estão sempre ligados uns aos outros, formando longos filamentos chamados polinucleotídeos. A ligação ocorre entre o fosfato de uma unidade e a pentose da unidade vizinha. Dessa forma, a longa cadeia apresenta uma sequência alternada de pentoses e fosfatos, com as bases nitrogenadas ligadas às pentoses. A diferença entre duas moléculas distintas de ácidos nucleicos reside na sequência em que as bases nitrogenadas estão dispostas.

O DNA

Em 1952, na Inglaterra, os pesquisadores Maurice Wilkins (1916-2004) e Rosalind Franklin (1920-1958) realizaram estudos sobre o DNA utilizando a técnica de difração de raios X. Com base nessas observações, Francis Crick (1916-2004) e James Watson (1928-) desenvolveram um modelo para a molécula de DNA que explicava a imagem obtida pelos raios X e os dados químicos descobertos em 1952 por Erwin Chargaff (1905-2002) e sua equipe da Universidade de Colúmbia, que revelavam que a quantidade de adenina era igual à de timina, e a de citosina era igual à de guanina. O modelo proposto por Watson e Crick ficou conhecido como o modelo da dupla hélice.

De acordo com esse modelo, a molécula de DNA é composta por duas cadeias ou fitas de polinucleotídeos que se entrelaçam formando uma dupla hélice. As duas fitas estão torcidas e se ligam por meio das bases nitrogenadas. Cada fita é constituída por uma sequência alternada de pentoses e fosfatos, e os pares de bases se assemelham aos degraus de uma escada torcida. As bases das duas fitas estão ligadas por ligações de hidrogênio, sendo que a timina sempre se liga à adenina por duas ligações de hidrogênio, e a citosina sempre se liga à guanina por três ligações de hidrogênio.

Essa complementaridade específica das bases nas fitas opostas significa que a sequência de bases em uma fita determina a sequência de bases na outra. Por exemplo, se em uma fita temos a sequência AATCCATGT, na fita complementar teremos a sequência TTAGGTACA. Assim, as duas fitas são complementares, mas não idênticas. Por suas contribuições, Watson, Crick e Wilkins foram agraciados com o Prêmio Nobel de Fisiologia ou Medicina em 1962. Vale ressaltar que Rosalind Franklin faleceu em 1958, antes da concessão do prêmio.

De forma simplificada, podemos dizer que a diferença entre dois genes está no número e na sequência de bases de cada um. Essa sequência pode ser comparada a uma frase codificada escrita com quatro letras, representando as quatro bases do DNA: A, T, C, G. Essa sequência de bases codifica a informação genética responsável pela produção de moléculas de RNA. Ao alterar o número e a sequência de bases, modificamos a "frase" genética.

O conjunto de genes presentes em uma célula, que influencia o desenvolvimento das características de um organismo, é chamado de genoma, e essa sequência varia entre os diferentes organismos. No caso humano, o genoma consiste na sequência de nucleotídeos do DNA encontrado em 22 pares de cromossomos autossômicos e nos dois cromossomos sexuais (X e Y). O conjunto de proteínas expressas pelo genoma é chamado de proteoma, representando todas as proteínas produzidas pelo organismo em questão.

Duplicação do DNA

A duplicação do DNA é um processo altamente regulado que envolve várias enzimas responsáveis por separar as duas fitas da molécula original, sintetizar novos nucleotídeos complementares e corrigir erros de replicação por meio de um mecanismo de verificação de erros. Esse mecanismo substitui nucleotídeos "errados" por nucleotídeos "certos", ou seja, seus complementares. Apesar desse processo de correção, alguns erros podem ocorrer, mas graças a esse mecanismo de verificação, a taxa de erro é extremamente baixa, com menos de um erro a cada bilhão de nucleotídeos copiados. Em bactérias, isso representa aproximadamente um erro a cada 250 células que se reproduzem.

Antes da duplicação, enzimas desenrolam as duas hélices do DNA e quebram as ligações de hidrogênio entre as bases nitrogenadas. Em seguida, proteínas específicas mantêm as duas cadeias separadas.

Em cada uma das fitas expostas, os novos nucleotídeos dissolvidos no nucleoplasma começam a se alinhar, obedecendo ao emparelhamento A-T e C-G. A união dos novos nucleotídeos é mediada pelas enzimas DNA polimerases, que também verificam se o nucleotídeo correto se encaixou na base apropriada, removendo quaisquer pareamentos incorretos. Cada fita guia a formação de uma nova fita complementar. Dessa forma, a fita recém-sintetizada torna-se idêntica à fita antiga que ocupava aquela posição, resultando em duas moléculas de DNA filhas que são exatamente iguais à molécula original.

Como cada molécula-filha de DNA é composta por uma fita antiga, derivada do DNA original, e uma fita nova, a duplicação é considerada semiconservativa. Esse termo indica que metade da molécula filha é composta por material genético original e a outra metade é recém-sintetizada.

Sintese de proteínas

As características morfológicas e fisiológicas de um organismo dependem dos tipos de proteínas presentes em seu corpo. A síntese dessas proteínas ocorre por meio da interação entre o DNA, o RNA, enzimas, ribossomos e outras estruturas celulares.

Embora todas as células de um indivíduo tenham a mesma coleção de genes, elas podem ser diferentes entre si porque, em determinados momentos, alguns genes estão ativos, comandando a síntese de proteínas, enquanto outros estão inativos. Além disso, os genes ativos podem variar em diferentes tecidos do organismo.

Como resultado, diferentes células produzem diferentes conjuntos de proteínas, o que contribui para as diferenças morfológicas e fisiológicas entre elas. Por exemplo, os melanócitos são responsáveis pela produção de melanina, o pigmento que confere cor à pele, enquanto certas células do pâncreas produzem o hormônio insulina. Essas diferenças na síntese de proteínas são essenciais para a especialização e funcionamento adequado de cada tipo de célula.

É importante ressaltar que nem todas as proteínas são sintetizadas continuamente pelas células. A síntese de proteínas é regulada de acordo com as necessidades celulares e os sinais do ambiente. Em resposta a estímulos específicos, certos genes são ativados, iniciando o processo de transcrição do DNA para a formação do RNA mensageiro (mRNA). Esse mRNA é então transportado para os ribossomos, onde ocorre a tradução da informação genética em sequências de aminoácidos, que são a base para a formação das proteínas. A síntese de proteínas é um processo complexo e essencial para a manutenção e funcionamento adequado das células.


O RNA

Ao contrário da molécula de DNA, a molécula de RNA é composta por um único filamento de polinucleotídeos. Nela, a pentose é sempre a ribose, e as bases presentes são adenina, guanina, citosina e uracila, enquanto a timina não está presente no RNA.

O processo de fabricação do RNA ocorre no núcleo celular, onde um determinado segmento da molécula de DNA serve como modelo. Em seguida, o RNA migra para o citoplasma, onde desempenha suas funções na síntese de proteínas. Existem três principais tipos de RNA:

O controle da síntese de proteínas ocorre em duas etapas: transcrição e tradução. Na etapa de transcrição, o DNA serve como molde para a síntese do RNAm, ocorrendo a transferência do código genético do DNA para o RNA. A tradução, por sua vez, envolve a organização dos aminoácidos presentes no citoplasma com base nas instruções do RNAm, resultando na formação de um polipeptídio. Esse polipeptídio pode se juntar a outros polipeptídios para formar uma proteína funcional. A síntese de proteínas é um processo fundamental para a função e estrutura das células.

Síntese do RNAm

Na transcrição, apenas uma das fitas do trecho específico do DNA é utilizada para a síntese do RNAm. Nesse processo, atuam as enzimas RNA polimerases, também conhecidas como polimerases do RNA, que se ligam a uma sequência específica do DNA chamada promotor. O promotor marca o início da transcrição e direciona as enzimas para a cadeia correta a ser lida. As enzimas desenrolam a dupla hélice do DNA, expondo as bases, e começam a inserir os ribonucleotídeos correspondentes.

Durante a transcrição, ocorre o pareamento obrigatório entre as bases nitrogenadas. No entanto, onde há uma adenina no DNA, será inserida uma uracila no RNA. Por exemplo, para a sequência TACGGACTA no DNA, será formada a sequência AUGCCUGAU no RNA. A transcrição é finalizada em uma sequência específica de bases do DNA.

Processamento do RNA

Nos eucariontes, o RNAm transcrito a partir de um segmento de DNA não está em sua forma final e requer várias modificações, conhecidas como processamento do RNA, para se tornar funcional. O pré-RNA contém trechos não funcionais chamados de íntrons, que são sequências de bases que não codificam proteínas.

No processo de splicing, os íntrons são "cortados" e removidos antes do RNA seguir para o citoplasma, resultando em um RNAm funcional. Por outro lado, os trechos funcionais são chamados de éxons, que são regiões codificadoras de proteínas.

O corte dos íntrons e a união dos éxons podem ocorrer de maneiras diferentes em casos específicos, o que é conhecido como processamento alternativo do RNA ou splicing alternativo. Isso significa que um único gene pode produzir diferentes tipos de RNAm e, consequentemente, mais de uma proteína diferente. Essa capacidade contribui para a diversidade proteica em nosso organismo, permitindo que, mesmo com um número relativamente pequeno de genes (estimado em cerca de 20.500, sujeito a alterações com base em novos estudos), sejam produzidas mais de 90.000 proteínas diferentes.

Ainda é objeto de discussão o papel dos íntrons e de outros trechos de DNA não codificante na célula. Alguns parecem ter a função de controlar a atividade dos genes.

A ideia simplificada de que os genes correspondem a trechos de DNA que codificam polipeptídeos não reflete a complexidade real do processo. Muitos segmentos de DNA são íntrons, enquanto outros transcrevem RNAr ou RNAt em vez de proteínas. Além disso, existem outros tipos de DNA não codificante. Além da sequência de bases em um determinado segmento de DNA, a síntese de uma proteína específica também depende da interação entre vários genes e moléculas do ambiente, tanto internas quanto externas ao organismo. Portanto, é extremamente difícil definir com precisão o conceito de gene.

Produzindo preoteínas a partir do DNA

Na tradução, a informação contida na sequência de bases do RNA mensageiro é convertida em uma sequência de aminoácidos. Cada grupo de três bases consecutivas no RNAm é chamado de códon e corresponde a um aminoácido específico. Essa correspondência entre códons e aminoácidos é conhecida como código genético. Dessa forma, o código genético contido no DNA é expresso na forma de polipeptídios ou proteínas que desempenham funções específicas.

É importante observar que os códons UAG, UAA e UGA não especificam nenhum aminoácido, mas indicam o fim de uma cadeia polipeptídica. Por outro lado, o códon AUG possui uma função especial, pois além de codificar o aminoácido metionina, também determina o início da síntese de um novo polipeptídio.

Ao analisar a tabela de códons, percebemos que o código genético é degenerado ou redundante, ou seja, existem múltiplos códons com o mesmo significado. Por exemplo, a alanina pode ser codificada por qualquer um dos seguintes códons: GCU, GCC, GCA e GCG. Portanto, existem 61 códons que especificam vinte aminoácidos diferentes, além de três códons que indicam o término de uma cadeia polipeptídica. Apesar da redundância, o código genético não é ambíguo, o que significa que um mesmo códon não codifica dois aminoácidos diferentes.

O código genético é praticamente universal para a maioria dos seres vivos, o que indica uma origem evolutiva comum. Existem apenas algumas poucas exceções encontradas no código genético de mitocôndrias, bactérias e protistas específicos. No entanto, essas diferenças são observadas em apenas alguns códons.

Os códons desempenham seu papel na identificação dos aminoácidos com a ajuda do RNAt, que é capaz de se ligar a unidades de aminoácidos dissolvidos no citoplasma e transportá-los até o RNAm. O RNAt é uma molécula dobrada no espaço, composta por um filamento com aproximadamente 74 a 95 nucleotídeos. Ele apresenta regiões com bases emparelhadas e outras com bases livres, onde ocorrem curvas. Em uma das extremidades do RNAt, encontramos as bases CCA. Em uma das curvas do filamento, há um trio de bases chamado anticódon, que varia de um transportador para outro. Por meio do anticódon, o RNAt se encaixa nos códons do RNAm. A ligação entre o transportador e o aminoácido é específica e mediada por uma enzima com formato adequado, garantindo exclusividade na ligação. Por exemplo, se o RNAt possui o anticódon CGA, ele se ligará exclusivamente ao aminoácido alanina.

A tradução da sequência de bases do RNAm para a proteína ocorre nos ribossomos. Os RNAt com seus respectivos aminoácidos se encaixam nos códons correspondentes do RNAm. À medida que um grupo de ribossomos desliza pelo RNAm, os aminoácidos se ligam e formam uma molécula de proteína ou uma cadeia polipeptídica. Enquanto isso, os transportadores se desprendem e ficam livres para o transporte de outros aminoácidos. O processo de síntese da proteína termina quando um dos três códons de parada (UAA, UAG ou UGA) se posiciona no ribossomo. Ao invés de se ligar a um anticódon, esse códons se encaixa em uma proteína especial que libera o filamento polipeptídico.

A tradução envolve mecanismos para ativar aminoácidos, indicar os pontos de início e término da síntese e remover a metionina (que indica o início da síntese) caso não faça parte da proteína a ser formada. Esses mecanismos são controlados por enzimas e pelo RNAr, que também possui atividade enzimática. Moléculas de RNA com atividade enzimática são chamadas de ribozimas.