Baixe o app para aproveitar ainda mais
Prévia do material em texto
GENÉTICA Carolina Saibro Girardi Bases moleculares da hereditariedade: genoma, DNA e genes Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: Identificar as funções das bases moleculares da hereditariedade. Diferenciar os componentes das bases moleculares da hereditariedade estudadas. Descrever as estruturas que compõem o DNA. Introdução A vida depende da capacidade dos organismos em armazenar, reparar e copiar as informações genéticas que serão transmitidas para a próxima geração de forma hereditária — tanto em relação à geração de novas células quanto de indivíduos da prole. Assim, a hereditariedade depende de mecanismos que permitam o armazenamento e a manutenção da informação genética. A molécula responsável por essa importante função nos seres vivos é o ácido desoxirribonucleico (DNA). A ideia de que o DNA poderia ser a principal molécula genética surgiu por acaso, ao final da década de 1920, quando pesquisadores estudavam a transmissão de características de virulência entre bactérias. A caracterização da estrutura dessa molécula e a compreensão de como sua sequência orienta a transcrição dos genes foram conquistas posteriores. Hoje, vivemos a era da genômica, em que o desafio é extrair informações funcionais do grande volume de dados de sequências de DNA obtidas pelos métodos de sequenciamento. Neste capítulo, você entenderá as características da molécula de DNA, de suas sequências gênicas e do genoma como um todo. 1 Armazenamento de informação genética nas células O ácido desoxirribonucleico (DNA) é uma macromolécula que armazena toda a informação genética dentro de cada célula. Sua função, essencialmente, é manter essa informação preservada e replicá-la para que ela possa ser expressa durante a vida do indivíduo e transmitida para as próximas gerações. A estru- tura química e molecular do DNA garante estabilidade à molécula que, além da função autorreplicadora, tem a tarefa de orientar a síntese de proteínas a partir de sua informação genética (BORGES-OSÓRIO; ROBINSON, 2013). Nos eucariotos, o conteúdo de DNA celular encontra-se em duas regiões: no núcleo e nas mitocôndrias. O DNA mitocondrial está, principalmente, relacionado à transcrição de fatores importantes para a função dessa organela. O DNA nuclear, por sua vez, corresponde à maior parte da informação genética celular e define a maior parte das características do organismo (BORGES-OSÓRIO; ROBINSON, 2013). Por esse motivo, neste capítulo, serão abordados os aspectos referentes ao material genético nuclear. Os genes e genomas de organismos eucarióticos e proca- rióticos têm algumas características distintas. Aqui, serão abordadas, especialmente, aquelas referentes ao material genético dos eucariotos, que é o caso do ser humano. DNA em forma de cromatina nos cromossomos de eucariotos Cada molécula de DNA origina uma estrutura que conhecemos como cromos- somo. Para se ter uma dimensão do tamanho da molécula de DNA, vejamos esse exemplo: uma célula eucariótica tem, em média, 50 μm, e o menor cromossomo humano possui, aproximadamente, 14.000 μm quando descompactado e estendido (ALBERTS et al., 2017). Assim, as moléculas de DNA das células eucarióticas não encontram-se livres, elas precisam ser muito compactadas para que seja possível a sua compartimentalização no núcleo celular (ALBERTS et al., 2017). Essa compartimentalização é possível em função da interação da molécula de DNA com proteínas nucleares que a enovelam e a organizam. A estrutura formada pelo conjunto da molécula de DNA com essas proteínas é chamada de cromatina. Proteínas denominadas histonas interagem com o DNA para formar os nucleossomos, que são a estrutura base da cromatina (Figura 1). Esses nucleossomos ainda se dobram sobre si pela interação com outras proteínas, adquirindo maiores níveis de compactação. Assim, os cromossomos eucarióticos são, em verdade, uma molécula de DNA interagindo com diversas proteínas. Essa compactação é dinâmica, podendo ser intensificada ou afrouxada de acordo Bases moleculares da hereditariedade: genoma, DNA e genes2 com o contexto celular. Durante a divisão celular, por exemplo, os cromossomos atingem o máximo da compactação para facilitar a reorganização do material genético nas células-filhas. Por outro lado, essas interações podem ser afrouxadas em regiões específicas do DNA durante a sua transcrição ou replicação, por exemplo (ZAHA; FERREIRA; PASSAGLIA, 2014). Figura 1. A molécula de DNA em diferentes níveis moleculares. (a) A molécula de DNA, em regiões tanto codificadoras de proteínas quanto não codificadoras, interage com proteínas histonas para formar nucleossomos. Esses nucleossomos interagem ainda com outras pro- teínas, possibilitando diferentes níveis de enovelamento e compactação do DNA. O DNA em conjunto com as proteínas histonas e outras proteínas diversas configura a cromatina. Cada molécula completa de DNA no contexto da cromatina origina a estrutura do cromossomo (na figura, um cromossomo mitótico em sua forma mais enovelada). (b) O conjunto de cro- mossomos humanos contendo toda a informação genética nuclear. Os cromossomos de um indivíduo do sexo feminino foram isolados de uma célula mitótica e identificados. Os pares de cromossomos materno e paterno foram então arranjados artificialmente, possibilitando a visualização do cariótipo. Fonte: Adaptada de Alberts et al. (2017). Relação das sequências de DNA e suas funções A informação genética encontra-se codifi cada em forma de sequências de bases nitrogenadas ao longo da molécula de DNA. A maior parte da informação genética está contida nos genes, considerados as unidades genéticas funda- mentais dos seres vivos. Sua função é armazenar e codifi car as sequências de DNA funcionais utilizadas na produção de todos os RNAs e proteínas 3Bases moleculares da hereditariedade: genoma, DNA e genes que compõem o organismo. Ao serem transmitidos de uma geração à outra, ou seja, de pais para fi lhos, os genes carregam essas informações de forma hereditária (BORGES-OSÓRIO; ROBINSON, 2013). De forma geral, cada gene codifica um produto (como uma cadeia polipep- tídica, por exemplo). Por vezes, no entanto, um mesmo gene pode dar origem a produtos distintos. Existem algumas sequências no DNA com as características de genes completos, mas que não são transcritas e não dão origem a produto algum. Essas sequências, muito semelhantes a genes, mas não funcionais, são denominadas pseudogenes (BORGES-OSÓRIO; ROBINSON, 2013). Os genes encontram-se dispostos de forma linear e, geralmente, não con- tínua no DNA. Eles são intercalados por muitos segmentos de DNA com sequências não codificadoras, denominadas regiões intergênicas. Por bastante tempo acreditou-se que essas regiões seriam algum tipo de “lixo molecular” não funcional. Hoje, são atribuídas diversas funções biológicas a essas regiões não codificadoras, principalmente, na regulação da transcrição gênica. No entanto, grande parte dessas regiões permanece sem função caracterizada, e é possível que parte do DNA intergênico, de fato, não tenha função alguma (WATSON et al., 2015). O conjunto de sequências gênicas de um organismo somado a todas essas outras sequências de DNA não codificador configura o genoma do organismo. Assim, o genoma diz respeito à sequência de todo o conteúdo de DNA de uma célula (ou do núcleo da célula, quando nos referimos ao genoma nuclear), contendo o conjunto de todas as informações genéticas transmitidas de forma hereditária (BORGES-OSÓRIO; ROBINSON, 2013). Nem sempre o DNA é o guardião da informação genética. O DNA é a macromolécula que armazena toda a informação genética na maioria dos seres vivos, com algumas exceções. Alguns tipos de vírus armazenam suas informações genéticas em forma de moléculas de ácido ribonucleico (RNA), mas cientistas ainda debatem até que ponto os vírus podem ser considerados seres vivos. De qualquer forma, o fatoé que esses vírus de RNA têm mecanismos moleculares distintos das maquinarias convencionais de DNA, com impacto significativo no diagnóstico e no tratamento das doenças relacionadas a eles. Alguns exemplos desses vírus são o vírus HIV e o coronavírus (STEPHENS et al., 2013). Bases moleculares da hereditariedade: genoma, DNA e genes4 2 Características químicas e moleculares do DNA O DNA é um ácido nucleico formado a partir da ligação em cadeia de diferentes nucleotídeos, tendo sua estrutura conservada entre todos os organismos. Trata-se de uma macromolécula que se organiza em uma estrutura tridimensional característica, com algumas propriedades importantes (ZAHA; FERREIRA; PASSAGLIA, 2014). Formação do DNA por nucleotídeos Os nucleotídeos podem ser considerados as unidades moleculares fundamentais dos ácidos nucleicos e são formados pelos elementos descritos a seguir (Figura 2). Um açúcar: caracteriza-se por uma pentose, com cinco carbonos. Na molécula de DNA, essa pentose é do tipo desoxirribose — por isso, o nome ácido desoxirribonucleico. Um grupo fosfato: é um grupo extremamente hidrofílico e fornece a carga negativa característica das moléculas de DNA. Uma base nitrogenada: o grupo apolar é o componente de maior va- riabilidade nos nucleotídeos, podendo ser caracterizado como uma purina (adenina e guanina) ou como uma pirimidina (citosina e timina). Assim, o grupo fornece as quatro possibilidades de bases do DNA, A (adenina), G (guanina), C (citosina) e T (timina) (ZAHA; FERREIRA; PASSAGLIA, 2014). A forma como as diferentes bases estão dispostas na cadeia de nucleotídeos fornece a sequência da molécula de DNA. Essa ligação entre os nucleotídeos dá-se por ligações fosfodiéster entre o grupamento fosfato do carbono 5’ (5'-PO4) do primeiro nucleotídeo e o grupamento hidroxílico do carbono 3' (3'-OH) do nucleotídeo adjacente (Figura 2). Essa característica da ligação fosfodiéster faz com que as cadeias dos ácidos nucleicos sejam direcionais. O nucleotídeo de uma extremidade da cadeia terá um carbono 5' com um grupamento fosfato livre, e o nucleotídeo da outra extremidade terá um car- bono 3' com um grupamento hidroxílico livre. Essa orientação tem consequ- ências para as reações que envolvem ácidos nucleicos: o DNA e o RNA são sintetizados no sentido 5'→3', e o RNA é lido na síntese proteica também no sentido 5'→3'. Além disso, as cadeias de nucleotídeos que formam o DNA e o RNA são sempre representadas na orientação 5'→3', por convenção (ZAHA; FERREIRA; PASSAGLIA, 2014). 5Bases moleculares da hereditariedade: genoma, DNA e genes Figura 2. Detalhe de dois nucleotídeos ligados por meio de uma ligação fosfodiéster formando parte de uma molécula de DNA. A pentose é uma desoxirribose (açúcar), e a adenina e a timina são bases nitrogenadas presentes na molécula. A cadeia é direcional, ou seja, uma extremidade tem um grupo fosfato livre ligado ao carbono 5’ da pentose (extremidade 5’-fosfato); e a outra extremidade tem um grupo hidroxila livre ligado ao carbono 3’ da pentose (extremidade 3’-hidroxila). Fonte: Adaptada de Zaha, Ferreira e Passaglia (2014). Bases moleculares da hereditariedade: genoma, DNA e genes6 Configuração da dupla-hélice pela estrutura molecular do DNA A molécula de DNA é bastante estável, tanto em função de algumas caracte- rísticas químicas como em função de sua estrutura molecular. O modelo tridi- mensional da estrutura da molécula de DNA propõe duas cadeias distintas de nucleotídeos (as fi tas) unidas entre si por ligações de hidrogênio, que se enrolam em torno do próprio eixo formando uma hélice. Por isso, a denominação de dupla-hélice de DNA (Figura 3). Essas ligações de hidrogênio entre as fi tas são fortes o sufi ciente para manter a sua estrutura, mas também podem ser desnatu- radas (rompidas) e renaturadas de acordo com as condições do meio ou devido à presença de proteínas específi cas (ZAHA; FERREIRA; PASSAGLIA, 2014). A manutenção da dupla-hélice de DNA depende da interação de uma base nitrogenada de uma cadeia com a base oposta em outra cadeia. Isso só é possível em função da propriedade de complementariedade das bases, em que ocorre o pareamento entre bases nitrogenadas específicas por meio das ligações de hidrogênio. Assim, as fitas da dupla-hélice de DNA serão sempre complementares entre si, possibilitando, na prática, que a sequência de uma fita possa ser determinada pela sequência da outra fita da molécula. A seguir, estão descritos os dois os possíveis pareamentos entre bases. Pareamento G-C: guaninas pareiam com citosinas e vice-versa, por meio de três ligações de hidrogênio. Pareamento A-T: adeninas pareiam com timinas (ou uracilas presentes em moléculas de RNA) e vice-versa, por meio de duas ligações de hidrogênio (ZAHA; FERREIRA; PASSAGLIA, 2014). Outra propriedade fundamental da dupla-hélice de DNA é que suas fitas tam- bém são antiparalelas, ou seja, com orientações inversas. Enquanto as ligações fosfodiéster de uma fita encontram-se na direção 5'→ 3', as ligações da outra fita encontram-se na direção 3'→ 5' (ZAHA; FERREIRA; PASSAGLIA, 2014). 7Bases moleculares da hereditariedade: genoma, DNA e genes Figura 3. Representações esquemáticas da dupla-hélice de DNA, ilustrando o pareamento de bases complementares no interior da molécula e a orientação antiparalela entre as fitas complementares (indicada pelas setas). (a) Dupla-hélice desenrolada, com as ligações e as interações químicas que formam a molécula de DNA. (b) Representação esquemática frequente da dupla-hélice, que evidencia o pareamento de bases no interior e o esqueleto das fitas composto pelas desoxirriboses e pelos fosfatos na face externa da molécula. (c) Representação mais realista da dupla-hélice, com o preenchimento do espaço ocupado pelos átomos da molécula. Fonte: Adaptada de Borges-Osório e Robinson (2013). 3 Sequências gênicas e intergênicas que compõem o genoma dos seres vivos Dentro da compreensão funcional das sequências de DNA, o conceito sobre o que, de fato, compõe um gene é fundamental. Sua defi nição já mudou bastante ao longo do tempo, mas pode-se dizer que o gene é um segmento de DNA contendo a sequência necessária para direcionar a síntese de um produto gênico, sendo esse produto um RNA mensageiro e sua cadeia polipeptídica correspondente, ou outros tipos de RNAs como os ribossomais e transporta- dores (ZAHA; FERREIRA; PASSAGLIA, 2014). Bases moleculares da hereditariedade: genoma, DNA e genes8 A sequência gênica incluirá, necessariamente, a sequência que codifica o produto em si, chamada de região codificadora, e as sequências regulatórias essenciais para a sua transcrição, que são o promotor e os sítios de início e de término da transcrição (Figura 4a). O promotor encontra-se a montante da região codificadora, e isso é importante para a interação com a RNA-polimerase (enzima necessária para a transcrição do gene). O sítio de início da transcrição ocorre, com frequência, associado ao promotor, e o sítio de término encontra- -se a jusante da região codificadora. Eles atuam determinando os pontos em que a síntese do produto de RNA tem início e fim. A cada fita da dupla-hélice de DNA na região gênica é atribuída uma nomenclatura distinta. Uma delas é a fita-codificadora, cuja sequência é análoga à do produto gênico de RNA sintetizado e cuja orientação é 5'→ 3'. A outra fita da dupla-hélice é a fita-molde, complementar e antiparalela à codificadora, que tem orientação 3'→ 5' e que serve de molde para o processo de transcrição. Os genes são sempre representados de acordo com a sequência da fita-codificadora, com orientação 5'→ 3' (Figura 4) (ZAHA; FERREIRA; PASSAGLIA, 2014). Além das sequências essenciais, os genes podem apresentar outras sequên- cias (Figura 4b). Em eucariotos, por exemplo, é comum a ocorrência de regiões intercalares no interior da sequência gênica. Essas regiões serão transcritas, mas removidas, posteriormente, para a formaçãode um RNA maduro, não contribuindo para o produto gênico final. Essas regiões intercalares são de- nominadas íntrons, e as demais regiões gênicas presentes no produto maduro são denominadas exons (Figura 4b). Os íntrons ocorrem, com frequência, no interior das regiões codificadoras de proteínas, mas podem também ocorrer em regiões adjacentes. Muitos genes apresentam regiões regulatórias diversas que atuam modu- lando a transcrição gênica. É comum a sua presença próximo ao promotor da transcrição (no caso de reguladores proximais) (Figura 4b), mas elas também podem ocorrer a vários pares de base a montante do promotor, ou mesmo dentro da região codificadora ou próximo ao término de transcrição. Em geral, quanto mais complexo é o organismo, maiores são as possibilidades de regulação transcricional (WATSON et al., 2015). 9Bases moleculares da hereditariedade: genoma, DNA e genes Figura 4. Representação das sequências que compõem um gene. Ilustração da fita-codifi- cadora da dupla-hélice, com orientação 5'→ 3'. (a) As regiões essenciais de uma sequência gênica em todos os organismos: o promotor e o sítio de início da transcrição a montante da região codificadora, a própria região codificadora e o sítio de término da transcrição a jusante da região codificadora. (b) Um gene eucariótico típico, incluindo íntrons intercala- dos com os éxons e a presença de regiões regulatórias adicionais. Nesse caso, os íntrons ocorrem no interior da região codificadora, e os reguladores ocorrem a alguns pares de base a montante da sequência promotora. Além dos genes, outras sequências compõem os genomas dos seres vivos. Assim, é possível caracterizar o DNA genômico em sequências gênicas (e relacio- nadas aos genes) e em sequências intergênicas (WATSON et al., 2015). A Figura 5 demonstra como essas diferentes sequências estão distribuídas no genoma humano. Sequências gênicas e relacionadas estão presentes em apenas uma cópia no genoma haploide. Elas correspondem aos genes e às sequências relacionadas, como pseudogenes (WATSON et al., 2015). Sequências intergênicas podem ser únicas ou repetitivas (WATSON et al., 2015). As sequências únicas estão presentes em apenas uma cópia no ge- noma e são associadas, geralmente, a funções regulatórias. As sequências de DNA repetitivo estão presentes em algumas ou inúmeras cópias no genoma, e são resultado de duplicações, expansões e inserções que ocorreram ao longo da evolução do genoma (BORGES-OSÓRIO; ROBINSON, 2013). Muitos estudos de análise comparativa de genomas tentam entender se a complexidade anatômica, fisiológica e/ou comportamental dos organismos pode ser explicada com base em características genômicas. Algumas vezes, chegou- -se à observação de que o tamanho do genoma estaria diretamente associado à complexidade do organismo. No entanto, essa associação mostrou-se, por Bases moleculares da hereditariedade: genoma, DNA e genes10 vezes, falha. A correlação com a densidade gênica, por outro lado, mostra-se mais eficaz (WATSON et al., 2015; ZAHA; FERREIRA; PASSAGLIA, 2014). Observa-se que organismos mais complexos têm genomas com menores densidades gênicas (medida em termos de número de genes por megabases de DNA). Portanto, quanto maior a complexidade do organismo, maior também a presença de DNA intergênico. As maiores densidades gênicas são encontradas nos vírus, que são incapazes de desenvolver metabolismo autônomo. Já em seres humanos, o DNA intergênico representa mais de 60% do genoma nuclear (BORGES-OSÓRIO; ROBINSON, 2013; WATSON et al., 2015). Figura 5. O genoma humano nuclear contém diferentes tipos de sequências de DNA, na maior parte, DNA intergênico. Com um total de 3.200 megabases (Mb) de extensão, ele apresenta 1.200 Mb correspondentes a genes e a sequências relacionadas, como íntrons, UTRs (extremidades do mRNA que não são traduzidas em proteínas), fragmentos de genes e pseu- dogenes. Já os 2.000 Mb de DNA intergênico dividem-se em regiões repetitivas amplamente distribuídas no genoma (decorrentes de elementos de transposição), regiões repetitivas do tipo pequenas repetições em tandem (como os microssatélites) e em DNA intergênico não repetitivo (como regiões reguladoras e de síntese de RNAs regulatórios como os miRNAs). Fonte: Adaptada de Watson et al. (2015). 11Bases moleculares da hereditariedade: genoma, DNA e genes Genômica O sequenciamento do genoma completo de milhares de organismos forneceu uma imensa quantidade de informações a respeito das sequências constituin- tes dos DNAs cromossômicos. As tecnologias de sequenciamento de última geração facilitaram muito a determinação de sequências e representaram um grande avanço nessa área nas últimas duas décadas, dando início à Era da genômica. O fenômeno gerou — e continua gerando — um grande volume de dados genômicos, cuja análise funcional representa um grande desafi o aos cientistas atualmente. Afi nal, a determinação das sequências genômicas pode ter sido facilitada com as novas tecnologias de sequenciamento, mas o tra- balho para compreender suas funções celulares continua bastante complexo. A bioinformática tem sido uma grande aliada nesse trabalho, auxiliando a análise de sequências em larga escala. As ferramentas computacionais permitem a anotação funcional de genomas, com a possibilidade de atribuição de funções potenciais às sequências obtidas (ZAHA; FERREIRA; PASSAGLIA, 2014). Herança epigenética O código genético presente nas sequências de bases do DNA é a forma mais conhecida pela qual a informação é armazenada, acessada e transmitida. No entanto, outro tipo de informação tem recebido cada vez mais atenção dos geneticistas: a informação epigenética. Essa informação consiste em características/alterações que não estão na sequência do DNA, mas influenciam fortemente o quanto que as sequências de DNA serão expressas. Essas características são o objeto de estudo da epigenética. Sua ocorrência em regiões específicas do genoma tem sido associada a eventos naturais da vida humana, como o desenvolvimento e o envelhecimento, e também com doenças como câncer, diabetes e transtornos psiquiátricos (BORGES-OSÓRIO; ROBINSON, 2013). As principais marcas epigenéticas são alterações químicas presentes no conjunto formado pelo DNA e por proteínas histonas. Essas modificações influenciam o nível de compactação da cromatina, alterando a acessibilidade das maquinarias de transcrição às sequências de DNA presentes na região afetada (ZAHA; FERREIRA; PASSAGLIA, 2014). Além do fato de as modificações epigenéticas servirem como informação à célula, impactando a expressão gênica significativamente, elas podem ser transmitidas de Bases moleculares da hereditariedade: genoma, DNA e genes12 ALBERTS, B. et al. Biologia molecular da célula. 6. ed. Porto Alegre: Artmed, 2017. BORGES-OSÓRIO, M. R.; ROBINSON, W. M. Genética humana. 3. ed. Porto Alegre: Art- med, 2013. STEPHENS, P. R. S. et al. Virologia. In: MOLINARO, E. M.; CAPUTO, L. F. G.; AMENDOEIRA, M. R. R. (org.). Conceitos e métodos para formação de profissionais em laboratórios de saúde. Rio de Janeiro: EPSJBC: IOC, 2013. cap. 2. Disponível em: http://www.epsjv.fiocruz.br/ sites/default/files/cap2.pdf. Acesso em: 12 maio 2020. WATSON, J. D. et al. Biologia molecular do gene. 7. ed. Porto Alegre: Artmed, 2015. ZAHA, A.; FERREIRA, H. B.; PASSAGLIA, L. M. P. (org.). Biologia molecular básica. 5. ed. Porto Alegre: Artmed, 2014. Os links para sites da web fornecidos neste capítulo foram todos testados, e seu fun- cionamento foi comprovado no momento da publicação do material. No entanto, a rede é extremamente dinâmica; suas páginas estão constantemente mudando de local e conteúdo. Assim, os editores declaram não ter qualquer responsabilidade sobre qualidade, precisão ou integralidade das informações referidas em tais links. forma hereditária. Apesar de reversíveis (todas essas modificações químicas podem ser desfeitas por maquinarias celulares específicas), essas alterações,muitas vezes, mantêm-se estáveis e são transmitidas da célula-mãe às células-filhas (BORGES-OSÓRIO; ROBINSON, 2013). Assim, vemos que os mecanismos da hereditariedade são um pouco mais complexos do que se pensou por muito tempo. Enquanto a informação genética determina as sequências de DNA que serão transmitidas à próxima geração, a infor- mação epigenética atua como uma forma mais maleável de herança, que influenciará o quanto essas sequências serão, de fato, expressas na geração seguinte. 13Bases moleculares da hereditariedade: genoma, DNA e genes
Compartilhar