Prévia do material em texto
5920117 - Genética I I 2014 Transcrição gênica em eucariotos Prof. Dr. Tiago Campos Pereira tiagocampospereira@ffclrp.usp.br 3602 3818 – sala 13, bloco 14 Principle of Genetics 5th Edition - Cap 11 (págs 293 - 307). Snustad & Simons, Editora Wiley Assuntos abordados nesta aula: • Tipos de RNA polimerases • Iniciação das cadeias • Elongação das cadeias e adição de CAP • Terminação da cadeia e adição da cauda poli-A • Edição de RNA • Íntrons e éxons • Splicing autocatalítico e spliceossomo Embora o processo de transcrição em eucariotos seja semelhante ao de procariotos, ele é consideravelmente mais complexo em eucariotos. Em eucariotos, a transcrição ocorre no núcleo e a maioria dos transcritos que codificam proteínas são transportados para o citoplasma para a tradução. Contudo, evidências recentes indicam qua alguma tradução ocorre no núcleo. mRNAs de procariotos são geralmente policistrônicos (vários cistrons = multigênico), ao passo que os de eucariotos são monocistrônicos. Contudo, 25% das unidades de transcrição de C. elegans são multicistrônicas. Cinco diferentes tipos de RNA polimerases (I, II, III, IV e V) estão presentes em eucariotos, transcrevendo classes distintas de genes. Adicionalmente, a maioria dos transcritos primários de mRNAs eucarióticos passam por três modificações antes do transporte ao citoplasma: - adição de um “cap” (7-metilguanosina - 7mG) na extremidade 5’ - adição de uma cauda poli-A de 20 a 200 nt na extremidade 3’ - retirada de eventuais íntrons Em eucariotos, a população nuclear de transcritos primários de um mesmo gene é chamada de RNAs nucleares heterogêneos (hnRNAs) devido à grande variação no tamanho deles. Portanto, os hnRNAs consistem em pré-mRNAs passando por processamento. Adicionalmente, os transcritos são cobertos por proteínas durante ou logo após sua síntese, protegendo contra a degradação por ribonucleases. Por isso, a meia-vida de um transcrito eucariótico é de 5 h ao passo que de um procariótico é <5 min. Eucariotos possuem cinco RNA polimerases (I, II, III, IV e V) que são mais complexas que a RNAP de E. coli, contendo 10 ou mais subunidades. Diferentemente da RNAP de E. coli, RNAPs eucarióticas requerem a assistência de proteínas denominadas fatores de transcrição (FTs) para iniciar a síntese das cadeias de RNA. De fato, estes FTs precisam se ligar à região promotora no DNA e formar um complexo apropriado antes da RNAP se ligar e iniciar a transcrição. Diferentes promotores e FTs são utilizados por diferentes RNAPs. Focaremos na iniciação de pré-mRNAs sintetizados pela RNAP II, que transcreve a maioria dos genes eucaritóticos (mRNAs). Os promotores reconhecidos pela RNAP II consistem de pequenos elementos conservados (ou módulos) localizados upstream ao TSS (transcription start site). Por exemplo, os componentes do promotor do gene da thymidine kinase de camundongos são: A iniciação da transcrição pela RNAP II requer a assistência de diversos FTs basais, que devem intereagir com os promotores na sequência correta para iniciar a transcrição eficientemente. Cada FT é simbolizado por TFIIX: Transcription Factor for RNAP II, X representando um determinado fator. TFIID é o primeiro a interagir com o promotor. Ele contém uma TATA-binding protein (TBP) e diversas proteínas associadas a TBP. TFIIH possui atividade de DNA helicase, e viaja com a RNAPII durante a elongação, abrindo o dsDNA. RNAP de eucariotos catalizam a elongação da cadeia pelo mesmo mecanismo das RNAP de procariotos. Após a síntese das primeiras 30 ligações fosfodiéster, a extremidade 5’ do pré-mRNA é modificada pela adição de uma 7-metilguanosina (7mG). Esta estrutura “CAP” (ou capa) tem duas utilidades: - reconhecimento por fatores da iniciação da tradução - proteção contra degradação por exoribonucleases Como a RNAP transcreve o DNA que está empacotado em nucleossomos? O nucleossomo precisa ser desmontado antes do DNA ser transcrito? Surpreendentemente, a RNAPII é capaz de atravessar os nucleossomos com a ajuda do complexo proteico FACT (facilitates chromatin transcription). Nucleossomos são octâmeros de histonas. Este complexo remove dímeros H2A/H2B dos nucleossomos. O DNA fica “afrouxado” ao hexâmero restante, permitindo a passagem da RNAPII. Logo em seguida, FACT e outras proteínas ajudam a redepositar os dímeros de histona, restaurando a estrutura dos nucleossomos. direção da transcrição A RNAPII não responde a sinais de terminação, mas sim a um sinal de poliadenilação (AAUAAA) no transcrito além de uma região rica em “GU”. Um componente de especificidade se liga à sequência AAUAAA Um fator estimulatório se liga à sequência rica em GU Uma endonuclease e uma poli-A polimerase se ligam aos dois elementos anteriores formando um complexo multimérico. Marilena Realce Este complexo multimérico cliva o transcrito em um sítio de 11 a 30 nt downstream do sinal de poliadenilação (AAUAAA ) e upstream à região GU. Logo em seguida, a poli- A polimerase adiciona uma cauda de 200 nt. Esta cauda poli-A aumenta a estabilidade do mRNA e tem papel no transporte para o citoplasma. Ao contrário da RNAPII, as outras RNA polimerases respondem a sinais discretos de terminação: - RNAP I termina a transcrição em resposta a uma sequência de 18 pb que é reconhecida por uma proteína terminadora associada. - RNAP III responde a um sinal de terminação que é semelhante ao terminador independente da proteína rho de E. coli. De acordo com o dogma central da biologia molecular, a informação genética flui do DNA para a proteína sem alterações. Contudo, a descoberta do processo de edição de RNA mudou nossa visão. Ele modifica a informação presente nos transcritos de duas formas: - alterando a estrutura de bases individuais - inserindo ou deletando resíduos de uridina monofosfato (UMP) O primeiro tipo, alteração de bases individuais é um processo raro e foi descoberto durante estudos dos genes e transcritos da apolipoproteína-B (apo-B) de coelhos e humanos. deaminação stop codon prematuro A edição de RNA também é observada no receptor de glutamato de cérebro de ratos. A maioria dos transcritos de genes mitocondriais de plantas sofre algum grau de edição de RNA. Curiosamente, alguns transcritos da mitocondria vegetal possuem a maioria das citidinas convertidas em uridinas!O segundo tipo de edição - inserção ou deleção de UMPs - é mais complexo e ocorre nas mitocondrias de tripanossomas. nuclease TUTase ligase TUTase: terminal uridil transferase A maioria dos genes bem caracterizados de procariotos consistem em sequências contínuas de nt, os quais especificam sequências colineares de aminoácidos. Entretanto, em 1977 análises moleculares dos genes de -globina de coelho e ovoalbumina de galinha revelaram que eles possuem sequências intervenientes não codificantes (íntrons) entre as regiões codificantes (éxons). íntrons: sequências intervenientes (= que fica entre). São regiões não traduzidas, localizadas entre os éxons e que estão presentes no pré-mRNA mas não no mRNA. éxons: sequências expressas (i.e., presentes no mRNA). São regiões traduzidas (=CDS) e não traduzidas (=5’ UTR e 3’ UTR) que estão presentes no pré-mRNA e no mRNA. CDS (coding DNA sequence): região codificadora do DNA. 5’ UTR (untranslated region): região não traduzida na extremidade 5’. 3’ UTR (untranslated region) : região não traduzida na extremidade 3’. Pouco se sabe sobre a relevância biológica dos íntrons. A taxa de acumulação de mutações em íntrons é bem maior do que em éxons, evidenciando que estas regiões não seriam importantes. Alternativamente, íntrons fornecem uma vantagem seletiva por aumentar a taxa com a qual sequências codificadoras em diferentes éxons podem ser rearranjadas por recombinação, acelerando, portanto o processo evolutivo. Existem íntrons: - na maioria dos genes nucleares que codificam proteínas em eucariotos multicelulares - em um grande número de genes de eucariotos unicelulares (mas menos do que em eucariotos multicelulares) - raramente em genes de archae e de vírus de procariotos Para genes que codificam proteínas, o processo de retirada de íntrons e religação de éxons (splicing = recomposição) precisa ser extremamente preciso, para preservar o quadro de leitura intacto. Este nível de acurácia requer sinais de recomposição, presumivelmente sequências nucleotídicas dentro dos íntrons e nas junções éxon-íntron. As únicas sequências completamente conservadas são os dinucleotídeos “GT” e “AG” nas extremidades dos íntrons. Há também pequenas sequências consenso nas junções. Para genes nucleares, as sequências consenso são: Através de estudos in vitro, pesquisadores descobriram que há diferentes tipos de excisão de íntrons, os principais são: - 1. Via clivagem e ligação (tRNAs de leveduras) - 2. Autocatalítica - 3. Via spliceossomos Os íntrons de pre-mRNAs nucleares são excisados em duas etapas, pela atividade de spliceossomos. Spliceossomos são compostos por : - um conjunto de pequenos RNAs nucleares (snRNAs), entre 100 a 215 nt: U1, U2, U4, U5 e U6 - 40 proteínas Os snRNAs não permanecem sozinhos, mas sim em complexos chamados snRNPs (small nuclear ribonucleoproteins). Os spliceossomos são montados por 4 snRNPs diferentes + proteínas: snRNP U1 = snRNA U1 + proteínas snRNP U2 = snRNA U2 + proteínas snRNP U5 = snRNA U5 + proteínas snRNP U4/U6 = snRNA U4 + snRNA U6 + proteínas - snRNP U1 se liga ao sítio 5’ do íntron, provavelmente por complementaridade do snRNA U1 com a sequência consenso do íntron. - snRNP U2 se liga a uma sequência consenso que contém um “A” no ponto de ramificação (branch site) na estrutura de laço do íntron. - Em seguinda, snRNP U5 se liga à extremidade 3’ do íntron - snRNP U4/U6 se ligam ao complexo, formando o spliceossomo completo. - Quando o sítio 5’ do íntron é clivado (etapa 1), ele se liga ao “A” no ponto de ramificação, formando a alça. snRNAs U1 e U4 são retirados do spliceossomo. - Na etapa 2, o sítio 3’ do íntron é clivado e os 2 éxons são reunidos por uma ligação fosfodiéster normal 5’ - 3’. Nature - 2013 TFIID é o primeiro a interagir com o promotor. Ele contém uma TATA-binding protein (TBP) e diversas proteínas associadas a TBP. Posteriormente TFIIA se liga ao complexo, seguido por TFIIB. TFIIF se associa à RNAP II; posteriormente ambos se ligam ao complexo de iniciação. TFIIF contém 2 subunidades, uma das quais é capaz de abrir dsDNA, provavelmente separando o DNA para o início da transcrição. TFIIE se liga ao complexo em uma posição downstream do TSS. TFIIH e TFIIJ se ligam ao complexo. TFIIH possui atividade de DNA helicase, e viaja com a RNAPII durante a elongação, abrindo o dsDNA. RNAP I e III iniciam o processo de transcrição por processos similares. Contudo, os promotores de genes transcritos por RNAP I e III são bem diferentes daqueles utilizados pela RNAP II, embora compartilhem alguns elementos conservados. Os promotores usados pela RNAP I são bipartidos: - uma sequência principal (core sequence) entre -45 e +20. - um elemento controlador se estendendo de -180 a -105. Estas duas sequências são semelhantes e ricas em CG. A sequência principal é suficiente para a iniciação, mas a eficiência (da iniciação) é intensificada pela presença do elemento controlador. Curiosamente, a maiorira dos promotores usados pela RNAP III (mas não todos) estão localizados dentro das unidades de transcrição, i.e., a downstream de TSS. A maioria dos genes eucarióticos possuem íntrons: - gene para vitelogenina A2 de X. laevis contem 33 íntrons - gene do colágeno 12 de galinha possui 50 íntrons - gene do colágeno possui 37.000 pb mas seu mRNA tem apenas 4.600 nt - O gene Ultrabithorax (Ubx) de drosófila possui um íntron de 70.000 nt - O maior gene conhecido é o DMD (distrofina humana) com 2,5 milhões de pb e 78 íntrons Alguns introns variam de 50 a milhares de pb em tamanho. Contudo, íntrons não são essenciais uma vez que nem todos genes de eucariotos superiores os possuem. Primeiros genes sem íntrons descobertos: - histona do ouriço do mar - heat-shock proteins de drosófila Em alguns casos, diferentes éxons codificam diferentes domínios funcionais da proteína. Isso tem levado à especulação de que genes com íntrons seriam simplesmente resultado da fusão de genes sem íntrons. Se esta hipótese for correta, os íntrons seriam meramente rélicas do processo evolutivo. Gene 1 Gene 2 Gene 3 Gene 4 Gene 5 A excisão de íntrons de tRNAs de leveduras ocorre em duas etapas : - Estágio I: uma endonuclease ligada à membrana nuclear realiza dois cortes precisamente nas extremidades do íntron. - EstágioII: uma ligase une as duas metades do tRNA, produzindo a forma madura do tRNA. A especificidade destas reações reside nas características da estrutura tridimensional conservada dos tRNAs precursores, não nas sequências nucleotídicas per se. Em 1982, Thomas Cech e colaboradores descobriram que o íntron do rRNA de Tetrahymena thermophila (protozoário) era excisado sem o envolvimento de proteína alguma. Eles verificaram que a atividade catalítica era intrínseca ao rRNA! Tratava-se da primera ribozima descoberta. Tetrahymena thermophila Posteriormente descobriu-se que esta atividade de auto-splicing está presente em: - rRNAs de diversos eucariotos inferiores e - rRNAs, tRNAs e mRNAs precursores de mitocôndrias e cloroplastos de diversas espécies. A excisão autocatalítica do íntron do rRNA de Tetrahymena não requer fonte externa de energia e nenhuma atividade catalítica de proteínas. O mecanismo de splicing envolve uma série de transferências de ligação fosfoéster, sem ganho ou perda de ligações durante o processo. A reação requer um nucleosídeo ou nucleotídeo de guanina com um grupo 3’ OH livre (GTP, GDP, GMP ou guanosina) como cofator, um cátion monovalente e um cátion bivalente. O requerimento de um G-3’-OH é absoluto, nenhuma outra base pode ser usada como como cofator. O íntron é excisado por meio de duas transferências de ligações fosfoéster; o íntron excisado é subsequentemente circularizado por meio de uma outra transferência de ligação fosfoéster. A circularização autocatalítica do íntron excisado sugere que o a atividade de auto- splicing reside primariamente na estrutura do íntron. Presumivelmente, a atividade autocatalítica é dependente da estrutura secundária do íntron e, pelo menos em parte, pela do RNA precursor. snRNAs (em amarelo) permitem o posicionamento dos snRNPs através do pareamento com sequências consenso.