Prévia do material em texto
1 Análise de transcriptomas Eduardo M. Reis Departamento de Bioquimica IQ - USP Fevereiro 2011 Curso de Verão em Bioinformatica 2011 IME - USP O que é o transcriptoma ? • O transcriptoma corresponde a fração do código genético (DNA) que é transcrita pela RNA polimerase em moléculas de RNA. • Depende do estágio do desenvolvimento, estado fisiológico e tipo de tecido. Transcriptoma = Coleção de RNAs (transcritos) presentes em uma célula/tecido em um dado momento. Principais Tipos de RNA codificados no Genoma • RNAs mensageiros (mRNA): contém a informação genética que codifica a sequência de aminoácidos das proteínas • RNAs transportadores (tRNA): identifica e transporta os aminoácidos até o ribossomo. Responsáveis pela leitura do código genético. • RNAs ribosomais (rRNA): constituinte dos ribossomos. Síntese protéica. • Pequenos RNAs nucleares envolvidos no processamento de outros RNAs (snRNAs, snoRNAs) • Pequenos RNAs regulatórios: micro RNAs, piRNAs, pasRNAs • Longos RNAs regulatórios (RNAs não- codificadores) Bolha de transcrição Fita molde (antisenso) RNA polimerase Direção da transcrição Fita codificadora (senso) Desenovelamento Re-enovelamento Transcrição do DNA Trancrição e tradução são acopladas em procariotos Etapas envolvidas na expressão de genes em eucariotos Transcrição Processamento Transporte Tradução Citoplasma Núcleo Promotores de genes bacterianos Região -10Região -35 Posição +1 Genes codificantes para RNA ribosomal possuem elementos UP Região -40 a -60 A transcrição do RNA se inicia em regiões específicas do genoma: Regiões Promotoras Estrutura de um gene eucariótico Citoplasma Núcleo DNA genômico Pre-mRNA mRNA Transcrição Processamento • adição de cap 5’ • adição de cauda poliA 3 • remoção de introns (RNA splicing) Promotor do gene codificador da strictosidina sintase, enzima da via de síntese de alcaloides em plantas. Abundância de RNAs em eucariotos é regulada por fatores de transcrição, proteínas que se ligam ao DNA e a RNA polimerase e ativam ou reprimem a transcrição DNA mRNA Proteina Transcrição Tradução Papéis estruturais e metabólicos substrato produto Genômica (Genoma) Transcriptômica (Transcriptoma) Proteômica (Proteoma) Metabolômica (Metaboloma) morfologia fisiologia comportamento ecologia Genótipo Fenótipo O mundo “omics” Análise de Transcriptomas em larga-escala • identificação de todos os RNAs expressos em um dado organismo ou tecido. • compararação do perfil de expressão gênica em diferentes condições ambientais, estados patológicos, fisiológicos ou de desenvolvimento. • caracterização de polimorfismos associados aos genes transcritos: formas alternativas de splicing e SNPs. •Identificação de genes e vias moleculares envolvidas em processos biológicos : “guilt by association”: genes com perfil de expressão semelhante podem estar funcionalmente relacionados ou sob o mesmo mecanismo e controle. •Fornecer pistas sobre as funções de genes ainda não caracterizados a partir do estudo do padrão espacial (localização sub-celular) e temporal de expressão. •Identificar marcadores para diagnóstico molecular de doenças •Os padrões de expressão gênica podem indicar eventos de regulação em cis- e em trans- , permitindo assim a inferência acerca de diferenças genéticas entre indivíduos. •Podem ainda indicar alterações no proteoma e/ou metaboloma. Que informações podem ser obtidas através da análise de transcriptomas ? Experimentais: permitem a quantificação do nível de expressão gênica • Differential display (RT-PCR) • Sequenciamento de ESTs • SAGE (Serial Analysis of Gene Expression) • Massive Paralel Signature Sequencing (MPSS) • Microarrays de DNA • RNA-seq Métodos para estudo de transcriptomas In silico: requerem conhecimento da sequencia genômica • predição de genes ab initio • busca por domínios protéicos conhecidos • busca por homologia com outros organismos • Síntese fotoquímica in situ. •Milhões de cópias identicas mesmo oligonucleotídeo estão arranjadas em “features”. • Human Genome U133 Set: 45,000 “probe sets” representando 39,000 transcritos de 33,000 genes humanos. • cada “probe set “ é composto por 11–16 pares de 25-mer oligonucleotideos selecionados a partir da sequência de cada transcrito. • “Perfect-match” e “”Mismatch” probes GeneChip (oligoarray) “Wafer” 1,27cm feature 15 Affymetrix - Síntese de oligoarrays in situ através de fotolitografia 16 Sequenciamento por hibridização (Affymetrix) Oligoarrays de alta-densidade Chee M. Assessing genetic information with high-density oligonucleotide arrays. Science 1996 17 Agilent 60-mer Ink-jet oligoarrays 244 k elementos 18 Agilent 44k element oligoarray SurePrint Technology“Zoom in” Detecção de splicing alternativo utilizando microarrays 19 Pan et al., Mol. Cell 16:929-941, 2004 20 Como s o utilizados os microarranjos de DNA?ã Dupla-h liceé de DNA Experimentos com microarranjos de DNA Johnson et al, Trends in Genetics, 21:93-102, 2005 Análise de transcrição em larga-escala utilizando “tiling” arrays genômicos Mattick and Makunin Hum.Mol.Genet. 15:R17-R29, 2006 genoma Transcrição documentada nas 2 fitas do genoma Regiões transcritas do genoma (60-70%) incluindo introns 2% do genoma ocupado por regiões codificadores deproteínas Maior parte do genoma humano é transcrito em RNAS não-codificadores 25 Projeto ENCODE Encyclopedia of DNA Elements Different and redundant approaches to delineate the transcriptional and epigenetic landscapes of ~1% the human genome: 44 genomic regions encompassing 30 Mb of the human genome studied in great detail: → 15Mb in 14 regions for which there is already substantial biological knowledge. → 15Mb in 30 regions randomly picked NATURE, 447:799-816 14 June 2007 Transcrição não-codificadora ubíqua ao longo do genoma (93% do genoma) Rede interconectada de loci gênicos Trancrição de RNAs não-codificadores se correlaciona com a complexidade biológica from Hüttenhofer et al., 2005 TIGS 21:289-297 Birney et al., 2007 Nature 447: 799–816. 27 microRNAs como reguladores da expressão gênica • Micro RNA primário (pri- miRNA) transcrito no núcleo • Clivagem pela enzima Drosha (RNAse tipo III) • Micro RNA precursor (pre- miRNA, ~70 nt) exportado para o citoplasma • Clivagem específica pela enzima Dicer (RNAse tipo III) produz microRNAs maduros (21-22 nt) • microRNAs promovem o silenciamento específico de mRNAs-alvo através do complexo RISC (“RNA Induced Silencing Complex”) Funções de RNAs não=codificadores longos Wilusz J E et al. Genes Dev. 2009;23:1494-1504 RNA não-codificador HOTAIR regula cromatina através do recrutamento de enzimas modificadoras de histonas Rinn et al., Cell 2007, 129:1311-1323 RNAs não-codificadores longos intrônicos e antisenso ~ 1 . 1 K b R A S S F 1 ( C h r 3 p 2 1 . 3 1 ) 5 0 , 3 3 1 , 6 0 85 0 , 3 3 0 , 5 5 3 5 ' 3 ' 5 ' 3 ' ~ 0 . 8 K b A P 1 G B P 1 ( C h r 1 7 q 1 2 ) 3 6 , 1 0 7 , 8 0 63 6 , 1 0 7 , 0 0 6 5 ' 3 ' 5 ' 3 ' C G E ~ 0 . 6 K b P P H L N 1 ( C h r 1 2 q 1 2 ) 4 1 , 1 0 6 , 8 5 44 1 , 1 0 6 , 2 6 8 5 ' 3 ' 5 ' 3 ' A T L E 3 ( C h r 1 5 q 2 3 ) 3 6 , 0 7 5 , 0 9 63 6 , 0 7 4 , 7 9 6 5 ' 3 ' 3 ' 5 ' 4 1 , 0 0 6 , 2 3 4 3 6 , 0 7 4 , 5 5 8 3 6 , 1 6 4 , 9 9 6 4 1 , 1 2 7 , 3 9 4 5 0 , 3 2 6 , 2 2 8 5 0 , 3 3 7 , 3 7 9 3 6 , 0 5 8 , 2 3 63 6 , 1 0 4 , 9 7 6 e x o n 1 3e x o n 1 4 e x o n 1 0e x o n 9 9 . 5 7 . 5 4 . 4 2 . 4 1 . 3 0 . 2 4 k b D F B 5 . 0 1 . 9 k b 5 . 0 1 . 9 k b 5 . 5 3 Sp le en Th ym us P ro st at e Te st is PC 3 D U 14 5 Ln C ap PC 3 D U 14 5 Ln C ap 0 . 6 6 RASSF1 PPHLN1 RASSF1 PPHLN1 Reis et al. Oncogene 23: 6684-6692, 2004 GAS6 Reis et al., Oncogene 2005, 23: 6684-6692; Louro et al. BMC Biology 5:4, 2007 Ao menos 74% dos loci gênicos codificadores de proteína (11,679 RefSeqs) possuem regiões intrônicas transcricionalmente ativas que originam ncRNAs totalmente (TIN) ou parcialmente (PIN) intrônicos Nakaya et al., Genome Biology 2007, 8:R43 Tipo de sonda Nº de sondas TIN (senso/antisenso) 7,715 x 2 = 15,430 PIN (senso/antisense) 5,289 x 2 = 10,578 Exon codificador 14,403 34 Grau de Gleason (GS) Diagrama esquemático do sistema de classificação de Gleason Gleason Risco de for recorrência do tumor 2 - 6 Baixo 7 Intermediário 8 - 10 Alto Identificação de ncRNAs intrônicos associados a agressividade do câncer de próstata Gleason Grade # of samples G 5 1 G 6 5 G7 16 G9 1 G10 4 Total 27 G 5 1 G 6 5 G7 16 G9 1 G10 4 Total 27 Grau de Gleason # de amostras G 5G 5 11 G 6G 6 55 G7G7 1616 G9G9 11 G10G10 44 TotalTotal 2727 35 Classifica o n o-supervisionada:çã ã Clusteriza o hier rquica de 27 amostrasçã á de c ncer de pr stata a partir dos dados de 3.355 genesâ ó 36 Moreira et al., manuscrito em preparação Preditores de evolução clínica identificados a partir de perfis globais de expressão gênica Classifica o supervisionada:çã 37 65 transcritos (21 exonicos, 44 intronicos) correlacionados com a recorrência do câncer de próstata SNR p-value<0.01 28 sample28 amostras do conjunto de treinamento Moreira et al., manuscrito em preparação 38 Transcritos intr nicos ô mais abundantes s o originados emã regi es intr nicas de genes relacionados com õ ô regula o da transcri oçã çã 123 genes Em pelo menos 1 tecido categoria GO 'Regulation of transcription, DNA-dependent' (GO:006355) está significativamente enriquecida (p < 0.002) entre os 40% antisenso TINs mais abundantes nos 3 tecidos estudados Nakaya et al., Genome Biology 2007, 8:R43 Identificação de vias metabólicas/regulatórias enriquecidas em assinaturas de expressão gênica 39 Assinatura de expressão gênica preditora de metástase no câncer de mama • 113 transcritos 77 ex nicosô 8 interg nicosê 28 intr nicosô • 18 amostras de adenocarcinoma ductal invasivo • Seguimento m nimo de 4 anosí Sem metástase Com metástase Durães et al., manuscrito em preparação Marcadores moleculares do adenocarcinoma de pâncreas M�dia_ trimada_Teste-t(p<0.01)_z-score-TvsPC+N_L�minas_2007 T N / PC * Ana Carolina Tahira Bianca Dazzani Michele Farias Colaboradores: Dr. Marcel Machado Dra. Márcia Kubrusly FMUSP – Dep. Cirurgia 41 Qual a função de RNAs não codificadores intrônicos ? Como são regulados ? AAAAAA Re gu la çã o ?? ? ncRNA antisenso 42 Cell 116: 499-509, 2004 PNAS 100: 12247-12252, 2003 [...] Strikingly, a significant proportion of binding was seen in intronic regions, demonstrating that transcription factor binding is not restricted to promoter regions. [...] Evidências de fatores ativadores da transcrição em regiões não-codificadoras do genoma humano A expressão de RNAs intrônicos não-codificadores é regulada por fatores semelhantes aos que regulam genes codificadores? Identificação de transcritos intrônicos não-codificadores com expressão regulada por andrógeno RNAs diferencialmente expressos na linhagem tumoral de próstata LNCaP tratada com andrógeno em relação a controles não-tratados •Significance Analysis of Microarrays (SAM) •Fold-change ≥1.5X •False Discovery Rate ≤ 5% 6h 9h 12h 18h 24h 48h 6h 9h 12h 18h 24h 48h 134 mRNAs codificadores 28 ncRNAs intrônicos Louro et al. BMC Biology 5:4, 2007 Louro et al. BMC Biology 5:4, 2007 Identificação de ncRNAs intrônicos antisenso com expressão regulada por andrógeno 45 Louro et al. BMC Biology 5:4, 2007 46 RNAS intrônicos : mecanismo envolvido no ajuste fino da regulação da expressão gênica: Hipótese 1: estabilização/desestabilização da cromatina transcripcionalmente ativa e/ou do pre-mRNA Transcrição CH3 CH3CH3 CH3 Ilhas CpG pre-mRNA RNA intrônico antisenso TF A TFBS + TFB S Pol IITF Pol II Reis et al. (2005) OMICS 9: 2-12 47 Louro et al.,manuscrito em preparação RNAs intrônicas antisenso cuja abundância está inversamente relacionada com a abundância do gene codificante para proteína Louro et al. BMC Biology 5:4, 2007 48 RNAS intrônicos : mecanismo envolvido no ajuste fino da regulação da expressão gênica Hipótese 2: Modulação da abundância de formas alternativas de splicing Reis et al. (2005) OMICS 9: 2-12 spliced-out introns variante de splicing 1 Proteína isoforma 1 Pré-mRNA RNA antisenso intrônico S C Proteína isoforma 2 Splicing Splicing Alternativo Tradução Tradução B variante de splicing 2 spliced-out introns S C S C S C + mRNA processado mRNA processado Complexo do Spliceosoma spliced-out introns variante de splicing 1 Proteína isoforma 1 Pré-mRNA RNA antisenso intrônico S C Proteína isoforma 2 Splicing Splicing Alternativo Tradução Tradução B variante de splicing 2 spliced-out introns S C S C S C + mRNA processado mRNA processado Complexo do Spliceosoma SAF: a natural intronic antisense message modulates the sub-cellular localization of the Fas protein Yan et al., Hum. Mol. Genet. 14:1465–1474, 2005 50 Louro et al. BMC Biology 5:4, 2007 Abundância de RNAs intrônicos antisenso regulados por andrógeno está correlacionada ao padrão de splicing do gene codificador para proteína correspondente Etapas envolvidas na expressão de genes em eucariotos Transcrição Processamento Transporte Tradução Citoplasma Núcleo Spector DL 2001, Journal of Cell Science 114: 2891-2893 Estruturas nucleares em células de mamíferos Paraspeckle e a retenção nuclear de RNAs hipereditados A-I from Chen & Carmichael, 2009 Molecular Cell 35, 467–478 Diferenciação celular CTN-RNA, um RNA não codificador expresso no locus do gene codificador para o transportador de aminoácidos catiônicos mCAT2, é retido no núcleo e se Localiza em paraspeckles. Kannanganattu et al., 2005 Cell 123: 249-263 55Kannanganattu et al., 2005 Cell 123: 249-263 Conjuntos de mRNAs e ncRNAs intrônicos encontram-se enriquecidos na fração nuclear 57 emreis@iq.usp.br Departamento de Bioquímica Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Agilent 44k element oligoarray SurePrint Technology Detecção de splicing alternativo utilizando microarrays Slide 20 Slide 21 Slide 22 Slide 23 Slide 24 Projeto ENCODE Encyclopedia of DNA Elements Slide 26 Slide 27 Slide 28 Slide 29 Slide 30 Slide 31 Slide 32 Slide 33 Slide 34 Slide 35 Slide 36 Slide 37 Slide 38 Slide 39 Marcadores moleculares do adenocarcinoma de pâncreas Slide 41 Slide 42 Slide 43 Slide 44 Slide 45 Slide 46 Slide 47 Slide 48 Slide 49 Slide 50 Slide 51 Slide 52 Paraspeckle e a retenção nuclear de RNAs hipereditados A-ISlide 54 Slide 55 Slide 56 Slide 57