Prévia do material em texto
Análise de Expressão Gênica A expressão gênica compreende desde a ativação do gene até que a proteína madura esteja em seu respectivo compartimento e esteja ativa para contribuir com a expressão do fenótipo da célula. Estudos com expressão gênica são direcionados para detectar e quantificar os níveis de RNA mensageiro (mRNA) de um gene específico. A primeira técnica de avaliação de transcritos se iniciou com o Northern blot e posteriormente com hibridização in situ. Com os crescentes estudos de análise do transcriptoma e da expressão gênica e os avanços na metodologia utilizadas nessa área de pesquisa, vemos um acúmulo nas informações que permitem a compreensão de processos celulares e fisiológicos em diversas condições experimentais específicas. Por exemplo, a partir de análises de transcriptoma podemos avaliar quais genes estão sendo superexpressos em células cancerígenas em comparação com células normais. Além disso, podemos descobrir, utilizando técnicas que avaliem o transcriptoma, polimorfismos em transcritos e formas alternativas de splicing. De modo geral, a grande maioria das técnicas de análise de transcritos tem como primeira etapa a formação de um DNA complementar (cDNA) a partir do RNA extraído da célula. Essa etapa é realizada utilizando a enzima transcriptase reversa, sendo a técnica conhecida como RT-PCR (reverse transcription polymerase chain reaction). Essa técnica permite um aumento da quantidade de ácido nucleico que será utilizada em experimentos posteriores, permitindo sua detecção. PCR quantitativa ou PCR em tempo real (qPCR) Em 1984, Kary Mullis desenvolveu a Reação em Cadeia da Polimerase (PCR). Essa técnica amplifica um segmento específico de DNA para obter centenas de milhões de cópias em poucas horas. Essa técnica foi utilizada para estudos qualitativos até que em, 1992, Higuchi e colaboradores desenvolveram a Reação em Cadeia da Polimerase quantitativa (qPCR), a qual emprega a técnica de PCR para estudos de expressão gênica. Para fazer isso, os pesquisadores usaram o mesmo material utilizado na PCR convencional: um par de primers específicos; trifosfatos de desoxinucleotídeos (dNTPs); um tampão de reacão; uma DNA polimerase termoestável; e eles adicionaram um fluorocromo que fluoresce quando excitado. Além disso, eles projetaram um sistema capaz de detectar em tempo real os produtos de PCR que iam sendo formados. O sistema utiliza uma câmera que detecta o aumento da fluorescência que ocorre quando o brometo de etídio é intercalado em novas cadeias de DNA formadas em cada ciclo. Portanto, na PCR em tempo real ou qPCR, os processos de amplificação e detecção ocorrem simultaneamente ao mesmo tempo. A reação de PCR consiste em uma série de mudanças cíclicas de temperatura. Cada ciclo é dividido em três etapas (Fig. 1): ● Desnaturação: separação do DNA de cadeia dupla quando submetido a 95 °C. ● Hibridização dos primers (anelamento): alinhamento dos primers ao DNA molde a uma temperatura em torno de 50 a 70 °C. ● Elongação ou Polimerização: ligação dos dNTP correspondentes à cadeia de alongamento do DNA a uma temperatura em torno de 68-72 °C. Teoricamente, se a eficiência da reação for 100%, o número de moléculas de DNA duplicará com cada ciclo. A realidade é que a eficiência em condições ótimas será um pouco menor que 100%. Figura 1. Etapas do qPCR: desnaturação, anelamento dos primers e extensão (ou elongação). O fluoróforo está representado como uma molécula verde. Métodos de detecção A técnica de qPCR permite a quantificação do material estudado (DNA ou cDNA) usando fluoróforos. A fluorescência é medida em cada ciclo e é proporcional à quantidade do produto de PCR (quanto mais fluorescência era captada, mais DNA havia no final de cada ciclo de reação). Por um lado, os fluoróforos podem ser corantes fluorescentes que se ligam inespecificamente ao DNA de cadeia dupla e produzem uma quantidade fluorescente que se correlaciona com o número de cópias do DNA. Esses corantes são denominados intercalentes de DNA (Fig. 2). Neste grupo encontramos corantes como o SYBR Green. Por outro lado, podem ser utilizados fluorocromos ligados a sondas, que hibridizam especificamente com as cadeias de DNA amplificadas. Assim, a reação é mais específica e o sinal só é gerado quando a sonda hibridiza com sua região complementar. Neste grupo, encontramos sondas de hidrólise “TaqMan”, sondas FRET, sondas Beacon e sondas Scorpions. Figura 2. Fluorescente intercalante se ligando à dupla fita de DNA durante uma reação de qPCR. A detecção da fluorescênca é feita após o término da extensão da dupla fita (3ª etapa do ciclo). Intercalantes de DNA e curva de melting SYBR Green I é um composto orgânico com a fórmula química C32H37N4S. Está associado à molécula de DNA, interagindo com o sulco menor. É usado em coloração de DNA para análise por eletroforese de produtos de PCR, ou como um meio de visualização direta dos produtos de PCR em tempo real. A análise da curva de melting é necessária para detectar problemas de ligação não específica do SYBR Green ao DNA. A comparação das curvas de melting permite uma interpretação dos produtos amplificados em PCR. Diferentes produtos têm temperaturas diferentes porque a temperatura de melting depende do tamanho do amplicon, do conteúdo de GC e das estruturas secundárias e terciárias. No final da reação de PCR, um gradiente de 50 a 95 °C é feito para desnaturar o DNA de fita dupla. Quando o DNA de cadeia dupla se torna DNA de cadeia simples, a diminuição da fluorescência pode ser observada como picos, representados pela realização da segunda derivada da fluorescência. Se a reação não for específica, os produtos de PCR mostram picos de curva de melting diferentes (Fig. 3). Há mais de uma década, existem outros corantes fluorescentes, como LC Green, ResoLight, EvaGreen, Chromofy SYTO e BEBO. Figura 3. Análise de uma curva de melting. Nesse tipo de análise, após a reação de qPCR, um gradiente de temperatura é amplicado nas amostras. À medida que o DNA desnatura, a fluorescência diminui, a curva de melting pode ser visualizada no computador. A curva de cima (verde) mostra que o DNA amplificado é um só, sendo um mesmo produto final. A curva de baixo (vermelha) apresenta uma amplificação inespecífica (note os dois picos). Isso significa que há mais de um tipo de DNA amplificado. Sondas (TaqMan) A sonda TaqMan® pertence ao grupo de sondas de hidrólise e é baseada na atividade de exonuclease 5′-3′ da Taq polimerase. A sonda Taqman é uma sequência complementar a um produto de PCR que não faz parte dos primers. A sonda é marcada com um fluoróforo que se liga covalentemente a sua extremidade de 5′ (chamada de “doador”) e com um quelante ligado covalentemente a sua extremidade 3′ (também chamada de “aceptor”) cuja função é quelar a fluorescência emitida pelo fluoróforo quando é excitado pela luz. A atividade de exonuclease 5′ degrada a sonda e libera o fluoróforo que emitirá fluorescência quando não estiver próximo do quelante (Fig. 4). O fluoróforo liberado é proporcional à quantidade de DNA amplificado na PCR. A sonda deve estar próxima de um primer e o tamanho do amplicon não deve ser maior que 200 pares de bases. Outra desvantagem é que essas sondas não permitem a análise da curva de melting, porque a hidrólise da sonda impede sua reutilização. Figura 4. Detecção de cópias de DNA durante a qPCR utilizando a sonda TaqMan®. A sonda apresenta um fluoróforo (F) e um quelante (Q) ligados em cada extremidade. Quando a Taq polimerase quebra a sonda durante a fase de extensão, a fluoróforo se distancia do quelante e emite fluorescência, que é captada pelo leitor do termociclador. Termos utilizados na qPCR Todos os sistemas quantificam e registram similarmente o sinal fluorescente em cada ciclo da PCR. A cinética da reação(a curva) mostra uma representação formando uma forma sigmóide. A representação gráfica (Fig. 5) é definida pelo ciclo de linha de base (background baseline), limiar de detecção (threshold) e ciclo do limiar de detecção (cycle threshold). Todos esses dados são analisados pelo programa de computador. ● Background: Fluorescência não específica da reação. O algoritmo matemático remove- o. ● Linha de base (baseline): nível de ruído nos ciclos iniciais de PCR, onde não é detectado um aumento na fluorescência do produto de PCR. Determina a fluorescência basal (não há positividade). ● Limiar de detecção (Threshold): o valor do limiar de detecção é definido logo acima do nível da linha de base, onde a amplificação exponencial começa. Quando a curva de fluorescência ultrapassa o limiar de detecção, consideramos que houve positividade. O limiar de detecção pode ser determinado automaticamente (pelo programa) ou manualmente. ● Ciclo do limiar de detecção (Cycle threshold, Ct): o ciclo no qual a fluorescência ultrapassa o limiar de detecção. Este ciclo é utilizado para quantificação relativa da expressão gênica. Figura 5. Ciclo de uma qPCR com os termos base representados. O threshold está representado pela linha “baseline”. Fases da qPCR A reação qPCR envolve três fases que podem ser representadas como uma curva sigmoidal (Fig. 6). As três fases são as seguintes: ● Fase exponencial: a quantidade de produto é pequena, o produto de PCR é gerado exponencialmente porque a enzima e os reagentes não são limitados, de modo que a reação pode atingir a máxima eficiência. Esse crescimento exponencial é difícil de detectar porque a quantidade de produto é insuficiente. A quantidade de produto neste estágio é proporcional à quantidade da amostra inicial. ● Fase linear: a quantidade de produto aumenta linearmente porque a quantidade de enzima e reagentes começa a ser limitada, de modo que a eficiência da reação diminui. ● Fase de platô: a reação diminui até que os dNTPs e os primers necessários para a nova síntese sejam esgotados. O ciclo no qual a fluorescência começa a exceder o nível de fundo é chamado de ciclo do limiar de detecção (Ct) e é o início da fase logarítmica. Portanto, o Ct é inversamente correlacionado com a quantidade de amostra: quanto menor o Ct, maior a quantidade de cDNA. Figura 6. Fases da qPCR. Quantificação Para quantificar a expressão do gene em estudo, existem dois métodos, chamados de quantificação absoluta e quantificação relativa. No primeiro caso, a quantidade de expressão absoluta é expressa como o número de cópias obtidas. No segundo, a quantificação é baseada em um calibrador, cujo valor é referência para todos os outros, atribuindo a ele um valor de 1. Para realizar a quantificação absoluta é necessário conhecer o número de cópias do gene alvo em uma amostra padrão. Geralmente, esta amostra padrão é um DNA de plasmídeo ou DNA complementar (cDNA) cujas concentrações são medidas por um espectrofotômetro. No ensaio, deverão ser preparadas diluições em série da amostra padrão em que o gene alvo será amplificado. O computador registra os ciclos de limiar de detecção (Ct) para cada amostra. As diluições de uma amostra padrão mostram uma curva padrão que afeta o número de cópias por interpolação do Ct e permite quantificar as amostras. Existem três métodos para quantificação relativa; o mais utilizado é o método 2-ΔΔCT. Este método assume que o procedimento dobra o conteúdo de DNA em cada ciclo, que a eficiência da reação é 100%, e que um gene de referência é expresso em um nível constante entre todas as amostras. Este gene de referência é um gene constitutivo (gene housekeeping) que é usado como um controle endógeno para corrigir a variabilidade intra e inter-ensaio. A expressão do gene de referência é imutável nas diferentes amostras do ensaio pois é um gene cuja função está relacionada à manutenção da célula, portanto, também é chamado de gene constitutivo. O resultado da análise relativa é dado em ordem de grandeza comparado com o gene controle (2x mais expresso, 5x mais expresso, 2x menos expresso...). Microarray (Microarranjo) A técnica de Microarrays baseia-se na complementaridade entre as cadeias de ácidos nucleicos que permite a detecção de sequências específicas, a qual é chamada de hibridização. O microarranjo, também conhecido como chip de DNA ou biochip, é um suporte sólido de vidro, plástico ou nylon que é unido a oligonucleotídeos cujas sequências correspondem a todas as regiões do genoma que se quer estudar. Os fabricantes usaram a mesma tecnologia usada nos chips semicondutores, mas colocando verticalmente milhões de fitas de DNA no suporte. Cada oligonucleotídeo é colocado em uma área específica chamada “célula de sonda” (spots), onde bilhões de cópias do oligucleotídeo são encontradas. Estes oligonucleotídeos são sintetizados antes da ligação ao suporte ou no suporte. Há doois tipos de microarrays: microarranjos de expressão, onde sequências específicas de RNA (cDNA) são detectadas e microarranjo de genotipagem para detecção de sequências específicas de DNA. Ao comparar os resultados de ambas os arranjos, pôde-se estabelecer a relação de polimorfismos com a expressão gênica, o que, entre outras coisas, poderia explicar a diferente resposta ao tratamento observado entre pacientes com diferente genética. A metodologia desta técnica inclui os seguintes passos (Fig. 6): ● Extração e preparação de RNA: o RNA é extraído das células, tentando obter RNA com a mais alta pureza e qualidade possível, evitando assim uma importante fonte de variabilidade. ● Transcrição reversa: para converter mRNA em cDNA. ● Marcando as sondas: o cDNA é fragmentado e marcado com biotina. Depois, a molécula fluorescente que se liga à biotina é adicionada. Geralmente as moléculas são Cye3 (fluorescência verde) e Cye5 (vermelho). Cada DNA (amostra e controle) é marcado com um fluoróforo diferente, ● Hibridização das sondas: o cDNA com fluoróforo é colocado sobre a lâmina contendo as sondas. O tempo necessário para a hibridação completa é diretamente proporcional à concentração da amostra. No final deste processo, o microarranjo hibridizado é lavado para remover cadeias não ligadas. ● Varredura do microarray: a detecção de luz fluorescente indica que a hibridização ocorreu em um ponto específico para uma sequência específica. A leitura é realizada por um laser e a fluorescência é registrada por varredura. A intensidade da fluorescência é proporcional à quantidade de sonda ligada a cada amostra. As imagens formadas são analisadas em software específico. A intensidade de fluorescência de cada spot é quantificado. Softwares de aquisição precisam identificara a distribuição, formato e intensidade dos spots, distância entre eles, resolução da imagem e background. Figura 6. Passos para a realização de um teste utilizando microarranjo. As lâminas contendo as sondas é adquirida de um fornecedor. Duas amostras são analisadas (por exemplo: células normais e células cancerígenas). O mRNA é extraído e o cDNA produzido a partir de RT-PCR é marcado com fluoróforos (Cye 3 ou Cye 5). As amostras são depositadas sobre a superfície sólida contendo as sondas. Após lavagem, apenas o cDNA que hibridizou nas sondas da lâmina irão permanecer. Um laser é incidido e fluorescência emitida é captada e fotografada. Um software de análise é posteriormente utilizado para determinar a intensidade da fluorescência de cada fluoróforo. Expressed Sequence Tag (EST) Os marcadores de sequência expressa (ESTs) são leituras de sequência curta, tipicamente dentro da faixa de 100 a 700 pb, obtidas a partir de clones de cDNA selecionados aleatoriamente. O conceito foi introduzido pela primeira vez como uma abordagem mais econômica para a rápida descoberta e caracterização de genes expressos.As ESTs são frequentemente geradas por sequenciação de passo único de clones de cDNA de uma (single-end) ou ambas as extremidades (paired-end), geralmente cobrindo apenas uma parte da sequência do transcrito, e são relativamente propensas a erros. Apesar desta última característica, o sequenciamento de ESTs representa uma metodologia mainstream (principal, muito utilizada) para o estudo de genes expressos. Mesmo hoje em dia, quando as sequências do genoma completo estão disponíveis para muitos organismos, as ESTs ainda desempenham um papel importante na identificação de genes, mapeamento de transcritos e descrição da atividade transcricional de um tipo de tecido/célula. Além disso, as ESTs podem representar um corpo de evidências muito importante para a predição de genes e um recurso abundante de marcadores moleculares para o mapeamento físico. Outra aplicação prevista de ESTs é a quantificação da expressão de genes, uma vez que quanto mais uma sequência é lida, mais expresso é aquele gene. Para analisar ESTs, se maneira geral, as seguintes etapas não realizadas (Fig. 7): ● Extração e preparação de RNA: o RNA é extraído das células, tentando obter RNA com a mais alta pureza e qualidade possível, evitando assim uma importante fonte de variabilidade. ● Transcrição reversa: para converter mRNA em cDNA. ● Clonagem: os fragmentos de cDNA obtidos são inseridos em um vetor para realização de clonagem e obtenção de uma biblioteca de cDNA. ● Sequenciamento das extremidades: Uma (single-end) ou ambas (paired-end) as extremidades do cDNA clonado não sequenciados. O Sequenciamento é feito apenas uma vez para cada livro da biblioteca. ● Depósito em bancos de dados: os dados obtidos são processados em computador e depositados em bancos de dados específicos para EST. Figura 7. Passos realizados na obtenção de ESTs. O banco de dados EST do Genbank (dbEST) é um repositório disponível ao público, útil para estudos de descoberta de genes e expressão comparativa de genes. Constitui a divisão EST do Genbank e corresponde à maior fração (48%) das inscrições (fonte: página da Internet do NCBI http://www.nlm.nih.gov/7.4). Em outubro de 2006, o dbEST (release 100606) compreendia mais de 38 milhões de inscrições de mais de 1200 organismos, embora cerca de metade das entradas provenham de apenas oito organismos. Atualmente, o Genbank conta com mais de 74,2 milhões de ESTs no seu banco de dados (Fig. 8). Figura 8. Exemplo de EST obtido ano banco de dados do Genbank. Note, na segunda linha da sequência fasta a região complementar à cauda poli-A do mRNA. Serial Analysis of Gene Expression (SAGE) A análise serial da expressão gênica (SAGE) é uma poderosa abordagem de análise ampla de expressão genômica utilizada para a caracterização de transcriptomas. O método baseia-se em três princípios: (i) tags de sequência curta (10–27 pb) obtidos de uma posição definida do cDNA são suficientes para identificar transcritos de forma exclusiva; (ii) os marcadores podem ser concatemerizados para formar fragmentos de DNA longos (concatêmeros), que podem ser clonados e sequenciados para aumentar a eficiência da análise de transcrito baseada em sequências; e (iii) o nível de expressão de cada transcrito é quantificado pelo número de vezes que uma tag particular é observada. A geração de uma biblioteca SAGE envolve a obtenção de tags de sequência curta a partir de locais específicos de transcritos utilizando uma combinação de enzimas de restrição (ancoragem e marcação). Essas tags podem ser ligadas, clonadas, sequenciadas e exclusivamente mapeadas para transcritos. A abundância de uma tag em uma biblioteca SAGE (isto é, a coleção de todas as tags de uma amostra) reflete o número real de cópias de transcritos dentro da célula. O SAGE tem sido uma abordagem valiosa para a identificação de marcadores diagnósticos e prognósticos, bem como para alvos terapêuticos no câncer. Tem sido usado para caracterizar transcriptomas após a ativação de oncogene (por exemplo, c-MYC36 e ERBB2) ou estimulação hormonal (estrogênio), para o perfil de vários tipos de câncer (incluindo leucemia mielóide aguda, melanoma, carcinoma gástrico, cólon e próstata), para detectar alterações na expressão gênica durante a progressão do câncer de mama, para caracterizar alterações no microambiente tumoral e definir as bases moleculares da quimiorresistência. Os passos gerais para realizar a técnica de SAGE são as seguintes (Fig. 9): ● Extração e preparação de RNA: o RNA é extraído das células, tentando obter RNA com a mais alta pureza e qualidade possível, evitando assim uma importante fonte de variabilidade. ● Transcrição reversa: para converter mRNA em cDNA. ● Clivagem dos frafmentos: os cDNA são ancorados em uma superfície sólida e uma enzima de restrição que corta todas as fitas em um mesmo tamanho é utilizada para formação das tags (pequenos pedaços de DNA). ● Formação dos concatêmeros: As tags são unidas com a ajuda de ligases para formar uma fita grande de DNA, o concatêmero. ● Clonagem: os concatêmeros são inseridos em um vetor e clonados. ● Sequenciamento: os concatêmeros são então sequenciados. ● Processamento dos dados: os resutados de sequenciamento são processados em um software para análise de concatêmeros. O programa separará as sequências das tags, e o padrão de expressão de cada tag poderá ser analisada e comparada com outras amostras. Figura 9. Passos realizados na SAGE. Após isolamento de mRNA e realização de RT-PCR, as fitas de cDNA são cortadas utilizando uma enzima de restrição em pedaços pequenos (tags). As tags são unidas em um concatêmero, sendo este último clonado. O concatêmero é sequenciado e o resultado do sequenciamento inserido em um programa de computador que avaliará quantas vezes a mesma tag apareceu durante o sequenciamento. Quanto mais a mesma tag aparece, mais o gene a qual aquela sequência pertence está sendo expresso. Referências Gruber, A. (2007) Expressed sequence tags. In: Paul Dear. (ed) Bioinformatics: Methods Express. Bloxham Mill, Oxfordshire, UK: Scion Publishing Ltd. Hu, M., & Polyak, K. (2006). Serial analysis of gene expression. Nature Protocols, 1(4), 1743–1760. San Segundo-Val I., Sanz-Lozano C.S. (2016) Introduction to the Gene Expression Analysis. In: Isidoro García M. (eds) Molecular Genetics of Asthma. Methods in Molecular Biology, vol 1434. Humana Press, New York, NY. http://lattes.cnpq.br/8644261025719801 http://lattes.cnpq.br/8644261025719801