Baixe o app para aproveitar ainda mais
Prévia do material em texto
Biotecnologia AULA 2: Sequenciamento de Genoma Profª Natália Faria Romão Bióloga / Mestre em genética e toxicologia Esp. Microbiologia de alimentos e Avançada Doutoranda: Biotecnologia - BIONORTE • 1977 – Técnica de sequenciamento de DNA – Método de Sanger • 1991 – Projeto Genoma Humano • 1995 – Primeiro genoma sequenciado (Haemophylus influenzae) • 2001 – Primeiro rascunho do Genoma Humano • 2003 – Conclusão do sequenciamento do Genoma Humano • 2009 – Mais de 1000 genomas sequenciados Introdução Histórico Introdução • Sequenciamento de DNA: determina a sequência de nucleotídeos (A, T, C e G) em um pedaço de DNA. Métodos 1ª Geração: Método Enzimático ou Sanger (Frederik Sanger – 1977) 2ª Geração: Método Pirosequenciamento (Mostafa Ronaghi – 1996) 3ª Geração: Single Molecule Real Time (SMRT) - DNA Sequencing Introdução Gene MC1R: codifica a proteína receptora do hormônio estimulador de melanócito (MSH) Localização: Cromossomo 16q 24.3, com 3.099 nucleotídeos h tt p s: // w w w .n cb i. n lm .n ih .g o v Métodos para Sequenciamento • Reação de sequenciamento – amplificação linear • Eletroforese em gel de acrilamida – em placa – capilar • Leitura da sequencia – manual – automática Método Enzimático ou Sanger Métodos para Sequenciamento • fragmento de DNA (fita simples) • 1 primer • DNA polimerase • dNTPs • ddNTPs OH H Métodos para Sequenciamento Método Enzimático ou Sanger H H H H H Métodos para Sequenciamento Método Enzimático ou Sanger Métodos para Sequenciamento GCATATGTCAGTCCAG CGTATACAGTCAGGTC 5’ 5’ 3’ 3’ DNA fita dupla CGTATACAGTCAGGTC3’ 5’ DNA fita simples GCAT5’ 3’Iniciador + DNA polimerase + excesso de dATP, dTTP, dGTP, dCTP GCAT A ATGTCA ATGTCAGTCCA ATGTCAGT ATGT AT ATGTCAGTCC ATGTCAGTC ATGTC ATGTCAGTCCAG GCAT GCAT GCAT GCAT GCAT GCAT GCAT GCAT GCAT GCAT GCAT ATGTCAG ATG +ddATP +ddTTP +ddCTP +ddGTP Métodos para Sequenciamento Método Enzimático ou Sanger Anelamento do primer Extensão do primer Terminação da síntese: adição dos ddNTPs Eletroforese em gel de poliacrilamida desnaturante Autorradiografia 32P Métodos para Sequenciamento Método Sanger Métodos para Sequenciamento Eletroforese em gel de poliacrilamida separando fragmentos de DNA com 1 base de diferença Métodos para Sequenciamento Métodos para Sequenciamento Método Sanger 5’ TGGACCGATCGTAAGTCG 3’ PRIMER Precisão de 99,99% Métodos para Sequenciamento Métodos para Sequenciamento Métodos para Sequenciamento Métodos para Sequenciamento Auto-radiogramas de um gel de sequenciamento de DNA Métodos para Sequenciamento Leitura da sequência de DNA G A T C Métodos para Sequenciamento Auto-radiogramas de um gel de sequenciamento de DNA Método Sanger Métodos para Sequenciamento Métodos para Sequenciamento Problemas com Método Sanger • Erros ou não detecção dos primeiros 15-40 pb • Dependente de enzima • Preparação das amostras • PCR kit, primers, passos de purificação, clonagem • Única reação pode sequenciar 300-800 pb • Pouco eficiente para sequenciar genomas Anos 80 – sequenciador semi-automático • Substituição das técnicas de detecção por radioatividade pelo uso de marcadores fluorescentes •Radioisótopos – danosos à saúde, dificuldade de automação •Fluorófos – sistema de detecção que permite a leitura automática das sequências • Preparação do gel e aplicação das amostras • Utilização ddNTPs fluorescentes lidos automaticamente durante a eletroforese • Corantes fluorescentes – reações no mesmo poço no gel Sequenciamento Manual X Automático • Permite a análise simultânea de diversos segmentos de DNA • Utilizado para sequenciamento de larga escala • Nucleotídeos marcados com fluorocromo (quatro corantes diferentes) • Emitem luz em diferentes comprimentos de ondas quando excitados por um laser Sequenciamento Automático Método de Sanger automatizado SEQUENCIADOR • Seqüenciadores de capilares - duas vezes mais rápidos, completamente automatizados • Associação de capilares preenchidos com gel a um sistema de detecção através de fluorescência confocal excitada por laser • Eliminação da montagem da placa e preparação do gel • Aplicação das amostras por eletroinjeção • Alta velocidade e resolução na separação das amostras SEQUENCIAMENTO AUTOMÁTICO Região de qualidade alta • Picos bem definidos e grandes. • Linha de base boa. • Distância entre picos anterior e posterior constante. ANALISANDO O CROMATOGRAMA Região de qualidade média – poucas ambigüidades • Picos razoavelmente bem definidos e de tamanho médio. • Linha de base boa a razoável. • Distância entre picos anterior e posterior razoável. ANALISANDO O CROMATOGRAMA Região de qualidade baixa – baixa confiabilidade • Picos mal definidos e de tamanho pequeno. • Linha de base confusa. • Distância entre picos anterior e posterior inconstante. ANALISANDO O CROMATOGRAMA ANALISANDO O CROMATOGRAMA Métodos para Sequenciamento Método Pirosequenciamento Alternativa ao método Sanger Baseado no princípio de detecção dos raios luminosos emitidos e liberados a partir da síntese do DNA. Enzimas: DNA polimerase ATP sulforilase Luciferase Apirase (APS) Métodos para Sequenciamento Método Pirosequenciamento reage Métodos para Sequenciamento Método Pirosequenciamento Métodos para Sequenciamento Método Pirosequenciamento Métodos para Sequenciamento Método Pirosequenciamento • Polimorfismo de nucleotídeo único (SNP); • Identificação de bactérias; • Tipagem fúngica e viral; • Detectar mutações; • Análises de metilação do DNA; • Sequências múltiplas; • Verificações de clones; • Sequenciamento do genoma humano. Métodos para Sequenciamento Método Pirosequenciamento 1. Automatizada 2. Expediente (1 dia) 3. Alto Rendimento 4. Comprimento das sequências podem ser tão longo quanto > 200pb 5. Ilimitado número de amostras 6. Incorporação simples em protocolos PCR 7. Rápido método com real tempo de leitura altamente adequado para sequenciamento de pequenas faixas de DNA Prós: Métodos para Sequenciamento Método Pirosequenciamento 1. Alto Custo 2. Rápidas leituras para inferência filogenética 3. Pesada bioinformática 4 4. Relativamente alta taxa de erro (0,0098) 5. Longo dNTP único não confiável (linearidade 8 pb) Contras: Métodos para Sequenciamento Método Pirosequenciamento • Trouxe automação • Alto rendimento • Pode ser utilizado um número ilimitado de amostras • Incorporação aos protocolos de PCR • Método em tempo real Lançada em 2004. Métodos para Sequenciamento Método SMRT • Desenvolvido pela Pacific Bioscience (PacBio); • Tempo real Métodos para Sequenciamento Método SMRT • Método de síntese em tempo real; • Single-Molecule, Real Time Technology Sequencing (SMRT®); • Permite a observação em tempo real da síntese de DNA - , precisão superior a 99,999%; • Faixa de leitura superior a qualquer outra tecnologia – leitura de 8000pb de forma rápida e simples. Métodos para Sequenciamento Método SMRT Métodos para Sequenciamento Método SMRT • Automação • Alto rendimento e alta qualidade • Análises rápidas (2h) um genoma completo (bactéria) • Precisão de 99,999% • Alto custo (equipamento)Métodos para Sequenciamento os sequenciadores de nova geração podem ler até bilhões de fragmentos simultaneamente. Sequenciadores da Terceira geração Sequenciamento completo de Genomas Ano Ser 1982 Fago Lambda – 49 mil pb 1995 Haemophilus influenzae – 1,8 milhão de ph 1996 Saccharomyces cerevisiae – 12 milhões de pb 1997 Escherichia coli – 5.5 milhões de pb 1998 Caenorhabdis elegans – 100 milhões de pb 2000 Drosophila melanogaster – 122 milhões de pb 2001 Homo sapiens – 3,3 bilhões de pb 2008 Mammuthus primigenius - > 4 bilhões de pb 2010 Homo neanderthalensis – 4 bilhões de pb 2011 Genômica Pessoal O que fazer com a informação após o sequenciamento? Montar o genoma Efetuar a varredura sequências de nucleotídeos correspondentes a cada um de seus genes ou de outras regiões de interesse Bioinformática O que fazer com a informação após o sequenciamento? • Identificar: – regiões promotoras, – junção dos éxons com os íntrons, – os códons de início e parada da tradução. • São capazes de predizer a sequencia do gene, identificando o conjunto gênico de um organismo após seu sequenciamento. Sítios gênicos conservados. A sequencia de nucleotídeos é numerada começando pela primeira base do códon de iniciação ATG (em roxo). Os éxons estão indicados em vermelho (7 no total) e as regiões entre os éxons são os íntrons (6 no total). Sítios 5’ e 3’ conservados, flanqueando os exóns estão sublinhados em todos os íntrons. Domínios conservados envolvidos na transcrição de eucariotos (ex: TATAA, CAAT e motivos CT) estão em negrito na região 5’ não codificante. Os códons de início e final da tradução estão em roxo. Mapa de bandeamento do cromossomo 6 humano e mapa físico evidenciando posição, identificação e função de alguns genes. Este tipo de mapa nos permite identificar regiões do genoma com maior probabilidade de ocorrer recombinação, construção de linhagens genéticas e descoberta de funções de genes. Variação genética e sua relação com doenças humanas ~99,9% idênticos Deixando ainda com diferenças entre os 3,2 bilhões de pb de nucleotídeos que compõem o genoma. SNPs (Single Nucleotide Polymorphisms) 90% de todas as variações são SNPs, e mais de 1,42 milhões de SNPs já foram identificados durante o PGH. SNPs mais frequentes (frequência alélica mínima de 40%) aparecem a cada 3.280 nucleotídeos do nosso genoma. Alelos raros são mais comuns. Aproximadamente 11 milhões de bases de nosso genoma apresentam um pequeno índice de variação Ocorrem uma vez a cada 290 nt em nosso genoma. A combinação desses SNPs forma os genótipos. Aplicações atuais Identificação de microrganismos Estudo de genes e proteínas codificantes Relação entre seres vivos Detecção de doenças genéticas e epigenéticas Detecção de mutações Verificações de clones Aplicações atuais • Sequenciamento completo do genoma ou WGS (Whole Genomic Sequencing): – um mapa detalhado de mutações pontuais (em regiões codificantes ou não), inserções e deleções, além de informações minuciosas sobre alterações estruturais ou numéricas. • Perfis de genótipos a determinadas patologias. • Viabiliza o diagnóstico precoce de patologias, permite um melhor aconselhamento genético de casais portadores de alelos mutantes. Um caso de sucesso Múltiplas fístulas apareceram no órgão, fazendo com que Nic não conseguisse comer normalmente. Nic Volker (USA), aos 6 anos (2010) - inflamação intestinal desconhecida. + de 100 cirurgias, os médicos não haviam chegado a um diagnóstico. Sequenciamento de regiões onde as proteínas eram codificadas em cada gene do organismo do menino. identificaram uma mutação jamais associada a problemas intestinais. a variante havia sido ligada a distúrbios sanguíneos - curados por meio do transplante de medula óssea. “A equipe médica levantou a possibilidade de um transplante, o que não seria considerado sem um diagnóstico firme” Nic Volker (USA), aos 6 anos - inflamação intestinal desconhecida. Os médicos usaram células- tronco do cordão umbilical de um doador saudável – 2010. O caso, foi o primeiro no mundo no qual o sequenciamento do DNA de um paciente levou ao diagnóstico e ao tratamento. Um caso de sucesso Aplicações atuais Detecção de mutações: • Causadores de grande parte de doenças humanas. • identificar os genes responsáveis por uma doença é o primeiro passo para entender sua fisiopatologia e elaboração de futura intervenção terapêutica. Ex.: Tipos de câncer, microcefalia, diagnóstico de transtornos do neurodesenvolvimento altamente heterogêneos e deficiência intelectual Aplicações atuais Detecção de mutações: Aplicações atuais Diagnóstico pré-natal de aneuploidias: • É realizado apenas em situações específicas. • Apenas em gestações consideradas de risco para tal anormalidade - gestantes de idade avançada. • Aneuploidias dos cromossomos X ou Y e trissomias dos cromossomos 21, 13 e 18 - resultam em síndromes que causam um grande impacto na saúde ou, ocasionam a morte do indivíduo . Permite identificar a origem cromossômica específica. Como fetos portadores de trissomias tem maior quantidade de DNA circulante no plasma materno proveniente do cromossomo adicional, a análise da proporção destes segmentos permite concluir se o feto é normal ou portador de alguma anomalia cromossômica. Aplicações atuais Estudos epigenéticos: • Estudo das mudanças na função dos genes sem que tenham ocorrido mudanças na estrutura do DNA. • Pode detectar pontos onde o DNA se encontra inativo devido à metilação. • Mapear pontos de ligação dos fatores de transcrição e esclarecer sobre mecanismos de regulação epigenética. Estes dados orientam o prognóstico de algumas doenças – como câncer. Aplicações atuais Microrganismos causadores de doenças: • Conhecer a sequencia de DNA dos microrganismos patogênicos: • facilita o diagnóstico • entendimento da patogenia • desenvolvimento de tecnologias preventivas • Evolução dos microrganismos • Biodiversidade de espécies (vírus) Aplicações atuais Neoplasias: • Extensamente utilizado para o diagnóstico de câncer, • Em casos onde o diagnóstico convencional tenha falhado ou para elaborar um diagnóstico molecular de subtipos. • Análises em células tumorais. Foram encontradas uma série de mutações associadas ao desenvolvimento e progressão da neoplasia. Prevenção, com base no conhecimento individual de genótipos de risco Perspectivas Medicina personalizada: • Doenças humanas de causa molecular, é possível o desenvolvimento de testes moleculares ou genéticos que melhor predigam respostas às terapias. Farmacogenômica e Farmacogenética Entender como os fatores genéticos influenciam na resposta a medicamentos. Assim, torna-se possível desenvolver novas terapias e otimizar a utilização das já existentes. Perspectivas sequenciaram todo o genoma de células cancerígenas extraídas de dois pacientes e de tecidos saudáveis extraídos das mesmas pessoas. mutações encontradas apenas nos tecidos tumorais. Foi possível reconstruir a “história biológica” celular e descobrir como, ao longo do tempo, as estruturas vão se modificando até se tornar maléficas. Perspectivas Medicina a distância: • Universidade de Yale (2009): • conseguiram diagnosticar e tratar um bebê a milhares de quilômetros – a criança estava na Turquia. Bebe de 5 meses – Síndrome de Bartter(provoca perda de sal, potássio e água nos rins. sequenciamento total do exoma - parte do genoma que contém os códigos proteicos. Mutação nas duas cópias de um gene conhecido por causar diarreia clórida-congênita (trato gastrointestinal falha ao tentar absorver água e cloretos). Perspectivas Determinar, de um modo mais preciso, riscos como os da exposição a vários tipos de radiações, reagentes mutagênicos e toxinas em geral. Identificação forense Paternidade Melhoramento molecular de plantas - identificar regiões do genoma que contém genes de interesse econômico Novas Fontes de energia Monitores de poluição A limpeza de resíduos tóxicos – sem danos ao ambiente. E se eu quiser sequenciar o meu genoma? • Existem empresas que realizam testes genéticos e os vendem diretamente ao consumidor via internet: Hoje nos EUA, já é possível mapear 42 genes por US$400 ou R$ 1.880,00 Risco de desenvolver doenças do coração, câncer, diabetes, Alzheimer, Parkinson, osteoporose... Quanto custa um sequenciamento no Brasil? http://laboratorio.genoma.ib.usp.br/search Referências • KINGSMORE, S. F.; LANTOS, J. D.; DINWIDDIE, D. L.; MILLER, N. A.; SODEN, S. E.; FARROW, E. G.; SAUNDERS, C. J. Next-generation community genetics for low- and middle-income countries. Genome Medicine. v.4(3), 25–32, 2012. • GLISSEN, C.; HOISCHEN, A.; BRUNNER, H. G.; VELTMAN, J. A. Disease gene identification strategies for exome sequencing. European Journal of Human Genetics. v.20, 490–497, 2012. • MELDRUM, C.; DOYLE, M. A.; TOTHILL,R. W. Next-generation sequencing for cancer diagnosis – a pratical perspective. Clin Biochem. V.32, 177-195, 2011. • KUMAR, S.; NEI, M.; DUDLEY, J. et al. MEGA: a biologist-centric software for evolutionary analysis of DNA and protein sequences. Brief Bioinform, v. 9, p. 299-306, 2008. • SCHALLING, M.; HUDSON, T.J.; BUETOW, K.H.; HOUSMAN, D.E. - Direct detection of novel expanded trinucleotide repeats in the human genome. Nature Genet. V.4, p. 135-9, 1993. • VENTER, J.C.; ADAMS, M.D.; MYERS, E.W. ET AL - The sequence of the human genome. Science. V. 291, p. 1304-51, 2001.
Compartilhar