Buscar

GENÉTICA P2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

GENÉTICA P2
EPIGENÉTICA
O estudo das mudanças na expressão de genes, herdáveis meiótica e mitóticamente, que ocorrem SEM alterações na sequência de DNA. Mecanismos de regulação da epigenética: metilação do DNA e modificação das histonas.
A metilação do DNA (metDNA) é feita no carbono 5’ de regiões específicas: CG é o principal alvo (ilhas CpG). Dois alelos com a mesma sequência diferem no padrão de expressão devido ao estado de metilação: DNA metilado tem expressão gênica silenciada e DNA não metilado tem expressão gênica ativa (nem sempre).
A adição de grupamento metil em algumas citosinas do DNA que normalmente ocorre em ilhas CpG (5’ – CG – 3’) alteram a expressão do gene. 
O metilado é silenciado, porque a metila se liga no promotor, impedindo a ligação da RNA polimerase; mas também pode estar em outras regiões, como nas ORFs, o que dificulta a transcrição e a faz sair errado. No câncer há a ativação do que era para estar silenciado e vice-versa.
	A metilação pode ocorrer nos promotores, nas sequências intergênicas e ‘gene desert’ (região grande sem genes, sem elementos ativos funcionais), em regiões de instabilidade do genoma (transposon – sequências saltadoras, então estarem metiladas é uma proteção) e metilação do corpo gênico (inativação do cromossomo X em fêmeas de mamíferos). Catalisado pelas metiltransferases (DNMT). Para retirar a metilação, pode-se tirar o metil, a base ou o nucleotídeo.
Na formação de gametas, se o animal for macho, o alelo fornecido ao espermatozoide deve ser não metilado (independente de este ser originalmente metilado ou não). Se um alelo materno encontra-se no espermatozoide ele deve estar desmetilado. No imprinting: alelo materno é inativo (metilado) e paterno ativo. Genes imprintados podem ser controlados por um único centro (exemplo: ICR controla Igf 2 e H19). 
Histonas têm carga positiva (arginina, lisina) que interage com a carga negativa dos fosfatos do DNA (tipos: H1, H2A, H2B, H3 e H4). Nucleossomo (partícula cerne): DNA (duas voltas) mais um grupo de oito histonas (H2A, H2B, H3, H4) e H1 = grampo (“prende” pro DNA dar as voltas).
	Fibras muito empacotadas: cromossomo. A eucromatina é menos compacta (tem os genes expressos e sofre as modificações) e a heterocromatina tem os genes reprimidos (muito compacta).
Modificação das caudas de histonas por metilação e acetilação. Acetilação (afrouxa a cromatina, abrindo o DNA) ativa a expressão gênica e metilação reprime a expressão gênica. A cromatina é remodelada, alterando a organização do nucleossomo. Variegação por efeito de posição, na qual a heterocromatina se propaga pelo cromossomo, gerando segmentos de diferentes cores fenotipicamente. 
	RNAsi silencia os genes por metilação: genes alvo recrutam uma RNA polim. IV (NRPD1+ NRPD2) gerando cópia fita simples (ssRNA), ssRNA --> dsRNA (RDR2), dsRNA--> siRNAs 23 nt (DCL3), siRNAs --> AGO4+NRPD1B-NRPD2 (guia DRM2 citosilmetiltransferase) e a metilação estimula produção de ssRNA e reforça silenciamento.
	Exemplo da abelha: geléia real inibe uma DNMT, deixando os genes ativos, o que torna a abelha rainha, quando os genes são reprimidos, portanto, ela se torna operária. Há diferença epigenética entre gêmeos. Com o envelhecimento, a probabilidade de erro aumenta e com isso, a possibilidade de se adquirir um câncer também.
TÉCNICAS BÁSICAS DE BIOLOGIA MOLECULAR
Ferramenta utilizada em engenharia genética (transformação). RNAi: manipulação da expressão gênica. Quando se tem um gene de interesse, a obtenção do DNA genômico é feita por engenharia genética, seguido os passos: lise celular, tratamento do lisado e DNA solúvel. Sendo que a lise celular é feita congelando e macerando (o morango no caso do que foi feito no laboratório), são colocados detergente, proteases e RNAse para retirar os componentes desnecessários, como as membranas e por fim, no DNA solúvel adiciona-se água, etanol e sal para precipitá-lo. 
O DNA precipita, porque ele é polar (devido ao fosfato), a água também e o etanol não muito. Com isso, ocorre uma atração elétrica entre os grupos fosfato e outros íons positivos presentes em solução, causando a formação de pontes iônicas, precipitando o DNA quando adicionado o sal. 
	Após a extração do DNA feita e o gene de interesse obtido, o próximo passo é conseguir várias cópias dele, o que é feito por meio de: obtenção do primer, PCR (reação em cadeia da polimerase) e eletroforese. 
	Lembrando que a replicação é semi-conservativa. A polimerização do DNA é sempre 5’ → 3’ e a síntese de ambos os filamentos deve ocorrer na forquilha de replicação. Há os filamentos contínuos (leading) e fragmentos de Okazaki (filamento lagging). A DNA polimerase AMPLIA uma cadeia, por isso precisa de um primer (cadeia curta de nucleotídeos que se liga ao filamento-molde) e a primase (RNA polimerase) sintetiza um trecho curto de RNA.
O primer são oligonucleotídeos sintetizados com aproximadamente 22 nucleotídeos que servem para a DNA polimerase começar a transcrição do gene de interesse no local adequado, afinal ela não cria uma nova fita, apenas amplia, por isso precisa do começo para continuar. 
	São colocados os chamados primer Foward e Reverse, sendo que o primeiro são os primeiros 22 nucleotídeos do gene de interesse (5’ 3’) e o segundo, é o complementar aos últimos 22 nucleotídeos do gene de interesse (5’ 3’). 
	O PCR amplifica poucas cópias de um pedaço de DNA por meio de ciclos alternados de aquecimento e de resfriamento que causam a desnaturação do DNA e replicação enzimática, por isso a temperatura de melting do primer tem que ser próxima. Nessa reação são colocados: a DNA polimerase termo estável: Taq polimerase (isolada da bactéria Thermus aquaticus), template (gDNA), par de primer, dNTPS: dATP, dTTP, dGTP, dCTP, cofator (MgCl2) e um tampão. 
	Nesses ciclos ocorre respectivamente e repetidamente a desnaturação, seguida de anelamento e extensão. Ou seja, com o aquecimento (94 - 98°C), as fitas duplas de DNA desnaturam (aquecimento faz o papel da helicase) e com o resfriamento de 3 a 5 graus, ocorre o anelamento dos primers ao template de DNA, possibilitando a ligação da DNA polimerase que dá início à polimerização que é feita na temperatura mais adequada para a enzima e a duração também depende dela e do tamanho do gene de interesse. O ciclo se repete aproximadamente 35 vezes em um termociclador. 
	Depois é realizado o gel de eletroforese que é utilizado para confirmar o tamanho do fragmento amplificado, por meio da aplicação de um campo elétrico: DNA (negativo) se move ao polo positivo e sabe-se que pela matriz de agarose moléculas pequenas se movem mais rapidamente que moléculas maiores. Usa-se um marcador para identificar o tamanho dos fragmentos e o brometo de etídeo é o agente intercalante que permite visualização do DNA com luz ultravioleta. 
Quando o interesse está em um RNA, ao invés de estar no DNA, existem algumas diferenças, como a RNA polimerase é capaz de criar nova fita sem a utilização de primer. Devido a todas as diferenças entre RNA e DNA, para o RNA é feito o Real Time PCR que utiliza fluorescência.
Revisão de transcrição: 
A transcrição é quimicamente e enzimaticamente muito similar à replicação do DNA: ambos envolvem enzimas que sintetizam uma nova fita de ácidos nucleico complementar a uma fita template de DNA. Diferenças: a nova fita é de ribonucleotídeos (não de deoxirribonucleotideos), a transcrição é assimétrica (apenas um filamento de DNA do gene é utilizado como molde), RNA polimerase não necessita de primer, o RNA não se mantém pareado com a fita template, a transcrição é menos acurada que a replicação (transcrição: um erro a cada 10.000 e replicação: um erro a cada 10.000.000)*, a replicação copia o genoma inteiro apenas uma vez a cada divisão celular e a transcrição copia seletivamente certas partes do genoma centenas/milhares de cópias (a escolha dos genes não é aleatória, diferentes células → diferentes genes expressos). 
*é mais grave errar na replicação, porque o erro se propaga para as gerações (genoma todo errado), enquanto queo erro na transcrição é pontual (só uma proteína errada). 
Mesma reação em procariotos e eucariotos, mas as bactérias apresentam uma polimerase e os eucariotos três. Etapas da transcrição: iniciação, alongamento e terminação. A iniciação requer: a escolha do promotor (primeira etapa de regulação) complexo promotor/polimerase bolha de transcrição filamentos de DNA se separam localmente e um dos filamentos atua como molde. No cromossomo em geral, ambos os filamentos de DNA são usados como moldes, mas, em qualquer gene, apenas um filamento é usado e, nesse gene, é sempre o mesmo filamento.
Alongamento: sempre na direção 5’ → 3’ (nucleotídeos sempre adicionados na ponta 3’). Transcreve 10 pb, mudanças conformacionais na polimerase, desenovela DNA à frente, re-anela o que já foi transcrito e revisão. Terminação: polimerase para e dissocia-se do RNA, sinais de terminação, sequências específicas e auxiliada por proteínas.
Iniciação em procariotos: reconhecimento do promotor, transcrição sempre começará no sítio iniciador (primeira base a ser transcrita está sempre no mesmo local: +1), promotor é antecedente: DOWNSTREM (-) e genes diferentes têm promotores diferentes, mas como a mesma RNA polimerase reconhece promotores diferentes?
Duas regiões de grande similaridade entre promotores: -10 e -35 e não são idênticas: sequência consenso. Polimerase se liga a essas regiões, desenrola a dupla fita da DNA, começa a transcrição a partir do nucleotídeo +1, região 5’ UTR. Liga em -10 e -35 e separa a fita de DNA em torno de -10 polimerase fortemente ligada sigma se dissocia em vários sigmas diferentes. Complexo ternário estável: fita molde de DNA + polimerase + RNA nascente. 
Alongamento: bolha de transcrição exposição do filamento molde. Término: transcrição continua além da parte codificante de proteína (3’ UTR) e terminação intrínseca dependen de Rô. 
Transcrição em eucariotos: RNA Pol I – genes de rRNA (excluindo o 5S rRNA) RNA Pol II - genes codificantes de proteínas - mRNAs RNA Pol III – tRNA e 5S RNA (porque são muitos genes, existe o DNA não codificante e menor densidade de genes). Processamento do RNA coordenado pela RNA polimerase (porque a tradução e transcrição são separadas espacialmente, o RNA é instável e existem as regiões intrônicas). Mecanismo de regulação da expressão gênica (porque o DNA está organizado em forma de cromatina). 
Iniciação: RNA pol não reconhece sítio promotor sozinha (GTF – fatores gerais de transcrição TFIIA, TFIIB ...). Complexo de pré-iniciação: GTF + cerne da RNA pol II. O primeiro evento na transcrição de eucariotos ocorre no TATA boxe (-30 pb) que atrai outras proteínas. Após a transcrição ter sido iniciada alguns TFs permanecem no promotor atrai outro cerne de RNA pol transcrição simultânea de um único gene. Muitos RNAs podem ser transcritos simultaneamente de um gene. RNA pol se separa dos TFs e começa o alongamento. 
Em procariotos ocorre a tradução simultânea e em eucariotos o processamento (eliminação de íntrons – splicing, cauda poli A adicionada e enzimas de revestimento). Então, 5’ UTR é um pedaço do RNA que não é traduzido (entre o primeiro nucleotídeo e a primeira metionina) e 3’ UTR é a região que não é traduzida por estar após o códon de terminação. A iniciação em procariotos liga ao fator sigma, enquanto em eucariotos, liga a fatores de transcrição.
Preocupação na extração de RNA: degradação por RNAses e enzimas resistentes a vários tratamentos. Utilização de agentes desnaturantes fortes (fenol, sais de guanidina, Trizol...) e a água DEPC (dietilpirocarbonato) é um inibidor de RNAses. A extração de RNA é feita igual a do DNA. Depois da extração, constrói o DNA complementar (cDNA) pelo tratamento com DNAse do RNA (transcriptase reversa + primers).
A vantagem do uso de cDNA é que ele não tem íntrons. A quantificação do cDNA específico de um gene é baseada em fluorescência. Detecção da fluorescência de um composto que se liga entre a fita dupla de DNA (SYBR Green). O sinal de fluorescência aumenta na quantidade direta do produto de PCR. CT: ciclo no qual a fluorescência da amostra ultrapassou o limiar, sendo que quanto menor o CT, mais expresso e vice-versa, porque com o CT maior demora mais ciclos para ter fluorescência detectável, menos amostra inicial, então é menos expresso. 
Real time PCR coloca-se: SYBR green + cDNA + Primer específico para o gene a ser analisado. Gel de RNA: duas bandas de RNAr (90%). SYBR Green fica fluorescente quando está complexado com fita dupla de DNA.
ΔCt = = Ct alvo – Ct controle endógeno (para normalizar em relação ao gene controle). 
ΔΔCt = ΔCt amostra - ΔCt condição controle (normalizar em relação à condição controle).
Quantificação Relativa = 2 –ΔΔCt
1973 – Stanley Cohen, Hebert Boyer trecho de DNA de um plasmídeo em outro = molécula recombinante (‘nova’) E. coli. Tecnologia do DNA recombinante (engenharia genética) é um conjunto de técnicas moleculares para localizar, isolar, alterar e estudar segmentos de DNA. 
Final dos anos 60: enzimas de restrição (endonucleases de restrição): reconhecem e fazem cortes bifilamentares (açúcar-fosfato) em sequências específicas de nucleotídeos (bactérias proteção). Reconhecem sequências 4-8 pb e palindrômicas. 
Portanto, as enzimas de restrição cortam regiões específicas do DNA (bactérias usam como proteção) e existem três tipos, sendo que o segundo que reconhece o sítio e corta. Elas reconhecem pequenas sequências (4-8 bases) palindrômicas, isto é, que tanto de 5’ pra 3’ quanto ao contrário são a mesma sequência (tipo Ana). Quando o DNA é circular possui o mesmo número de sítios e fragmentos, quando é linear tem n sítios e n+1 fragmentos. 
Confere se cortou o que queria por eletroforese ou membrana de nylon e sonda. O DNA após sofrer digestão pelas enzimas de restrição e passar pelo PCR, se torna DNA clonável que é o objetivo. Ou RNA cDNA PCR real time DNA clonável a partir de RNA. Agora o DNA clonável se liga ao vetor, passa pela transformação para enfim chegar ao sequenciamento.
A ligação ao vetor (serve para fazer cromossomo artificial com o gene de interesse, para poder clonar) pode ser feita por ligases ou vetores (amplificam a molécula de DNA várias vezes).
Ligase: enzima que promove a ligação dos fragmentos de DNA previamente clivados por endonucleases de restrição. A DNA ligase requer um grupo OH livre na extremidade 3' de uma das cadeias de DNA e um grupo fosfato na extremidade 5' da outra cadeia. É restabelecida então a ligação fosfodiéster. 
Os vetores podem ser plasmídeos (para genes pequenos), bacteriófagos (mais eficiente e para genes maiores) ou cosmídeos (maior ainda, mistura os dois anteriores). 
Vetores são usados para amplificar uma molécula de DNA para muitas cópias. São estáveis e capazes de se replicar na célula alvo. A maioria dos vetores são plasmídios ou fagos modificados por engenharia genética. Há também cosmídeos, YACs e BACs. Devem conter: uma origem de replicação, sítios únicos de restrição e marcas selecionáveis. 
Bacteriófagos são eficientes, pois 1/3 genoma não é essencial (15kb), 23 kb DNA exógeno e compactação: 40-50kb. Cosmídeos combinam sítio cos do fago λ (empacotamento) e plamídeos; tamanho: até 44 kb + eficiência. YACs: tamanho de 600 kb; se replicam como plasmídeos (descarregados) replicam como cromossomos eucarióticos; contêm um centrômero, dois telômeros, uma origem de replicação de bactéricas e marcas de seleção. BACs: tamanho de 300 kb; BACr = BACs recombinantes fator F; apresentam um conjunto de genes regulatórios, OriS e RepE, os quais controlam a replicação do fator F, e genes parA e parB, que atuam na divisão para as células filhas (estabilidade do plasmídeo/regulação do número de cópias por células) e marcas seleção.
Os vetores de expressão são os YACs (instável, menos comum) e BACs (com bactérias, mais comum, para muitos genes – genoma inteiro). Todos os vetores e técnicas são escolhidos de acordo com seu interesse.
A transformação pode ser feita por choque térmico (a diminuição brusca de temperatura auxilia a entrada)ou eletroporação (o choque desestabiliza a membrana e entra, mais usado). 
Sequenciamento: Allan Maxam e Walter Gilbert, 1977: método baseado na degradação química do DNA e Frederick Sanger e colaboradores, 1978: método didesóxi baseado no alongamento do DNA. 
O de degradação faz por marcação do fragmento com grupo radioativo (P32). E Sanger com bacteriófago. Sanger: o processo é realizado a partir de uma cadeia simples (não dupla) do DNA - servirá de molde para gerar a outra metade complementar da dupla. Estratégia consiste em identificar, continuamente e sequencialmente durante o processo, o último nucleotídeo incorporado na extremidade de alongamento da cadeia.
A incorporação desse análogo bloqueia o posterior crescimento da nova cadeia, pois este não tem a hidroxila 3’ terminal impedindo a formação da ligação fosfodiéster. Quatro de tais conjuntos de fragmentos com término de cadeia (um para cada análogo didesoxi) são então submetidos à eletroforese. A seqüência de bases deste DNA sintetizado é lida no autorradiograma das quatro colunas. Método foi automatizado: detecção por fluorescência, todos os dideoxi são colocados na mesma reação, laser detecta fluorescência e utilização de capilares. 
Genoma humano: 1990: International Human Genome Sequencing Consortium (Francis Collins) 15 anos para a construção. Estratégia: clonagem hierárquica (pública) 1995: Automatização do sequenciamento (Craig Venter Celera e Perkin Elmer Applied Biosystens) 1998: Celera (Craig Venter) Estratégia: Shotgun Genoma completo (patenteado). 2001: Craig Venter (Science) e Francis Collins (Nature).
Gilbert e Sanger: 70’s: 20 bases em dois anos, sequenciamento manual, géis de poliacrilamida e radioisótopos. Sequenciamento automático (gel capilar). 2001: genoma humano pelo Sanger Institute e Celera Genomics. A partir de 2005: tecnologias de segunda geração. 
O sequenciamento é mais preciso do que a eletroforese e é feito pelos dois métodos citados: degradação (trabalhoso) e Sanger (usado até hoje). Acaba o sequenciamento tirando o OH do nucleotídeo, com isso não liga mais nada. O método de Sanger automatizado que possibilitou o sequenciamento do genoma humano.
DIAGNÓSTICOS MOLECULARES
	Análise em DNA: obtenção do material biológico extração do DNA/RNA digestão PCR digestão eletroforese análise (geral).
Detecção de doenças genéticas, por exemplo, predisposição genética à trombose. Causas hereditárias da trombofilia: fator V Leiden, mutação no gene da MTHFR e mutação no gene da protrombina (fator II). 
Fator V de Leiden: transição G -> A na posição 1691 do gene e substituição de arginina por glutamina. Maior fator de risco para trombose venosa e prevalência normal: 2-5% em caucasoides. Mutação C677T no gene da MTHFR: transição C -> T na posição 677 do gene e substituição de alanina por valina. Mutação C677T no gene da MTHFR: maior fator de risco para trombose arterial e prevalência normal de 5-15%. Mutação G20210A no gene da protrombina: transição G -> A na posição 20210 do gene. Mutação G20210A no gene da protrombina: maior fator de risco para trombose venosa e prevalência normal: 2,3% todas as etnias.
Coleta de sangue ou saliva extração do DNA PCR enzima de restrição (digestão) eletroforese (separação dos fragmentos de DNA pelo tamanho). Sendo que para doenças genéticas, extrai apenas DNA humano (β globina) e para doenças infecciosas não precisa ser necessariamente de humano.
Detecção de doenças infecciosas: gonococos e Neisseria gonohoeae. O gonococos ou gonorréia é uma doença infecciosa de origem bacteriana, transmitida por contato sexual (DST) ou perinatal. Pode haver ausência de sintomas até infecções graves como salpingite, causando infertilidade feminina; infecções na uretra e epidídimo. Diagnóstico: exame microscópico observando a coloração de Gram, isolamento por cultura em meio seletivo e amplificação de DNA pela técnica de PCR. 
Coleta de material extração do DNA PCR eletroforese.
Outra doença infecciosa: HPV (Papilomavirus). Prevalência da infecção cervical é principalmente em países subdesenvolvidos; infecções crônicas pelo HPV levam ao desenvolvimento de câncer cervical; a transmissão do HPV ocorre pelo contato sexual, mas também por qualquer contato físico; etc. Existem mais de 150 genótipos (tipos) virais; 40 genótipos são capazes de infectar o epitélio do trato anogenital; 15 genótipos são capazes de provocar câncer cervical; maioria das infecções são transientes e eliminadas pelas células do sistema imune em 6 meses e infecções por HPV de alto risco demoram de 12 a 24 meses para serem eliminadas. 
Tipagem e identificação de microorganismos na produção de etanol: determinação de perfil genético de Saccharomyces cerevisiae. Objetivo: identificar cepas dominantes na amostra de fermentado por comparação com os padrões inoculados (fermentos comerciais ou cepas selvagens já conhecidas) com as colônias isoladas. 
Genética forense (criminalística) e investigação de paternidade: identificação humana por análises em DNA. Para diferenciar uma pessoa da outra, analisamos o número de repetições de uma determinada sequência que essa pessoa apresenta em um locus específico. Por exemplo: analisando os VNTRs ou STRs de um locus X de dois indivíduos A e B identifica-se quantas repetições apresentam e faz uma eletroforese para separar por tamanho.
Casos.
GENÉTICA DE POPULAÇÕES (ou evolutiva)
Cada gene apresenta um alelo comum (selvagem) e um raro (mutante). Alelos mutantes em geral são deletérios ou não funcionais. Alelos mutantes em geral são recessivos. A diversidade é uma parte fundamental do patrimônio genético das espécies. E mutação não é sinônimo de erro. 
Variabilidade genética: aumenta quando há mais variedades de alelos; aumenta quando as diferentes variedades de alelos são todas frequentes. Variabilidade dentro das populações: aumenta quando há vários alelos frequentes em cada população. Variabilidade entre populações: aumenta quando diferentes populações têm diferentes alelos ou alelos em frequências diferentes. E variabilidade total da espécie: aumenta quando quaisquer um dos outros dois componentes aumentam.
Frequência gênica ou alélica é a frequência de cada tipo de alelo do gene na população. Sendo f(alelo) = número de alelos do tipo/número total de alelos. f(alelo) = número de alelos do tipo/2N. N = número de indivíduos na população. 2N porque cada indivíduo tem dois alelos (em espécies diplóides).
Frequência genotípica é a frequência de cada tipo de genótipo na população. Sendo f(alelo) = número de genótipos do tipo/número total de genótipos. f(alelo) = número de genótipos do tipo/N. N = número de indivíduos na população. N porque cada indivíduo só tem um genótipo.
Paternidade: regiões variáveis repetitivas (VTNR): regiões do DNA formadas por várias repetições em
tandem de uma mesma sequência curta de nucleotídeos; são divididos em mini ou microssatélites dependendo do tamanho da unidade de repetição; cada uma destas regiões apresenta diferentes alelos, formados por números diferentes de repetições. Cada alelo de cada região variável tem sua frequência gênica característica. Diferentes alelos podem ser visualizados por eletroforese como bandas de diferentes tamanhos. Exemplo de marcador: sonda D1S7, apresenta 31 bins de diferentes tamanhos, funcionalmente equivalentes a alelos. 
As mutações geram novos alelos. Deriva gênica e a seleção natural alteram as frequências destes alelos em cada população. E as migrações levam alelos de uma população para outra. Mutação é qualquer alteração do material genético que gere uma nova variedade alélica. A mutação é a fonte inicial de toda a diversidade genética de uma espécie. Deriva gênica é a variação ao acaso na frequência populacional de um alelo ao longo do tempo. Seleção natural é a variação na frequência de um alelo devida a capacidade de sobrevivência diferencial que este determina ao indivíduo que o porta. Migração é a movimentação de alelos entre as populações.
Estes fatores promovem alterações ao longo do tempo nas frequências gênicas daspopulações e espécies. Evolução é qualquer mudança na frequência de um alelo ao longo do tempo. Os fatores que causam estas alterações são chamados, portanto de fatores evolutivos.
Deriva gênica é a variação ao acaso nas frequências dos alelos de uma geração para a outra. Equivale, em termos estatísticos, a um erro de amostragem. Portanto é mais efetiva em populações pequenas. É relevante quando: a população é fundada por apenas uns poucos migrante e permanece pequena por um tempo após a fundação (efeito de fundador) ou quando uma população passa por uma diminuição prolongada no seu tamanho (efeito de gargalo/funil). 
Consequências: eventualmente alelos se perdem por acaso, variabilidade genética intrapopulacional diminui, alelos diferentes se fixam em diferentes populações por acaso, variabilidade genética interpopulacional aumenta e após longos períodos de isolamento, pode transformar duas populações em duas novas espécies.
Migração, do ponto de vista da genética de populações, é a movimentação de alelos entre as populações. Não basta que o indivíduo migre. Seus alelos tem que ser incorporados ao patrimônio genético da população que o recebeu. Gametas, grãos de pólen, esporos, gemas e similares também podem resultar em migração. Não é preciso um grande número de migrantes para que a migração seja uma força importante. Ao chegarem à população de destino os alelos se reproduzem.
Consequências: novos alelos são trazidos para a população, variabilidade genética intrapopulacional aumenta, os alelos novos são distribuídos entre as várias populações, variabilidade genética interpopulacional diminui e impede o isolamento entre populações e o surgimento de novas espécies.
A história das migrações de genes nem sempre concorda com a história das migrações das populações. Genes se reproduzem ao serem introduzidos numa população. O resultado desta reprodução depende de outros fatores evolutivos: seleção natural e deriva gênica. Poucos genes introduzidos podem se espalhar rapidamente. 
Seleção natural é a variação na frequência de um alelo devida à capacidade de sobrevivência diferencial que este determina ao indivíduo que o porta. Seleção natural é a única força evolutiva capaz de produzir adaptação. 
Em todo o mundo vírus, bactérias e outros organismos patogênicos apresentam resistência crescente a medicamentos. O uso contínuo destas substâncias está criando organismos resistentes a elas? Não, o que vemos é um processo de seleção natural em andamento. Desde o início já existem indivíduos resistentes a drogas e venenos nas populações. A introdução das drogas e venenos (mudança ambiental) favorece a sobrevivência destes indivíduos e a morte dos demais. A longo prazo (muitas gerações) a forma ambientalmente favorecida deve se tornar mais comum. Nenhuma característica foi criada: a seleção apenas alterou as frequências de características pré-existentes.
	Heterozigotos para a anemia falciforme são resistentes à malária. Onde a malária é endêmica é melhor ser heterozigoto do que homozigoto dominante. Alguns indivíduos com anemia falciforme nascerão (e morrerão) a cada geração. Talassemia pode ter o mesmo papel.
	Doenças “raciais”: Tay-Sachs, característica dos judeus asquenazes, pode estar ligada à resistência à tuberculose. 1:25 dos asquenazes e 1:250 da população são portadores heterozigotos. A fibrose cística (mucoviscidose), comum em europeus, emergiu como uma provável estratégia de resistência à febre tifóide. Alelo CCR5 provê resistência ao HIV. Receptor de membrana sado pelo HIV para se ligar as células do SI. Um dos alelos, mesmo em heterozigozidade, dificulta esta fixação. Comum em europeus, provavelmente se tornou comum durante a peste negra.
	Glicoproteína P provê resistência a xenobióticos. O alelo C mais ativo está presente em 91% dos africanos de Gana e em apenas 51% dos Europeus. Indivíduos CC tem menor concentração plasmática de inibidores de protease usados no tratamento do HIV. Significa que a droga é menos eficiente em africanos? Não, este seria um estimador grosseiro de sua eficiência.
	No geral seria mais correto falar em doenças (caracteres) geográficas do que raciais. Mesmo esta ressalva ainda é limitada, pois ignora as intensas migrações humanas. Altas frequências da fibrose cística, por exemplo, já foram observadas em populações do Oriente Médio e da África. A doença de Tay-Sachs é vista em elevada frequência em canadenses franceses da província de Quebec.
Seleção natural foi o primeiro mecanismo evolutivo proposto. Originalmente proposto por Darwin em 1865, deu origem a uma imediata discussão nos meios científicos e religiosos. Derivações insustentáveis do conceito deram origem a teorias erradas e eticamente inaceitáveis. Darwinismo social: tenta aplicar a ideia de seleção para explicar (e muitas vezes justificar) fenômenos como a desigualdade social e a violência. Eugenia: visa o aprimoramento genético da raça humana. Leis a respeito do assunto existiram em vários países, mesmo após o fim da 2ª guerra.
	Humanos tem uma pequena variabilidade genética. Variação nos haplótipos mitocondriais é de apenas 10% da variação observadas em chipanzés, por exemplo. Maior parte da diversidade genética é intrapopulacional: 85,4% da diversidade alélica observada ocorre dentro das próprias populações; 8,3% entre as populações de uma mesma ‘raça’; apenas 6,3% entre as chamadas ‘raças’. Cuidado: alguns estudos sub-amostram as populações. Há, em média, 0,01% de variação nucleotídica entre duas pessoas.
	A cor da pele é um caráter sujeito a seleção natural. Possíveis explicações: evolução recente da espécie, gargalo populacional recente (talvez durante as eras glaciais mais recentes), africanos tem mais variação nos haplótipos, alguns caracteres são restritos a grupos e alguns grupos humanos são muito fechados.
	Após algum tempo de isolamento, as populações devem divergir geneticamente, estabelecendo alelos e genes próprios. Isolamento geográfico. Caso a evolução destes genes determine uma impossibilidade reprodutiva, as populações passam a serem duas espécies diferentes. Isolamento reprodutivo. Teoricamente o isolamento reprodutivo pode prescindir do isolamento geográfico. Neste caso teríamos uma especiação simpátrica.
	Embora duas novas espécies tenham se formado, seus genes homólogos ainda tem uma ancestralidade em comum. Dois caracteres são homólogos se tem a mesma origem evolutiva. Esta ancestralidade pode ser usada para reconstruir a filogenia. A idéia geral é que quanto mais divergentes forem as sequencias dos homólogos de diferentes espécies, mais tempo se passou desde sua divergência.
	Existe uma ancestralidade comum entre quaisquer duas sequências homólogas. Existe uma ancestralidade comum entre quaisquer duas espécies. A evolução das sequências se dá por divergência. A evolução das espécies se dá por divergência. Os padrões evolutivos não são observáveis, devido principalmente as escalas de tempo nas quais os processos evolutivos operam. Em consequência, o processo de reconstrução filogenética é, necessariamente, um processo de inferência. A filogenia do HIV é estabelecida a partir da sequência completa do vírus. E é uma filogenia, pois não há cruzamentos entre vírus.
Os cromossomos fazem crossing-over na região de homologia, sendo o resto constante (XY). Se tiver mutação na parte constante, ela não vai passar para outra geração, isto é, haplótipo. O efeito do fundador é quando um grupo possui determinada característica rara, mas ela passa a ser comum em outro lugar quando há migração (no geral, as populações minoritárias migram mais). 
A diversidade/variedade (fator de evolução) ocorre por meio de quatro fatores: mutações (mais importante, mas demora muitas gerações), deriva gênica, seleção natural e migrações (efeito do fundador). A evolução é a variação dos alelos ao longo do tempo.
A deriva gênica é importante em populações pequenas (não humanos), porque por meio dela um gene pode ser extinto. Quanto maior a população, maior a variabilidade e se a população é grande, mas a variabilidade ébaixa, provavelmente ocorreu o efeito gargalo. A mutação sinônima muda a base, mas não a proteína; ao contrário da não sinônima que muda a proteína também.
BIOINFORMÁTICA PLANA
	O sequenciamento de DNA, feito de forma aleatória, fornece informações sobre regiões codantes (genes) e promotores, mas gera sequências em regiões inter-gênicas (a princípio sem nenhuma função). E o sequenciamento de mRNA fornece informação direta sobre os genes e também sobre a expressão gênica, mas genes pouco expressos são mais raros de serem sequenciados por essa técnica, com isso a situação ideal para um projeto genoma é sequenciar ambos DNA e mRNA. 
	O sequenciamento de DNA pode ser feito por: shotgun de genoma inteiro, shotgun em pedaços do genoma clonados em BACs, primer walking, enquanto o do RNAm é feito por mRNA oriundos de diferentes tecidos ou condições. 
	O shotgun de genoma inteiro é feito da seguinte forma: quebra o DNA genômico em pedaços aleatórios de ~2000pb (shotgun) clona em vetor sequencia. Depois é feita a reconstrução do DNA original a partir dos fragmentos (clusterização), a partir da sobreposição dos fragmentos. 
 O shotgun em pedaços do genoma clonados em BACs é feito quebrando o DNA genômico em pedaços aleatoriamente desde 50Kpb até 300Kpb clona em BAC’s e sequencia apenas as pontas de cada fragmento quebra em pedaços de 2000pb clona em vetor e sequencia os fragmentos.
O primer walking é feito sempre desenhando o primer de forma que a sequência amplificada tenha sobreposição com a anterior (tipicamente 100 pb de sobreposição). As ESTs (expressed sequence tags – estuda expressão gênica) são feitas: extrai o mRNA de diferentes tecidos/condições síntese de cDNA clona em vetor sequenciamento. 
Tecnologias de sequenciamento: Sanger sequencing (PNAS 74 1977, sequenciador MegaBACE 1Mpb/24 horas e sequências em torno de 500 bp), pirosequenciamento (Science 281 1998, Nature 437 2005, sequenciador 454 150Mpb/24 horas e sequências em torno de 400 bp e 800 bp) e Solexa sequencing (70 Gbp/24 horas e sequências de 150 bp). 
Eletroforese no Sanger sequencing: a diferença de tamanho permite a separação dos grupos de fragmentos, e esta “distribuição normal” da passagem dos fragmentos é representada pelo eletroferograma (ou cromatograma) de cada seqüência (read). 
Cromatograma gerado pelo sequenciador: a identificação dos picos é feita através de uma transformada de fourier do sinal, a nota está ligada com a resolução entre os picos vizinhos e a altura do background. Regiões de alta qualidade possuem: picos bem definidos e grandes, linha de base boa e distância entre picos anterior e posterior constante; ao contrário da baixa qualidade. Sequenciamento produz seqüências da ordem de 500 pb e onde q é a nota phred e P é a probabilidade encontrar uma base errada. Nota de corte phred: igual a 16 para corte processamento em larga escala e igual a 30 quando tem a necessidade de trabalhar com sequências de alta qualidade (exemplo: SNPs - interesse em um nucleotídeo). 
No pirosequenciamento, o adaptador permite que o DNA se ligue em grânulos minúsculos (diâmetro de 28 mm). Apenas um DNA é ligado em cada grânulo: os grânulos são envolvidos em gotas de óleo que contêm todos os reagentes necessários para amplificar o DNA, cada gota contendo o grânulo é mantida isolada para evitar contaminação e consegue produzir 10 milhões de cópias numa reação de pirosequenciamento, um pmol de DNA numa reação de pirosequenciamento produz 1011 moléculas de ATP gerando mais de 109 fótons, num comprimento de onda de 560 nm, e num período de 3-4 segundos. Facilmente detectado por uma câmera de CCD. 
O Sanger depende de clonagem em bactéria (2 semanas de trabalho), 1 milhão de pb em 24 horas, Reads de ~500 bp e 6 meses de sequenciamento, 24 horas por dia, para sequenciar o genoma de um fungo. Enquanto nas novas tecnologias: não há clonagem, 25 milhões de bp em 4 horas (100x mais rápido), reads de ~400 bp e 24 horas para sequenciar o genoma de um fungo. Portanto, é bom usar ambos. 
A identificação da região de vetor é feita através da comparação, via BLAST (bl2seq), da sequência fasta com a sequência do vetor. A sequência do vetor utilizado na clonagem pode ser obtida no site do fabricante/distribuidor. Outra possibilidade é utilizando o banco de sequências de vetores do NCBI (BLASTn). 
Para análises em larga escala o programa cross_match (linux) faz a identificação da região do vetor através da comparação entre as sequências fasta e o banco de vetores mascarando a região do vetor na sequência fasta. Isto é, substitui os nucleotídeos identificados com vetor pela letra X. 
O processamento de sequências ESTs é utilizado na montagem de genomas completos, obtenção de genes completos quando maiores que 500 pb, melhoria da qualidade de uma sequência de interesse e são analisados: padrões de expressões gênicas e SNPs.
Uma forma rápida de agregar alguma informação sobre uma sequência desconhecida é compará-la com um banco de dados de sequências com funções conhecidas. Esta comparação é feita através de alinhamentos par a par entre as sequências. Isto é, se o banco de dados possuir 1000 sequências conhecidas serão realizados 1000 alinhamentos. 
Tipicamente são usados os bancos de dados mundiais (NCBI, EMBL). Atualmente uma busca nesses bancos faz 100,000,000 de alinhamentos. Existem vários programas de alinhamentos com diferentes metodologias, sendo que o mais utilizado é o BLAST.
Essencialmente esses alinhamentos devem tentar indicar uma homologia entre as sequências (ou pelo menos terem uma similaridade estatisticamente significante), identidade = número que indica a quantidade de nucleotídeos alinhados e similaridade = considera a probabilidade do alinhamento ter ocorrido por acaso (e-value). Considera todos os outros possíveis alinhamentos e homologia = dividem a mesma ancestralidade com significado evolutivo. Outras aplicações não biológicas: reconstrução da sequência consensu a partir de sobreposições de fragmentos de sequências (montagens de sequências de DNA), alinhamento entre sequências de mRNAs e DNA genômico, comparação entre proteínas e DNA, construção de mapas físicos, comparação entre genomas, etc.
Nos alinhamentos, a comparação entre sequências de DNA de organismos diferentes é baseada no conceito de que estes organismos originaram-se de um ancestral comum. No contexto de evolução as sequências de DNA sofrem mutações. Estas modificações locais entre os nucleotídeos podem ser: inserções (inserção de uma base ou várias bases na sequência), deleções (deleção de uma base ou mais bases na sequência) e substituições (substituição de uma base por outra). Portanto um programa de alinhamento de sequências biológicas tem que considerar essas mutações. 
Gaps representam as inserções e deleções entre as sequências e o melhor alinhamento entre duas sequências é aquele que maximiza o score. Alinhamento global: útil quando as duas sequências tem tamanhos próximos (exemplo de programa: CLUSTAL), alinhamento local: útil para alinhamento entre sequências de tamanhos diferentes e também para sequências com apenas alguns trechos conservados (exemplo de programa: BLAST E FASTA) e alinhamento semi-global (ou pontas livres): útil para encontrar sobreposições de fragmentos de sequenciamento (exemplo de programa: PHRAP E CAP3). 
Pode ser feito: alinhamento proteína-proteína, nucleotídeo-proteína, proteína-nucleotídeo ou nucleotídeo-nucleotídeo. Matriz de substituição: BLOSUM (BLOcks of amino acid SUbstitution Matrix). A matriz foi construída a partir de alinhamentos múltiplos globais de 504 grupos de proteínas. 
BLAST (Basic Local Alignment Search Tool) utiliza o algoritmo BLAST, tem implementações (NCBI BLAST e WU-BLAST), acesso via web / local (Linux), consulta de seqüências em BDs biológicos (nt ou proteínas), alinhamento – sobreposição de trechos semelhante de duas seqüências (seqs). BLAST traz pontuação e mostra alinhamentos. Similaridade – grau de semelhança de seqs num alinhamento. Homologia – genes com ancestral comum.
Dogma central: DNA (genômica)RNA (transcriptômica) proteínas (proteômica) metabólitos (metabolômica). O problema da genômica é que ela é estável, ou seja, você tem o sequenciamento do DNA, mas não sabe como a célula faz sua regulação gênica (quais genes existem, mas não quais estão ativos e com qual intensidade), isso se dá por meio da transcriptômica, afinal pelo RNA se sabe a regulação gênica, porque quanto mais RNA, mais ativo está o gene que o transcreve (em cada momento). 
O sequenciamento de DNA é aleatório (determina genes e regiões intergênicas) e pelo de RNA se obtém também a expressão gênica. O shotgun do genoma inteiro (bom para bactérias e alguns fungos) tem um limite, afinal não cabe todo o genoma no sequenciador, por isso precisa quebrar aleatoriamente o DNA antes, depois colocar na eletroforese para pegar o tamanho desejado. 
Até 2005 era feito: quebra clone em vetor sequenciamento (consegue a parte que era desconhecida) montagem (reconstrução). O clone em vetor era feito colocando o pedaço desconhecido de interesse no meio de um DNA circular conhecido. Era feito o sequenciamento forward e reverse para conseguir sequenciar tudo. Como a quebra foi aleatória e se quer o genoma inteiro, é necessária a reconstrução (por sobreposição). 
O shotgun com BAC é usado para genomas maiores (humanos e plantas). Também começa com uma quebra aleatória, depois faz a clonagem em BAC (vetor que aguenta fragmentos gigantes), sequencia as pontas (forward e reverse), pega aleatoriamente e sequencia novamente, faz clonagem em vetor para achar o meio que é desconhecido. Sequencia novamente 10%, então conhecendo esses 10% é possível saber as pontas do resto, observa a sobreposição para saber qual é o vizinho e vai sequenciando (não mais aleatório). 
	O GAP de sequenciamento é a região ainda desconhecida, ou seja, conhece uma parte, tem um GAP, conhece outra... Sabe quais são os vizinhos, nessa situação faz um primer walking. Isto é, pega um primer da região conhecida e sequencia o que não conhece, pega outro primer disso, sequencia e assim por diante (sequencia de 800 em 800 pb, técnica boa para pequenos fragmentos). 
	O sequenciamento de RNAm é feito: transforma o RNA em fita dupla (RNAc) clona em vetor sequencia e a montagem é por sobreposição também, mas os contigs (fragmentos montados) não crescem na horizontal. Quanto mais reads em um contig, mais expresso está o gene, com isso sabe-se qual gene está mais expresso em cada situação.
	No PCR do Sanger, além de nucleotídeos “normais”, coloca alguns marcados que quando a polimerase os inserir, ela para e você tem alguns nucleotídeos normais com o último marcado (fragmento que pode ter vários tamanhos). O menor fragmento é quando o marcado é o primeiro nucleotídeo depois do primer e o maior é quando ele é o 800º. Com a eletroforese separa por tamanho. Com isso sequencia base por base e passa pelo cromatograma.
	No pirosequenciamento é colocado um nucleotídeo de cada vez (ou A ou T ou C ou G) e a reação só ocorre se foi colocada a base correta (se colocar A e emitir luz, quer dizer que ligou), começa novo round e assim por diante (se não ligar, os nucleotídeos são degradados). Quanto mais intensa a luz, significa que ligou várias vezes, mas não tem como saber quantas exatamente. 
	Começa quebrando o DNA aleatoriamente também, mas não clona em vetor e sim liga um adaptador nas pontas da parte desconhecida de interesse (a partir de 2005). O adaptador se liga a grânulos e com isso, depois do PCR, obtém-se uma esfera com vários DNAs cópias ligados. Coloca uma esfera em cada pocinho e faz um pirosequenciamento (vê qual pocinho acende). 
	No cromatograma, cada pico representa uma base no caso do Sanger, porém no pirosequenciamento não, porque altos picos significam várias bases, mas só é proporcional até oito (desvantagem). Sanger tem qualidade ruim no começo e no final (então tem que tirar as pontas e o vetor). 
	Depois do sequenciamento pronto, como saber se é um gene, qual proteína codifica, etc. Para isso é feito o alinhamento de sequências com um banco de dados (BLAST mais usado). Com a evolução, os programas precisam ser atualizados, afinal troca uma base, muda um aminoácido. Inserir ou deletar uma base, muda a proteína toda, a não ser que delete três bases seguidas (tira apenas um acc), mas se a mudança for numa região intergênica não tem problema.

Outros materiais