Buscar

RESUMO DE TECNOLOGIA GENETICA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

RESUMO DE TECNOLOGIA GENETICA 
AULA 01: SEQUENCIAMENTO DO DNA
· HISTORICO:
· 1953 –James Watson e Francis Crick com uma ajuda de Rosalind Franklin e Maurice Wilkins desvendaram a estrutura do DNA; (até a metade do anos 50 não se tinha informações de como seria a estrutura física do DNA, sabia-se apenas da sua existência) 
Até que Rosalind Franklin utilizou o raio x para evidenciar a estrutura do DNA e como o raio x tem uma certa penetração em estruturas diferentes, conseguiu- se ver que se formava um padrão no DNA. 
· Estratégias para caracterizar a sequência de proteínas não se aplicava à ácidos nucleicos – bases muito parecidas, o processo era mais difícil;
Só se sabia a estrutura do DNA, mas não a sequência. Até então se tinha métodos químicos para realizar a síntese de proteínas, mas eram mais simples por serem moléculas maiores, tem características físico químicas diferentes, um aminoácido se difere do outro, sendo mais fácil. 
· 1965 – primeira sequência utilizando técnicas químicas – tRNA da Ala (Saccharomyces cerevisiae); 
 - Com a estrutura química das moléculas conseguiu-se sequenciar um gene que não foi codificado por uma proteína, pq queria se fazer de um gene mais conservado possível, utilizando o de uma levedura.
· 1972 – Digestão parcial e fracionamento– primeiro gene (capsídeo do bacteriófago MS2);
 - O primeiro gene proteico foi de um bacteriófago (um vírus parasita uma bactéria)
 - utilizava algumas RNAses especificas. 
· 1975 – sequenciamento “mais e menos” – primeiro genoma (PhiX174);
 - foi codificado o primeiro genoma de um bacteriófago. Ainda não se tinha um método muito fididigno que não pudesse ser aplicado em grande escala. 
· 1977 – Sequenciamento Sanger: metodologia dideoxinucleotídeos;
- Utilizou um método de Sanger para realizar o sequenciamento do DNA, com didesoxinucleotideo 
- não era bem utilizado para sequencias grandes por se tornarem muito custoso, logo não se pensava em usado para codificar o genoma humano devido a demora. 
· 1977 – Sequenciamento Maxam-Gilbert: metodologia química;
- Foi desenvolvido uma metodologia parecida com a de sanguer utilizando também uma metodologia de término de cadeia, mas não era usado nucleotideos, mas sim um tratamento químico. Utilizada basicamente como teste químico. 
· 1981 – Sequenciamento shotgun – genoma do vírus do mosaico em couve-flor;
- Era basicamente a quebra do genoma em diversas partes aleatoriamente. 
- utilidade de um método que foi comemorado. 
- tudo manual. 
· 1986 – Primeiro sequenciador automático (Applied Byosistems);
- Fazia desde conter as reações até passar para o computador após a reação. 
· 1990 – Lançamento do PROJETO GENOMA: 3 bilhões de bases em 15 anos;
· 1996 – Pirossequenciamento – sequenciamento de segunda geração;
- pouco diferente do método de sanger
-envolvia outra metodologia 
· 1996 – primeiro genoma de um eucarioto – Caenorhabditis elegans;
-de um helminto, um genoma pequeno. 
· 2000 – genoma da mosca da fruta (Drosophila melanogaster);
· 2000 – Roche Life Sciences 454 (pirossequenciamento);
- Nova geração de sequenciadores de 2 geração automatizado. Mas faliu em 2014 por falta de equipamentos. 
· 2001 – primeiro draft do genoma humano lançado;
- primeiro rascunho do que era o genoma humano 
· 2003 – Dois anos antes, genoma humano sequenciado.
- dois anos antes do prazo (2005)
· 2006 – Next-generation sequencing pela Illumina Genome Analyzer;
-NGS (sequenciamento de nova geração)
- metodo mais funcional, custo beneficio melhor. 
· 2007 – SOLiD sequencing by Applied Biosystems;
· 2008 – Projeto 1000 Genomas;
-Serviu para fazer o sequenciamento de várias populações. Cada população tem um determinado tipo de particularidade. 
· 2010 – Genoma do Homo neanderthalensis;
- sequenciamento a partir de varias amostras de foceis congelados. 
· 2014 – Illumina HiSeq X com uma eficiência absurda.
-até hoje se mantem bem no mercado. 
· METODOS BASICOS DE SEQUENCIAMENTO DE DNA 
· Sequenciamento de sanguer (ou de termino de cadeia)
· Conceitos
· Metodologia desenvolvida por Frederick Sanger e colaboradores (1977) para desvendar sequências desconhecidas;
· Consiste na incorporação aleatória de didesoxinucleotídeos (ddNTPs) durante a replicação in vitro;
-Controla os tamanhos dos fragmentos utilizando um nucleotídeo especial que possui um açúcar diferenciado (ao invés de desoxinucleotideo, será um didesoxinucleotideo)
· Requerimentos: DNA molde (template 3’-5’), primers, DNA polimerase, desoxinucleotídeos (dNTPs) e ddNTPs (didesoxinucleotideo) 
- Como ocorre: A polimerase vai fazendo o enlogamento da amostra a partir de um primer e ela vai incorporando os desoxinucleotideos e eventualmente ela vai pegar um didesoxinucleotideo. 
OBS: para cada dNTP tem 100 ddNTP.
- Essa técnica faz com que a polimerase pegue um didesoxinucleotideo para realizar a quebra da cadeia, não conseguindo gerar um fragmento maior do que ela ta tentando. 
· Chamado de término de cadeia – ddNTPs não possibilitam a continuação da ligação fosfodiéster fim da cadeia do DNA;
· Os ddNTPs podem ser marcados radioativos ou fluorescentes.
- A síntese do DNA sempre no sentido 5’-3’. 
- o Oxigênio com elétron sobrando vai atacar a hidroxila (OH) 3’ promovendo a saída de uma molécula de água (H2O), formando uma ligação Fosfodiester (no ribonucleotideo)
-No didesoxinucleotideo, não há a hidroxila no carbono 3’, o grupamento fosfato do outro nucleotídeo quando for fazer a ligação não vai conseguir, logo se não tiver a hidroxila naquele local não irá conseguir fazer a ligação Fosfodiester, não tem a liberação de água e assim se tem o fim da cadeia prematuramente. 
- Logo pensaram que se conseguissem gerar fragmentos de tamanhos diferentes, talvez se consiga separar os fragmentos por tamanhos. Para assim conseguir saber que o menor fragmento corresponde a um par de base e o maior fragmento se refere a uma quantidade maior de nucleotideos que o anterior. 
-Para isso essa técnica precisa de uma fita no sentido 3’-5’, sendo necessário uma DNA polimerase, porém ela só trabalha no sentindo 5’-3’. Sendo necessário fornecer para a técnica uma sequência no sentido 5’-3’ para se obter a complementar que é o que se precisa. 
· Início do sequenciamento:
1. Separação das amostras em quatro tubos diferentes – A, T, C e G;
(cada tubo tem 1 didesoxinucleotideo diferente)
2. Precisamos da fita molde no sentido 3’-5’ (para fazer a complementar, utilizando a polimerase);
3. Fragmentos separados dos primers por calor e então revelados no gel de agarose. (tanto por radiografia ou por eletroforese capilar)
As bases se ligam as suas bases complementares: 
A-T
C-G
Logo, a quantidade depende até onde irá haver a ligação das bases.
LEITURA DA RADIOGRAFIA: de baixo para cima.
- A menor banda vai ser a banda mais leve com menor número de nucleotídeo e a maior banda está relacionada com a maior quantidade de nucleotídeo sendo a mais pesada. 
- Método manual e demorado. 
resultado dessa sequência final: TGGCATG
· Interpretação de Eletroferogramas
· Gráficos produzidos para representar o resultado de uma eletroforese capilar – um nucleotídeo por vez;
· Um laser irá incidir sobre as estruturas que geram a cor nos ddNTP, e cada cor absorve luz num espectro específico sendo visto no laser através do comprimento de onda, sendo feito automaticamente gerando os picos. A altura dos picos diz respeito a quantos nucleotideos tem a essa determinada posição. 
- Utilizados para evitar erros na leitura da sequência já que eram anotados na mão.
· MÉTODOS BÁSICOS DE SEQUENCIAMENTO DE DNA
· Sequenciamento de Maxam-Gilbert (ou de “terminação química”)
- Parecido com o de sanger, porem ao invés de haver uma terminação por ddNTP tem um tratamento químico, o encerramento é feito por uma molécula chamada piperidina. 
· Desenvolvido por Allan Maxam e Walter Gilbert em 1977 (até os anos 1980); 
· Utiliza métodos químicos para terminar a cadeia; (tratamento químico com algumas substancias especificas)
· Inicialmente precisa-se de uma marcação radioativa (utilizando umaquinase para adicionar um fosfato radioativo na porção 5’ da amostra); (é feito a marcação no primeiro nucleotídeo que vai mostrar na hora da revelação do gel )
OBS: Diferente do método de Sanger, aqui já se trabalha com a 5’-3’, não sendo necessário passar a sequência 3’-5’ para o sequenciamento 5’-3’. Sendo mais fácil ler o auto radiograma. 
· Tratamento químico compostos que modificarão e cortarão bases aleatoriamente na amostra, gerando fragmentos de tamanhos diferentes;
(molécula piperidina que vai realizar o corte desse nucleotídeo modificado que vai ser incorparado pela DNA polimerase para fora do fragmento)
· Também feito em 4 tubos diferentes.
- Ao invés te ter um tubo para cada nucleotídeo, terá:
1 tubo: purinas
1 tubo: pirimidinas
1 tubo: G
1 tubo: C
- Cada tubo recebe um tratamento diferente:
 * o tubo que vai revelar somente a posição das guaninas ele vai receber um tratamento somente com Dimel sulfato (DMS). Logo, aonde tem o G será jogado fora. 
* o tubo com citocina irá receber um tratamento com Hidrazina + NaCl e vai cortar aonde tiver um C. 
*no tubo com as purinas recebe o tratamento com Acido fórmico, ela atinge as purinas em geral, porém mas com as adeninas do que com as guaninas 
* no tubo com as pirimidinas recebe o tratamento com hidrazina, porem ela atinge mais as timinas e menos na citocina. 
LOGO, SE OBTENDO FRAGMENTOS DE TAMANHOS DIFERENTES SENDO FORMANDO NOS TUBOS ONDE SERÃO LEVADOS PARA A ELETROFORESE E SERÃO REVELADOS NA AUTO RADIOGRAFIA. 
A LEITURA É FEITA DEBAIXO PARA CIMA: A MENOR BANDA CORRESPONDE AO PRIMEIRO NUCLEOTIDEO DA SEQUENCIA E A MAIOR BANDA CORRESPONDE O TAMANHO FINAL DA SEQUÊNCIA INTEIRA. 
 
(quando se tem uma banda fraca e uma forte representa o elemento em comum, pois teve tanta revelação na banda especifica quanto na inespecífica, logo com certeza tenho um T, por exemplo)
· MÉTODOS AVANÇADOS DE SEQUENCIAMENTO DE DNA
- Genome Shotgun e Whole Genome Shotgun (WGS)
SHOTGUN:
· Melhoria no método Sanger; (era o mais viável para genoma pequeno)
· O DNA genomico é quebrado em diferentes partes de tamanhos aleatórios (até 1000bp), então cada fragmento (ou read) é sequenciado por Sanger; 
- essa técnica pode ser utilizada tanto para analisar uma sequencia de um genoma que já tenha sido sequenciado (utilizando como genoma de referencia). 
· A sobreposição de diversas reads proporciona a montagem do contig;
- é como se pegasse vários livros iguais e picotasse eles de forma aleatória em frases curtas. (como ocorre no genoma) , essas partes picotadas são os reads que serão sequenciados. A montagem desses reads ocorre de forma sobreposta até montar um capitulo inteiro que é o contig (uma sequencia grande de nucleotideos). 
· Nenhuma das reads consegue cobrir toda a sequência, mas quatro reads da mesma amostra conseguem se sobrepor e desvendar aquela sequência; -quanto mais amostra (reads) melhor, pois mais fidedigno será aquele sequenciamento.
· Maiores problemas: regiões repetitivas – alta taxa de erros, pois regiões similares podem vir de diferentes regiões;
- é como se tivesse várias palavras iguais e não há como saber aonde ela vai começar e aonde ela vai terminar. Causa problemas quando essas repetições estão ligada a outras sequencias não repetitivas. 
· Para contornar esse problema, precisa-se de uma maior cobertura – sequenciar reads que consigam cobrir proporcionalmente “vários genomas iguais”.
- nada mais é do que utilizar mais sequencias (reads) para garantir que seja mais fácil cobrir a parte daquela sequência
· MONTAGEM DO GENOMA- SHOTGUN:
· Feita utilizando sobreposições das reads que gera os contigs.
· Junção dos contigs gera os scaffold (é o rascunho da montagem, mas não está de fato montada. É como se pegasse os capítulos e montassem de ordem aleatória. )
· Prós: é a melhor escolha se não tiver nada melhor. 
· Contras: muitos gaps na sequência (especialmente em regiões com muitas repetições);
· SOFTWARES EM BIOFORMATICA – SHOTGUN
· Essa montagem não é feita manualmente, mas sim por softwares alinhadores utilizando algoritmos específicos. 
· Phred/Phrap, BWA, Velvet, ...;
· Alinhadores utilizam basicamente Algoritmos específicos para encontrar os melhores alinhamentos locais (gananciosos) entre reads pequenas, ou encontrar melhor alinhamento global (método de grafos);
· Para cada nucleotídeo tem que achar a sequência ideal para aquele nucleotídeo. Para encontrar a máxima global vai ter que correr o alinhador nas mil posições (por exemplo se for sequenciar um genoma de 1000 pares de base) e ele vai encontrar qual posição que aquele nucleotídeo vai tá, fazendo isso para todas as amostras. 
Next-generation DNA sequencing- Pirossequenciamento
· A partir dele já são métodos mais avançados, até então erma sequenciamento de 1º e 2º geração.
· Utiliza a mesma metodologia de preparo mas metodologia diferente de sequenciamento.
· Fosfato que é liberado quando tem o ataque do O2 com o eletron livre da hidroxila do açúcar do DNA liberando o pirofosfato, que é uma região de um nucleotídeo trifosfatario (dois fosfato ligado em cadeia) que vai ser utilizado para geração de ATP e posteriormente utilizado para geração de energia.
· Também conhecido como sequenciamento de alto rendimento (high-througput);
-utliza superfícies de sequenciamentos microscópicos. 
- o pirossequenciamento é feita em superfície (placa de 96 poços) microscopicamente. (cada poço terá uma estrutura)
- vai ter um resultado muito mais eficiente do que o de sanger. 
· Utiliza a produção de luz (a partir de uma enzima luciferase) para aferir o procedimento de sequenciamento; 
- a enzima vai utilizar o pirofosfato que vai ser gerado em ATP, que vai ser utilizado luctiferase fazer a conversão da lucterina. 
- a luz determinar se houve ou não incorporação de um determinado nucleotídeo 
- a leitura é feita pelo computador, que recebe esses sinais luminosos e vai transformando em informação. 
· Síntese da fita complementar, acompanhando a adição de cada base de cada vez;
· Extremidade –OH + dNTP PPi (pirofosfato) ATP luciferina + O2 luz (detectável por um sensor);
· Chemist mumble-jumble.
· Na preparação para o pirossequenciamento tem que fazer a quebra do DNA genomico e são adicionados algumas sequencias chamadas de adaptadores. 
Next-generation DNA sequencing- Ion Torrent sequencing
· Principalmente o Ion torrente: Utiliza bid (como se fosse uma bola com várias sequencias – pequenos oligonucleotideos ligados e no meio dela tem ligado pequenas sequências.) Na preparação para o pirossequenciamento tem que fazer a quebra do DNA genomico e são adicionados algumas sequencias (conhecidas ) chamadas de adaptadores. Os adaptadores irão se ligar as regiões que estão nas Bids, vai ser colocado a amostra em cada micropoço e as amotras irão ligar a cada uma das sequencias e são complementares aos adaptadores que estão ligadas a sequencia e a polimerase irá conseguir fazer o alongamento do paciente. Isso irá ocorrer bilhões de vezes por rodada gerando a incorporação de um nucleotídeo na sequência irá gerar uma sequencia de luz em um padrão diferente, o computador consegue reconhecer esses padrões diferentes
· Utiliza variação de PH. 
· Sequenciamento por liberação de prótons (H+) toda vez que um nucleotídeo é adicionado à cadeia;
· Ataque nucleofílico do grupamento –OH da extremidade 3’ no dNTP, liberando um PPi e H+.
- ele vai ver que houve a incorporação de um nucleotídeo a cadeia devido o ataque do O2 a hidroxila liberando uma H2O que depois vai se dissociar se transformando em H+, onde esse H+ (próton) irá baixar o PH da solução. 
· DNA genômico é fragmentado adição de sequências adaptadoras ligação da amostra fragmentada à beads (que possuem sequências complementares às sequências adaptadoras;
- quando jogar a amostra no microchip ela vai se ligar aos adaptadores e a Polimerase conseguira fazer o sequenciamento do fragmento. 
· Beads ligadas à um microchip (placa semicondutora);
· Cada microchip é dividido em bilhões de subunidades funcionais;
· O processo de sequenciamento é feitonucleotídeo a nucleotídeo;
· É relativamente demorado, porém se tem um rendimento muito alto. 
· Abaixo do chip temos um sensor, que detecta a mudança de pH. (e ver que houve a incorporação de nucleotídeo.)
Next-generation DNA sequencing- Illumina sequencing
· É o padrão ouro (mais utilizado)
· Equipamento e reagentes caros. 
· Tecnologia mais famosa e acessível nos dias atuais;
· Método de amplificação por formação de pontes; (por síntese que também libera luz, onde cada nucleotídeo será marcado com uma cor específica e será lido no computador)
· Uso do shotgun para fragmentação; adição de adaptadores (5’ e 3’) e preparação da amostra, etc.;
- os adaptadores serão colocados nas duas porções diferentes das outras técnicas que só coloca na 5’. Fazendo com que a síntese ocorra nos 2 sentidos. Isso vai minimizar a quantidade de ambigdade na sequência (regiões repetitivas). 
· Não usa microchips, usa lâminas de sílica;
- nessas lâminas tem canais
· Quando o DNA da amostra se liga num oligo (lâmina), o adaptador da outra ponta se curva (ponte) e liga numa outra sequência complementar DNA polimerase faz a amplificação da amostra;
-Na lâmina de vidro vai ter um oligonucleotideos que é uma região complementar a região adaptador que foi ligada na amostra depois de fragmentada. E quando se adiciona a amostra nesta lâmina, no primeiro momento os adaptadores 5’ e 3’ estão bloqueados e depois vai ligar os adaptadores 3’ e 5’ e vai ocorrer a síntese no sentido. 
Quando os fragmentos se ligam, o próprio peso dele e atração elétrica pelos outros fragmentos faz com que ele se dobre fazendo com que ele se ligue aos fragmentos complementar a outra extremidade. esses fragmentos formam pontes que irão ocorrer simultaneamente tendo um grande volume de sequências sendo sintetizadas ao mesmo tempo. (basicamente sem nenhum esforço se obtém uma sequência dobrada. 
· Processo repetido várias vezes. Ao final, as sequências 3’-5’ são degradadas/lavadas, permanecendo apenas as 5’-3’ (depois é feito na direção reversa*);
· Alinhamento ao genoma de referência para montagem.
- ocorre em 4 etapas:
· Preparação 
· Formação- adição da amostra na lâmina 
· Síntese- sequenciamento 
· Análise 
OBS: cada adaptador tem que ser regiões especificas. 
OBS: a lâmina possui vários canais. Possui os oligo que são complementares aos adaptadores tanto 5’-3’ como 3’-5’. 
Os adaptadores se ligam aos oligo, a polimerase irá formar um fragmento igual, amplifica. Será desnaturado e depois é feita uma amplificação por clonagem que é onde forma as pontes. Tendo 2 copiais a partir de 1 só sem ela sair do lugar, e isso vai acontecer por toda a lâmina. 
Após se ter os fragmentos amplificados, será feito o sequenciamento deles. Fazendo a síntese das fitas em cada sentido de uma vez de forma a incorporar nucleotideos específicos.
será expresso através de fragmentos diferentes, sendo sintetizados com tamanho diferente. 
AULA 02: LINUX PARA BIOINFORMATICA, MANIPULAÇÃO DE SEQUENCIAS E BANCOS DE DADOS BIOLOGICOS
· BIOINFORMATICA:
· Envolve vários campos do conhecimento diferente.
· É uma área multidisciplinar que envolve a utilização de ferramentas computacionais para resolver problemas biológicos. 
· Surgiu com o intuito de resolver problemas. Devido a quantidade de dados que surgiram foi necessário a utilização de computadores para automatizar esse trabalho, pois eram feitos manualmente onde a probabilidade de erro era muito grande. 
· Utilização de computação para analisar dados biológicos. 
· Quando houve o surgimento dos primeiros sequenciadores automáticos para realizar a leitura da radiograma direto e já transformava toda a parafernália em um arquivo contendo toda a sequência. Também utilizado para fazer sequencias proteicas.
· Sequenciamentos, transcriptoma, cristais de proteínas, alinhamentos de genes, variantes genéticas. 
· Utilizado principalmente em sequenciamento. 
· Estuda para tentar desvendar o máximo possível.
· Conhecer os genomas dos microrganismos de bactérias, vírus, helmintos, protozoários... serve para saber como lidar com eles, sobre infecções, Identificar genes que são essenciais para sobrevivência de um determinado organismo e para assim criar uma substâncias que vai silenciar ele e o microrganismo não poderá mais se desenvolver. 
· Quando se fala em organismo vivo está realizando o Estudo in vivo do organismo vivo. Quando se fala em estudo in vitro está utilizando cultura de células ou qualquer outro meio par avaliar a resposta de células procarióticas ou eucarióticas a uma determinada perturbação mas fora do seu habitat natural. 
· INCILICO= todo procedimento feito no computador. 
· Além de sequenciamentos gênicos e proteicos, é importante saber tratar com transcriptoma (conjunto de transcritos, ex: RNA mensageiro. Ele vai da informações precisas sobre como tá o perfil de transcrição dos genes que estão sendo expressos frente a uma determinada condição. Consegue verificar diferenças em diferentes populações como de pacientes com câncer e de indivíduos saudáveis visualizando genes que são expressos nos pacientes com câncer e que não estão expressos em paciente normal.
Conhecendo os transcriptomas se conhece genes específicos e tratar algumas doenças.
· Cristais de proteínas: a cristalografia serve para identificar a estrutura tridimensional de uma proteína e entender como ele interage com as outras coisas a sua volta. Essa técnica congela Uma proteína em um determinado meio e essas proteínas são bombardeados com raio x, podendo saber a posição de cada átomo, saber de cada aminoácido e no final podendo formar estruturas tridimensionais de proteínas. 
- Consegue-se testar moléculas para fazer fármacos. 
- entender como acontece infecção viral. 
· Variantes genéticas servem para estudar diferentes populações. Além de estudo para câncer. 
· Surgiu como influência da era do sequenciamento de proteínas/genes -> comparação entre sequencias passou a se tornar impraticável manualmente.
· O profissional da bioinformática trabalha para resolver problemas. 
· Tornou-se o custo mais viável para sequenciar qualquer coisa. 
· “Escrevi um livro e vendi, mas as pessoas não sabem ler!
- muita informação e não sabiam interpretar. Então os bioinformatas servem para ler e interpreta-los. 
· Bioinformaticians, a.k.a., UNICORNS; (unicórnio por serem raros e por tem que ter conhecimento nas 3 grandes áreas: biologia, ciências da computação (ajuda no desenvolvimento de ferramentas e melhoria delas) e estatísticas
· Data Science. (ciência de dados) 
- muito utilizado para avaliar risco. 
-banco jovem para avaliar dados. 
· Bioinformática – No Brasil
· 1999 – Sequenciamento da Xylella fastidiosa (primeiro genoma de bactéria sequenciado) – João Meidanis e João Carlos Setubal (UNICAMP);
· Aqui, a área arrastou-se a passos de tartaruga, com pouca visibilidade;
· Alguns polos no país: UFRJ, UFMG, UFPA, UFRGS e UFRN;
· Um dos centros mais promissores na área, com pesquisadores de altíssimo nível (Sidarta Ribeiro, Sandro Souza, etc);
· BioME – Bioinformatics Multidisciplinary Environment (ambiente multidisciplinar de bioinformática): oferecimento de serviços, pós-graduação e treinamentos.
· Por que bioinformática é um campo pra mim?
· Mão-de-obra escassa, trabalho abundante;
- Muitos dados para analisar com poucos bioinformatas. 
· Utilização de ferramentas e desenvolvimento de ferramentas;
· Era do Big Data: muitos dados e pouca gente pra analisar;
· Laboratórios de testes genéticos contratam muitos bioinformatas 🤑🤑🤑;
· É preciso dedicação e trabalho duro, mas não é impossível.
 
(Vagas de emprego, pois são unicórnios e eles não existem)
	
· O que um bioinformata usa?
· Sistemas operacionais baseados em Linux
· Linux não é um sistema operacional, mas um kernel (“coração do sistema”) arquitetura; 
- Diferente do Windows. São sistemas fechados. já no sistema Linux você consegue entrar no corpo dele e modificar como você quiser, tendo uma quantidade de usuários muito grande. 
-Os pacotes Linuxsão atualizados frequentemente que são preventivas, porém é diferente do Windows que suas atualizações são corretivas, corrigindo falhas de segurança. (sendo muito vulnerável)
· Sistemas Linux são apresentados a usuários finais como distribuições, onde uma empresa fabrica seu próprio sistema a partir do kernel, destinando a cada tipo de usuário;
 *Diferentes interfaces de usuário.
· Existem vários tipos de distribuição, cada uma baseada no tipo de distribuição de pacotes; (esses pacotes são tipos de empacotamentos de arquivos e cada tipo de distribuição vai ter um tipo de pacote diferente e isso atrapalha um pouco em pacotes intercambiáveis)
 -Ubuntu, Fedora, Arch Linux, Gentoo, Slackware, Linux Mint, Elementary, ... 
- o sistema Linux se torna mais seguro. 
· “Professor, posso usar Windows?”
 - para trabalhar não. 
 - o Linux é mais fácil de usar.
Motivos para usar o LINUX:
- as ferramentas da bioinformatica são feitas para serem usadas no sistema linux. Onde essas ferramentas são desenvolvidas em codigo aberto.
- é mais seguro. Pois conseguem se atualizar a cada momento.
· Linux na bioinformática
· Normalmente não é possível realizar grandes tarefas em computadores domésticos (até os “PC gamer” da vida);
· Tarefas robustas configurações robustas;
· Solução: utilização de supercomputadores ou servidores;
· Exemplos: Santos Dumont (LNCC/UFRJ), NPAD (IMD/UFRN), ...
- Encontrados em centros de pesquisas
· Normalmente estes computadores não apresentam interface gráfica (uma janelinha com os ícones bonitinhos pra você clicar); (não utiliza o mouse)
· LINHA DE COMANDO!!
· Bancos de dados biológicos
· São estruturas que servem para armazenar dados. 
· “Bancos de dados” (que são um pouco diferentes dos DBs na área tecnológica) são utilizados para armazenar, catalogar e hierarquizar informações acerca de alguma coisa; 
- o banco de dados serve para nos dá informações. 
· Essa coisa pode ser: nucleotídeos, proteínas, ontologias, relações etc.;
- saber se tem alguma patologia associado a ele, se está presente em mais de um organismo etc. 
· Diversos exemplos disponíveis com dados públicos para acessarmos quando e onde quisermos.
· Basic Local Alignment Search Tool – BLAST
É uma ferramenta de busca de alinhamentos locais.
· Alinhamentos de sequências
· Serve para comparar duas (pairwise) ou mais (multiple sequence alignment) sequências entre si; (alinha as duas sequencias)
· Pode ser: Alinhamentos globais ou locais;
· Serve para: Identificação de sequências desconhecidas, identificação de domínios conservados, estabelecimento de relações de ortologia (experimentos em camundongos, animais e com isso inferir resultados para os humanos.)
· Contra o banco de dados inteiro ou contra um banco de dados local; (BLAST)
· Alinhamentos globais
· Comparam as sequências por inteiro. Normalmente é utilizado para comparar duas sequências do mesmo tamanho;
- foi colocado uma serie de intervalos (GAPS) com o intuito de complementar a sequência para que ela fique do mesmo tamanho da outra. (como se fosse um espaço em branco em meio a sequencia)
- traços entre as sequencias é chamado de identidade (match)
- quando se tem o ponto é um mismatch que significa um erro. (mantem devido a sequencia posterior, pode ser uma variante genética)
- é pouco utilizado para conseguir ter a identificação de domínios conservados. 
· Alinhamentos locais
· Comparam as sequências por partes. Normalmente é utilizado para identificação de regiões conservadas na sequência e/ou quando não se tem certeza de sua origem.
- quebra o alinhamento em vários pedaços e vai alinhar o que for mais favorável. 
COMO IDENTIFICAR UMA SEQUÊNCIA QUALQUER:
- utiliza o BLAST para descobrir essa sequência. Que é uma ferramenta de alinhamentos locais que comparam uma sequência que vc quer descobrir, onde ela é contra um banco de dados inteiro ou contra partes do banco de dados. Tentando achar uma identidade entre elas. 
-
RECAPITULANDO:
· O que é bioinformática? Para que é utilizada?
- é uma área do conhecimento multidisciplinar que necessita de conhecimentos da biologia, ciências da computação, estatística. utilizada para diversos fins principalmente para analisar dados que são gerados do sequenciamento etc. Servindo para economizar tempo e dinheiro. 
· Por que usar sistemas GNU/Linux ou Mac OS para bioinformática é bem melhor que usar um sistema Windows?
- porque são sistemas que possui melhor suporte, a linguagem de programação, ferramentas funcionam melhor, possui as linhas de comando, consegue fazer acessos remotos de forma rápida, utilizar supercomputadores. 
· O que são bancos de dados biológicos? Qual sua função?
- são repositórios onde se armazena, catalogar e deixar o conhecimento para acesso de informações mais rápida.
· Quais as diferenças entre alinhamentos
- alinhamento global: serve para comparar duas sequencias do mesmo tamanho e se a sequência for menor se faz um aumento da sequência para que ela possa caber na outra. 
-alinhamento local: alinha os blocos mais favoráveis ajudando na identificação de domínios e diversas estruturas de genes. 
· O que é o BLAST? Já BLASTOU hoje?
- é uma ferramenta de alinhamentos locais que basicamente se utiliza para identificar sequencias que não se sabe, identificar domínios conservados, identificar sequencias desconhecidas e também para fazer comparação entre sequencias de espécies diferentes.
1. Você sabe usar o PubMed pra pesquisar artigos?
- é um repositório oficial de literatura cientifica. 
- pode ser usado para pesquisa de sequencias, como sequencias nucleotídicas.
2. Você consegue achar qualquer sequência, salvar no seu computador em formato .fasta e depois mexer com ela?
OBS: no Windows não vai abrir
3. Você consegue realizar um BLAST? Sabe ler os resultados? Extrair algum significado?
------------------------------------------------------------//------------------------------------
AULA 03: EDIÇÃO DE GENOMA: CRISPR/CAS 9
HISTORICO:
· Yoshizumi Ishino (1987) et alia em Osaka investigavam o genoma da bactéria Escherichia coli;
- Foi feito com shougtan (métodos mais avançados)
· Identificação de estruturas esquisitas: sequências repetidas e logo após sequências espaçadoras intercaladas;
- era uma padrão porem ninguém sabia sua função.
-sempre seguia o padrão de seq. Repetidas- sequencia espaçadora- seq. Repetida. 
· Função: só Jesus sabe.
· Anos mais tarde (ano 2000): identificadas estas estruturas bisonhas em outras bactérias e também em Archea;
- encontram também em S. aureus. E archea que são semelhantes as bactérias, são organismos parecidos porem possui muitas semelhantes com eucariotos primitivos.
- as Archeas não são tão velhas quanto as bactérias. Tem um interesse econômico e cientico, pois são organismo extermofilos (que vivem em fontes termais próximas a vacuões, sobre alta pressão, com alta salinidade).
· 2002: Clustered Regularly Interspaced Short Palindromic Repeats; 
- 1 ano após o genoma humano 
- essas estruturas no genoma das bactérias foram batizadas de : CRISp
· Ou, em português, Repetições palindrômicas curtas agrupadas e interespaçadas regularmente. (é o CRISP)
 - tanto no 5’ como no 3’ é basicamente a mesma sequência. 
-agrupadas por sempre estar juntas no mesmo locus.
- as sequencias que dividem esses espaçadoras são regulares. 
· 2005: sequências de origem extracromossômica (plasmidial ou viral);
- viram que aquelas sequencias protoespaçadores não tinham origem bacteriana, mas sim sequencias plasmidais ou virais, ou seja, de outras espécies. E começaram a se perguntar o pq. 
· Identificação de genes fisicamente próximos ao locus CRISPR: cas (CRISPR associated genes); 
- o cas tem a função nuclease, ou seja, que rompe ligação Fosfodiester(ligação entre nucleotideos).
· Função: nuclease. (enzima que rompe ligação Fosfodiester)
· 2006: postula-se que CRISPR/Cas é um sistema de defesa em bactérias e arqueias contra bacteriófagos;
 (um sistema de defesa contra bacteriófagos -vírus que infectam bactérias. As bactériasque sobrevivem quando infectadas pelo virus incorporam partes do material genético viral para usar como mecanismo de defesa)
· Usa moldes de RNA para identificar uma “assinatura de invasão”;
- todos os protoespaçados que a bactéria tem no seu genoma é a assinatura de invasão por bacteriófagos. 
· Validação: evidência em Streptococcus thermophilus “imunização” de bactérias produtoras de laticínios contra bacteriófagos;
- viram que dava certo utilizar isso na indústria. 
O bacteriófago (vírus) injeta seu material genético na célula bacteriana, as proteínas Cas (Cas1 e Cas2) tem uma atividade nuclease e reconhece. Quando a bactéria sobrevive ao bacteriófago essas proteínas Cas cortam um pedaço do genoma viral e incorporam na própria bactéria. Onde esses pedaços cortados são chamados de protoespaçadores, que são separados por outros protoespaçadores que são sequencias repetitivas curtas e interpassadas regularmente. 
COMO FUNCIONA – CRISPR/Cap 9
 Função biológica do CRISPR/Cas9
· Como mencionado anteriormente, é um mecanismo de defesa;
· Ocorre em três etapas distintas: i) adaptação (aquisição de novos protoespaçadores-> é a primeira infecção por bacteriófago na vida da bactéria.) ; ii) biogênese (ou transcrição do CRISP, do genoma bacteriano para identificação) e iii) ação contra o invasor; (após a identificação do invasor como ela vai se livrar do invasor)
· FASE I- ADAPTAÇÃO
Aquisição de novos protoespaçadores
· Um novo protoespaçador é integrado ao genoma bacteriano, mais especificamente no CRISPR locus – relacionado a uma primeira infecção ou por uma segunda infecção só que por outro bacteriófago;
· Cas1 e Cas2 – clivam o DNA patogênico em pequenos oligos (pedaços) (24 a 48 bp); e vão inserir no genoma da bacteria
· Nucleases inespecíficas – poderia atuar sobre qualquer seqüência protoespaçadora presente no genoma viral
- as nucleases não necessariamente são inespecífica é necessário como se fosse um sitio de restrição. Elas clivam qualquer sequência. 
- cada enzima Cas tem um motivo específico que elas resconhecem. 
· Integração (Cas1 e Cas2) – o novo fragmento é inserido no genoma;
- vai ocorrer a introdução do pequeno pedaço viral que foi clivado pelas Cas e vão ser introduzidos dentro no CRISPR locus bacteriano. 
Ou seja, elas(CAS) clivam e colocam o pedaço de DNA no genoma bacteriano e sintetizam uma nova repetição para separar do próximo protoespaçador. (logo depois que coloca o protoespaçador lá que vai sintetizar uma nova repetição para separar do próximo protoespaçador que vai ser integralizado ao genoma)
· Repetições novas (CRISPR) são sintetizadas e separam um protoespaçador de outro;
· Manutenção da estrutura do locus: “REPEAT-SPACER-REPEAT”
- locus tem uma estrutura específica: repetição- protoespaçador – repetição.
- vai ter uma repetição constante para todos os protoespaçadores 
- vai ter um protoespaçador que é diferente de acordo com o vírus. 
- não tem limite de quantos protoespaçadores pode ter no genoma bacteriano. 
· Como a bactéria diferencia o DNA invasor do próprio DNA?
 - devido ao Motivo Adjacente ao Protoespaçador (PAM) (sequência muito pequena( 3 a 4 pares de base) que ela é sintetizada pelos vírus e elas ficam muito próximas ao espaçador. Então sempre que a Cas vai realizar o corte ela identifica também um motivo adjacente ao protoespaçador. Então no espaçador que é colocado na bactéria não tem essa sequência, mas de onde a Cas tirou apresenta essa sequência no genoma viral. 
 - não tem no genoma bacteriano apenas no genoma viral. 
- quando a Cas estão procurando esse protoespaçador, essa sequencia complementar ao protoespaçador. Elas procuram primeiro o PAM (motivo adjacente ao protoespaçador), quando ela acha, ela procura próximo acima ou abaixo se existe uma sequência que seja complementar ao protoespaçador que existe na bactéria, se sim destrói-se o DNA viral, se não tiver ela vai procurar outra sequência complementar ao protoespaçador até achar. 
Ou seja, a Cas irá procurar no virus uma sequencia ela saberá que próximo tem uma sequencia pequena (de 2 a 3 pares de base) que não tem na bactéria. EX: ATT
 Então quando tiver uma infecção viral ela vai procurar o motivo, pra ver se existe a sequencia, se existir ela corta o genoma e continuara vasculhando o genoma procurando por essa sequencia. E se não achar e a bactéria conseguir sobreviver ótimo.
· Cada domínio PAM pode ter a sequência variável de acordo com o tipo de sistema CRISPR, sugerindo que proteínas Cas presentes nos distintos tipos de CRISPR estejam envolvidas no reconhecimento do domínio PAM.
- cada cas vai ser associada a um domínio PAM diferente. Onde esse tipo de adequação de vários tipos de domínio é o que faz ter tipos de sistema Cas diferente. 
Fase II – Biogênese
 Transcrição do locus CRISPR
- Depois que já houve a aquisição de novos protoespaçadores, a bacteria depois de ter sido infectada adiquiriu o seu poder contra os virus. E isso vai ficar no genoma bacteriano e ela precisa transcrever. 
- como ocorre a identificação e a transcrição dos vírus que vai definir o tipo de sistema CRISPR.
· Nessa etapa ocorre a formação do crRNA – CRISPR derived RNA;
- o genoma bacteriano vai ser transcrito e a transcrição bacteriana é feita de forma ininterrupta, ou seja, O RNA será transcrito por inteiro e depois é clivado em porções especificas formando proteínas especificas. É um sistema policistronico, chamado de mensagem policistronica. 
· Sistema policistrônico – transcrição ininterrupta;
· Processo mediado pela sequência líder (L) – alta concentração de AT: sítio promotor; 
Como a bacteria sabe qual foi o primeiro CRISP locus, o primeiro protoespaçador?
 O locus do CRISP tem uma sequência líder que é uma região que possui alta concentração de AT, que é uma região promotora. Então guiada por essa sequência líder as bactérias transcricionais vão saber que ali é um CRISP locus.
· Transcrição do locus CRISPR –gera o precursor do RNA de CRISPR (pré-crRNA) – várias repetições e vários espaçadores em um único RNA;
- transcreve todos os protoespaçadores juntamente com suas repetições em uma única molécula de RNA. A partir daqui que vai iniciar as diferenças entre os tipos de sistemas CRISP. 
- Depois faz o pré-crRNA. 
· Processamento do pré-crRNA transformados em RNAs menores (crRNAs), cada um correspondente a um protoespaçador distinto;
· Divididos em três sistemas: I, II e III. A diferença entre eles é a basicamente a organização do operon.
- operon é um mecanismo de regulação da transcrição genica em bactérias. É como os elementos da transcrição vão se organizar para fazer a transcrição e fazer o corte para gerar as proteínas funcionais.
Os RNA que vão gerar essas proteínas funcionais.
Basicamente é a organização de como vai ser cortado os pré-crRNA em crRNAs funcionais (que são os protoespaçadores)
- é a organização do genoma
- operon Cas vai variar de sistema a sistema. Alguns vai ter cas9, cas ou cas 6.
- a estrutura tracrRNA é exclusiva do sistema 2.
- tudo será transcrito, tanto as repetições quanto os protoespaçadores. (formação do pré-crRNA) e depois por algum motivo vai ser cortado e vai se obter diversos pequenos crRNA. 
FASE II: 
 Sistema CRISPR/Cas9 – Tipo I
 Sistema tipo I:
· Pouco utilizado 
· Dividido em 6 subtipos: IA-IF;
· Transcrição mediada pela formação de hairpins (grampos) entre os protoespaçadores, clivados pela Cas6 crRNA;
- a clivagem dos protoespaçadores é feita quando as sequencias próximas ao protoespaçador formam a hairpins (grampo),essa estrutura que se formam sobre elas mesmas é clivada pela cas6 (que reconhece uma estrutura especifica), separando o pré-crRNA em vários crRNA com protoespaçadores cada. 
· Cas associated complex for antiviral defense – Cascade;
· Cascade = Cas5+Cas6+Cas7+Cas8. 
- complexo de Cas para defesa antiviral é composta por 5 Cas.
- é um sistema que vai reconhecer se a sequência do crRNA é complementar a sequência do RNA viral, se for complementar tudo certo, pois a Cas vai lá e vai cortar. ela vai reconheceratravés do domínio PAM na fita complementar (que é o material genético do vírus) e aí se livra da infecção viral
OBS: isso é um subtipo e não é igual em todas as bactérias. 
· Esse complexo atua reconhecendo o domínio PAM na fita complementar do crRNA (que é o material genético viral);
- o reconhecimento do crRNA com o DNA viral só ocorre quando está ocorrendo a transcrição da bactéria, seja para transcrever o genoma para se multiplicar ou devido o virus está usando o maquinário da bactéria para se multiplicar.
· Uma vez feito o reconhecimento, a sequência alvo é clivada pela Cas3.
Cada protoespaçador é clivado e tem vários protoespaçadores liberados e vai procurar algum genoma para se ligar, quando ele acha o DNA invasor e o PAM a cas3 vai lá e corta. 
FASE II: Sistema CRISPR/Cas9 – Tipo II
· Não depende do sistema cascade. ( dos cas que faz uma vistoria)
· É o tipo simples e por isso, o mais utilizado, podendo ser dividido em 3 subtipos: IIA-IIC;
· Transcrição do CRISPR locus é feita utilizando um RNA transativador complementar ao crRNA (tracrRNA);
· Esse tracrRNA pareia no crRNA ativação da nucleasse Cas9 clivagem guiada pelo sítio PAM;
O RNA transativador tem afinidade pelo domínio PAM
· Ao contrário do sistema Tipo I, o reconhecimento do domínio PAM no sistema Tipo II ocorre na mesma fita do crRNA.
- não vai clivar o material genético viral, mas sim o crRNA. Vai destruir tudo que o virus já construí, impede que o virus continua se replicando. Sendo mais simples. 
Já no sistema I ele cliva na fita complementar ao crRNA, ou seja, cliva no material genético do virus 
Sistema CRISPR/Cas9 – Tipo III
· Pouco menos usado
· Dividido em 2 subtipos: IIIA e IIIB. É o tipo mais complexo;
· Associado à proteína Cas10: não requer sítio PAM para o reconhecimento da sequência-alvo ou sua clivagem.
- é semelhante ao tipo I, só que não vai ter transcrição junto da sequência repetitiva. 
- não deixa o protoespaçador junto da sequência repetitiva. Libera só o protoespaçador. E isso é crRNA maduro (sem a sequencia repetitiva) e vai ser deixado isso se ligado ao DNA viral.
· Complexo Tipo IIIA – reconhece e destrói o DNA invasor quando a molécula pareia junto do genoma do invasor.
· Complexo Tipo IIIB – reconhece e destrói o RNA invasor após a transcrição com enzimas diferentes ele vai destruir o RNA do virus invasor. 
· Transcrição do locus CRISPR ocorre a clivagem 8 nucleotídeos antes (mais pra 5’). Isto resulta em uma série de protoespaçadores com sequências repetidas nos dois extremos, 5’ e 3’.
Fase III – Ação contra o invasor : Associação com proteínas Cas
· Associação dos crRNAs com proteínas Cas específicas de cada sistema;
· Esses complexos reconhecem o sistema e fazem a clivagem (através das Cas) da sequência genética exógena: plasmidial, elemento transponível ou viral;
· Semelhante ao mecanismo de silenciamento por RNAi (RNAs de interferência) em eucariotos.
- esses RNA que são utilizados como sondas para reconhecer o DNA invasor são semelhantes ao sistemas de silenciamento gênico onde se tem eucariotos (são feitos por RNAs de interferência).
- esses RNAs tem função de regulação da expressão genica.
- o modo que as sequencias do CRISP elas agem é muito semelhante a dos RNAs de interferência, pois os RNA de interferência se ligam a uma sequência complementar e impedem a transcrição de determinado gene. 
Aplicações do CRISPR: 
· Edição de genomas. 
· Gravar filmes no genoma bacteriano (seria o menor pen drive) do mundo? LINK
· Recuperação de espécies ameaçadas de extinção;
· Terapêutica de doenças genéticas;
· Controle de doenças endêmicas;
- devido o vetor. 
· Melhoramento animal/vegetal;
- alimentos geneticamente modicados (transgênicos)- alteração do genoma do alimento. 
BEBÊS MELHORADOS. Vamos discutir sobre isso?

Continue navegando