genomica final web high
406 pág.

genomica final web high


DisciplinaGenética I16.644 materiais498.243 seguidores
Pré-visualização50 páginas
~750 9 (PRC)
Xylella fastiosa 
9a5c
1/2 2,5 × 106 ~ 2.500 10 (XFGP)
1 \u2013 HGPI - Human Genome (http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml)
2 \u2013 TAIR - The Arabidopsis Information Resource (http://www.arabidopsis.org/index.jsp)
3 \u2013 MGI \u2013 Mouse Genome Research (http://www.ncbi.nlm.nih.gov/genome/guide/mouse/)
4 \u2013 FlyBase \u2013 A Data Base of Drosophila Genes & Genomes (http://flybase.org/)
5 \u2013 CGSP - Caenorhabditis Genome Sequencing Projects (http://www.sanger.ac.uk/Projects/C_elegans/)
6 \u2013 SGD \u2013 Saccharomyces Genome Database (http://www.yeastgenome.org/)
7 \u2013 EcGP \u2013 E.coli Genome Project (http://www.genome.wisc.edu/)
8 \u2013 Agro \u2013 Agrobacterium public web resource (http://depts.washington.edu/agro/)
9 \u2013 PWS \u2013 Phytoplasma Resource Center (http://plantpathology.ba.ars.usda.gov/phytoplasma.html)
10 \u2013 XFGP \u2013 Xylella fastidiosa genome Project (http://aeg.lbi.ic.unicamp.br/xf/)
Genômica comparativa 91
A genômica comparativa de proteínas permite então que os pesquisadores 
observem quais proteínas estão ou não presentes em um determinado genoma e que, 
através do agrupamento das proteínas por via bioquímica, possam identificar quais 
vias um organismo é capaz \u2013 ou não \u2013 de produzir. Como já explicado anteriormente 
os humanos não são capazes de sintetizar todos os aminoácidos que precisam 
para montar suas proteínas através de vias de síntese de novo, ou seja, a partir de 
precursores simples. Isso significa que o ser humano não tem determinadas enzimas 
que seriam responsáveis por fazer com que intermediários das vias de biossíntese de 
aminoácidos produzissem mesmo essas moléculas dentro das células. Com relação 
a fungos e bactérias que podem ser cultivados em laboratório é importante saber se 
eles possuem proteínas para quebrar determinados tipos de carboidratos ou gorduras 
em suas células para que se possa produzir um meio de cultura apropriado para eles.
E, além disso, pode-se hoje inclusive pensar em construir organismos sintéticos 
contendo vias bioquímicas inteiras que foram encontradas em outros organismos e 
adicionadas a um organismo hospedeiro de interesse (Capítulo 15).
Finalmente a genômica comparativa a partir de metabólitos secundários 
(Capítulo 10) produzidos permite compreender quais vias metabólicas ou subprodutos 
destas, diferentes organismos conseguem produzir para fins diversificados, quase 
sempre relacionados à adptação diante de condições fisiológicas as quais foram 
expostos.
Genes conservados, genes espécie-específicos e herança vertical
Os genes de um genoma que são compartilhados entre outros genomas são chamados 
de conservados. Para isso devemos levar em conta alguns critérios razoavelmente bem 
Figura 7. Exemplo de um modelo figurativo relacionando transcritômica e proteômica comparativa 
a partir de tecidos celulares diferenciados e em distintas condições fisiológicas.
Ciências genômicas: fundamentos e aplicações92
estabelecidos, como (i) a cobertura e (ii) a identidade entre as sequências. Entende-se 
por cobertura o percentual de comprimento de uma sequência de um organismo 
que se deseja comparar (query) em relação a outra sequência conhecida (subject). 
Esta comparação entre tais sequencias, posição a posição (seja uma comparação de 
nucleotídesos ou aminoácidos) também fornecerá informação quanto ao nível de 
conservação, aferindo desta forma o que se chama identidade.
Portanto, para ser conservado um gene precisa estar presente ao longo de inúmeros 
organismos de genomas conhecidos e que sejam distantes filogeneticamente. O gene 
que codifica as proteínas histonas, por exemplo, que são proteínas responsáveis 
por ligar o DNA e permitir a compactação do DNA no núcleo celular são altamente 
conservados em todos os organismos eucarióticos, e estão ausentes apenas nas 
bactérias. A sequência de nucleotídeos dos genes que codificam a histona são 
bastante similares entre os organismos. Entretanto o que realmente importa na hora 
de definirmos se os genes são conservados é a sequência de aminoácidos da proteína 
codificada pelo gene em questão. Isso se dá pelo fato de que o código genético é 
degenerado, ou seja, sequências diferentes de DNA podem resultar em sequências 
parecidas de proteínas. São as sequências parecidas das proteínas codificadas pelo 
gene que definem se o mesmo é ou não conservado quando essas sequências são 
comparadas entre diversos organismos. Sabemos que proteínas que possuem a mesma 
estrutura primária, ou seja, a mesma ordem de aminoácidos encadeados, possuirão 
assim a mesma estrutura terciária ou 3D em que consiste sua estrutura nativa que dá 
a ela a capacidade de encaixar nos substratos e catalisar reações químicas que, sem 
elas, demorariam muito mais tempo para acontecer.
O fato de proteínas de genomas distintos serem consideradas conservadas sugere 
que elas terão a mesma estrutura nas células dos genomas em questão. E quando 
falamos em proteínas, a estrutura delas está altamente ligada à função molecular que 
irão exercer na célula. Essas proteínas conservadas, portanto, terão a mesma estrutura 
na célula do genoma 1 e do genoma 2 e muito provavelmente funcionarão de forma 
a quebrar o mesmo substrato e produzir o mesmo produto em ambas as células. De 
fato, testes in vitro demonstram que proteínas conservadas normalmente realizam 
funções idênticas, mesmo que algumas funcionem melhor em diferentes condições 
de temperatura ou pH.
Vale notar que essas proteínas conservadas que normalmente realizam a mesma 
função em organismos, células e genomas diferentes possuem também uma origem 
comum no passado. Se tivermos como base os mecanismos de evolução darwiniana, 
saberemos que todos os organismos vivos tiveram um ancestral no passado. Homem 
e cães tiveram um ancestral vivo em algum momento da história e as proteínas 
conservadas que existem em nossos genomas são normalmente derivadas de 
proteínas que já existiam nesse organismo desconhecido que foi nosso ancestral. 
Estudos realizados mostram que são poucos os genes que surgem \u201cmilagrosamente\u201d 
a partir do nada ao longo da evolução das espécies. Genes normalmente surgem 
a partir da duplicação de genes antigos. Além disso, o nosso gene da insulina não 
é exatamente idêntico ao gene que codifica a insulina no cachorro porque nossas 
linhagens divergiram e nossos genes sofreram mutações diferentes ao longo do 
processo evolutivo. O mais interessante entretanto não é observar as diferenças e sim 
Genômica comparativa 93
as incríveis semelhanças entre as sequências das proteínas codificadas por genes de 
espécies que já se distanciaram evolutivamente há milhões de anos.
Tais genes que estão nos genomas dos organismos vivos, que são conservados e 
que são derivados de um mesmo gene num organismo ancestral são chamados de 
genes ortólogos (Figura 8). Um gene é ortólogo a outro quando se prova, através 
de análise filogenética, que eles possuem um gene ancestral no passado que deu 
origem aos dois genes através de um processo contínuo de especiação. Os genes 
ortólogos são importantíssimos para a nossa compreensão da genômica e da biologia 
molecular porque uma vez que sabemos a função de um determinado gene ortólogo, 
ao testarmos sua atividade em bancada, normalmente os bioinformatas são capazes 
de inferir, ao menos de forma provisória, a função de outro gene recém-sequenciado 
e desconhecido através de sua alta similaridade e conservação com esse gene bem 
conhecido. A anotação de novos genomas é, portanto, realizada de forma a transferir 
informações conhecidas de genes entre espécies. Hoje em dia, quando uma nova 
espécie é sequenciada, os pesquisadores normalmente já são capazes de conhecer 
a função de uma boa parte dos genes desse genoma. Isso porque a maioria dos 
genes presentes em um genoma consiste em genes conservados. Como falamos 
anteriormente, os genes responsáveis pela manutenção do metabolismo celular basal 
(genes