Buscar

Discussão experimental 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 12 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal do Espírito Santo 
Centro de Ciências Exatas, Naturais e da Saúde 
Departamento de Biologia 
Biotecnologia 
Discussão experimental 1 
 
Produção de plantas transgênicas 
Edson Delatorre 
 
Esta discussão e prática se baseia na tese de RAQUEL DE OLIVEIRA FARIA, intitulada: 
“EXPRESSÃO DA PROTEÍNA HSP60 HUMANA (HSPD1) EM ALFACE (​Lactuca sativa L.) NA 
PREVENÇÃO DA COLITE EXPERIMENTAL”, apresentada na Universidade Federal de Viçosa, 
como parte das exigências do Programa de Pós-Graduação em Fisiologia Vegetal. 
 
Objetivo 
Apresentar as etapas necessárias para produzir plantas transgênicas de ​Lactuca sativa viáveis 
que expressam a proteína HSP60 humana em suas folhas. 
 
Métodos 
 
Escolha do gene de interesse 
Nesta tese, foi escolhido o gene da proteína HSP60 (Proteínas de Choque Térmico) 
humana por sua capacidade de restaurar a imunorregulação e induzir a tolerância oral em 
camundongos que apresentam colite ulcerativa induzida por sulfato de sódio dextrano. A proteína 
HSP60 atua como chaperonina mitocondrial que assiste e catalisa o dobramento de polipeptídeos 
em proteínas, para que não se agregam de forma indesejada durante o dobramento e montagem 
das subunidades proteicas; ou durante o transporte transmembrana de proteínas. Mais 
informações sobre a proteína HSP60 você encontra nesse ​link​. 
A sequência genética escolhida da proteína HSP60 foi a codificada no RNAm humano e 
armazenada no banco de dados de sequências biológicas NCBI (do inglês, National Center for 
Biotechnology Information). 
 
 
 
1 
https://www.wikiwand.com/pt/Chaperona#/As_hsp60_e_o_controle_de_qualidade
 
Obtenção da sequência 
As informações do gene e sua sequências nucleotídica podem ser encontradas nesse link: 
https://www.ncbi.nlm.nih.gov/nuccore/NM_002156.5?report=fasta 
 
 
Note que temos o título com uma série de informações: 
Homo sapiens: ​Espécie de onde o gene se originou 
heat shock protein family D (Hsp60) member 1 (HSPD1): ​nome do gene 
transcript variant 1, mRNA: ​de qual molécula a sequências foi obtida. 
nuclear gene for mitochondrial product: ​onde ele fica 
 
 
2 
 
A sequências completa deste gene disponível no NCBI está abaixo no formato editável: 
 
>NM_002156.5 Homo sapiens heat shock protein family D (Hsp60) member 1 (HSPD1), 
transcript variant 1, mRNA; nuclear gene for mitochondrial product 
CCCTCACTCGCCGCCGACGACCTGTCTCGCCGAGCGCACGCCTTGCCGCCGCCCCGCAGAAATGCTTCGG 
TTACCCACAGTCTTTCGCCAGATGAGACCGGTGTCCAGGGTACTGGCTCCTCATCTCACTCGGGCTTATG 
CCAAAGATGTAAAATTTGGTGCAGATGCCCGAGCCTTAATGCTTCAAGGTGTAGACCTTTTAGCCGATGC 
TGTGGCCGTTACAATGGGGCCAAAGGGAAGAACAGTGATTATTGAGCAGAGTTGGGGAAGTCCCAAAGTA 
ACAAAAGATGGTGTGACTGTTGCAAAGTCAATTGACTTAAAAGATAAATACAAAAACATTGGAGCTAAAC 
TTGTTCAAGATGTTGCCAATAACACAAATGAAGAAGCTGGGGATGGCACTACCACTGCTACTGTACTGGC 
ACGCTCTATAGCCAAGGAAGGCTTCGAGAAGATTAGCAAAGGTGCTAATCCAGTGGAAATCAGGAGAGGT 
GTGATGTTAGCTGTTGATGCTGTAATTGCTGAACTTAAAAAGCAGTCTAAACCTGTGACCACCCCTGAAG 
AAATTGCACAGGTTGCTACGATTTCTGCAAACGGAGACAAAGAAATTGGCAATATCATCTCTGATGCAAT 
GAAAAAAGTTGGAAGAAAGGGTGTCATCACAGTAAAGGATGGAAAAACACTGAATGATGAATTAGAAATT 
ATTGAAGGCATGAAGTTTGATCGAGGCTATATTTCTCCATACTTTATTAATACATCAAAAGGTCAGAAAT 
GTGAATTCCAGGATGCCTATGTTCTGTTGAGTGAAAAGAAAATTTCTAGTATCCAGTCCATTGTACCTGC 
TCTTGAAATTGCCAATGCTCACCGTAAGCCTTTGGTCATAATCGCTGAAGATGTTGATGGAGAAGCTCTA 
AGTACACTCGTCTTGAATAGGCTAAAGGTTGGTCTTCAGGTTGTGGCAGTCAAGGCTCCAGGGTTTGGTG 
ACAATAGAAAGAACCAGCTTAAAGATATGGCTATTGCTACTGGTGGTGCAGTGTTTGGAGAAGAGGGATT 
GACCCTGAATCTTGAAGACGTTCAGCCTCATGACTTAGGAAAAGTTGGAGAGGTCATTGTGACCAAAGAC 
GATGCCATGCTCTTAAAAGGAAAAGGTGACAAGGCTCAAATTGAAAAACGTATTCAAGAAATCATTGAGC 
AGTTAGATGTCACAACTAGTGAATATGAAAAGGAAAAACTGAATGAACGGCTTGCAAAACTTTCAGATGG 
AGTGGCTGTGCTGAAGGTTGGTGGGACAAGTGATGTTGAAGTGAATGAAAAGAAAGACAGAGTTACAGAT 
GCCCTTAATGCTACAAGAGCTGCTGTTGAAGAAGGCATTGTTTTGGGAGGGGGTTGTGCCCTCCTTCGAT 
GCATTCCAGCCTTGGACTCATTGACTCCAGCTAATGAAGATCAAAAAATTGGTATAGAAATTATTAAAAG 
AACACTCAAAATTCCAGCAATGACCATTGCTAAGAATGCAGGTGTTGAAGGATCTTTGATAGTTGAGAAA 
ATTATGCAAAGTTCCTCAGAAGTTGGTTATGATGCTATGGCTGGAGATTTTGTGAATATGGTGGAAAAAG 
GAATCATTGACCCAACAAAGGTTGTGAGAACTGCTTTATTGGATGCTGCTGGTGTGGCCTCTCTGTTAAC 
TACAGCAGAAGTTGTAGTCACAGAAATTCCTAAAGAAGAGAAGGACCCTGGAATGGGTGCAATGGGTGGA 
ATGGGAGGTGGTATGGGAGGTGGCATGTTCTAACTCCTAGACTAGTGCTTTACCTTTATTAATGAACTGT 
GACAGGAAGCCCAAGGCAGTGTTCCTCACCAATAACTTCAGAGAAGTCAGTTGGAGAAAATGAAGAAAAA 
GGCTGGCTGAAAATCACTATAACCATCAGTTACTGGTTTCAGTTGACAAAATATATAATGGTTTACTGCT 
GTCATTGTCCATGCCTACAGATAATTTATTTTGTATTTTTGAATAAAAAACATTTGTACATTCCTGATAC 
TGGGTACAAGAGCCATGTACCAGTGTACTGCTTTCAACTTAAATCACTGAGGCATTTTTACTACTATTCT 
GTTAAAATCAGGATTTTAGTGCTTGCCACCACCAGATGAGAAGTTAAGCAGCCTTTCTGTGGAGAGTGAG 
AATAATTGTGTACAAAGTAGAGAAGTATCCAATTATGTGACAACCTTTGTGTAATAAAAATTTGTTTAAA 
GTTAA 
 
 
 
 
 
3 
 
Identificação dos frames de leitura aberta (ORF) 
Para ver qual(is) os frames de leitura aberta (ORF) dessa sequência, você pode 
copia-la (do símbolo ‘>’ até o último nucleotídeo) e colar neste programa online, que 
realizará a tradução para a sequências de aminoácidos. Nesse caso, estamos procurando 
os códons de iniciação (AUG) e os códons de terminação (UAA, UAG, UGA). Podemos 
fazer isso a mão ou pedir para o programa encontrar. 
 
https://web.expasy.org/translate/ 
 
 
 
Cola a sequência acima no campo “​DNA or RNA sequence​” 
Marque a opção: “​Includes nucleotide sequence​” 
Marque a opção: “​forward​” 
Clique no botão “​TRANSLATE!​” 
 
 
 
 
 
4 
https://web.expasy.org/translate/
 
O resultado foi esse abaixo. O frame de leitura mais extenso se dá a partir da posição 2: 
A linha superior representa os códons e a linha inferior os aminoácidos codificados. A proteína 
inteira está marcada em verde. 
 
5'3' Frame 2 
ccct cac tcg ccg ccg acg acc tgt ctc gcc gag cgc acg cct tgc cgc cgc ccc gca gaa 
 P H S P P T T C L A E R T P C R R P A E 
atg ctt cgg tta ccc aca gtc ttt cgc cag atg aga ccg gtg tcc agg gta ctg gct cct 
 M L R L P T V F R Q M R P V S R V L A P 
cat ctc act cgg gct tat gcc aaa gat gta aaa ttt ggt gca gat gcc cga gcc tta atg 
 H L T R A Y A K D V K F G A D A R A L M 
ctt caa ggt gta gac ctt tta gcc gat gct gtg gcc gtt aca atg ggg cca aag gga aga 
 L Q G V D L L A D A V A V T M G P K G R 
aca gtg att att gag cag agt tgg gga agt ccc aaa gta aca aaa gat ggt gtg act gtt 
 ​T V I I E Q S W G S P K V T K D G V T V 
gca aag tca att gac tta aaa gat aaa tac aaa aac att gga gct aaa ctt gtt caa gat 
 A K S I D L K D K Y K N I G A K L V Q D 
gtt gcc aat aac aca aat gaa gaa gct ggg gat ggc act acc act gct act gta ctg gca 
 V A N N T N E E A G D G T T T A T V L A 
cgc tct ata gcc aag gaa ggc ttc gag aag att agc aaa ggt gct aat cca gtg gaa atc 
 R S I A K E G F E K I S K G A N P V E I 
agg aga ggt gtg atg tta gct gtt gat gct gta att gct gaa ctt aaa aag cag tct aaa 
 R R G V M L A V D A V I A E L K K Q S K 
cct gtg acc acc cct gaa gaa att gca cag gtt gct acg att tct gca aac gga gac aaa 
 P V T T P E E I A Q V A T I S A N G D K 
gaa att ggc aat atc atc tct gat gca atg aaa aaa gtt gga aga aag ggt gtc atc aca 
 E I G N I I S D A M K K V G R K G V I T 
gta aag gat gga aaa aca ctg aat gat gaa tta gaa att att gaa ggc atg aag ttt gat 
 V K D G K T L N D E L E I I E G M K F D 
cga ggc tat att tct cca tac ttt att aat aca tca aaa ggt cag aaa tgt gaa ttc cag 
 R G Y I S P Y FI N T S K G Q K C E F Q 
gat gcc tat gtt ctg ttg agt gaa aag aaa att tct agt atc cag tcc att gta cct gct 
 D A Y V L L S E K K I S S I Q S I V P A 
ctt gaa att gcc aat gct cac cgt aag cct ttg gtc ata atc gct gaa gat gtt gat gga 
 L E I A N A H R K P L V I I A E D V D G 
gaa gct cta agt aca ctc gtc ttg aat agg cta aag gtt ggt ctt cag gtt gtg gca gtc 
 E A L S T L V L N R L K V G L Q V V A V 
aag gct cca ggg ttt ggt gac aat aga aag aac cag ctt aaa gat atg gct att gct act 
 K A P G F G D N R K N Q L K D M A I A T 
ggt ggt gca gtg ttt gga gaa gag gga ttg acc ctg aat ctt gaa gac gtt cag cct cat 
 G G A V F G E E G L T L N L E D V Q P H 
gac tta gga aaa gtt gga gag gtc att gtg acc aaa gac gat gcc atg ctc tta aaa gga 
 D L G K V G E V I V T K D D A M L L K G 
aaa ggt gac aag gct caa att gaa aaa cgt att caa gaa atc att gag cag tta gat gtc 
 K G D K A Q I E K R I Q E I I E Q L D V 
aca act agt gaa tat gaa aag gaa aaa ctg aat gaa cgg ctt gca aaa ctt tca gat gga 
 T T S E Y E K E K L N E R L A K L S D G 
gtg gct gtg ctg aag gtt ggt ggg aca agt gat gtt gaa gtg aat gaa aag aaa gac aga 
 V A V L K V G G T S D V E V N E K K D R 
gtt aca gat gcc ctt aat gct aca aga gct gct gtt gaa gaa ggc att gtt ttg gga ggg 
 V T D A L N A T R A A V E E G I V L G G 
ggt tgt gcc ctc ctt cga tgc att cca gcc ttg gac tca ttg act cca gct aat gaa gat 
 G C A L L R C I P A L D S L T P A N E D 
5 
 
caa aaa att ggt ata gaa att att aaa aga aca ctc aaa att cca gca atg acc att gct 
 Q K I G I E I I K R T L K I P A M T I A 
aag aat gca ggt gtt gaa gga tct ttg ata gtt gag aaa att atg caa agt tcc tca gaa 
 K N A G V E G S L I V E K I M Q S S S E 
gtt ggt tat gat gct atg gct gga gat ttt gtg aat atg gtg gaa aaa gga atc att gac 
 V G Y D A M A G D F V N M V E K G I I D 
cca aca aag gtt gtg aga act gct tta ttg gat gct gct ggt gtg gcc tct ctg tta act 
 P T K V V R T A L L D A A G V A S L L T 
aca gca gaa gtt gta gtc aca gaa att cct aaa gaa gag aag gac cct gga atg ggt gca 
 T A E V V V T E I P K E E K D P G M G A 
atg ggt gga atg gga ggt ggt atg gga ggt ggc atg ttc taa​ ​ctc cta gac tag tgc ttt 
 M G G M G G G M G G G M F -​ ​ L L D - C F 
acc ttt att aat gaa ctg tga cag gaa gcc caa ggc agt gtt cct cac caa taa ctt cag 
 T F I N E L - Q E A Q G S V P H Q - L Q 
aga agt cag ttg gag aaa atg aag aaa aag gct ggc tga aaa tca cta taa cca tca gtt 
 R S Q L E K M K K K A G - K S L - P S V 
act ggt ttc agt tga caa aat ata taa tgg ttt act gct gtc att gtc cat gcc tac aga 
 T G F S - Q N I - W F T A V I V H A Y R 
taa ttt att ttg tat ttt tga ata aaa aac att tgt aca ttc ctg ata ctg ggt aca aga 
 - F I L Y F - I K N I C T F L I L G T R 
gcc atg tac cag tgt act gct ttc aac tta aat cac tga ggc att ttt act act att ctg 
 A M Y Q C T A F N L N H - G I F T T I L 
tta aaa tca gga ttt tag tgc ttg cca cca cca gat gag aag tta agc agc ctt tct gtg 
 L K S G F - C L P P P D E K L S S L S V 
gag agt gag aat aat tgt gta caa agt aga gaa gta tcc aat tat gtg aca acc ttt gtg 
 E S E N N C V Q S R E V S N Y V T T F V 
taa taa aaa ttt gtt taa agt taa 
 - - K F V - S - 
 
 
Agora já sabemos exatamente onde a ORF começa e termina, e além disso, também 
sabemos quais os códons utilizados. No nosso caso, a proteína é composta por 573 aminoácidos. 
 
Mas lembra que o código genético é degenerado. O que significa isso mesmo? Pense um 
pouco (dê uma olhada ​aqui​ se estiver na dúvida). 
 
Mais de um códon codifica para o mesmo aminoácido, ou seja, temos 61 códons 
(descontando os três utilizados como códons de parada) para codificar 20 aminoácidos. Assim, 
evolutivamente, diferentes organismos podem acabar favorecendo um ou outros códon frente a 
um mesmo aminoácido. E isso pode afetar muito o sucesso em um processo de transgenia. 
Sempre temos que levar em consideração os chamados “códons preferenciais” de um organismo 
quando vamos modificá-lo com genes de outras espécies (em alguns casos, temos que tomar o 
cuidado de olhar até mesmo quais códons determinadas células de um mesmo organismo têm 
preferência - hepatócitos e neurônios podem diferir em seus códons preferenciais. 
 
Como os autores resolveram esta questão? 
Eles buscaram quais são os códons preferenciais utilizado por plantas, e como não tinha 
dados confiáveis para ​Lactuca sativa (alface), utilizaram a planta modelo ​Arabidopsis thaliana. 
Existe um banco de dados específico para isso, administrado pelo Kazusa DNA Research Institute 
no Japão. Nele você pode realizar a busca por diversos organismos que já tenham tido seus 
genomas sequenciados e de onde já se tenham uma boa parcela de conhecimento de suas 
proteínas. A partir das sequências de diversas proteínas, os curadores do banco de dados fazem 
tabelas informando a frequências com que cada códon foi utilizado. 
6 
https://www.wikiwand.com/pt/C%C3%B3digo_gen%C3%A9tico
 
No caso, os autores utilizaram a tabela compilada para ​Arabidopsis thaliana​, presente no link 
abaixo: 
http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=3702 
 
Arabidopsis thaliana [gbpln]: 80395 CDS's (31098475 codons) 
fields: [triplet] [frequency: per thousand] ([number]) 
UUU 21.8(678320)​ UCU 25.2(782818) UAU 14.6(455089) UGU 10.5(327640) 
UUC 20.7(642407)​ UCC 11.2(348173) UAC 13.7(427132) UGC 7.2(222769) 
UUA 12.7(394867)​ UCA 18.3(568570) UAA 0.9( 29405) UGA 1.2( 36260) 
UUG 20.9(649150)​ UCG 9.3(290158) UAG 0.5( 16417) UGG 12.5(388049) 
 
CUU 24.1(750114) CCU 18.7(580962) CAU 13.8(428694) CGU 9.0(280392) 
CUC 16.1(500524) CCC 5.3(165252) CAC 8.7(271155) CGC 3.8(117543) 
CUA 9.9(307000) CCA 16.1(502101) CAA 19.4(604800) CGA 6.3(195736) 
CUG 9.8(305822) CCG 8.6(268115) CAG 15.2(473809) CGG 4.9(151572) 
 
AUU 21.5(668227) ACU 17.5(544807) AAU 22.3(693344) AGU 14.0(435738) 
AUC 18.5(576287) ACC 10.3(321640) AAC 20.9(650826) AGC 11.3(352568) 
AUA 12.6(391867) ACA 15.7(487161) AAA 30.8(957374) AGA 19.0(589788) 
AUG 24.5(762852) ACG 7.7(240652) AAG 32.7(1016176) AGG 11.0(340922) 
 
GUU 27.2(847061) GCU 28.3(880808) GAU 36.6(1139637) GGU 22.2(689891) 
GUC 12.8(397008) GCC 10.3(321500) GAC 17.2(535668) GGC 9.2(284681) 
GUA 9.9(308605) GCA 17.5(543180) GAA 34.3(1068012) GGA 24.2(751489) 
GUG 17.4(539873) GCG 9.0(280804) GAG 32.2(1002594) GGG 10.2(316620) 
Coding GC 44.59% 1st letter GC 50.84% 2nd letter GC 40.54% 3rd letter GC 42.38% 
 
 
 
7 
 
Obtenção da tabela de uso de códons preferenciais 
Para buscar a tabela de uso de códons de uma espécie, basta entrar no site abaixo e escrever o 
nome científico dela: 
http://www.kazusa.or.jp/codon/ 
 
Para facilitar, deixei alguns links para as tabelas de alguns organismos modelo: 
E. coli​: ​http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=316407 
S. cerevisae​: http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4932C. elegans​: ​http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=6239 
D. melanogaster​: ​http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=7227 
M. musculus​: ​http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=10090 
R. novergicus​: ​http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=10116 
N. tabacum​: http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4097 
 
8 
http://www.kazusa.or.jp/codon/
http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=316407
http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=6239
http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=7227
http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=10090
http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=10116
 
Otimização dos códons 
Depois de obter a tabela de uso preferencial de códons do organismo que irá expressar o 
transgene (no caso do nosso exemplo, será ​A. thaliana​), iremos realizar a otimização dos códons 
do gene da HSP60 com os códons preferenciais de ​A. thaliana​. Isso pode ser feito de várias 
formas, porém iremos utilizar uma plataforma online que faz a mudança de forma automática. 
Uma série de parâmetros podem (e devem) ser otimizados, como por exemplo o conteúdo de GC, 
a presença de estruturas secundárias, caudas poliA prematuras, sítios de ​splicing escondidos, etc. 
Para a finalidade deste tutorial, iremos realizar a otimização automática, mais simples, através do 
site ​http://www.atgme.org/​. 
Primeiramente, iremos copiar somente a região codificante (ORF) presente na sequência 
de RNAm de HSP60 (a colorida em verde acima) 
 
9 
http://www.atgme.org/
 
Região codificante HSP60 
>HSP60_humano_selvagem 
atg ​ctt cgg tta ccc aca gtc ttt cgc cag atg aga ccg gtg tcc agg gta ctg gct cct 
cat ctc act cgg gct tat gcc aaa gat gta aaa ttt ggt gca gat gcc cga gcc tta atg 
ctt caa ggt gta gac ctt tta gcc gat gct gtg gcc gtt aca atg ggg cca aag gga aga 
aca gtg att att gag cag agt tgg gga agt ccc aaa gta aca aaa gat ggt gtg act gtt 
gca aag tca att gac tta aaa gat aaa tac aaa aac att gga gct aaa ctt gtt caa gat 
gtt gcc aat aac aca aat gaa gaa gct ggg gat ggc act acc act gct act gta ctg gca 
cgc tct ata gcc aag gaa ggc ttc gag aag att agc aaa ggt gct aat cca gtg gaa atc 
agg aga ggt gtg atg tta gct gtt gat gct gta att gct gaa ctt aaa aag cag tct aaa 
cct gtg acc acc cct gaa gaa att gca cag gtt gct acg att tct gca aac gga gac aaa 
gaa att ggc aat atc atc tct gat gca atg aaa aaa gtt gga aga aag ggt gtc atc aca 
gta aag gat gga aaa aca ctg aat gat gaa tta gaa att att gaa ggc atg aag ttt gat 
cga ggc tat att tct cca tac ttt att aat aca tca aaa ggt cag aaa tgt gaa ttc cag 
gat gcc tat gtt ctg ttg agt gaa aag aaa att tct agt atc cag tcc att gta cct gct 
ctt gaa att gcc aat gct cac cgt aag cct ttg gtc ata atc gct gaa gat gtt gat gga 
gaa gct cta agt aca ctc gtc ttg aat agg cta aag gtt ggt ctt cag gtt gtg gca gtc 
aag gct cca ggg ttt ggt gac aat aga aag aac cag ctt aaa gat atg gct att gct act 
ggt ggt gca gtg ttt gga gaa gag gga ttg acc ctg aat ctt gaa gac gtt cag cct cat 
gac tta gga aaa gtt gga gag gtc att gtg acc aaa gac gat gcc atg ctc tta aaa gga 
aaa ggt gac aag gct caa att gaa aaa cgt att caa gaa atc att gag cag tta gat gtc 
aca act agt gaa tat gaa aag gaa aaa ctg aat gaa cgg ctt gca aaa ctt tca gat gga 
gtg gct gtg ctg aag gtt ggt ggg aca agt gat gtt gaa gtg aat gaa aag aaa gac aga 
gtt aca gat gcc ctt aat gct aca aga gct gct gtt gaa gaa ggc att gtt ttg gga ggg 
ggt tgt gcc ctc ctt cga tgc att cca gcc ttg gac tca ttg act cca gct aat gaa gat 
caa aaa att ggt ata gaa att att aaa aga aca ctc aaa att cca gca atg acc att gct 
aag aat gca ggt gtt gaa gga tct ttg ata gtt gag aaa att atg caa agt tcc tca gaa 
gtt ggt tat gat gct atg gct gga gat ttt gtg aat atg gtg gaa aaa gga atc att gac 
cca aca aag gtt gtg aga act gct tta ttg gat gct gct ggt gtg gcc tct ctg tta act 
aca gca gaa gtt gta gtc aca gaa att cct aaa gaa gag aag gac cct gga atg ggt gca 
atg ggt gga atg gga ggt ggt atg gga ggt ggc atg ttc ​taa 
 
 
 
E também somente a tabela com a informação de uso de códons em​ A. thaliana​: 
10 
 
UUU 21.8(678320) ​ UCU 25.2(782818) UAU 14.6(455089) UGU 10.5(327640) 
UUC 20.7(642407) ​ UCC 11.2(348173) UAC 13.7(427132) UGC 7.2(222769) 
UUA 12.7(394867) ​ UCA 18.3(568570) UAA 0.9( 29405) UGA 1.2( 36260) 
UUG 20.9(649150) ​ UCG 9.3(290158) UAG 0.5( 16417) UGG 12.5(388049) 
 
CUU 24.1(750114) CCU 18.7(580962) CAU 13.8(428694) CGU 9.0(280392) 
CUC 16.1(500524) CCC 5.3(165252) CAC 8.7(271155) CGC 3.8(117543) 
CUA 9.9(307000) CCA 16.1(502101) CAA 19.4(604800) CGA 6.3(195736) 
CUG 9.8(305822) CCG 8.6(268115) CAG 15.2(473809) CGG 4.9(151572) 
 
AUU 21.5(668227) ACU 17.5(544807) AAU 22.3(693344) AGU 14.0(435738) 
AUC 18.5(576287) ACC 10.3(321640) AAC 20.9(650826) AGC 11.3(352568) 
AUA 12.6(391867) ACA 15.7(487161) AAA 30.8(957374) AGA 19.0(589788) 
AUG 24.5(762852) ACG 7.7(240652) AAG 32.7(1016176) AGG 11.0(340922) 
 
GUU 27.2(847061) GCU 28.3(880808) GAU 36.6(1139637) GGU 22.2(689891) 
GUC 12.8(397008) GCC 10.3(321500) GAC 17.2(535668) GGC 9.2(284681) 
GUA 9.9(308605) GCA 17.5(543180) GAA 34.3(1068012) GGA 24.2(751489) 
GUG 17.4(539873) GCG 9.0(280804) GAG 32.2(1002594) GGG 10.2(316620) 
 
Essas informações serão adicionadas no site ATGme: 
 
Depois basta clicar em ‘Start processing’ e depois na próxima tela em ‘Optimize’ 
 
11 
 
Sequência otimizada do gene para expressão em ​A. thaliana 
>HSP60_human_otimizado 
ATG​ ​CTT AGA CTT CCT ACT GTT TTT AGA CAA ATG AGA CCT GTT TCT AGA GTT CTT 
GCT CCT CAT CTT ACT AGA GCT TAT GCT AAG GAT GTT AAG TTT GGA GCT GAT GCT 
AGA GCT CTT ATG CTT CAA GGA GTT GAT CTT CTT GCT GAT GCT GTT GCT GTT ACT 
ATG GGA CCT AAG GGA AGA ACT GTT ATT ATT GAA CAA TCT TGG GGA TCT CCT AAG 
GTT ACT AAG GAT GGA GTT ACT GTT GCT AAG TCT ATT GAT CTT AAG GAT AAG TAT 
AAG AAT ATT GGA GCT AAG CTT GTT CAA GAT GTT GCT AAT AAT ACT AAT GAA GAA 
GCT GGA GAT GGA ACT ACT ACT GCT ACT GTT CTT GCT AGA TCT ATT GCT AAG GAA 
GGA TTT GAA AAG ATT TCT AAG GGA GCT AAT CCT GTT GAA ATT AGA AGA GGA GTT 
ATG CTT GCT GTT GAT GCT GTT ATT GCT GAA CTT AAG AAG CAA TCT AAG CCT GTT 
ACT ACT CCT GAA GAA ATT GCT CAA GTT GCT ACT ATT TCT GCT AAT GGA GAT AAG 
GAA ATT GGA AAT ATT ATT TCT GAT GCT ATG AAG AAG GTT GGA AGA AAG GGA GTT 
ATT ACT GTT AAG GAT GGA AAG ACT CTT AAT GAT GAA CTT GAA ATT ATT GAA GGA 
ATG AAG TTT GAT AGA GGA TAT ATT TCT CCT TAT TTT ATT AAT ACT TCT AAG GGA 
CAA AAG TGT GAA TTT CAA GAT GCT TAT GTT CTT CTT TCT GAA AAG AAG ATT TCT 
TCT ATT CAA TCT ATT GTT CCT GCT CTT GAA ATT GCT AAT GCT CAT AGA AAG CCT 
CTT GTT ATT ATT GCT GAA GAT GTT GAT GGA GAA GCT CTT TCT ACT CTT GTT CTT 
AAT AGA CTT AAG GTT GGA CTT CAA GTT GTT GCT GTT AAG GCT CCT GGA TTT GGA 
GAT AAT AGA AAG AAT CAA CTT AAG GAT ATG GCT ATT GCT ACT GGA GGA GCT GTT 
TTT GGA GAA GAA GGA CTT ACT CTT AAT CTT GAA GAT GTT CAA CCT CAT GAT CTT 
GGA AAG GTT GGA GAA GTT ATT GTT ACT AAG GAT GAT GCT ATG CTT CTT AAG GGA 
AAG GGA GAT AAG GCT CAA ATT GAA AAG AGA ATT CAA GAA ATT ATT GAA CAA CTT 
GAT GTT ACT ACT TCT GAA TAT GAA AAG GAA AAG CTT AAT GAA AGA CTT GCT AAG 
CTT TCT GAT GGA GTT GCT GTT CTT AAG GTT GGA GGA ACT TCT GAT GTT GAA GTT 
AAT GAA AAG AAG GAT AGA GTT ACT GAT GCT CTT AAT GCT ACT AGA GCT GCT GTT 
GAA GAA GGA ATT GTT CTT GGA GGA GGA TGT GCT CTT CTT AGA TGT ATT CCT GCT 
CTT GAT TCT CTT ACT CCT GCT AAT GAA GAT CAA AAG ATT GGA ATT GAA ATT ATT 
AAG AGA ACT CTT AAG ATT CCT GCT ATG ACT ATT GCT AAG AAT GCT GGA GTT GAA 
GGA TCT CTT ATT GTT GAA AAG ATT ATG CAA TCT TCT TCT GAA GTT GGA TAT GAT 
GCT ATG GCT GGA GAT TTT GTT AAT ATG GTT GAA AAG GGA ATT ATT GAT CCT ACT 
AAG GTT GTT AGA ACT GCT CTT CTT GAT GCT GCT GGA GTT GCT TCT CTT CTT ACT 
ACT GCT GAA GTT GTT GTT ACT GAA ATT CCT AAG GAA GAA AAG GAT CCT GGA ATG 
GGA GCTATG GGA GGA ATG GGA GGA GGA ATG GGA GGA GGA ATG TTT ​TGA 
 
 
Em verde está marcado o códon de início 
Em vermelho está marcado o códon de terminação 
 
12

Continue navegando