Buscar

GENE S BIOINFORMÁTICA concluído

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE DO OESTE DE SANTA CATARINA CAMPUS VIDEIRA
BIOTECNOLOGIA INDUSTRIAL BIOINFORMÁTICA
BRUNA DIAS SRANTER DAIANE DE QUADROS FERNANDES
IZADORA SURDI OZORIO
ANÁLISE GENÔMICA DO SARS-CoV-2 (SEVERE ACUTE RESPIRATORY SYNDROME CORONAVIRUS 2) COM ENFÂSE NO GENE S- SPIKE GLYCOPROTEIN
VIDEIRA, SC 2020
BRUNA DIAS SPRANTER DAIANE DE QUADROS FERNANDES
IZADORA SURDI OZORIO
ANÁLISE GENÔMICA DO SARS-CoV-2 (SEVERE ACUTE RESPIRATORY SYNDROME CORONAVIRUS 2) COM ENFÂSE NO GENE S- SPIKE GLYCOPROTEIN
Artigo científico apresentado como requisito parcial de avaliação do componente curricular de Bioinformática ministrado pelo professor Dr. Cesar Milton Baratto no 1º semestre de 2020.
VIDEIRA, SC 2020
RESUMO
Doenças infecciosas emergentes são constantes desafios para a saúde pública mundial. Recentes casos de pneumonia de causa desconhecida ocorridos em Wuhan, China, levaram à descoberta de um novo tipo de Coronavírus (2019-nCoV), que são RNA de vírus envelopados, comumente encontrados em humanos, outros mamíferos e aves, capazes de causar doenças respiratórias. Até o momento, são seis as espécies de Coronavírus conhecidas que causam doenças em humanos. Quatro dessas (229E, OC43, NL63 e HKU1) causam sintomas comuns de gripe em pessoas imunocompetentes e duas espécies (SARS-CoV e MERS-CoV) provocam síndrome respiratória aguda grave com taxas elevadas de mortalidade. As proteínas estruturais do SARS-CoV-2 incluem a proteína S, proteína E, proteína M, e a proteína N. Dentre essas proteínas, a proteína S, codificada pelo gene S, saindo da superfície do vírus é altamente exposta e responsável pela invasão de células hospedeiras, ela é um alvo promissor para o desenvolvimento de vacinas e a descoberta de drogas para bloquear as interações entre o vírus e as células hospedeiras. O objetivo do presente trabalho é auxiliar no entendimento da COVID-19 em relação a origem do SARS-CoV-2, suas descobertas genômicas, patogenia, além da comparação com outros coronavírus através de análises usando softwares de bioinformática.
Palavras- chaves: Genoma. Bioinformática. Coronavírus.
1. INTRODUÇÃO
Em 12 de dezembro de 2019, um conjunto de casos de pneumonia causada por um coronavírus recém identificado foi anunciado em Wuhan, na China. Esse coronavírus foi inicialmente nomeado como novo coronavírus de 2019 (2019-Ncov) em 12 de janeiro de 2020 pela Organização Mundial da Saúde (OMS). Rapidamente, instalou-se uma epidemia de infecção aguda do trato respiratório, tendo a OMS nomeado oficialmente a doença como doença pelo coronavírus 2019 (coronavirus disease 2019 - Covid-19), e o novo coronavírus como o vírus da síndrome respiratória aguda grave do coronavírus 2 (severe acute respiratory syndrome coronavirus 2 – Sars-CoV-2) (RONG GUO; DONG CAO; SI HONG et al., 2020).
1.2 MANIFESTAÇÕES CLÍNICAS
Como uma doença infecciosa respiratória aguda emergente, a Covid-19 se espalha principalmente pelo trato respiratório, por gotículas, secreções respiratórias e contato direto. Entretanto, há relatos de que o SARS-CoV-2 tenha sido isolado de swabs fecais de sangue, indicando a possibilidade de transmissão por múltiplas rotas (RONG GUO; DONG CAO; SI HONG et al., 2020).
A doença é altamente transmissível entre seres humanos. Os pacientes apresentaram sintomas como febre, mal-estar e tosse (HUANG et al., 2020). Embora o sinal clínico da Covid-19, que permitiu a detecção de casos tenha sido a pneumonia, há relatos mais recentes de sintomas gastrointestinais e infecções assintomáticas, principalmente em crianças (MD, JASPER et al., 2020).
A Idade média dos pacientes acometidos é de 49 a 56 anos. Indivíduos idosos e aqueles com comorbidades como diabetes, doenças pulmonares crônicas, doenças cardiovasculares, câncer e pacientes imunocomprometidos mostraram-se particularmente propensos a quadros mais graves e admissão em unidades de terapia intensiva. Parece haver uma tendência de maior relato de casos em indivíduos do sexo masculino (HUANG et al., 2020).
1.3 CARACTERÍSTICAS DO SARS-CoV-2
Os coronavírus foram descritos, pela primeira vez em 1966 por Tyrell e Byone que cultivaram os vírus de pacientes com resfriados comuns (TYRELL,1966). São uma subfamília de grandes e envelopados vírus contendo morfologia esférica, com cerca de 100 a 160nm de diâmetro. Visualizados na microscopia eletrônica como círculos com espículas que se exteriorizam de sua superfície, formando projeções semelhantes a uma coroa solar (a palavra “corona”, em latim, tem o significado de coroa). Eles podem ser divididos nos gêneros alfa, beta, gama e delta coronavírus, dos quais os CoVs alfa e beta infectam humanos. Os betacoronavírus podem causar doenças graves e fatais, enquanto os alfacoronavírus causam infecções assintomáticas ou levemente sintomáticas. Os alfa e beta coronavírus são, aparentemente, originários de mamíferos, em particular de morcegos, enquanto o vírus gama e delta são originários de porcos e pássaros (MEYER; VELAVAN, 2020).
Figura 1. Imagem do novo coronavírus Covid-19 em microscopia (fornecido pelo CDC da China)
Fonte: CDC da China, 2020.
Até o momento, são seis espécies de Coronavírus conhecidas que causam doenças em humanos. Quatro dessas (229E, OC43, NL63 E HKU1) causam sintomas comuns de gripe em pessoas imunocompetentes e duas espécies (SARS-COv e MERS- CoV) provocam síndrome respiratória aguda grave com taxas elevadas de mortalidade (SHI ZL; LI F; CUI J, 2019).
O arranjo de genes do genoma do SARS-CoV-2 é: 5’UTR-replicase (orf1ab)-Spike (S)- orf3a- Envelope (E)- Membrane (M)- orf6-orf7a- orf8- Nucleocapsid (N)- orf10- 3’UTR. As principais diferenças entre o SARS-CoV-2 e o SARS-CoV são nos genes Spike, orf3a e orf8, que são conhecidos por codificar indutores da ativação inflamassoma de receptores tipo NOD 3 (NLRP3) e por codificar uma proteína que inibe a expressão de interferon β (INFβ). O SARS-CoV-2 forma novas proteínas mais curtas e é codificado pelo gene orf3a e por orf8. Assim, surge a hipótese de que o SARS-CoV-2 pode ser menos eficiente na supressão de resposta antiviral e na ativação do inflamassoma de NLRP3 do que o SARS-CoV, porém isso deve ser testado (LIMA; SOUSA;LIMA,K 2020).
O genoma dos CoVs alberga um RNA de fita simples, polaridade positiva e com tamanho variando entre 26kb e 32kb. Apresentam quatro proteínas estruturais, conhecidas como proteínas S (spike), E (envelope), M (membrana) e N (nucleocapsídeo). As infecções por vírus indicam uma ligação de partículas virais aos recepctores de superfície celulares. O reconhecimento de receptores é, portanto, um determinante importante do tropismo de células de tecidos de um vírus.
Figura 2. Estrutura do SARS-CoV-2 e mecanismos de entrada na célula.
Fonte: Adaptado Lima; Sousa, 2020.
Na parte superior esquerda, desenho esquemático do vírus SARS-CoV-2, evidenciando as quatro proteínas estruturais do envelope, membrana, núcleocapsídeo e Spike (S1+S2) e membrana lipídica. A Etapa 1 ilustra a interação da proteína Spike (S1) com o receptor celular ACE2. Nesta etapa, proteases da célula alvo ativam a proteína S, clivando-a em subunidades S1 e S2. S2 muda sua conformação (etapa 2) incluindo a inserção de FP na membrana da célula-alvo e exposição do domínio HR1. A interação entre os domínios de HR2 e HR1 formam feixes de seis hélices (6-HB), trazendo o envelope viral e a membrana celular em estreita proximidade para a fusão e entrada viral (etapa 3).
1.4 DESCOBERTAS GÊNOMICAS DO SARS-CoV-2
Para que o SARS-CoV-2 possa se replicar, ele precisa entrar na célula hospedeira, por meio da ligação da sua proteína viral Spike à enzima conversora de angiotensina 2 (do inglês, Angiotensin Converting Enzyme 2- ACE2), a qual está presente em vários tipos celulares, incluindo células pulmonares. Até o presente momento, a ACE2 é reconhecida como principal molécula receptora que permite a entrada do SARS-CoV-2 na célula hospedeira (HOFFMANN et al., 2020).
Estudo recentes realizados em isolados de pacientes de Covid-19 mostraram que mesmo dentrode um mesmo indivíduo ocorreram mutações ao longo de todo o genoma viral, sendo essas predominantes em cinco genes: S (proteína de superfície), N (proteína de nucleocapsídeo) e nas ORFS 8, 3a e 1ab (SHEN et al.,2020). A existência dessas mutações sugere que o vírus iniciou a sua adaptação ao hospedeiro humano, incluindo mutações na região do domínio de ligação ao receptor ACE (região RBD) que podem resultar em um aumento da infinidade, resultando num aumento da infectividade (WRAPP et al., 2020).
O RBD da subunidade S1 da proteína S é a parte mais variável do genoma entre os SARS-CoV-2 e o SARS-CoV. Seis aminoácidos do RBD são críticos para a ligação à ACE2 e para determinar quais os hospedeiros quais os hospedeiros dos SARS-CoV, são Y442, L472, N479, D480, T487 e Y4911, que correspondem a L455, F486, Q493, S494,
N501 e Y505 em SARS-CoV-2. Cinco desses seis resíduos diferem entre o SARS-CoV e o SARS-CoV-2, o qual tem um RBD que se liga com alta afinidade a ACE2 de humanos, furões, gatos e outras espécies com alta homologia de receptores. Estudos reportam que a proteína S do SARS-CoV-2 se liga ao ACE2 com afinidade de ~15Nm, que é uma
afinidade aproximadamente 10 a 20 vezes maior do que a ligação do ACE2 ao SARS- CoV (WRAPP D, 2020; LETKO M, 2020; YANG B, 2020).
1.5 ABORDAGEM ESPECÍFICA SOBRE O GENE S (PROTEÍNA DE SUPERFÍCIE) DO SARS-CoV-2
As proteínas estruturais do SARS-CoV-2 incluem a proteína S, proteína E, proteína M, e a proteína N. Dentre essas proteínas, a proteína S, codificada pelo gene S, saindo da superfície do vírus é altamente exposta e responsável pela invasão de células hospedeiras. A proteína S é homotrimerica e é altamente glicosada na superfície do vírus, permitindo a ligação ao receptor da enzima conversora de angiotensina II (ACE 2) em células hospedeiras para promover a fusão das membranas celulares virais e do hospedeiro. Dado o seu papel indispensável na entrada e infectividade do vírus, a proteína S é um alvo promissor para o desenvolvimento de vacinas e a descoberta de drogas para bloquear as interações entre o vírus e as células hospedeiras. A proteína S foi revelado como um antígeno crucial para aumentar anticorpos neutralizantes e provocando proteção humoral assim com imunidade celular após infecção ou vacinação com vacinas baseada na proteína S (ZHANG et al., 2020).
Análise de bioinformática demonstrou que a proteína S de SARS-CoV-2 exibe características semelhantes às das proteínas S de outros CoVs, incluindo uma região S1 NTD, S1 CTD S2, uma região transmembranar e um pequeno domínio citoplasmático. A proteína S trimétrica do SARS-CoV-2 é clivada em S1 e S2 pelas proteases das células hospedeiras durante a infecção, na qual a subunidade S1 é responsável pela ligação ao receptor celular e s subunidade S2 é envolvida na entra viral (ZHANG et al., 2020).
A proteína S de SARS de SARS-CoV-2 contém uma sequência de reconhecimento da furina (PRRARSV), semelhante ao MERS-CoV (PRSVRSV). Por outro lado, a parte “PRRA” da sequência alvo da furina no local S1/S2 está ausente na proteína S de todos os outros SARS/ SARSr-CoVs. Somente o SARS-CoV-2 contém um potencial local de clivagem para proteases de furina. Essa característica indica que o SARS-CoV-2humano pode ganhar um mecanismo distinto para promover sua entrada nas células hospedeiras (YAN R; ZHANG Y; LI Y; XIA L, GUO Y; ZHOU Q, 2020).
O objetivo do presente trabalho é auxiliar no entendimento da COVID-19 em relação a origem do SARS-CoV-2, suas descobertas genômicas, patogenia, além da comparação com outros coronavírus através de análises usando softwares de bioinformática.
2. MATERIAS E MÉTODOS
2.1 Sequência gênica
A sequência gênica do microrganismo utilizada no presente estudo é denominada como Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) ela foi sequenciada no Brasil, na cidade de São Paulo. A sequência foi obtida no site da NCBI
– National Center for Biotechnology Information, contendo o seguinte número de acesso: MT126808.1
2.2 Gene de Interesse
O gene de interesse escolhido para as análises foi o Gene S (proteína de superfície), GenBank: MT126808.1. A sequência foi obtida no site da NCBI- National Center for Biotechnology Informartion, estando descrita abaixo:
ATGTTTGTTTTTCTTGTTTTATTGCCACTAGTCTCTAGTCAGTGTGTTAATCTTACAACCAGAACTCAAT TACCCCCTGCATACACTAATTCTTTCACACGTGGTGTTTATTACCCTGACAAAGTTTTCAGATCCTCAGT TTTACATTCAACTCAGGACTTGTTCTTACCTTTCTTTTCCAATGTTACTTGGTTCCATGCTATACATGTC TCTGGGACCAATGGTACTAAGAGGTTTGATAACCCTGTCCTACCATTTAATGATGGTGTTTATTTTGCTT CCACTGAGAAGTCTAACATAATAAGAGGCTGGATTTTTGGTACTACTTTAGATTCGAAGACCCAGTCCCT ACTTATTGTTAATAACGCTACTAATGTTGTTATTAAAGTCTGTGAATTTCAATTTTGTAATGATCCATTT TTGGGTGTTTATTACCACAAAAACAACAAAAGTTGGATGGAAAGTGAGTTCAGAGTTTATTCTAGTGCGA ATAATTGCACTTTTGAATATGTCTCTCAGCCTTTTCTTATGGACCTTGAAGGAAAACAGGGTAATTTCAA AAATCTTAGGGAATTTGTGTTTAAGAATATTGATGGTTATTTTAAAATATATTCTAAGCACACGCCTATT AATTTAGTGCGTGATCTCCCTCAGGGTTTTTCGGCTTTAGAACCATTGGTAGATTTGCCAATAGGTATTA ACATCACTAGGTTTCAAACTTTACTTGCTTTACATAGAAGTTATTTGACTCCTGGTGATTCTTCTTCAGG TTGGACAGCTGGTGCTGCAGCTTATTATGTGGGTTATCTTCAACCTAGGACTTTTCTATTAAAATATAAT GAAAATGGAACCATTACAGATGCTGTAGACTGTGCACTTGACCCTCTCTCAGAAACAAAGTGTACGTTGA AATCCTTCACTGTAGAAAAAGGAATCTATCAAACTTCTAACTTTAGAGTCCAACCAACAGAATCTATTGT TAGATTTCCTAATATTACAAACTTGTGCCCTTTTGGTGAAGTTTTTAACGCCACCAGATTTGCATCTGTT TATGCTTGGAACAGGAAGAGAATCAGCAACTGTGTTGCTGATTATTCTGTCCTATATAATTCCGCATCAT TTTCCACTTTTAAGTGTTATGGAGTGTCTCCTACTAAATTAAATGATCTCTGCTTTACTAATGTCTATGC AGATTCATTTGTAATTAGAGGTGATGAAGTCAGACAAATCGCTCCAGGGCAAACTGGAAAGATTGCTGAT TATAATTATAAATTACCAGATGATTTTACAGGCTGCGTTATAGCTTGGAATTCTAACAATCTTGATTCTA AGGTTGGTGGTAATTATAATTACCTGTATAGATTGTTTAGGAAGTCTAATCTCAAACCTTTTGAGAGAGA TATTTCAACTGAAATCTATCAGGCCGGTAGCACACCTTGTAATGGTGTTGAAGGTTTTAATTGTTACTTT CCTTTACAATCATATGGTTTCCAACCCACTAATGGTGTTGGTTACCAACCATACAGAGTAGTAGTACTTT
CTTTTGAACTTCTACATGCACCAGCAACTGTTTGTGGACCTAAAAAGTCTACTAATTTGGTTAAAAACAA ATGTGTCAATTTCAACTTCAATGGTTTAACAGGCACAGGTGTTCTTACTGAGTCTAACAAAAAGTTTCTG CCTTTCCAACAATTTGGCAGAGACATTGCTGACACTACTGATGCTGTCCGTGATCCACAGACACTTGAGA TTCTTGACATTACACCATGTTCTTTTGGTGGTGTCAGTGTTATAACACCAGGAACAAATACTTCTAACCA GGTTGCTGTTCTTTATCAGGATGTTAACTGCACAGAAGTCCCTGTTGCTATTCATGCAGATCAACTTACT CCTACTTGGCGTGTTTATTCTACAGGTTCTAATGTTTTCAAACACGTGCAGGCTGTTTAATAGGGGCTG AACATGTCAACAACTCATATGAGTGTGACATACCCATTGGTGCAGGTATATGCGCTAGTTATCAGACTCA GACTAATTCTCCTCGGCGGGCACGTAGTGTAGCTAGTCAATCCATCATTGCCTACACTATGTCACTTGGT GCAGAAAATTCAGTTGCTTACTCTAATAACTCTATTGCCATACCCACAAATTTTACTATTAGTGTTACCA CAGAAATTCTACCAGTGTCTATGACCAAGACATCAGTAGATTGTACAATGTACATTTGTGGTGATTCAAC TGAATGCAGCAATCTTTTGTTGCAATATGGCAGTTTTGTACACAATTAAACCGTGCTTTAACTGGAATA GCTGTTGAACAAGACAAAAACACCCAAGAAGTTTTTGCACAAGTCAAACAAATTTACAAAACACCACCAA TTAAAGATTTTGGTGGTTTTAATTTTCACAAATATTACCAGATCCATCAAAACCAAGCAAGAGGGATATT TATTGAAGATCTACTTTTCAACAAAGTGACACTTGCAGATGCTGGCTTCATCAAACAATATGGTGATTGC CTTGGTGATATTGCTGCTAGAGACCTCATTTGTGCACAAAAGTTTAACGGCCTTACTGTTTTGCCACCTT TGCTCACAGATGAAATGATTGCTCAATACACTTCTGCACTGTTAGCGGGTACAATCACTTCTGGTTGGAC CTTTGGTGCAGGTGCTGCATTACAAATACCATTTGCTATGCAAATGGCTTATAGGTTTAATGGTATTGGA GTTACACAGAATGTTCTCTATGAGAACCAAAAATTGATTGCCAACCAATTTAATAGTGCTATTGGCAAAA TTCAAGACTCACTTTCTTCCACAGCAAGTGCACTTGGAAAACTTCAAGATGTGGTCAACCAAAATGCACA AGCTTTAAACACGCTTGTTAAACAACTTAGCTCCAATTTTGGTGCAATTTCAAGTGTTTTAAATGATATC CTTTCACGTCTTGACAAAGTTGAGGCTGAAGTGCAAATTGATAGGTTGATCACAGGCAGACTTCAAAGTT TGCAGACATATGTGACTCAACAATTAATTAGAGCTGCAGAAATCAGAGCTTCTGCTAATCTTGCTGCTAC TAAAATGTCAGAGTGTGTACTTGGACAATCAAAAAGAGTTGATTTTTGTGGAAAGGGCTATCATCTTATG TCCTTCCCTCAGTCAGCACCTCATGGTGTAGTCTTCTTGCATGTGACTTATGTCCCTGCACAAGAAAAGA ACTTCACAACTGCTCCTGCCATTTGTCATGATGGAAAAGCACACTTTCCTCGTGAAGGTGTCTTTGTTTC AAATGGCACACACTGGTTTGTAACACAAAGGAATTTTTATGAACCACAAATCATTACTACAGACAACACA TTTGTGTCTGGTAACTGTGATGTTGTAATAGGAATTGTCAACAACACAGTTTATGATCCTTTGCAACCTG AATTAGACTCATTCAAGGAGGAGTTAGATAAATATTTTAAGAATCATACATCACCAGATGTTGATTTAGG TGACATCTCTGGCATTAATGCTTCAGTTGTAAACATTCAAAAAGAAATTGACCGCCTCAATGAGGTTGCC AAGAATTTAAATGAATCTCTCATCGATCTCCAAGAACTTGGAAAGTATGAGCAGTATATAAAATGGCCAT GGTACATTTGGCTAGGTTTTATAGCTGGCTTGATTGCCATAGTAATGGTGACAATTATGCTTTGCTGTAT GACCAGTTGCTGTAGTTGTCTCAAGGGCTGTTGTTCTTGTGGATCCTGCTGCAAATTTGATGAAGACGACTCTGAGCCAGTGCTCAAAGGAGTCAAATTACATTACACATAA
2.3 Sequências para análise final
Realizou-se pesquisas em alguns artigos científicos disponíveis com o objetivo de comparar a sequência do coronavírus do Brasil (SARS-CoV-2) com outras que apresentassem sequências de nucleotídeos e proteínas referente ao Gene S em seu genoma. As sequências foram obtidas no site da NCBI - National Center for Biotechnology Information, na plataforma BLAST e no formato FASTA. As mesmas foram salvas em blocos de notas e estão sendo demonstradas pela tabela 1.
Tabela 1. Número de acesso do GenBank das sequências e suas respectivas classificações.
NÚMERO DE ACESSO:	CLASSIFICAÇÃO:
	MT126808
	SARS-CoV-2/human/BRA/SP02
	MT350282.1
	SARS-CoV-2/human/BRA/SP02cc
	NC_045512.2
	SARS-CoV2 Wuhan-Hu-1 (isol 1)
	MH734115.1
	MERS-CoV camel/Kenya/C1272/2018
	MH259486.1
	MERS-CoV KSA_1723
	AY291315.1
	SARS coronavirus Frankfurt 1. Gene S (21492-25259)
	EF065511
	Bat coronavirus HKU5-3 (Betacoronavírus)
	JQ065048.1
	Wigeon coronavirus HKU20 (Deltacoronavirus)
	MK423876.1
	Pheasant coronavirus (Gamacoronavírus)
	MK334044.1
	Human coronavirus (Alfacoronavírus)
	MT040336.1
	Pangolin coronavirus isolate PCoV_GX-P5E
	MT072864.1
	Pangolin coronavirus isolate PCoV_GX-P2V
	GQ153548.1
	Bat SARS coronavirus HKU3-13. Gene S (2144425172)
	MK071267.1
	Coronavírus aviário AvCoV / Gallus gallus
	NC_003045.1
	Bovine coronavirus
	MT470219.1
	SARS-CoV-2/human/COL/Cali-01
	MT470179.1
	SARS-CoV-2/human/France/40002VJ
	MT467260.1
	SARS-CoV-2/human/IND/GBRC52
	MT461668.1
	SARS-CoV-2/human/USA/CT-UW-6576
	MT461654.1
	SARS-CoV-2/human/USA/WA-UW-6527
	MT419818.1
	SARS-CoV2/human/USA/PR-CDC-S9
	MT118835.1
	2019-nCoV/USA-CA9/2020
	MT077125.1
	SARS-CoV-2/human/ITA/INMI1
	MT270814.1
	SARS-CoV-2 / canino / HKG
	MT450872.1
	SARS-CoV-2/human/SRB/KV26
	MT457401.1
	SARS-CoV-2/mink/NED/NB04
	MT292569.1
	SARS-CoV-2/human/ESP/Valencia13
2.4 Análise das sequências de nucleotídeos e proteínas
Através das sequências escolhidas para a análise final obteve-se as sequências de nucleotídeos e proteínas de cada uma delas, baseadas no gene de interesse (Gene S), as mesmas foram aplicadas em softwares de bioinformática. A busca e a obtenção das sequências foram feitas e estão disponíveis no site da NCBI- National Center for Biotechnology Informartion.
2.5 Aplicação dos Softwares
Para a realização das análises das sequências e suas respectivas proteínas e nucleotídeos foi utilizado alguns softwares de bioinformática, sendo eles: O Clustal X
com o objetivo de alinhar a sequência para uma melhor análise dos resultados, em seguida foi utilizado o GeneDoc para exibir a estrutura da proteína e a sequência do gene, auxiliando também na edição e na organização da sequência, logo após utilizou-se o Mega, (nele está implementando o Clustal X), que foi responsável pela criação das árvores filogenéticas que através do seu alinhamento múltiplo permitiu determinar diferentes eventos evolutivo através das sequências, também utilizou-se o Vector 4.1 para uma representação esquemática da organização do genoma do SARS-CoV-2 e o mesmo também foi utilizado para o desenho dos primers. E por fim, para a visualização molecular da nossa proteína em formato tridimensional (surface glycoprotein) foi utilizado o Pymol.
2.6 UTILIZAÇÃO DO SWISS-MODEL
O SWILL-MODEL é um servidor web de bioinformática estrutural, ele foi utilizado para gerar modelos tridimensionais confiáveis de proteína. A sequência de proteínas utilizada no servidor foi a do GENE S em formato FAST do SARS-CoV-2 que foi sequenciada no Brasil, GenBank: QIG55994.1. A mesma foi retirada e está disponível do site da NCBI- - National Center for Biotechnology Information.
2.7 Pesquisa bibliográfica
A pesquisa bibliográfica foi realizada por meio de consulta à base de dados Scientific Eletronic Library Online (SciELO), PubMed e diversos artigos científicos disponíveis no Google Scholar. Após a análise do título, resumo e textos completos, foram utilizados artigos de revisão e originais, em língua portuguesa, inglesa e espanhola, pesquisados no período de 12 de junho a XX de junho de 2020. Utilizaram-se os seguintes descritores: SARS-CoV, SARS-CoV-2, covid-19, coronavirus, Wuhan, genome, structure, origem, transmission, evolução, zoonotic, genoma completo e todas as combinações de associação entre elas. Os artigos originais identificados foram incluídos nesta revisão, juntamente com artigos de suporte referenciados por estes.
3. RESULTADOS E DISCUSSÃO
3.1 Alinhamento de múltiplas sequências de nucleotídeos e proteínas
De acordo com Fernando Prosdocimi (2007) no alinhamento de sequências busca-se posicionar as bases de forma que as que forem iguais, ou semelhantes, fiquem em uma mesma coluna. Caso haja diferenças entre elementos de uma mesma coluna é sinal de que ocorreu uma mutação. Para completar um alinhamento realiza-se a inserção de gaps (buracos), que correspondem aos indels que ocorreram no processo evolutivo, isto é, inserções ou remoções de bases. Desta forma, um alinhamento ótimo é aquele que melhor representa o cenário de evolução das sequências.
Os métodos de alinhamento de sequências variam muito, pois baseiam-se principalmente na pontuação da dissimilaridade entre as sequências e no equilíbrio dessa pontuação com o intervalo que opera nas sequências.
No presente trabalho utilizou-se 27 sequências de nucleotídeos e proteínas, as mesmas foram descritas em “sequências para análises finais”. Para esse alinhamento foi utilizado o software Clustal X e os resultados estão demonstrados nas figuras 3 e 4.
Figura 3. Sequências de alinhamentos múltiplos obtido através de 27 sequências de proteínas de diferentes organismos de coronavírus.
Fonte: As autoras.
Legenda:Cada linha representa uma sequência, o gráfico abaixo representa o grau de conservação. Os símbolos indicam uma conservação de resíduos ou grupos de resíduos em uma coluna. Símbolo * (asterísco): posições que tem um único resíduo conservado ou totalmente; : (cólon): conservação entre os grupos de propriedades semelhantes fortemente, com uma pontuação maior do que 0,5 na matriz PAM 250; . (período): conservação entre os grupos de propriedades semelhantes fracamente, com uma pontuaçãO inferior a ou igual a 0,5 na matriz PAM 250.
Figura 4. Sequências de alinhamentos múltiplos obtido através de 27 sequências de nucleotídeos de diferentes organimos de coronavírus.
Fonte: As autoras.
Legenda:Cada linha representa uma sequência, o gráfico abaixo representa o grau de conservação. Os símbolos indicam uma conservação de resíduos ou grupos de resíduos em uma coluna. Símbolo * (asterísco): posições que tem um único resíduo conservado ou totalmente; : (cólon): conservação entre os grupos de propriedades semelhantes fortemente, com uma pontuação maior do que 0,5 na matriz PAM 250; . (período): conservação entre os grupos de propriedades semelhantes fracamente, com uma pontuaçãO inferior a ou igual a 0,5 na matriz PAM 250.
Figura 5. Sistemas de cores do ClustalX.
Fonte: Adaptado de Ifsc. Usp (2017).
Através dos alinhamentos foi possível analisar eventos revolucionários e restrições estruturais ou funcionais das sequências de nucleotídeos e proteínas, tornando possível entender a estrutura, a função e a evolução dos genes que compõem os organismos estudados. As cores permitem destacar os recursos conservados no alinhamento.
Espaçamentos (gaps) podem ser inseridos entre os resíduos para que caracteres semelhantes (por algum critério) sejam alinhados em colunas sucessivas. Se duas sequências em um alinhamento compartilham de um ancestral comum, discordâncias (mismatches) podem ser interpretados como mutações pontuais e os espaços (gaps) como inserções ou deleções introduzidas em uma ou ambas as sequências desde quando estas divergiram no tempo.
O Clustal X tem melhor desempenho quando alinha sequências de comprimento médio ou curto.
3.2 ÁRVORE FILOGENÉTICA
Filogenética é o estudo da história evolucionária dos organismos vivos (e alguns “nãovivos”) utilizando diagramas em forma de árvore que representa os organismos. Uma filogenia ou árvore filogenética é uma representação das relações genealógicas entre as espécies, entre os genes, entre populações ou mesmo entre indivíduos da mesma espécie (PEREIRA, 2016).
Para realizar uma análise filogenética são necessários cinco passos: primeiro, escolher um marcador genético. Segundo, realizar um alinhamento múltiplo. Terceiro, escolher o critério e o modelo evolutivo. Quarto, determinar o método de reconstrução filogenética. Quinto, verificar a sustentabilidade da topologia com testes estatísticos.
Os principais objetivos da filogenia são determinar a história evolutiva do gene, da função ou da espécie; caracterizar ancestrais; estimar o tempo de divergência entre dois organismos desde o último ancestral compartilhado e caracterizar famílias gênicas e proteícas.
As árvores filogenéticas a seguir foram projetadas a partir do software MEGA 4.1, através do método Neighbor Joining, com teste de filogenia Bootstrap, com “replications” à 2000 e “random seed” à 5000.
Figura 6. Árvore filogenética construída a partir de 27 sequências de nucleotídeos de diferentes organismos de coronavírus.
Fonte: As autoras.
Legenda: Árvore filogenética construída pelo software Mega 4.1 a partir de sequências de nucleotídeos de diferentes organismos de coronavírus, utilizando o método Nighbor-Joining. Uma análise de bootstrap foi feita com 5.000 repetições.
Figura 7. Árvore filogenética construída a partir de 27 sequências de proteínas de diferentes organismos de coronavírus.
Fonte: As autoras.
Legenda: Árvore filogenética construída pelo software Mega 4.1 a partir de sequências de proteínas de diferentes organismos de coronavírus, utilizando o método Nighbor-Joining. Uma análise de bootstrap foi feita com 5.000 repetições
De acordo com as árvores podemos perceber que o organismo mais similar com os dos SARS- CoV-2 foi o do Pangolin e também apresentou mais semelhanças com o Mocego.
Segundo um artigo publicado pela revista científica Nature, no dia 26 de março de 2020, pesquisadores chineses descobriram evidências de que um pequeno número de pangolins malaios (Manis Javanica) seja portador do novo coronavírus. Juntamente com os morcegos, os pangolins são os únicos mamíferos conhecidos por serem infectados
com cepas muito próximas à do novo coronavírus, embora, o estudo não comprove a relação dos pangolins com a atual pandemia, as evidências indicam a possibilidade de que essa espécie tenha contribuído para o surgimento do SARS-CoV-2.
Durante a realização do estudo, as sequências genéticas de diversas cepas de coronavírus encontradas em pangolins foram de 88,5% a 92,4% semelhantes às do novo coronavírus. O estudo alerta que a venda e o consumo de pangolins nos mercados de animais vivos devem ser rigorosamente proibidos para evitar futuras pandemias.
Segundo a Organização Mundial da Saúde (OMS), os morcegos são a fonte mais provável do novo coronavírus, mas provavelmente a transmissão ocorreu a outras espécies antes de infectar humanos.
3.3 MAPA GÊNICO
O ácido nucleico do novo coronavírus é um RNA de cadeia positiva, cuja as proteínas estruturais são Spike Protein (S), proteína de envelope (E), proteína de membrana (M) e fosfoproteína nucleocapsídica, e as proteínas não estruturais são of1ab, ORF3a, ORF6, ORF7a, ORF10 e ORF8.
Figura 8. Organização genômica do SARS-CoV-2.
Fonte: As autoras.
Legenda: Genoma linear desenvolvido através do software Vector NTI 4.0 com a sequência completa do SARS-CoV-2 sequenciada no Brasil obtida através do site NCBI.
3.4 DESENHO DOS PRIMERS
A partir do gene S do SARS-CoV-2 e através do software Vector NTI 4.0 foi construído o desenho dos primers que estão demonstrados a seguir.
Contains region of the molecule from 13818 to 13967
Tn: 69.2ºC
Sense Primer:
#F 5 CCTCGTCTATGCTTTAAGGATTT ’3
Antisense Primer:
#R 5’GCGTATACGCGTAATATATCTGGG ‘3
Contains region of the molecule from 13834 to 13967
Tn: 68.2ºC
Sense primer:
#F 5’AGGCATTTTGATGAAGGTAATTGTG’3
Antisense Primer:
#R 5’ GCGTATACGCGTAATATATCTGGG’3
Contains region of the molecule from 13834 to 13968
Tn: 68.4ºC
Sense Primer:
#F 5’AGGCATTTTGATGAAGGTAATTGTG’3 #R 5’GGCGTATACGCGTAATATATCTGG’3
3.5 PROTEÍNAS
Para que ocorra o processo de infecção pelo SARS-CoV-2 a proteína S (spike) da superfície viral precisa ser ativada para ligar-se ao receptor celular de entrada. O processo de iniciação e ativação da proteína S é mediado por proteases da célula hospedeira, destacando-se a Transmembrane Protease Serine 2 (TMPRSS2)15. Saber deste mecanismo da infecção é fundamental para indicar alvos alternativos de terapia,
seja inibindo farmacologicamente os receptores ACE1/ACE2 ou mesmo inativando a proteína S com anticorpos monoclonais18 (DUARTE; QUINTANA, 2020).
A sequência de proteínas utilizada. no servidor web Swiss-Model foi a do GENE S em formato FAST do SARS-CoV-2 que foi sequenciada no Brasil, desse modo, através do sistema originou-se um comparativo da proteína com maior semelhança, que foi a spike glycoprotein com 99,59% semelhante. Os arquivos no formato PDB da conformação refinada e da experimental foram submetidos ao programa Pymol, para gerar as conformações tridimensionais.
Figura 9. Modelagem 3D da Spike Glycoprotein.
Fonte: Swiss-Model.
SPIKE GLYCOPROTEIN
Figura 10. Estrutura da proteína spike glycoprotein.
Legenda: A) representação em formato Lines; B) representação em formato Sticks; C) representação em formato Cartonn.
Em formato Cartonn os átomos da cadeia leteral são ignorados e as linhas suaves são desenvolvidas através da cadeia principal da proteína. Nessa representação hélices e alfas são indicadas como fitas e setas respectivamente. Na representação padrão, os átomos de carbonos são indicados em verdes, o nitrogênio em azul, o oxigênio em vermelho, enxofre em amarelo, e fósforo em laranja. Os átomos de hidrogênio são representados em branco, mas eles não são normalmente visíveis numa estrutura cristalina.
Figura 11. Estruruta da spike glycoprotein e molde obtido.
Legenda: A) Representação da spyke glycoprotein; B) Representação do molde obtido; C) Alinhamento da spyke glycoprotein com o molde obtido.
A proteína utilizada como molde foi a Receptor-type tyrosine-protein phosphatase S, Spyke glycoprotein, Fibritin com 98,45% de semelhança.
4. CONCLUSÃO
Concluímos que é de extrema importância obter mais dados genéticos e funcionais sobre o SARS-CoV-2, pois a sua evolução viral e patogenicidade ainda é desconhecida. A epidemia também pode ser conhecida como um impacto nos fenômenos que envolvem as inter relações do homem com a natureza, é o momento para alcançar abordagens de relevância entre a saúde animal e humana, usando isso como um elemento chave para muitas doenças emergentes. Ainda assim, torna-se muito importante estudos em animais, o sequenciamento do vírus em casos muito precoces e identificação dos parentes mais próximos do SARS-CoV-2 em animais.
Portanto, a falta de vacina contra a COVID-19 reforça entre a população, em geral, a adoção das medidas contra a infecção, por se tratar de uma doença com alta taxa de transmissibilidade.
A proteína S mostrou-se um grande alvo promissor para o desenvolvimento da vacina, além disso, a mesma foi revelada como um antígeno crucial para aumentar anticorpos neutralizantes, provocando proteção humoral, assim, com imunidade celular após infecção ou vacinação com vacinas baseada na proteína S.
REFERÊNCIAS
CHAOLIN, Huang et al. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. Disponível em: https://pubmed.ncbi.nlm.nih.gov/31986264/. Acesso em: 12.jun.2020.
Cui J, Li F, Shi ZL. Origin and evolution of pathogenic coronaviruses. Nat Rev Microbiol 2019; 17: 181-92. doi: 10.1038/s41579-018-0118-9.
DUARTE, Geraldo; QUINTANA, Silvana Maria. Infecção pelo Coronavírus SARS-CoV-2 em obstetrícia. Disponível em: https://www.sogesp.com.br/noticias/infeccao-pelo-coronavirus-sars- cov-2-em-obstetricia-enfrentando-o-desconhecido/.Acesso em: 01.jul.2020.
GUO, Yan-Rong; CAO, Qing-Dong; HONG, Zhong-Si et al. The origin, transmission and clinical therapies on coronavirus disease 2019(COVID-19) outbreak - an update on the status. Disponível em: https://pubmed.ncbi.nlm.nih.gov/32169119/. Acesso em: 12.jun.2020.
HOFFMANN, M et al. SARS-CoV-2 Cell Entry Depends on ACE2 and TMPRSS2 and Is Blocked by a Clinically Proven Protease Inhibitor. Disponível em: https://www.sciencedirect.com/science/article/pii/S0092867420302294. Acesso em: 10.jun.2020.
HUANG, C et al. Clinical feature of patients infected with 2019 novel coronavirus in Wuhan, China. Disponível em: https://www.thelancet.com/journals/lancet/article/PIIS0140- 6736(20)30183-5/fulltext. Acesso em: 14.jun.2020.
Lam, T.T., Shum, M.H., Zhu, H. et al. Identifying SARS-CoV-2 related coronaviruses in Malayan pangolins. 2020 Mar. Disponível em: https://www.nature.com/articles/s41586-020- 2169-0. Acesso em: 28.jun.2020.
Letko M, Marzi A, Munster V. Functional assessment of cell entry and receptor usage for SARS-CoV-2 and other lineage B betacoronaviruses. Nat Microbiol. 2020; 5 (4): 562-569.
LIMA, Luana Nepomuceno Gondim Costa; SOUSA, Maisa Silva; LIMA, Karla Valéria Batista. As descobertas genômicas do SARS-CoV-2 e suas implicações na pandemia de COVID-19.
Disponível em: https://periodicos.unichristus.edu.br/jhbs/article/view/3232/1108. Acesso em: 06.jun.2020
Lu R, Zhao X, Li J, Niu P, Yang B, Wu H, et al. Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding. Lancet.
2020;395(10224):565–74.
MD, Jasper Fuk-Woo Chan et al. A familial cluster of pneumonia associated with the 2019 novel coronavirusi ndicating person‐to‐person transmission: a study of a family cluste. Disponível em: https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(20)30154- 9/fulltext. Acesso em: 12.jun.2020.
PEREIRA, Anderson Alvarenga. Construção e interpretação de árvores filogenéticas utilizando o MEGA. Disponível em: https://www.passeidireto.com/arquivo/23284132/arvores- filogeneticas-utilizando-o-mega-manual-mega-prof-anderson-alvarenga-pere. Acesso em: 28.jun.2020.
PROSDOCIMI, Fernando. Alinhamento de sequências. Disponível em: http://professor.pucgoias.edu.br/SiteDocente/admin/arquivosUpload/18497/material/Cap.%203% 20Alinhamento%20de%20sequ%C3%AAncias.pdf. Acesso em: 10.jun.2020.
Velavan TP, Meyer CG. The COVID-19 epidemic. Trop Med Int Heal. 2020;25(3):278–80.
WRAPP, D et al. Cryo-EM structure of the 2019-nCoV spike in the prefusion conformation. Science (New York, N.Y.), v. 367, n. 6483, p. 1260–1263, 13 2020.
Yan R, Zhang Y, Li Y, Xia L, Guo Y, Zhou Q. Structural basis for the recognition of SARS- CoV-2 by full-length human ACE2. Science. 2020;367(6485):1444–8.
ZHANG, Yong & Zhao et al. Site-specific N-glycosylation Characterization of Recombinant SARS-CoV-2 Spike Proteins using High-Resolution Mass Spectromet. Disponível em: https://www.biorxiv.org/content/10.1101/2020.03.28.013276v2> Acesso em: 14 de junho de 2020.

Continue navegando