Buscar

Prova 1 Bioinformática

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade de Brasília
Prova 1 - Bioinformática
Brasília - DF
2019
Sumário
1	Gene Alvo	5
2	Localização Genômica	5
2.1	Quais as coordenadas genômicas exatas do gene?	5
2.2	Utilizando o genome browser do ensembl mostre uma figura da posição do gene no genoma. Encontre um fator de zoom de tal maneira que seu gene fique no centro e ladeado pelos genes vizinhos (anterior e posterior)	5
2.3	Qual a distância exata (em bases) do seu gene para os seus vizinhos acima. Mostre em uma tabela contendo as seguintes colunas (nome/código do gene, início, fim, distância para seu gene alvo)…	6
3	Bancos de Dados Gerais	6
3.1	Qual o Ensembl Gene ID?	6
3.2	Forneça uma breve descrição da função deste gene	6
3.3	O seu gene existe em camundongo (Mus musculus)? Forneça o termo de busca no banco Gene e o link para o resultado.	6
3.4	Em quais classes do Gene Ontology seu gene é classificado?	6
3.5	Quantas referências bibliográficas existem para este gene, entre 2013 a 2017? Liste as 5 primeiras e mostre os termos de busca no pubmed	7
4	Ácidos Nucléicos	8
4.1	Quais os códigos para a entrada do DNA genômico nos bancos EMBL e DDBJ?	8
4.2	Mostre a figura com a estrutura do gene em termos de éxons e íntrons	8
4.2.1	A partir do Ensembl genome browser	8
4.2.2	USCS genome browser	9
4.3	Quantos transcritos este gene possui? Forneça os IDs.	9
4.4	Qual o tamanho do maior éxon e do maior íntron?	9
4.5	Quantos éxons possui o primeiro transcrito da sua lista?	9
4.6	Existem genes homólogos ao seu em outras espécies? Mostre um screenshot da página do banco que possui estas informações	9
5	Variações Genéticas	10
5.1	Quantos SNPs foram reportados para este gene no dbSNP?	10
5.2	Destes SNPs quantos são patogênicos de acordo com o ClinVar e quantos são patogênicos com uma mutação do tipo frameshift?	10
5.3	Existe uma doença mendeliana associada com o gene? Forneça o código do OMIM e uma breve descrição	10
5.4	Para o seu gene busque o SNP patogênico que possui a maior frequência MAF no projeto 1000 genomes	11
5.4.1	Indique o ID do dbSNP (com link)	11
5.4.2	Mostre um screenshot da frequência alélica deste nas 5 principais populações do 1000 genomes..	11
6	Proteínas	11
6.1	Qual o código do Uniprot?	11
6.1.1	Esta proteína está o SwissProt?	11
6.2	Quais os domínios proteícos do presentes nesta proteína? Crie uma tabela com o Pfam ID, Pfam accession e Intrepro ID	11
6.2.1	Mostre uma figura esquemática com os domínios conservados	12
6.3	Mostre uma figura da estrutura tridimensional desta proteína, fornecendo o PDB ID (forma de link)	12
6.4	Se o seu gene for uma enzima qual é seu EC number?	12
6.4.1	Mostre um screenshot da página correspondente no banco Enzyme	12
6.5	A partir do banco de enzimas BRENDA identifique:	12
6.5.1	Forneça uma figura e o link da reação catalizada pela enzima (REACTION DIAGRAM)…	13
6.5.2	Forneça uma tabela com o valor do KM da enzima	13
6.5.3	Mostre a figura de uma via metabólica que a sua enzima participa dentro do banco KEGG….	13
7	Outros Bancos Proteícos	13
7.1	Qual é a sua função?	13
7.2	Qual o pubmed id de uma publicação contendo o termo reactome no título em 2014?..	13
7.3	Mostre um screenshot da página do Reactome com o resultado da pesquisa (primeira entrada Reaction) com o EC number do seu gene	13
8	Buscas Integradas em Bancos de Dados	13
8.1	Quantos genes de microRNAs existem no cromossomo onde se encontra o seu gene?..	13
8.2	Forneça a tabela do BioMart (20 primeiras linhas) com as seguintes informações sobre os genes de microRNAs encontrados: Chromosome name, Gene start (bp), Gene end (bp), Strand, Ensembl gene ID, Description, miRBase ID	13
8.3	Qual o tamanho (em pares de bases) do maior destes genes. Indique também o Ensembl gene ID……	14
8.4	No BioMart busque no genoma de camundongo todos os genes que possuam pelo menos algum os domínio Pfam que esteja presente no seu gene designado e que estejam nos cromossomos de 1 a 5	15
8.4.1	Mostre um screenshot da página do BioMart com os filtros utilizados	15
8.4.2	Mostre as 20 primeiras linhas da planilha com os resultados finais, contendo as colunas acima (exceto miRBase ID)	15
8.4.3	Com a planilha de resultados salva no formato XLS (Excel), crie um gráfico de pizza dos Interpro ID para mostrar a distribuição de todos os domínios que ocorrem na planilha obtida do BioMart. (Dica: inclua o Interpro Id nos “attributes” da saída)	16
Lista de figuras
Figure 1 – Posição do gene HBA1 (centro) no genoma humano. O gene é flanqueado anteriormente por HBA2 e posteriormente por HBQ1. Imagem feita com o Genome Browser do banco Ensembl.	5
Figure 2 – Termo de busca utilizado no banco Gene com o objetivo de encontrar o gene HBA1 em Mus musculus.	6
Figure 3 – Termos GO, do gene HBA1, para a classe Function do Gene Ontology. Entrada no banco Gene.	6
Figure 4 – Termos GO, do gene HBA1, para a classe Process do Gene Ontology. Entrada no banco Gene.	7
Figure 5 – Termos GO, do gene HBA1, para a classe Component do Gene Ontology. Entrada no banco Gene.	7
Figure 6 – Termos de busca do PubMed para as referências bibliográficas do gene HBA1 entre 2013 e 2017.	7
Figure 7 – Estrutura do gene HBA1 em termos de éxons e introns. Imagem feita com o Genome Browser do Ensembl.	8
Figure 8 – Estrutura do gene HBA1 em termos de éxons e introns. Imagem feita com o Genome Browser do USCS.	9
Figure 9 – Árvore gênica para o gene HBA1 humano e seus homólogos em outros organismos. Imagem feita a partir da entrada do gene HBA1 no banco Ensembl.	10
Figure 10 – Printscreen do banco dbSNP para a entrada da SNP patogênica, do gene HBA1 humano, com a maior MAF. Pode-se observar as frequências alélicas nas cinco principais populações do 1000 genomes.	11
Figure 11 – Ilustração do domínio conservado Globina da proteína Hemoglobina.	12
Figure 12 – Estrutura tridimensional da proteína Hemoglobina. Ilustração 3D retirada do banco PDB, entrada 1A00.	12
Figure 13 – Screenshot da página do BioMart com os filtros utilizados para a pesquisa solicitada.	15
Figure 14 - Screenshot da página do BioMart. Pode-se observar que a tabela com os resultados para a busca solicitada retornou vazia.	15
1 Gene Alvo
O gene alvo do presente trabalho é o HBA1 de Homo sapiens, cujo gene ID é: 3039.
2 Localização Genômica
2.1 Quais as coordenadas genômicas exatas do gene?
O gene está localizado no cromossomo 16, braço p e banda 13.3. Suas coordenadas genômicas exatas, no GRCh38, são: Cromossomo 16: 176,680-177,522 – fita líder.
2.2 Utilizando o genome browser do ensembl mostre uma figura da posição do gene no genoma. Encontre um fator de zoom de tal maneira que seu gene fique no centro e ladeado pelos genes vizinhos (anterior e posterior)
Figure 1 – Posição do gene HBA1 (centro) no genoma humano. O gene é flanqueado anteriormente por HBA2 e posteriormente por HBQ1. Imagem feita com o Genome Browser do banco Ensembl.
2.3 Qual a distância exata (em bases) do seu gene para os seus vizinhos acima. Mostre em uma tabela contendo as seguintes colunas (nome/código do gene, início, fim, distância para seu gene alvo).
Tabela 1 – Genes codificadores de proteínas, na região 172822-181366 do cromossomo 16 do genoma humano.
	Gene name
	Gene stable ID
	Gene start (bp)
	Gene end (bp)
	Distance to HBA1 (bp)
	HBA2
	ENSG00000188536
	172876
	173710
	2970
	HBA1
	ENSG00000206172
	176680
	177522
	0
	HBQ1
	ENSG00000086506
	180459
	181179
	2937
3 Bancos de Dados Gerais 
3.1 Qual o Ensembl Gene ID?
O Ensembl Gene ID correspondente é: ENSG00000206172.
3.2 Forneça uma breve descrição da função deste gene
Esse gene codifica para a subunidade de um proteína que possui a função de realizar o transporte de oxigênio dos pulmões para os outros tecidos do corpo humano. 
3.3 O seu gene existe em camundongo (Mus musculus)? Forneça o termo de busca no banco Gene e o link para o resultado.
Sim, o gene HBA1 existe em camundongo. O Gene ID correspondente é: 15122.
Figure 2 – Termo de busca utilizado no banco Gene com o objetivo de encontrar o gene HBA1 em Mus musculus.
3.4 Em quais classes do Gene Ontology seu gene é classificado?
Os termosGO para o gene HBA1 podem ser visualizados nas figuras abaixo. 
Figure 3 – Termos GO, do gene HBA1, para a classe Function do Gene Ontology. Entrada no banco Gene.
Figure 4 – Termos GO, do gene HBA1, para a classe Process do Gene Ontology. Entrada no banco Gene.
Figure 5 – Termos GO, do gene HBA1, para a classe Component do Gene Ontology. Entrada no banco Gene.
3.5 Quantas referências bibliográficas existem para este gene, entre 2013 a 2017? Liste as 5 primeiras e mostre os termos de busca no pubmed
Existe no total 128 referências para esse gene no período solicitado. Os PMID’s dos 5 primeiros resultados são: 29210290, 29205277, 29232697, 28993156, 29049312.
Figure 6 – Termos de busca do PubMed para as referências bibliográficas do gene HBA1 entre 2013 e 2017.
4 Ácidos Nucléicos
4.1 Quais os códigos para a entrada do DNA genômico nos bancos EMBL e DDBJ?
Os códigos para a entrada do DNA genômico no banco EMBL é: J00153.1, e a entrada no banco DDBJ é: J00153.
4.2 Mostre a figura com a estrutura do gene em termos de éxons e íntrons
4.2.1 A partir do Ensembl genome browser
Figure 7 – Estrutura do gene HBA1 em termos de éxons e introns. Imagem feita com o Genome Browser do Ensembl.
4.2.2 USCS genome browser
Figure 8 – Estrutura do gene HBA1 em termos de éxons e introns. Imagem feita com o Genome Browser do USCS.
4.3 Quantos transcritos este gene possui? Forneça os IDs.
Esse gene possui 4 transcritos, sendo 2 deles codificadores de proteínas. Os IDs dos transcritos são: ENST00000320868.9, ENST00000472694.1, ENST00000397797.1, ENST00000487791.1.
4.4 Qual o tamanho do maior éxon e do maior íntron?
O maior éxon possui 243 pares de bases, já o maior intron possui 148 pares de base.
4.5 Quantos éxons possui o primeiro transcrito da sua lista?
O primeiro transcrito da minha lista possui 3 exons. 
4.6 Existem genes homólogos ao seu em outras espécies? Mostre um screenshot da página do banco que possui estas informações
Existem ao todo 234 genes homólogos reportados até o momento, de acordo com o banco Ensembl. Esses genes homológos podem ser visualizados na árvore gênica representada pela figura abaixo. Ainda Segundo o mesmo banco essa árvore faz parte de uma super árvore gênica (composta por 15 árvores) que reúne um total de 2005 genes.
Figure 9 – Árvore gênica para o gene HBA1 humano e seus homólogos em outros organismos. Imagem feita a partir da entrada do gene HBA1 no banco Ensembl. 
5 Variações Genéticas
5.1 Quantos SNPs foram reportados para este gene no dbSNP?
Foram reportados 1189 SNPs para o gene HBA1 no banco dbSNP.
5.2 Destes SNPs quantos são patogênicos de acordo com o ClinVar e quantos são patogênicos com uma mutação do tipo frameshift?
De acordo com o ClinVar, apenas 18 SNPs são patogênicas. Nenhuma delas apresenta mutação do tipo frameshift.
5.3 Existe uma doença mendeliana associada com o gene? Forneça o código do OMIM e uma breve descrição
Existem 5 doenças mendelianas associada com o gene HBA1. Os códigos para o OMIM são: 617981, 617973, 613978, 604131, 140700. Podemos descrever brevemente a doença Eritrocitose Familial 7, que é a primeira da lista de IDs, como: Uma doença caracterizada pelo aumento da afinidade da Hemoglobina pelo oxigênio, de tal forma que a entrega de O2 para os tecidos do corpo é prejudicado, tendo em vista que essa gás não se dissocia da proteína. 
5.4 Para o seu gene busque o SNP patogênico que possui a maior frequência MAF no projeto 1000 genomes
5.4.1 Indique o ID do dbSNP (com link)
O ID da dbSNP com a maior frequência MAF é: rs1060339.
5.4.2 Mostre um screenshot da frequência alélica deste nas 5 principais populações do 1000 genomes.
Figure 10 – Printscreen do banco dbSNP para a entrada da SNP patogênica, do gene HBA1 humano, com a maior MAF. Pode-se observar as frequências alélicas nas cinco principais populações do 1000 genomes.
6 Proteínas
6.1 Qual o código do Uniprot?
O Código do UniProt é: P69905.
6.1.1 Esta proteína está o SwissProt?
Sim, a proteína está no SwissProt.
6.2 Quais os domínios proteícos do presentes nesta proteína? Crie uma tabela com o Pfam ID, Pfam accession e Intrepro ID
A proteína Hemoglobina, que é composta pela subunidade alfa, possui apenas um domínio, sendo esse o domínio Globina. 
Tabela 2 – Informações dos bancos de dados para o domínio proteíco da Hemoglobina
	Pfam accession
	Pfam ID
	Interpro ID
	Globin
	PF00042
	IPR000971
 
6.2.1 Mostre uma figura esquemática com os domínios conservados
Figure 11 – Ilustração do domínio conservado Globina da proteína Hemoglobina. 
6.3 Mostre uma figura da estrutura tridimensional desta proteína, fornecendo o PDB ID (forma de link)
Essa proteína possui várias entradas para o estruturas 3D no PDB. Uma dessas entradas corresponde a figura abaixo, e seu PDB ID é: 1A00.
Figure 12 – Estrutura tridimensional da proteína Hemoglobina. Ilustração 3D retirada do banco PDB, entrada 1A00.
6.4 Se o seu gene for uma enzima qual é seu EC number?
6.4.1 Mostre um screenshot da página correspondente no banco Enzyme
A Hemoglobina não é uma enzima, logo não possui um EC number.
6.5 A partir do banco de enzimas BRENDA identifique:
A Hemoglobina não é uma enzima, logo não possui um EC number.
6.5.1 Forneça uma figura e o link da reação catalizada pela enzima (REACTION DIAGRAM)
6.5.2 Forneça uma tabela com o valor do KM da enzima
6.5.3 Mostre a figura de uma via metabólica que a sua enzima participa dentro do banco KEGG
7 Outros Bancos Proteícos
O banco de dados Reactome, não foi estudado na disciplina, responda:
7.1 Qual é a sua função?
O Reactome é um banco de dados curado e revisado por pares que fornece informações a respeito de vias metabólicas
7.2 Qual o pubmed id de uma publicação contendo o termo reactome no título em 2014?
O PMID da publicação correspondente é: 24243840.
7.3 Mostre um screenshot da página do Reactome com o resultado da pesquisa (primeira entrada Reaction) com o EC number do seu gene
A Hemoglobina não é uma enzima, logo não possui um EC number.
8 Buscas Integradas em Bancos de Dados
8.1 Quantos genes de microRNAs existem no cromossomo onde se encontra o seu gene? 
Existem ao todo 79 genes de miRNA no cromossomo 16 humano, aonde está localizado o gene HBA1. 
8.2 Forneça a tabela do BioMart (20 primeiras linhas) com as seguintes informações sobre os genes de microRNAs encontrados: Chromosome name, Gene start (bp), Gene end (bp), Strand, Ensembl gene ID, Description, miRBase ID
	Chromosome/scaffold name
	Gene start (bp)
	Gene end (bp)
	Strand
	Gene stable ID
	Gene description
	miRBase ID
	16
	770183
	770277
	1
	ENSG00000207579
	microRNA 662 [Source:HGNC Symbol;Acc:HGNC:32918]
	hsa-mir-662
	16
	30893903
	30893985
	1
	ENSG00000211591
	microRNA 762 [Source:HGNC Symbol;Acc:HGNC:37303]
	hsa-mir-762
	16
	83508346
	83508408
	1
	ENSG00000263785
	microRNA 3182 [Source:HGNC Symbol;Acc:HGNC:38317]
	hsa-mir-3182
	16
	16306370
	16306434
	1
	ENSG00000264722
	microRNA 3670-2 [Source:HGNC Symbol;Acc:HGNC:43460]
	hsa-mir-3670-1
	16
	16306370
	16306434
	1
	ENSG00000264722
	microRNA 3670-2 [Source:HGNC Symbol;Acc:HGNC:43460]
	hsa-mir-3670-2
	16
	16306370
	16306434
	1
	ENSG00000264722
	microRNA 3670-2 [Source:HGNC Symbol;Acc:HGNC:43460]
	hsa-mir-3670-3
	16
	16306370
	16306434
	1
	ENSG00000264722
	microRNA 3670-2 [Source:HGNC Symbol;Acc:HGNC:43460]
	hsa-mir-3670-4
	16
	76868936
	76869019
	1
	ENSG00000266426
	microRNA 4719 [Source:HGNC Symbol;Acc:HGNC:41807]
	hsa-mir-4719
	16
	2271747
	2271840
	1
	ENSG00000284346
	microRNA 940 [Source:HGNC Symbol;Acc:HGNC:33683]
	hsa-mir-940
	16
	81611348
	81611408
	1
	ENSG00000275109
	microRNA 6504 [Source:HGNC Symbol;Acc:HGNC:49976]
	hsa-mir-6504
	16
	2445392
	2445457
	1
	ENSG00000283180
	microRNA 6767 [Source:HGNC Symbol;Acc:HGNC:50133]
	hsa-mir-6767
	16
	21506049
	21506135
	-1
	ENSG00000265462
	microRNA 3680-1 [Source:HGNC Symbol;Acc:HGNC:38989]
	hsa-mir-3680-1
	16
	21506049
	21506135
	-1
	ENSG00000265462
	microRNA 3680-1 [Source:HGNC Symbol;Acc:HGNC:38989]
	hsa-mir-3680-2
	16
	56245520
	56245623
	1
	ENSG00000265281
	microRNA 3935 [Source:HGNCSymbol;Acc:HGNC:38918]
	hsa-mir-3935
	16
	2090195
	2090284
	-1
	ENSG00000221656
	microRNA 1225 [Source:HGNC Symbol;Acc:HGNC:33931]
	hsa-mir-1225
	16
	3485381
	3485469
	-1
	ENSG00000273776
	microRNA 6126 [Source:HGNC Symbol;Acc:HGNC:50099]
	hsa-mir-6126
	16
	4671318
	4671390
	1
	ENSG00000276641
	microRNA 6769a [Source:HGNC Symbol;Acc:HGNC:50079]
	hsa-mir-6769a
	16
	28724252
	28724321
	1
	ENSG00000278340
	microRNA 6862-2 [Source:HGNC Symbol;Acc:HGNC:50192]
	hsa-mir-6862-1
	16
	28724252
	28724321
	1
	ENSG00000278340
	microRNA 6862-2 [Source:HGNC Symbol;Acc:HGNC:50192]
	hsa-mir-6862-2
	16
	543277
	543366
	1
	ENSG00000266235
	microRNA 3176 [Source:HGNC Symbol;Acc:HGNC:38345]
	hsa-mir-3176
Tabela 3 – 20 primeiros resultados para os genes de miRNA encontrados no cromossomo 16 humano.
8.3 Qual o tamanho (em pares de bases) do maior destes genes. Indique também o Ensembl gene ID 
O maior desses genes possui 103 pares de bases. Seu ENSEMBL ID é: ENSG00000265281.
8.4 No BioMart busque no genoma de camundongo todos os genes que possuam pelo menos algum os domínio Pfam que esteja presente no seu gene designado e que estejam nos cromossomos de 1 a 5
8.4.1 Mostre um screenshot da página do BioMart com os filtros utilizados
Figure 13 – Screenshot da página do BioMart com os filtros utilizados para a pesquisa solicitada.
8.4.2 Mostre as 20 primeiras linhas da planilha com os resultados finais, contendo as colunas acima (exceto miRBase ID)
Não há nenhum gene nos cromossomos 1, 2, 3, 4 e 5 de camundongo que possua o domínio Globina. 
Figure 14 - Screenshot da página do BioMart. Pode-se observar que a tabela com os resultados para a busca solicitada retornou vazia.
8.4.3 Com a planilha de resultados salva no formato XLS (Excel), crie um gráfico de pizza dos Interpro ID para mostrar a distribuição de todos os domínios que ocorrem na planilha obtida do BioMart. (Dica: inclua o Interpro Id nos “attributes” da saída)
Não houve resultados para a pesquisa solicitada.

Continue navegando