Baixe o app para aproveitar ainda mais
Prévia do material em texto
Ministério da Educação UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Câmpus Dois Vizinhos Professora Dra. Betty Cristiane Kuhn Curso Engenharia de Bioprocessos e Biotecnologia Disciplina Bioinformática Turma 6EB1 Acadêmico Alisson Roegelin Dos Santos Data 16/03/18 Atividade Inicial – Conhecendo o banco de dados Dados a serem usados: 1 - Homo sapiens insulin receptor (desejado receptor de insulina em Homo sapiens) 2 - Zea mays beta-glucosidase (desejado beta glucosidase em Zea mays) 3 - Mus musculus ferredoxin (desejado ferrodoxina em Mus musculus) 4 - Canis lúpus NADH dehydrogenase (desejado NADH deidrogenase em Canis lúpus) 5 - Homo sapiens Keratin (desejado keratina em Homo sapiens) 6 - Oryza sativa ribosomal protein (desejado proteína ribossomal em Oryza sativa) 7 - Saccharomyces cerevisiae Cytochrome c (desejado citocromo c em Saccharomyces cerevisiae) Atividade -1. Busca com limitadores de campo Nesta primeira atividade vamos simular a busca por um transcrito especifico. É necessário lembrar que todo o banco se encontra em inglês e que, portanto, é este o idioma que deve ser utilizado nas buscas (exceto pelos nomes de espécies em latim). Entre no site NCBI selecione na busca “nucleotide” https://www.ncbi.nlm.nih.gov/ Ou vá direto em: http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore Escolha um ítem da lista. Entre as palavras chave “espécie e proteína”. (sempre substituindo os dados pelas palavras chaves fornecidas no arquivo) Clique no botão “Search” Quantas registros retornaram desta busca? (Desconsidere a princípio a caixa amarela da busca no banco Gene). Resposta: 265 Quais as classes em que estas sequências estão agrupadas e quantas sequencias em cada classe? (Nucleotide; EST; GSS (curtas sequencias primárias de genomas); protein...) Resposta: Nucleotídeo (265) EST ( 57 ) Considerando que você deseja obter a sequência completa do gene sem íntrons, qual seria o melhor banco a ser procurado? Resposta: procuro só no EST. https://www.ncbi.nlm.nih.gov/nucest?term=Zea%20mays%20beta-glucosidase 4) Examine os registros da página 1 e determine o organismo de origem desta sequência e a função descrita para a proteína codificada. Todos eles são registros da espécie que você tem interesse? Resposta: Não. Esse organismo não o que eu procurei, “Streptomyces coelicolor A3(2) chromosome, complete genome. Todos eles são registros relacionados à proteína que você tem interesse? Resposta: Não. O primeiro item da pesquisa mostra “Zea mays cultivar B73 chromosome 10, B73 RefGen_v4, whole genome shotgun sequence” que não é meu genê de interesse Por que estes registros estão sendo recuperados com estas palavras chaves? Resposta: Minha pesquisa não foi muito delineada, eu deveria ter feito uma pesquisa mais delineada. Todas as sequências encontradas correspondem a genes? Por que? Resposta: Não, pois procurarei por nucleotídeos. 5) Realize a busca novamente utilizando as palavras chave “espécie [orgn] proteína”. Neste caso a busca das palavras estará delimitada à espécie de interesse no campo de descrição do organismo. Quantos registros foram recuperados desta vez? Resposta: 130 Quais as classes em que estas sequências estão agrupadas e quantas sequencias em cada classe? (Nucleotide EST GSS (curtas sequencias primárias de genomas) ...) Resposta: Nucleotídeos (130) EST (16). Todos eles são registros da espécie que você tem interesse? Resposta: Sim, na primeira página não ouve discrepância de resultado para outro organismo. Todos eles são registros relacionados à proteína que você tem interesse? Resposta: Não, teve sobre “cultivar B73 chromosome 4, whole genome shotgun sequence”, que não é especificadamente sobre o termo da minha busca. 6) Realize uma ultima vez a busca agora utilizando as palavras chave ” espécie [orgn] proteína [titl]”. Neste caso também estamos limitando a busca da proteína no título do deposito. Quantos registros foram recuperados desta vez? Resposta: 53 Todos eles são registros relacionados à proteína que você tem interesse? Resposta: Sim, na primeira das 3 páginas encontradas foi especifico do organismo procurado. Por que na primeira busca esse resultado não foi obtido? Resposta: Pios eles ainda não estava bem delineado. 7) Copie o número de acesso da primeira sequência obtida. Realize a busca utilizando este número de acesso. ou GI NCBI Reference Sequence, (GI), número da sequência: Resposta: GI: 1315020898 Quantas sequências são obtidas nesta busca? Por que? Resposta: Apenas uma, e de meu g1 especifico. Atividade – 2. Entendendo as informações Entre no site NCBI selecione na busca “nucleotide” https://www.ncbi.nlm.nih.gov/ Selecione nucleotídeo. Digite o número de acesso GI:52211453 Abra a sequência no banco de dados e analise as informações: Qual o ID da sequencia? Resposta: Burkholderia pseudomallei strain K96243, chromosome 2, complete sequence Qual o nome popular da espécie em que a sequência foi identificada: Resposta: Milho Última data de atualização (update) Resposta:? 06, fevereiro de 2015. 4) Clique no arquivo FASTA copie a sequência e salve no bloco de notas. Atividade -3. Buscando por genes 1) Acesse o site NCBI No campo Search selecione: Gene 2) Digite as palavras chave usadas na atividade anterior: “espécie [orgn] proteína [titl]” e clique em Search 3) Clique na primeira sequência encontrada e responda: Qual o ID da sequencia? Resposta: ID: 542414 Qual o nome popular da espécie em que a sequência foi identificada: Resposta: Milho Última data de atualização (update) Resposta:? 27, Janeiro 2018 Qual o gene? (gene description) Resposta: beta glucosidase 1 Essa sequência contém íntrons e exons? Resposta: Sim. intron: [intron] Number of Spliced Reads: 1426363 Splice Sites: GT-AG (consensus) Location: 35,178,207..35,179,249 Length: 1,043 Position: 35,179,250 Em qual cromossomo o gene está localizado? Resposta: Cromossomo: 10 5) Clique no formato FASTA e salve a sequencia no bloco de notas. 6) Escolha uma proteína do seu interesse e complete o campo Gene com as informações: “espécie [orgn] proteína [titl]” e clique em Search 7) Clique na primeira sequência encontrada e responda: Qual o ID da sequencia? Resposta: ID: 5367 Qual o nome popular da espécie: Resposta: Ser humano. Última data de atualização (update) Resposta:? Qual o gene? (gene description) Resposta: 4 de março de 2018. Essa sequência contém íntrons e exons? Resposta: Na sequência que eu procurei, ainda não foi encontrado intro. Em qual cromossomo o gene está localizado? Resposta: Cromossomo 12. 5) Clique no formato FASTA e salve a sequência no bloco de notas.
Compartilhar