Baixe o app para aproveitar ainda mais
Prévia do material em texto
UFCSPA CURSO DE BIOMEDICINA DISCIPLINA DE INFORMÁTICA II TÓPICOS DE BIOINFORMÁTICA APLICADA À BIOLOGIA MOLECULAR Profª Drª Ana Beatriz Gorini da Veiga Roteiro da Aula •Histórico da Biologia Molecular •Bioinformática: conceito e como surgiu •Revisão: Ácidos nucléicos, Transcrição, Tradução •Bioinformática: uma visão geral Aplicações Bancos de dados Principais ferramentas •1865 Os genes são fatores particulados •1871 Descoberta dos ácidos nucléicos •1944 O DNA é o material genético •1953 O DNA é uma hélice dupla Uma breve história da genética e biologia molecular •1961-66 O código genético é uma trinca Uma breve história da genética e biologia molecular •Anos 70 Estudo dos organismos no nível do código genético •1974 Primeiros camundongos transgênicos •1977 O DNA pode ser seqüenciado – o genoma do bacteriófago phi-x174 •Início dos anos 80 Dois bancos de dados são criados: EMBL Data Library (Heidelberg, DL) e GenBank (Los Alamos National Laboratory, USA) •Meados dos anos 80 DNA Data Bank of Japan (DDBJ) (National Institute of Genetics, Mishima, JP) •1981-1982 Animais transgênicos passam a ser mais estudados Uma breve história da genética e biologia molecular •1987 International Nucleotide Sequence Consortium •1988 National Center for Biotechnology Information (NCBI), parte da National Library of Medicine (NLM), do National Institutes of Health (NIH) (Bethesda, USA) - GenBank •1995 Genomas mais complexos podem ser seqüenciados •2001 A primeira versão do genoma humano é publicada •2008 200 gigabases (200 bilhões de bases, 200.000.000.000), 110 milhões de seqüências de mais de 240.000 organismos. Uma breve história da genética e biologia molecular Bilhões de bases nucleotídicas tornadas públicas Como estudar essa imensa quantidade de informação? O que significa cada seqüência? Avanços tecnológicos Biologia Ciências da Saúde Bioinformática Ciência da Computação Tecnologia da Informação Matemática Estatística BIOINFORMÁTICA "A bioinformática é uma nova disciplina científica com raízes nas ciências da computação, na estatística e na biologia molecular. A bioinformática desenvolveu-se para enfrentar os resultados das iniciativas de seqüenciamento de genes, que produzem uma quantidade cada vez maior de dados sobre proteínas, DNA e RNA. Desse modo, os biólogos moleculares passaram a utilizar métodos estatísticos capazes de analisar grandes quantidades de dados biológicos, de predizer funções dos genes e de demonstrar relações entre genes e proteínas". http://www.bioinformatica.nl ( site do programa dedicado ao tema da Universidade de Wageningen, na Holanda) Ácidos nucléicos -Constituição química e estrutura -Organização e função Revisão: DNA e RNA Açúcar Ribose RNA Açúcar Desoxi-ribose DNA Base A G C T Base Formação de pontes de hidrogênio entre bases púricas e bases pirimídicas. Nucleotídeo Açúcar + Base + Fosfato Ácidos nucléicos Estrutura Ligação fosfodiéster entre nucleotídeos 5’ – 3’ purina-pirimidina: importância espacial DNA DNA RNA Bases nitrogenadas: A, C, G, U Geralmente fita simples mRNA: produto da transcrição do DNA ncRNAs: tRNA: envolvido na tradução e síntese de proteínas rRNA: componentes estruturais dos ribossomos miRNA, snRNA, snoRNA RNA RNA transportador tRNA Organização do DNA Eucariotos Vários cromossomos DNA no núcleo e nas organelas. Mitocôndria e cloroplasto: DNA circular. O DNA é empacotado na célula Célula: 2 m de DNA Núcleo: 6 µm de diâmetro DNA “empacotado”, associado a proteínas: cromatina Cromossomos: cromatina e outras proteínas envolvidas na replicação e reparo do DNA e na expressão gênica. Cada cromossomo = 1 molécula de DNA Humanos 2 m DNA / célula ~1014 células ~2 x 1011 km de DNA Circunferência da Terra: 4 x 104 km Distância Terra-Sol: 1,5 x 108 km cromossomosDNA Proteínas ligam-se ao DNA para formar a cromatina. Histonas: empacotam o DNA em nucleossomos Empacotamento de ~7x “colar de contas”, ø ~ 10 nm Fibras de cromatina são presas em um esqueleto central formado por topoisomerase II e outras proteínas, e formam o solenóide. Enrolamento do esqueleto nos cromossomos metafásicos. Genoma mitocondrial humano Patologias decorrentes de mutações no DNA mitocondrial MELAS, MERFF Genoma humano: 25 moléculas diferentes Genoma nuclear ~ 20 mil genes 24 cromossomos Genoma mitocondrial ~ 37 genes 1 cromossomo circular RNA Proteínas Fenótipo DNA Expressão gênica DNA RNA proteína Dogma central da biologia molecular transcrição síntese protéica DNA RNA transcrição Transcrição Transcrição 5’ 3’ 5’ 3’ 3’ 5’ DNA mRNA Síntese no sentido 5’ → 3’ (DNA molde 3’ → 5’) Tradução Síntese de proteínas transcrição tradução Código Genético “Regras pelas quais as seqüências de nucleotídeos de um gene, por meio do mRNA, são traduzidas para uma seqüência de aminoácidos de uma proteína.” 4 “letras” (nucleotídeos) 20 aminoácidos 4² = 16 4³ = 64 Códon = 3 nucleotídeos Anos 50 1. ribossomos (Paul Zamecnik et cols.) 2. aminoácidos ligam-se a RNA transportador (Mahlon Hoagland e Paul Zamecnik); ação de aminoacil-tRNA sintetases 3. tRNA = molécula adaptadora para tradução (Francis Crick) Tradução Moldes de mRNA artificiais para decifrar o código genético Trinucleotídeos artificiais ligam aminoacil-tRNA específicos. 1961: Marshall Nirenberg e Heinrich Matthaei Misturas de polinucleotídeos sintéticos e aminoácidos marcados. UUU = Phe Aminoacil-tRNA marcado com C 14 ligado a ribossomo Trinucleotídeo Phe-tRNAPhe Lys-tRNALys Pro-tRNAPro UUU + - - AAA - + - CCC - - + H. Gobind Khorana: poliribonucleotídeos sintéticos de seqüências repetidas definidas. Muitos outros estudos a partir dos avanços tecnológicos e da Biologia Molecular... Information system: http://www.ncbi.nlm.nih.gov Bibliography BIOINFORMÁTICA Análise e processamento dos dados obtidos com o aumento de informação. http://www.tech-res.com/GenBank25/ 672 53 94 http://www.genomesonline.org/ Tree of life Complete genomes 3823 projects • 819 published (12-06-08) • 1848 Bacteria • 90 Archaea • 936 eukaryotes • 130 metagenomes • 3 phylogenetic domains; • Lifestyles: mesophiles; (hyper)thermophiles; psychrophiles; extreme conditions,... Number of available completely sequenced genomes GOLDList and referencesList and references Completely sequenced Genomes that span the three domains of life are growing at a rapid rate 06-2008 3823 projects ESTUDO IN SILICO DE MOLÉCULAS Rapidez no campo da biologia molecular Análise de genomas Comparação entre seqüências Busca por similaridades entre moléculas Classificação e agrupamento de moléculas: filogenética e filogenômica Tradução in silico Estudos estruturais (modelagem molecular) Estudos de dinâmica molecular Desenho de moléculas de aplicação médica (ex. novas drogas) Seleção de regiões específicas de moléculas de aplicação laboratorial (ex. primers) Revistas relativamente específicas Algorithms for Molecular Biology Applied Bioinformatics (acabou em 2008) Bioinformatics Bioinformation BMC Bioinformatics Briefings in Bioinformatics Computational Biology and Chemistry EURASIP Journal on Bioinformatics and Systems Biology International Journal of Bioinformatics Research and Applications (IJBRA) International Journal of Data Mining and Bioinformatics (IJDMB) Journal of Bioinformatics and Computational Biology (JBCB) Journal of Computational Biology Journal of Computational Neuroscience PLoS Computational Biology Journal of Biomedical InformaticsComputers in Biology and Medicine IEEE/ACM Transactions on Computational Biology and Bioinformatics Online Journal of Bioinformatics In Silico Biology Journal of Theoretical Biology BioData Mining Source Code for Biology and Medicine Mathematical Biosciences Bulletin of Mathematical Biology BMC Research Notes Journal of Biological Systems Cancer Informatics Statistical Applications in Genetics and Molecular Biology Revistas não-específicas - enfoque ciências biológicas BMC Systems Biology DNA Research Genetics and Molecular Research (GMR) Genomics, Proteomics & Bioinformatics Biology Direct Biochemistry and Molecular Biology Education Revistas não-específicas - enfoque ciências exatas Pattern Recognition Artificial Intelligence in Medicine Biosystems Journal of Statistical Software (as vezes exemplos em bioinfo) Serviços eletrônicos de acesso público - NCBI (Bethesda, USA) - GenBank (www.ncbi.nih.gov) - European Bioinformatics Institute (EBI) (Hinxton, UK), do European Molecular Biology Laboratory (EMBL) (Heidelberg, DL) (www.ebi.ac.uk/) - Swiss Institute of Bioinformatics → SWISS-PROT, Expert Protein Analysis System (ExPASy Proteomics, www.expasy.org) - DNA Data Bank of Japan (DDBJ, www.ddbj.nig.ac.jp) - Protein Data Bank (PDB, www.rcsb.org/pdb) - FlyBase - The Institute for Genomic Research (TIGR) - The Sanger Centre -...muitos outros ↓ NCBI - NLM - NIH NCBI - NIH BLAST BLAST (Basic Local Alignment Search Tool) encontra regiões de similaridade entre seqüências; compara seqs. de nucleotídios e de aminoácidos com seqs. de bancos de dados e calcula a significância das similaridades. Pode ser usado para inferir relações funcionais e evolutivas entre seqs., bem como para auxiliar na identificação de famílias de genes. Blast n: seq. nucleotídios x banco dados nucleotídeos Blast X: seq. nucleot. x banco dados proteínas Blast P: seq. aminoácidos x banco dados proteínas TCCAGATGTTCGACACAACAAAATCCGGGTACATCGATGTTCTGAAGATCTCAACAATC ||||||||||||||||| | || ||||||| |||||| | ||||||||| || || TCCAGATGTTCGACACCTCCAAGTCCGGGTTCATCGAGACCCAGAAGATCTCCACGATC A B RESULTADO RESULTADO: GRÁFICO DOS ALINHAMENTOS Resultado: resumo dos alinhamentos Resultado: alinhamento entre 2 seqs E para alinhar múltiplas seqüências? CLUSTAL Alinhamento de múltiplas seqüências e parentesco (filogenia) Dados do Clustal após formatação manual Tree View Vários outros estudos Exemplo: MODELAGEM MOLECULAR Lipocalina de L. obliqua MKFFGLFLAILASTAADVVIDGACPD MKAVSKFDMNAYQGTWYEIKKFPVA NEANGDCGSVEYTPDNGLLKVRAGH VEDDIEKFVVGVLTKNAGTSDAELTL SVVVGDYVRVAPLWIVSTDYDNYAIG YSCKDYKKSNQHRVNIWILSRTKTLT ETSKSTVNKFLKEHSKEFDQSKFVET DFSEKACFFKKSHVYTVPFGA Exemplo: TRADUÇÃO IN SILICO http://ca.expasy.org/ Comparação de genomas Evolução molecular Identificação de genes envolvidos em doenças Análise de resultados experimentais ... BIBLIOGRAFIA: MRI, Luís (org). Genômica. São Paulo: Editora Atheneu, 2004. PRIMROSE, Sandy B; TWYMAN, Richard M. Genomics: applications in Human Biology. Oxford: Blackwell Publishing, 2004. LEWIN, Benjamin. Genes VII: Tratado de Genética Molecular. Porto Alegre: Editora Artmed, 2000. http://www.tech-res.com/GenBank25/ http://www2.iict.pt/?idc=21&idi=12815 TV Ciência on-line – Prêmio Científico 2006 http://www.comciencia.br/reportagens/bioinformatica/bio11.shtml Com Ciência: Revista eletrônica de jornalismo científico - reportagens sobre bioinformática Genomes Online Database – GOLD http://www.genomesonline.org/gold.cgi Database of Genome Sizes – DOGS http://www.cbs.dtu.dk/databases/DOGS/index.php Sanger - The welcome Trust Sanger Institute http://www.sanger.ac.uk/ TIGR - The Institute for Genomic Research http://cmr.tigr.org/tigr-scripts/CMR/shared/Genomes.cgi Eucaryotic genomes http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi Bacteria, fungi genomes http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi?p3=11:Fungi&taxgroup=11:Fungi|12: Insects http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi?p3=12:Insects&taxgroup=11:|12:Insects Plant genomes http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html SITES INTERESSANTES: ATIVIDADE PRÁTICA
Compartilhar