Buscar

Aula de Bioinformatica

Prévia do material em texto

UFCSPA
CURSO DE BIOMEDICINA
DISCIPLINA DE INFORMÁTICA II
TÓPICOS DE
BIOINFORMÁTICA
APLICADA À BIOLOGIA
MOLECULAR
Profª Drª Ana Beatriz Gorini da Veiga
Roteiro da Aula
•Histórico da Biologia Molecular
•Bioinformática: conceito e como surgiu
•Revisão: Ácidos nucléicos, Transcrição, Tradução
•Bioinformática: uma visão geral
Aplicações
Bancos de dados
Principais ferramentas
•1865 Os genes são fatores particulados
•1871 Descoberta dos ácidos nucléicos
•1944 O DNA é o material genético
•1953 O DNA é uma hélice dupla
Uma breve história da genética e biologia molecular
•1961-66 O código genético é uma trinca
Uma breve história da genética e biologia molecular
•Anos 70 Estudo dos organismos no nível do código genético
•1974 Primeiros camundongos transgênicos
•1977 O DNA pode ser seqüenciado – o genoma do bacteriófago phi-x174
•Início dos anos 80 Dois bancos de dados são criados: EMBL Data Library
(Heidelberg, DL) e GenBank (Los Alamos National Laboratory, USA)
•Meados dos anos 80 DNA Data Bank of Japan (DDBJ) (National Institute of
Genetics, Mishima, JP)
•1981-1982 Animais transgênicos passam a ser mais estudados
Uma breve história da genética e biologia molecular
•1987 International Nucleotide Sequence Consortium
•1988 National Center for Biotechnology Information (NCBI), parte da
National Library of Medicine (NLM), do National Institutes of Health (NIH)
(Bethesda, USA) - GenBank
•1995 Genomas mais complexos podem ser seqüenciados
•2001 A primeira versão do genoma humano é publicada
•2008 200 gigabases (200 bilhões de bases, 200.000.000.000), 110 milhões de
seqüências de mais de 240.000 organismos.
Uma breve história da genética e biologia molecular
Bilhões de bases nucleotídicas tornadas públicas
Como estudar essa imensa
quantidade de informação?
O que significa cada
seqüência?
Avanços tecnológicos
Biologia
Ciências da
Saúde
Bioinformática
Ciência da
Computação
Tecnologia da
Informação
Matemática
Estatística
BIOINFORMÁTICA
"A bioinformática é uma nova disciplina científica com
raízes nas ciências da computação, na estatística e na
biologia molecular. A bioinformática desenvolveu-se para
enfrentar os resultados das iniciativas de seqüenciamento
de genes, que produzem uma quantidade cada vez maior
de dados sobre proteínas, DNA e RNA. Desse modo, os
biólogos moleculares passaram a utilizar métodos
estatísticos capazes de analisar grandes quantidades de
dados biológicos, de predizer funções dos genes e de
demonstrar relações entre genes e proteínas".
http://www.bioinformatica.nl ( site do programa dedicado ao tema
da Universidade de Wageningen, na Holanda)
Ácidos nucléicos
-Constituição química e
estrutura
-Organização e função
Revisão: DNA e RNA
 Açúcar
Ribose
RNA Açúcar
Desoxi-ribose
DNA
 Base
A G
C T
 Base
Formação de pontes de hidrogênio entre bases púricas e bases
pirimídicas.
Nucleotídeo
Açúcar + Base + Fosfato Ácidos nucléicos
Estrutura
Ligação fosfodiéster entre nucleotídeos
5’ – 3’
purina-pirimidina: importância espacial
DNA DNA
RNA
Bases nitrogenadas: A, C, G, U
Geralmente fita simples
mRNA: produto da transcrição do DNA
ncRNAs:
tRNA: envolvido na tradução e síntese de proteínas
rRNA: componentes estruturais dos ribossomos
miRNA, snRNA, snoRNA
RNA
RNA transportador
tRNA
Organização do DNA
Eucariotos
Vários cromossomos
DNA no núcleo e nas organelas.
Mitocôndria e cloroplasto: DNA circular.
O DNA é empacotado na célula
Célula: 2 m de DNA
Núcleo: 6 µm de diâmetro
DNA “empacotado”, associado a
proteínas: cromatina
Cromossomos: cromatina e outras
proteínas envolvidas na replicação e
reparo do DNA e na expressão gênica.
Cada cromossomo = 1 molécula de DNA
Humanos
2 m DNA / célula
~1014 células
~2 x 1011 km de DNA
Circunferência da Terra: 4 x 104 km
Distância Terra-Sol: 1,5 x 108 km
cromossomosDNA
Proteínas ligam-se ao DNA para formar a cromatina.
Histonas: empacotam o DNA em nucleossomos
Empacotamento de ~7x
“colar de contas”, ø ~ 10 nm
Fibras de cromatina são presas em um esqueleto central formado
por topoisomerase II e outras proteínas, e formam o solenóide.
Enrolamento do esqueleto nos cromossomos metafásicos.
Genoma mitocondrial humano
Patologias decorrentes de
mutações no DNA mitocondrial
MELAS, MERFF
Genoma humano: 25 moléculas diferentes
Genoma nuclear
~ 20 mil genes
24 cromossomos
Genoma mitocondrial
~ 37 genes
1 cromossomo circular
RNA
Proteínas
Fenótipo
DNA
Expressão gênica
DNA RNA proteína
Dogma central da biologia molecular
transcrição síntese protéica
DNA RNA
transcrição
Transcrição Transcrição
5’ 3’
5’ 3’
3’ 5’
 DNA
 mRNA
 Síntese no sentido 5’ → 3’ (DNA molde 3’ → 5’)
Tradução
Síntese de proteínas
transcrição tradução
Código Genético
“Regras pelas quais as seqüências de nucleotídeos de um gene, por meio do mRNA,
são traduzidas para uma seqüência de aminoácidos de uma proteína.”
4 “letras” (nucleotídeos) 20 aminoácidos
4² = 16
4³ = 64
Códon = 3 nucleotídeos
Anos 50
1. ribossomos (Paul Zamecnik et cols.)
2. aminoácidos ligam-se a RNA transportador (Mahlon
Hoagland e Paul Zamecnik); ação de aminoacil-tRNA sintetases
3. tRNA = molécula adaptadora para tradução (Francis Crick)
Tradução
Moldes de mRNA artificiais para decifrar o código genético
Trinucleotídeos artificiais ligam aminoacil-tRNA específicos.
1961: Marshall Nirenberg e Heinrich Matthaei
Misturas de polinucleotídeos sintéticos e aminoácidos marcados.
UUU = Phe
Aminoacil-tRNA marcado com C 14 ligado a ribossomo 
Trinucleotídeo Phe-tRNAPhe Lys-tRNALys Pro-tRNAPro
UUU + - -
AAA - + -
CCC - - +
H. Gobind Khorana:
poliribonucleotídeos sintéticos de
seqüências repetidas definidas.
Muitos outros estudos a
partir dos avanços
tecnológicos e da Biologia
Molecular...
Information system: http://www.ncbi.nlm.nih.gov
Bibliography
BIOINFORMÁTICA
Análise e processamento dos dados obtidos com o aumento de informação.
http://www.tech-res.com/GenBank25/
672 53
94
http://www.genomesonline.org/
Tree of life
Complete genomes
 3823 projects
 • 819 published
 (12-06-08)
• 1848 Bacteria
• 90 Archaea
• 936 eukaryotes
• 130 metagenomes
• 3 phylogenetic
domains;
• Lifestyles:
mesophiles;
(hyper)thermophiles;
psychrophiles;
extreme conditions,...
Number of available completely sequenced genomes
GOLDList and referencesList and references
Completely sequenced Genomes that span the three
domains of life are growing at a rapid rate
06-2008
3823 projects
ESTUDO IN SILICO DE MOLÉCULAS
Rapidez no campo da biologia molecular
Análise de genomas
Comparação entre seqüências
Busca por similaridades entre moléculas
Classificação e agrupamento de moléculas: filogenética e filogenômica
Tradução in silico
Estudos estruturais (modelagem molecular)
Estudos de dinâmica molecular
Desenho de moléculas de aplicação médica (ex. novas drogas)
Seleção de regiões específicas de moléculas de aplicação laboratorial
(ex. primers)
Revistas relativamente específicas
Algorithms for Molecular Biology
Applied Bioinformatics (acabou em 2008)
Bioinformatics
Bioinformation
BMC Bioinformatics
Briefings in Bioinformatics
Computational Biology and Chemistry
EURASIP Journal on Bioinformatics and Systems Biology
International Journal of Bioinformatics Research and
Applications (IJBRA)
International Journal of Data Mining and Bioinformatics
(IJDMB)
Journal of Bioinformatics and Computational Biology (JBCB)
Journal of Computational Biology
Journal of Computational Neuroscience
PLoS Computational Biology
Journal of Biomedical InformaticsComputers in Biology and Medicine
IEEE/ACM Transactions on Computational Biology and
Bioinformatics
Online Journal of Bioinformatics
In Silico Biology
Journal of Theoretical Biology
BioData Mining
Source Code for Biology and Medicine
Mathematical Biosciences
Bulletin of Mathematical Biology
BMC Research Notes
Journal of Biological Systems
Cancer Informatics
Statistical Applications in Genetics and Molecular Biology
Revistas não-específicas - enfoque ciências
biológicas
BMC Systems Biology
DNA Research
Genetics and Molecular Research (GMR)
Genomics, Proteomics & Bioinformatics
Biology Direct
Biochemistry and Molecular Biology Education
Revistas não-específicas - enfoque ciências exatas
Pattern Recognition
Artificial Intelligence in Medicine
Biosystems
Journal of Statistical Software (as vezes exemplos em
bioinfo)
Serviços eletrônicos de acesso público
- NCBI (Bethesda, USA) - GenBank (www.ncbi.nih.gov)
- European Bioinformatics Institute (EBI) (Hinxton, UK), do
European Molecular Biology Laboratory (EMBL) (Heidelberg, DL)
(www.ebi.ac.uk/)
- Swiss Institute of Bioinformatics → SWISS-PROT, Expert Protein
Analysis System (ExPASy Proteomics, www.expasy.org)
- DNA Data Bank of Japan (DDBJ, www.ddbj.nig.ac.jp)
- Protein Data Bank (PDB, www.rcsb.org/pdb)
- FlyBase
- The Institute for Genomic Research (TIGR)
- The Sanger Centre
-...muitos outros
↓
NCBI - NLM - NIH
NCBI - NIH
BLAST
BLAST (Basic Local Alignment Search Tool) encontra
regiões de similaridade entre seqüências; compara seqs. de
nucleotídios e de aminoácidos com seqs. de bancos de dados e calcula
a significância das similaridades. Pode ser usado para inferir
relações funcionais e evolutivas entre seqs., bem como para auxiliar
na identificação de famílias de genes.
Blast n: seq. nucleotídios x banco dados nucleotídeos
Blast X: seq. nucleot. x banco dados proteínas
Blast P: seq. aminoácidos x banco dados proteínas
TCCAGATGTTCGACACAACAAAATCCGGGTACATCGATGTTCTGAAGATCTCAACAATC
||||||||||||||||| | || ||||||| |||||| | ||||||||| || ||
TCCAGATGTTCGACACCTCCAAGTCCGGGTTCATCGAGACCCAGAAGATCTCCACGATC
A
B
RESULTADO
RESULTADO: GRÁFICO DOS ALINHAMENTOS Resultado: resumo dos alinhamentos
Resultado: alinhamento entre 2 seqs E para alinhar múltiplas seqüências?
CLUSTAL
Alinhamento de múltiplas seqüências e parentesco (filogenia)
Dados do Clustal
após formatação
manual
Tree View
Vários outros estudos
Exemplo: MODELAGEM MOLECULAR
Lipocalina de L. obliqua
MKFFGLFLAILASTAADVVIDGACPD
MKAVSKFDMNAYQGTWYEIKKFPVA
NEANGDCGSVEYTPDNGLLKVRAGH
VEDDIEKFVVGVLTKNAGTSDAELTL
SVVVGDYVRVAPLWIVSTDYDNYAIG
YSCKDYKKSNQHRVNIWILSRTKTLT
ETSKSTVNKFLKEHSKEFDQSKFVET
DFSEKACFFKKSHVYTVPFGA
Exemplo: TRADUÇÃO IN SILICO
http://ca.expasy.org/
Comparação de genomas
Evolução molecular
Identificação de genes envolvidos em doenças
Análise de resultados experimentais
...
BIBLIOGRAFIA:
 MRI, Luís (org). Genômica. São Paulo: Editora Atheneu,
2004.
 PRIMROSE, Sandy B; TWYMAN, Richard M. Genomics:
applications in Human Biology. Oxford: Blackwell
Publishing, 2004.
 LEWIN, Benjamin. Genes VII: Tratado de Genética Molecular.
Porto Alegre: Editora Artmed, 2000.
http://www.tech-res.com/GenBank25/
http://www2.iict.pt/?idc=21&idi=12815  TV Ciência on-line – Prêmio Científico 2006
http://www.comciencia.br/reportagens/bioinformatica/bio11.shtml  Com Ciência: Revista eletrônica de
jornalismo científico - reportagens sobre bioinformática
Genomes Online Database – GOLD
http://www.genomesonline.org/gold.cgi
Database of Genome Sizes – DOGS
http://www.cbs.dtu.dk/databases/DOGS/index.php
Sanger - The welcome Trust Sanger Institute
http://www.sanger.ac.uk/
TIGR - The Institute for Genomic Research
http://cmr.tigr.org/tigr-scripts/CMR/shared/Genomes.cgi
Eucaryotic genomes
http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi
Bacteria, fungi genomes
http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi?p3=11:Fungi&taxgroup=11:Fungi|12:
Insects http://www.ncbi.nlm.nih.gov/genomes/leuks.cgi?p3=12:Insects&taxgroup=11:|12:Insects
Plant genomes
http://www.ncbi.nlm.nih.gov/genomes/PLANTS/PlantList.html
SITES INTERESSANTES:
ATIVIDADE PRÁTICA

Continue navegando