Prévia do material em texto
282//13 1 1 Bioinformática 2 - Introdução Bioinformática 2013 2 Bioinformática / Biologia Computacional l Novas disciplinas que reúnem as seguintes áreas científicas: l Biologia (molecular) l Ciência de computação l Estatística l Tecnologias de Informação l Computadores e Ciência da informação l Abrange o estudo e utilização das ferramentas computacionais para armazenamento, acesso e análise de dados Em resumo l A Bioinformática faz uso das ferramentas computacionais para armazenar, aceder e analizar todo o tipo de dados biológicos que podem ir do DNA aos ecossistemas Bioinformática 2013 3 Marcos na história da Biologia Molecular e Bioinformática 1869 - Johann Friedrich Miescher descobriu o DNA e chamou-lhe nucleína 1881 - Edward Zacharias mostrou que os cromossomas eram constituídos por nucleína 1899 - Richard Altmann chamou ácido nucleico à nucleína Jo ha nn M ie sc he r Bioinformática 2013 4 Marcos na história da Biologia Molecular e Bioinformática Cerca de 1900, foram identificadas as estruturas químicas dos 20 aminoácidos 1902 - Emil Hermann Fischer ganha o prémio Nobel: mostrou que as proteínas são constituídas por a.a. ligados entre si. Postulou que as propriedades das proteínas são definidas pela sua composição em a.a. e pela sequência desses a.a. E m il Fi sc he r 282//13 2 Bioinformática 2013 5 Marcos na história da Biologia Molecular e Bioinformática 1911 – Thomas Hunt Morgan descobre que os genes se encontram nos cromossomas e que são as unidades da hereditariedade 1911 - Pheobus Aaron Theodore Lerene descobre o RNA 1933 - Arne Tiselius foi o primeiro a usar a electroforese para separar proteínas em solução. Ganhou o prémio Nobel da Química em 1948 Th om as M or ga n A rn e Ti se liu s Bioinformática 2013 6 Marcos na história da Biologia Molecular e Bioinformática 1941 – George Beadle e Edward Tatum descobrem que os genes produzem proteínas 1943 – Foi construído o primeiro computador electrónico na Universidade da Pensilvânia 1950 – Edwin Chargaff descobre a complementaridade entre as bases do DNA G eo rg e B ea dl e E dw ar d Ta tu m E dw in C ha rg af f Bioinformática 2013 7 Marcos na história da Biologia Molecular e Bioinformática 1950s – Mahlon Bush Hoagland isolou tRNA M ah lo n H oa gl an d Hemoglobina humana, A 1951 Pauling e Corey propuseram as estruturas para a helice α e a folha pregueada β da estrutura secundária das proteínas Li nu s P au lin g R ob er t C or ey Bioinformática 2013 8 Marcos na história da Biologia Molecular e Bioinformática 1952 - Martha Chase e Alfred Hershey provaram que o DNA era a molécula responsável pela transmissão e armazenamento da informação genética Em 1969 Hershey ganhou o prémio Nobel da Medicina pela sua descoberta de que um vírus pode causar mutações e ter múltiplos genes M ar th a C ha se A lfr ed H er sh ey 282//13 3 Bioinformática 2013 9 Marcos na história da Biologia Molecular e Bioinformática 1952-1953 - James Watson e Francis Crick deduziram a estrutura da molécula de DNA recorrendo ao material ode difracção por raios X obtido Rosalind Franklin 1955 – A sequência da insulina bovina foi a primeira proteína a ser analisada por F. Sanger Rosalind Franklin 1958 - Jack Kilby construiu o primeiro circuito integrado para a Texas Instruments F S an ge r Ja ck K ilb y James Watson Fr an ci s C ric k Bioinformática 2013 10 Marcos na história da Biologia Molecular e Bioinformática 1956 - George Emil Palade mostrou que as proteínas são produzidas em ribossomas 1969 Foi criada a ARPANET para estabelecer ligações entre os computadores de Stanford, UCSB, Universidade de Utah e UCLA 1970 - Howard Temin and David Baltimore isolaram independentemente a primeira enzima de restricção G eo rg e E m il P al ad e H ow ar d Te m in D av id B al tim or e Bioinformática 2013 11 Marcos na história da Biologia Molecular e Bioinformática 1977 - Phillip Sharp e Richard Roberts demonstraram que o pre-mRNA é processado pela remoção dos intrões e recolocação dos exões P hi lli p S ha rp R ic ha rd R ob er ts 1980 – Sequenciação completa do primeiro gene de um organismo (FX174). O gene posuui 5 386 bp e codifica para 9 proteínas 1980 – É fundada a IntelliGenetics, Inc na California. O seu principal produto foram os programas IntelliGenetics Suite para a análise de sequências de DNA e proteínas Bioinformática 2013 12 Marcos na história da Biologia Molecular e Bioinformática 1981 - É publicado o algoritmo Smith-Waterman algoritmo para o alinhamento de sequências. 1981 – A IBM introduz no mercado o primeiro computador pessoal. 1983 – É lançado o Compact Disk (CD). 1985 - É publicado o algoritmo FASTP. 1985 - Kary Mullis e colaboradores descrevem a reacção de PCR. K ar y M ul lis 282//13 4 Bioinformática 2013 13 Marcos na história da Biologia Molecular e Bioinformática 1986 - Leroy Hood desenvolveu o mecanismo de sequenciação automática 1986 – É anunciada a Human Genome Initiative para sequenciação do genoma humano 1986 – É cunhado o termo Genómica por Thomas Roderick para descrever a área científica que inclui o mapeamento, sequenciação e análise de genes. 1986 – É criada a base de dados SWISS-PROT pelo Department of Medical Biochemistry da University of Geneva e o European Molecular Biology Laboratory (EMBL). 1987 – São descritos os YACs (yeast artificial chromosomes) (David T. Burke, et. al., Science, 236: 806-812). Le ro y H oo d Bioinformática 2013 14 Marcos na história da Biologia Molecular e Bioinformática 1988 – O NCBI (National Center for Biotechnology Information) é lançado pelo National Cancer Institute 1988 – O algoritmo FASTA para comparação de sequências é publicado por Pearson e Lupman. 1988 - Um programa novo - vírus informático- infectou 6 000 computadores militares no EEUU 1995 John Craig Venter – sequenciou o primeiro genoma bacteriano 1995 Sequenciação fluorescente automática e robótica 1996 Primeiro genoma eucariota sequenciado – levedura Jo hn C ra ig V en te r Bioinformática 2013 15 Marcos na história da Biologia Molecular e Bioinformática 1997 – Genoma de E. coli sequenciado 1998 - PerkinsElmer, Inc. desenvolveu o sequenciador de 96 capilares 1998 - Genoma de Caenorhabditis elegans completamente sequenciado 1999 - Primeiro cromossomas humano sequenciado (cromossoma 22) 2000 – Sequência completa da porção eucromática do genoma de Drosophila melanogaster 2001- 2004 – Rascunho do genoma humanto até à conclusão do Projecto Sequenciação do genoma do ratinho (mouse) e do rato (rat) Bioinformática 2013 17 Tipos de informação l Genoma l Totalidade do complemento de DNA de um organismo determinado por sequenciação l Transcriptoma l Totalidade ds mRNAs (transcritos presentes num tipo de célula e numa determinada condição) – representa a totalidade de genes expressos nesse tipo celular. Quantifica-se por microarrays e/ou SAGE (Serial Analysis of Gene Expression) l Proteoma l Totalidade de proteínas presentes num tipo de célula e numa determinada condição l Metaboloma l Descrição das proteínas metabolicamente activas e de outros metabolitos presentes na célula l Metiloma l Totalidade de sequências que se encontram metiladas 282//13 5 Bioinformática 2013 18 Disciplinas emergentes l Genómica Estrutural: l Estudo das estruturas 3D dos produtos da expressão génica – proteínas e RNA l Genómica Funcional: l Pretende estudar o funcionamento dos genomas como um todo: informação genética, regulação desta informação eexpressão – fenótipo l Biologia de Sistemas l Faz uma análise global e integrada dos processos biológicos l Tem como objectivo compreender sistemas biológicos complexos com usando ferramentas interdiciplinares Bioinformática 2013 19 Biologia de sistemas Human oncogene-signaling map M ol ec ul ar S ys te m s B io lo gy 3 :1 52 Bioinformática 2013 20 Que perguntas podemos responder com a Bioinformática / Biologia Computacional? Bioinformática 2013 21 1 Semelhanças entre sequências l Problema: l Possuímos uma sequência de DNA ou proteína . Queremos saber rapidamente a função dessa sequência. l Solução: l Efectuar pesquisas de semelhança entre sequências. l software especializado compara a nossa sequência com grandes bases de dados onde existem milhões de sequências l Se na base de dados existe uma sequência muito semelhnate à nossa (com um grande scoring), então podemos começar a inferir que a nossa sequência tem a mesma função ou uma função semelhante. 282//13 6 Bioinformática 2013 22 2 Semelhanças entre sequências l Usam-se correntemente alguns softwares de pesquisa: l BLAST (Basic Local Alignment Search Tool) - ferramenta mais usada em Bioinformática l É muito rápido, sensível e está disponível para todos. Existe ligado a muitas organizações o que permite a pesquiza em inúmeras bases de dados Bioinformática 2013 23 2 Organização de genomas l Problema: l Determinar a sequência completa de uma longa secção de DNA a partir de uma colecção de numerosas sequências pequenas. Estas sequências pequenas são o resultado directo da sequenciação e têm em média aproximadamente 500 pares de bases (bp) l Solução: l A montagem destas sequências é feita com recurso a software que identifica as sequências pequenas que se sobrepoem e produz um ”contig” (contiguous assembly) Bioinformática 2013 24 1 Organização de genomas l Depois de ter todos os fragmentos uni-los na ordem correcta l O Problema: SCS Problem (Shortest Common Superstring) l Alguns dos fragmentos sobrepoem-se l Sobrepôr todos os fragmento e encontrar a sequência menor possível que inclua todos os fragmentos Bioinformática 2013 25 1 Organização de genomas 282//13 7 Bioinformática 2013 26 3 Previsão da estrutura de uma proteína l Problema: l A nossa proteína possui uma determinada sequência que foi previamente cofirmada através da análise de busca de semelhanças mas queremos saber mais acerca da sua função através da previsão da sua estrutura l As proteínas l são as moléculas mais importantes do ponto de vista metabólico – catalizam reacções l encontram-se envolvidas na regulação da expressão génica l Solução: l Existem vários tipos de métodos que prevêem a estrutura a partir da sequência Bioinformática 2013 27 3 Previsão da estrutura de uma proteína Bioinformática 2013 28 Previsão de uma macroestrutura Capsid of Lambda-like Phage HK97