Rede de Biodiversidade e Biotecnologia da Amazônia Legal Programa de Pós-Graduação da Bionorte FUNDAÇÃO UNIVERSIDADE FEDERAL DE RONDÔNIA NÚCLEO DE SAÚDE DEPARTAMENTO DE MEDICINA PROGRAMA DE PÓS-GRADUAÇÃO EM BIOLOGIA EXPERIMENTAL O surgimento da Bioinformática Banco de Dados Biológicos Retrospectiva da Biologia Molecular 1951 Fred Sanger, Amino Acid Sequence of Insulin 1953 Watson/Crick, Estrutura do DNA 1957 Francis Crick, Central Dogma, DNA RNA Protein 1960’s Nirenberg & Matthaei, The Genetic Code 1967 Shapiro and Beckwith, First gene cloned, LacZ 1972 Paul Berg, First recombinant DNA molecule 1973 Cohen/Boyer, First recombinant organism 1977 Maxam/Gilbert and Fred Sanger, DNA sequencing 1977 Fred Sanger, Complete sequence of phage X174 1978 David Botstein, Restriction Fragment Length Polymorphisms (RFLP) 1980 Kerry Mullis, PCR 1983 Lee Hood, First Automated DNA Sequencer Sequenciamento Automático Leroy Hood 30kb por corrida A era genômica (geração de muitos dados) International Consortium Grupos acadêmicos Celera Genomics Companhia Privada A revolução da Genômica 454 ~120 MB de DNA por corrida 12KB/US$ Solexa - Illumina ~01 GB de DNA por corrida 100KB/US$ SOLiD - ABI ~03 GB de DNA por corrida 300KB/US$ Dispensa clonagem dos fragmentos em sistemas bacterianos Dispensa a preparação de DNA molde para sequenciamento Reações feitas em paralelo em volume extremamente pequeno - nanotecnologia Bioinformática – O Início NASA coleta informações sobre a atmosfera de Venus Bioinformática – O Início Com dados da NASA, Carl Sagan (Havard) e Lippincot (Maryland) orientam a tese de doutorado em Fisico-Química de Margaret Dayhoff, onde ela Desenvolve sistemas de computador para cálculos de bioquímica. Bioinformática – O Início 1965, Margaret Dayhoff, “Atlas of Protein sequence and structure”. 1966, Margaret Dayhoff, matriz de substituição PAM 1970, Needleman/Wunch, Alinhamento Global. 1979, Walter Goad, GenBank. 1981, Smith/Waterman, Alinhamento Local. 1989, NHGRI, Projeto Genoma Humano. 1990, Altschul/Gish/Miller/Myers/Lipman, BLAST. Bioinformática – O Início Na década de 1970 a unidade básica de armazenamento de informação era o kilobyte -- 1024 bytes (1024 caracteres) Um computador de grande porte daquela época tinha alguns kbytes de memória (hoje são da ordem de Gbytes (1.000 x) Com tal memória um computador desses não seria capaz de processar nem sequer o genoma de um vírus, que pode chegar a 20 kilobases (20 mil letrinhas); que dirá o genoma humano, com seus 3 bilhões de letrinhas http://www.ncbi.nlm.nih.gov/genbank/statistics http://www.ncbi.nlm.nih.gov/genbank/statistics Desenvolvimento de ferramentas. Forma de explorar novos dados. Processamento de dados gerados por projetos em larga-escala. Uma nova forma de se fazer ciência dirigida por hipóteses. Biologia em larga-escala. Produção de dados em massa gera uma demanda para análises computacionais. Economiza tempo e dinheiro. Poucas pessoas adequadamente treinadas em Biologia e Computação. NCBI (The National Center for Biotechnology Information; EBI (The European Bioinformatics Institute) http://www.ddbj.nig.ac.jp/ SwissProt/ExPASy (Swiss Bioinformatics Resource) http://www.ebi.ac.uk/ DNA Data Bank of Japan http://www.ncbi.nlm.nih.gov/ http://expasy.cbr.nrc.ca/sprot/ PDB (The Protein Databank) http://www.rcsb.org/PDB/ Acesso aos bancos de dados via Entrez Servidor de BLAST Medline/OMIM Genbank/Genpept/Structures Todos os tipos de Blast Portal do Genoma Humano Muito, muito mais…….. Acesso a bancos de dados via SRS EMBL, SwissProt, …… Muitas outras ferramentas ClustalW, DALI, … Outro Banco de dados de armazenamento e análise de genomas e seqûências diversas Muitas outras ferramentas Blast, alinhamentos múltiplos, filogenia, etc…. Checagem manual. O número de entradas errôneas é bastante reduzido. Cross-link extensivo com outros bancos SwissProt é o ‘gold-standard’ em termos de bancos de dados e é o melhor lugar para se começar uma análise se você procura info para uma ou poucas sequências. Armazena a estrutura tri-dimensional para milhares de proteínas Acesso a vários serviços relacionados a biologia estrutural Comunicação entre os Bancos de Sequência Primários International Nucleotide Sequence Database Collaboration Vamos explorar os Bancos de Dados: -Pubmed - Nucleotide -Protein