Rede de Biodiversidade e Biotecnologia da Amazônia Legal
Programa de Pós-Graduação da Bionorte
FUNDAÇÃO UNIVERSIDADE FEDERAL DE RONDÔNIA
NÚCLEO DE SAÚDE
DEPARTAMENTO DE MEDICINA
PROGRAMA DE PÓS-GRADUAÇÃO EM BIOLOGIA EXPERIMENTAL
O surgimento da Bioinformática
Banco de Dados Biológicos
Retrospectiva da Biologia Molecular

1951
Fred Sanger, Amino Acid Sequence of Insulin

1953
Watson/Crick, Estrutura do DNA

1957
Francis Crick, Central Dogma, DNA  RNA  Protein

1960’s Nirenberg & Matthaei, The Genetic Code

1967
Shapiro and Beckwith, First gene cloned, LacZ

1972
Paul Berg, First recombinant DNA molecule

1973
Cohen/Boyer, First recombinant organism

1977
Maxam/Gilbert and Fred Sanger, DNA sequencing

1977
Fred Sanger, Complete sequence of phage X174

1978
David Botstein, Restriction Fragment Length
Polymorphisms (RFLP)

1980
Kerry Mullis, PCR

1983
Lee Hood, First Automated DNA Sequencer
Sequenciamento Automático
Leroy Hood
30kb por corrida
A era genômica
(geração de muitos dados)

International Consortium
 Grupos acadêmicos

Celera Genomics
 Companhia Privada
A revolução da Genômica
454
~120 MB de DNA
por corrida
12KB/US$
Solexa - Illumina
~01 GB de DNA
por corrida
100KB/US$
SOLiD - ABI
~03 GB de DNA
por corrida
300KB/US$

Dispensa clonagem dos fragmentos em sistemas
bacterianos

Dispensa a preparação de DNA molde para
sequenciamento

Reações feitas em paralelo em volume
extremamente pequeno - nanotecnologia
Bioinformática – O Início
NASA coleta informações sobre a atmosfera de Venus
Bioinformática – O Início
Com dados da NASA, Carl Sagan (Havard) e Lippincot (Maryland) orientam a tese de
doutorado em Fisico-Química de Margaret Dayhoff, onde ela Desenvolve sistemas de
computador para cálculos de bioquímica.
Bioinformática – O Início

1965, Margaret Dayhoff, “Atlas of Protein sequence and
structure”.

1966, Margaret Dayhoff, matriz de substituição PAM

1970, Needleman/Wunch, Alinhamento Global.

1979, Walter Goad, GenBank.

1981, Smith/Waterman, Alinhamento Local.

1989, NHGRI, Projeto Genoma Humano.

1990, Altschul/Gish/Miller/Myers/Lipman, BLAST.
Bioinformática – O Início



Na década de 1970 a unidade básica de armazenamento de
informação era o kilobyte -- 1024 bytes (1024 caracteres)
Um computador de grande porte daquela época tinha alguns
kbytes de memória (hoje são da ordem de Gbytes (1.000 x)
Com tal memória um computador desses não seria capaz de
processar nem sequer o genoma de um vírus, que pode
chegar a 20 kilobases (20 mil letrinhas); que dirá o genoma
humano, com seus 3 bilhões de letrinhas
http://www.ncbi.nlm.nih.gov/genbank/statistics
http://www.ncbi.nlm.nih.gov/genbank/statistics

Desenvolvimento de ferramentas.

Forma de explorar novos dados.

Processamento de dados gerados por projetos
em larga-escala.

Uma nova forma de se fazer ciência dirigida
por hipóteses.



Biologia em larga-escala. Produção de dados
em massa gera uma demanda para análises
computacionais.
Economiza tempo e dinheiro.
Poucas pessoas adequadamente treinadas em
Biologia e Computação.

NCBI (The National Center for Biotechnology Information;


EBI (The European Bioinformatics Institute)


http://www.ddbj.nig.ac.jp/
SwissProt/ExPASy (Swiss Bioinformatics Resource)


http://www.ebi.ac.uk/
DNA Data Bank of Japan


http://www.ncbi.nlm.nih.gov/
http://expasy.cbr.nrc.ca/sprot/
PDB (The Protein Databank)

http://www.rcsb.org/PDB/

Acesso aos bancos de dados via Entrez



Servidor de BLAST



Medline/OMIM
Genbank/Genpept/Structures
Todos os tipos de Blast
Portal do Genoma Humano
Muito, muito mais……..

Acesso a bancos de dados via SRS


EMBL, SwissProt, ……
Muitas outras ferramentas

ClustalW, DALI, …


Outro Banco de dados de armazenamento e
análise de genomas e seqûências diversas
Muitas outras ferramentas

Blast, alinhamentos múltiplos, filogenia, etc….

Checagem manual.

O número de entradas errôneas é bastante reduzido.

Cross-link extensivo com outros bancos

SwissProt é o ‘gold-standard’ em termos de
bancos de dados e é o melhor lugar para se
começar uma análise se você procura info para
uma ou poucas sequências.


Armazena a estrutura tri-dimensional para
milhares de proteínas
Acesso a vários serviços relacionados a biologia
estrutural
Comunicação entre os Bancos de
Sequência Primários
International Nucleotide Sequence Database Collaboration
Vamos explorar os Bancos de Dados:
-Pubmed
- Nucleotide
-Protein