Universidade Federal de Santa Catarina
Programa de Pós-graduação em Bioquímica
Apoios aos alunos de graduação
Bioinformática
Florianópolis, 09 de novembro de 2010.
Tópicos
• Genbank
• Swiss-prot
• pdb
GENBANK
GENBANK
GENBANK:
• É um banco de seqüências de nucleotídeos e proteínas.
• Acesso
irrestrito
(grande
http://www.ncbi.nlm.nih.gov
parte)
acessado
pelo
NCBI:
• Construído pelo National Center of Biothecnology Information (NCBI) em
1982.
COLABORAÇÕES:
• DNA Data Bank do Japão (DDBJ)
• European Bioinformatics Institutes (EBI, Hinxtin, UK).
-> Todos estes centros recebem dados separadamente, estas informações são
trocadas e integradas, de maneira que estes bancos contém o mesmo
banco de dados, sendo grande parte deles disponível on line.
O National Center for Biotechnology Information (NCBI)
Bethesda, MD

Aceita submissões de seqüências primárias.

Desenvolve ferramentas para analisar dados.

Criação de bancos específicos baseados na seqüência

primária.
Fornece pesquisa livre e links
Tráfego de navegação ao NCBI
65 milhões de pb
61 milhões de seqüências
Japan 6%
Italy 4%
Users per day
600,000
Canada 3%
Germany 3%
United Kingdom
3%
Netherlands 2%
500,000
Spain 2%
Brazil 2%
Sweden 1%
400,000
Switzerland 1%
Belgium1%
U.S.
Other
14%
(.com, .net, .org,
.gov,
gov, .us)
300,000
40%
200,000
100,000
1998
1999
2000
2001
2002
2003
2004
Christmas and New Year’s Day
2005
01/21/2007
9/19/2006
Divisões do GENBANK
PRI
ROD
PLN
BCT
INV
VRT
VRL
MAM
PHG
SYN
ENV
UNA
(28)
(15)
(20)
(18)
(7)
(7)
(4)
(2)
(1)
(1)
(4)
(1)
EST (570)
Tag
GSS (197)
Sequence
HTG (88)
Genomic
PAT (27)
STS (9)
CON (1)
Primate
Rodent
Plant and Fungal
Bacterial/Archeal
Invertebrate
Other Vertebrate
Viral
Mammalian
Phage
Synthetic
Envir. samples
Unannotated
Organismo -Tradicional
• Organizado por taxonomia
• Submissões diretas (Sequin/Bankit)
• Acuracidade (~1 error per 10,000 bp)
• Bem caracterizado
Expressed Sequence
Genome Survey
High Throughput
Patent
Sequence Tagged Site
Contigs, virtual
Functional - Bulk
• Organizado por tipo de sequencia
• Submissões por (ftp/email)
• Menos acurado
• Pouco caracterizado
GENBANK funcional
• Expressed Sequence Tag
– Uma única passagem de leitura do cDNA
• Genome Survey Sequence
EST
GenBank
GSS
HTG
STS
– Uma única passagem de leitura do gDNA
• High Throughput Genomic
– Seqüências incompletas de clones
• Sequence Tagged Site
– PCR-based mapping reagents
Banco de Seqüências do tipo EST
Pouco caracterizada
GSS, HTG, WGS
Whole BAC insert (or genome)
shred
sequence
GSS division
or trace archive
assembly
isolate clones
whole genome shotgun
assemblies (wgs projects)
Draft sequence (HTG division)
HTG: Honeybee Draft Sequence
LOCUS
AC141845 147720 bp DNA linear HTG 19-MAR-2004
DEFINITION Apis mellifera clone CH224-4A2, WORKING DRAFT SEQUENCE, 14 unordered
pieces.
ACCESSION AC141845
VERSION
AC141845.1 GI:29124029
KEYWORDS HTG; HTGS_PHASE1; HTGS_DRAFT.
• Sequencias não concluidas de BAC
• Gaps e pedaços fora de ordem
Genomas completos - Projetos Shotgun

685 projetos




Bactéria (320)
Sequencias ambientais (14)
Archaea (8)
Eucariotos (140), incluem:
 Frango, em ratinhos, ratos, cães (2), chimpanzé, humano
 Peixe (2)
 Abelha, Anopheles, moscas das frutas (3)
 Nematóides (2)
 As leveduras (8), Aspergillus (2)
 Arroz (2)
Projetos Genomas Completos (WGS)
wgs master[properties]
ftp://ftp.ncbi.nih.gov/genbank/wgs/
GENBANK: procurando por seqüências
–
–
–
–
Regiões regulatórias.
Regiões não-traduzíveis.
Regiões codificantes para proteínas.
Regiões intergênicas.
Swiss-prot
Swiss-prot
• O swiss-prot foi criado durante a tese de Amos Bairoch em
1986 ligado ao Swiss Institute of Bioinformatics (SIB).
• Contém todas as seqüências protéicas de proteínas com funções
conhecidas.
• Swiss-prot está disponível no endereço eletrônico www.expasy.ch/sprot/
conectado ao servidor ExPAsy.
• ExPASy: Expert Protein Analysis System contém banco de dados +
ferramentas on line úteis.
• Colaboração: European Bioinformatics Institute (EBI).
• Automated TrEMBL (TRanslation of EMBL nucleotide sequences)
Típico swiss-prot entry
• Proteína
• Função proteíca
• bibliografia
• Links com outros
bancos:
– Estrutura
– Domínio
– Função
Download

genbank - Programa de Pós