Universidade Federal de Santa Catarina Programa de Pós-graduação em Bioquímica Apoios aos alunos de graduação Bioinformática Florianópolis, 09 de novembro de 2010. Tópicos • Genbank • Swiss-prot • pdb GENBANK GENBANK GENBANK: • É um banco de seqüências de nucleotídeos e proteínas. • Acesso irrestrito (grande http://www.ncbi.nlm.nih.gov parte) acessado pelo NCBI: • Construído pelo National Center of Biothecnology Information (NCBI) em 1982. COLABORAÇÕES: • DNA Data Bank do Japão (DDBJ) • European Bioinformatics Institutes (EBI, Hinxtin, UK). -> Todos estes centros recebem dados separadamente, estas informações são trocadas e integradas, de maneira que estes bancos contém o mesmo banco de dados, sendo grande parte deles disponível on line. O National Center for Biotechnology Information (NCBI) Bethesda, MD Aceita submissões de seqüências primárias. Desenvolve ferramentas para analisar dados. Criação de bancos específicos baseados na seqüência primária. Fornece pesquisa livre e links Tráfego de navegação ao NCBI 65 milhões de pb 61 milhões de seqüências Japan 6% Italy 4% Users per day 600,000 Canada 3% Germany 3% United Kingdom 3% Netherlands 2% 500,000 Spain 2% Brazil 2% Sweden 1% 400,000 Switzerland 1% Belgium1% U.S. Other 14% (.com, .net, .org, .gov, gov, .us) 300,000 40% 200,000 100,000 1998 1999 2000 2001 2002 2003 2004 Christmas and New Year’s Day 2005 01/21/2007 9/19/2006 Divisões do GENBANK PRI ROD PLN BCT INV VRT VRL MAM PHG SYN ENV UNA (28) (15) (20) (18) (7) (7) (4) (2) (1) (1) (4) (1) EST (570) Tag GSS (197) Sequence HTG (88) Genomic PAT (27) STS (9) CON (1) Primate Rodent Plant and Fungal Bacterial/Archeal Invertebrate Other Vertebrate Viral Mammalian Phage Synthetic Envir. samples Unannotated Organismo -Tradicional • Organizado por taxonomia • Submissões diretas (Sequin/Bankit) • Acuracidade (~1 error per 10,000 bp) • Bem caracterizado Expressed Sequence Genome Survey High Throughput Patent Sequence Tagged Site Contigs, virtual Functional - Bulk • Organizado por tipo de sequencia • Submissões por (ftp/email) • Menos acurado • Pouco caracterizado GENBANK funcional • Expressed Sequence Tag – Uma única passagem de leitura do cDNA • Genome Survey Sequence EST GenBank GSS HTG STS – Uma única passagem de leitura do gDNA • High Throughput Genomic – Seqüências incompletas de clones • Sequence Tagged Site – PCR-based mapping reagents Banco de Seqüências do tipo EST Pouco caracterizada GSS, HTG, WGS Whole BAC insert (or genome) shred sequence GSS division or trace archive assembly isolate clones whole genome shotgun assemblies (wgs projects) Draft sequence (HTG division) HTG: Honeybee Draft Sequence LOCUS AC141845 147720 bp DNA linear HTG 19-MAR-2004 DEFINITION Apis mellifera clone CH224-4A2, WORKING DRAFT SEQUENCE, 14 unordered pieces. ACCESSION AC141845 VERSION AC141845.1 GI:29124029 KEYWORDS HTG; HTGS_PHASE1; HTGS_DRAFT. • Sequencias não concluidas de BAC • Gaps e pedaços fora de ordem Genomas completos - Projetos Shotgun 685 projetos Bactéria (320) Sequencias ambientais (14) Archaea (8) Eucariotos (140), incluem: Frango, em ratinhos, ratos, cães (2), chimpanzé, humano Peixe (2) Abelha, Anopheles, moscas das frutas (3) Nematóides (2) As leveduras (8), Aspergillus (2) Arroz (2) Projetos Genomas Completos (WGS) wgs master[properties] ftp://ftp.ncbi.nih.gov/genbank/wgs/ GENBANK: procurando por seqüências – – – – Regiões regulatórias. Regiões não-traduzíveis. Regiões codificantes para proteínas. Regiões intergênicas. Swiss-prot Swiss-prot • O swiss-prot foi criado durante a tese de Amos Bairoch em 1986 ligado ao Swiss Institute of Bioinformatics (SIB). • Contém todas as seqüências protéicas de proteínas com funções conhecidas. • Swiss-prot está disponível no endereço eletrônico www.expasy.ch/sprot/ conectado ao servidor ExPAsy. • ExPASy: Expert Protein Analysis System contém banco de dados + ferramentas on line úteis. • Colaboração: European Bioinformatics Institute (EBI). • Automated TrEMBL (TRanslation of EMBL nucleotide sequences) Típico swiss-prot entry • Proteína • Função proteíca • bibliografia • Links com outros bancos: – Estrutura – Domínio – Função