Bioinformática (4611B) - Turmas 120/130 (3AB/CD, 4BC) - 2015_2 Osmar Norberto de Souza ([email protected]) Faculdade de Informática - PUCRS, Prédio 32 – Sala 608 Aula Prática de 18 e 19/08/2015: bancos de dados biológicos – Protein Data Bank ou PDB Introdução Esta aula prática possui dois objetivos: 1. Introduzir os tipos de dados de DNA presentes no banco de dados GenBank (formato dos dados, como o flat file e fasta; visualização, conexões para bancos de dados de referência cruzada, como genes e proteínas são anotados e, quando possível, as suas coordenadas na sequencia genômica). Como a grande maioria das sequências de aminoácidos das proteínas é derivada dessas sequências, analisaremos, de forma similar, as proteínas. 2. Praticar a consulta online a diferentes bancos de dados, incluindo-se o GenBank e o Protein Data Bank (PDB) para obter informações sobre genes e proteínas. Desde suas sequências e organismos de origem até as estruturas tridimensionais (3D) das proteínas e seus complexos. Aprender a fazer essas consultas é um passo muito importante e, com frequência um desafio, devido à enorme quantidade de dados presentes nestes bancos. Esta habilidade é a mais básica exigida de um bioinformata. O que é o Protein Data Bank ou PDB? O Protein Data Bank (PDB) é um banco de dados de estruturas tridimensionais (3D) experimentais de macromoléculas biológicas, como peptídeos, proteínas, DNA, RNA e seus complexos com outras moléculas ou ligantes. Ligantes são moléculas que se “ligam” ou se unem a outras moléculas, frequentemente por meio de interações intermoleculares, como, por exemplo, para citar dois tipos apenas, as ligações de hidrogênio e pontes salinas. No PDB os ligantes podem ser os próprios peptídeos, proteínas, DNA, RNA, coenzimas, cofatores e outras pequenas moléculas de baixa massa molecular. O PDB faz parte do The Worldwide Protein Data Bank (wwPDB), um consórcio de organizações para o depósito, processamento e distribuição dos dados do PDB. As organizações são: RCSB PDB (Estados Unidos da América), PDBe (Europa) and PDBj (Japão), e o BMRB (Biological Magnetic Resonance Data Bank, Estados Unidos da América). A missão do wwPDB é manter um único arquivo PDB de dados estruturais de macromoléculas de forma pública e gratuita para a comunidade mundial. O arquivo principal do PDB consiste apenas de estruturas 3D determinadas experimentalmente por cristalografia por difração de raios X (X-ray), Ressonância Magnética Nuclear (NMR, sigla em inglês), Microscopia Eletrônica (EM) ou combinações dessas técnicas experimentais. Há banco de dados para o depósito de estruturas 3D de macromoléculas obtidas por meio de modelagem computacional ou in silico. Um desses bancos é o Protein Model Portal ou PMD que, apesar de ser muito importante, não será discutido nessa unidade. Onde encontramos o Protein Data Bank ou PDB? A página do PDB na internet (http://www.rcsb.org/pdb/static.do?p=search/index.html) é um portal para acesso às informações sobre estruturas tridimensionais (3D) de macromoléculas biológicas. PARTE 2: Consulta ao PDB 1 Consultas ao PDB podem ser feitas de muitas formas diferentes, como veremos mais adiante. Aqui, iniciaremos com uma consulta utilizando simplesmente palavra- ou palavras-chave (nome do gene, nome da proteína ou enzima, nome do ligante, nome do organismo). Busque por InhA and tuberculosis (Aqui nós aspiramos encontrar estrutura(s) 3D do produto do gene inhA, a proteína InhA, do agente etiológico da tuberculose, o Mycobatcerium tuberculosis H37Rv). Procurem analisar a estrutura da página web com os resultados. Vejam como esses se encontram organizados. Isso facilitará a sua compreensão. Observem os resultados atentamente e respondam às questões seguintes. Questão 1.1: a) Quantos resultados foram obtidos nesta consulta? b) Quantos são de Mycobacterium tuberculosis? c) Quantos são de Mycobacterium tuberculosis H37Rv? d) Qual é o número de acesso ao PDB da estrutura 3D da proteína InhA de M. tuberculosis H37Rv? Dica: prestem bastante atenção nesta pergunta. e) Qual é o código de acesso ao PDB da primeira estrutura cristalina da InhA de M. tuberculosis (Mtb)? Abram o resultado da resposta à questão e) acima e analisem o arquivo resultante. Questão 1.2: a) Quantos aminoácidos tem a proteína InhA de Mtb? b) Que tipo de proteína é a InhA? De transporte, armazenamento, estrutural ou enzima? c) Qual a resolução da estrutura 3D InhA de Mtb cujo código PDB é 1ENY? d) Existe algum ligante associado á estrutura cujo código PDB é 1ENY? e) Se a resposta ao item anterior for SIM, qual é o seu nome? f) Qual é a origem dos dados apresentados nesta entrada (entry) do PDB? Formato PDB e visualização de estrutura 3D de macromoléculas biológicas O formato do arquivo que registra a estrutura 3D de macromoléculas biológicas no PDB é muito mais complexo do que o do GenBank, GenPept e FASTA para sequências de DNA, RNA e proteínas. Iremos investigar este formato dentro do contexto de visualização de estruturas 3D de macromoléculas biológicas utilizando um software específico para esta atividade. 2