Bioinformática (4611B) - Turmas 120/130 (3AB/CD, 4BC) - 2015_2
Osmar Norberto de Souza ([email protected])
Faculdade de Informática - PUCRS, Prédio 32 – Sala 608
Aula Prática de 18 e 19/08/2015: bancos de dados biológicos – Protein Data Bank ou PDB
Introdução
Esta aula prática possui dois objetivos:
1.
Introduzir os tipos de dados de DNA presentes no banco de dados GenBank (formato dos dados, como o flat
file e fasta; visualização, conexões para bancos de dados de referência cruzada, como genes e proteínas são
anotados e, quando possível, as suas coordenadas na sequencia genômica). Como a grande maioria das
sequências de aminoácidos das proteínas é derivada dessas sequências, analisaremos, de forma similar, as
proteínas.
2.
Praticar a consulta online a diferentes bancos de dados, incluindo-se o GenBank e o Protein Data Bank (PDB)
para obter informações sobre genes e proteínas. Desde suas sequências e organismos de origem até as
estruturas tridimensionais (3D) das proteínas e seus complexos. Aprender a fazer essas consultas é um passo
muito importante e, com frequência um desafio, devido à enorme quantidade de dados presentes nestes
bancos. Esta habilidade é a mais básica exigida de um bioinformata.
O que é o Protein Data Bank ou PDB?
O Protein Data Bank (PDB) é um banco de dados de estruturas tridimensionais (3D) experimentais de
macromoléculas biológicas, como peptídeos, proteínas, DNA, RNA e seus complexos com outras moléculas
ou ligantes. Ligantes são moléculas que se “ligam” ou se unem a outras moléculas, frequentemente por meio
de interações intermoleculares, como, por exemplo, para citar dois tipos apenas, as ligações de hidrogênio e
pontes salinas. No PDB os ligantes podem ser os próprios peptídeos, proteínas, DNA, RNA, coenzimas,
cofatores e outras pequenas moléculas de baixa massa molecular.
O PDB faz parte do The Worldwide Protein Data Bank (wwPDB), um consórcio de organizações para o
depósito, processamento e distribuição dos dados do PDB. As organizações são: RCSB PDB (Estados Unidos
da América), PDBe (Europa) and PDBj (Japão), e o BMRB (Biological Magnetic Resonance Data Bank,
Estados Unidos da América). A missão do wwPDB é manter um único arquivo PDB de dados estruturais de
macromoléculas de forma pública e gratuita para a comunidade mundial.
O arquivo principal do PDB consiste apenas de estruturas 3D determinadas experimentalmente por
cristalografia por difração de raios X (X-ray), Ressonância Magnética Nuclear (NMR, sigla em inglês),
Microscopia Eletrônica (EM) ou combinações dessas técnicas experimentais.
Há banco de dados para o depósito de estruturas 3D de macromoléculas obtidas por meio de modelagem
computacional ou in silico. Um desses bancos é o Protein Model Portal ou PMD que, apesar de ser muito
importante, não será discutido nessa unidade.
Onde encontramos o Protein Data Bank ou PDB?
A página do PDB na internet (http://www.rcsb.org/pdb/static.do?p=search/index.html) é um portal para acesso
às informações sobre estruturas tridimensionais (3D) de macromoléculas biológicas.
PARTE 2: Consulta ao PDB
1
Consultas ao PDB podem ser feitas de muitas formas diferentes, como veremos mais adiante. Aqui,
iniciaremos com uma consulta utilizando simplesmente palavra- ou palavras-chave (nome do gene, nome da
proteína ou enzima, nome do ligante, nome do organismo).
Busque por InhA and tuberculosis (Aqui nós aspiramos encontrar estrutura(s) 3D do produto do gene inhA,
a proteína InhA, do agente etiológico da tuberculose, o Mycobatcerium tuberculosis H37Rv).
Procurem analisar a estrutura da página web com os resultados. Vejam como esses se encontram
organizados. Isso facilitará a sua compreensão. Observem os resultados atentamente e respondam às
questões seguintes.
Questão 1.1:
a) Quantos resultados foram obtidos nesta consulta?
b) Quantos são de Mycobacterium tuberculosis?
c) Quantos são de Mycobacterium tuberculosis H37Rv?
d) Qual é o número de acesso ao PDB da estrutura 3D da proteína InhA de M. tuberculosis
H37Rv? Dica: prestem bastante atenção nesta pergunta.
e) Qual é o código de acesso ao PDB da primeira estrutura cristalina da InhA de M.
tuberculosis (Mtb)?
Abram o resultado da resposta à questão e) acima e analisem o arquivo resultante.
Questão 1.2:
a) Quantos aminoácidos tem a proteína InhA de Mtb?
b) Que tipo de proteína é a InhA? De transporte, armazenamento, estrutural ou enzima?
c) Qual a resolução da estrutura 3D InhA de Mtb cujo código PDB é 1ENY?
d) Existe algum ligante associado á estrutura cujo código PDB é 1ENY?
e) Se a resposta ao item anterior for SIM, qual é o seu nome?
f) Qual é a origem dos dados apresentados nesta entrada (entry) do PDB?
Formato PDB e visualização de estrutura 3D de macromoléculas biológicas
O formato do arquivo que registra a estrutura 3D de macromoléculas biológicas no PDB é muito mais
complexo do que o do GenBank, GenPept e FASTA para sequências de DNA, RNA e proteínas. Iremos
investigar este formato dentro do contexto de visualização de estruturas 3D de macromoléculas biológicas
utilizando um software específico para esta atividade.
2
Download

Guia prático para o Protein Data Bank (PDB)