Análise de Estruturas de
Proteínas
(Parte 2)
Jeane Melo
Roteiro

Introdução

Predição de Estrutura Secundária (Parte 1)




Apresentação do problema
Exemplos de abordagens
Preditor NNPSS
Comparação e Detecção de Padrões Estruturais
(Parte 2)



Jeane Melo
Apresentação do problema
Exemplos de abordagens
Modelo desenvolvido
Introdução

Proteínas

Jeane Melo
Metabolismo, suporte de filamentos, catálise
bioquímica, regulação do volume celular e imunização
Introdução
Swiss-Prot
290484
PDB
Seqüências
48235
X
Estruturas
Jeane Melo
Introdução
Jeane Melo
Predição de Estrutura
Secundária de Proteínas
Predição de Estrutura Secundária
 Patrick J. Fleming, Haipeng Gong and George D. Rose (2006) Secondary structure
determines protein topology. Protein Science 15:1828-1834.
Jeane Melo
O Preditor NNPSS
Jeane Melo
Extração de Características
Jeane Melo
Comparação e Detecção
de Estruturas
Comparação e Detecção de Estruturas
Jeane Melo
Motivos (motifs) estruturais

Elemento estrutural tridimensional encontrado
em diversas moléculas.

GCN4 leucine zipper
Ex.: Coiled Coil
gp41 hexamer: initiates
the entry of HIV into its
target cell.
Jeane Melo
Domínios Estruturais

Estruturas compactas

Função

Ação individual ou em
conjunto

Delimitação

Bases de Dados




Jeane Melo
3Dee
CATH
Dali
SCOP
Pyruvate kinase, a protein
from three domains
Classificação de Estruturas
Jeane Melo
Alinhamento Estrutural


Alinhamento de
seqüências baseado
em comparação
estrutural
Comparação de
proteínas com baixa
similaridade entre as
seqüências.
Thioredoxin: Humano X Drosophila melanogaster.
Jeane Melo
Processo de Comparação

Escolha das características




Elementos geométricos
Elementos topológicos
Propriedades físico-químicas dos
aminoácidos
Representação


Jeane Melo
Rotação e translação
Pouca variação diante de pequenas
diferenças
Processo de Comparação

Representação através de
um conjunto de pontos



Coordenadas dos centros
dos átomos
Restrição da região de
comparação
Cadeias laterais
 Escalier, V. (1997). Algorithmes pour la comparaison de structures moléculaires
tridimensionnelles. PhD thesis, Université Paris VII.
Jeane Melo
Processo de Comparação

Representação através de EES


Mais simples e compacta (15~300)
Mecanismos genéticos raramente produzem mutações
topológicas
 Dror, O., Benyamini, H., Nussinov, R., and Wolfson, H. J. (2003). Multiple structural alignment
by secondary structures: Algorithm and applications. Protein Science, 12:2492-2507.
Jeane Melo
Exemplos de Abordagens

Arthur Lesk, 1995




Distribuição dos elementos
de estrutura secundária
(SSEs) ao longo da cadeia
Interações geométricas
entre tais elementos
Representação Matricial
Classes de interação
1
1
1
2
3
1
2
PE
PE
HH PD HH
3
KK
PD
HH
 Lesk, A. M. (1995). Systematic representation of protein folding patterns. Journal of
Molecular Graphics, 13:159-164.
Jeane Melo
Exemplos de Abordagens

Ferramenta TOPS
 Seqüência de SSEs (grafos)
 Relações entre pares de
elementos

Ignora tamanho e orientações
precisas
 up e down

Busca em bancos de dados
definidos
 Michalopoulos, I., Torrance, G. M., Gilbert, D. R., and Westhead, D. R. (2004). TOPS:
an enhanced database of protein structural topology. Nucleic Acids Research, 32.
Jeane Melo
Exemplos de Abordagens

Ferramenta MASS

Dois níveis
 Elementos de estrutura
secundária (SSEs)


Tipo, distância  1.5Å,
diferença entre ângulos
 0.3 rad
Coordenadas atômicas
dos C
 Dror, O., Benyamini, H., Nussinov, R., and Wolfson, H. J. (2003). Multiple structural
alignment by secondary structures: Algorithm and applications. Protein Science, 12:24922507.
Jeane Melo
Exemplos de Abordagens
Ferramenta MASS (cont.)

Melhor alinhamento

Jeane Melo
pivot
Pontos Abordados

Informações a serem consideradas no
processo da comparação

Comparação múltipla
Jeane Melo
Representação Proposta

Dados






Obtenção de vetores através do VAST
Acesso direto ao valor do ângulo ou dupla codificação
Distâncias
Tamanho dos vetores
Flexibilidade
Representação através de grafos
 Gibrat, J.-F., Madej, T., and Bryant, S. H. (1996). Surprising similarities in structure
comparison. Current Opinion in Structural Biology.
Jeane Melo
Busca por Motivos

Isomorfismo de subgrafos
a
c
d
b
e
Jeane Melo
f
Busca por Motivos

Algoritmo do Ullmann




Jeane Melo
Estender um mapeamento M inicialmente vazio
Enumerar todos os possíveis isomorfismos
Seleção de possibilidades baseada no grau dos
vértices
Teste de adjacência
Busca por Motivos

Adaptação do algoritmo do Ullmann


Representação adotada para o problema
Restrições


Relações entre pares de elementos



Grau dos vértices, tipo, tamanho
Ângulo, código, distâncias
Grau dos vértices
Testes preliminares

Conjunto de 20 globinas


Jeane Melo
Reconhece a ocorrência de motivos no conjunto
Proteínas similares têm representações similares
Busca por Subestrutura Comum

Busca por subgrafo maximal



Generalização de isomorfismo de grafos
NP-completo
Adaptação do algoritmo de McGregor


Jeane Melo
Representação adotada
Comparação múltipla
Busca por Subestrutura Comum

Algoritmo de McGregor

Efetuar o produto dos grafos envolvidos

Efetuar a busca por cliques no grafo resultante

Jeane Melo
Cliques nos grafos resultantes corresponderão a
subestruturas comuns
Busca por Subestrutura Comum
Produto de grafos

ae
c
a
af
ad
d
be
bd
bf
b
e
(A)
f
cd
(B)
ce
(AXB)
Jeane Melo
cf
Busca por Subestrutura Comum

Generalização para N proteínas


Representação adotada
Vértices similares


Arestas

Jeane Melo
Tipo, tamanho
Ângulos, distâncias
Busca por Subestrutura Comum

Testes

Conjunto de 20 globinas


Tipo (não muito seletivo)
Tamanho



Ângulos e distâncias
Proteínas com dois domínios em comum

Jeane Melo
30%
Retorna elementos pertencentes a ambos os domínios
Busca por Subestrutura Comum

Proteínas muito semelhantes e com número de
elementos de estrutura secundária bem acima da
média
 Número de vértices considerados
 Cliques
 Grafos esparsos
Jeane Melo
Download

Comparação de Estruturas de Proteínas.