Análise de Estruturas de Proteínas (Parte 2) Jeane Melo Roteiro Introdução Predição de Estrutura Secundária (Parte 1) Apresentação do problema Exemplos de abordagens Preditor NNPSS Comparação e Detecção de Padrões Estruturais (Parte 2) Jeane Melo Apresentação do problema Exemplos de abordagens Modelo desenvolvido Introdução Proteínas Jeane Melo Metabolismo, suporte de filamentos, catálise bioquímica, regulação do volume celular e imunização Introdução Swiss-Prot 290484 PDB Seqüências 48235 X Estruturas Jeane Melo Introdução Jeane Melo Predição de Estrutura Secundária de Proteínas Predição de Estrutura Secundária Patrick J. Fleming, Haipeng Gong and George D. Rose (2006) Secondary structure determines protein topology. Protein Science 15:1828-1834. Jeane Melo O Preditor NNPSS Jeane Melo Extração de Características Jeane Melo Comparação e Detecção de Estruturas Comparação e Detecção de Estruturas Jeane Melo Motivos (motifs) estruturais Elemento estrutural tridimensional encontrado em diversas moléculas. GCN4 leucine zipper Ex.: Coiled Coil gp41 hexamer: initiates the entry of HIV into its target cell. Jeane Melo Domínios Estruturais Estruturas compactas Função Ação individual ou em conjunto Delimitação Bases de Dados Jeane Melo 3Dee CATH Dali SCOP Pyruvate kinase, a protein from three domains Classificação de Estruturas Jeane Melo Alinhamento Estrutural Alinhamento de seqüências baseado em comparação estrutural Comparação de proteínas com baixa similaridade entre as seqüências. Thioredoxin: Humano X Drosophila melanogaster. Jeane Melo Processo de Comparação Escolha das características Elementos geométricos Elementos topológicos Propriedades físico-químicas dos aminoácidos Representação Jeane Melo Rotação e translação Pouca variação diante de pequenas diferenças Processo de Comparação Representação através de um conjunto de pontos Coordenadas dos centros dos átomos Restrição da região de comparação Cadeias laterais Escalier, V. (1997). Algorithmes pour la comparaison de structures moléculaires tridimensionnelles. PhD thesis, Université Paris VII. Jeane Melo Processo de Comparação Representação através de EES Mais simples e compacta (15~300) Mecanismos genéticos raramente produzem mutações topológicas Dror, O., Benyamini, H., Nussinov, R., and Wolfson, H. J. (2003). Multiple structural alignment by secondary structures: Algorithm and applications. Protein Science, 12:2492-2507. Jeane Melo Exemplos de Abordagens Arthur Lesk, 1995 Distribuição dos elementos de estrutura secundária (SSEs) ao longo da cadeia Interações geométricas entre tais elementos Representação Matricial Classes de interação 1 1 1 2 3 1 2 PE PE HH PD HH 3 KK PD HH Lesk, A. M. (1995). Systematic representation of protein folding patterns. Journal of Molecular Graphics, 13:159-164. Jeane Melo Exemplos de Abordagens Ferramenta TOPS Seqüência de SSEs (grafos) Relações entre pares de elementos Ignora tamanho e orientações precisas up e down Busca em bancos de dados definidos Michalopoulos, I., Torrance, G. M., Gilbert, D. R., and Westhead, D. R. (2004). TOPS: an enhanced database of protein structural topology. Nucleic Acids Research, 32. Jeane Melo Exemplos de Abordagens Ferramenta MASS Dois níveis Elementos de estrutura secundária (SSEs) Tipo, distância 1.5Å, diferença entre ângulos 0.3 rad Coordenadas atômicas dos C Dror, O., Benyamini, H., Nussinov, R., and Wolfson, H. J. (2003). Multiple structural alignment by secondary structures: Algorithm and applications. Protein Science, 12:24922507. Jeane Melo Exemplos de Abordagens Ferramenta MASS (cont.) Melhor alinhamento Jeane Melo pivot Pontos Abordados Informações a serem consideradas no processo da comparação Comparação múltipla Jeane Melo Representação Proposta Dados Obtenção de vetores através do VAST Acesso direto ao valor do ângulo ou dupla codificação Distâncias Tamanho dos vetores Flexibilidade Representação através de grafos Gibrat, J.-F., Madej, T., and Bryant, S. H. (1996). Surprising similarities in structure comparison. Current Opinion in Structural Biology. Jeane Melo Busca por Motivos Isomorfismo de subgrafos a c d b e Jeane Melo f Busca por Motivos Algoritmo do Ullmann Jeane Melo Estender um mapeamento M inicialmente vazio Enumerar todos os possíveis isomorfismos Seleção de possibilidades baseada no grau dos vértices Teste de adjacência Busca por Motivos Adaptação do algoritmo do Ullmann Representação adotada para o problema Restrições Relações entre pares de elementos Grau dos vértices, tipo, tamanho Ângulo, código, distâncias Grau dos vértices Testes preliminares Conjunto de 20 globinas Jeane Melo Reconhece a ocorrência de motivos no conjunto Proteínas similares têm representações similares Busca por Subestrutura Comum Busca por subgrafo maximal Generalização de isomorfismo de grafos NP-completo Adaptação do algoritmo de McGregor Jeane Melo Representação adotada Comparação múltipla Busca por Subestrutura Comum Algoritmo de McGregor Efetuar o produto dos grafos envolvidos Efetuar a busca por cliques no grafo resultante Jeane Melo Cliques nos grafos resultantes corresponderão a subestruturas comuns Busca por Subestrutura Comum Produto de grafos ae c a af ad d be bd bf b e (A) f cd (B) ce (AXB) Jeane Melo cf Busca por Subestrutura Comum Generalização para N proteínas Representação adotada Vértices similares Arestas Jeane Melo Tipo, tamanho Ângulos, distâncias Busca por Subestrutura Comum Testes Conjunto de 20 globinas Tipo (não muito seletivo) Tamanho Ângulos e distâncias Proteínas com dois domínios em comum Jeane Melo 30% Retorna elementos pertencentes a ambos os domínios Busca por Subestrutura Comum Proteínas muito semelhantes e com número de elementos de estrutura secundária bem acima da média Número de vértices considerados Cliques Grafos esparsos Jeane Melo