UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas Projeto de Pós-Graduação Aluno Erico Souza Teixeira | Orientadora Katia Silva Guimarães PROTEÍNAS Conceitos Citosina | Guanina Adenina | Timina PROJETO Área de Desenvolvimento • BioInformática – Química Computacional • Modelagem Molecular • Descoberta das estruturas 3D O Problema • Construção de um modelo 3D de uma proteína a partir da seqüência primária O Problema >gi|532319|pir|TVFV2E|TVFV2E envelope protein ELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSEN RT QIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQA WC HFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFY CK MDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETIS KK TYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPI ATOM 145 N VAL A 25 32.433 16.336 57.540 1.00 11.92 A1 GF N APTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQK ATOM 146 CA VAL A 25 31.132 16.439 58.160 1.00 11.85 A1 NL C LAAVEAQQQMLKLTIWGVK ATOM 147 C VAL A 25 30.447 15.105 58.363 1.00 12.34 A1 C ATOM O 148 O VAL A 25 29.520 15.059 59.174 1.00 15.65 A1 ATOM C 149 CB AVAL A 25 30.385 17.437 57.230 0.28 13.88 A1 ATOM C 150 CB BVAL A 25 30.166 17.399 57.373 0.72 15.41 A1 ATOM 151 CG1AVAL A 25 28.870 17.401 57.336 0.28 12.64 A1 O Problema • Importância – Funcionalidade de uma proteína está relacionada com sua estrutura 3D – Desenvolvimento de novos medicamentos – Descobrir estruturas de outras proteínas • Situação atual – 1/6 das seqüências tem estrutura conhecida – Swiss-Prot (155576) X PDB (26403 ) Atacando o problema • Métodos experimentais – Estático • cristalografia de raios-X – Dinâmico • técnicas de ressonância nuclear magnética Atacando o problema • Aplicações teóricas – métodos físicos • ab initio – métodos empíricos • threading • homologia Homologia fim busca e seleção dos templates avaliação do modelo alinhamento alvo-template construção do modelo Atacando o problema • Precisões Experimentais (o.3 - o.5Å ) Empíricos (1.oÅ ) Físicos (3.5Å ) Atacando o problema • Dificuldades – Experimentais • Tempo • Equipamentos e laboratórios especializados – Teóricos • Manuseio com diversos programas (entrada/saída, interfaces) • Precisão Melhorando a Precisão • Avaliadores – Indicam possíveis regiões problemáticas – Metodologia baseada em conhecimento prévio • Interações não covalentes entre os átomos de C-O-N Freqüências de interações: janela e uma distância • Propriedades estereoquímicas (ângulos e distância de ligação, Ramanchandran Plot, ângulos diedros das cadeias laterais, ...) Morris et al. (1992) e Engh & Huber (1991) • Interações entre os átomos Cálculo de Energia potencial Melhorando a Precisão • Criando Novas Conformações – Modelos de uma seqüência polipeptídica próximos da estrutura nativa – Coordenadas Cartesianas dos Cα • • • • • estágios iniciais da difração de raios-X seqüências do PDB Analítica Baseado em conhecimento Minimização de energia – Ângulos de torção Φ (phi), ψ (psi) • Construir a geometria ideal da proteínas Seleção dos Modelos • Métodos – Campos de força • Equações de potenciais de energia • Termos não-ligados (interações de Lennard-Jones e Coulomb ) • Ligados (distância das ligações, ângulos de ligação, ângulos diedros) • Restrições de posição e de distância – Baseados em conhecimento • Ou potenciais estatísticos • Função de pontuação O Projeto • Definição – eliminação defeitos presentes nas estruturas de proteínas originadas da modelagem por homologia – Construir, avaliar, modificar e selecionas as melhores conformações O Projeto Estrutura primária da proteína Modelagem Estrutura terciária da proteína Seleção das regiões defeituosas Avaliação da estrutura Construção das conformações Novos modelos Modelo final OUTROS PROJETOS Modelagem • MODELLER – Interface da Accelrys – Nenhum estudo de automatização do processo Avaliadores • 3 tipos de avaliadores – Estereoquímicas – Energia potencial – Propriedades não presentes no processo de modelagem • Não há um projeto de relacionamento Criando novas conformações • Analítico – 2-3 resíduos • RAPPER e PETRA – Ab initio • FREAD – Baseado em conhecimento prévio – 3-8 resíduos • CODA – Combinação entre o FREAD e PETRA • Não há aplicação em “mundo real” Seleção de estruturas • Comparação entre – – – – Campos de Força (CHARMM) Potenciais estatísticos RMSD Cα Choque de energia das cadeias laterais • Problemas – Seleção empírica – Sob modelos originados de processos experimentais Como Resolver o Problema Ferramentas Aplicadas • Modelagem – MODELLER • Projeto na graduação • Mais conhecida • Bom material teórico Ferramentas Aplicadas • Avaliadores – – – – PROCHECK ANoLEA ProSa PROVE Ferramentas Aplicadas • Criação das conformações – Ab initio – Ângulos de torção Φ (phi), ψ (psi) • Seleção das Conformações – TINKER – Campo OPLSAA Linguagens de Programação • Perl – Saídas das ferramentas apresentavam um formato ASCII – Projetos em iniciação científica • Java – Orientada o objeto – Não dominava a linguagem C++ Entrada/Saída O Projeto CODIGO=<"CODIGO"> MODELLER=<on/off> SEQUENCIA=<"SEQUENCIA"> TEMPLATES= INICIO= FIM= NOME= ORIGEM= SEARCH=<no/yes/only> AVALIADOR3D=<on/off> PDB=default ANOLEA=1 PROCHECK=1 PROSA=1 PROVE=1 WINDOW=5 CONFORMACOES=<on/off> PDB=default ANOLEA=0 PROCHECK=0 PROSA=0 PROVE=0 WINDOW=5 AUTOMATIC=yes/no Exemplo Modelagem • Search • Tabela de seqüências similares Modelagem • Download dos arquivos PDB • Alinhamento entre as estruturas e a seqüência alvo • Construção da Árvore de Distância Modelagem • Construção de 5 modelos • Seleção pela menor energia Avaliadores • Escolha dos pesos para cada uma das ferramenta • Execução • Cálculo da região de maior pontuação Construção das estruturas Sai do algoritmo sim Há 1000 conformações no conjunto final? não Retira uma conformação da fila Conformação recusada Após 25 tentativas Insere o próximo resíduo Tem o tamanho da região – 1? não Insere a nova e a antiga conformação na fila sim Houve choques Aproximação entre o dummy e a penúltima âncora Insere a nova conformação no conjunto final e a antiga na fila Não houve choques Insere a última âncora Construção das Estruturas Seleção da melhor conformação • • • • • Construção das cadeias laterais Validação dos choques Cálculo da energia sem minimização Escolha das 50 com menor energia Cálculo do campo de força com minimização • Seleção daquela que apresenta a menor energia Alternativas Modelagem • Construção de interface que permita – Alterar os alinhamentos – Visualizar agrupamentos das seqüências similares • Função de pontuação para a seleção automática ou classificação dos templates Avaliadores • Clustering da informação – Associar os tipos usados como modelos de cada ferramenta com os templates da homologia – Determinar uma função de pontuação de acordo com as famílias de proteínas Construção de conformações • Inserir parcelas de campos de força como filtro de construção • Aplicação de análises originados de estruturas representativas do PDB – Ab initio + conhecimento prévio Seleção das conformações • Aplicação de outros campos de força de acordo com a famílias dos templates Docking • Aplicação dos campos de força • Busca dos sítios ativos UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO Modelagem, Avaliação, Modificação e Seleção de Estruturas de Proteínas Projeto de Pós-Graduação Obrigado !!! UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Análise de um Modelador de Estrutura de Proteínas e seus Componentes Trabalho de Graduação em Teoria da Computação Obrigado !!!