UNIVERSIDADE FEDERAL DE PERNAMBUCO
CENTRO DE INFORMÁTICA
MESTRADO EM CIÊNCIA DA COMPUTAÇÃO
Modelagem, Avaliação, Modificação e
Seleção de Estruturas de Proteínas
Projeto de Pós-Graduação
Aluno Erico Souza Teixeira
|
Orientadora Katia Silva Guimarães
PROTEÍNAS
Conceitos
Citosina | Guanina
Adenina | Timina
PROJETO
Área de Desenvolvimento
• BioInformática
– Química Computacional
• Modelagem Molecular
• Descoberta das estruturas 3D
O Problema
• Construção de um modelo 3D de uma
proteína a partir da seqüência primária
O Problema
>gi|532319|pir|TVFV2E|TVFV2E envelope protein
ELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSEN
RT
QIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQA
WC
HFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFY
CK
MDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETIS
KK
TYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPI
ATOM
145 N
VAL A 25
32.433 16.336 57.540 1.00 11.92
A1
GF
N
APTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQK
ATOM
146 CA VAL A 25
31.132 16.439 58.160 1.00 11.85
A1
NL
C
LAAVEAQQQMLKLTIWGVK
ATOM
147 C
VAL A 25
30.447 15.105 58.363 1.00 12.34
A1
C
ATOM
O
148
O
VAL A
25
29.520
15.059
59.174
1.00 15.65
A1
ATOM
C
149
CB AVAL A
25
30.385
17.437
57.230
0.28 13.88
A1
ATOM
C
150
CB BVAL A
25
30.166
17.399
57.373
0.72 15.41
A1
ATOM
151
CG1AVAL A
25
28.870
17.401
57.336
0.28 12.64
A1
O Problema
• Importância
– Funcionalidade de uma proteína está
relacionada com sua estrutura 3D
– Desenvolvimento de novos medicamentos
– Descobrir estruturas de outras proteínas
• Situação atual
– 1/6 das seqüências tem estrutura conhecida
– Swiss-Prot (155576) X PDB (26403 )
Atacando o problema
• Métodos experimentais
– Estático
• cristalografia de raios-X
– Dinâmico
• técnicas de ressonância nuclear magnética
Atacando o problema
• Aplicações teóricas
– métodos físicos
• ab initio
– métodos empíricos
• threading
• homologia
Homologia
fim
busca e seleção
dos templates
avaliação do
modelo
alinhamento
alvo-template
construção do
modelo
Atacando o problema
• Precisões
Experimentais
(o.3 - o.5Å )
Empíricos
(1.oÅ )
Físicos
(3.5Å )
Atacando o problema
• Dificuldades
– Experimentais
• Tempo
• Equipamentos e laboratórios especializados
– Teóricos
• Manuseio com diversos programas (entrada/saída,
interfaces)
• Precisão
Melhorando a Precisão
• Avaliadores
– Indicam possíveis regiões problemáticas
– Metodologia baseada em conhecimento prévio
• Interações não covalentes entre os átomos de C-O-N
Freqüências de interações: janela e uma distância
• Propriedades estereoquímicas (ângulos e distância de
ligação, Ramanchandran Plot, ângulos diedros das
cadeias laterais, ...)
Morris et al. (1992) e Engh & Huber (1991)
• Interações entre os átomos
Cálculo de Energia potencial
Melhorando a Precisão
• Criando Novas Conformações
– Modelos de uma seqüência polipeptídica próximos
da estrutura nativa
– Coordenadas Cartesianas dos Cα
•
•
•
•
•
estágios iniciais da difração de raios-X
seqüências do PDB
Analítica
Baseado em conhecimento
Minimização de energia
– Ângulos de torção Φ (phi), ψ (psi)
• Construir a geometria ideal da proteínas
Seleção dos Modelos
• Métodos
– Campos de força
• Equações de potenciais de energia
• Termos não-ligados (interações de Lennard-Jones e
Coulomb )
• Ligados (distância das ligações, ângulos de ligação,
ângulos diedros)
• Restrições de posição e de distância
– Baseados em conhecimento
• Ou potenciais estatísticos
• Função de pontuação
O Projeto
• Definição
– eliminação defeitos presentes nas estruturas de
proteínas originadas da modelagem por
homologia
– Construir, avaliar, modificar e selecionas as
melhores conformações
O Projeto
Estrutura primária
da proteína
Modelagem
Estrutura terciária
da proteína
Seleção das
regiões
defeituosas
Avaliação da
estrutura
Construção das
conformações
Novos modelos
Modelo final
OUTROS PROJETOS
Modelagem
• MODELLER
– Interface da Accelrys
– Nenhum estudo de automatização do processo
Avaliadores
• 3 tipos de avaliadores
– Estereoquímicas
– Energia potencial
– Propriedades não presentes no processo de
modelagem
• Não há um projeto de relacionamento
Criando novas conformações
• Analítico
– 2-3 resíduos
• RAPPER e PETRA
– Ab initio
• FREAD
– Baseado em conhecimento prévio
– 3-8 resíduos
• CODA
– Combinação entre o FREAD e PETRA
• Não há aplicação em “mundo real”
Seleção de estruturas
• Comparação entre
–
–
–
–
Campos de Força (CHARMM)
Potenciais estatísticos
RMSD Cα
Choque de energia das cadeias laterais
• Problemas
– Seleção empírica
– Sob modelos originados de processos
experimentais
Como Resolver o
Problema
Ferramentas Aplicadas
• Modelagem
– MODELLER
• Projeto na graduação
• Mais conhecida
• Bom material teórico
Ferramentas Aplicadas
• Avaliadores
–
–
–
–
PROCHECK
ANoLEA
ProSa
PROVE
Ferramentas Aplicadas
• Criação das conformações
– Ab initio
– Ângulos de torção Φ (phi), ψ (psi)
• Seleção das Conformações
– TINKER
– Campo OPLSAA
Linguagens de Programação
• Perl
– Saídas das ferramentas apresentavam um
formato ASCII
– Projetos em iniciação científica
• Java
– Orientada o objeto
– Não dominava a linguagem C++
Entrada/Saída
O Projeto
CODIGO=<"CODIGO">
MODELLER=<on/off>
SEQUENCIA=<"SEQUENCIA">
TEMPLATES=
INICIO=
FIM=
NOME=
ORIGEM=
SEARCH=<no/yes/only>
AVALIADOR3D=<on/off>
PDB=default
ANOLEA=1
PROCHECK=1
PROSA=1
PROVE=1
WINDOW=5
CONFORMACOES=<on/off>
PDB=default
ANOLEA=0
PROCHECK=0
PROSA=0
PROVE=0
WINDOW=5
AUTOMATIC=yes/no
Exemplo
Modelagem
• Search
• Tabela de seqüências similares
Modelagem
• Download dos arquivos PDB
• Alinhamento entre as estruturas e a
seqüência alvo
• Construção da Árvore de Distância
Modelagem
• Construção de 5 modelos
• Seleção pela menor energia
Avaliadores
• Escolha dos pesos para cada uma das
ferramenta
• Execução
• Cálculo da região de maior pontuação
Construção das estruturas
Sai do algoritmo
sim
Há 1000 conformações
no conjunto final?
não
Retira uma
conformação da fila
Conformação
recusada
Após 25
tentativas
Insere o próximo
resíduo
Tem o tamanho
da região – 1?
não
Insere a nova e a
antiga conformação
na fila
sim
Houve
choques
Aproximação entre
o dummy e a
penúltima âncora
Insere a nova conformação
no conjunto final e a antiga
na fila
Não houve
choques
Insere a
última âncora
Construção das Estruturas
Seleção da melhor conformação
•
•
•
•
•
Construção das cadeias laterais
Validação dos choques
Cálculo da energia sem minimização
Escolha das 50 com menor energia
Cálculo do campo de força com
minimização
• Seleção daquela que apresenta a menor
energia
Alternativas
Modelagem
• Construção de interface que permita
– Alterar os alinhamentos
– Visualizar agrupamentos das seqüências
similares
• Função de pontuação para a seleção
automática ou classificação dos templates
Avaliadores
• Clustering da informação
– Associar os tipos usados como modelos de cada
ferramenta com os templates da homologia
– Determinar uma função de pontuação de acordo
com as famílias de proteínas
Construção de conformações
• Inserir parcelas de campos de força como
filtro de construção
• Aplicação de análises originados de
estruturas representativas do PDB
– Ab initio + conhecimento prévio
Seleção das conformações
• Aplicação de outros campos de força de
acordo com a famílias dos templates
Docking
• Aplicação dos campos de força
• Busca dos sítios ativos
UNIVERSIDADE FEDERAL DE PERNAMBUCO
CENTRO DE INFORMÁTICA
MESTRADO EM CIÊNCIA DA COMPUTAÇÃO
Modelagem, Avaliação, Modificação e
Seleção de Estruturas de Proteínas
Projeto de Pós-Graduação
Obrigado !!!
UNIVERSIDADE FEDERAL DE PERNAMBUCO
CENTRO DE INFORMÁTICA
GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
Análise de um Modelador de Estrutura de
Proteínas e seus Componentes
Trabalho de Graduação em Teoria da Computação
Obrigado !!!
Download

Análise de um Modelador de Estrutura de Proteínas e seus