Bioinformática
Osmar NORBERTO DE SOUZA, Ph.D.
E-mail: [email protected]
Laboratório de Bioinformática, Modelagem e Simulação de Biossistemas (LABIO)
Faculdade de Informática
Pontifícia Universidade Católica do Rio Grande do Sul – PUCRS
Porto Alegre - RS
Agosto de 2015
Conformação de proteínas
A condensação dos aminoácidos produz uma cadeia polipeptídica, com os átomos do esqueleto
unidos pela ligação pepptídica.
Reação de síntese por desidratação
Conformação da cadeia principal (main-chain) ou
esqueleto (backbone)
O padrão de enovelamento de uma cadeia polipeptídica pode ser descrito em termos de ângulos internos
de rotação em torno de ligações da cadeia principal.
As ligações, na cadeia principal, entre os átomos N e C, e entre os átomos C e C, são ligações simples.
Rotações em torno dessas ligações não são restritas pela estrutura eletrônica, mas somente por
impedimentos estéricos nas conformações produzidas.
Conformação da cadeia principal ou esqueleto
O padrão de enovelamento de uma cadeia polipeptídica pode ser descrito em termos de ângulos internos
de rotação em torno de ligações da cadeia principal.
ω é restrito a 0° (cis) ou 180° (trans).
Conformação da cadeia principal ou esqueleto
O gráfico de Ramakrishnan-Sasisekharan-Ramachandran
Porque a maioria dos resíduos de aminoácidos em proteínas possuem ligações peptídicas trans, a
conformação da cadeia principal de cada resíduo é determinada por dois ângulos: φ e ψ. Há duas
regiões principais permitidas, uma em torno de φ = -57° e ψ = -47° (R) e a outra em torno de
φ = -125°e ψ = +125° () .
Conformações das cadeias laterais
As conformações das cadeias laterais são descritas também pelo ângulos internos de rotação,
denominados χ1 até χ5, ao longo da cadeia lateral. Cadeias laterais diferentes possuem diferentes
graus de liberdade. A cadeia lateral da fenilalanina, por exemplo, possui dois ângulos internos de
rotação (esquerda), enquanto a lisina (direita) possui quatro.
Hierarquia estrutural das proteínas
Estrutra Primária
Estrutura Secundária
Estrutura Terciária
Estrutura Quaternária
Hierarquia estrutural das proteínas
Estrutura Primária
A sequência linear de aminoácidos
MTATATEGAK PPFVSRSVLV
KVAVTHRGSG APKGLFGVEC
PVEVLVSNAG LSADAFLMRM
QRASRSMQRN KFGRMIFIGS
IGMARSIARE LSKANVTANV
GALQFIPAKR VGTPAEVAGV
GGMGMGH-247
TGGNRGIGLA
DVTDSDAVDR
TEEKFEKVIN
VSGSWGIGNQ
VAPGYIDTDM
VSFLASEDAS
IAQRLAADGH
AFTAVEEHQG
ANLTGAFRVA
ANYAASKAGV
TRALDERIQQ
YISGAVIPVD
Hierarquia estrutural das proteínas
Estrutura Secundária
Hierarquia estrutural das proteínas
Estrutura Secundária (cont.)
Hélice 
Folha β
Hierarquia estrutural das proteínas
Estrutura Supersecundária
Hierarquia estrutural das proteínas
Estrutura Terciária = Topologia (Fold)
Hierarquia estrutural das proteínas
Estrutura Quaternária
Hierarquia estrutural das proteínas
Estrutura Quaternária
Um pequeno álbum de estruturas de proteínas
Comparaçãode estruturas de proteínas
Domínios proteicos
Arquitetura de domínios proteícos
(1) Proteína com um único domínio
(2) Proteína com múltiplos domínios
Domain
A
B
C
D
• Proteoma procariótico: 2/3 proteínas possuem dois ou mais domínios
• Proteoma eucariótico: 4/5 das proteínas possuem múltiplos domínios
Motivos proteicos
Classificação estrutural de proteínas
•Hierarquia da calssificação estrutural de domínios protéicos Protein Databank
(PDB).
•Domínio são agrupados em quatro níveis principais:
•Class
•Architecture
•Topology
•Homologous superfamily
•Sequence family
CATH – Classificação hierárquica
•Classe
conteúdo de estruturas secundárias: principalmente α,
principalmente β, α–β, baixo conteúdo de estrutura
secundária.
•Arquitetura
orientação “ grosseira ”
de estruturas
independente da suas conectividade.
•Topologia
secundárias,
(dobra, enovelo)
dobramento da estrutura global dependente
conectividade das estruturas secundárias.
da
Classificação estrutural de proteínas
Superfamília: Possui uma origem evolucionária comum – são proteínas que possuem baixa
identidade de sequências, mas com características estruturais e funcionais comuns que sugerem a
existência de uma origem evolucionária comum. É constituída de uma ou mais famílias de proteínas.
Família: Proteínas são agrupadas em uma mesma família quando relacionadas evolutivamente por
uma identidade par a par dos resíduos de suas sequências igual ou superior a 30%. Alguns casos com
identidade inferior a 30% podem ter a mesma topologia e evolução comum.
Topologia: Possuem grande similaridade estrutural. Estruturas secundárias regulares com as
mesmas conectividades topológicas. Contudo, proteínas com a mesma topologia podem não ter a
mesma origem evolutiva.
CATH – arquiteturas
CATH – arquiteturas (cont.)
CATH: Class, Architecture, Topology, and Homologous Superfamily
Release 4.0 (Based on PDB release: March 26, 2013)
Classe
Arquitetura
Topologia
Superfamília Homóloga
1 - Mainly α
5
397
907
2 - Mainly β
20
241
547
3 - Mixed α/β
14
626
1.158
4 - Few sec. struct.
1
111
126
_______________________________________________________
Total
40
1.375
2.738
OBS: ver sítio do CATH para atualização
SCOPe 2.04: Structural Classification of Proteins
Extended Realease 2.04 (Julho de 2014)
Class
No. of folds
Super-families
Families
All α proteins
285
508
1.031
All β proteins
176
360
923
α and β proteins (α/β)
149
245
961
α and β proteins (α+β)
380
557
1.293
Multi-domain proteins (α & β)
68
68
109
Membrane & cell surface
57
109
145
proteins and peptides
Small proteins
91
131
258
_______________________________________________________
Total
1.205
1.978
4.720
OBS: ver sítio do SCOPe em http://scop.berkeley.edu/statistics/ver=2.04 para atualização