Bioinformática Osmar NORBERTO DE SOUZA, Ph.D. E-mail: [email protected] Laboratório de Bioinformática, Modelagem e Simulação de Biossistemas (LABIO) Faculdade de Informática Pontifícia Universidade Católica do Rio Grande do Sul – PUCRS Porto Alegre - RS Agosto de 2015 Conformação de proteínas A condensação dos aminoácidos produz uma cadeia polipeptídica, com os átomos do esqueleto unidos pela ligação pepptídica. Reação de síntese por desidratação Conformação da cadeia principal (main-chain) ou esqueleto (backbone) O padrão de enovelamento de uma cadeia polipeptídica pode ser descrito em termos de ângulos internos de rotação em torno de ligações da cadeia principal. As ligações, na cadeia principal, entre os átomos N e C, e entre os átomos C e C, são ligações simples. Rotações em torno dessas ligações não são restritas pela estrutura eletrônica, mas somente por impedimentos estéricos nas conformações produzidas. Conformação da cadeia principal ou esqueleto O padrão de enovelamento de uma cadeia polipeptídica pode ser descrito em termos de ângulos internos de rotação em torno de ligações da cadeia principal. ω é restrito a 0° (cis) ou 180° (trans). Conformação da cadeia principal ou esqueleto O gráfico de Ramakrishnan-Sasisekharan-Ramachandran Porque a maioria dos resíduos de aminoácidos em proteínas possuem ligações peptídicas trans, a conformação da cadeia principal de cada resíduo é determinada por dois ângulos: φ e ψ. Há duas regiões principais permitidas, uma em torno de φ = -57° e ψ = -47° (R) e a outra em torno de φ = -125°e ψ = +125° () . Conformações das cadeias laterais As conformações das cadeias laterais são descritas também pelo ângulos internos de rotação, denominados χ1 até χ5, ao longo da cadeia lateral. Cadeias laterais diferentes possuem diferentes graus de liberdade. A cadeia lateral da fenilalanina, por exemplo, possui dois ângulos internos de rotação (esquerda), enquanto a lisina (direita) possui quatro. Hierarquia estrutural das proteínas Estrutra Primária Estrutura Secundária Estrutura Terciária Estrutura Quaternária Hierarquia estrutural das proteínas Estrutura Primária A sequência linear de aminoácidos MTATATEGAK PPFVSRSVLV KVAVTHRGSG APKGLFGVEC PVEVLVSNAG LSADAFLMRM QRASRSMQRN KFGRMIFIGS IGMARSIARE LSKANVTANV GALQFIPAKR VGTPAEVAGV GGMGMGH-247 TGGNRGIGLA DVTDSDAVDR TEEKFEKVIN VSGSWGIGNQ VAPGYIDTDM VSFLASEDAS IAQRLAADGH AFTAVEEHQG ANLTGAFRVA ANYAASKAGV TRALDERIQQ YISGAVIPVD Hierarquia estrutural das proteínas Estrutura Secundária Hierarquia estrutural das proteínas Estrutura Secundária (cont.) Hélice Folha β Hierarquia estrutural das proteínas Estrutura Supersecundária Hierarquia estrutural das proteínas Estrutura Terciária = Topologia (Fold) Hierarquia estrutural das proteínas Estrutura Quaternária Hierarquia estrutural das proteínas Estrutura Quaternária Um pequeno álbum de estruturas de proteínas Comparaçãode estruturas de proteínas Domínios proteicos Arquitetura de domínios proteícos (1) Proteína com um único domínio (2) Proteína com múltiplos domínios Domain A B C D • Proteoma procariótico: 2/3 proteínas possuem dois ou mais domínios • Proteoma eucariótico: 4/5 das proteínas possuem múltiplos domínios Motivos proteicos Classificação estrutural de proteínas •Hierarquia da calssificação estrutural de domínios protéicos Protein Databank (PDB). •Domínio são agrupados em quatro níveis principais: •Class •Architecture •Topology •Homologous superfamily •Sequence family CATH – Classificação hierárquica •Classe conteúdo de estruturas secundárias: principalmente α, principalmente β, α–β, baixo conteúdo de estrutura secundária. •Arquitetura orientação “ grosseira ” de estruturas independente da suas conectividade. •Topologia secundárias, (dobra, enovelo) dobramento da estrutura global dependente conectividade das estruturas secundárias. da Classificação estrutural de proteínas Superfamília: Possui uma origem evolucionária comum – são proteínas que possuem baixa identidade de sequências, mas com características estruturais e funcionais comuns que sugerem a existência de uma origem evolucionária comum. É constituída de uma ou mais famílias de proteínas. Família: Proteínas são agrupadas em uma mesma família quando relacionadas evolutivamente por uma identidade par a par dos resíduos de suas sequências igual ou superior a 30%. Alguns casos com identidade inferior a 30% podem ter a mesma topologia e evolução comum. Topologia: Possuem grande similaridade estrutural. Estruturas secundárias regulares com as mesmas conectividades topológicas. Contudo, proteínas com a mesma topologia podem não ter a mesma origem evolutiva. CATH – arquiteturas CATH – arquiteturas (cont.) CATH: Class, Architecture, Topology, and Homologous Superfamily Release 4.0 (Based on PDB release: March 26, 2013) Classe Arquitetura Topologia Superfamília Homóloga 1 - Mainly α 5 397 907 2 - Mainly β 20 241 547 3 - Mixed α/β 14 626 1.158 4 - Few sec. struct. 1 111 126 _______________________________________________________ Total 40 1.375 2.738 OBS: ver sítio do CATH para atualização SCOPe 2.04: Structural Classification of Proteins Extended Realease 2.04 (Julho de 2014) Class No. of folds Super-families Families All α proteins 285 508 1.031 All β proteins 176 360 923 α and β proteins (α/β) 149 245 961 α and β proteins (α+β) 380 557 1.293 Multi-domain proteins (α & β) 68 68 109 Membrane & cell surface 57 109 145 proteins and peptides Small proteins 91 131 258 _______________________________________________________ Total 1.205 1.978 4.720 OBS: ver sítio do SCOPe em http://scop.berkeley.edu/statistics/ver=2.04 para atualização