Proteína 5
Análise de uma sequência de aminoácidos
Glória Regina Franco / Marcelo Matos Santoro
Bernardo Sgarbi Reis
Agenor Valadares Santos
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Sítio de fosforilação para proteína cinase
dependente de cAMP e cGMP
159-162 KKVT
Sítio de fosforilação para proteína cinase
dependente de cAMP e cGMP
159-162 KKVT
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Sítio de fosforilação para proteína
cinase C
365-367 SLK
Sítio de fosforilação para
proteína cinase C
365-367 SLK
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Sítio de fosforilação para caseinacinase II
15-18 TSCE
16-19 SCEE
83-86 SNPE
88-91 TVFD
243-246 TNGD
301-304 TTVE
318-321 TLHE
Sítio de fosforilação para caseinacinase II
15-18 TSCE 16-19 SCEE 83-86 SNPE
88-91 TVFD 243-246 TNGD 301-304 TTVE
318-321 TLHE
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Sítio de miristilação
25-30 GTVIGI
29-34 GIDLGT
33-38 GTTYSC
40-45 GVFQGG
184-189 GTIAGL
Sítio de miristilação
25-30 GTVIGI 29-34 GIDLGT 33-38 GTTYSC 40-45
GVFQGG 184-189 GTIAGL
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Sítio de amidação
96-99 IGRK
157-160 LGKK
Sítio de amidação
96-99 IGRK 157-160 LGKK
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Assinatura 1 de proteínas da família hsp70
Heat shock
30-37 IDLGTTYS
Assinatura 1 de proteínas da família
hsp70 Heat shock
30-37 IDLGTTYS
Domínios
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Assinatura 2 de proteínas da família hsp70
Heat shock
218-231 IFDLGGGTFDVSLL
Assinatura 2 de proteínas da família hsp70
Heat shock
218-231 IFDLGGGTFDVSLL
Propriedades Físico Químicas
•Peso Molecular: 41045.1
•Número de aminoácidos: 369
•pI Teórico: 6.06
•Resíduos negativos (Asp+Glu): 54
•Resíduos positivos (Arg+Lys): 50
•Meia-vida estimada:
• 30 h (mamíferos, in vitro).
• >20 h (levedura, in vivo).
• >10 h (Escherichia coli, in vivo).
Homologia
HSP70 [Schistosoma japonicum]
GR78_XENLA 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO...
BiP protein [Homo sapiens]
glucose regulated protein [Echinococc...
GR78_CHICK 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO...
glucose regulated protein [Echinococc...
GR78_RAT 78 KD GLUCOSE-REGULATED PROTEIN PRECURSOR ...
immunoglobulin binding protein [Xenop...
BiP [Mus musculus]
dnaK-type molecular chaperone grp78 precursor - m...
GR78_MESAU 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO...
glucose-regulated protein [Homo sa...
GR78_HUMAN 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO...
78 kDa glucose-regulated protein [Mu...
dnaK-type molecular chaperone BiP precursor - Cal...
heat shock 70 kD protein cognate [...
HS7C_DROME HEAT SHOCK 70 KD PROTEIN COGNATE 3 PRECU...
dnaK-type molecular chaperone hsc3 precursor - fr...
580
512
512
512
511
508
505
505
503
503
503
503
496
495
482
478
471
471
e-165
e-144
e-144
e-144
e-144
e-143
e-142
e-142
e-141
e-141
e-141
e-141
e-139
e-139
e-135
e-134
e-132
e-132
Região N-terminal
Possível sítio de clivagem: a.a.17 – Parece
possuir uma seq. sinal N-terminal clivável.
Composição de aminoácidos estimada da
forma matura: calculada a partir do a.a.18
HIDROFOBICIDADE DA PROTEÍNA
MIN: 2.68
MAX: 3.07
Localização celular
outside --- Certainty= 50,4% (Affirmative)
microbody (peroxisome) --- Certainty= 11,4% (Affirmative)
nucleus --- Certainty= 10,8% (Affirmative)
endoplasmic reticulum (membrane) --- Certainty= 10,0% (Affirmative)
Aminoácidos Hidrofóbicos
Aminoácidos Hidrofóbicos
Aminoácidos Hidrofóbicos
Segmentos transmembrânicos
MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY
VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP
YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK
DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT
NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT
VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL
KSLKVK
Posição Transmembrânicas
1-19 MFSYLLLLSCILCLTSCEE
216-234 ILIFDLGGGTFDVSLLTIE
Posição Transmenbrânicas
1-19 MFSYLLLLSCILCLTSCEE
216-234 ILIFDLGGGTFDVSLLTIE
Resultado do Predict Protein
1 MFxxxxxxxx xxxxxxxEEK KEDYGTVIGI DLGTTYSCVG VFQGGRVEII
51 ANDQGNRITP SYVAFTPEGE RLIGDAAKNQ LTSNPENTVF DVKRLIGRKF
101 DESTVQNDIT HFPFSVVNKK NKPYVEVHVG SEVKTFAPEE ISAMVLGKMK
151 EFAEAYLGKK VTHAVVTVPA YFNDAQRQAT KDAGTIAGLN ILRIINEPTA
201 AAIAYGLDKK DGEKNILIFD LGGGTFDVSL LTIENGVFEV VATNGDTHLG
251 GEDFDQRVID HFAKLILEKK GKDIKVNKRA VQKLRREVEK AKRMLSKQPS
301 TTVEIDAPYD WEGFSRNTLH ERHFEKLNID LFLKTLEPVK KVLEDAGMKK
351 EDIDEIIxxx xxxxxxxxx
X = aminoácidos não condizentes com a estrutura da proteína. “defaut” a.a.
(AF044412) HSP70 [Schistosoma japonicum]
Length = 648
Score = 587 bits (1498), Expect = e-167
Identities = 300/340 (88%), Positives = 314/340 (92%), Gaps = 1/340 (0%)
Query: 18
Sbjct: 18
Query: 78
Sbjct: 78
EEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAA 77
E+KK DYGTVIGIDLGTTYSCVGVFQGGRVEIIAN+QGNRITPSYVAFT EGERLIGDAA
EDKKVDYGTVIGIDLGTTYSCVGVFQGGRVEIIANEQGNRITPSYVAFTTEGERLIGDAA 77
KNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFA 137
KNQLTSNPENTVFDVKRLIGR FDESTVQ DI HFPFSVVNKKNKPYVEVHVGSEVK+FA
KNQLTSNPENTVFDVKRLIGRTFDESTVQEDIKHFPFSVVNKKNKPYVEVHVGSEVKSFA 137
Query: 138 PEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINE 197
PEEISAMVLGKMK AE+YLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGL++LRIINE
Sbjct: 138 PEEISAMVLGKMKSSAESYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLDVLRIINE 197
Query: 198 PTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR 257
PTAAAIAYGLDKKDGEKNIL+FDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR
Sbjct: 198 PTAAAIAYGLDKKDGEKNILVFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR 257
Query: 258 VIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRN 317
VID+FAK IL KKGKDI+ +KRAVQKLRREVEKAKRMLS
+ VEI++ D E FS
Sbjct: 258 VIDYFAKQILTKKGKDIRSDKRAVQKLRREVEKAKRMLSTTQTARVEIESLIDGEDFS-E 316
Query: 318 TLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEII 357
TL
FEKLN+DLFLKTLEPVKKVLEDA MKKEDIDEII
Sbjct: 317 TLTRALFEKLNMDLFLKTLEPVKKVLEDANMKKEDIDEII 356
Estrutura secundária
Porcentagem de amino acidos:
+--------------+--------+--------+--------+--------+--------+
| AA:
|
K
|
L
|
V
|
E
|
G
|
| % of AA:
|
9.8 |
9.2 |
8.9 |
8.1 |
7.6 |
+--------------+--------+--------+--------+--------+--------+
| AA:
|
I
|
T
|
D
|
A
|
F
|
| % of AA:
|
7.0 |
6.5 |
6.5 |
6.5 |
4.9 |
+--------------+--------+--------+--------+--------+--------+
| AA:
|
N
|
S
|
R
|
P
|
Y
|
| % of AA:
|
4.6 |
4.1 |
3.8 |
3.0 |
2.4 |
+--------------+--------+--------+--------+--------+--------+
| AA:
|
Q
|
H
|
M
|
C
|
W
|
| % of AA:
|
2.4 |
1.9 |
1.4 |
1.1 |
0.3 |
+--------------+--------+--------+--------+--------+--------+
Porcentagem de estruturas secundárias "predicted":
+--------------+--------+--------+--------+
| SecStr:
|
H
|
E
|
L
|
| % Predicted: |
35.8 |
21.4 |
42.8 |
+--------------+--------+--------+--------+
According to the following classes:
all-alpha:
%H>45 and %E< 5; all-beta : %H<5 and %E>45
alpha-beta : %H>30 and %E>20; mixed:
rest,
this means that the predicted class is:
alpha-beta
Estrutura secundária
22 fitas betas, 13 alfa hélices e 32 loops
AA
|MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITP|
PHD sec | EEEEEEE
EEEEE
EEEEEEE
EEEEE
|
AA
|SYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKK|
PHD sec | EEEE
HHHHHHHHHHHH
HHHHHHHHHH
HHHHHHH
EEEE |
AA
|NKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQAT|
PHD sec |
EEEEEE
HHHHHHHHHHHHHHHHHHHHH
EEEEEEE
HHHHHHH|
AA
|KDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEV|
PHD sec |HHHHHH
EEEEEE HHHHHHHHH
EEEEEE
EEEEEE
EEEE|
AA
|VATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPS|
PHD sec |EE
HHHHHHHHHHHHHHHHH
HHHHHHHHHHHHHHHHHHHHH
|
AA
|TTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVG|
PHD sec | EEEE
HHHHHHHHHHHHHH
HHHHHHHH
EEEEEE |
AA
|VLLKSLKVK|
PHD sec |
|
Identidade com outras proteínas
•
•
•
•
•
•
•
•
•
•
•
•
•
1HPM_.pdb: 65.97 % identity
1NGI_.pdb: 65.97 % identity
1NGJ_.pdb: 65.97 % identity
3HSC_.pdb: 65.97 % identity
1NGB_.pdb: 65.8 % identity
1BUPA.pdb: 65.37 % identity
1KAZ_.pdb: 65.8 % identity
1ATR_.pdb: 65.72 % identity
1NGA_.pdb: 65.8 % identity
1NGD_.pdb: 65.72 % identity
1NGF_.pdb: 65.72 % identity
1NGH_.pdb: 65.37 % identity
1NGC_.pdb: 65.72 % identity
•
•
•
•
•
•
•
•
•
•
•
•
•
1NGE_.pdb: 65.72 % identity
1NGG_.pdb: 65.37 % identity
1ATS_.pdb: 65.72 % identity
1KAX_.pdb: 65.8 % identity
1KAY_.pdb: 65.8 % identity
1BA0_.pdb: 65.72 % identity
2BUPA.pdb: 65.37 % identity
1BA1_.pdb: 65.37 % identity
1QQOA.pdb: 65.45 % identity
1QQMA.pdb: 65.15 % identity
1QQNA.pdb: 64.92 % identity
1HJOA.pdb: 65.1 % identity
1DKGD.pdb: 48.32 % identity
Estrutura tridimensional
Homologia estrutural
2BUP A
Proteína 5
Homologia estrutural
2BUP A
Proteína 5
1HPM
2BUPA
1HJO
Proteína 5
Agradecimentos
Ao Laboratório de Físico Química de Proteínas e Enzimologia, ao Thiago Mares Guia, ao
Laboratório de Biologia Computacional, ao Professor Ari Siqueira, ao Laboratório de Biologia
Celular e Desenvolvimento, ao Laboratório de Imunologia Celular e Molecular e ao Jamil.
Agradecemos também aos nossos pais e avós, ao Albert Einsten, aos nossos professores Glória e
Marcelo e especialmente ao copy paste.
Não poderiamos esquecer da Internet e dos nossos coleguinhas !!!
Download

Proteina5