Proteína 5 Análise de uma sequência de aminoácidos Glória Regina Franco / Marcelo Matos Santoro Bernardo Sgarbi Reis Agenor Valadares Santos Domínios MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Sítio de fosforilação para proteína cinase dependente de cAMP e cGMP 159-162 KKVT Sítio de fosforilação para proteína cinase dependente de cAMP e cGMP 159-162 KKVT Domínios MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Sítio de fosforilação para proteína cinase C 365-367 SLK Sítio de fosforilação para proteína cinase C 365-367 SLK Domínios MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Sítio de fosforilação para caseinacinase II 15-18 TSCE 16-19 SCEE 83-86 SNPE 88-91 TVFD 243-246 TNGD 301-304 TTVE 318-321 TLHE Sítio de fosforilação para caseinacinase II 15-18 TSCE 16-19 SCEE 83-86 SNPE 88-91 TVFD 243-246 TNGD 301-304 TTVE 318-321 TLHE Domínios MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Sítio de miristilação 25-30 GTVIGI 29-34 GIDLGT 33-38 GTTYSC 40-45 GVFQGG 184-189 GTIAGL Sítio de miristilação 25-30 GTVIGI 29-34 GIDLGT 33-38 GTTYSC 40-45 GVFQGG 184-189 GTIAGL Domínios MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Sítio de amidação 96-99 IGRK 157-160 LGKK Sítio de amidação 96-99 IGRK 157-160 LGKK Domínios MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Assinatura 1 de proteínas da família hsp70 Heat shock 30-37 IDLGTTYS Assinatura 1 de proteínas da família hsp70 Heat shock 30-37 IDLGTTYS Domínios MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Assinatura 2 de proteínas da família hsp70 Heat shock 218-231 IFDLGGGTFDVSLL Assinatura 2 de proteínas da família hsp70 Heat shock 218-231 IFDLGGGTFDVSLL Propriedades Físico Químicas •Peso Molecular: 41045.1 •Número de aminoácidos: 369 •pI Teórico: 6.06 •Resíduos negativos (Asp+Glu): 54 •Resíduos positivos (Arg+Lys): 50 •Meia-vida estimada: • 30 h (mamíferos, in vitro). • >20 h (levedura, in vivo). • >10 h (Escherichia coli, in vivo). Homologia HSP70 [Schistosoma japonicum] GR78_XENLA 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... BiP protein [Homo sapiens] glucose regulated protein [Echinococc... GR78_CHICK 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... glucose regulated protein [Echinococc... GR78_RAT 78 KD GLUCOSE-REGULATED PROTEIN PRECURSOR ... immunoglobulin binding protein [Xenop... BiP [Mus musculus] dnaK-type molecular chaperone grp78 precursor - m... GR78_MESAU 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... glucose-regulated protein [Homo sa... GR78_HUMAN 78 KD GLUCOSE-REGULATED PROTEIN PRECURSO... 78 kDa glucose-regulated protein [Mu... dnaK-type molecular chaperone BiP precursor - Cal... heat shock 70 kD protein cognate [... HS7C_DROME HEAT SHOCK 70 KD PROTEIN COGNATE 3 PRECU... dnaK-type molecular chaperone hsc3 precursor - fr... 580 512 512 512 511 508 505 505 503 503 503 503 496 495 482 478 471 471 e-165 e-144 e-144 e-144 e-144 e-143 e-142 e-142 e-141 e-141 e-141 e-141 e-139 e-139 e-135 e-134 e-132 e-132 Região N-terminal Possível sítio de clivagem: a.a.17 – Parece possuir uma seq. sinal N-terminal clivável. Composição de aminoácidos estimada da forma matura: calculada a partir do a.a.18 HIDROFOBICIDADE DA PROTEÍNA MIN: 2.68 MAX: 3.07 Localização celular outside --- Certainty= 50,4% (Affirmative) microbody (peroxisome) --- Certainty= 11,4% (Affirmative) nucleus --- Certainty= 10,8% (Affirmative) endoplasmic reticulum (membrane) --- Certainty= 10,0% (Affirmative) Aminoácidos Hidrofóbicos Aminoácidos Hidrofóbicos Aminoácidos Hidrofóbicos Segmentos transmembrânicos MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSY VAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKP YVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATK DAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVAT NGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTT VEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVGVLL KSLKVK Posição Transmembrânicas 1-19 MFSYLLLLSCILCLTSCEE 216-234 ILIFDLGGGTFDVSLLTIE Posição Transmenbrânicas 1-19 MFSYLLLLSCILCLTSCEE 216-234 ILIFDLGGGTFDVSLLTIE Resultado do Predict Protein 1 MFxxxxxxxx xxxxxxxEEK KEDYGTVIGI DLGTTYSCVG VFQGGRVEII 51 ANDQGNRITP SYVAFTPEGE RLIGDAAKNQ LTSNPENTVF DVKRLIGRKF 101 DESTVQNDIT HFPFSVVNKK NKPYVEVHVG SEVKTFAPEE ISAMVLGKMK 151 EFAEAYLGKK VTHAVVTVPA YFNDAQRQAT KDAGTIAGLN ILRIINEPTA 201 AAIAYGLDKK DGEKNILIFD LGGGTFDVSL LTIENGVFEV VATNGDTHLG 251 GEDFDQRVID HFAKLILEKK GKDIKVNKRA VQKLRREVEK AKRMLSKQPS 301 TTVEIDAPYD WEGFSRNTLH ERHFEKLNID LFLKTLEPVK KVLEDAGMKK 351 EDIDEIIxxx xxxxxxxxx X = aminoácidos não condizentes com a estrutura da proteína. “defaut” a.a. (AF044412) HSP70 [Schistosoma japonicum] Length = 648 Score = 587 bits (1498), Expect = e-167 Identities = 300/340 (88%), Positives = 314/340 (92%), Gaps = 1/340 (0%) Query: 18 Sbjct: 18 Query: 78 Sbjct: 78 EEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITPSYVAFTPEGERLIGDAA 77 E+KK DYGTVIGIDLGTTYSCVGVFQGGRVEIIAN+QGNRITPSYVAFT EGERLIGDAA EDKKVDYGTVIGIDLGTTYSCVGVFQGGRVEIIANEQGNRITPSYVAFTTEGERLIGDAA 77 KNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKKNKPYVEVHVGSEVKTFA 137 KNQLTSNPENTVFDVKRLIGR FDESTVQ DI HFPFSVVNKKNKPYVEVHVGSEVK+FA KNQLTSNPENTVFDVKRLIGRTFDESTVQEDIKHFPFSVVNKKNKPYVEVHVGSEVKSFA 137 Query: 138 PEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLNILRIINE 197 PEEISAMVLGKMK AE+YLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGL++LRIINE Sbjct: 138 PEEISAMVLGKMKSSAESYLGKKVTHAVVTVPAYFNDAQRQATKDAGTIAGLDVLRIINE 197 Query: 198 PTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR 257 PTAAAIAYGLDKKDGEKNIL+FDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR Sbjct: 198 PTAAAIAYGLDKKDGEKNILVFDLGGGTFDVSLLTIENGVFEVVATNGDTHLGGEDFDQR 257 Query: 258 VIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPSTTVEIDAPYDWEGFSRN 317 VID+FAK IL KKGKDI+ +KRAVQKLRREVEKAKRMLS + VEI++ D E FS Sbjct: 258 VIDYFAKQILTKKGKDIRSDKRAVQKLRREVEKAKRMLSTTQTARVEIESLIDGEDFS-E 316 Query: 318 TLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEII 357 TL FEKLN+DLFLKTLEPVKKVLEDA MKKEDIDEII Sbjct: 317 TLTRALFEKLNMDLFLKTLEPVKKVLEDANMKKEDIDEII 356 Estrutura secundária Porcentagem de amino acidos: +--------------+--------+--------+--------+--------+--------+ | AA: | K | L | V | E | G | | % of AA: | 9.8 | 9.2 | 8.9 | 8.1 | 7.6 | +--------------+--------+--------+--------+--------+--------+ | AA: | I | T | D | A | F | | % of AA: | 7.0 | 6.5 | 6.5 | 6.5 | 4.9 | +--------------+--------+--------+--------+--------+--------+ | AA: | N | S | R | P | Y | | % of AA: | 4.6 | 4.1 | 3.8 | 3.0 | 2.4 | +--------------+--------+--------+--------+--------+--------+ | AA: | Q | H | M | C | W | | % of AA: | 2.4 | 1.9 | 1.4 | 1.1 | 0.3 | +--------------+--------+--------+--------+--------+--------+ Porcentagem de estruturas secundárias "predicted": +--------------+--------+--------+--------+ | SecStr: | H | E | L | | % Predicted: | 35.8 | 21.4 | 42.8 | +--------------+--------+--------+--------+ According to the following classes: all-alpha: %H>45 and %E< 5; all-beta : %H<5 and %E>45 alpha-beta : %H>30 and %E>20; mixed: rest, this means that the predicted class is: alpha-beta Estrutura secundária 22 fitas betas, 13 alfa hélices e 32 loops AA |MFSYLLLLSCILCLTSCEEKKEDYGTVIGIDLGTTYSCVGVFQGGRVEIIANDQGNRITP| PHD sec | EEEEEEE EEEEE EEEEEEE EEEEE | AA |SYVAFTPEGERLIGDAAKNQLTSNPENTVFDVKRLIGRKFDESTVQNDITHFPFSVVNKK| PHD sec | EEEE HHHHHHHHHHHH HHHHHHHHHH HHHHHHH EEEE | AA |NKPYVEVHVGSEVKTFAPEEISAMVLGKMKEFAEAYLGKKVTHAVVTVPAYFNDAQRQAT| PHD sec | EEEEEE HHHHHHHHHHHHHHHHHHHHH EEEEEEE HHHHHHH| AA |KDAGTIAGLNILRIINEPTAAAIAYGLDKKDGEKNILIFDLGGGTFDVSLLTIENGVFEV| PHD sec |HHHHHH EEEEEE HHHHHHHHH EEEEEE EEEEEE EEEE| AA |VATNGDTHLGGEDFDQRVIDHFAKLILEKKGKDIKVNKRAVQKLRREVEKAKRMLSKQPS| PHD sec |EE HHHHHHHHHHHHHHHHH HHHHHHHHHHHHHHHHHHHHH | AA |TTVEIDAPYDWEGFSRNTLHERHFEKLNIDLFLKTLEPVKKVLEDAGMKKEDIDEIILVG| PHD sec | EEEE HHHHHHHHHHHHHH HHHHHHHH EEEEEE | AA |VLLKSLKVK| PHD sec | | Identidade com outras proteínas • • • • • • • • • • • • • 1HPM_.pdb: 65.97 % identity 1NGI_.pdb: 65.97 % identity 1NGJ_.pdb: 65.97 % identity 3HSC_.pdb: 65.97 % identity 1NGB_.pdb: 65.8 % identity 1BUPA.pdb: 65.37 % identity 1KAZ_.pdb: 65.8 % identity 1ATR_.pdb: 65.72 % identity 1NGA_.pdb: 65.8 % identity 1NGD_.pdb: 65.72 % identity 1NGF_.pdb: 65.72 % identity 1NGH_.pdb: 65.37 % identity 1NGC_.pdb: 65.72 % identity • • • • • • • • • • • • • 1NGE_.pdb: 65.72 % identity 1NGG_.pdb: 65.37 % identity 1ATS_.pdb: 65.72 % identity 1KAX_.pdb: 65.8 % identity 1KAY_.pdb: 65.8 % identity 1BA0_.pdb: 65.72 % identity 2BUPA.pdb: 65.37 % identity 1BA1_.pdb: 65.37 % identity 1QQOA.pdb: 65.45 % identity 1QQMA.pdb: 65.15 % identity 1QQNA.pdb: 64.92 % identity 1HJOA.pdb: 65.1 % identity 1DKGD.pdb: 48.32 % identity Estrutura tridimensional Homologia estrutural 2BUP A Proteína 5 Homologia estrutural 2BUP A Proteína 5 1HPM 2BUPA 1HJO Proteína 5 Agradecimentos Ao Laboratório de Físico Química de Proteínas e Enzimologia, ao Thiago Mares Guia, ao Laboratório de Biologia Computacional, ao Professor Ari Siqueira, ao Laboratório de Biologia Celular e Desenvolvimento, ao Laboratório de Imunologia Celular e Molecular e ao Jamil. Agradecemos também aos nossos pais e avós, ao Albert Einsten, aos nossos professores Glória e Marcelo e especialmente ao copy paste. Não poderiamos esquecer da Internet e dos nossos coleguinhas !!!