Caros Alunos,
Para desenvolver a atividade abaixo vocês precisarão de um computador conectado à
internet banda larga, do arquivo .txt (bloco de notas) disponível no “Constructore” e deste
arquivo com as coordenadas para o trabalho.
“Explorar o resultado” significa observar o máximo possível de detalhes a partir dos
resultados gerados com a ferramenta de trabalho que vocês estão utilizando. Não se
preocupem, porque links explicando o princípio e/ou o significado dos termos estarão
disponíveis em quase todas as etapas.
Vale destacar que as coordenadas descritas abaixo representam apenas uma das milhares
de formas de desenvolver esta tarefa. Fiquem completamente à vontade para explorarem
outros recursos disponíveis na web. Informações relevantes obtidas por caminhos
diferentes dos apresentados poderão favorecer o aprendizado e o rendimento final.
Nome da atividade:
Identificação de uma proteína a partir da sua seqüência nucleotídica e
determinação da sua estrutura e função
Seção 1: Identificação da proteína e aquisição de dados
Copie a seq de interesse a partir do arquivo .txt fornecido > Entre em
http://blast.ncbi.nlm.nih.gov/Blast.cgi > link blastx > cole a seq em “Enter query
sequence” > clique em “Blast” > clicar na identificação (ID) do primeiro item dos
resultados (ex.: gb|BCD95476.1|) > explorar os dados disponíveis (qual é a proteína,
organismo de origem...copie e guarde tudo!) > na parte superior da página em “format”
escolher “FASTA” > copie o resultado (desde gi|BCD95476.1| até o final da seq) > criar
um arquivo novo no bloco de notas (.txt) > colar a seq no arquivo .txt. Esta seq
corresponde à seq da proteína codificada pela seq de interesse. Representa a tradução da
seq nucleotídica em um seq de aminoácidos.
Retorne ao resultado do Blast > copie outras 4 seqs > a última seqüência da lista e outras
3 seqs intermediárias na lista > para cada seq copie a origem do organismo e outras
informações que acharem necessárias > colar todas as seqs no mesmo arquivo .txt
Ao final desta sessão vocês terão:
1) Identificação da proteína
2) Organismo e local de origem
3) um arquivo .txt contendo 5 seq em formato Fasta
Guarde este arquivo para uso posterior
Seção 2: Informações de estrutura primária da proteína
Copie a primeira seq a partir do arquivo.txt gerado na Seção 1 > Entre em
http://www.expasy.ch/tools/ > link “ProtParam” > cole a seq de interesse na caixa
indicada “Or you can paste your own sequence in the box below” > clique em “compute
parameters” > explorar os dados disponíveis (no de aminoácidos da proteína, pI...copie e
guarde tudo!)
Ao final desta Seção vocês terão:
1) informações de seqüência primária da seq de interesse
2) alguns parâmetros físico-químico da seq de interesse
Seção 3: Ocorrência de peptídeo sinal/Predição de localização subcelular
Copie a seq de interesse > retorne em http://www.expasy.ch/tools/ > link “SOSUI” > link
SOSUIsignal > cole a seq de interesse em “Enter your sequence with...” > clique em
“Exec” > explorar os dados disponíveis (se a proteína tem ou não peptídeo sinal, se é
solúvel ou não...copie e guarde tudo!)
Ao final desta Seção vocês terão:
1) existência de peptídeo sinal
2) se a proteína é solúvel ou de membrana
Seção 4: Alinhamento das seq de interesse
Entre em http://www.mbio.ncsu.edu/BioEdit/bioedit.html#downloads > no final da
página, escolha “Version 7.0.7” > salve no seu computador > abra e execute o programa
> File > Open > encontre o arquivo .txt gerado ao final da Seção 1 > as 5 seq salvas
aparecerão em ordem no programa > vá em “Accessory application” > “ClustalW
Multiple alignment” > aparece uma caixa de diálogo > clique em “Run ClustalW” > uma
outra caixa de diálogo aparece > clique em ok > a nova janela aberta apresenta as 5 seqs
alinhadas > mantenham esta janela aberta, ela deve ser o local de partida para os três
caminhos seguintes:
Caminho 1: determinação das regiões de maior e menor hidrofobicidade da proteína:
localize a sua seq de interesse entre as 5 seqs na janela do alinhamento anterior >
selecione a seq de interesse clicando sobre a identificação dela (gi|954761|) > vá em
“Sequence” > opção “protein” > escolha “Kyte & Doolitle Mean hydrophobicity Profile”
> clique em “Run Plot” > salvar o gráfico de hidrofobicidade da seq (observar que o eixo
“position” do gráfico equivale à posição do aminoácido representado pelos números que
aparece nas seqs alinhadas > no gráfico, encontrar as regiões de maior e menor
hidrofobicidade (picos superior e inferior) > encontrar na seq primária o trecho de
aminoácidos responsável por elas.
Caminho 2: montagem da figura final do alinhamento:
Na janela do alinhamento anterior > selecionar as 5 seqs alinhadas clicando na
identificação de cada uma delas (tem que estar com o Ctrl pressionado) > vá em “File” >
opção “Graphic View” > preencha a janela que foi aberta exatamente como segue:
copiar a figura do alinhamento em “Edit” > opção “Copy Page as an enhanced Windows
metafile” > colar em arquivo .doc ou .ppt para montagem do trabalho final (caso a figura
do alinhamento seja muito grande, vai ser necessário copiar em duas partes e montar uma
figura final única) > explorar os dados disponíveis (se existe algum aminoácido diferente
na seq de interesse) > analisar esta diferença levando-se em conta a natureza do
aminoácido diferente comparado com a natureza do aminoácido que ocorre na mesma
posição nas outras seqs (copie e guarde tudo!)
Caminho 3: Determinação de regiões conservadas
Na janela do alinhamento anterior > selecionar as 5 seqs alinhadas clicando na
identificação de cada uma delas (tem que estar com o Ctrl pressionado) > vá em
“Alignment” > opção “Find Conserved Regions” > uma caixa de diálogo vai ser aberta >
clique em “Start” > explorar os dados disponíveis (encontrar os trechos indicados como
conservados no alinhamento e checar a correspondência entre os aminoácidos das seqs
alinhadas para aqueles trechos...copie e guarde tudo!)
Ao final desta Seção, vocês terão:
1) os principais trechos responsáveis pelo caracter hidrofóbico e hidrofílico da proteína
2) o quanto as proteínas se parecem, se existe alguma diferença na composição de
aminoácido entre elas
3) quais seriam os trechos conservados da proteína
Seção 5: Avaliação do grau de parentesco
Retorne em http://www.expasy.ch/tools/ > opção “CLUSTAL W” > link “EBI”> na nova
página > na opção “Upload a file” clique em “Procurar” > localize o arquivo .txt gerado
na Seção 1 > clique em “Run” > aguarde enquanto o arquivo é processado > uma página
com vários resultados vai ser gerada > vá até o final da página no item “Cladogram” >
clique em “Show as Phylogram Tree > voltar ao final da página > para copiar a figura da
árvore filogenética vocês usarão o recurso “Print Screen” do computador (tecla PrtSc) >
abrir qualquer programa de foto disponível no seu computador > colar a imagem >
selecionar apenas a parte da imagem que equivale à árvore filogenética > copiar > colar
em arquivo tipo .doc ou .ppt para a montagem do trabalho final > observar se
agrupamento feito entra as seqs tem alguma correlação com o país de origem de cada seq
Ao final desta Seção, vocês terão:
1) Uma figura informativa do agrupamento das seqs de acordo com as semelhanças entre
elas
Seção 6: Avaliação da estrutura terciária/quaternária da proteína
Copie a primeira seq a partir do arquivo .txt gerado na Seção 1 (somente as letras que
correspondem aos aminoácidos) > retorne em http://www.expasy.ch/tools/ > opção
“CPHmodels” > cole a seq na opção “Paste a single sequence or several sequences in
FASTA format into the field below:” > aguarde o processamento do arquivo > no final da
página de resultados vocês encontrarão uma caixa preta, ela contem o modelo da
estrutura para a seq de interesse > observem que vocês podem rodar (segure o botão
esquerdo do mouse e movimente) ou alterar a escala da imagem (segure o botão direito e
arraste para direita ou esquerda) > para copiar a figura do modelo estrutural vocês usarão
o recurso “Print Screen” do computador (tecla PrtSc) > abrir qualquer programa de foto
disponível na seu computador > colar a imagem > selecionar apenas a parte da imagem
que equivale à árvore filogenética > copiar > colar em arquivo tipo .doc ou .ppt para a
montagem do trabalho final
Ao final desta Seção, vocês terão:
1) O modelo da estrutura terciária da seq de interesse
Seção 7: Busca por estrutura semelhantes à proteína de interesse
Entre no site http://www.rcsb.org/pdb/home/home.do > escreva o nome da proteína de
interesse (em inglês, ex.: hemoglobin) ou a seqüência (obtida após o Blast da seção 1). Se
utilizar a busca pelo nome: clique “Search” > entre os resultados observar pelo nome da
proteína aquela que estaria mais relacionada com a sua proteína de interesse (dar
preferência para proteínas que cuja estrutura foi determinada na presença de um ligante,
isso pode lhes ajudar a determinar a região chave na estrutura da proteína) > clique no
link “download PDB file” como abaixo (seta vermelha) > salve o arquivo .pdb
Se utilizar a busca pela seqüência: clique “Adv. search” > “Choose a query type” >
Sequence (Blast/Fasta) > cole sua seq na caixa em branco > evaluate query.
a estrutura salva poderá ser visualizada em um programa chamado “RasMol” > para fazer
o download dele, vá em http://www.bernstein-plus-sons.com/software/RasMol_2.7.2/ >
no final da página tem um link “RasWin.exe” > salve em seu computador > execute o
programa > abra o arquivo .pdb salvo anteriormente > utilize as ferramentas do programa
para movimentar a estrutura > copie as imagens que vocês acharem mais interessantes >
cole em arquivo .doc ou .ppt para montagem do trabalho final.
Ao final desta Seção, vocês terão:
1) O modelo da estrutura terciária de uma proteína semelhante à proteína de interesse
Seção 8: Agrupamento de informações
Baseado nos conceitos gerais sobre estrutura e função de proteínas desenvolvidos em sala
e nas informações específicas obtidas nas Sessões acima, monte uma apresentação (ex.:
no PowerPoint) objetivando contar a estória específica da proteína de interesse.
Lembrando que toda estória precisa ter princípio (“informações de estrutura primária),
meio (“informações de estrutura secundária”) e fim (“informações de estrutura terciária e
quaternária e função”).
Bom trabalho!
Download

Identificação de uma proteína a partir da sua seqüência