Evolução Molecular
Metodologias de Análise
Ricardo Lehtonen Rodrigues de Souza
Laboratório de Polimorfismos e Ligação
Depto de Genética – UFPR
[email protected]
Dados
Moleculares x Morfológicos
► Hereditários
► Descrição
não
ambígua
► Mais fácil
estabelecer
homologia
► Permite
comparações de
espécies distantes
► Abundantes
► Fatores
ambientais
► Diferenças de
classificação
Evolução Molecular
 As mutações genéticas são a matéria
prima do processo evolutivo.
 A taxa de mudança gênica pode ser
usada para medir a evolução.
Evolução Molecular
► Seqüências
de DNA mudam lentamente
► Não
é possível observar diretamente a
evolução
► Comparação
de 2 ou mais seqüências
homólogas (descendem de um
ancestral comum)
Modelo de um parâmetro
(Jukes e Cantor)
►A
taxa de
substituição em
cada direção é 
► A taxa de
substituição para
qualquer nt é 3 
► A probabilidade que
um nt não mude é
1-3
Modelo de 2 parâmetros (Kimura)
►A
taxa de transição é 
►A
taxa de transversão é

 e , pois
transições são mais
freqüentes que
transversões
► Considera
Tipos de substituições entre 2
seqüências
► Substituição
única
► Substituições
seqüenciais
► Substituições
coincidentes
► Substituições paralelas
► Substituições
convergentes
► Retro substituição
Numero de diferenças
Esperado
Observado
tempo
Regiões Codificadoras
► Distinguir
entre:
 Substituição sinônima
 Substituição não sinônima
► Para
estimar as proporções de
substituições sinônimas e não sinônimas
é preciso saber, respectivamente, o
número total possível de:
 Sítios sinônimos
 Sítios não sinônimos
Regiões Codificadoras
Cálculo do número de sítios
sinônimos e não sinônimos
► Se
i é o número de mudanças sinônimas em
um sítio, esse sítio é contado
separadamente como:
 i/3 sinônimo  (Ns =  i/3)
 (3-i)/3 não sinônimo  [Na =  (3-i/3)]
Regiões codificadoras
Ks = - 3/4 ln (1 - 4Ms/3Ns)
Ka = - 3/4 ln (1 - 4Ma/3Na)
 Ks e Ka : proporção de diferenças
sinônimas e não sinônimas por sítio
sinônimo e não sinônimo, respectivamente.
 Ms e Ma : número respectivo de diferenças
sinônimas e não sinônimas observadas,.
 Ns e Na : número respectivo de sítios
sinônimos e não sinônimos esperados.
Mudanças Evolutivas
►Substituição
aminoácidos
de
Substituição de Aminoácidos
►A
proporção (p) de diferentes
aminoácidos entre duas seqüências:
p = n/L
 n: número de aminoácidos diferentes
 L: comprimento da seqüência
►O
número de substituições de
aminoácidos por sítio (d):
d = - ln (1-p)
Algumas substituições de aminoácidos
requerem mais substituições de nt
► Ile  Thr : uma mudança
►AUU
 ACU
►AUC  ACC
►AUA  ACA
► Ile
 Cys: duas mudanças
►AUU
(Ile)  AGU (Ser)  UGU (Cys)
►AUU (Ile)  UUU (Phe)  UGU (Cys)
Substituição de
Nucleotídeos
Taxas e Padrões
Taxa de substituição de
nucleotídeos
► Divergência
de 2
seqüências homólogas
a partir do ancestral
comum
► r = K/2T
► r = no de substituições
por sítio/ano
► K = no médio de
substituições
► T = tempo desde a
divergência
► Normalmente
consideramos o tempo de
divergência das seqüências como igual
ao tempo de divergência das 2 espécies
► Mas,
em espécies próximas, podemos
estar vendo diferenças que já estavam
presentes no ancestral comum
►A
duplicação das seqüências pode
ocorrer independente da especiação
Seqüência comum ancestral
Espécie Ancestral
especiação
Tempo
Homem
Gorila
►As
seqüências divergiram há mais
tempo que as espécies
►Se
for usado o tempo de
divergência das espécies, a taxa de
substituição será superestimada
Regiões
Codificadoras
Taxas de substituições
sinônimas (S) e não
sinônimas (NS) em genes
de proteínas em
mamíferos.
Médias:
NS: 0,74
S: 3,51
Regiões codificadoras e não
codificadoras: comparando
seqüências e descobrindo genes
Padrões de substituição
Diferenças nas pressões seletivas
► Alguns
poucos aminoácidos em um ponto
crítico
 Região do grupo Heme na Hemoglobina
 O restante só precisa ser hidrofílico
► Toda a proteína
 Histona 4
 A proteína toda está em contato com o
DNA ou proteínas
 Quanto mais importante a função, mais lenta a
taxa de evolução
Padrões de substituição
► Padrões
de substituição podem dar
informações sobre a função da proteína
► Genes
diferentes evoluem a taxas diferentes
► Aminoácidos
conservados são críticos para a
função da proteína
Distâncias físico-químicas entre
os aminoácidos
Distâncias físico-químicas entre
pares de aminoácidos
Cerca de 60-90% das trocas de
aa envolvem o 1o ou 2o vizinhos
do anel
Relógio Molecular
► Número
de mudanças é proporcional ao
tempo
► Então, usando o número de mudanças é
possível estimar o tempo de divergência
entre espécies ou entre genes
► Pré-requisito: taxa de evolução constante
Obtenção das seqüências
► Seqüenciamento
► Bancos
de dados
Bancos de dados
► Entrez
► http://www.ncbi.nlm.nih.gov/Entrez/
► GenBank:
85.759.586.764 bases (fev 08)
Entrez
Busca de seqüências
Busca de seqüências
Alinhamento de seqüências
► ClustalW
 http://www.ebi.ac.uk/Tools/clustalw2/index.html
► BioEdit
 http://www.mbio.ncsu.edu/bioedit/bioedit.html
► Mega
 http://www.megasoftware.net/
BioEdit
Métodos de construção de árvores
filogenéticas
Métodos baseados em distância
► UPGMA – considera a árvore como aditiva e que
todos os táxons estão igualmente distantes da
raiz.
► Evolução mínima – estima-se para cada árvore
alternativa o comprimento de cada braço a partir
das distâncias entre os táxons. A árvore escolhida
é a que tem menor somatória do comprimento de
braços.
Métodos de construção de árvores
filogenéticas
► Agrupamento
de vizinhos (Neighbor
Joining): Baseado no método de evolução
mínima – não examina todas as topologias
possíveis, mas procura encontrar vizinhos
que minimizem o comprimento total da
árvore.
Métodos de construção de árvores
filogenéticas
Métodos baseados em caráter
► Máxima Parcimônia: o método assume o
critério da parcimônia, minimizando o
número de passos evolutivos aceitos na
árvore
► Máxima verossimilhança: considera todos os
sítios indistintamente
► Análise Bayesiana: probabilidades a
posteriori
Métodos de construção de árvores
filogenéticas
► Vários
desses métodos estão
implementados no programa Mega
► Também
no pacote de programas Phylip:
http://evolution.genetics.washington.edu/phylip.html
Exemplos
► Neighbor-Joining
94 PON2 Homosapiens
100
100
PON2 Pan troglodytes
PON2 Macaca mulata
PON2 Mus musculus
64
PON3 Mus musculus
PON3 Macaca mulata
100
64
100
PON3 Homo sapiens
95 PON3 Pan troglodytes
95
PON2 Galus gallus
PON1 Mus musculus
PON1 Macaca mulata
100
100
PON1 Homo Sapiens
95 PON1 Pan Troglodytes
PON2 Xenopus tropicalis
100
PON1 Xenopus laevis
MRNA Danio rerio
0.05
Exemplos
► Minimum
Evolution
90 PON2 Homosapiens
100
100
PON2 Pan troglodytes
PON2 Macaca mulata
PON2 Mus musculus
71
PON3 Mus musculus
PON3 Macaca mulata
100
51
100
PON3 Homo sapiens
96 PON3 Pan troglodytes
PON1 Mus musculus
98
PON1 Macaca mulata
100
100
PON1 Homo Sapiens
94 PON1 Pan Troglodytes
PON2 Galus gallus
PON2 Xenopus tropicalis
100
PON1 Xenopus laevis
MRNA Danio rerio
0.05
Exemplos
► Maximum
Parsimony
99
100
PON2 Homosapiens
PON2 Pan troglodytes
100
PON2 Macaca mulata
PON2 Mus musculus
33
PON3 Mus musculus
52
PON3 Macaca mulata
100
PON3 Homo sapiens
100
99
PON3 Pan troglodytes
91
PON2 Galus gallus
PON1 Mus musculus
100
PON1 Macaca mulata
100
PON1 Homo Sapiens
100
100
PON1 Pan Troglodytes
MRNA Danio rerio
PON2 Xenopus tropicalis
PON1 Xenopus laevis
Exemplos
► UPGMA
99 PON2 Homosapiens
100
100
PON2 Pan troglodytes
PON2 Macaca mulata
90
PON2 Mus musculus
PON2 Galus gallus
67
PON3 Mus musculus
PON3 Macaca mulata
100
97
100
PON3 Homo sapiens
100 PON3 Pan troglodytes
PON1 Mus musculus
PON1 Macaca mulata
100
100
PON1 Homo Sapiens
99 PON1 Pan Troglodytes
PON2 Xenopus tropicalis
100
PON1 Xenopus laevis
MRNA Danio rerio
0.15
0.10
0.05
0.00
Leitura recomendada
► Schneider,
Horacio. Métodos de análise
filogenética: um guia prático. 3a edição. Ed.
Holos e SBG, 2007.
► www.sbg.org.br
Download

Evolução Molecular