Evolução Molecular Metodologias de Análise Ricardo Lehtonen Rodrigues de Souza Laboratório de Polimorfismos e Ligação Depto de Genética – UFPR [email protected] Dados Moleculares x Morfológicos ► Hereditários ► Descrição não ambígua ► Mais fácil estabelecer homologia ► Permite comparações de espécies distantes ► Abundantes ► Fatores ambientais ► Diferenças de classificação Evolução Molecular As mutações genéticas são a matéria prima do processo evolutivo. A taxa de mudança gênica pode ser usada para medir a evolução. Evolução Molecular ► Seqüências de DNA mudam lentamente ► Não é possível observar diretamente a evolução ► Comparação de 2 ou mais seqüências homólogas (descendem de um ancestral comum) Modelo de um parâmetro (Jukes e Cantor) ►A taxa de substituição em cada direção é ► A taxa de substituição para qualquer nt é 3 ► A probabilidade que um nt não mude é 1-3 Modelo de 2 parâmetros (Kimura) ►A taxa de transição é ►A taxa de transversão é e , pois transições são mais freqüentes que transversões ► Considera Tipos de substituições entre 2 seqüências ► Substituição única ► Substituições seqüenciais ► Substituições coincidentes ► Substituições paralelas ► Substituições convergentes ► Retro substituição Numero de diferenças Esperado Observado tempo Regiões Codificadoras ► Distinguir entre: Substituição sinônima Substituição não sinônima ► Para estimar as proporções de substituições sinônimas e não sinônimas é preciso saber, respectivamente, o número total possível de: Sítios sinônimos Sítios não sinônimos Regiões Codificadoras Cálculo do número de sítios sinônimos e não sinônimos ► Se i é o número de mudanças sinônimas em um sítio, esse sítio é contado separadamente como: i/3 sinônimo (Ns = i/3) (3-i)/3 não sinônimo [Na = (3-i/3)] Regiões codificadoras Ks = - 3/4 ln (1 - 4Ms/3Ns) Ka = - 3/4 ln (1 - 4Ma/3Na) Ks e Ka : proporção de diferenças sinônimas e não sinônimas por sítio sinônimo e não sinônimo, respectivamente. Ms e Ma : número respectivo de diferenças sinônimas e não sinônimas observadas,. Ns e Na : número respectivo de sítios sinônimos e não sinônimos esperados. Mudanças Evolutivas ►Substituição aminoácidos de Substituição de Aminoácidos ►A proporção (p) de diferentes aminoácidos entre duas seqüências: p = n/L n: número de aminoácidos diferentes L: comprimento da seqüência ►O número de substituições de aminoácidos por sítio (d): d = - ln (1-p) Algumas substituições de aminoácidos requerem mais substituições de nt ► Ile Thr : uma mudança ►AUU ACU ►AUC ACC ►AUA ACA ► Ile Cys: duas mudanças ►AUU (Ile) AGU (Ser) UGU (Cys) ►AUU (Ile) UUU (Phe) UGU (Cys) Substituição de Nucleotídeos Taxas e Padrões Taxa de substituição de nucleotídeos ► Divergência de 2 seqüências homólogas a partir do ancestral comum ► r = K/2T ► r = no de substituições por sítio/ano ► K = no médio de substituições ► T = tempo desde a divergência ► Normalmente consideramos o tempo de divergência das seqüências como igual ao tempo de divergência das 2 espécies ► Mas, em espécies próximas, podemos estar vendo diferenças que já estavam presentes no ancestral comum ►A duplicação das seqüências pode ocorrer independente da especiação Seqüência comum ancestral Espécie Ancestral especiação Tempo Homem Gorila ►As seqüências divergiram há mais tempo que as espécies ►Se for usado o tempo de divergência das espécies, a taxa de substituição será superestimada Regiões Codificadoras Taxas de substituições sinônimas (S) e não sinônimas (NS) em genes de proteínas em mamíferos. Médias: NS: 0,74 S: 3,51 Regiões codificadoras e não codificadoras: comparando seqüências e descobrindo genes Padrões de substituição Diferenças nas pressões seletivas ► Alguns poucos aminoácidos em um ponto crítico Região do grupo Heme na Hemoglobina O restante só precisa ser hidrofílico ► Toda a proteína Histona 4 A proteína toda está em contato com o DNA ou proteínas Quanto mais importante a função, mais lenta a taxa de evolução Padrões de substituição ► Padrões de substituição podem dar informações sobre a função da proteína ► Genes diferentes evoluem a taxas diferentes ► Aminoácidos conservados são críticos para a função da proteína Distâncias físico-químicas entre os aminoácidos Distâncias físico-químicas entre pares de aminoácidos Cerca de 60-90% das trocas de aa envolvem o 1o ou 2o vizinhos do anel Relógio Molecular ► Número de mudanças é proporcional ao tempo ► Então, usando o número de mudanças é possível estimar o tempo de divergência entre espécies ou entre genes ► Pré-requisito: taxa de evolução constante Obtenção das seqüências ► Seqüenciamento ► Bancos de dados Bancos de dados ► Entrez ► http://www.ncbi.nlm.nih.gov/Entrez/ ► GenBank: 85.759.586.764 bases (fev 08) Entrez Busca de seqüências Busca de seqüências Alinhamento de seqüências ► ClustalW http://www.ebi.ac.uk/Tools/clustalw2/index.html ► BioEdit http://www.mbio.ncsu.edu/bioedit/bioedit.html ► Mega http://www.megasoftware.net/ BioEdit Métodos de construção de árvores filogenéticas Métodos baseados em distância ► UPGMA – considera a árvore como aditiva e que todos os táxons estão igualmente distantes da raiz. ► Evolução mínima – estima-se para cada árvore alternativa o comprimento de cada braço a partir das distâncias entre os táxons. A árvore escolhida é a que tem menor somatória do comprimento de braços. Métodos de construção de árvores filogenéticas ► Agrupamento de vizinhos (Neighbor Joining): Baseado no método de evolução mínima – não examina todas as topologias possíveis, mas procura encontrar vizinhos que minimizem o comprimento total da árvore. Métodos de construção de árvores filogenéticas Métodos baseados em caráter ► Máxima Parcimônia: o método assume o critério da parcimônia, minimizando o número de passos evolutivos aceitos na árvore ► Máxima verossimilhança: considera todos os sítios indistintamente ► Análise Bayesiana: probabilidades a posteriori Métodos de construção de árvores filogenéticas ► Vários desses métodos estão implementados no programa Mega ► Também no pacote de programas Phylip: http://evolution.genetics.washington.edu/phylip.html Exemplos ► Neighbor-Joining 94 PON2 Homosapiens 100 100 PON2 Pan troglodytes PON2 Macaca mulata PON2 Mus musculus 64 PON3 Mus musculus PON3 Macaca mulata 100 64 100 PON3 Homo sapiens 95 PON3 Pan troglodytes 95 PON2 Galus gallus PON1 Mus musculus PON1 Macaca mulata 100 100 PON1 Homo Sapiens 95 PON1 Pan Troglodytes PON2 Xenopus tropicalis 100 PON1 Xenopus laevis MRNA Danio rerio 0.05 Exemplos ► Minimum Evolution 90 PON2 Homosapiens 100 100 PON2 Pan troglodytes PON2 Macaca mulata PON2 Mus musculus 71 PON3 Mus musculus PON3 Macaca mulata 100 51 100 PON3 Homo sapiens 96 PON3 Pan troglodytes PON1 Mus musculus 98 PON1 Macaca mulata 100 100 PON1 Homo Sapiens 94 PON1 Pan Troglodytes PON2 Galus gallus PON2 Xenopus tropicalis 100 PON1 Xenopus laevis MRNA Danio rerio 0.05 Exemplos ► Maximum Parsimony 99 100 PON2 Homosapiens PON2 Pan troglodytes 100 PON2 Macaca mulata PON2 Mus musculus 33 PON3 Mus musculus 52 PON3 Macaca mulata 100 PON3 Homo sapiens 100 99 PON3 Pan troglodytes 91 PON2 Galus gallus PON1 Mus musculus 100 PON1 Macaca mulata 100 PON1 Homo Sapiens 100 100 PON1 Pan Troglodytes MRNA Danio rerio PON2 Xenopus tropicalis PON1 Xenopus laevis Exemplos ► UPGMA 99 PON2 Homosapiens 100 100 PON2 Pan troglodytes PON2 Macaca mulata 90 PON2 Mus musculus PON2 Galus gallus 67 PON3 Mus musculus PON3 Macaca mulata 100 97 100 PON3 Homo sapiens 100 PON3 Pan troglodytes PON1 Mus musculus PON1 Macaca mulata 100 100 PON1 Homo Sapiens 99 PON1 Pan Troglodytes PON2 Xenopus tropicalis 100 PON1 Xenopus laevis MRNA Danio rerio 0.15 0.10 0.05 0.00 Leitura recomendada ► Schneider, Horacio. Métodos de análise filogenética: um guia prático. 3a edição. Ed. Holos e SBG, 2007. ► www.sbg.org.br