Disciplina de Genética e Evolução, ano lectivo de 2002/2003 Apontamentos para as aulas teóricas Dep artam ento de Bio logia , Unive rsidad e de Évora Interpretação das distribuições genotípicas nas populações I Nes te capítulo descrevem-se e comentam-se algumas das ferramentas analíticas essenciais, baseadas na Genética de Populações, utilizadas nos estudos de Evolução. Desvios em relação à distribuição-padrão de Hardy-Weinberg Testes estatísticos básicos É sabido que não existem populações que obedeçam aos requisitos para o equilíbrio de Hardy-Weinberg, mas sendo esta a referência fundamental é necessário testar sempre se as distribuições observadas correspondem às espera das. Para isso utiliza-se o teste P2: para n alelos num locus existem ½n(n+1) classes genotípicas, obtendo-se os valores esperados das homozigóticas calculando para cada caso pi2 N, sendo pi a frequência do i-ésimo alelo do locus e N o número de indivíduos da amostra, e das heter ozig óticas com o i-és imo e j-ésim o alelos calculando 2pip jN. O número de graus de liberdade é ½n(n–1), excepto se, por causa da falta de poder estatístico deste teste quando os valores esperados são inferiores a 5, se tiver de agregar classes genotípicas e o número de comparações já não for ½n(n+1) mas menos 1 . No caso de apenas 2 alelos num locus com dominância completa há apenas 2 classes fenotípicas e 0 graus de liberdade, mas se se souberem os fenótipos dos progenitores po de utilizar-se o teste de Snyder (tabela 1): Tabela 1 — Implementação do teste de Snyder. A estimativa de q a partir da frequência de indivíduos r (manifestando o gene recessivo), pela distribuição de Hardy-Weinberg, é q2 , por isso entre os progenitores obtém-se q = / [(½N2 +N3 )/N], com N = N 1 +N2 +N3 . Os valores N’ referem-se ao número de descendentes por tipo de cruzamento. O teste P2 deve utilizar a correcção de Yates e o valor obtido corresponde a 1 grau de liberdade. Distribuição dos descendentes esperados Tipo de cruzamento (fenótipos D do gene dominante, r do recessivo) frequência do cruzamen to D r D×D N 1 = (1 – q2)2 N [(1+2q)/(1+q)2] N’1 [q/(1+q)] 2 N’1 D×r N 2 = 2q 2(1–q2)N [1/(1+q)] N’2 [q/(1+q)] N’2 r×r N 3 = q4 N 0 N’3 Interpretação dos testes Quer se detecte ou não um desvio significativo, o resultado pode não ter qualquer significado, pois são 1 Se o número de comparações for k e o número de frequências genéticas necessárias para calcular os valores esperados for p–1, então o número de graus de liberdade é k–p (o parâmetro N retira m ais um grau de liberdade). Note-se que, se houver p alelos diferentes na amostra, o conhecimento de p–1 frequências é suficiente, dado que no conjunto totalizam 1. Le plaisir de faire quelque chos e de parfaitement in utile... (Maurice Ravel) Disciplina de Genética e Evolução, ano lectivo de 2002/2003 Apontamentos para as aulas teóricas Dep artam ento de B iologia , Unive rsidad e de Évora múltiplas as vias pelas quais se atingem resultados análogos. Portanto, fazer contagens e calcular frequências deve ser acompanhado de in formações importantes para identificar factores que afectam as frequências, os quais se podem agrupar em duas categorias: a amostragem e a estratificação da população. Para além dos e rros s istem áticos que se pode m co mete r (que in cluem a pos sibilidade de certos genótipos serem tendencialmente incluídos ou excluídos da amostra), há a questão do momento no ciclo de vida em que se faz a amostragem, que pode não ser indiferente em casos de selecção. Retomando o exemplo da detecção de genes letais em drosófilas (figura 4), é totalmente diferente estimá-la através do decréscimo de indivíduos que atingem a idade adulta ou da contagem do número de larvas que não se desenvolvem. Analogamente, recolher as sem entes produ zidas e obs ervar as plantas criadas a partir delas, em con dições co ntroladas, pode fornecer informaçõ es precios as sobre a selecção natural actuando pós- germ inaçã o. C omo exem plifica a tabela 2, sem ter es se termo de com paração é impossíve l interpretar correctamente as distribuições que se observam nos adultos: Tabela 2 — Distribuições genotípicas em três loci numa mesma população diplóide, determinadas em duas fases diferentes do desenvolvimento, uma precoce (I) e outra no estado adulto (II). No locus A saa = 0,8, no locus B F = –0,1, no locus C scc = 2sCc = 0,5. locus A Fase AA Aa locus B aa p(A) BB Bb bb locus C p(B) CC Cc cc p(C) I 0,25 0,5 0,25 0,5 0,09 0,42 0,49 0,3 0,36 0,48 0,16 0,6 II 0,313 0,625 0,06 0,625 0,07 0,462 0,469 0,3 0,45 0,45 0,1 0,675 Entre I e II verificam-se alterações substanciais: tanto os Aa como os Bb estão em excesso para as frequências esperadas em II, mas enquanto no primeiro caso isso está associado a um decréscimo acentuado (em relação a I) da proporção dos aa (e consequente aumento dos restantes genótipos, mas AA está abaixo do esperado), revelado pelo a ume nto de p(A), no segundo a p(B) mantém-se constante, implicando uma perda simétrica dos homozigóticos. Já no locus C, a distribuição em II é muito próxima da esperada, mas novamente a alteração das frequências genéticas (aumento da p(C) em relação a I mostra que houve selecção. Le plaisir de faire quelque chos e de parfaitement in utile... (Maurice Ravel)