1 Artigo compilado do texto da disciplina BIO-212 Processos Evolutivos USP Genética de Populações http://dreyfus.ib.usp.br/bio212/ Genética de populações A genética de populações e suas relações com a Evolução Durante os últimos anos temos assistido a uma explosão na quantidade de informações tanto sobre a variabilidade genética das populações como sobre a quantidade de diferenciação genética existente entre as espécies atuais. Os dados obtidos por técnicas de Biologia Molecular têm se avolumado de tal maneira que existe um consenso entre os especialistas sobre a necessidade de métodos de análise mais poderosos ou até mesmo de suporte teórico novo para se poder lidar com tamanha massa de dados. Por outro lado, a preocupação crescente com a diminuição da biodiversidade tem levantado questões sobre tópicos como a fragilidade genética de populações pequenas, estratégias genéticas para a conservação de espécies ameaçadas e problemas correlatos, que naturalmente demandam informações sobre a estrutura genética de populações naturais. Estes problemas atuais necessariamente se baseiam numa área específica e recente da Ciência como um todo, mas antiga se considerarmos o desenvolvimento da genética: a genética de populações. A seguir traçaremos um pequeno histórico do seu desenvolvimento. O trabalho mais importante de Charles Robert Darwin (1809-1882), "A origem das espécies", e o trabalho de Alfred Russell Wallace forneceram uma base fenomenológica para o processo de evolução orgânica. "A origem", publicada em 1859, quando o autor contava com 50 anos de idade, provocou, sem dúvida, um grande impacto. A primeira edição da obra, com 1.250 exemplares, esgotou no primeiro dia de publicação, 22 de novembro, e até 1876, somente na Inglaterra, já haviam sido vendidos 16.000 exemplares. Isso não significa que Darwin só tenha recebido aplausos; muito pelo contrário, esta obra encontrou violenta oposição, não exatamente de natureza científica, mas de caráter emocional por parte da Igreja Anglicana (liderada inicialmente pelo bispo Wilberforce) e por parte da sociedade leiga, por não se admitir a idéia da origem do homem a partir de primatas. Essa resistência persiste até hoje em alguns grupos de religiosos fundamentalistas, principalmente os criacionistas, que defendem a interpretação bíblica "ipsis litteris" da criação do mundo e dos seres vivos. A Igreja Católica admitiu, após quase 100 anos de resistência, através da Encíclica Papal "Humanis Genesis" (1951), a ascendência biológica do homem. Em 1997, através de comunicado do papa João Paulo II, a Igreja Católica deixou de considerar a evolução biológica como uma teoria científica e passou a considerá-la como um fato. Na comunidade científica a teoria de Darwin foi aos poucos encontrando abrigo e se tornando cada vez mais uma fonte de inspiração para o desenvolvimento de novas pesquisas. Além disso, a teoria da evolução, com a devida complementação que mais tarde a genética lhe emprestou, permitiu uma visão unificada de toda a Biologia. Os primeiros grandes defensores e divulgadores da teoria da evolução foram Thomas H. Huxley (avô do biólogo Julian Huxley e do escritor Aldous Huxley), na Inglaterra, e Ernst H. Haeckel na Alemanha, onde o darwinismo foi ensinado pela primeira vez em 1860. É importante salientar que o mecanismo da hereditariedade é fundamental para a compreensão da teoria da evolução. Os trabalhos de Mendel (realizados praticamente ao mesmo tempo em que Darwin formulava sua teoria) tornaram-se amplamente conhecidos somente a partir de 1900. Apenas a partir daquele 2 momento foi possível o estabelecimento de ligações adequadas entre a teoria da evolução e a mecânica da hereditariedade. Antes disso, as idéias predominantes sobre a herança biológica eram oriundas do pensamento de Francis Galton, um primo de Darwin que se dedicava ao estudo de caracteres quantitativos através da aplicação de métodos estatísticos para desvendar os princípios da hereditariedade. Em 1897 Galton propôs a lei da ancestralidade que viria a provocar, no futuro, grande resistência à aceitação do mendelismo; independentemente disso Galton foi um cientista muito importante por ter criado uma escola de biometria, com cientistas do porte de Karl Pearson, que desenvolveu métodos estatísticos usados até hoje. A discrepância entre a teoria de Galton e a genética mendeliana só foi resolvida mais tarde, graças principalmente aos trabalhos do dinamarquês Johanssen sobre a herança de caracteres quantitativos (1909) e a um trabalho publicado em 1918 por Ronald Alymer Fisher. Assim, no começo deste século, a teoria da evolução de Darwin sofreu o forte impacto das novas descobertas da genética, iniciadas com a divulgação do trabalho de Mendel. Tornou-se claro que a matéria-prima da evolução são os genes e as suas leis de transmissão de uma geração a outra, ao nível populacional. A união das idéias de Darwin com as noções exatas da mecânica da transmissão do material hereditário originou a teoria moderna da evolução, também conhecida pelo nome de neodarwinismo. As grandes sínteses empíricas desta visão renovada da teoria de evolução foram feitas nas décadas de 30 e de 40 por três importantes nomes da Ciência: Theodosius Dobzhansky, na sua obra clássica "Genetics and the Origin of Species", cuja primeira edição apareceu em 1937, seguida de várias reimpressões e edições revistas e ampliadas; Julian Huxley em "Evolution, the Modern Synthesis", publicada em 1942, e Ernst Mayr em "Systematics and the Origin of Species", de 1942. A ausência de um bom conhecimento da genética no tempo de Darwin não o impediu de elaborar a sua teoria sobre a origem das espécies, mas deixou um vazio que já foi preenchido nas três primeiras décadas do século 20, com os conhecimentos que viriam a se constituir naquilo que é chamado hoje de "genética de populações". A genética de populações estuda as manifestações da herança no nível populacional. Ela trabalha com modelos, ou seja, representações simplificadas da realidade, usando para isso os elementos que participam do fenômeno (genes, genótipos, fenótipos, gametas, etc.), representados simbolicamente e regras operacionais capazes de traduzir os fenômenos que estão sendo estudados. Estas regras operacionais, em geral, estão sujeitas a princípios matemáticos e estatísticos, de modo que os modelos são chamados de modelos matemáticos. A grande importância desses modelos é que partem de informações obtidas por biólogos através de observação e experimentação. Os modelos fornecem meios de estimar parâmetros corretamente e permitem fazer previsões que podem ser testadas experimentalmente. Se os testes experimentais não estiverem de acordo com os modelos, estes serão rejeitados ou modificados e outros modelos mais adequados serão formulados. A cada nova informação, novos modelos podem ser estabelecidos. Os modelos permitem, portanto, um tratamento quantitativo dos fenômenos, o estabelecimento de previsões e uma maneira de testar hipóteses. O conjunto de modelos acumulados desde os primeiros trabalhos feitos nesse campo e sua maneira integrada de tratar os processos evolutivos permitem afirmar que a genética de populações é hoje uma ciência à parte. A primeira publicação relativa à genética de populações foi uma simples nota publicada na revista Science, em 10 de julho de 1908, por Godfrey Harold Hardy, o mais importante matemático inglês deste século. Esse trabalho se deve às questões levantadas por um famoso estatístico, Yule, numa conferência pronunciada pelo geneticista Punnett, na Royal Society of 3 Medicine. Yule declarava que se um alelo dominante fosse introduzido numa população, sua freqüência deveria aumentar até atingir o valor 0,5, fazendo com que a relação entre os fenótipos dominantes e recessivos fosse de 3:1. Punnett, não concordando com aquela afirmação, levou o problema para Hardy, que analisou a questão e demonstrou que na ausência de qualquer fator perturbador as freqüências gênicas devem permanecer constantes e a distribuição das freqüências dos genótipos AA, Aa e aa dependerá das freqüências gênicas de A e a, assumindo valores conforme a distribuição binomial. Esta distribuição de freqüências de uma população em equilíbrio se tornou o ponto fundamental de todo o desenvolvimento da genética de populações. Mais tarde, verificou-se que o mesmo resultado já havia sido publicado em 13 de janeiro de 1908 por um médico alemão, Wilhelm Weinberg, num estudo sobre a herança da gemelaridade. Assim, esse equilíbrio é hoje conhecido na literatura como "equilíbrio de Hardy-Weinberg". Um outro aspecto que preocupou os geneticistas da época, em termos populacionais, foi o efeito do endocruzamento na distribuição das freqüências genotípicas. Este aspecto foi tratado independentemente por H. S. Jennings e por R. Pearl em uma série de trabalhos publicados entre 1912 e 1916. Algumas dúvidas sobre a veracidade das proposições de Pearl levaram também o então jovem geneticista americano Sewall Wright (1889-1988) a se envolver no problema de endocruzamento e sistemas de cruzamento de um modo geral, o que culminou, em 1921, com a publicação de uma série de trabalhos com o título "Systems of mating". Wright tornou-se um dos mais importantes teóricos da genética de populações, juntamente com Ronald Alymer Fisher (1890-1962) e John Burdon Sanderson Haldane (1892-1965). Fisher, além de ter sido um pioneiro da genética de populações, também fez inúmeras contribuições extremamente importantes à Estatística. Haldane, que era professor de Bioquímica em Cambridge, desde cedo manteve interesse por problemas de genética e a partir de 1924 iniciou uma série de publicações sobre genética de populações, centradas no estudo da seleção natural. O estudo da genética vinha apresentando grandes progressos e cada vez mais os problemas evolutivos eram analisados sob o ponto de vista genético, ficando claro que a sede das mudanças evolutivas era o próprio material genético. Cada caráter usado para definir uma população, raça ou espécie é, portanto, um caráter hereditário; estudar as mudanças evolutivas a que estes caracteres estão sujeitos é estudar as mudanças que ocorrem no próprio material genético. Trabalhando com genes é possível estabelecer modelos matemáticos para estimar as freqüências dos mesmos e prever as mudanças que podem ocorrer quando submetidos à ação dos agentes evolutivos. Assim, a essência do processo evolutivo é retratada pela genética de populações que, por volta da década de 30, já tinha suas bases completamente estabelecidas. Em 1930, Fisher havia publicado seu livro "The genetical theory of natural selection"; Wright, em 1931, publicava um longo artigo na revista Genetics, intitulado "Evolution in Mendelian populations" e Haldane, em 1932, publicava o livro "The causes of evolution". Outro grande impacto teórico experimentado pela genética de populações foi sofrido no fim dos anos 60 e começo dos anos 70, devido aos avanços da genética bioquímica. O problema apareceu com a descoberta de uma quantidade inesperadamente alta de polimorfismos proteicos e a resposta, proposta principalmente pelo biólogo japonês Motoo Kimura, foi a teoria neutralista da evolução molecular, segundo a qual estes polimorfismos seriam uma espécie de ruído de fundo do processo evolutivo. Esta questão teórica ainda aguarda solução. A disponibilidade recente de informações sobre filogenias gênicas tem aberto novos horizontes, especialmente com o desenvolvimento da teoria da coalescência. Em todos estes avanços teóricos a linguagem usada, principalmente nas demonstrações matemáticas e nas aplicações de estatística, não era acessível para quem não tivesse algum tipo de preparo 4 nestas áreas. O problema foi facilitado pelo aparecimento de livros-texto, como os que citamos a seguir. O primeiro livro-texto didático de genética de populações foi publicado por Hogben, em 1946 e levava o título “An introduction to mathematical genetics”. Em 1948, seguiu-se “Population Genetics”, de autoria de Ching Chung Li, cuja segunda edição, bastante ampliada, foi publicada em 1976 sob o título "First course in population genetics". Li foi um grande divulgador da genética de populações, além de contribuir também com vários trabalhos originais. Além dos livros de C. C. Li, são conhecidas obras dos seguintes autores: Oscar Kempthorne publicou em 1957 "An introduction to genetics statistics", um livro relativamente complexo, exigindo conhecimentos de estatística; D. S. Falconer, em 1960, publicou "Introduction to quantitative genetics", que é um clássico da genética quantitativa; P. A. P. Moran, publicou, em 1962, "The statistical processes of evolutionary theory"; James F. Crow e Motoo Kimura, publicaram "An introduction to population genetics theory" em 1970 e Regina C. Elandt-Johnson, "Probability models and statistical methods in genetics", em 1971. Desta data para cá apareceram inúmeros outros trabalhos, muitos dos quais apresentam o assunto com o mínimo de formalismo matemático. Entre os livros que também abordam o impacto recente dos resultados de Biologia molecular temos o de Masatoshi Nei, "Molecular evolutionary genetics", de 1987, de Daniel Hartl e Andy G. Clark, "Principles of population genetics" (1989) e o de John Maynard Smith, "Evolutionary genetics" (1989). Embora essas obras abordem o assunto de modo mais profundo que o necessário para um curso básico como o nosso, o registro das mesmas fica pela apresentação dos autores e para aqueles que porventura se interessem pelo assunto. EQUILÍBRIO DE HARDY-WEINBERG Um dos aspectos importantes do estudo da Evolução é a análise da variabilidade genética das populações e do seu comportamento ao longo das gerações. Esses aspectos constituem a preocupação fundamental da Genética de populações, que procura descrever a composição genética das populações bem como sua resposta frente à atuação de fatores tais como o tipo de cruzamento, o tamanho da população, a mutação, a migração e os vários tipos de seleção. A Genética de populações, por quantificar os fenômenos evolutivos, fornece parâmetros para a análise da variabilidade genética das populações, sua origem e manutenção. Vamos, portanto, mostrar como essa variabilidade é caracterizada para fins do estudo da Genética de populações. Freqüências gênicas ou gaméticas A fim de conceituar freqüência gênica, vamos considerar inicialmente o que ocorre com um par de genes autossômicos em organismos diplóides. Supondo que não haja dominância, poderemos distinguir os três genótipos possíveis, representados por AA, Aa e aa. Esses três genótipos corresponderão a três classes fenotípicas diferentes. Assim, em uma população constituída de N indivíduos poderemos contar D indivíduos AA, H indivíduos Aa e R indivíduos aa. Os valores D, H e R são chamados de freqüências absolutas (note as letras maiúsculas) enquanto que esses valores, divididos pelo total de indivíduos da população (N) nos dão as freqüências relativas (representadas pelas mesmas letras, só que minúsculas). 5 AA D d= N Aa H h= N aa r= R N A soma das freqüências relativas é sempre 1. D H R D+ H + R N + + = = =1 N N N N N As freqüências relativas podem ser interpretadas, no caso de amostragens muito grandes, como probabilidades, ou seja, d é a probabilidade de se tomar "ao acaso" um indivíduo AA desta população. Podemos agora procurar saber quais as freqüências gênicas nessa população. Neste caso, o método direto para estimar as freqüências gênicas é o da contagem simples. Dada a população: AA D Aa aa N H R contamos o número de alelos A e a e estimamos as freqüências gênicas. Por se tratar de uma população diplóide vamos atribuir a cada indivíduo dois genes. A população toda terá, pois, 2N genes. Os indivíduos AA terão 2D genes A e os indivíduos Aa terão H genes A, perfazendo um total de 2D + H genes A em uma população com um total de 2N genes; logo, a freqüência do alelo A será: f ( A) = 2D + H 2D H h = + =d+ = p 2N 2N 2N 2 Com o mesmo raciocínio veremos que a freqüência do alelo a será: f (a ) = H 2R + H 2R h = + =r+ =q 2N 2N 2N 2 pode-se verificar que: p+q = d + h h + +r =1 2 2 Uma vez calculada a freqüência de um alelo, a freqüência do outro pode ser obtida pela diferença em relação à unidade, uma vez que p+q =1 p = 1− q e q = 1− p 6 EQUILÍBRIO (OU LEI) DE HARDY-WEINBERG O que fizemos até o momento foi representar um par de genes autossômicos, sem dominância, em uma população diplóide e estimar as freqüências dos alelos. Agora verificaremos o que acontecerá com uma população desse tipo na geração seguinte. Por isso consideramos uma população com reprodução sexuada, que se reproduza por fecundação cruzada. Vamos considerar, para simplificar o problema, um modelo com "gerações discretas", ou seja, uma população na qual não haja cruzamentos entre indivíduos pertencentes a duas ou mais gerações diferentes. Assim, temos uma população de N indivíduos adultos: AA D Aa aa N H R Vamos supor que os cruzamentos nesta população ocorram ao acaso. Tal fenômeno é conhecido como pan-mixia e diz-se que a população que se reproduz assim é pan-mítica. Pan-mixia significa que a probabilidade de um indivíduo de qualquer genótipo cruzar com outro pertencente a qualquer genótipo depende apenas das freqüências genotípicas. Isso é o mesmo que dizer que não há preferências, seja ela por genótipos iguais ou diferentes, na escolha de parceiros. Considerando as freqüências relativas dos genótipos como probabilidades, podemos dizer que a probabilidade dos indivíduos AA, com freqüência relativa 2 d, cruzar com outro indivíduo de mesmo genótipo é simplesmente dXd = d . Assim, podemos construir um quadro com as probabilidades, ou freqüências, dos cruzamentos "ao acaso". QUADRO 1 - Freqüências de cruzamentos "ao acaso". machos AA Aa aa d h r AA freqüências genotípicas d d dh dr Aa h hd h 2 hr aa r rd rh fêmeas 2 r 2 Lembre-se que a soma dessas probabilidades ou freqüências de cruzamentos será sempre igual a 1, pois ( d + h + r ) × (d + h + r ) = 1 × 1 = 1 Agora vamos verificar qual a descendência deixada por cada um desses cruzamentos. Novamente teremos de fazer algumas considerações a respeito de como calcular o número de descendentes. O número de descendentes por casal é variável, mas podemos admitir que este número não dependa dos genótipos dos indivíduos que formam o casal, sendo, em média, o mesmo. 7 Assim, podemos apresentar a freqüência de descendentes de cada classe de casal pela própria freqüência dos cruzamentos. Podemos assim determinar os genótipos dos descendentes de cada casal e suas respectivas freqüências. Exercício: Complete o quadro abaixo, determinando os genótipos descendentes de cada tipo de cruzamento e suas respectivas freqüências. machos AA Aa aa d h r 2 d AA dh/2 AA dh/2 Aa fêmeas AA d Aa h aa r dos Para determinar as freqüências dos diferentes genótipos na nova geração basta somar as freqüências das 3 classes genotípicas dos descendentes. tipo de cruzamento freqüência de cruzamento Descendentes AA AA X AA d2 d2 AA X Aa 2dh dh AA X aa 2dr Aa X Aa h2 Aa X aa 2hr aa X aa r2 Total 1 Aa aa dh 2dr h2/4 h2/2 h2/4 hr hr r2 (d+h/2)2 2(d+h/2)(r+h/2) (r+h/2)2 Lembrando que (d + h/2) = p e (h/2 + r) = q verificamos imediatamente que a distribuição das freqüências genotípicas poderá ser expressa assim: AA Aa aa 2 p 2pq 2 q 2 p 2p(1-p) 2 (1-p) 2 (1-q) 2q(1-q) 2 q ou ou 8 As duas últimas representações têm a vantagem de ter apenas uma variável de freqüência gênica. As freqüências gênicas não mudam, pois: p1 = d 1 + h1 = p 2 + pq = p 2 + p − p 2 = p 2 Note que uma série de condições foi imposta na elaboração do modelo, o que levou a população ao equilíbrio. Estas condições são: - população de tamanho infinito; reprodução sexuada, por fecundação cruzada; pan-mixia; ausência de mutação; ausência de migração diferencial; ausência de seleção. Nestas condições, uma população não sofre alterações em suas freqüências gênicas, ao longo das gerações, nas proporções: p2 q2 2pq Estas proporções serão atingidas em uma única geração. Alelos Múltiplos O princípio alelos. visto acima pode ser estendido para qualquer número de Sejam os alelos: A1 p1 A2 p2 A3 p3 ... AN, com as freqüências gênicas: ... pN No equilíbrio, as freqüências dos genótipos homozigotos f ( A1 A1 ) = p 2 1 ; f ( A2 A2 ) = p 2 2 ; f ( A3 A3 ) = p 2 3 ... serão: f ( AN AN ) = p N2 e as freqüências dos genótipos heterozigotos serão: f ( A1 A2 ) = 2 p1 p2 ; f ( AN −1 AN ) = 2 p N −1 p N f ( A1 A3 ) = 2 p1 p3 ; f ( A2 A3 ) = 2 p2 p3 ... Algumas considerações sobre o equilíbrio de H.W. O equilíbrio de H.W. pressupõe uma série de condições que raramente são observadas na prática. Dificilmente será encontrada uma população natural em que todas as condições estejam vigorando simultaneamente. A mutação, por exemplo, é um fenômeno espontâneo, de ocorrência constante. Porém, como as taxas de mutação são, em geral, muito baixas, da ordem de um para dez mil ou -4 -5 cem mil (10 ou 10 ), seu efeito sobre o equilíbrio, no instante em que a amostra for colhida, será desprezível. Quando se observa um polimorfismo, os diversos fenótipos poderão ter valores adaptativos diferentes, significando que a seleção natural está ocorrendo. Além disso, em muitas populações podem 9 estar ocorrendo migrações e muitas populações nem sempre terão um tamanho que permita considerá-las infinitamente grandes. Ainda, nem sempre as populações são pan-míticas. Apesar dessas observações, o equilíbrio de H.W. é extremamente importante e extremamente útil em genética de populações. Ele se constitui de um modelo básico muito simples, porque elimina todos os fatores que redundam em complicações. As condições que são impostas são exatamente aquelas que poderiam promover mudanças nas freqüências gênicas ou genotípicas e que implicariam em evolução. Por isso podemos dizer que o equilíbrio de H.W. é conservador, pois ele descreve uma situação de uma população que não está se modificando. Para estudar as mudanças evolutivas, procura-se analisar o efeito que os fatores isolada ou conjuntamente apresentam sobre o equilíbrio de H.W., chegando-se, assim, a retratar as mudanças evolutivas. DESVIOS DA PAN-MIXIA: CRUZAMENTOS PREFERENCIAIS E ENDOCRUZAMENTO Entre as várias condições que são impostas para que o equilíbrio de Hardy-Weinberg (H.W.) se verifique, uma delas é que a população seja completamente pan-mítica, isto é, os cruzamentos devem ocorrer totalmente ao acaso. Acontece, porém, que podem haver inúmeras maneiras diferentes dos indivíduos se associarem em acasalamento. Essas diferentes maneiras dependem da própria biologia do organismo, devido a determinadas características morfológicas, fisiológicas ou comportamentais. Podemos lembrar, por exemplo, que existem organismos monóicos, como o caso da ervilha, em que a autofecundação é praticamente obrigatória. Por outro lado, alguns organismos, embora sendo monóicos ou hermafroditas, dispõem de mecanismos que evitam a realização da autofecundação. Em determinadas plantas, como a Nicotiana tabacum, existe um sistema regulado por um loco com vários alelos (S1, S2, S3, ...) que determinam a auto-esterilidade. O pólen S1 é incapaz de produzir o desenvolvimento do tubo polínico no estigma de uma planta cujo genótipo tenha o alelo S1. O mesmo acontece para qualquer outro alelo, de tal forma que a autofecundação nunca deixa descendência e também nunca se formam homozigotos para quaisquer dos alelos do loco. Os sistemas de cruzamentos podem também ser alterados artificialmente pelo homem, que interfere seletivamente na escolha dos cruzamentos de plantas e animais domésticos. Em ambos os casos, teremos alterações na distribuição das freqüências genotípicas das populações. Conseqüentemente, devemos procurar analisar os vários modelos que produzem desvios da pan-mixia e determinar quais as conseqüências que acarretam na estrutura genética da população. Basicamente distinguimos duas categorias de alterações da pan-mixia, uma delas devida a um maior índice de cruzamentos consangüíneos, fenômeno esse chamado de endogamia ou de endocruzamento, e a outra categoria corresponde aos cruzamentos preferenciais, positivos e negativos, com relação a um dado caráter genético. Endocruzamento ou endogamia Considera-se endocruzamento ou cruzamento endogâmico quando os indivíduos que se cruzam apresentam ancestrais comuns próximos. Se admitirmos que a população é pan-mítica, pode-se esperar uma determinada freqüência de cruzamentos endogâmicos. Quando a freqüência de cruzamentos endogâmicos observada for maior do que a freqüência esperada (pela panmixia), então se diz que está ocorrendo endogamia. A população será, então, endogâmica. 10 Endogamia é, portanto, o desvio da pan-mixia devido ao excesso de endocruzamentos (ou cruzamentos endogâmicos) na população. O endocruzamento ou endogamia corresponde ao termo inglês "inbreeding"; o produto de um "inbreeding" é chamado "inbred". A conseqüência da ocorrência de endocruzamento numa população será o aumento da freqüência dos indivíduos homozigotos e a redução da freqüência dos heterozigotos na população. Para entender melhor o que acontece quando há cruzamento endogâmico, vamos comparar duas situações diferentes, uma com endocruzamento e outra sem: 1) Aa AA AA Aa Aa AA Aa Aa aa 2) Aa AA AA Aa Aa Aa aa No caso 1 podemos verificar que o homozigoto aa é constituído por dois genes a, sendo que ambos são cópias do mesmo gene original existente num dos bisavós. No caso 2, também temos um homozigoto aa, formado, porém, por cópias de dois genes a presentes nos avós, de origens independentes. No primeiro caso, diz-se que os dois alelos são iguais por descendência (i.p.d.) e, no segundo, iguais pela origem (i.p.o.). Cotterman chamou os homozigotos com i.p.d. de autozigotos e os homozigotos com genes i.p.o de alozigotos. O importante será determinar quantitativamente o efeito dos cruzamentos endogâmicos sobre a estrutura da população. É claro que o grau de endogamia pode variar e, conseqüentemente, o efeito que acarreta para a estrutura da população também variará. Para se ter uma idéia mais objetiva da conseqüência do endocruzamento na população vamos inicialmente analisar o que ocorre em uma população que se reproduz por autofecundação. A autofecundação corresponde ao grau máximo de endogamia. Consideremos um par de genes autossômicos. Assim, na geração inicial g 0 a população é : g0 AA D0 Aa H0 aa N R0 11 em que f ( A) = D0 + H0 N 2 =p e f (a) = R0 + H0 N 2 =q Admitindo, como foi feito anteriormente, que o número médio de descendentes por entidade reprodutora seja o mesmo e representando esse número pelo próprio número de cruzamentos ocorridos, podemos ver que, nas gerações seguintes, a população terá as seguintes constituições: geração 0 AA Aa aa d0 r0 h0 h0 + 4 8 h0 h0 2 h0 4 ... ... ... 1 1 1 d 0 + h0 . + +...+ n 4 8 2.2 h0 2n 1 1 1 r0 + h0 . + +...+ n 4 8 2.2 1 d0 + 2 d0 + ... n h0 4 r0 + r0 + h0 4 h0 h0 + 4 8 No equilíbrio, teremos: h d$ = d 0 + 0 2 ; h$ = 0 e r$ = r0 + h0 2 , pois lim ∑ i →∞ i =1 1 =1 2i Portanto, na enésima geração, a população estará em equilíbrio e será constituída apenas pelas duas classes homozigotas. Em equilíbrio, a composição genética da população será: AA p Aa 0 aa q Como se pode ver, não ocorreram mudanças nas freqüências gênicas, mas apenas nas freqüências genotípicas, sendo que o valor da classe heterozigota foi diminuindo e os valores das classes homozigotas, aumentando. A endogamia não produz modificação em freqüências gênicas, mas pode ser importante, por exemplo, na eliminação mais rápida de genes letais ou detrimentais da população, quando associada à seleção natural. Podemos definir um índice de heterozigose da população, h /h , chamado n 0 por Wright de índice de pan-mixia, P: P= hn h0 No exemplo que acabamos de examinar, o índice de heterozigose P, é zero, porque h é zero; isso significa que, nessa população, não há qualquer n parcela que seja pan-mítica, isto é, ela é totalmente formada por indivíduos que se cruzam por autofecundação. O complemento de P, isto é, (1-P), é o coeficiente de endocruzamento F: 12 F = 1− P = 1− hn h0 − hn = h0 h0 O coeficiente de endocruzamento F pode variar entre 1 (quando hn for igual a zero) e zero (quando hn for igual a h0): h0 − h0 =0 h0 h0 − 0 =1 h0 Podemos interpretar o coeficiente F como sendo um fator de proporcionalidade que divide a população em duas partes, uma fração F, na qual haveria endocruzamento total, e uma fração 1-F, completamente panmítica. Assim, poderíamos dizer que uma população AA Aa aa em que existisse um coeficiente de endocruzamento F, constante ao longo das gerações, seria constituída por uma fração F de indivíduos autozigotos AA Aa aa p 0 q e uma fração 1-F constituída por indivíduos alozigotos AA 2 p Aa aa 2 q 2pq Ou então: (1 − F ).( p 2 + 2 pq + q 2 ) + F ( p + 0 + q ) Se desdobrarmos esses termos e efetuarmos a soma, teremos: p 2 + 2 pq + q 2 − Fp 2 − 2 Fpq − Fq 2 + Fp + Fq que, reescrito, dará p 2 − Fp 2 + Fp + 2 pq − 2 Fpq + q 2 − Fq 2 + Fq que será igual a: p 2 + Fp(1 − p) + 2 pq − 2 Fpq + q 2 + Fq (1 − q) = = p 2 + Fpq + 2 pq − 2 Fpq + q 2 + Fpq = p 2 + Fpq + 2 pq (1 − F ) + q 2 + Fpq ou seja: AA Aa aa 2 p +Fpq 2pq(1-F) 2 q +Fpq 13 Essa é a distribuição de freqüências de uma população com coeficiente de endocruzamento F. Essa população está num equilíbrio conhecido pelo nome de equilíbrio de Wright, uma vez que esse tipo de equilíbrio foi demonstrado, pela primeira vez, por esse autor. Mutações Toda variabilidade genética existente origina-se por mutações, que podem ser induzidas ou espontâneas. Em ambos os casos, podemos considerar que as mutações são recorrentes, ou seja, não são eventos únicos. Seja para sítio de nucleotídeo, aminoácido ou para genes inteiros, a probabilidade de ocorrência de mutação é a chamada taxa. No caso de processos evolutivos, as mutações importantes são aquelas que envolvem a linhagem germinativa, na produção de gametas. No entanto, os modelos vistos a seguir podem ser facilmente modificados para mutações somáticas, tais como aquelas que envolvem a origem de tumores, ou no caso de propagação vegetativa. As taxas de mutação são expressas em termos de proporção de gametas mutantes que aparecem por geração por gene (ou por sítio). O modelo a seguir considera um loco com dois alelos, A e a. Sendo µ a taxa de mutação de A para a, e p0 e q0 as respectivas freqüências gênicas na geração inicial, então podemos escrever: p1 = p0 (1 − µ ) p2 = p1 (1 − µ ) = p0 (1 − µ )(1 − µ ) = p0 (1 − µ ) 2 da mesma forma: p3 = p2 (1 − µ ) = p0 (1 − µ ) 2 (1 − µ ) = p0 (1 − µ ) 3 pn = p0 (1 − µ ) n logo: pn (1 − qn ) = = (1 − µ ) n p0 (1 − q0 ) multiplicando µ por n/n e substituindo p por 1-q temos: (1 − q n ) nµ n = (1 − ) (1 − q 0 ) n x A função exponencial (e ) é definida por n lim x e = 1 + n → ∞ n x e se considerarmos um número grande de gerações, (1 − q n ) ≅ e − nµ (1 − q 0 ) tomando os logaritmos naturais (na base e) de ambos os lados da equação: −nµ ≅ ln(1 − q n ) − ln(1 − q 0 ) Portanto podemos calcular aproximadamente quantas gerações são necessárias para que um determinado gene mude de freqüência com um determinado ∆q, sabendo-se sua freqüência inicial e sua taxa de mutação: 14 n≅ ln(1 − q 0 ) − ln(1 − q n ) µ Mutação reversa É possível que o alelo A mute para a com taxa µ e que o alelo a mute para A com taxa v: A µ → a A← ν a Assim, em cada geração teremos uma variação nas freqüências dos alelos, que pode ser expressa por: ∆q = µ. p − ν . q Haveria equilíbrio quando ∆q = 0. Neste caso: µp = vq sendo p = 1-q, segue µ(1-q) = νq µ - µq = νq µ = (µ + ν)q Logo, q (em equilíbrio) = q$ = µ µ +ν Note que para este equilíbrio ser alcançado, o número de gerações é muito grande, pois as taxas são muito pequenas. Efeitos das migrações e suas aplicações Abordaremos este assunto primeiramente examinando o modelo proposto por Glass e Li (1953). Sejam: q0 - freqüência original de determinado alelo na população que recebe os migrantes. Q - freqüência do mesmo alelo na população migrante; qn - freqüência do mesmo alelo na população resultante na geração n; m - fração do “pool” gênico que é substituída a cada geração por genes de migrantes, através do inter-cruzamento. Temos, portanto: q1 = (1 − m)q 0 + mQ q 2 = (1 − m)q1 + mQ = (1 − m) 2 q 0 + mQ[1 + (1 − m)] [ q 3 = (1 − m)q 2 + mQ = (1 − m) 3 q 0 + mQ 1 + (1 − m) + (1 − m) 2 ] ... [ q n = (1 − m) n q 0 + mQ 1 + (1 − m) + (1 − m) 2 ...+(1 − m) n −1 ] Entre colchetes temos uma soma de termos de uma progressão geométrica, onde n-1 o primeiro termo (a1)=1; o último termo (an)=(1-m) e a razão (q)=(1-m) A fórmula geral para a soma dos termos dessa progressão é: 15 n ∑a q 1 i = i =1 a n × q − a1 q −1 portanto: (1 − m) n −1 × (1 − m) − 1 q n = (1 − m) n q 0 + mQ = (1 − m) − 1 (1 − m) n − 1 n n = (1 − m) n q 0 + mQ = (1 − m) q 0 + Q 1 − (1 − m) = m − n n = (1 − m) q 0 + Q − Q(1 − m) = (1 − m) n (q 0 − Q) + Q [ ] q n − Q = (1 − m) n (q 0 − Q) q n = (1 − m) n (q 0 − Q) + Q (1 − m) n = ( q n − Q) ( q 0 − Q) ( q − Q) ln(1 − m) n = ln n ( q 0 − Q) ( q − Q) n ln(1 − m) = ln n ( q 0 − Q) e ( q − Q) ln n (q − Q) ln(q n − Q) − ln(q 0 − Q) n= 0 = ln(1 − m) ln(1 − m) DERIVA GENÉTICA Seja uma população de tamanho finito N, constante ao longo das gerações; sejam ainda p0 e q0 as freqüências dos alelos A e a de um loco autossômico na geração 0; como o tamanho da população é constante, a geração 1 é formada da união de 2N gametas ao acaso dentre os indivíduos da geração 0: (p0+q0)2N; q1 pode tomar, portanto, qualquer um dos (2N+1) valores seguintes: 0 1 2 2N − 2 2N − 1 2N ; ; ; ...; ; ; 2N 2N 2N 2N 2N 2N A probabilidade de que q tome o valor particular qj = j/2N é 2N 2N− j j 2N . q = .(1 − q ) 2 N − j . q j . p j j 16 Onde 2N (2 N )! = j j !(2 N − j )! (combinação de 2N elementos j a j) Seja o seguinte exemplo: N = 2, 2N = 4 genes; p0 = q0 = 1/2 f(A) = p = 1 f(a) = q = 0 estado j = 0 3/4 1/4 1 1/2 1/2 2 1/4 3/4 3 0 1 4 As probabilidades de que a população 1 esteja nos estados j = 0, 1, 2, 3 ou 4 são, respectivamente, 0: 1: 2: 3: 4: (1/2)4 = 1/16 4(1/2)3(1/2) = 1/4 6(1/2)2(1/2)2 = 3/8 4(1/2)(1/2)3 = 1/4 (1/2)4 = 1/16 o que define o vetor da linha Q(1) = (1/16 1/4 3/8 1/4 1/16). Se a população 1 estiver no estado j = 0 (p1 = 1, q1 = 0), o que ocorre com uma probabilidade de 1/16, as probabilidades de que a população 2 esteja nos estados j = 0, 1, 2, 3, 4 são, respectivamente, 0: 1: 2: 3: 4: 1 0 0 0 0. Se a população 1 estiver no estado j=1 (p1 = 3/4, q1 = 1/4), o que ocorre com uma probabilidade de 1/4, as probabilidades de que a população 2 esteja nos estados j = 0, 1, 2, 3, 4 são, respectivamente, 0: 1: 2: 3: 4: (3/4)4 = 81/256 4(3/4)3(1/4) = 27/64 6(3/4)2(1/4)2 = 27/128 4(3/4)(1/4)3 = 3/64 (1/4)4 = 1/256. Se a população 1 estiver no estado j=2 (p1 = q1 = 1/2), o que ocorre com uma probabilidade de 3/8, as probabilidades de que a população 2 esteja nos estados j=0, 1, 2, 3, 4 são respectivamente, 0: 1: 2: 3: 4: (1/2)4 = 1/16 4(1/2)3(1/2) = 1/4 6(1/2)2(1/2)2 = 3/8 4(1/2)(1/2)3 = 1/4 (1/2)4 = 1/16. Se a população 1 estiver no estado j=3 (p1 = 1/4, q1 = 3/4), o que ocorre com uma probabilidade de 1/4, as probabilidades de que a população 2 esteja nos estados j = 0, 1, 2, 3, 4 são, respectivamente, 0: 1: 2: 3: 4; (1/4)4 = 1/256 4(1/4)3(3/4) = 3/64 6(1/4)2(3/4)2 = 27/128 4(1/4)(3/4)3 = 27/64 (3/4)4 = 81/256. 17 Se a população 1 estiver no estado j=4 (p1 = 0, q1 = 1), o que ocorre com uma probabilidade de 1/16, as probabilidades de que a população 2 esteja nos estados j=0, 1, 2, 3, 4 são, respectivamente, 0: 1: 2: 3: 4: 0 0 0 0 1. Logo, as probabilidades de que a população 2 esteja nos estados j = 0, 1, 2, 3, 4 são, respectivamente, 0: 1/16 x 1 + 1/4 x 81/256 + 3/8 x 1/16 + 1/4 x 1/256 + 1/16 x 0 = 85/512 = 0,166016 1: 1/16 x 0 + 1/4 x 27/64 + 3/8 x 1/4 + 1/4 x 3/64 + 1/16 x 0 = 27/128 = 0,210938 2: 1/16 x 0 + 1/4 x 27/128 + 3/8 x 3/8 + 1/4 x 27/128 + 1/16 x 0 = 63/256 = 0,246094 3: 1/16 x 0 + 1/4 x 3/64 + 3/8 x 1/4 + 1/4 x 27/64 + 1/16 x 0 = 27/128 = 0,210938 4: 1/16 x 0 + 1/4 x 1/256 + 3/8 x 1/16 + 1/4 x 81/256 + 1/16 x 1 = 85/512 = 0,166016 o que define o vetor de linha Q(2) = (85/512 27/128 63/256 27/128 85/512). Sob forma matricial, as operações podem ser reescritas como 1 16 1 4 3 8 1 4 [ 0 0 0 0 1 81 256 27 64 27 128 3 64 1 256 1 1 1 3 1 1 × 4 8 4 16 16 16 3 27 27 81 1 64 128 64 256 256 0 0 0 0 1 = 85 512 27 128 63 256 27 128 85 512 ] ou, abreviadamente, Q(1).T = Q(2), em que T é uma matriz transicional de probabilidades condicionais (matrizes desse tipo caracterizam-se por suas linhas somarem 1). Generalizando, Q(n).T = Q(n+1). O que foi visto foi a análise de um processo em que, dadas as condições de uma determinada população (tamanho e freqüência), podemos determinar as probabilidades da população estar na mesma condição (freqüências gênicas iguais) ou em condições diferentes. Como a deriva genética é um processo de amostragem casual, não podemos prever o que pode acontecer com a freqüência gênica de uma determinada população pequena. O que pode ser feito, no entanto, é estudar o comportamento de um número muito grande de populações com mesmo tamanho, em que podemos esperar que algumas aumentem as freqüências gênicas, outras diminuam e outras permaneçam com freqüências gênica iguais. A teoria da Estatística nos fornece meios de prever a dispersão das freqüências gênicas em muitas populações. Para isso, usamos a medida da variância, na enésima geração, em um grupo de populações que na geração 0 têm as mesmas freqüências gênicas. A previsão da variância no decorrer das gerações exige conhecimentos avançados de Estatística, mas está representada abaixo apenas para ilustração: Na geração 0, não há variação, todas as freqüências são idênticas, portanto: 18 σ 20 = 0 Na primeira geração (da distribuição binomial): σ 12 = q 0 (1 − q 0 ) 2N A média das freqüências é igual a esperança: E ( q1 ) = q 0 = q e a variância: σ 12 = E (q12 ) − q 2 = E (q12 ) − q 02 q (1 − q 0 ) ∴ E (q12 ) = σ 12 + q 02 = q 02 + 0 2N A proporção de heterozigotos esperada na geração 1 é: 2 h1 = E (2 p1q1 ) = 2 E (q1 ) − 2 E (q1 ) = 2q 0 − 2q 02 − 2q 0 (1 − q 0 ) − 2q 0 (1 − q 0 ) = 2N 2q 0 (1 − q 0 ) 1 = 2q 0 (1 − q 0 ) 1 − = 2N 2N 1 h0 1 − ∴ 2N como a proporção de heterozigotos de uma geração é a multiplicação da quantidade de heterozigotos da geração seguinte por uma constante, na nésima geração: 1 hn = h0 1 − 2N n A variância na n-ésima geração: σ 2n = E (q n2 ) − q 02 Colocando o termo E (q n2 ) em termos de hn(que já conhecemos) e q0: hn = E (2 pn q n ) = E [2q n (1 − q n )] = 2 E (q n ) − 2 E (q n2 ) = 2q 0 − 2 E (q n2 ) E (q n2 ) = 2q 0 − hn 2 n h 1 σ = q 0 − n − q 02 = q 0 − q 02 − q 0 (1 − q 0 ) 1 − = 2 2N 2 n n 1 = q 0 (1 − q 0 ) − q 0 (1 − q 0 ) 1 − = 2n n 1 = q 0 (1 − q 0 ) 1 − 1 − 2 N 19 n 1 σ = p0 q 0 1 − 1 − 2 N 2 n O limite de σ n quando n tende a infinito é q0(1-q0). A Tabela abaixo mostra, para um número infinito de populações compostas, cada uma, por N = 2 indivíduos com p0 = q0 = 1/2 na geração inicial, os valores das probabilidades dos estados j = 0, 1, 2, 3, 4 e da 2 variância σ 2n , calculados segundo os métodos mostrados anteriormente. 0 1 2 3 4 σ 2n 0,000000 0,062500 0,166016 0,248962 0,311670 0,358748 0,466480 0,492046 0,498112 0,499552 0,500000 0,000000 0,250000 0,210938 0,160400 0,120506 0,090399 0,021453 0,005091 0,001208 0,000287 0,000000 1,000000 0,375000 0,246094 0,181274 0,135647 0,101706 0,024124 0,005727 0,001359 0,000323 0,000000 0,000000 0,250000 0,210938 0,160400 0,120506 0,090399 0,021453 0,005091 0,001208 0,000287 0,000000 0,000000 0,062500 0,166016 0,248962 0,311670 0,358748 0,466480 0,492046 0,498112 0,499552 0,500000 0,000000 0,062500 0,109375 0,144531 0,170898 0,190674 0,235922 0,246659 0,249207 0,249812 0,250000 j geração 0 1 2 3 4 5 10 15 20 25 ∞ Seleção Natural "I have called this principle, by which each slight variation, if useful, is preserved, by the term Natural Selection, in order to mark its relation to man's power of selection." (Denominei este princípio, pelo qual cada variação diminuta, se útil, é preservada, com o termo Seleção Natural, com a finalidade de salientar sua relação com o poder humano de seleção.) Darwin, The origin of Species, cap III. Quando Darwin estabeleceu o conceito de seleção natural comparou-a com a prática da seleção genética de animais e plantas (domesticação), que vinha sendo realizada com sucesso desde há muito tempo. A seleção artificial era sempre direcionada para o desenvolvimento de características desejáveis pelos seres humanos, chegando a satisfazer até mesmo caprichos bizarros. Em princípio, o que se fazia era escolher os organismos que apresentassem caracteres interessantes para serem os reprodutores. Darwin raciocinou acertadamente que, na natureza, aqueles indivíduos que apresentassem atributos que aumentassem a chance de deixar mais descendentes deixavam mais descendentes. Se estes atributos fossem hereditários e variáveis, os descendentes dos indivíduos "mais aptos" apresentariam, com maior probabilidade, as características de sucesso. Este raciocínio é correto uma vez que as chances de sucesso dependem de fatores extrínsecos aos organismos, os chamados fatores ambientais, que podem ser, inclusive, outros organismos, tais como predadores, parasitas, competidores, etc. A dependência com relação ao ambiente confere significado ao que se conhece como "valor adaptativo". A variação não genética (ou variação ambiental) por não ser herdada, não influencia o valor adaptativo. A potencialidade 20 genética para responder ao ambiente, por ser herdável, também é passível de seleção. O valor adaptativo, além de ser dependente dos fatores ambientais, é de natureza estatística. Um indivíduo com um genótipo que apresenta características vantajosas para uma determinada situação ambiental pode ter insucesso reprodutivo, enquanto outros não geneticamente favorecidos podem deixar proles enormes. Neste caso, diferenças entre valores adaptativos são diferenças entre médias apresentadas pelos diversos indivíduos de cada genótipo. O valor adaptativo, por ser um parâmetro que depende de genótipo, é sempre relativo aos outros genótipos. Cálculo do valor adaptativo. O valor adaptativo é calculado geralmente a partir da divisão dos indivíduos em classes genotípicas com relação a apenas uma fração da variação genética existente, considerando que a variação restante tem efeito igual sobre os genótipos a ser analisados. Exemplificando: se quisermos verificar o efeito sobre o sucesso reprodutivo que a variação em um loco com dois alelos exerce, dividimos os indivíduos em três classes: AA, Aa e aa. Dentro de cada uma destas classes haverá variantes em outros locos (BB, Bb e bb; CC, Cc e cc, etc.), mas como a divisão não considera estes locos, podese admitir que eles atuam de forma semelhante sobre o(s) loco(s) cujas classes genotípicas serviram de base para a divisão. Aqui cada classe genotípica pode ser analisada quanto a qualquer componente do valor adaptativo, por exemplo, número de ovos, sementes, taxa de fertilidade, etc., mas a avaliação global do valor adaptativo são as próprias relações entre freqüências de duas gerações consecutivas. Sejam as freqüências genotípicas na geração inicial: AA d0 Aa h0 aa r0 Aa h1 aa r1 e na geração seguinte: AA d1 os valores adaptativos serão: w1(genót. AA)= d1 d0 w2(genót. AA)= h1 h0 . w1(genót. aa)= r1 r0 como são valores relativos, os valores adaptativos podem ser normalizados dividindo-se cada um deles pelo maior, que passará a valer 1. Exemplo: Tomou-se uma população de 1000 indivíduos que foi observada por duas gerações obtendo-se os resultados: AA 250 360 Aa 500 480 aa 250 160 Os valores adaptativos para cada um dos genótipos são, portanto: 21 w1 = 360 =1,44 250 normalizando: w1= 1,44 1,44 w2= 480 500 = 1,00 =0,96 w2= 0,96 1,44 = 0,67 w3= 160 250 = 0,64 w3 = 0,64 1,44 = 0,44 Assim, os indivíduos de genótipo Aa deixam, em média 67% de descendentes com relação aos de genótipo AA e os de genótipo aa deixam apenas 44%, com relação ao mais adaptado (AA). O modelo geral de seleção. O conceito de valor adaptativo nos permite fazer previsões com relação à composição genética de populações naturais, desde que aplicadas a modelos matemáticos adequados. Supondo um sistema de cruzamento ao acaso (pode-se modelar com outros sistemas, sendo que a seqüência de procedimentos é a mesma). Supõe-se também um loco com dois alelos e com valores adaptativos constantes ao longo do tempo. Temos: Genótipos AA Aa aa Total valores W1 W2 W3 p2 2 pq q2 1 p 2 . w1 2 pq. w2 q 2 . w3 w adaptativos freqüências antes da seleção contribuição proporcional freqüências após seleção p 2 . w1 w 2 pq. w2 w q 2 . w3 w 1 O valor adaptativo médio - w - (Atenção, w NÃO é uma média aritmética simples, é a média ponderada dos valores adaptativos dos genótipos pelas freqüências genotípicas) nos mostra o quanto a população como um todo está adaptada. Por ser uma média ponderada pelas freqüências genotípicas, com valores adaptativos iguais, o valor adaptativo médio pode assumir diversos valores. A quantidade de seleção sofrida por cada um dos genótipos também pode ser expressa através do valor complementar ao do valor adaptativo, o coeficiente de seleção: s1 = 1 - w1 s2 = 1 - w2 s3 = 1 - w3 Casos especiais I. Seleção contra homozigotos recessivos ( w1 = w2 > w3) obs: como só existe designado apenas por s. um coeficiente de seleção, ele será, neste caso, 22 Genótipos AA Aa aa Total valores 1 1 (1 − s) p2 2 pq q2 1 p2 2 pq q 2 (1 − s) w = 1 − sq 2 p2 1 − sq 2 2 pq 1 − sq 2 q 2 (1 − s) 1 − sq 2 1 adaptativos freqüências antes da seleção contribuição proporcional freqüências após seleção a freqüência do alelo a na próxima geração será (r+h/2): q1 = q 2 − sq 2 + pq q 2 − sq 2 + q (1 − q ) q 2 − sq 2 + q − q 2 q − sq 2 = = = 1 − sq 2 1 − sq 2 1 − sq 2 1 − sq 2 A variação da freqüência gênica de a, ∆q = q1 − q 0 = ∆q = − Como s q será: q − sq 2 q − sq 2 − q (1 − sq 2 ) sq 2 + sq 3 − q = = − 1 − sq 2 1 − sq 2 1 − sq 2 sq 2 (1 − q ) 1 − sq 2 e ∆q são (seleção contra homozigotos recessivos) quantidades positivas e menores que 1, q será sempre negativo, ou seja, haverá seleção até a extinção do alelo a. Se a seleção for total (s=1), poderemos prever a freqüência do gene a (q) para a n-ésima geração: q1 = q(1 − q ) q − q2 q = = 2 1− q (1 + q )(1 − q ) 1 + q q q2 = 1 1 + q1 , reaplicando q q q 1+ q 1+ q = = = q 1 + q + q 1 + 2q 1+ 1+ q 1+ q assim q3 = q0 1 + 3q 0 recessivos) e qn = q0 1 + nq 0 (quando há seleção total contra homozigotos 23 Se n fica muito grande, q tende a zero, ou seja, a população tende a ficar sem o gene recessivo. 24 II. Seleção favorecendo heterozigotos. (w1<w2>w3) Genótipos valores AA Aa aa Total (1 − s1 ) 1 (1 − s3 ) p2 2 pq q2 1 p 2 (1 − s1 ) 2 pq q 2 (1 − s3 ) w = 1 − s1 p 2 − s3 q 2 p 2 (1 − s1 ) w 2 pq w q 2 (1 − s3 ) w 1 adaptativos freqüências antes da seleção contribuição proporcional freqüências após seleção a freqüência do alelo a na próxima geração será (r+h/2): q 2 − s3 q 2 + pq q 2 − s3 q 2 + q − q 2 q − s3 q 2 q1 = = = 1 − s1 p 2 − s3 q 2 1 − s1 p 2 − s3 q 2 1 − s1 p 2 − s3 q 2 a diferença entre duas gerações consecutivas (∆q) será: ∆q = q1 − q = = = q − s3 q 2 − q (1 − s1 p 2 − s3 q 2 ) q − s3 q 2 − q + s1 p 2 q + s3 q 3 = = 1 − s1 p 2 − s3 q 2 1 − s1 p 2 − s3 q 2 [ ] 2 s1 p 2 q + s3 q 3 − s3 q 2 q ( s1 p 2 + s3 q 2 − s3 q ) q s1 p − qs3 (1 − q ) = = = 1 − s1 p 2 − s3 q 2 1 − s1 p 2 − s3 q 2 1 − s1 p 2 − s3 q 2 ( q s1 p 2 − qs3 p 1 − s1 p − s3 q ∆q = Este 2 )= 2 pq ( s1 p − s3q ) 1 − s1 p 2 − s3q 2 valor (∆q) (para seleção a favor de heterozigotos) assumirá um valor negativo ou positivo dependendo das freqüências gênicas. Isto significa que existe um valor de equilíbrio onde as freqüência gênicas não mudarão. No equilíbrio, portanto as relações serão constantes: p1 q1 = p q ; substituindo: p − s1 p 2 q − s3 q 2 = wp wq então: p(1 − s1 p) q (1 − s3 q ) = wp wq 1 − s1 p = 1 − s3 q ; portanto s1 p = s3 q ; s1 (1 − q ) = s3 q 25 q$ = s1 s1 + s3 (somente em equilíbrio, com superioridade do heterozigoto) este é o valor da freqüência gênica q, em equilíbrio, significando que esta depende apenas homozigotos. das intensidades dos coeficientes de seleção contra os