R. Bras. Zootec., v.27, n.4, p.715-721, 1998 Efeitos da Substituição de Alelos, da Freqüência Gênica e da Taxa de Recombinação sobre o Poder de se Detectar Ligação entre um Marcador Genético e Loci de Característica Quantitativa de Baixa Heritabilidade Mário Luiz Martinez1 RESUMO - O delineamento de filhas com várias estruturas de famílias foi usado para avaliar os efeitos da substituição de alelos, da freqüência gênica e da taxa de recombinação sobre o poder de se detectar a ligação entre um marcador e loci de característica quantitativa (QTL). Foram simuladas famílias de 20, 40, 80 e 100 reprodutores, com 25, 50, 100, 200 e 400 filhas por reprodutor. Os efeitos simulados para substituição de alelos foram de 0,3 e 0,4 desvios-padrão fenotípicos; a heritabilidade variou de 2 a 10%; a taxa de recombinação foi de 0; 0,1; e 0,2 e a freqüência de alelos foi igual a 0,1 e 0,5. Os resultados mostraram grande efeito da substituição de alelos, independentemente do valor da heritabilidade da característica. Quando a freqüência gênica variou de 0,5 para 0,1, aumentou o número de indivíduos que devem ser analisados para se obter mesmo poder. Da mesma forma, quando o QTL e o marcador não estão próximos um do outro (r ≥ 0,2), a ligação entre marcador - QTL só pode ser detectada se o número de animais for muito grande (> 30,000). Palavras-chave: freqüência gênica, marcador genético, taxa de recombinação Effects of Alleles Substitution, Gene Frequency and Recombination Rate on the Power to Detect Linkage between a Genetic Marker and a Quantitative Trait Loci of Low Heritability ABSTRACT - The daughter design with different families structures was used to evaluate the effects of allele substitution, gene frequency and recombination rate on the power to detect the linkage between a marker and a quantitative trait loci (QTL). Families of 20, 40, 80 and 100 sires with 25, 50, 100, 200 and 400 daughters per sire were simulated. The simulated effects for allele substitution were .3 and .4 phenotypic standard deviations; the heritability ranged from 2 to 10%; the recombination rates were zero, .1 and .2; and the allele frequency was egual to .1 and .5. The results showed a large effect of allele substitution, independently on the heritability value of the trait. When the gene frequency ranged from .5 to .1, increased the number of animals that must be analyzed to obtain the same power. In the same way, when the QTL and the marker are not close to each other (r≥0.2), the linkage between the marker - QTL just could be detected if the number of animals were higher (>30.000). Key Words: gene frequency, genetic marker, linkage, recombination rate Introdução Uma série de estudos tem mostrado que locus de características quantitativas (QTL) de importância econômica podem ser detectados e mapeados por meio da análise de ligação a marcadores genéticos conhecidos (SOLLER, 1990). Em populações de gado de leite, alguns touros elite têm centenas ou mesmo milhares de filhas produzidas pela inseminação artificial. Dessa forma, é possível detectar um QTL que esteja sendo transmitido para as progênies de um touro heterozigoto para um marcador genético (NEIMANN-SORENSEN e ROBERTSON, 1961). Se o marcador está ligado a um QTL heterozigoto no touro, as filhas que recebem alelos diferentes do marcador deverão também apresentar diferença para 1 Pesquisador da EMBRAPA - Gado de Leite - Juiz de Fora, MG. a característica quantitativa. Todavia, mesmo o touro sendo heterozigoto para o marcador, ele pode ser homozigoto para o QTL e as filhas que recebem alelos diferentes do marcador não apresentarão nenhuma diferença para a característica quantitativa. Além disso, mesmo se o touro for heterozigoto para ambos, o marcador e o QTL, a relação de ligação pode ser diferente de um touro para outro. Dessa forma, torna-se necessário analisar em conjunto as progênies de vários touros e considerar os efeitos do marcador dentro de touros. Estas análises podem ser realizadas pela análise de variância (WELLER et al., 1990) ou pelo método do qui-quadrado (GELDERMANN, 1975). Como as relações de ligação entre alelos do marcador e QTL são diferentes entre os touros, o delineamento de filhas (WELLER 716 MARTINEZ et al., 1990) tem poder estatístico menor que os foram simulados considerando-se o delineamento de delineamentos que usam os cruzamentos entre linhafilhas (WELLER et al., 1990). Para as alternativas gens consangüíneas. Para se detectar um QTL que simuladas, consideraram-se: o número de touros (NS) tenha efeito médio de substituição de genes de 0,1 a = 20, 40, 80 e 100; o número de filhas por touro (ND) 0,3 desvios-padrão fenotípico, é necessário determi= 25, 50, 100, 200 e 400; o efeito da substituição de nar o genótipo de milhares de filhas (SOLLER e alelos em desvio-padrão fenotípico (A) = 0,3 e 0,4; a GENIZI, 1978; WELLER et al., 1990). Quando a heritabilidade da característica = 0,02, 0,04, 0,08 e ligação genética entre QTL e marcador é incompleta, 0,10; a taxa de recombinação (r) = 0, 0,1 e 0,2; e a ou seja, a taxa de recombinação é diferente de zero, freqüência de alelos (p) = 0,1 e 0,5. Outras estimatias estimativas dos efeitos do QTL será viesada pela vas utilizadas foram adaptadas dos trabalhos de taxa de recombinação, reduzindo-se o poder para se SCHUKKEN et al. (1994) e SCHUTZ et al. (1994). detectar a ligação (BOVENHUIS e WELLER, 1994). Embora o nível de significância (α) de 0,05 seja Nos últimos anos mais ênfase tem sido dada ao geralmente utilizado na maioria dos estudos em genéimpacto da genética sobre a resistência às doenças, tica de populações e análises de ligação, deve-se e a seleção genética para melhorar as características considerar, em determinadas situações, um nível de saúde de bovinos leiteiros pode vir a ser uma menor (por exemplo, α = 0,01), pois, quando se realidade (LEWIN et al., 1988; MALLARD et al., testam vários marcadores com vários QTL, é possí1989; STEAR et al., 1989; SCHUKKEN et al., vel obter, simplesmente devido ao acaso, efeitos 1994). A seleção de reprodutores por intermédio da significativos para as ligações entre marcador-QTL avaliação genética para baixa incidência de determique não existem. Assim, em algumas das situações nadas doenças, tal como a incidência de mastite estudadas, variou-se o nível de significância exigido. clínica nas filhas, é um processo lento para se obter O poder para se detectar ligação entre marcador ganho genético, principalmente devido à baixa e QTL para as combinações dos parâmetros foi heritabilidade dessas características. Métodos mais calculado utilizando-se o método do qui-quadrado eficientes são necessários nessas situações. O comcomo proposto por GELDERMANN (1975) e descriplexo maior de histocompatibilidade (MHC), juntato por WELLER et al. (1990), considerando-se apemente com outros marcadores genéticos, pode ser nas dois alelos do QTL, grupos de progênies de uma das alternativas (MALLARD et al., 1989; mesmo tamanho e variância do QTL desprezível, STEAR et al., 1989). Em bovinos, este grupo de relacionada à variância fenotípica total. Sob essas genes é conhecido como sistema antígenos condições, o poder é calculado como: linfocitários bovino (BoLA). Todavia, para avaliar a P = 1 - B = 1 - p [χ2 (NC, NS) < y] (1) importância da seleção com auxílio de marcadores, é Em que B é o erro tipo 2, p [χ2 (NC, NS) < y] é necessário que se detectem e estimem, em primeiro a probabilidade do valor do qui-quadrado ser menor lugar, os efeitos dos locus de características quantique o valor de y, dado o parâmetro não-central NC e tativas de importância econômica. A detecção de NS graus de liberdade e y é o valor do qui-quadrado QTL ligados a marcadores genéticos é afetada por central para um erro tipo 1 igual a a e com NS graus diversos fatores (freqüência dos alelos, efeitos da de liberdade. Para o caso da hipótese de nulidade, ou substituição de alelos, heritabilidade da característiseja, não há ligação entre QTL e marcador, NC = 0. ca, taxa de recombinação etc). Para uma hipótese alternativa qualquer, a esperança O objetivo deste trabalho foi avaliar os efeitos da do NC pode ser calculada como: substituição de alelos, da freqüência gênica e da taxa NC = (NS * F * A2) / SE2 (2) de recombinação sobre o poder de se detectar QTL, Em que F é a fração de touros heterozigotos para utilizando-se estimativas da freqüência gênica e efeio marcador ligado ao QTL, A é o efeito médio da tos da substituição de alelos obtidos por SCHUKKEN substituição de genes do QTL e SE é o erro-padrão et al. (1994) e SCHUTZ et al. (1994). da diferença dos dois grupos de progênies. F, A e SE podem ser obtidos por intermédio das equações: Material e Métodos F = 2pq (3) A = α + (p - q)d (4) Os dados para se avaliarem os efeitos da substiSE 2 = 4 (1 - h2/4)/ND (5) tuição de alelos, da heritabilidade da característica, Em que p e q são as freqüências dos alelos q1 e q2 da freqüência gênica e da taxa de recombinação do QTL, α é a metade da diferença entre os dois R.Bras.Zootec. 717 homozigotos para o QTL, d é a diferença entre o heterozigoto para QTL e a média dos dois homozigotos, h2 é a heritabilidade da característica e ND é o número de filhas. Ambos os termos a e d são medidos em unidades do desvio-padrão fenotípico. As equações (3) e (4) são encontradas em FALCONER (1981). Devido à natureza discreta do efeito de touros, o número de touros heterozigotos (F) pode ser muito diferente do que se espera, quando se tem um número pequeno destes. Isto ocorre em virtude da amostragem ao acaso; portanto, o poder dos delineamentos deve ser calculado considerando-se a natureza discreta da distribuição dos touros, utilizando-se a distribuição binomial com pequenos ajustes nas equações (1) e (2). Na equação (4), a proporção de touros heterozigotos (F) é calculada como: Ni Fi = NS para i = 1, 2,..., NS, ou seja, Fi varia de 0 a 1; em que Ni é o número de touros heterozigotos e NS o número total de touros sendo considerados, e Resultados e Discussão Os parâmetros utilizados para gerar os resultados das Tabelas 2 e 3 são apresentados na Tabela 1, em que estão apenas os alelos do sistema BoLA (CA42, W20 e W11), que apresentaram efeito significativo sobre a incidência de infecção das glândulas mamárias no trabalho de SCHUKKEN et al. (1994). Pela análise da Tabela 1, nota-se que, embora o efeito da substituição de alelos seja de razoável magnitude (0,25 a 0,65 desvios-padrão fenotípicos), a variância explicada pelo efeito dos alelos (QTL) associados a estes marcadores é de apenas 2 a 3%, o que é conseqüência da baixa freqüência dos alelos (0,02 a 0,2). Pode-se observar na Tabela 2 que a heritabilidade dentro da faixa simulada (2 a 10%) não influenciou o poder, independentemente do efeito da substituição de alelos. Todavia, o efeito da substituição afetou significativamente o poder em se detectar ligação entre marcador e QTL. Embora o efeito da substituição gênica considerado (0,3 e 0,4) para CA42 seja de média magnitude, devido a sua baixa freqüência (p = 0,1), são necessários no mínimo 10.000 indivíduos (100 touros com 100 filhas cada uma) para se obter poder de cerca de 75%, quando se considera um erro do tipo 1 ao nível de 5% de probabilidade e A = 0,4. No caso de se desejar diminuir este erro (α = 0,01), o número de animais deve ser de, no mínimo, 16.000 NS PF = ∑ pb i * Pi (6) i =1 Em que PF é o poder final, pbi é a probabilidade através da distribuição binomial de que o touro i é heterozigoto e Pi é o poder como calculada em (1). Tabela 1 - Estimativa 1 da freqüência gênica (p), do efeito da substituição de alelos (G), da variância fenotípica (Vp) e da proporção da variância do QTL em relação à variância total (Vqtl ) Table 1 - Estimates 1 of gene frequency (p), alleles substitution effect (G), phenotypic variance (Vp) and proportion of QTL variance (Vqtl) related to total variance Alelo Estimativa Allele Estimate BoLA p CA 42 W 20 W 11 0,1 0,2 0,02 1Resultados 2Efeitos G Vp 0,51 0,40 0,85 2,8 2,8 2,8 2Gene 0,3(0,4)3 0,25 (0,3) 0,5(0,65) Vp = 1,64 (SCHUTZ et al., 1994). of resistence to infection by Staphylococcus aureus adapted from SCHUKKEN et al. (1994). substitution effect in phenotypic standard deviation unit A = G . Vp parenthesis values of A was considering Vp = 1.64 (SCHUTZ et al., 1994). 5Values considering Vp= 1.64. 3Between Vqtl4 0,02(0,03)5 0,02(0,03) 0,01(0,02) adaptados de SCHUKKEN et al. (1994) sobre a resistência a infecções por Staphylococcus aureus. da substituição de alelos em unidades de desvio-padrão fenotípico A = G Vp . 3Entre parênteses valores de A considerando-se 4V 2 qtl = 2p (1- p) G /Vp. 5Valores considerando-se Vp = 1,64. 1Results A2 718 MARTINEZ Tabela 2 - Efeitos de baixas heritabilidades e da substituição de alelos sobre o poder de se detectar ligação entre marcador e QTL Table 2 - Touro Sire Effect of low heritabilities and alleles substitution on power to detect linkage between marker and QTL Número Poder (% de detecção) Number Power (% of detection) Filha/touro Heritabilidade Daughter/sire Heritability 0,02 A2 0,04 0,08 0,10 20 25 50 100 0,3 7 11 19 0,4 10 17 33 0,3 7 11 19 0,4 10 17 33 0,3 8 11 19 0,4 10 17 33 0,3 8 11 19 0,4 10 17 33 40 25 50 100 9 14 26 12 23 47 9 14 26 12 23 47 9 14 27 12 24 48 9 14 27 13 24 48 80 25 50 100 10 18 39 16 34 68 10 18 39 16 34 68 10 18 39 16 34 68 10 18 39 16 35 69 100 25 50 100 11 20 44 18 39 75 11 20 44 18 39 75 11 21 45 18 39 76 11 21 45 18 40 76 1 Erro tipo 1 = 0,05; p = 0,1 (q = 0,9). 2 Em unidades de desvio-padrão fenotípico (DPF). 1 Type 1 error = .05; p = .1 (q = .9). 2 In phenotypic standard deviation units (SDU). a 20.000 (40 touros com 400 filhas ou 100 touros com 200 filhas), como se deduz da Tabela 3 para CA42. Na Tabela 3 compara-se o poder de se detectar ligação, quando se considera a possibilidade de utilizar como marcador genes do sistema BoLA, assumindo que o marcador e o QTL estão perfeitamente ligados, ou seja, a taxa da recombinação é igual a zero. Considerando-se as características de cada um dos genes (freqüência e efeito de substituição), como apresentado na Tabela 1, e heritabilidade de 0,04, verifica-se que o marcador W20 é o que apresenta maior poder para todas as estruturas de famílias simuladas. Verifica-se que, quando W20 é usado, são necessários 20 touros com 400 filhas (8.000 no total) para se obter poder de 80%, ao passo que, com o CA42, serão necessários cerca de três vezes mais indivíduos (80 touros com 300 filhas), quando o erro do tipo 1 é de 0,01. Se W11 for utilizado mesmo com 100 touros e 400 filhas por touro, o poder máximo será de 76%. O efeito do erro tipo 1 sobre o poder de se detectar ligação entre marcador e QTL é maior para valores intermediários e praticamente nulo para altos valores do poder (P>90%). Embora o alelo W11 tenha o maior efeito de substituição dentre os genes considerados (Tabela 1), o poder do seu uso é menor, pois a sua freqüência na população é muito baixa (0,02). No caso dos gens CA42 e W20, embora tenham o mesmo efeito de substituição, o gene W20 é duas vezes mais freqüente na população e, conseqüentemente, requer uma estrutura de família menor que a requerida quando se usa o gen CA42. O efeito da freqüência gênica afeta o poder por intermédio da equação (3). Este efeito foi estudado considerando-se dois valores de freqüência gênica (0,1 e 0,5). Na Tabela 4 pode-se observar o grande efeito da freqüência sobre o poder em se detectar ligação entre marcador e QTL, quando a característica tem heritabilidade de 0,1 e o efeito da substituição de alelos é de 0,3 unidades de desvio-padrão. Observa-se que, quando a freqüência gênica é igual a 0,5, são necessários 4.000 indivíduos (40 touros com 100 filhas) para se obter poder de 90%, com erro a de 0,01. Todavia, se a freqüência gênica é de apenas 0,1, mesmo com 10.000 indivíduos (100 touros com 100 filhas), obtém-se apenas poder de 24%. Neste caso, para se obter poder equivalente (90%), seriam necessários 80 touros com 400 filhas, ou seja, oito vezes mais indivíduos deveriam ser analisados genética e fenotipicamente. Caso a taxa de recombinação (r) não seja zero, o poder em se detectar ligação reduz substancialmente. Na Tabela 5 são apresentados os valores do poder para diferentes estruturas de famílias considerandose diferentes taxas de recombinação e erro tipo 1 igual a 0,05. Pode-se observar que, à medida que a taxa de recombinação aumenta, o poder diminui. Por exemplo, um poder de cerca de 90% pode ser obtido com 8.000 indivíduos (20 touros com 400 filhas), se R.Bras.Zootec. 719 Tabela 3 - Poder1 para detectar ligação entre loci de uma característica de baixa heritabilidade (0,04), usando BoLA genes como marcadores genéticos Table 3 - Power1 to detect linkage between loci of a trait of low heritability (.04) using BoLA genes as genetic marker Número Poder (% de detecção) Number Touro Sire Power (% of detection) Filha/touro Erro tipo 1 Daughter/sire Type 1 error 20 100 200 400 CA42 7 20 46 0,01 W20 18 47 80 W11 10 23 33 CA42 19 36 61 0,05 W20 36 66 89 W11 20 31 36 40 100 200 400 11 33 68 32 73 96 14 32 52 26 53 81 54 87 98 27 44 56 80 100 200 400 19 55 90 56 94 99 21 47 71 39 74 96 77 98 99 37 60 77 100 200 400 23 64 95 66 98 99 24 53 76 44 81 98 84 99 99 41 66 83 100 1 Freqüências dos genes CA42, W20 eW11 iguais a 0,1; 0,2; e 0,02; efeitos da substituição de alelos de CA42, W20 e W11 iguais a 0,3, 0,3 e 0,65. Taxa de recombinação igual a zero. 1 Gene frequency for CA42, W20 and W11 equals to .1, .2 and .02; alleles substitution effect of CA42, W20 and W11 equals to .3, .3 and .65. Recombination rate equal to zero. Tabela 4 - Efeito da freqüência (p) do alelo sobre o poder para detectar ligação entre um marcador genético e um QTL, com heritabilidade = 0,1, efeito da substituição de alelos igual a 0,3 unidades de DPF e taxa de recombinação = 0 Table 4 - Effect of allele frequency (p) on power to detect linkage between a genetic marker and a QTL with heritability = .1, allele substitution effect equal to .3 SDU units and recombination rate = 0 Número total Poder (% de detecção) Total number Power (% of detection) Touro Sire Filhas/touro Freqüência do alelo Daughter/sire Allele frequency α1 : 0,01 2 3 7 0,1 0,5 0,05 8 11 19 0,01 8 25 64 0,05 22 47 82 20 25 50 100 40 25 50 100 2 4 11 9 14 27 14 45 90 33 69 97 80 25 50 100 3 6 20 10 18 39 27 76 99 51 90 99 100 25 50 100 3 7 24 11 21 45 33 85 99 58 95 99 1a = erro tipo 1. 1a = type 1 error. 720 MARTINEZ Tabela 5 - Efeito da taxa de recombinação sobre o poder1 para detectar ligação entre um marcador e loci de uma característica com heritabilidade igual a 0,04 Table 5 - Effect of recombination rate on power1 to detect linkage between a marker and loci of a trait with heritability of .04 Número total Poder (% de detecção) Total number Touro Sire Power (% of detection) Filha/touro Daughter/sire 20 40 80 100 1 Taxa de recombinação Recombination rate 25 50 100 200 400 0 11 18 36 66 89 0,1 8 13 23 46 76 0,2 7 9 14 26 51 25 50 100 200 400 13 26 54 87 98 10 17 34 67 93 7 11 18 39 73 25 50 100 200 400 18 39 77 98 99 12 23 51 88 99 8 13 26 58 92 25 50 100 200 400 20 44 84 99 99 13 26 58 93 99 9 15 30 65 99 p = 0,2; A = 0,3 e α = 0,05. houver perfeita ligação (r = 0) entre marcador e QTL. Todavia, se a taxa for igual a 0,1, o poder já diminui para 76% e será de apenas 51% para r = 0,2. Em geral, para se manter o mesmo poder quando r é diferente de zero, é necessário medir 1/(1 - 2r)2 mais animais, pois a taxa de recombinação diminui em (1 - 2r) a diferença média entre os grupos de progênies que recebem diferentes alelos do marcador. Conclusões O poder de detecção de ligação marcador-QTL é praticamente o mesmo quando a característica é de baixa heritabilidade (menor do que 0,1). Considerando-se os dados de SCHUKKEN et al. (1994), o alelo W20 dentre a classe de alelos do sistema BoLA foi a melhor opção em análises de ligação. Freqüências gênicas próximas de 0,5 reduzem substancialmente o número de animais necessários para se detectar ligação. A detecção de ligação, quando marcador e QTL não estão próximos (r≥0,2), só pode ser realizada com sucesso se o número de animais medidos for muito grande. Referências Bibliográficas BOVENHUIS, H., WELLER, J. I. Mapping and analysis for dairy cattle quantitative trait loci by Maximum Likelihood methodology using milk protein genes as genetic markers. Genetics, v. 137, p. 267-280, 1994. FALCONER, D.S. Introduction to quantitative genetics. 2 ed. New York: Longman, 1981. 340p. GELDERMANN, H. Investigations on inheritance of quantitative characters in animals by gene markers. I. Methods. Theor. Appl. Genet., v. 46, p. 319-330, 1975. LEWIN, H. A., WU, M., STEWART, J. A. et al. Association between BoLA and subclinical bovine leukemia virus infection in a herd of Holstein-Friesian cows. Immunogenetics, v. 37, p. 338-343, 1988. MALLARD, B. A., WILKIE, B. N., KENNEDY, B. W. Genetic and other effects on antibody and cell mediated immune response in swine leukocyte antigen (SLA) - defined miniature pigs. Anim. Genet., v. 20, p. 167-173, 1989. NEIMANN-SORENSEN, A., ROBERTSON, A. The associations between blood groups and several production characteristics in three Danish cattle breeds. Acta. Agric. S c a n d., v. 11, p. 163-196, 1961. SCHUKKEN, Y. H., MALLARD, B. A., DEKKERS. J. C. M. et al. Genetic impact on the risk of intra summary infection following Staphylococcus aureus challenge. J. Dairy Sci., v. 77, p. 639-647, 1994. SCHUTZ, M. M., VAN RADEN, P. M., WIGGANS, G. R. Genetic variation in lactation means of somatic cell scores R.Bras.Zootec. for six breeds of dairy cattle. J. Dairy Sci., v. 77, p. 284293, 1994. SOLLER, M., GENEZI, A. The efficiency of experimental designs for the detection of linkage between a marker locus and a locus affecting a quantitative trait in segregating populations. Biometrics, v. 34, p. 47-55, 1978. SOLLER, M. Genetic mapping of the bovine genome using DNAlevel markers with particular attention to loci effecting quantitative traits of economic importance. J. Dairy Sci., v. 73, p. 2628-2646, 1990. STEAR, M. J., MALLARD, B. A., NEWMAN, M. J. et al. The current status of major histocompatibility system definition in cattle, goats, horses, pigs and sheeps. J. Anim. Sci., v.4, p. 32-39, 1989. 721 WELLER, J. I., SOLLER, M., KASHI, Y. Power of daughter and granddaughter designs for determining linkage between marker loci and quantitative trait loci in dairy cattle. J. Dairy Sci., v. 73, p. 2525-2537, 1990. Recebido em: 28/08/97 Aceito em: 17/03/98