NT-238 –
Ecologia de Populações de Plantas
Estrutura genética de populações de plantas
Pedro L. R. de Moraes –
Depto. de Botânica/IB/UNICAMP
MODELOS MATEMÁTICOS
Propostas incluindo n parâmetros para a explicação de certos fenômenos
para se fazer predições
adequação dos modelos
Modelos em geral são muito simples (simplificados).
Não é vantagem trabalhar com modelos muito complexos e sofisticados.
Trabalhar com o essencial.
Modelos Fatuais: Observação, sugestão da natureza.
São simplificados e depois referendados, verificados.
Saber os pontos fracos dos modelos!
Conhecimento das pressuposições para entendê-los.
Modelos Determinísticos x Estocásticos
Determinísticos: populações grandes, não entra problema de amostragem
Estocásticos: populações pequenas, com problemas de amostragem
(incorpora parâmetros responsáveis pelas variações aleatórias devido aos erros!)
População: o conceito na genética não é tão amplo como na estatística
Grupo de indivíduos, da mesma categoria taxonômica, com adaptação
semelhante (do ponto de vista da população, ocupa o mesmo nicho
ecológico, o mesmo hábitat)
Origem comum (genética)- de um mesmo grupo de ancestrais
Há troca de genes entre os indivíduos (ideal)
Populações naturais x populações artificiais
Espécie: pode ser um conjunto de demes (subpopulações)
Espécies florestais: procedências (origem geográfica)
Não é população:
conjunto de variedades de uma espécie domesticada
conjunto de raças
conjunto de clones
conjunto de procedências
variedade A x variedade B = população nova AB
POPULAÇÕES GRANDES, MODELOS DETERMINÍSTICOS
plantas e animais - diplóides (modelo)
1 loco e 1 alelo
Estrutura das populações -_ genes de manifestações fenotípicas ou genes
de eletroforese (a nível bioquímico)
Sem dominância
Genótipos no. de indivíduos Proporção
Freqüência
(Paramétrica)
genotípica
AA
NAA
NAA
D(dominante) = P = PAA
N
NAa
H(heterozigoto) = Q = PAa
Aa
NAa
N
aa
Naa
Naa
R(recessivo) = R = Paa
N
Soma
N
1
Genes existentes na população:
no. de genes
A
a
AA
2NAA
2NAA
0
Aa
2NAa
1NAa
1NAa
aa
2Naa
0
2Naa
Total
2N
Freqüências
alélicas (gênicas)
PA = p = 2NAA + NAa = D + 1 H
2
2N
Pa = q = 2Naa + NAa = R + 1 H
2
2N
p = PA
q = Pa = 1 - p
Não importa se é autógama ou alógama, etc.
D + H + R = 1
p + q = 1
*Panmixia (cruzamento ao acaso, random mating), populações naturais
- plantas hermafroditas, monóicas. * máximo de heterozigosidade
1 2 3 4 5 6 7 8 . . . N
1
2
3
4
5
6
7
8
.
.
.
igual probabilidade
N
P(1x 3) =
1
N
2
P(3x8) =
1
N2
F ig u r a . M a p a d a á r e a d e e s tu d o d o P .E . C a r lo s B o te lh o , S . M ig u e l A rc a n jo , S P , c o m
lo c a liz a ç ã o d a s á rv o r e s a m o s tr a d a s d e C r y p to c a r y a m o s c h a ta N e e s . F o n te : M O R A E S e t a l.
( 2 0 0 4 ).
Reprodução sexuada (combina os gametas)
Cruzamentos são ao acaso (random mating) (CAA) -- exclui autofecundação
AA D
AA
D
*D2
Aa
H
DH
aa
R
DR
D
Aa H
DH
H2
HR
H
aa R
DR
D
HR
H
R2
R
R
1
* probabilidades; freqüências dos cruzamentos
Na descendência:
AA D1 = D2 + 1DH + 1DH + 1H2 = = D2 + DH + 1H2
2
2
4
4
= (D + 1H)2 = p2
2
-- união aleatória dos genes.
aa R1 = R2 + 1HR + 1HR + 1H2 = (R + 1H)2 = q2
2
2
4
2
Aa H1 = 2(D + 1H)(R + 1H) = 2pq
2
2
AA
0
D
1
D1=p2
2
D2=p2
Aa
H
H1=2pq
aa
R
R1=q2
A
p
a
q
Geração
...
t
Dt=p2
H2=2pq
Ht=2pq
R2=q2
Rt=q2
p
p
p
q
q
q
p2 + ½(2pq) = p2 + pq = p2 + p(1 - p) = p
A variabilidade permanece a mesma. Ausência de evolução, ausência de melhoramento
EQUILÍBRIO DE HARDY-WEINBERG –
só pressupõe cruzamento ao acaso, ou genes neutros
Bibliografia básica (selecionar capítulos)
LI, C.C. Population genetics.
FALCONER, D.S. Quantitative genetics.
CROW, J.F. & KIMURA, M. An introduction to population genetics theory.
METTLER, L.E., GREGG, T.G. Population genetics and evolution.
(p + q)2 para se testar equilíbrio não é tão simples
AA
0
0,25
seleção
0'
0,25
D' - 0,333
1 C.A.A.(após seleção)
(p')2 0,445
Aa
0,50
0,50
H' - 0,667
2p'q' 0,444
aa
0,25
1
0,0
0,75
R' - 0,000
1
(q')2 0,111
*
p
0,50
p' = 0,667
q
0,50
q' = 0,333
Não está em equilíbrio (EHW) -- constância das freqüências genotípicas e gênicas
Tem que se estudar 2 gerações.(ver se mudou, para provar EHW)
ex: seleção
AA
0
D = 0,25
Pais
seleção
0'
0,25
D'= 0,333
1
D1 = 0,445
Filhos
2
D2 = 0,445
Aa
H = 0,50
0,50
H'= 0,667
H1 = 0,444
H2 = 0,444
aa
R = 0,25
0,00
0,75
R'= 0,000
1
R1 = 0,111
1
R2 = 0,111
1
p
0,5
0,667
q
0,5
0,333
p2 = 0,667
q2 = 0,333
equilíbrio em 1 geração.
Equilíbrio de HW (p2, 2pq, q2) é atingido após uma geração de cruzamento ao acaso (gene
por gene)
Propriedades de populações originadas de cruzamentos ao acaso (C.A.A.)
(p + q)2 = p2, 2pq, q2
H = 2p(1 - p)
é máximo quando p = 0,5
H ≤ D + R
H
2pq
=
=2
2
2
(D + R )0,5 p + q 0,5
(
)
se acima, mais heterozigotos que devia, se menos, menos heterozigotos
Dados de tese, dendê (1991).
AA
35
D̂ = 0,3763
Aa
40
Ĥ = 0,4301
aa
18
93
R̂ = 0,1935
0,9999
H
2pq
0,430
=
=
= 1,509 ≅ 1,51
(D + R )0,5 p 2 + q 2 0,5 (0,376 + 0,193)0,5
(
)
Puv
p12
B1B1
B2B1
B1B2
2p1p2
B3B1
B1B3
2p1p3
p22
B2B2
B3B2
proporções de Hardy-Weinberg
B2B3
2p2p3
p32
B3B3
(p1 + p2 + p3)2
large population
1,3
P13
P11. P 33
2 p1 p 3
p12 p 32
=2
A1A1
1/3
A1A2
1/3
A2A2
1/3
*
1
3 =1
1 1
x
3 3
nuv
p̂uv
A1A1
20
1/3
1/4
15
A1A2
20
1/3
2/4
30
A2A2
20
1/3
1/4
15
60
puv (Hw)
1(não é panmítica)
n esp (nv)
valor amostral
p uv = nuv
* ~
n
~
p u = 2nuu + Σnuv
2n
v#u
~
p 1 = 2n11 + n12 + n13 = n11 + 1/2 (n12 + n13) = ~
p 11 + 1/2 ( ~
p
2n
n
n
n
freqüência de alelo (gênica)
~
p1 = ~
p 11 + 1/2 ( ~
p 12 + ~
p 13)
12
qualquer população diplóide
~
p 1 = 1/3 + 1/2(1/3) = 1/3 + 1/6 = ½
~
p 2 = 1/2
* não é equilíbrio de Hardy-Weinberg, mas pode estar em equilíbrio.
p
+ ~
13)
SANTOS, MÁRCIO MIRANDA (CENARGEN) Dr. FMRP-USP, 1991. Dendê.
11
ACPA
35
MDHA
21
PGD
76
SKDH
6
PG2
26
PGMA
46
PGMB
67
EST
31
12
40
35
12
24
39
38
23
42
22
18
93
31
87
5
93
65
95
27
92
7
91
7
97
24
97
Enzima
no (observado)
ACPA
AA
35
Aa
40
aa
18
p = 70 + 40 = 0,591
186
ne (EHW)
p̂2 .93 = 32,5
2 p̂q̂ .93 = 45,0
q̂2 .93 = 15,6
q = 0,409
t = 1, aceitamos o equilíbrio
(no - ne)2
ne
0,192
0,556
0,369
χ2 = 1,117 (ns)
Tabela (1 GL) {5% 3,84
{1% 6,67
Teste da hipótese: χ2
Estimativa de t:
40
2pq(2 t )
= 0,430 =
Ho =
(1 + t )
93
H e = 2p̂q̂ = 0,483
2pq(2t )
0,430
2t
(
1 + t)
=
=
= 0,890 ⇒ t̂ = 0,802
0,483
2p̂q̂
1+ t
ŝ = 1 − t̂ = 0,198
11
MDHA
21 17,07
χ2
0,905
PGD
76 72,346
χ2
0,184
SKDH
6 3,39
χ2
2,009
12
35 42,93
1,465
12 19,358
2,796
24 29,123
0,9011
22
31 26,99
87 86,99
0,596
2,966
5 1,295 10,60
93 92,998 13,58
65 62,483
95 94.996
0,1013
3,0114
p̂ =(42 + 35)= 0,443
174
q̂ = 0,557
(152 + 12)= 0,882
186
0,118
Ho = 0,402
He = 0,493
t = 0,687
s = 0,312
Ho
He
t
s
=
=
=
=
0,1290
0,2081
0,449
0,551
(12 + 24)= 0,189
190
0,811
Ho
He
t
s
=
=
=
=
0,2526
0,30665
0,7002
0,2998
PG2
PGMA
PGMB
EST
χ2
χ2
χ2
χ2
11 26 22,45 0,561 46 46,42 0,004 67 63,52 0,191 31 27,87 0,352
12 39 45,94 1,048 38 37,14 0,020 23 29,94 1,607 42 48,24 0,807
22 27 23,50 0,521 7 7,43 0,025 7 3,53 3,418 24 20,87 0,468
92 91,89 2,130 91 90,98 0,049 97 96,99 5,216 97 96,98 1,627
p̂ =0,494
0,7142
0,8092
0,5360
q̂ =0,505
0,2857
0,1907
0,4639
Ho= 0,4239
He= 0,4993
t= 0,7374
s= 0,2625
0,4175
0,4080
1,047
0,047
0,237
0,3086
0,6232
0,3767
0,4329
0,4973
0,7706
0,2293
Calculando t médio:
11
Σno
308
Σne
253,410
χ2
11,760
12
253
362,181
32,913
22
184
745
129,410
745,001
23,028
67,701** não está em equilíbrio de HW
f(AA) = 0,340
f(Aa) = 0,486
f(aa) = 0,174
f(A) = (616 + 253)/ 1490 = 0,583
f(a) = (253 + 368)/ 1490 = 0,417
He = 362,181
t médio = 0,537
Ho = 253,000
t médio = 53,674%
Ho = 0,341
He = 0,401
Ho = 1 - f = 0,150
He
_
t = 1 - f = t = 0,74
1+f
Conclusão: Dendê é parcialmente alógama com t̂ = 0,74 e ŝ = 0,26
Genótipos e genes (plantas diplóides)
locos com qualquer no. de alelos
Co-dominância
Notação de WEIR, B.S. Genetic Data Analysis II(1996)
Loco B
(freqüência genotípicas de BuBv)
Puv
Amostra (nuv)*
Freqüência alélica (gênica)
(3 alelos)
B1B1
P11
n11
B1B2
P12
n12
B1B3
P13
n13
B2B2
P22
n22
B2B3
P23
n23
B3B3
P33
n33
1
n
n uv
~
=
p
* Valor amostral: uv
n
Bu pu = puu + 1/2 Σ Puv
v#u
p1 = p11 + 1/2 (p12 + p13)
2n uu
~
=
+ ∑ n uv
pu
2n v ≠u
Medidas de Variabilidade Genética
→ Riqueza
→ Equitabilidade em distribuição de freqüência
População com 3 cores de flores é mais diversa do que a com 2 cores de
flores
População com 2 cores de flores igualmente freqüentes é mais diversa do
que outra com 3 cores de flores ocorrendo sob freqüências desiguais
(0,90, 0,05, 0,05, p.ex.)
Medidas de Variabilidade Genética
A = número médio de alelos por loco
¼ média aritmética do número de alelos de cada loco, em cada
população, para cada loco, fazendo-se a média aritmética entre locos
Ae = número efetivo de alelos
Ae =
1
∑ pi2
¼ onde pi é igual à freqüência alélica do loco i, calculando-se, em
seguida, a média aritmética para todos os locos
P = proporção de locos polimórficos por população
¼ obtida pela divisão do número de locos polimórficos pelo número
total de locos analisados.
Critério 95% | Um loco é considerado polimórfico quando a
freqüência do alelo mais comum não ultrapassa a 0,95
Coeficiente de Diversidade gênica (H)
(Nei, 1973)
é a probabilidade (H) de que dois gametas aleatoriamente escolhidos da população ou
amostra diferirão no loco gênico
→ heterozigosidade esperada sob panmixia
↓
depende da equitabilidade das freqüências alélicas
↓
m
$ = 1 − ∑ x$ 2
H
i
i
x$ i = a freqüência populacional do i-ésimo alelo de um loco (m = número de alelos)
= 1 – var(xi) – 1/A
↓
A diversidade gênica é alta quando o número de alelos (A) é grande, mas é ainda maior
quando há equitabilidade, ou a variância das freqüências alélicas é baixa
Ho → heterozigosidade média observada
→ obtida pela média aritmética das proporções do número total de
heterozigotos em relação ao número total de indivíduos entre os locos
analisados
He → heterozigosidade esperada não viesada
$ =
H
e
2 n(1 − ∑ x$ 2i )
(2 n − 1)
n = número de indivíduos amostrados
fazendo-se a média aritmética entre os locos estudados
Índice de Fixação
$
$I = 1 − H o
F
$
H
e
$ −H
$
H
e
o
F$ ( IS) =
$
H
e
Teste de significância de F em relação às proporções de HardyWeinberg, através da estatística χ2
χ = N F$ 2 ( k − 1)
2
kk
com (
− 1)
2
graus de liberdade, onde: k = número de alelos e N = tamanho da amostra
Tabela: Índices de diversidade de oito populações naturais de C ryptocarya m oschata N ees
& M artius ex N ees procedentes do Estado de São Paulo, obtidos a partir da análise
de vinte locos isoenzim áticos em 35 fam ílias de progênies (PEC B-P), 214
indivíduos adultos e 60 indivíduos juvenis.
População
Tamanho
médio da
amostra/locos
PECB-P
676,2
(13,9)♦
PECB-A
141,0
(0,0)
2,0
(0,1)
1,62
(0,15)
85,0
0,330
(0,045)
0,336
(0,042)
0,018 ns
PECB-D1†
20,0
(0,0)
1,7
(0,2)
1,37
(0,16)
55,0
0,182
(0,062)
0,199
(0,051)
0,085 ns
PECB-D2†
20,0
(0,0)
1,7
(0,2)
1,40
(0,15)
55,0
0,260
(0,065)
0,226
(0,051)
-0,150 ns
PECB-D3†
20,0
(0,0)
1,6
(0,2)
1,39
(0,16)
50,0
0,223
(0,063)
0,209
(0,053)
-0,067 ns
PEI, NS
36,0
(0,0)
2,0
(0,1)
1,55
(0,14)
80,0
0,325
(0,055)
0,310
(0,045)
-0,048 ns
PESM, NP
9,9
(0,0)
1,9
(0,1)
1,46
(0,14)
75,0
0,268
(0,063)
0,269
(0,050)
0,004 ns
PESM, NSV
26,5
(0,3)
2,0
(0,1)
1,52
(0,15)
80,0
0,310
(0,051)
0,297
(0,045)
-0,044 ns
Heterozigosidade
Número Porcentagem
Número
de locos
efetivo
médio de
média
alelos/locos de alelos polimórficos contagem esperado
>
direta
(HW)=
2,0
1,57
75,0
0,211
0,313
(0,1)
(0,14)
(0,046)
(0,045)
> um lo co é co nsid erad o p o lim ó rfico se a freq üência d o alelo m ais co m um não exced er 0 ,9 5
= estim ativa não viesad a d e N E I (1 9 7 8 ); †ind ivíd uo s juvenis; ♦ erro s p ad rõ es em p arênteses
** P < 0 ,0 1 ; ns - não significativo . F o nte: M O R A E S (1 9 9 7 ).
Índice de
Fixação
( F$ (IS))
0,326**
Desvios da Panmixia
Equilíbrio com endogamia (sem panmixia)
Exemplo:
A1A1
A1A2
A2A2
p1 = 1/2
p2 = 1/2
Puv
1/3
1/3
1/3
1
Puv (EHW)
Geração 0
1/4 + 1/12
2/4 - 2/12
1/4 + 1/12 (é o que irá estabelecer o s)
1
cruzamento (t) (exogamia) - medida de panmixia
autofertilização (s) = 1-t (endogamia, selfing)
100 s ____ 8 autofecundação
100 (1-s) ____ x
taxa natural de autofertilização
t = 1/2
s = 1/2
polinização aberta (open pollinated) macho A1 1/2, A2 1/2
1/2 8
fêmea
1/2 x
A1A1
A1A1 A1A1 A1A1 A1A1
GERAÇÃO 1 (filial)
Puv
A1A1 A1A1 A1A2 A1A2 A1A1
8
1/3
A1 1/2
A1A2
A1A1 A1A2 A2A1 A2A2
A1A1 A1A2 A2A1 A2A2
A1A2
8
1/3
A2 1/2
A2A2
A2A2 A2A2 A2A2 A2A2
A1A2 A1A2 A2A2 A2A2
12
12
(está em equilíbrio)
usa 4 para equilibrar, mínimo múltiplo comum
A2A2
8
24
1/3
1
(paramétrico: sem amostragem)
Dois alelos
B1
p1 = p
p2 = q
p1 = p
p1 + p2 = 1
B1B1
puv
p2 + pqf
B1B2
2pq (1 - f) = 2pq - 2pqf
B2B2
q2 + pqf
1
B2
p2 = q = 1 - p
q = 1 - p
(p + q)2
(1 - f) - taxa de redução de panmixia (heterozigose)
f = índice de fixação (só homozigotos)
coeficiente de endogamia (mais restritivo) (inbreeding coefficient)
f = Fis
f=0
p2
2pq
q2
f=f
p2 + pqf
f=1
p
2pq(1 - f)
0
q2 + pqf
q
-1 ≤ f ≤ 1
não é probabilidade
f = negativo = só heterozigotos (clones, p. ex.)
(3 - 1) - (1) - (1) = 0 (não dá para avaliar) (graus de liberdade)
2 parâmetros : p e f para população com 2 alelos
3 alelos (múltiplos)
6 CLASSES
GENOTÍPICAS
puv
B1B1
p11 + p1(1 - p1)f
B1B2
1 loco com 3 alelos
p1 *
p2 *
p3 = 1- p1 - p2 (não é parâmetro)
2p1p2 (1 - f)
f *
B1B3
2p1p3 (1 - f)
* 3 parâmetros
B2B2
p22 + p2(1 - p2)f
B2B3
2p2p3 (1 - f)
B3B3
p33 + p3(1 - p3)f
1
avaliação do modelo: observados x esperados
6 classes genotípicas
6
graus de liberdade
6 - 1
5 - 2 (p1p2)
3 - 1 (f) = 2
no
n11
ne
n'11
n12
n'12
n13
n'13
n22
n'22
n23
n'23
n33
n
n'33
n
χ2: 2GL alelismo múltiplo é importante para verificação de funcionamento
do modelo.
B1B1
no
ne
20 (p2 + pqf)n
B1B2
20 (2pq(1 - f)n
B2B2
20 (q2 + pqf)n
60
*
20 = 1 = 2pq(1 - f) 1/3 = 2(1/2)(1/2)(1-f)
60 3
1 - f = 2/3
f = 1/3
p = 1/2
q = 1/2
f = 1/3
*
( 1/4 + 1/4.1/3)60 = 20
(2/12.1/2(1 - 1/3)60 = 20
(1/4 + 1/4.1/3)60 = 20
χ2 = Σ (no - ne)2 = 0
ne
(c/ 2 alelos)
SANTOS, M. M. 1990. TESE DOUTORADO (UMRP-USP).
Dendê:
genótipos
11
IDH
10
PGI
26
12
12
24
13
15
15
22
13
9
23
21
10
33
26
8
97
(194)
estimar freqüências genotípicas e alélicas
92 (no. de plantas)
(184)
testar validade das proporções de Hardy-Weinberg
testar validade de modelo que inclui o índice de fixação.
Heterozigosidade: quantidade de heterozigotos que a população tem.
WEIR : H = Σ Puv
u#v
1 população
1 loco por vez
~
Ex.: H IDH = 0,124 + 0,155 + 0,216 = 0,495
~
H PGI = 0,261 + 0,163 + 0,109 = 0,533
∴ varia com as freqüências alélicas (depende de como se reproduz)
Hmáximo = A - 1
A
H = 1 - Σ Puu
u
2
3
A = no. de alelos (limite)
facilidade computacional
Ho (observado)
Diversidade gênica __ em função das freqüências alélicas (se em panmixia)
D = h = Σ 2pupv = 1 - Σ pu2 = He (esperado)
\freqüência esperada
~
pu
nuv
0,5
p1 = 0,5 p2 = 0,3
p3 = 0,2
A1A1
p11
0
p11= 0,25 p22= 0,09 p33= 0,04
A1A2
2p1p2
Σpu2 = 0,38
A1A3
2p1p3
0
A2A2
p22
0,3
1 - 0,38 = 0,62
0
A2A3
2p1p3
p33
0,2
A3A3
Equilíbrio de Endogamia Neutro de Wright (EENW)
VENCOVSKY, R. Variance of an estimate of outcrossing rate. Revista Brasileira de Genética,
v. 17, n. 3, p. 349-351, 1994.
cálculo das freqüências genotípicas esperadas (cruzamento aleatório mais
autofecundação), com a freqüência de homozigotos (AuAu) e de heterozigotos (AuAv)
sendo obtidas por:
P uu =
2
pu
+ p u (1 − p u) F
, v≠u
P uv = 2 p u p v (1 − F )
assumindo o mesmo índice de fixação F (F = FIS) para todos os heterozigotos
Tabela 14: Teste qui-quadrado (χ2) dos desvios do Equilíbrio de Endogamia Neutro de
Wright de adultos e progênies de Cryptocarya moschata Nees & Martius ex
Nees. Graus de liberdade entre parênteses.
LOCO
GENÓTI
ADULTOS
LOCO
GENÓTI
PROGÊNIES
PO
PO
no
ne
no
ne
GOT-1
1-1
0
1,35
GOT-1
1-1
453
453,56
(PEI-NS)
1-2
3
4,45
(PECB)
1-2
37
35,91
1-3
5
0,82
1-3
152
151,71
2-2
24
21,98
2-2
6
5,89
2-3
3
5,58
2-3
6
7,67
3-3
1
1,80
3-3
38
37,26
( )
2
24,692 (2) **
0,415 (2) ns
χ
PRX-4
1-1
76
71,82
(PECB)
1-2
32
31,48
1-3
9
17,61
2-2
7
10,12
2-3
11
5,20
3-3
6
4,51
Fonte: MORAES (1997)
2
12,377 (2)**
χ
** P<0,01; ns - não significativo.
Locos que rejeitam a hipótese nula de EENW B endogamia promovida por outros
fatores adicionais ao sistema reprodutivo B cruzamentos não aleatórios ou biparentais
Estatísticas F de Wright (WRIGHT, 1951, 1965)
caracterização da distribuição da variabilidade genética:
entre as populações (FST)
níveis médios de endogamia ao nível populacional (FIS)
e ao nível específico (FIT).
1 − F$IT = (1 − F$IS )(1 − F$ST )
Assume-se implicitamente um número infinitamente grande de
subpopulações
Na prática, este número é usualmente muito pequeno
relação entre a teoria de Wright e os dados reais não é muito clara
Pressupõe a neutralidade dos alelos
F$IT
$
H
= 1 − ot
$
H
et
$
H
ot
∑ ∑ x$ il
= 1−
ls
F$IS
$
H
ei
$
=
1
−
F ST
$
H
$
H
= 1 − ot
$
H
et
ei
$ = 1−
H
ei
∑ ∑ ∑
ls
x$ i2l k
2
$
⎡ ( ∑ ∑ x il k ) ⎤
⎢
⎥
s
⎢
⎥⎦
⎣
$
H et = 1 −
l
H$ et =
heterozigosidade esperada total (todas as populações)
H$ ot =
heterozigosidade observada total
H$ ei =
heterozigosidade esperada média entre as populações
x$ il = freqüência de heterozigotos do loco l na população i
x$ il k = freqüência do alelo k do loco l na população i
s = número de populações
l = número de locos
LI & HORVITZ (1953)
2
χ = N F$ 2 ( k − 1)
kk
com (
− 1)
2
graus de liberdade, onde: k = número de alelos e N = tamanho da amostra.
(WORKMAN & NISWANDER, 1970)
χ2 = 2 N T F ST ( k − 1) , com (k - 1)(r - 1) graus de liberdade,
onde
NT = tamanho de amostragem (número total de indivíduos)
k = número de alelos
r = número de subpopulações
Tabela 16: Estimativas de FIS, FIT e FST de oito populações naturais de Cryptocarya moschata
Nees & Martius ex Nees, avaliação a partir de 35 famílias de progênies do PECB,
indivíduos adultos e juvenis, baseadas em dezoito locos isoenzimáticos.
Populações
F$ IS
F$ IT
F$ ST
Progênies (35) 1
-0,074 ns
0,335**
0,380**
2
Adultos (4)
-0,038 ns
0,073 ns
0,107**
Juvenis (3)
-0,075 ns
0,016 ns
0,084**
Região Sul x Região Norte (2)
0,025 ns
0,073 ns
0,049**
PECB-A x PEI-NS
-0,022 ns
0,073 ns
0,093**
PESM-NP x PESM-NSV
-0,057 ns
-0,004 ns
0,050 ns
1 F$ IS ≈ F$ PS; F$ IT ≈ F$ PT ; F$ ST ≈ F$ ST
’
( ) número de “grupos” na comparação
** significativo a 1% pelo teste χ2; ns - não significativo
2
Fonte: MORAES (1997)
1,2
GOT-1
F médio e Intervalo de Confiança
1
0,8
CAT-2
PRX-1
ALP-3
0,6
PRX-3
ALP-1
CAT-3 CAT-4
0,4
0,2
PRX-4 PRX-5 Média
GOT-2
ACP-3
ALP-4
CAT-1
PPO-5
PRX-2
ALP-5
0
PPO-4
-0,2
-0,4
-0,6
-0,8
Locos Isoenzimáticos
Figura 2. Média das estimativas de F por locos isoenzimáticos, a partir de quatro populações naturais
de Cryptocarya moschata Nees. Intervalos de confiança obtidos por reamostragem numérica do tipo
jackknife sobre as amostras; para a média, reamostragem numérica do tipo bootstrap sobre os locos.
Fonte: MORAES et al. (1999).
1,2
GOT-1
p médio e Intervalo de Confiança
1
0,8
CAT-2
0,6
ALP-3
0,4
ACP-3
ALP-1
CAT-1
Média
PPO-4
ALP-4
0,2
CAT-3
ALP-5
PRX-1
CAT-4
GOT-2
PPO-5
PRX-5
PRX-2
PRX-3
PRX-4
0
-0,2
Locos Isoenzimáticos
Figura 3. Média das estimativas de θP por locos isoenzimáticos, a partir de quatro populações naturais de
Cryptocarya moschata Nees. Intervalos de confiança obtidos por reamostragem numérica do tipo jackknife
sobre as amostras; para a média, reamostragem numérica do tipo bootstrap sobre os locos.
Fonte: MORAES et al. (1999).
1
PRX-1
0,8
PRX-3
f médio e Intervalo de Confiança
0,6
ALP-3
CAT-3
0,4
CAT-4
CAT-2
ALP-1
PRX-4
GOT-2
PRX-5
0,2
0
PRX-2
ALP-5
ACP-3
ALP-4
Média
PPO-5
GOT-1
CAT-1
-0,2
PPO-4
-0,4
-0,6
-0,8
Locos Isoenzimáticos
Figura 4. Média das estimativas de f por locos isoenzimáticos, a partir de quatro populações naturais de
Cryptocarya moschata Nees. Intervalos de confiança obtidos por reamostragem numérica do tipo jackknife
sobre as amostras; para a média, reamostragem numérica do tipo bootstrap sobre os locos.
Fonte: MORAES et al. (1999).
Diversidade gênica em populações subdivididas de Nei
(NEI, 1973, 1977, 1987)
distribuição da heterozigosidade ou diversidade gênica total (HT)
entre (DST) e dentro (HS) das subpopulações
2)
$
−
n
(
x
2
1
∑
i i
$ =
H
S
2n − 1
;
2 +H
$
1
−
x
∑
i
S
i
$ =
H
T
2 ns
n = número de indivíduos amostrados
s = número de subpopulações
x 2i = média ponderada da freqüência do alelo i nas subpopulações
∑i x$ 2i =
média do somatório da freqüência alélica quadrada entre as
subpopulações
sendo:
$ =H
$ +D
$
H
T
S
ST
Coeficiente de diferenciação gênica (G$ ST)
proporção da diversidade gênica devido ao componente entre populações
D$ ST
$
G ST =
H$ T
diferenciação gênica absoluta ( D$ m)
s$
$ = DST
Dm s − 1
,
com s = número de subpopulações.
diversidade gênica interpopulacional relativa à diversidade gênica
intrapopulacional
$
Dm
$
=
RST $
HS
Tabela 19: Estimativas de HT, HS, DST, GST, D m e RST de oito populações naturais de
Cryptocarya moschata Nees & Martius ex Nees, avaliação a partir de famílias
de progênies, de indivíduos adultos e juvenis, agrupados de diferentes modos.
$
$ ST
$ ST
$T
$S
$ ST
Populações
D
H
H
R
D
G
m
Progênies1 (35) 2
0,314 0,189 (0,046)3 0,124 (0,056) 0,397**
Adultos (4)
0,332 0,297 (0,044) 0,035 (0,019) 0,107**
Juvenis (3)
0,225 0,206 (0,050) 0,019 (0,017) 0,084**
4
0,338 0,322 (0,043) 0,017 (0,017) 0,049**
Região 1 x Região 2 (2)
PECB-AxPEI-NS
0,353 0,321 (0,043) 0,033 (0,026) 0,093**
PESM-NPxPESM-NSV 0,287 0,273 (0,046) 0,014 (0,009) 0,049 ns
1
$ ≈ $ ’; R$ ≈ R$ ’
$T ≈ H
$ T ’; H
$S≈ H
$ S ’; D
$ ST ≈ G
$ ST ’; D
$ ST ≈ D
$ ST ’; G
H
Dm
ST
ST
m
2
( ) número de “grupos” na comparação
3
( ) erros padrões
4
Região 1 = PECB-A + PEI-NS; Região 2 = PESM-NP + PESM-NSV
** significativo a 1% pelo teste χ2; ns - não significativo
Fonte: MORAES (1997)
0,128
0,047
0,028
0,033
0,066
0,028
0,677
0,159
0,138
0,103
0,205
0,104
Deriva genética : populações pequenas :
mudanças nas freqüências alélicas
população-base - infinita (panmixia)
B1B1
B1B2
B2B2
1/4
2/4
1/4
geração 0
p = 1/2
Amostragem de 2 plantas
1/16
geração 0 B1B1, B1B1
P1
1
4/16
6/16
B1B1, B1B2
B1B1, B2B2
B1B2, B1B2
3/4
g
e B1B1
1
9/16
r
a
ç B1B2
0
6/16
ã
o
B2B2
0
1/16
1
sub-divisão de população -
4/16
B1B2, B2B2
1/16
B2B2, B2B2
Média*
2/4
1/4
0
p 1 = E(p1)
= 1/2 = p
1/4
1/16
0
0,3125
> 0,25
2/4
6/16
0
0,3750
< 0,50
1/4
9/16
1
0,3125
> 0,25
Efeito de Wahlund
Amostragem estatística x amostragem genética
(geração ou criação de subpopulações)
* média (esperança matemática - médias
populacionais) (ponderada)
Ex: B1B1 : 1 x 1/16 + 9/16 x 4/16 + 1/4 x 6/16 + 1/16 x 4/16 + 0 = 0,3125
deriva : conseqüência - aumento da homozigose, redução do
polimorfismo (heterozigose)
B1B1
Puv
0,3125
=
0,25 + 0,0625
B1B2
0,3750
=
0,50 - 0,1250
B2B2
0,3125
=
0,25 + 0,0625
1
σ2 = 1/16(1 - 1/2)2 + 4/16(3/4 - 1/2)2 + 6/16(1/2 - 1/2)2 +
p1 4/16(1/4 - 1/2)2 + 1/16(0 - 1/2)2 = 0,0625 -- Lei de Wahlund
B1B1
p2 + σ2
p1
B1B2
2pq - 2σ2
p1
B2B2
q2 + σ2
p1
B1B1
p2 + σ2 = p2 + p(1-p)F
p1
(F;f - conseqüência de deriva)
σ2 = p(1 - p)F
p1
(WRIGHT) Fst = σp1 = Gst (NEI)
p(1 - p)
(Distância genética)
Ex: por subdivisão de população
Pop.
p1
1
0,1
2
0,3
3
0,8
no.
n
n
n
p̂ 1 = 0,525
σp1= 0,1491
4
0,9
n
p̂ 1(1 - p̂ 1) = 0,525(1 - 0,525) = 0,2494
Gst = 0,1491 = 0,598
0,2494
os parâmetros podem ser estimados de várias maneiras (estimadores).
por deriva apenas:
σp12 = p(1 - p)
2N
1 - p = q ; N = no. de fundadores
no. efetivo, ou tamanho
= 1/2(1 - 1/2)= 1/4 = 1/16 = 0,0625
2x2
4
N = Ne = 2 (genitores)
Fst =
σp12 =
p(1-p)
B1B1, B1B2
.
.
.
B2B2, B2B2
p(1-p)
2N
= 1 = 1/4 só por deriva
p(1-p)
2N
σp12 é a variância entre as interpopulações.
Deriva ao longo do tempo:
Se o N é pequeno, mais rápida é a fixação!!!
.
t
Sub A1A1
σpt2 =
p(1 -p)
acaba heterozigosidade
Sub A2A2
Gst = Fst = 0,01 _____
p
1-p
σp2 (Depende de Ne e de tempo (geração))
0,01 = 1 ∴ N = 50 (em uma geração)
2N
Equilíbrio entre Mutação e Deriva genética
populações com recente redução de seu tamanho efetivo populacional
†
correlacionada redução do número de alelos e da diversidade gênica (He,
ou heterozigosidade esperada pelas proporções de EHW) nos locos
polimórficos
†
o número de alelos é reduzido mais rapidamente do que a
heterozigosidade (He)
†
He se torna maior do que a heterozigosidade esperada sob Equilíbrio
entre Mutação e Deriva (Heq)
†
Heq é calculada a partir do número de alelos (e do tamanho amostral)
heterozigosidade (He) e heterozigosidade esperada de equilíbrio (Heq)
†
heterozigosidade senso diversidade gênica de Nei (1987)
proporção de heterozigotos observada (Ho)
Teste não para um excesso de heterozigotos (H o> He)
Æ
Teste para um excesso de heterozigosidade (He > Heq)
j
excesso de diversidade gênica
demonstrado apenas para locos que evoluem sob o Modelo de Mutação
de Infinitos Alelos
Tabela 2: Testes estatísticos não-paramétricos gerados pelo programa BOTTLENECK 1.2.02 (Piry et al. 1999), para a determinação se populações de Cryptocarya
aschersoniana Mez exibem número significativo de locos com excesso de heterozigosidade, sob os modelos de Mutação de Infinitos Alelos (MIA) e de “Passos de
Mutação” (PM).
Teste do Sinal
Teste de Diferenças
Teste de
Padronizadas
Wilcoxon*
MIA
PM
MIA
PM
MIA
PM
População
N* Déficit Excesso
P*
N
Déficit Excesso
P
T2
P
T2
P
P
P
13,38
8
21
0,0037
14,79
10
19
0,0828
3,43 0,0003
1,83 0,0338
0,0015
0,0459
SP
14,20
11
20
0,0275
16,25
14
17
0,4652
3,46 0,0002
1,38 0,0842
0,0007
0,0626
SG
16,97
10
26
0,0019
18,85
14
22
0,1873
3,77 0,0000
1,63 0,0512
0,0002
0,0036
MM
12,99
9
18
0,0383
13,99
12
15
0,4229
2,61 0,0045
0,48 0,3161
0,0107
0,2423
I
13,98
5
25
0,0000
16,07
5
25
0,0006
4,59 0,0000
2,67 0,0038
0,0000
0,0087
MA
15,67
1
33
0,0000
17,44
2
32
0,0000
7,38
0,0000
5,51
0,0000
0,0000
0,0000
BR
15,28
7
27
0,0000
17,60
8
26
0,0026
5,98 0,0000
3,94 0,0000
0,0000
0,0002
FC
14,00
4
26
0,0000
15,85
6
24
0,0018
5,95 0,0000
3,96 0,0000
0,0000
0,0001
SSP
14,21
2
30
0,0000
16,09
6
26
0,0003
5,73 0,0000
3,97 0,0000
0,0000
0,0000
BA
14,58
5
25
0,0000
15,71
7
23
0,0053
4,68 0,0000
3,14 0,0008
0,0000
0,0046
SJ
15,73
2
31
0,0000
17,63
3
30
0,0000
6,16 0,0000
4,17 0,0000
0,0000
0,0000
BI
13,10
5
23
0,0001
15,30
5
23
0,0022
4,90 0,0000
3,38 0,0003
0,0000
0,0010
BJ
* teste unicaudal para excesso de heterozigosidade
N* número esperado de locos com excesso de heterozigosidade sob o modelo, seguido pelos respectivos números de locos com déficit e excesso de
heterozigosidade
P* probabilidade
verificação das leis básicas de herança Mendeliana
¾
Marcador genético
(população segregante)
Referências
COCKERHAM, C. C. Variance of gene frequencies. Evolution, v. 23, p. 72-84, 1969.
COCKERHAM, C. C. Analyses of gene frequencies. Genetics, v. 74, p. 679-700, 1973.
CROW, J. F., KIMURA, M. Introduction to population genetics theory. New York: Harper & Row, 1970. 591p.
FRANKEL, O. H., BROWN, A. H. D., BURDON, J. J. The conservation of plant biodiversity. Cambridge: Cambridge University Press,
1995. 299p.
HARTL, D. L., CLARK, A. G. Principles of population genetics. 2nd. ed. Sunderland: Sinauer Associates, 1989. 682p.
LOVELESS, M. D., HAMRICK, J. L. Ecological determinants of genetic structure in plant populations. Annual Review of Ecology and
Systematics, v. 15, p. 65-95, 1984.
MORAES, P.L.R. Estrutura genética de populações de Cryptocarya moschata Nees & Martius ex Nees (Lauraceae). Tese de doutorado,
Universidade Estadual Paulista “Júlio de Mesquita Filho”, Rio Claro. 1997. 197p.
MORAES, P.L.R., MONTEIRO, R., VENCOVSKY, R. Conservação genética de populações de Cryptocarya moschata Nees (Lauraceae) na
Mata Atlântica do estado de São Paulo. Revista Brasileira de Botânica, v. 22, p. 237-248, 1999.
NEI, M. Analysis of gene diversity in subdivided populations. Proceedings of the National Academy of Sciences of the United States of
America, v. 70, n. 12, p. 3321-3323, 1973.
NEI, M. Molecular evolutionary genetics. New York: Columbia University Press, 1987. 512p.
VENCOVSKY, R. Análise de variância de freqüências alélicas. Revista Brasileira de Genética, v. 15, n.1, Suplemento 1, p.53-60, 1992.
VENCOVSKY, R. Variance of an estimate of outcrossing rate. Revista Brasileira de Genética, v. 17, n. 3, p. 349-351, 1994.
WEIR, B. S. Genetic data analysis II: methods for discrete population genetic data. Sunderland: Sinauer Associates, 1996. 445p.
WRIGHT, S. The genetical structure of populations. Annals of Eugenics, v. 15, p. 323-354, 1951.
WRIGHT, S. The interpretation of population structure by F-statistics with special regard to systems of mating. Evolution, v. 19, n. 3, p.
395-420, 1965.
WRIGHT, S. Evolution and the genetics of populations. V.2. The theory of gene frequencies. Chicago: The University of Chicago Press,
1969. 511p.
WRIGHT, S. Evolution and the genetics of populations. V.4. Variability within and among populations. Chicago: The University of
Chicago Press, 1978. 580p.
Download

1,3 - Unicamp