Probabilidade e estatística
Genética Básica
Licenciatura
Victor Martin Quintana Flores
Qual a utilidade de usar probabilidade
e estatística em Genética?
1 Calcular a probabilidade de determinados
fenótipos aparecerem na descendência de
determinados cruzamentos. Ex: agricultura,
diagnósticos humanos.
2 Verificar se as proporções encontradas ou
observadas se ajustam a determinado padrão
teórico, como por exemplo às proporções
mendelianas.
Porém determinar uma probabilidade não é sinônimo de certeza
que aquele fenótipo ou traço previsto terá necessariamente que
aparecer.
Exemplo: sabemos que a probabilidade de ter filhos homens ou
mulheres é de 50%.
Mesmo fazendo cálculos podemos verificar no dia-a-dia que
existem casais normais com 5 ou mais filhos, todos homens ou
mulheres, contradizendo a probabilidade teórica aceita.
Ou seja, mesmo tendo uma probabilidade alta de ter um fenótipo
este não se apresenta e também mesmo tendo uma
probabilidade baixa de aparecer uma doença esta aparece.
1 - Probabilidade
A probabilidade é a chance que
existe de um evento ocorrer
• Exemplo, cara ou coroa ao lançar uma
moeda
P
Número de vezes que o evento estudado ocorrer
=
Total de eventos
1 cara
P (cara)
=
1
=
1 cara + 1 coroa
2
= 0,5 ou 50%
• Na Genética estamos interessados em saber na
probabilidade de um determinado fenótipo ocorrer num
cruzamento
• Se um heterozigoto para tamanho de planta (Aa), sendo o
alelo A (alta) dominante sobre o alelo a(anã), é autocruzado
a proporção genotípica seria 3 altos: 1 anã
P
Número de vezes que o evento estudado ocorrer
=
Total de eventos
P (altas) =
P (anãs) =
3 altas
3
=
3 altas + 1 anã
4
1 anã
1
=
3 altas + 1 anã
= 0,75 ou 75%
= 0,25 ou 25%
4
Porém a acurácia ou exatidão da probabilidade
calculada depende também, em grande
medida, do tamanho do número amostral.
Assim o erro em, por exemplo, 6 eventos ou
descendentes será sempre muito maior que o
erro ou desvio em 1.000 eventos ou
descendentes.
exemplos
1.1 A regra da soma pode ser usada
para predizer a ocorrência de eventos
mutuamente exclusivos
A regra da soma estabelece que a
probabilidade de um ou mais eventos
mutuamente exclusivos ocorrer é igual à
soma das probabilidades individuais de cada
evento.
Exemplo:
DdCc x DdCc
Sendo
DD e Dd = orelhas normais
dd = orelhas caídas
CC e Cc = cauda normal
cc = cauda escamosa
DC
Dc
dC
dc
DC
DDCC
DDCc
DdCC
DdCc
Dc
DDCc
DDcc
DdCc
Ddcc
dC
DdCC
DdCc
ddCC
ddCc
dc
DdCc
dDcc
ddCc
ddcc
9: orelhas normais cauda normal
3: orelhas normais cauda escamosa
3: orelhas caídas cauda normal
1: orelhas caídas cauda escamosa
Qual a probabilidade de um camundongo deste cruzamento ter orelhas normais e
cauda normal OU orelhas caídas e cauda escamosa?
Qual a probabilidade de um camundongo deste cruzamento ter orelhas normais e
cauda normal OU orelhas caídas e cauda escamosa?
9
P camundongos orelhas normais e cauda normal =
16
1
1
9+3+3+1
P=
16
10
1
+
=
16
16
=
9+3+3+1
P camundongos orelhas caídas e cauda escamosa =
9
9
=
16
Portanto 10/16 é a probabilidade de ter um
camundongo com orelhas e cauda normal ou
um camundongo com orelhas caídas e cauda
escamosa
1.2 A regra do produto pode ser
usada para predizer a ocorrência de
eventos independentes
A regra do produto estabelece que a
probabilidade de dois ou mais eventos
independentes ocorrer é igual ao produto
das probabilidades individuais de cada
evento.
exemplo
Pp x Pp
Sendo
PP e Pp pessoas normais
pp pessoas com analgesia
P
PP
Pp
P
p
p
Pp
pp
¾ normais e ¼ com analgesia
Qual a probabilidade de os primeiros 3 filhos deste casal terem analgesia?
1 – calcular a probabilidade esperada para ter analgesia
2 – multiplicar as probabilidades individuais
=
=
¼x¼x¼
¼
= 1/64
= 0,016 ou 1,6%
O cálculo de produto de probabilidade pode ser usado para probabilidades
diferentes, por exemplo:
Qual seria a probabilidade no exemplo anterior de, o primeiro filho ser normal, o
segundo ter analgesia e o terceiro ser normal?
P=
P=
P (normal) x
¾
x
¼
x
P(analgesia)
¾
= 9/64
x
= 0,14
P(normal)
O mesmo cálculo do produto também pode ser usado para calcular a
probabilidade de um determinado genótipo quando trabalhamos com dois ou mais
genes se tivermos algumas informações do genótipos parentais ou paternos.
Exemplo:
Aa bb Cc
x
AA bb Cc
Pergunta: qual é a probabilidade de ocorrer o genótipo AA bb Cc na descendência
desse cruzamento?
1 alternativa:
- fazer um quadro de Punnett, para isso deduzir todos os possíveis genótipos de
gametas de cada individuo do cruzamento e cruzar todos os gametas.
- Contar o número de genótipos pesquisados e dividir pelo número total de
descendentes deste cruzamento.
2 - alternativa
Usar a regra do produto
Aa Bb CC x
Aa bb Cc
Genótipo perguntado: AA bb Cc
AA bb Cc
P(1)
P(x) =
P(2)
P(1) x P(2) x P(3)
P(3)
P(1) = ¼ ou 0,25
P(2) = ½ ou 0,5
P(3) = ½ ou 0,5
P(x) =
¼x½x½ =
0,0625 = 6,25%
1.3 A equação binomial pode ser uisada
para prever a ocorrência de probabilidade
de combinações não ordenadas de eventos
Exemplo: se tomarmos como exemplo o genótipo Bb onde BB e Bb determinam
olhos marrons em humanos e o genótipo bb determina olhos azuis.
Poderíamos perguntar, qual a probabilidade de ocorrer dois filhos de cinco
possíveis terem olhos azuis
n!
x n− x
P=
p q
x! (n − x)!
n!
x n− x
p q
P=
x! (n − x)!
P = probabilidade do fenótipo não ordenando pesquisado ocorrer
n = número total de eventos
X = número de eventos na categoria pesquisada (exemplo: olhos azuis)
p = probabilidade de x
q = probabilidade da outra categoria (exemplo olhos marrons)
Notar que p+q sempre devem dar 1 como probabilidade.
O símbolo ! Denota a operação matemática de fatorial
1. Probabilidade
1.1 A regra da soma pode ser usada para calcular eventos mutuamente
exclusivos
1.2 A regra do produto pode ser usada para calcular a probabilidade de eventos
independentes
1.3 A equação de expansão binomial pode ser usada para predizer a
probabilidade de combinações não ordenadas de eventos.
n!
x n− x
p q
P=
x! (n − x)!
Onde
P = probabilidade
n = número de eventos
x = número de eventos em cada categoria
p = probabilidade pesquisada
q = probabilidade de outras categorias
2. Teste do Chi quadrado (χ22)
O teste do Chi quadrado pode ser suado para validar hipóteses genéticas
2
(
O
−
E
)
χ2 = Σ
E
Onde:
O = dados observados em cada categoria.
E = dados esperados em cada categoria
baseados em hipóteses experimentais
Download

aqui!