Probabilidade e estatística Genética Básica Licenciatura Victor Martin Quintana Flores Qual a utilidade de usar probabilidade e estatística em Genética? 1 Calcular a probabilidade de determinados fenótipos aparecerem na descendência de determinados cruzamentos. Ex: agricultura, diagnósticos humanos. 2 Verificar se as proporções encontradas ou observadas se ajustam a determinado padrão teórico, como por exemplo às proporções mendelianas. Porém determinar uma probabilidade não é sinônimo de certeza que aquele fenótipo ou traço previsto terá necessariamente que aparecer. Exemplo: sabemos que a probabilidade de ter filhos homens ou mulheres é de 50%. Mesmo fazendo cálculos podemos verificar no dia-a-dia que existem casais normais com 5 ou mais filhos, todos homens ou mulheres, contradizendo a probabilidade teórica aceita. Ou seja, mesmo tendo uma probabilidade alta de ter um fenótipo este não se apresenta e também mesmo tendo uma probabilidade baixa de aparecer uma doença esta aparece. 1 - Probabilidade A probabilidade é a chance que existe de um evento ocorrer • Exemplo, cara ou coroa ao lançar uma moeda P Número de vezes que o evento estudado ocorrer = Total de eventos 1 cara P (cara) = 1 = 1 cara + 1 coroa 2 = 0,5 ou 50% • Na Genética estamos interessados em saber na probabilidade de um determinado fenótipo ocorrer num cruzamento • Se um heterozigoto para tamanho de planta (Aa), sendo o alelo A (alta) dominante sobre o alelo a(anã), é autocruzado a proporção genotípica seria 3 altos: 1 anã P Número de vezes que o evento estudado ocorrer = Total de eventos P (altas) = P (anãs) = 3 altas 3 = 3 altas + 1 anã 4 1 anã 1 = 3 altas + 1 anã = 0,75 ou 75% = 0,25 ou 25% 4 Porém a acurácia ou exatidão da probabilidade calculada depende também, em grande medida, do tamanho do número amostral. Assim o erro em, por exemplo, 6 eventos ou descendentes será sempre muito maior que o erro ou desvio em 1.000 eventos ou descendentes. exemplos 1.1 A regra da soma pode ser usada para predizer a ocorrência de eventos mutuamente exclusivos A regra da soma estabelece que a probabilidade de um ou mais eventos mutuamente exclusivos ocorrer é igual à soma das probabilidades individuais de cada evento. Exemplo: DdCc x DdCc Sendo DD e Dd = orelhas normais dd = orelhas caídas CC e Cc = cauda normal cc = cauda escamosa DC Dc dC dc DC DDCC DDCc DdCC DdCc Dc DDCc DDcc DdCc Ddcc dC DdCC DdCc ddCC ddCc dc DdCc dDcc ddCc ddcc 9: orelhas normais cauda normal 3: orelhas normais cauda escamosa 3: orelhas caídas cauda normal 1: orelhas caídas cauda escamosa Qual a probabilidade de um camundongo deste cruzamento ter orelhas normais e cauda normal OU orelhas caídas e cauda escamosa? Qual a probabilidade de um camundongo deste cruzamento ter orelhas normais e cauda normal OU orelhas caídas e cauda escamosa? 9 P camundongos orelhas normais e cauda normal = 16 1 1 9+3+3+1 P= 16 10 1 + = 16 16 = 9+3+3+1 P camundongos orelhas caídas e cauda escamosa = 9 9 = 16 Portanto 10/16 é a probabilidade de ter um camundongo com orelhas e cauda normal ou um camundongo com orelhas caídas e cauda escamosa 1.2 A regra do produto pode ser usada para predizer a ocorrência de eventos independentes A regra do produto estabelece que a probabilidade de dois ou mais eventos independentes ocorrer é igual ao produto das probabilidades individuais de cada evento. exemplo Pp x Pp Sendo PP e Pp pessoas normais pp pessoas com analgesia P PP Pp P p p Pp pp ¾ normais e ¼ com analgesia Qual a probabilidade de os primeiros 3 filhos deste casal terem analgesia? 1 – calcular a probabilidade esperada para ter analgesia 2 – multiplicar as probabilidades individuais = = ¼x¼x¼ ¼ = 1/64 = 0,016 ou 1,6% O cálculo de produto de probabilidade pode ser usado para probabilidades diferentes, por exemplo: Qual seria a probabilidade no exemplo anterior de, o primeiro filho ser normal, o segundo ter analgesia e o terceiro ser normal? P= P= P (normal) x ¾ x ¼ x P(analgesia) ¾ = 9/64 x = 0,14 P(normal) O mesmo cálculo do produto também pode ser usado para calcular a probabilidade de um determinado genótipo quando trabalhamos com dois ou mais genes se tivermos algumas informações do genótipos parentais ou paternos. Exemplo: Aa bb Cc x AA bb Cc Pergunta: qual é a probabilidade de ocorrer o genótipo AA bb Cc na descendência desse cruzamento? 1 alternativa: - fazer um quadro de Punnett, para isso deduzir todos os possíveis genótipos de gametas de cada individuo do cruzamento e cruzar todos os gametas. - Contar o número de genótipos pesquisados e dividir pelo número total de descendentes deste cruzamento. 2 - alternativa Usar a regra do produto Aa Bb CC x Aa bb Cc Genótipo perguntado: AA bb Cc AA bb Cc P(1) P(x) = P(2) P(1) x P(2) x P(3) P(3) P(1) = ¼ ou 0,25 P(2) = ½ ou 0,5 P(3) = ½ ou 0,5 P(x) = ¼x½x½ = 0,0625 = 6,25% 1.3 A equação binomial pode ser uisada para prever a ocorrência de probabilidade de combinações não ordenadas de eventos Exemplo: se tomarmos como exemplo o genótipo Bb onde BB e Bb determinam olhos marrons em humanos e o genótipo bb determina olhos azuis. Poderíamos perguntar, qual a probabilidade de ocorrer dois filhos de cinco possíveis terem olhos azuis n! x n− x P= p q x! (n − x)! n! x n− x p q P= x! (n − x)! P = probabilidade do fenótipo não ordenando pesquisado ocorrer n = número total de eventos X = número de eventos na categoria pesquisada (exemplo: olhos azuis) p = probabilidade de x q = probabilidade da outra categoria (exemplo olhos marrons) Notar que p+q sempre devem dar 1 como probabilidade. O símbolo ! Denota a operação matemática de fatorial 1. Probabilidade 1.1 A regra da soma pode ser usada para calcular eventos mutuamente exclusivos 1.2 A regra do produto pode ser usada para calcular a probabilidade de eventos independentes 1.3 A equação de expansão binomial pode ser usada para predizer a probabilidade de combinações não ordenadas de eventos. n! x n− x p q P= x! (n − x)! Onde P = probabilidade n = número de eventos x = número de eventos em cada categoria p = probabilidade pesquisada q = probabilidade de outras categorias 2. Teste do Chi quadrado (χ22) O teste do Chi quadrado pode ser suado para validar hipóteses genéticas 2 ( O − E ) χ2 = Σ E Onde: O = dados observados em cada categoria. E = dados esperados em cada categoria baseados em hipóteses experimentais