Distribuição de probabilidade Uma variável pode tomar qualquer valor dentro de um conjunto de valores com uma determinada probabilidade Uma distribuição de probabilidades mostra a probabilidade de todos os valores possíveis de uma variável Distribuição normal - Completamente descrita por dois parâmetros (, ) - Em forma de sino - Simétrica para a média (média = mediana) Se o desvio padrão diminui a curva compacta-se mais a volta da média Teorema do limite central Amostra 1 – X1 Amostra 2 – X2 Amostra 3 – X3 . . . Teorema do limite central – média da população – desvio padrão da população X – média da amostra s – desvio padrão da amostra (EP) -1.96 EP +1.96 EP Distribuição das médias de amostras feitas numa população Teorema do limite central Qualquer que seja a distribuição de uma variável se se fizerem várias amostras com o mesmo tamanho, a distribuição das médias destas amostras tende para uma distribuição normal com média igual á média da população e com desvio padrão igual ao da população a dividir pela raiz quadrada do tamanho das amostras. Intervalo de confiança - média – média da população – desvio padrão da população X – média da amostra s – desvio da padrão amostra Intervalo de confiança - média E se não soubermos o desvio padrão da população ()? Se o tamanho da amostra (n) é pequeno? Nestes casos a distribuição das médias amostrais segue uma distribuição t e o raciocínio que fizemos antes aplica-se novamente mas desta vez com a distribuição t: IC 95% para a média: ± t0,05 EP Exemplo Queremos estimar a média de idades das mulheres no dia do nascimento do seu primeiro filho. Em uma amostra de 49 mulheres: X = 27 anos s = 5 anos = ? (queremos) =? Como = ? usamos a distribuição t para calcular o intervalo de confiança a 95% (27 - t0,05 5/49 , 27 - t0,05 5/49 ) = (25.5 ; 28.5) Intervalo de confiança - proporção Estamos interessados na proporção de indivíduos de uma população que têm determinada característica. Se tiramos uma amostra de tamanho n a proporção é estimada pelo nº de indivíduos com a característica na amostra a dividir por n. Se tirarmos repetidas amostras de tamanho n da população e fizermos a distribuição das estimativas das proporções das amostras, essa distribuição aproxima-se da distribuição normal cuja média é a verdadeira proporção na população e o desvio padrão p (1-p)/n Intervalo de confiança Intervalo de confiança a 95% para uma proporção p: EP= p (1-p)/n (p - 1.96 EP ; p + 1.96 EP) Quando o tamanho da amostra é pequeno [np ou n(1-p) <5] distribuição das estimativas das proporções das amostras segue uma distribuição Binomial, o restante raciocínio é semelhante. Exemplo De entre 64 mulheres grávidas incluídas num estudo 27 (42%) estiveram mais de 6 meses a tentar engravidar sem sucesso. p=0.42 EP=0.42 (1-0.42)/64 = 0.06 IC 95% = (0.42 - 1.96 x 0.06 ; 0.42 - 1.96 x 0.06 ) Testes de Hipótese Queremos saber se uma determinada moeda é equilibrada Definimos a Hipótese de que a moeda é equilibrada. Usámos uma amostra de 100 lançamentos Suponhamos que o resultado dos lançamentos foi 48 coroas e 52 caras. Será este resultado suficientemente forte para rejeitarmos a Hipótese Nula? Ou seja, será que este resultado é compatível com a hipótese da moeda ser equilibrada? A probabilidade de obter 48 ou menos coroas em 100 lançamentos, com uma moeda equilibrada, é de aproximadamente 38%. 0.38 é demasiado elevado para rejeitar a hipótese, isto é, a probabilidade de obter 48 ou menos coroas em 100 lançamentos com uma moeda equilibrada é alta (38%). Assim não devemos rejeitar a Hipótese de que a moeda é equilibrada Testes de Hipótese Queremos saber se uma determinada moeda é equilibrada Definimos a Hipótese de que a moeda é equilibrada. Usámos uma amostra de 100 lançamentos Suponhamos que o resultado dos lançamentos foi 30 coroas e 70 caras. Será este resultado suficientemente forte para rejeitarmos a Hipótese Nula? Ou seja, será que este resultado é compatível com a hipótese da moeda ser equilibrada? A probabilidade de obter 30 ou menos coroas em 100 lançamentos, com uma moeda equilibrada, é de aproximadamente 0.2%. 0.2% é demasiado baixo para rejeitar a hipótese, isto é, a probabilidade de obter 30 ou menos coroas em 100 lançamentos com uma moeda equilibrada é baixa (0.2%). Assim devemos rejeitar a Hipótese de que a moeda é equilibrada Testes de Hipótese Definimos a Hipótese H0 = hipótese nula – sem efeito H1 = hipótese alternativa Obtemos a estatística do teste com os dados de uma amostra Obtemos o valor de p – probabilidade de obter o resultado que obtivemos ou mais extremo, sendo H0 verdadeira. Definimos o nível se significancia – usualmente 0.05 Interpretamos o valor de p – se p<0.05 temos evidência suficiente para rejeitar H0 se p>0.05 não temos evidência suficiente para rejeitar H0 Erros H0 verdadeira H0 falsa Rejeitar H0 Aceitar H0 Erro Tipo I () Sem Erro Erro Tipo II () Sem Erro Poder do teste = 1- = Probabilidade de rejeitar H0 quando ela é falsa