Estatística Experimental Distribuição amostral das médias (introdução ao teste de hipótese ) Cap. 5 – Callegari-Jacques, S. M. Bioestatística: Princípios e Aplicações, 2003. Profº: Glauco Vieira de Oliveira AGR/ICET/CUA/UFMT Curva Normal Propriedades ou Características da Curva Normal: Exemplo de uma curva normal de média () zero e desvio padrão () igual a 1. OBSERVAÇÂO: O intervalo exato de x em que 95% da população está compreendida: ± 1,96 σ (Veja a tabela z) Distribuição amostral das médias Exemplo 1) Considerando que a alcalinidade de um rio é de 19,6mg de CaCO3/L por meio de uma pesquisa em literatura, pergunta-se se a média de 16,2 mg (obtida de 16 observações recentes) indica que a alcalinidade no rio modificou? Dados: Parâmetros: - média populacional ( = 19,6 mg) - média amostral ( x = 16,2 mg), n = 16 observações Interpretação da pergunta em termos estatístico é: A diferença obtida (16,2-19,6= -3,4mg) pode ser atribuída a uma diferença real (alcalinidade) ou a um erro aleatório? (já que se trata de uma amostra de 16 dados e não da população de valores possíveis do rio) Desafio. Como é o comportamento aleatório das médias amostrais (distribuição probabilística). ( x e ) Distribuição amostral de médias (DAM) População hipotética x = 10; 20; 30; 40. média desses valores é 25 Vamos fazer retiradas de todas as amostras aleatórias possíveis da seguinte maneira: retirada dois a dois com reposição. Temos o seguinte resultado: f fr 10 1 0,0625 15 2 0,1250 20 3 0,1875 25 4 0,2500 30 3 0,1875 35 2 0,1250 40 1 0,0625 16 1 0,3 0,25 0,2 fr x Se x tiver distribuição normal as médias também apresentarão distribuição normal 0,15 0,1 0,05 0 10 15 20 25 30 m édias am ostrais Todas as médias possíveis, de amostras aleatórias de n = 2 elementos, obtidas de uma população onde x = 10, 20, 30 e 40 35 40 Distribuição amostral de médias (DAM) Característica importante da distribuição amostral de médias (DAM) – Possui centro em (isto é, a média real da população amostrada). A variabilidade é expressa pelo desvio padrão das médias ou erro padrão da média, σ (x), dado por: (x) n Onde n é o tamanho (nº de elementos) da amostra - Por possuir distribuição gaussiana: aproximadamente 68% das médias estão entre - (x) e pontos + (x); aproximadamente 95% estão entre - 2(x) e pontos + 2(x); e aproximadamente 99% estão entre - 3(x) e pontos + 3(x). erro padrão da média e Intervalo de Confiança Significância estatística de um desvio – Obs: Um critério científico para o estabelecimento de uma diferença ou desvio significativo entre dois valores não pode ser uma questão de opinião dependente do sujeito, mas um critério objetivo. – Ex: A média de altura de uma população é 175cm. Supondo que uma pessoa desta população tenha 180 cm, pergunta-se: este desvio é significativo? O critério estatístico para significância de um desvio pressupõe que: a) a distribuição seja gaussiana. b) os valores desviantes sejam uma fração pequena da população e que esta fração seja determinada a priori Ex: Considera-se como não-significativo todos os desvios ao redor da média que represente 95% dos valores da população. (olhar a tabela) Assim: A metade (47,5%) estão a direita da média populacional, ou seja, são maiores que a média, e a outra metade (47,5%) estão a esquerda da média populacional Significância estatística de um desvio – 95% denomina-se a área de não-significancia (C) – Desvios para o estabelecimento de uma diferença significativa (alfa) α =1 – C → se C= 95% ou C= 0,95 então α = 0,05 ou 5% Exercício (decisão sobre a significância de um desvio entre x e ) Dado: x 142,6;n 5 amostra (pesquisa) 129; 15 por revisão de literatura Pergunta-se O desvio da média amostral é devida ao acaso, considerando um nível de 5% de significância? (x) 15 6,7 n 5 1,96 ( x ) 129 1,96(6,7) 115,9 1,96 ( x ) 129 1,96(6,7) 142,1 Resposta: A média 142,6 não esta dentro da região de não rejeição. Assim para o critério escolhido ( α=5%) a média desvia-se significativamente da média populacional ().