APLICAÇÕES COM EXCEL: Distribuição Binomial Considere: p a probabilidade de sucesso; q = 1-p a probabilidade de insucesso(fracasso); A probabilidade do evento acontecer exatamente x vezes, em n tentativas (x sucessos e n-x insucessos) é definida por: n x n x P(x) p q x Função DistrBinom: calcula a Prob.de x sucessos (cumulativo=0) ou a soma acumulada desde x=0 (cumulativo=1) até o valor estipulado. Exemplo 1: A porcentagem de neutrofilos numa amostra de sangue é de 70%. Qual a probabilidade de encontrar 50% de neutrofilos tomando-se 20 leucócitos ao acaso? 20 P(10) (0,7)10 (0,3)10 0,0308 10 Exemplo 2: Uma infecção experimental em camundongos determina morte de 30% dos animais a ela submetidos, 70% sobrevivendo. Qual a probabilidade de obter num lote de 5 animais, uma mortalidade de, no máximo 20%? 5 P(0) (0,3) 0 (0,7) 5 0,16807 0 5 P(1) (0,3)1 (0,7) 4 0,36015 1 p(x 1) = p(0)+p(1) APLICAÇÕES COM EXCEL: Distribuição Poisson Definição Considere X uma variável aleatória com os seguintes valores: 0,1,2,3,...,n. A probabilidade de assumir um valor k é dada pela fórmula de distribuição de probabilidade: P(X k) e k! k Função Poisson: calcula a Prob.de x sucessos (cumulativo=0) ou a soma acumulada desde x=0 (cumulativo=1) até o valor estipulado. Exemplo: Mortes por esclerose múltipla, em uma determinada população. Nº DE ÓBITOS Nº DE CONDADOS 0 18 1 13 2 3 3 ou mais 0 TOTAL 34 Encontrar os valores esperados, admitindo uma distribuição de Poisson. APLICAÇÕES COM EXCEL: Distribuição Normal Características: 1.A área sob a curva normal é igual a 1; 2.Como a distribuição é continua, só faz sentido calcular a Prob.de X assumir valores dentro de intervalos; 3.Como a média é igual à mediana, a Prob. de se obter um valor inferior à média é igual a 0,50; 4.A maior concentração de freqüências ocorre no centro da distrbuição, isto é, em torno da média. Função Dist.norm: calcula a área da curva normal de menos infinito (cumulativo=1) até o valor estipulado (X). APLICAÇÕES COM EXCEL: Distribuição Normal Exemplo 3. Seja a variável X = altura de indivíduos adultos, com distribuição aproximadamente normal, com média m = 1,65 m e desvio padrão = 0,09 m. Ou seja, X N(1,65;0,09). Qual a proporção de indivíduos desta população que mede 1,65 m e 1,80 m? APLICAÇÕES COM EXCEL: Distribuição Normal A curva normal padronizada é dada por: x média z desvio padrão Exemplos: Calcular 1) P(0 z 1,96) 2) P(0 z 2,56) 3) P(1,44 z 1,96) 4) P(-2 z 2) 5) P(-3 z 3) Função Dist.normp: calcula a área da curva normal de menos infinito (cumulativo=1) até o valor estipulado (z). Exemplo 4 1. Seja a variável X = altura de indivíduos adultos, com distribuição aproximadamente normal, com média m = 1,65 m e desvio padrão = 0,09 m. Ou seja, X N(1,65;0,09). Calcular a proporção de indivíduos desta população que mede 1,65 m e 1,80 m, ou seja, entre a média da distribuição e 1,80 m. Para isso transformar o valor x = 1,80 m em um específico valor z, usando a relação. z xm 1,80 1,65 0,15 , 0,09 0,09 1,67. Função Padronizar: calcula o valor de z, ao se digitarem os valores de x, da média e do desvio-padrão. Intervalo de Confiança para a Média Com variância conhecida Conforme mostrado na aula anterior, o intervalo de confiança bilateral de 100 (1- )% para é dado por: X z / 2 n X z / 2 n Função Int.Confiança: calcula o valor do erro de amostragem dado os valores de alfa, desvio-padrão e tamanho da amostra. A Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho n1 da primeira população, com uma variância s12, e outra amostra aleatória de tamanho n2 da segunda população com variância s22 . A estatística (s12 / 12 ) /(s22 / 22 ) indica a relação entre as razões das variâncias amostral e da população. Supondo que as variâncias amostrais sejam oriundas de amostras aleatórias independentes e com as mesmas variâncias populacionais, então: F=s12 /s22. A distribuição teórica que modela essa razão denomina-se Distribuição F Função TesteF: realiza o teste de igualdade de variância dado os valores da amostra1 e da amostra2 e do valor de alfa. No menu Ferramentas, a opção Análise de Dados leva ao Teste F. . Exercício sobre o Teste F Exemplo: Considere as medidas de alturas de alunos e alunas da disciplina RGM 5837. F 1,60 1,65 1,54 1,55 1,59 1,65 1,73 1,71 1,73 M 1,71 1,72 1,92 1,73 1,83 1,80 1,82 1,76 1,75 Considerando-se uma confiança de 95%, pode-se afirmar que as variâncias são iguais? No Menu Ferramentas, a opção Análise de Dados leva ao Teste F:duas amostras para variâncias, que realiza o teste de igualdade de variâncias. Intervalo de Confiança para a Diferença de Médias Considerando iguais as variâncias das populações A variável aleatória X1 é modelada por uma distribuição de Gauss com média 1 e variância 12, isto é, X1~N(1, 12) e a variável X2, também é de Gauss, isto é, X2~N(2, 22) O intervalo de 100 (1-)% de confiança para a diferença (1 - 2 ) entre as médias das duas populações é dado por: X 1 X 2 t / 2, n1 n2 2 s p 1 1 1 2 ( X 1 X 2 ) t / 2, n1 n2 2 s p n1 n2 Com a variância comum, ponderada, dada por: s 2p (n1 1) s12 (n2 1) s22 n1 n2 2 1 1 n1 n2 A Distribuição Qui-quadrado Considere uma população de tamanho n que tem uma distribuição de Gauss com média 0 e variância 1, ou seja, z12, z22, ..., zn2. A distribuição qui-quadrado(2) é definida como a soma dos quadrados dos n valores de zi: 2=z12 + z22 + z32 + ... + zn2 Se continuarmos a retirar as amostras da mesma população, cada uma das n quantidades terá uma distribuição de probabilidade 2 que poderá ser representado por um histograma. Com o número de amostras(n) grande, tem-se a distribuição do quiquadrado com n-1 graus de liberdade. Exemplo com o Excel No menu Colar função, escolher Estatística e a opção INV.QUI ou DIST.QUI. TESTES DE HIPÓTESES Exemplos 1. Suponha que um medicamento P tenha, com relação a uma doença, uma eficiência de curas da ordem de 50%. Admita, ainda, que o laboratório esteja interessado em lançar no mercado um novo medicamento N cuja eficiência, com relação à mesma doença, seja EN, esperada superior a EP. O objetivo é testar a hipótese de que os dois medicamentos têm a mesma eficiência contra a hipótese de que o medicamento N é mais eficiente do que o padrão (P) H0 EN = EP H1 EN EP H0 H1 ou EN = 50% EN 50% Exemplos TESTES DE HIPÓTESES 2. Suponha que um levantamento realizado na população de postos de gasolina do Estado de São Paulo tenha fornecido a média de R$ 1,437. Após, o atentado de 11 de setembro houve um aumento de preço do petróleo no mercado internacional. Temendo as repercussões sobre a inflação doméstica, o governo reduziu os impostos sobre a gasolina. Pela cultura de inflação no Brasil, parece que o preço da gasolina aumentou nos postos do Estado assim, o governo selecionou uma amostra de 36 postos para testar a hipótese de que houve aumento de preços. TESTES DE HIPÓTESES Selecionada a amostra e colhidos os preços, encontrouse média maior que R$ 1,437, a antiga média da população. Há evidência suficiente para concluir que os preços da gasolina aumentaram no Estado de São Paulo? ELEMENTOS DE UM TESTE ESTATÍSTICO • A hipótese nula, H0 • A hipótese alternativa, Ha ou H1 • O teste estatístico • A região de não rejeição Região de não rejeição Região de não rejeição Para testar H0 contra H1, suponha a realização do seguinte experimento: Toma-se uma amostra de indivíduos apresentando as características da doença e casualmente aplica-se os dois medicamentos. Por exemplo, 20 indivíduos, 10 tomam o medicamento P e o restante o N. Ao final do experimento, com os resultados obtidos, o laboratório deverá tomar uma decisão, entre duas possíveis: • aceitar H0, ou seja, o medicamento N tem a mesma eficiência que o P. • rejeitar H0 (aceitar H1), isto é, medicamento N tem eficiência maior que o P. o Ao tomar uma decisão o laboratório estará cometendo algum tipo de erro? a) Suponha que H0 seja realmente verdadeira • se for tomada a primeira decisão (aceitar H0), não se estará cometendo erro • se for tomada a segunda decisão (rejeitar H0 ), comete-se um erro, denominado tipo I que consiste em rejeitar H0 quando H0 é verdadeira, cuja probabilidade de ocorrência é o . b) Suponha que H1 seja realmente verdadeira: se for tomada a primeira decisão (aceitar H0), comete-se um erro, denominado tipo II que consiste em aceitar H0 quando H0 é falsa, cuja probabilidade de ocorrência é . EM RESUMO Verdade H0 H1 Não há erro Erro tipo II = Aceitar H0 (rejeitar H1) quando H0 é falso (H1 é verdadeiro) Decisão H0 H1 Erro tipo I = Rejeitar H0 (aceitar H1) quando H0 é verdadeira (H1 é falso) Não há erro OBSERVAÇÕES a) Os dois erros são igualmente importantes, porém depende do problema; b) Ao reduzir um ocorre aumento no outro ; c) A única maneira de reduzir aumentando o tamanho da amostra; ambos é OBSERVAÇÕES d) Em geral, fixa-se o possível; e o é o menor e) A escolha prévia do valor de , não é um problema estatístico e sim do pesquisador interessado em testar H0 contra H1. Resumo: Funções: 1. DistrBinom 2. Poisson 3. Dist.norm 4. Dist.normp 5. Padronizar 6. Int.Confiança 7. TesteF:duas amostras