Aula 9 –Planejamento e Análise de Experimentos Professores Miguel Antonio Sovierzoski, Dr. [email protected]; Vicente Machado Neto, Dr. [email protected]; Testes não Paramétricos Porque usar um teste não paramétrico Muitos procedimentos exigem que determinadas condições sejam atendidas pela(s) populações sob investigação. Por exemplo, a análise de variância com um fator requer amostras de populações distribuídas normalmente com variâncias iguais. No entanto, existem muitas situações onde estas suposições não são satisfeitas. Consequentemente, procedimentos não paramétricos foram desenvolvidos que requerem poucas ou nenhuma suposição sobre a população sob investigação. Testes não Paramétricos Desvantagens de testes não paramétricos Testes não paramétricos: · São globalmente menos poderosos do que testes correspondentes, projetados para uso em dados provenientes de uma distribuição específica. Assim, você está menos preparado para rejeitar a hipótese nula quando ela é falsa. · Com frequência exigem que você modifique as hipóteses. Por exemplo, muitos teste não paramétricos referentes ao centro de população são testes sobre a mediana ao invés de média. O teste não responde a mesma pergunta como o procedimento paramétrico correspondente. Quando existe uma escolha entre usar um procedimento paramétrico ou não paramétrico e você está razoavelmente certo de que as suposições para o procedimento paramétrico foram satisfeitas, a seguir, use o procedimento paramétrico. Testes de Wilcoxon para 1 amostra Use o intervalo de confiança e procedimentos de teste Wilcoxon para 1 amostra (também chamado de teste de Wilcoxon de 1 amostra de amplitude assinada) para fazer inferências sobre uma mediana da população, com base em dados de uma amostra aleatória. Por exemplo, você pode determinar: · Se os custos de alimentação semanal para famílias de quatro pessoas com orçamentos intermediários é inferior à média nacional de US $92 · Se a média de idade dos cidadãos norte-americanos aumentou nos últimos anos Use o teste de Wilcoxon de 1 amostra quando você é incapaz de assumir a distribuição de uma população a partir da qual a amostra foi criada, mas que pode assumir que a distribuição é simétrica . Isto é uma alternativa não paramétrica para procedimentos de teste Z para uma amostra e teste t para uma amostra . Testes de Wilcoxon para 1 amostra Intervalo de Confiança A mediana da amostra é uma estimativa da mediana desconhecida da população. O intervalo de confiança é uma amplitude de valores prováveis para a mediana da população com base nos dados da amostra. Você pode escolher qualquer nível alfa que for maior que 0% e menor que 100%. O nível a de 0,05 é comumente usado. Testes de Wilcoxon para 1 amostra Exercicio Deseja-se testar se o tempo de ação de um antiácido é igual a 12 minutos. Time 10,9 15,0 11,9 8,8 8,2 14,8 9,2 8,8 16,0 15,2 15,9 9,2 9,2 7,7 8,0 12,5 Testes de Wilcoxon para 1 amostra Intervalo de Confiança Interpretação O intervalo de confiança indica que você pode estar 94,8% confiante que a mediana da população está entre 8,60 e 11,80. Devido a singularidade da estatística de teste de Wilcoxon, você raramente consegue a confiança especificada. Em vez disso, o Minitab oferece o valor mais próximo (confiança alcançada ). Testes de Wilcoxon para 1 amostra Teste da mediana Interpretação Para os dados de antiácido: · Com base na amostra, você quer saber se o antiácido recém desenvolvido alivia a dor em menos de 12 minutos. A hipótese é H0: mediana = 12,00 e H1: mediana<12,00 · As estatísticas Wilcoxon é 53,0 e o valor p associado é 0,227. O valor p é maior que 0,05, neste caso você não pode rejeitar H0 e conclui que o antiácido não alivia a dor significativamente mais rápido que 12 minutos. Teste de Mann-Whitney Intervalo de Confiança Usar o intervalo de confiança e procedimentos de teste de MannWhitney para duas amostras (também chamado de posto de duas amostras ou soma do posto de teste Wilcoxon de duas amostras) para fazer inferências sobre a diferença entre duas medianas de população com base em dados de duas amostras independentes, aleatórias. Por exemplo, você pode determinar se · O tempo de embalagem das duas máquinas de embalagem é o mesmo · O tempo de alívio é o mesmo para dois analgésicos Suposições: · As amostras são criadas aleatoriamente, cujas distribuições têm a mesma forma · As duas amostras aleatórias são independentes O teste de Mann-Whitney é uma alternativa não paramétrica ao teste t para duas amostras com variâncias de amostras combinadas. Teste de Mann-Whitney A diferença entre as medianas da amostra é uma estimativa da diferença correspondente entre as medianas da população desconhecidas. O intervalo de confiança é uma amplitude aleatória de valores possíveis para a diferença nas medianas da população com base nos dados da amostra. Devido à singularidade da estatística do teste de Mann-Whitney para 2 amostras, você raramente poderá alcançar o intervalo de confiança especificado. Em vez disso, o Minitab fornece o valor mais perto. Teste de Mann-Whitney Exemplo Um departamento da rodovia estadual usa duas marcas de tinta para traçar faixas nas estradas. Um funcionário da rodovia quer saber se existe uma diferença entre as duas marcas de tinta. Para avaliar o problema, o funcionário registra o número de meses que as faixas aplicadas com cada marca de tinta duram na rodovia. Brand A 35,6 37,0 34,9 36,0 36,6 36,1 35,8 34,9 38,8 36,5 34,9 Brand B 37,2 39,7 37,2 38,8 37,7 36,4 37,5 40,5 38,2 37,5 Teste de Mann-Whitney Exemplo Interpretação Para os dados de pintura, o intervalo de confiança lhe diz que você pode ter 95,5% de confiança de que a diferença entre as duas medianas da população é maior do que ou igual a –3.000 e menor ou igual a –0,901. Como 0 não está dentro do intervalo de confiança, você pode rejeitar H0 com 95,5% de confiança, e concluir que as duas medianas não são iguais. Teste de Mann-Whitney Exemplo Interpretação Para os dados da tinta: · Com base na sua amostra, você quer saber se o tempo que as faixas de tinta duram na rodovia é o mesmo para as duas marcas. A hipótese é H0: η1 = η2 e H1: η1 não é = η2. · A estatística de Mann-Whitney é 76,5 e o valor-p associado é 0,0019. Como o valor-p é menor do que 0,05, você deve rejeitar H0 e concluir que os tempos da mediana são significativamente diferentes. Teste de Kruskal-Wallis Use o teste de Kruskal-Wallis para fazer inferências sobre a igualdade de medianas para duas ou mais populações com base nos dados de amostras independentes, aleatórias. Ao usar o teste de Kruskal-Wallis você poderia, por exemplo, comparar: · Salários de advogados empregados por corporações em três principais cidades · Quantidades de leite produzidas por gado leiteiro alimentado com quatro dietas diferentes Para usar o teste de Kruskal-Wallis: · As amostras devem ser de populações cujas funções de distribuição têm a mesma forma e suas variâncias são iguais. · As amostras devem ser aleatórias e independentes · Cada amostra deve consistir em cinco ou mais medições Teste de Kruskal-Wallis O teste de Kruskal-Wallis, como o teste de mediana de Mood, é uma alternativa não paramétrica à análise de variância com um fator (para o qual supomos que as populações que estão sendo amostradas também são normalmente distribuídas ). Contudo, o teste de Kruskal-Wallis é mais poderoso do que o teste da mediana de Mood para dados de diversas distribuições, incluindo dados da distribuição normal, mas é menos robusta contra outliers . Teste de Kruskal-Wallis Exemplo – Teste de igualdade de medianas Uma administradora de saúde quer comparar leitos desocupados de três hospitais localizados na mesma cidade. Ela seleciona aleatoriamente 11 dias diferentes dos registros de cada hospital e lista o número de leitos desocupados para cada dia. Use a tabela de estatísticas individuais para avaliar as seguintes propriedades dos seus dados: · N - o número de observações de cada nível do fator. · global - número total de observações. · Mediana - mediana das observações de cada tratamento, que fornece uma estimativa das medianas da população para cada nível. · Atribuir postos Médio - estatística que classifica os níveis de dados e é usada para determinar a estatística de Kruskal-Wallis. Teste de Kruskal-Wallis Exemplo – Teste de igualdade de medianas Uma administradora de saúde quer comparar leitos desocupados de três hospitais localizados na mesma cidade. Ela seleciona aleatoriamente 11 dias diferentes dos registros de cada hospital e lista o número de leitos desocupados para cada dia. Beds 6 37 3 17 11 30 15 16 29 25 5 34 28 41 13 40 31 9 32 39 27 31 13 35 19 4 29 0 7 5 33 17 24 Hospital 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 Teste de Kruskal-Wallis Exemplo – Teste de igualdade de medianas – estatísticas individuais Uma administradora de saúde quer comparar leitos desocupados de três hospitais localizados na mesma cidade. Ela seleciona aleatoriamente 11 dias diferentes dos registros de cada hospital e lista o número de leitos desocupados para cada dia. Teste de Kruskal-Wallis Exemplo – Teste de igualdade de medianas – estatísticas individuais Os resultados das análises de dados de leitos indicam que: · O número da mediana de leitos desocupados é o menor no hospital 1 (16,00) e o maior no hospital 2 (31,00). · Dois hospitais tem postos ocupados entre (14,0 e 13,7) próximo ao posto global (17,0) enquanto o posto do hospital 2 é 23,3, que pode indicar que a taxa de ocupação do hospital 2 é diferente dos outros dois. Teste de Kruskal-Wallis Exemplo – Teste de hipóteses igualdade de medianas Para os dados de leitos, você quer determinar se não existe diferença no número de leitos ocupados em três hospitais. As hipóteses são: · H0: Não existe diferença nas medianas das populações · H1: Existe uma diferença entre pelo menos duas medianas da população Teste de Kruskal-Wallis Exemplo – Teste de hipóteses igualdade de medianas O teste de Kruskal-Wallis fornece duas estatísticas que você pode usar para conduzir um teste de tratamento de efeitos: a estatística de Friedman (S ) e o valor-p (P ). A estatística de Friedman não é muito informativa por si, mas ela é usada para determinar o valor-p. Teste de Kruskal-Wallis Exemplo – Teste de hipóteses igualdade de medianas Se P for menor do que ou igual ao nível alfa predeterminado, um ou mais tratamentos têm efeitos significativos (isto é, dois ou mais medianas de tratamento são diferentes). · Se P for maior do que o nível alfa predeterminado, nenhum dos efeitos do tratamento são significativos (isto é, as medianas de tratamento são todas iguais). Se os resultados do teste de KruskalWallis indicam diferenças significativas do tratamento, você pode examinar as estatísticas individuais para aprender mais sobre as diferenças. Teste de Kruskal-Wallis Exemplo – Teste de hipóteses igualdade de medianas A estatística de Kruskal-Wallis para os dados de leitos é 7,05 e o valor-p é 0,029 (ambos os valores são os mesmos quando eles são ajustados para empates. Como o valor-p é bastante pequeno (menos do que o nível a comum de 0,05), o teste é significativo. Desta forma, você pode concluir que o número de leitos desocupados difere nos três hospitais. Teste de mediana de Mood Use o teste de Mood para a mediana (também chamado de um teste de mediana ou escores de sinal) para fazer inferências sobre a igualdade de medianas para duas ou mais populações, com base em dados de amostras aleatórias, independentes. Por exemplo, usando o teste de Mood para a mediana, você pode comparar: · Quanto tempo leva um ser humano para se recuperar os tipos comuns de virus influenza (Victoria A, Texas, Rússia) · A durabilidade das três marcas de bolas de golfe Teste de mediana de Mood Para usar o teste da Mood para a mediana: · As amostras devem ser de populações cujas funções de distribuição têm a mesma forma e suas variâncias são iguais · As amostras devem ser aleatórias e independentes O teste de Mood para a mediana é uma alternativa não paramétrica para um análise unidirecional de variância (da qual assumimos que as populações que estão sendo amostradas também são normalmente distribuídas ). O teste de Mood para a mediana é robusto contra outliers e erros nos dados e é particularmente apropriado nos estágios preliminares da análise. O teste de Mood para a mediana é mais robusto do que é o teste de Kruskal-Wallis contra outliers, mas é menos poderoso para dados de diversas distribuições, incluindo a normal. Teste de mediana de Mood Exemplo Um grupo ambiental quer determinar se as alterações de temperatura na água do mar, perto de uma usina nuclear terão um efeito significativo sobre a vida animal na região. O grupo divide aleatoriamente 25 amostras de uma certa espécie de peixe em 4 grupos e os coloca em ambientes separados de simulação de oceano, que são idênticos em todos os sentidos, exceto pela temperatura da água. Seis meses depois, eles pesam os peixes. Weight 22 18 22 24 16 18 19 15 21 26 16 25 17 14 28 21 19 24 23 17 18 13 20 21 18 Temp 38 38 38 38 38 38 38 42 42 42 42 42 42 46 46 46 46 46 46 50 50 50 50 50 50 Teste de mediana de Mood Exemplo - Teste de igualdade de medianas O teste de Mood para a mediana fornece duas estatísticas que você pode usar para conduzir um teste da igualdade das medianas da população a estatística Qui-Quadrado e o valor-p (P ). A estatística quiquadrado não é muito informativa por si, mas ela é usada para determinar o valor-p. Este valor informa se o nível das medianas são significativamente diferentes entre si: · Se P é menor ou igual ao nível alfa predeterminado, duas ou mais medianas são significativamente diferentes. · Se P é maior que o nível alfa predeterminado, as medianas não são significativamente diferentes. Se o teste de Mood para a mediana não indicar diferenças significativas, examine as estatísticas individuais e intervalos de confiança para saber mais sobre as diferenças. Teste de mediana de Mood Exemplo - Teste de igualdade de medianas Os dados qui-quadrados para os peixes são de 1,44 e o valor p é de 0,697. Porque o valor-p é muito grande (maior que o comum nível alfa de 0,05), o teste não é significativo. Assim, você não pode concluir que as mudanças na temperatura afetam os pesos dos peixes. Teste de mediana de Mood Exemplo - Teste de Intervalos de Confiança O Minitab apresenta intervalos de confiança de 95% para cada nível do fator. Quando o valor-p na tabela de análise de variância indica uma diferença entre as medianas de nível do fator, você pode usar a tabela de intervalos de confiança individuais para explorar as diferenças: Teste de mediana de Mood Exemplo - Teste de Intervalos de Confiança · O sinal * entre parênteses representa a mediana de amostra para cada nível de fator. · Cada conjunto de parênteses inclui um intervalo de confiança de 95% da mediana da população. Você pode ter 95% de confiança de que a mediana da população para cada grupo está dentro de cada intervalo correspondente. · Se os intervalos para duas medianas não estão sobrepostos, então as medianas da população são diferentes. Teste de mediana de Mood Exemplo - Teste de Intervalos de Confiança Nos resultados do peso dos peixes, os intervalos para todas as medianas se sobrepõem, sugerindo que as medianas de população não diferem entre os grupos. Teste de Friedman Use o teste de Friedman para fazer inferências sobre os efeitos do tratamento em um experimento com blocos aleatórios. Por exemplo, você pode: · Determinar a eficácia dos três tratamentos usando um design de bloco aleatorizado (cada tratamento é aleatoriamente atribuído a cada paciente no experimento). · Compare a popularidade de quatro carros domésticos pequenos em uma cidade (cada paciente é solicitado a classificar os quatro tipos de carros). Teste de Friedman Para usar o teste de Friedman, · As respostas de cada combinação de tratamento de bloco devem ser de populações cujas funções de distribuição têm a mesma forma e variâncias iguais. · Os tratamentos devem ser aleatoriamente atribuídos a unidades experimentais dentro dos blocos · Cada combinação de bloco de tratamento deve ter exatamente uma observação não faltante O teste de Friedman é uma alternativa não paramétrica à análise de variância com dois fatores (para os quais também supomos que a resposta é normalmente distribuída para cada combinação de tratamento de bloco). Os resultados empíricos mostram que a análise é adequada se ambos o números de blocos ou o número de tratamentos no design do bloco aleatorizado exceder 5. Teste de Friedman Exemplo - Teste de Hipóteses Uma empresa de marketing quer comparar a eficácia relativa dos três modos diferentes de publicidade: publicidade por mala direta, jornal e revista. A empresa conduziu um experimento de bloco aleatorizado . Para 14 clientes, a empresa de marketing usou todos os 3 modos durante um período de 1 ano e registrou a resposta da porcentagem do ano para cada tipo de publicidade. Response 7,2 9,4 4,3 11,3 3,3 4,2 5,9 6,2 4,3 10,0 2,2 6,3 10,1 8,2 5,1 6,5 8,7 6,0 12,3 11,1 6,0 12,1 6,3 4,3 15,7 18,3 11,2 19,0 9,2 10,5 8,7 14,3 3,1 18,8 5,7 20,2 Company 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 Advtype direct-mail direct-mail direct-mail direct-mail direct-mail direct-mail direct-mail direct-mail direct-mail direct-mail direct-mail direct-mail magazine magazine magazine magazine magazine magazine magazine magazine magazine magazine magazine magazine newspaper newspaper newspaper newspaper newspaper newspaper newspaper newspaper newspaper newspaper newspaper newspaper Teste de Friedman Exemplo - Teste de Hipóteses Para os dados de publicidade, você quer determinar se não existe diferença nos três modos de publicidade. As hipóteses são: · H0: Não existe diferença nas medianas das populações · H1: Existe uma diferença entre pelo menos duas medianas da população O teste de Friedman fornece duas estatísticas que você pode usar para conduzir um teste de tratamento de efeitos: a estatística de Friedman (S ) e o valor-p (P ). A estatística de Friedman não é muito informativa por si, mas ela é usada para determinar o valor-p. Teste de Friedman Exemplo - Teste de Hipóteses Para os dados de publicidade, você quer determinar se não existe diferença nos três modos de publicidade. As hipóteses são: · H0: Não existe diferença nas medianas das populações · H1: Existe uma diferença entre pelo menos duas medianas da população · Se P for menor do que ou igual ao nível alfa predeterminado, um ou mais tratamentos têm efeitos significativos (isto é, dois ou mais medianas de tratamento são diferentes). · Se P for maior do que o nível alfa predeterminado, nenhum dos efeitos do tratamento são significativos (isto é, todas as medianas de tratamento são iguais). Se os resultados do teste de Friedman indicam efeitos significativos do tratamento, você pode examinar as estatísticas individuais para aprender mais sobre elas. Teste de Friedman Exemplo - Teste de Hipóteses Interpretação A estatística de Friedman para os dados de publicidade é 10,67 e o valor-p é 0,005. Como o valor-p é bem pequeno (menor do que o nível a comum de 0,05), o teste é significativo; desta forma, você conclui que pelo menos um dos três modos de publicidade têm um efeito diferente. Teste de Friedman Exemplo - Teste de Hipóteses Para os dados de publicidade, você quer determinar se não existe diferença nos três modos de publicidade. As hipóteses são: · H0: Não existe diferença nas medianas das populações · H1: Existe uma diferença entre pelo menos duas medianas da população Teste de Friedman Exemplo - Teste de Hipóteses Use a tabela de estatísticas individuais para avaliar as seguintes propriedades dos seus dados: · N - o número de observações de cada tratamento (o número de blocos) · Mediana Est - mediana das observações de cada tratamento, que fornece uma estimativa das medianas da população para cada tratamento · Soma dos postos - Soma dos postos de tratamento, quando tratados dentro de cada bloco, que pode servir como uma medida do tamanho relativo das medianas de tratamento e são usadas no cálculo da estatística de teste · Mediana global - mediana de todas as observações Teste de Friedman Exemplo - Teste de Hipóteses Os resultados da análise de dados de publicidade indicam que: · A resposta da mediana é a menor para publicidade por mala direta (6,10) e a maior para publicidade por jornal (13,30). · As respostas da mediana para mala direta (6,10) e revista (8,15) estão perto da mediana global (9,183), enquanto a resposta da mediana para publicidade por jornal (13,30) é bem diferente ( a maior). A publicidade por jornal pode ser preferível.