Aula 9 –Planejamento e Análise de
Experimentos
Professores
Miguel Antonio Sovierzoski, Dr.
[email protected];
Vicente Machado Neto, Dr.
[email protected];
Testes não Paramétricos
Porque usar um teste não paramétrico
Muitos procedimentos exigem que determinadas condições sejam
atendidas pela(s) populações sob investigação. Por exemplo, a
análise de variância com um fator requer amostras de populações
distribuídas normalmente com variâncias iguais. No entanto, existem
muitas situações onde estas suposições não são satisfeitas.
Consequentemente, procedimentos não paramétricos foram
desenvolvidos que requerem poucas ou nenhuma suposição sobre a
população sob investigação.
Testes não Paramétricos
Desvantagens de testes não paramétricos
Testes não paramétricos:
·
São globalmente menos poderosos do que testes
correspondentes, projetados para uso em dados provenientes de uma
distribuição específica. Assim, você está menos preparado para
rejeitar a hipótese nula quando ela é falsa.
·
Com frequência exigem que você modifique as hipóteses. Por
exemplo, muitos teste não paramétricos referentes ao centro de
população são testes sobre a mediana ao invés de média. O teste não
responde a mesma pergunta como o procedimento paramétrico
correspondente.
Quando existe uma escolha entre usar um procedimento paramétrico
ou não paramétrico e você está razoavelmente certo de que as
suposições para o procedimento paramétrico foram satisfeitas, a
seguir, use o procedimento paramétrico.
Testes de Wilcoxon para 1 amostra
Use o intervalo de confiança e procedimentos de teste Wilcoxon para
1 amostra (também chamado de teste de Wilcoxon de 1 amostra de
amplitude assinada) para fazer inferências sobre uma mediana da
população, com base em dados de uma amostra aleatória.
Por exemplo, você pode determinar:
·
Se os custos de alimentação semanal para famílias de quatro
pessoas com orçamentos intermediários é inferior à média nacional
de US $92
·
Se a média de idade dos cidadãos norte-americanos aumentou
nos últimos anos
Use o teste de Wilcoxon de 1 amostra quando você é incapaz de
assumir a distribuição de uma população a partir da qual a amostra foi
criada, mas que pode assumir que a distribuição é simétrica . Isto é
uma alternativa não paramétrica para procedimentos de teste Z para
uma amostra e teste t para uma amostra .
Testes de Wilcoxon para 1 amostra
Intervalo de Confiança
A mediana da amostra é uma estimativa da mediana desconhecida da
população. O intervalo de confiança é uma amplitude de valores
prováveis para a mediana da população com base nos dados da
amostra. Você pode escolher qualquer nível alfa que for maior que 0%
e menor que 100%. O nível a de 0,05 é comumente usado.
Testes de Wilcoxon para 1 amostra
Exercicio
Deseja-se testar se o tempo de
ação de um antiácido é igual a 12
minutos.
Time
10,9
15,0
11,9
8,8
8,2
14,8
9,2
8,8
16,0
15,2
15,9
9,2
9,2
7,7
8,0
12,5
Testes de Wilcoxon para 1 amostra
Intervalo de Confiança
Interpretação
O intervalo de confiança indica que você pode estar 94,8% confiante
que a mediana da população está entre 8,60 e 11,80. Devido a
singularidade da estatística de teste de Wilcoxon, você raramente
consegue a confiança especificada. Em vez disso, o Minitab oferece o
valor mais próximo (confiança alcançada ).
Testes de Wilcoxon para 1 amostra
Teste da mediana
Interpretação
Para os dados de antiácido:
·
Com base na amostra, você quer saber se o antiácido recém
desenvolvido alivia a dor em menos de 12 minutos. A hipótese é H0:
mediana = 12,00 e H1: mediana<12,00
· As estatísticas Wilcoxon é 53,0 e o valor p associado é 0,227. O
valor p é maior que 0,05, neste caso você não pode rejeitar H0 e
conclui que o antiácido não alivia a dor significativamente mais rápido
que 12 minutos.
Teste de Mann-Whitney
Intervalo de Confiança
Usar o intervalo de confiança e procedimentos de teste de MannWhitney para duas amostras (também chamado de posto de duas
amostras ou soma do posto de teste Wilcoxon de duas amostras) para
fazer inferências sobre a diferença entre duas medianas de população
com base em dados de duas amostras independentes, aleatórias.
Por exemplo, você pode determinar se
·
O tempo de embalagem das duas máquinas de embalagem é o
mesmo
· O tempo de alívio é o mesmo para dois analgésicos
Suposições:
· As amostras são criadas aleatoriamente, cujas distribuições têm a
mesma forma
· As duas amostras aleatórias são independentes
O teste de Mann-Whitney é uma alternativa não paramétrica ao teste t
para duas amostras com variâncias de amostras combinadas.
Teste de Mann-Whitney
A diferença entre as medianas da amostra é uma estimativa da
diferença correspondente entre as medianas da população
desconhecidas. O intervalo de confiança é uma amplitude aleatória de
valores possíveis para a diferença nas medianas da população com
base nos dados da amostra. Devido à singularidade da estatística do
teste de Mann-Whitney para 2 amostras, você raramente poderá
alcançar o intervalo de confiança especificado. Em vez disso, o
Minitab fornece o valor mais perto.
Teste de Mann-Whitney
Exemplo
Um departamento da rodovia estadual usa
duas marcas de tinta para traçar faixas nas
estradas. Um funcionário da rodovia quer
saber se existe uma diferença entre as
duas marcas de tinta. Para avaliar o
problema, o funcionário registra o número
de meses que as faixas aplicadas com
cada marca de tinta duram na rodovia.
Brand A
35,6
37,0
34,9
36,0
36,6
36,1
35,8
34,9
38,8
36,5
34,9
Brand B
37,2
39,7
37,2
38,8
37,7
36,4
37,5
40,5
38,2
37,5
Teste de Mann-Whitney
Exemplo
Interpretação
Para os dados de pintura, o intervalo de confiança lhe diz que você
pode ter 95,5% de confiança de que a diferença entre as duas
medianas da população é maior do que ou igual a –3.000 e menor ou
igual a –0,901. Como 0 não está dentro do intervalo de confiança,
você pode rejeitar H0 com 95,5% de confiança, e concluir que as duas
medianas não são iguais.
Teste de Mann-Whitney
Exemplo
Interpretação
Para os dados da tinta:
·
Com base na sua amostra, você quer saber se o tempo que as
faixas de tinta duram na rodovia é o mesmo para as duas marcas. A
hipótese é H0: η1 = η2 e H1: η1 não é = η2.
·
A estatística de Mann-Whitney é 76,5 e o valor-p associado é
0,0019. Como o valor-p é menor do que 0,05, você deve rejeitar H0 e
concluir que os tempos da mediana são significativamente diferentes.
Teste de Kruskal-Wallis
Use o teste de Kruskal-Wallis para fazer inferências sobre a igualdade
de medianas para duas ou mais populações com base nos dados de
amostras independentes, aleatórias.
Ao usar o teste de Kruskal-Wallis você poderia, por exemplo,
comparar:
·
Salários de advogados empregados por corporações em três
principais cidades
· Quantidades de leite produzidas por gado leiteiro alimentado com
quatro dietas diferentes
Para usar o teste de Kruskal-Wallis:
·
As amostras devem ser de populações cujas funções de
distribuição têm a mesma forma e suas variâncias são iguais.
· As amostras devem ser aleatórias e independentes
· Cada amostra deve consistir em cinco ou mais medições
Teste de Kruskal-Wallis
O teste de Kruskal-Wallis, como o teste de mediana de Mood, é uma
alternativa não paramétrica à análise de variância com um fator (para
o qual supomos que as populações que estão sendo amostradas
também são normalmente distribuídas ).
Contudo, o teste de Kruskal-Wallis é mais poderoso do que o teste da
mediana de Mood para dados de diversas distribuições, incluindo
dados da distribuição normal, mas é menos robusta contra outliers .
Teste de Kruskal-Wallis
Exemplo – Teste de igualdade de medianas
Uma administradora de saúde quer comparar leitos desocupados de
três hospitais localizados na mesma cidade. Ela seleciona
aleatoriamente 11 dias diferentes dos registros de cada hospital e lista
o número de leitos desocupados para cada dia.
Use a tabela de estatísticas individuais para avaliar as seguintes
propriedades dos seus dados:
· N - o número de observações de cada nível do fator.
· global - número total de observações.
·
Mediana - mediana das observações de cada tratamento, que
fornece uma estimativa das medianas da população para cada nível.
· Atribuir postos Médio - estatística que classifica os níveis de dados
e é usada para determinar a estatística de Kruskal-Wallis.
Teste de Kruskal-Wallis
Exemplo – Teste de igualdade de medianas
Uma administradora de saúde quer comparar
leitos
desocupados
de
três
hospitais
localizados na mesma cidade. Ela seleciona
aleatoriamente 11 dias diferentes dos registros
de cada hospital e lista o número de leitos
desocupados para cada dia.
Beds
6
37
3
17
11
30
15
16
29
25
5
34
28
41
13
40
31
9
32
39
27
31
13
35
19
4
29
0
7
5
33
17
24
Hospital
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
Teste de Kruskal-Wallis
Exemplo – Teste de igualdade de medianas – estatísticas
individuais
Uma administradora de saúde quer comparar leitos desocupados de
três hospitais localizados na mesma cidade. Ela seleciona
aleatoriamente 11 dias diferentes dos registros de cada hospital e lista
o número de leitos desocupados para cada dia.
Teste de Kruskal-Wallis
Exemplo – Teste de igualdade de medianas – estatísticas individuais
Os resultados das análises de dados de leitos indicam que:
· O número da mediana de leitos desocupados é o menor no hospital 1
(16,00) e o maior no hospital 2 (31,00).
·
Dois hospitais tem postos ocupados entre (14,0 e 13,7) próximo ao
posto global (17,0) enquanto o posto do hospital 2 é 23,3, que pode
indicar que a taxa de ocupação do hospital 2 é diferente dos outros dois.
Teste de Kruskal-Wallis
Exemplo – Teste de hipóteses igualdade de medianas
Para os dados de leitos, você quer determinar se não existe diferença
no número de leitos ocupados em três hospitais. As hipóteses são:
· H0: Não existe diferença nas medianas das populações
·
H1: Existe uma diferença entre pelo menos duas medianas da
população
Teste de Kruskal-Wallis
Exemplo – Teste de hipóteses igualdade de medianas
O teste de Kruskal-Wallis fornece duas estatísticas que você pode
usar para conduzir um teste de tratamento de efeitos: a estatística de
Friedman (S ) e o valor-p (P ). A estatística de Friedman não é muito
informativa por si, mas ela é usada para determinar o valor-p.
Teste de Kruskal-Wallis
Exemplo – Teste de hipóteses igualdade de medianas
Se P for menor do que ou igual ao
nível alfa predeterminado, um ou mais
tratamentos têm efeitos significativos
(isto é, dois ou mais medianas de
tratamento são diferentes).
· Se P for maior do que o nível alfa
predeterminado, nenhum dos efeitos
do tratamento são significativos (isto é,
as medianas de tratamento são todas
iguais).
Se os resultados do teste de KruskalWallis indicam diferenças significativas
do tratamento, você pode examinar as
estatísticas individuais para aprender
mais sobre as diferenças.
Teste de Kruskal-Wallis
Exemplo – Teste de hipóteses igualdade de medianas
A estatística de Kruskal-Wallis para os dados de leitos é 7,05 e o
valor-p é 0,029 (ambos os valores são os mesmos quando eles
são ajustados para empates. Como o valor-p é bastante pequeno
(menos do que o nível a comum de 0,05), o teste é significativo.
Desta forma, você pode concluir que o número de leitos
desocupados difere nos três hospitais.
Teste de mediana de Mood
Use o teste de Mood para a mediana (também chamado de um teste de
mediana ou escores de sinal) para fazer inferências sobre a igualdade
de medianas para duas ou mais populações, com base em dados de
amostras aleatórias, independentes.
Por exemplo, usando o teste de Mood para a mediana, você pode
comparar:
·
Quanto tempo leva um ser humano para se recuperar os tipos
comuns de virus influenza (Victoria A, Texas, Rússia)
· A durabilidade das três marcas de bolas de golfe
Teste de mediana de Mood
Para usar o teste da Mood para a mediana:
· As amostras devem ser de populações cujas funções de distribuição
têm a mesma forma e suas variâncias são iguais
· As amostras devem ser aleatórias e independentes
O teste de Mood para a mediana é uma alternativa não paramétrica
para um análise unidirecional de variância (da qual assumimos que as
populações que estão sendo amostradas também são normalmente
distribuídas ).
O teste de Mood para a mediana é robusto contra outliers e erros nos
dados e é particularmente apropriado nos estágios preliminares da
análise. O teste de Mood para a mediana é mais robusto do que é o
teste de Kruskal-Wallis contra outliers, mas é menos poderoso para
dados de diversas distribuições, incluindo a normal.
Teste de mediana de Mood
Exemplo
Um grupo ambiental quer determinar se as
alterações de temperatura na água do mar, perto
de uma usina nuclear terão um efeito significativo
sobre a vida animal na região. O grupo divide
aleatoriamente 25 amostras de uma certa espécie
de peixe em 4 grupos e os coloca em ambientes
separados de simulação de oceano, que são
idênticos em todos os sentidos, exceto pela
temperatura da água. Seis meses depois, eles
pesam os peixes.
Weight
22
18
22
24
16
18
19
15
21
26
16
25
17
14
28
21
19
24
23
17
18
13
20
21
18
Temp
38
38
38
38
38
38
38
42
42
42
42
42
42
46
46
46
46
46
46
50
50
50
50
50
50
Teste de mediana de Mood
Exemplo - Teste de igualdade de medianas
O teste de Mood para a mediana fornece duas estatísticas que você
pode usar para conduzir um teste da igualdade das medianas da
população a estatística Qui-Quadrado e o valor-p (P ). A estatística quiquadrado não é muito informativa por si, mas ela é usada para
determinar o valor-p. Este valor informa se o nível das medianas são
significativamente diferentes entre si:
· Se P é menor ou igual ao nível alfa predeterminado, duas ou mais
medianas são significativamente diferentes.
· Se P é maior que o nível alfa predeterminado, as medianas não são
significativamente diferentes.
Se o teste de Mood para a mediana não indicar diferenças significativas,
examine as estatísticas individuais e intervalos de confiança para saber
mais sobre as diferenças.
Teste de mediana de Mood
Exemplo - Teste de igualdade de medianas
Os dados qui-quadrados para os peixes são de 1,44 e o valor p é de
0,697. Porque o valor-p é muito grande (maior que o comum nível alfa
de 0,05), o teste não é significativo. Assim, você não pode concluir que
as mudanças na temperatura afetam os pesos dos peixes.
Teste de mediana de Mood
Exemplo - Teste de Intervalos de Confiança
O Minitab apresenta intervalos de confiança de 95% para cada nível do
fator. Quando o valor-p na tabela de análise de variância indica uma
diferença entre as medianas de nível do fator, você pode usar a tabela
de intervalos de confiança individuais para explorar as diferenças:
Teste de mediana de Mood
Exemplo - Teste de Intervalos de Confiança
·
O sinal * entre parênteses representa a mediana de amostra para
cada nível de fator.
·
Cada conjunto de parênteses inclui um intervalo de confiança de
95% da mediana da população. Você pode ter 95% de confiança de que
a mediana da população para cada grupo está dentro de cada intervalo
correspondente.
· Se os intervalos
para
duas
medianas
não
estão sobrepostos,
então as medianas
da população são
diferentes.
Teste de mediana de Mood
Exemplo - Teste de Intervalos de Confiança
Nos resultados do peso dos peixes, os intervalos para todas as
medianas se sobrepõem, sugerindo que as medianas de população
não diferem entre os grupos.
Teste de Friedman
Use o teste de Friedman para fazer inferências sobre os efeitos do
tratamento em um experimento com blocos aleatórios.
Por exemplo, você pode:
·
Determinar a eficácia dos três tratamentos usando um design de
bloco aleatorizado (cada tratamento é aleatoriamente atribuído a cada
paciente no experimento).
·
Compare a popularidade de quatro carros domésticos pequenos
em uma cidade (cada paciente é solicitado a classificar os quatro tipos
de carros).
Teste de Friedman
Para usar o teste de Friedman,
· As respostas de cada combinação de tratamento de bloco devem
ser de populações cujas funções de distribuição têm a mesma forma e
variâncias iguais.
·
Os tratamentos devem ser aleatoriamente atribuídos a unidades
experimentais dentro dos blocos
·
Cada combinação de bloco de tratamento deve ter exatamente
uma observação não faltante
O teste de Friedman é uma alternativa não paramétrica à análise de
variância com dois fatores (para os quais também supomos que a
resposta é normalmente distribuída para cada combinação de
tratamento de bloco).
Os resultados empíricos mostram que a análise é adequada se ambos
o números de blocos ou o número de tratamentos no design do bloco
aleatorizado exceder 5.
Teste de Friedman
Exemplo - Teste de Hipóteses
Uma empresa de marketing quer
comparar a eficácia relativa dos três
modos diferentes de publicidade:
publicidade por mala direta, jornal e
revista. A empresa conduziu um
experimento de bloco aleatorizado .
Para 14 clientes, a empresa de
marketing usou todos os 3 modos
durante um período de 1 ano e
registrou a resposta da porcentagem
do ano para cada tipo de publicidade.
Response
7,2
9,4
4,3
11,3
3,3
4,2
5,9
6,2
4,3
10,0
2,2
6,3
10,1
8,2
5,1
6,5
8,7
6,0
12,3
11,1
6,0
12,1
6,3
4,3
15,7
18,3
11,2
19,0
9,2
10,5
8,7
14,3
3,1
18,8
5,7
20,2
Company
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
Advtype
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
direct-mail
magazine
magazine
magazine
magazine
magazine
magazine
magazine
magazine
magazine
magazine
magazine
magazine
newspaper
newspaper
newspaper
newspaper
newspaper
newspaper
newspaper
newspaper
newspaper
newspaper
newspaper
newspaper
Teste de Friedman
Exemplo - Teste de Hipóteses
Para os dados de publicidade, você quer determinar se não existe
diferença nos três modos de publicidade. As hipóteses são:
· H0: Não existe diferença nas medianas das populações
·
H1: Existe uma diferença entre pelo menos duas medianas da
população
O teste de Friedman fornece duas estatísticas que você pode usar
para conduzir um teste de tratamento de efeitos: a estatística de
Friedman (S ) e o valor-p (P ). A estatística de Friedman não é muito
informativa por si, mas ela é usada para determinar o valor-p.
Teste de Friedman
Exemplo - Teste de Hipóteses
Para os dados de publicidade, você quer determinar se não existe
diferença nos três modos de publicidade. As hipóteses são:
· H0: Não existe diferença nas medianas das populações
·
H1: Existe uma diferença entre pelo menos duas medianas da
população
· Se P for menor do que ou igual ao nível alfa predeterminado, um
ou mais tratamentos têm efeitos significativos (isto é, dois ou mais
medianas de tratamento são diferentes).
·
Se P for maior do que o nível alfa predeterminado, nenhum dos
efeitos do tratamento são significativos (isto é, todas as medianas de
tratamento são iguais).
Se os resultados do teste de Friedman indicam efeitos significativos
do tratamento, você pode examinar as estatísticas individuais para
aprender mais sobre elas.
Teste de Friedman
Exemplo - Teste de Hipóteses
Interpretação
A estatística de Friedman para os dados de publicidade é 10,67 e o
valor-p é 0,005. Como o valor-p é bem pequeno (menor do que o nível
a comum de 0,05), o teste é significativo; desta forma, você conclui
que pelo menos um dos três modos de publicidade têm um efeito
diferente.
Teste de Friedman
Exemplo - Teste de Hipóteses
Para os dados de publicidade, você quer determinar se não existe
diferença nos três modos de publicidade. As hipóteses são:
· H0: Não existe diferença nas medianas das populações
·
H1: Existe uma diferença entre pelo menos duas medianas da
população
Teste de Friedman
Exemplo - Teste de Hipóteses
Use a tabela de estatísticas individuais para avaliar as seguintes
propriedades dos seus dados:
·
N - o número de observações de cada tratamento (o número de
blocos)
· Mediana Est - mediana das observações de cada tratamento, que
fornece uma estimativa das medianas da população para cada
tratamento
·
Soma dos postos - Soma dos postos de tratamento, quando
tratados dentro de cada bloco, que pode servir como uma medida do
tamanho relativo das medianas de tratamento e são usadas no cálculo
da estatística de teste
· Mediana global - mediana de todas as observações
Teste de Friedman
Exemplo - Teste de Hipóteses
Os resultados da análise de dados de publicidade indicam que:
· A resposta da mediana é a menor para publicidade por mala direta
(6,10) e a maior para publicidade por jornal (13,30).
·
As respostas da
mediana para mala
direta (6,10) e revista
(8,15) estão perto da
mediana
global
(9,183), enquanto a
resposta da mediana
para publicidade por
jornal (13,30) é bem
diferente ( a maior). A
publicidade por jornal
pode ser preferível.
Download

Aula 9 PAE - Testes não Paramétricos