Dr Hermano Alexandre
Doutorando em Saúde Coletiva
Mestre em Saúde Pública
Especialista em auditoria de sistemas de saúde
Faculdade de Medicina
Universidade Federal do Ceará
Significância estatística
Intervalos de confiança
Inferência estatística
Tópicos
Testes de hipótese
Teste t de student
Teste F
Teste chi quadrado
Intervalos de confiança
Inferência estatística
Teste de hipótese
Visa testar qual a probabilidade de que um
determinado resultado encontrado em uma
determinada amostra seja somente devido
ao acaso.
O que é hipótese?
Em inglês, hypothesis
Em alemão, Hypothese
Em latim, hypothesis
...
Vem de: base(hipo) de uma
proposição(thesis).
O que é hipótese?
100 Obesos
População
Amo
stra
100 Não
obesos
O que é hipótese?
Obesos –
120, 113, 167, 100, 98, 76, 129, ...
Média - 122
37 Pré diabéticos
Não obesos –
98, 90, 100, 73, 200, 103, 78, ...
Média – 98
13 Pré diabéticos
Por que testar a hipótese
O acaso (erro tipo I)
Hipóteses
de um Teste
Ho - Hipótese Nula
H1 - Hipótese Alternativa
Hipóteses
de um Teste
Ho - Hipótese Nula - hipótese que será suposta
inicialmente como verdadeira.
É, basicamente, a negação do que o pesquisador
deseja provar.
Hipóteses
de um Teste
H1 - Hipótese Alternativa - hipótese que será aceita,
se os dados mostrarem evidências suficientes para a
rejeição da hipótese nula.
Geralmente, é a própria hipótese da pesquisa.
Exemplo
Ho: Em média, as vendas não aumentam
com a introdução da propaganda.
H1: Em média, as vendas aumentam com a
introdução da propaganda.
Ho: Em média, o IAM não diminui com uso de
aspirina.
H1: Em média, o IAM diminui com o uso de aspirina.
Exemplo
Suspeita-se que uma moeda, utilizada em jogo de azar,
seja viciada, isto é, que a probabilidade de sair “cara”
seja diferente de 50%.
Hipóteses
Ho: p = 0,5 (a probabilidade é 50%)
H1: p = 0,5 (a probabilidade não é 50%)
p - probabilidade
de cara.
Amostra
Para se tomar a decisão de se aceitar, ou
não, que a moeda seja honesta, tomou-se
uma amostra com 10 lançamentos e
observou-se o número de caras.
(variável X - estatística do teste).
Valor
Esperado
Qual é o valor esperado para o número de caras
(variável X - estatística do teste) se a probabilidade
for realmente 50%?
5 caras
Resultado
da amostra
Valor esperado se a probabilidade for realmente 50%: 5 caras.
Situação 1: Valor obtido: X = 10 caras. Qual seria a conclusão?
Situação 2: Valor obtido: X = 7 caras. Qual seria a conclusão?
Desvio Observado
Valor esperado se
Ho for verdadeira
Desvio
Valor observado
na amostra
ocorreu por acaso? (Ho verdadeira)
ocorreu porque Ho é falsa ?
Tipos de testes estatísticos
Cada um para uma finalidade específica
Tipo de variável
Distribuição da variável
Paramétricos
Não paramétricos
Quantidade de amostras
Amostras relacionadas ou não
Tipos de variáveis
Numéricas?
T de student
Teste F
ANOVA
Mann Whitney
Categóricas?
Chi quadrado
Análise de verossimilhança
Kendall`s Tau B
Distribuição de variáveis
Paramétricas
Teste T
Anova
Não paramétricas
Mann Whitney
Chi quadrado
*Kolmogorov Smirnov
Quantidade de amostras
Duas?
Mann Whitney
Teste T
Chi quadrado
K?
Kruskall Wallis
Chi quadrado
ANOVA
Relação entre amostras
Com controle?
McNemar
Wilcoxon
Sem controle?
Teste T
Chi quadrado
Como funciona um teste?
Fórmula matemática
Valor lançado em uma curva
Como funciona um teste?
Valor de p
Teste T
Utilizado para comparar duas médias, variáveis
paramétricas, não relacionadas, duas amostras
Obesos –
120, 113, 167, 100, 98, 76, 129, ...
Média - 122
37 Pré diabéticos
Não obesos –
98, 90, 100, 73, 200, 103, 78, ...
Média – 98
13 Pré diabéticos
Teste F (ANOVA)
Utilizado para comparar duas variâncias, variáveis
paramétricas ou não, não relacionadas, K amostras
Obesos –
120, 113, 167, 100, 98, 76, 129, ...
Média - 122
37 Pré diabéticos
Não obesos –
98, 90, 100, 73, 200, 103, 78, ...
Média – 98
13 Pré diabéticos
Teste chi quadrado
Utilizado para comparar duas categorias,
variáveis paramétricas, não relacionadas,
duas amostras
Vários tipo de chi quadrado
Ideia ->
Obesos
Não Obesos
Pré diabéticos
37(50)
13(50)
Não Pré diabéticos
63(50)
87(50)
Teste chi quadrado
Utilizado para comparar duas categorias, variáveis
paramétricas, não relacionadas, duas amostras
Obesos –
120, 113, 167, 100, 98, 76, 129, ...
Média - 122
37 Pré diabéticos
Não obesos –
98, 90, 100, 73, 200, 103, 78, ...
Média – 98
13 Pré diabéticos
Intervalo de confiança
As medidas de tendência central
apresentam valores que podem assumir até
um certo limite com uma certa confiança
O limite mais utilizado é o de 95%
Médias 122 (IC 95% 110 – 134)
Médias 98 (IC 95% 86 – 110)
Inferência estatística
Generalizar uma proposição retirada de
uma amostra para uma população.
Critérios de causalidade;
Viéses.
Inferência estatística
População
Conjectura (hipótese) sobre o comportamento de
variáveis
Amostra
Decisão sobre a
admissibilidade da
hipótese
Resultados reais obtidos
Probabilidade de Significância (ps)
– Valor de p
Probabilidade da estatística do teste acusar um
resultado tão (ou mais) distante do esperado quanto
o resultado ocorrido na amostra observada.
Pode ser compreendida como a probabili-dade do
desvio observado ter ocorrido por acaso se a
hipótese nula for verdadeira.
Desvio Observado
Valor esperado se
Ho for verdadeira
Desvio
Valor observado
na amostra
ocorreu por acaso? (Ho verdadeira)
ocorreu porque Ho é falsa ?
Situação 1
A amostra apresentou 10 caras.
Se p = 0,5, a probabilidade da amostra
apresentar X = 10 (ou X=0) caras é:
Situação 1
0.246
0.205
0.205
0.117
0.117
0.044
0.044
0.001 0.01
0
1
0.01 0.001
2
3
4
5
ps = 0,002 ou 0,2%
6
7
8
9
10
X
Conclusão...
ps = 0,2% (probabilidade do desvio ter
ocorrido por acaso)
Qual seria a conclusão?
Rejeita-se Ho, ou seja, não se admite que o desvio
tenha ocorrido por acaso.
Situação 2
A amostra apresentou 7 caras.
Se p = 0,5, a probabilidade da amostra apresentar X = 7
ou mais (ou X=3 ou menos) caras é:
Situação 2
0.246
0.205
0.205
0.117
0.117
0.044
0.044
0.001 0.01
0
1
0.006 0.001
2
3
4
5
ps = 0,344 ou 34,4%
6
7
8
9
10
X
Conclusão...
ps = 34,4%
(probabilidade do desvio ter
ocorrido por acaso)
Qual seria a conclusão?
Aceita-se Ho,ou seja, não se pode afirmar que o
desvio não tenha ocorrido por acaso.
Decisão
Se a probabilidade do desvio ter ocorrido por acaso for
considerável (ps alta), não há evidências para se
rejeitar Ho. Aceita-se Ho.
Quando a probabilidade do desvio ter ocorrido por
acaso for considerada pequena (ps baixa), há
evidências para a rejeição de Ho. Rejeita-se Ho.
VALOR DE P
O nível de significância () é o limite para a
probabilidade de significância a partir do qual se
passa a rejeitar a hipótese nula do teste.
Representa a probabilidade tolerável de se rejeitar
Ho quando esta for verdadeira.
Os valores mais comuns para o nível de
significância são 5%, 10% e 1%.
Critérios de causalidade
Força de associação (maior proporção de
imc elevado e pré-diabetes)
Consistência ( Se repetido o estudo,
encontra-se o mesmo resultado)
Especificidade (todos os imc elevados
teriam pré-diabetes)
Temporalidade (primeiro vem o imc alto,
depois a pré-diabetes)
Critérios de causalidade
Gradiente biológico (Maior imc, maior
glicemia de jejum)
Plausibilidade (Faz sentido relacionar imc e
pré-diabetes?)
Coerência (Existe teoria que contradiz?)
Evidência experimental (Se engordarmos
uma pessoa ela adquire pré-diabetes?)
Viéses
Decorre do fato de não se utilizar a
população inteira
Viés de seleção
Viés de estimativa
Viés de financiamento
Obrigado!
Dúvidas ou sugestões?
[email protected]
Download

Aula 10 - Testes de Hipótese