Dr Hermano Alexandre Doutorando em Saúde Coletiva Mestre em Saúde Pública Especialista em auditoria de sistemas de saúde Faculdade de Medicina Universidade Federal do Ceará Significância estatística Intervalos de confiança Inferência estatística Tópicos Testes de hipótese Teste t de student Teste F Teste chi quadrado Intervalos de confiança Inferência estatística Teste de hipótese Visa testar qual a probabilidade de que um determinado resultado encontrado em uma determinada amostra seja somente devido ao acaso. O que é hipótese? Em inglês, hypothesis Em alemão, Hypothese Em latim, hypothesis ... Vem de: base(hipo) de uma proposição(thesis). O que é hipótese? 100 Obesos População Amo stra 100 Não obesos O que é hipótese? Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos Por que testar a hipótese O acaso (erro tipo I) Hipóteses de um Teste Ho - Hipótese Nula H1 - Hipótese Alternativa Hipóteses de um Teste Ho - Hipótese Nula - hipótese que será suposta inicialmente como verdadeira. É, basicamente, a negação do que o pesquisador deseja provar. Hipóteses de um Teste H1 - Hipótese Alternativa - hipótese que será aceita, se os dados mostrarem evidências suficientes para a rejeição da hipótese nula. Geralmente, é a própria hipótese da pesquisa. Exemplo Ho: Em média, as vendas não aumentam com a introdução da propaganda. H1: Em média, as vendas aumentam com a introdução da propaganda. Ho: Em média, o IAM não diminui com uso de aspirina. H1: Em média, o IAM diminui com o uso de aspirina. Exemplo Suspeita-se que uma moeda, utilizada em jogo de azar, seja viciada, isto é, que a probabilidade de sair “cara” seja diferente de 50%. Hipóteses Ho: p = 0,5 (a probabilidade é 50%) H1: p = 0,5 (a probabilidade não é 50%) p - probabilidade de cara. Amostra Para se tomar a decisão de se aceitar, ou não, que a moeda seja honesta, tomou-se uma amostra com 10 lançamentos e observou-se o número de caras. (variável X - estatística do teste). Valor Esperado Qual é o valor esperado para o número de caras (variável X - estatística do teste) se a probabilidade for realmente 50%? 5 caras Resultado da amostra Valor esperado se a probabilidade for realmente 50%: 5 caras. Situação 1: Valor obtido: X = 10 caras. Qual seria a conclusão? Situação 2: Valor obtido: X = 7 caras. Qual seria a conclusão? Desvio Observado Valor esperado se Ho for verdadeira Desvio Valor observado na amostra ocorreu por acaso? (Ho verdadeira) ocorreu porque Ho é falsa ? Tipos de testes estatísticos Cada um para uma finalidade específica Tipo de variável Distribuição da variável Paramétricos Não paramétricos Quantidade de amostras Amostras relacionadas ou não Tipos de variáveis Numéricas? T de student Teste F ANOVA Mann Whitney Categóricas? Chi quadrado Análise de verossimilhança Kendall`s Tau B Distribuição de variáveis Paramétricas Teste T Anova Não paramétricas Mann Whitney Chi quadrado *Kolmogorov Smirnov Quantidade de amostras Duas? Mann Whitney Teste T Chi quadrado K? Kruskall Wallis Chi quadrado ANOVA Relação entre amostras Com controle? McNemar Wilcoxon Sem controle? Teste T Chi quadrado Como funciona um teste? Fórmula matemática Valor lançado em uma curva Como funciona um teste? Valor de p Teste T Utilizado para comparar duas médias, variáveis paramétricas, não relacionadas, duas amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos Teste F (ANOVA) Utilizado para comparar duas variâncias, variáveis paramétricas ou não, não relacionadas, K amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos Teste chi quadrado Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras Vários tipo de chi quadrado Ideia -> Obesos Não Obesos Pré diabéticos 37(50) 13(50) Não Pré diabéticos 63(50) 87(50) Teste chi quadrado Utilizado para comparar duas categorias, variáveis paramétricas, não relacionadas, duas amostras Obesos – 120, 113, 167, 100, 98, 76, 129, ... Média - 122 37 Pré diabéticos Não obesos – 98, 90, 100, 73, 200, 103, 78, ... Média – 98 13 Pré diabéticos Intervalo de confiança As medidas de tendência central apresentam valores que podem assumir até um certo limite com uma certa confiança O limite mais utilizado é o de 95% Médias 122 (IC 95% 110 – 134) Médias 98 (IC 95% 86 – 110) Inferência estatística Generalizar uma proposição retirada de uma amostra para uma população. Critérios de causalidade; Viéses. Inferência estatística População Conjectura (hipótese) sobre o comportamento de variáveis Amostra Decisão sobre a admissibilidade da hipótese Resultados reais obtidos Probabilidade de Significância (ps) – Valor de p Probabilidade da estatística do teste acusar um resultado tão (ou mais) distante do esperado quanto o resultado ocorrido na amostra observada. Pode ser compreendida como a probabili-dade do desvio observado ter ocorrido por acaso se a hipótese nula for verdadeira. Desvio Observado Valor esperado se Ho for verdadeira Desvio Valor observado na amostra ocorreu por acaso? (Ho verdadeira) ocorreu porque Ho é falsa ? Situação 1 A amostra apresentou 10 caras. Se p = 0,5, a probabilidade da amostra apresentar X = 10 (ou X=0) caras é: Situação 1 0.246 0.205 0.205 0.117 0.117 0.044 0.044 0.001 0.01 0 1 0.01 0.001 2 3 4 5 ps = 0,002 ou 0,2% 6 7 8 9 10 X Conclusão... ps = 0,2% (probabilidade do desvio ter ocorrido por acaso) Qual seria a conclusão? Rejeita-se Ho, ou seja, não se admite que o desvio tenha ocorrido por acaso. Situação 2 A amostra apresentou 7 caras. Se p = 0,5, a probabilidade da amostra apresentar X = 7 ou mais (ou X=3 ou menos) caras é: Situação 2 0.246 0.205 0.205 0.117 0.117 0.044 0.044 0.001 0.01 0 1 0.006 0.001 2 3 4 5 ps = 0,344 ou 34,4% 6 7 8 9 10 X Conclusão... ps = 34,4% (probabilidade do desvio ter ocorrido por acaso) Qual seria a conclusão? Aceita-se Ho,ou seja, não se pode afirmar que o desvio não tenha ocorrido por acaso. Decisão Se a probabilidade do desvio ter ocorrido por acaso for considerável (ps alta), não há evidências para se rejeitar Ho. Aceita-se Ho. Quando a probabilidade do desvio ter ocorrido por acaso for considerada pequena (ps baixa), há evidências para a rejeição de Ho. Rejeita-se Ho. VALOR DE P O nível de significância () é o limite para a probabilidade de significância a partir do qual se passa a rejeitar a hipótese nula do teste. Representa a probabilidade tolerável de se rejeitar Ho quando esta for verdadeira. Os valores mais comuns para o nível de significância são 5%, 10% e 1%. Critérios de causalidade Força de associação (maior proporção de imc elevado e pré-diabetes) Consistência ( Se repetido o estudo, encontra-se o mesmo resultado) Especificidade (todos os imc elevados teriam pré-diabetes) Temporalidade (primeiro vem o imc alto, depois a pré-diabetes) Critérios de causalidade Gradiente biológico (Maior imc, maior glicemia de jejum) Plausibilidade (Faz sentido relacionar imc e pré-diabetes?) Coerência (Existe teoria que contradiz?) Evidência experimental (Se engordarmos uma pessoa ela adquire pré-diabetes?) Viéses Decorre do fato de não se utilizar a população inteira Viés de seleção Viés de estimativa Viés de financiamento Obrigado! Dúvidas ou sugestões? [email protected]