R aplicado a Epidemiologia Suzi Alves Camey Luciana Neves Nunes Departamento Estatística - UFRGS R • Página do R: – http://www.r-project.org/ • Página com excelente tutorial do R: – http://leg.ufpr.br/~paulojus/ • Página com material do curso: – http://euler.mat.ufrgs.br/~camey/ R aplicado a Epidemiologia R: Links para download > CRAN > http://cran.br.r-project.org/ > Windows > base > R-2.7.2-win32.exe Para instalação execute o arquivo R aplicado a Epidemiologia Pacotes Epidemiológicos • • • • • Epi epibasix epicalc epiR epitools • rmeta (Meta-analysis) • survey (Complex survey analysis) R aplicado a Epidemiologia Instalar e carregar pacotes • Instalar: > Pacotes > Instalar pacote(s) > Brazil(PR) > OK > <escolher pacote> > OK R aplicado a Epidemiologia Instalar e carregar pacotes • Carregar: > Pacotes > Carregar pacote > <escolher pacote> > OK R aplicado a Epidemiologia Epi • Título: A package for statistical analysis in epidemiology. • Autores: – Bendix Carstensen, Martyn Plummer, Esa Laara, Michael Hills et. al. • Conteúdo: – Funções para análise demográficas e epidemiológicas no Diagrama de Lexis, isto é, registro e acompanhamento de dados de coorte, incluindo intervalos com dados censurados e representação de multiestados de dados. Também apresenta algumas funções úteis para tabulação e gráficos. Contém alguns bancos de dados epidemiológicos. • Endereço: http://www.pubhealth.ku.dk/~bxc/Epi/ R aplicado a Epidemiologia Epi • ROC: data(births) help(births) attach(births) ROC(gestwks,(1-lowbw),plot="ROC“,MI=FALSE) R aplicado a Epidemiologia epibasix • Título: Elementary Epidemiological Functions for a Graduate Epidemiology Course • Autor: Michael A Rotondi <[email protected]> • Conteúdo: Esse pacote contém ferramentas elementares para análise de problemas epidemiológicos comuns, tais como cálculo de tamanho de amostra, análise de tabelas 2x2 e medidas de concordância (kappa, sensibilidade/especificidade). Saídas e resumos apropriados são produzidos de maneira a facilitar a interpretação sempre que possível. Esse pacote está em desenvolvimento, portanto comentários e sugestões são bem vindos. O código é comentado para facilitar modificações. R aplicado a Epidemiologia epibasix • Tamanho da amostra para ensaio clínico randomizado: – Suponha que uma nova droga promete reduzir o risco da doença de 0.10 para 0.03. n4props(0.03, 0.10, AR=1, alpha=0.05, power=0.80) R aplicado a Epidemiologia epicalc • Título: Epidemiological calculator • Autor: Virasakdi Chongsuvivatwong [email protected] • Conteúdo: Funções para fazer o R fácil para cálculos epidemiológicos. • Endereço: http://CRAN.R-project.org/ • Dica: Curso On Line - Próxima turma Jan/09 R aplicado a Epidemiologia epicalc • Medidas de efeito table1 <- make2x2(25,70,22,7) cc(outcome=NULL, exposure=NULL, cctable=table1) cs(outcome=NULL, exposure=NULL, cctable=table1) table1 <- make2x2(70,7,22,25) cc(outcome=NULL, exposure=NULL, cctable=table1) cs(outcome=NULL, exposure=NULL, cctable=table1) R aplicado a Epidemiologia epiR • Título: Functions for analysing epidemiological data • Autores: – Mark Stevenson <[email protected]> with contributions from Telmo Nunes, Javier Sanchez, and Ron Thornton. • Conteúdo: Um pacote para analisar dados epidemiológicos. Contém funções para ajustar, direta ou indiretamente, medidas de freqüências das doenças. • Endereço: http://epicentre.massey.ac.nz R aplicado a Epidemiologia epiR • Estimação de prevalência: Uma amostra aleatória simples de 150 mulheres é selecionada de uma população de 2560. Cada mulher é avaliada por um instrumento rastreador de depressão. – Sensibilidade = 96% – Especificidade = 89% – Casos positivos = 23 epi.prev(23, 150, 2560, se = 0.96, sp = 0.89, conf.level = 0.05) R aplicado a Epidemiologia epitools • Título: Epidemiology Tools • Autor: Tomas Aragon <[email protected]> • Conteúdo: Pacote R para dados e gráficos epidemiológicos. • Endereço: http://www.epitools.net R aplicado a Epidemiologia epitools • Risco relativo pessoa/ano – Exemplo: Rothman 1998, p. 238 bc <- c(Unexposed = 15, Exposed = 41) pyears <- c(Unexposed = 19017, Exposed = 28010) rateratio.wald(bc,pyears) R aplicado a Epidemiologia Rcmdr • Instalação como os demais pacotes • Carregar: – Na primeira vez vai solicitar a instalação de pacotes auxiliares R aplicado a Epidemiologia Rcmdr: banco de dados R aplicado a Epidemiologia Rcmdr: banco de dados - texto R aplicado a Epidemiologia Rcmdr: banco de dados - SPSS R aplicado a Epidemiologia Rcmdr: banco de dados - Excel R aplicado a Epidemiologia Rcmdr: banco de dados - Excel R aplicado a Epidemiologia Rcmdr: Descritivas R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado O R representa os números com notação científica. 7.764e-09 = 0.000000007764 R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado O Rcmdr só permite análises compatíveis com o tipo de variável que há no banco de dados R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Qui-quadrado R aplicado a Epidemiologia Rcmdr: Regressão logística R aplicado a Epidemiologia Rcmdr: Regressão logística R aplicado a Epidemiologia Rcmdr: Regressão logística •A função summary não exibe a estimativa do O.R. •Usar função logistic.display do pacote epicalc para obter O.R. R aplicado a Epidemiologia Rcmdr: Regressão logística • Para usar a função o pacote deve estar carregado • Digitar o comando e clicar em submeter R aplicado a Epidemiologia Rcmdr: Regressão logística R aplicado a Epidemiologia Rcmdr: Regressão logística • Comando para regressão logística condicional (caso-controle pareado). • Precisa do pacote survival R aplicado a Epidemiologia Rcmdr: Regressão de Poisson • Precisamos dos pacotes carregados nessa ordem: – epicalc – Rcmdr – lmtest – sandwich R aplicado a Epidemiologia Rcmdr: Regressão de Poisson R aplicado a Epidemiologia Rcmdr: Regressão de Poisson R aplicado a Epidemiologia Rcmdr: Regressão de Poisson R aplicado a Epidemiologia Rcmdr: Regressão de Poisson Clicar 2x em “poisson” para mudar a função link R aplicado a Epidemiologia Rcmdr: Regressão de Poisson • O erro padrão da estimativa apresentada nessa saída não é robusta para resposta binária. • Nesse caso devemos usar um estimador robusto. R aplicado a Epidemiologia Rcmdr: Regressão de Poisson • Antes de estimar o erro padrão robusto temos que tratar os valores faltantes adequadamente. • Caso contrário não conseguimos fazer a estimativa robusta. R aplicado a Epidemiologia Rcmdr: Regressão de Poisson • Comandos para comparar modelos e estimar o erro padrão robusto. O erro padrão cai de 0.2474 para 0.22185. R aplicado a Epidemiologia Rcmdr: Regressão de Poisson Comando para calcular a exponencial do parâmetro e o respectivo IC. Estimativa e IC95% R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t Primeiro testar se as variâncias são iguais! R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t p>0,05 variâncias iguais p0,05 variâncias diferentes R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: teste t R aplicado a Epidemiologia Rcmdr: Anova Primeiro categorizar variável women em três grupos com igual amplitude. R aplicado a Epidemiologia Rcmdr: Anova R aplicado a Epidemiologia Rcmdr: Anova Para escolher mais do que um fator pressionar Ctrl R aplicado a Epidemiologia Rcmdr: Anova • Essa tabela de Anova não é a que usamos tradicionalmente. • Teremos que construir a tabela tradicional. R aplicado a Epidemiologia Rcmdr: Anova R aplicado a Epidemiologia Rcmdr: Anova Este é o comando Tabela Anova R aplicado a Epidemiologia Rcmdr: Anova • Comando para teste de Tukey para comparações múltiplas. • Novo modelo deve ser construído para as comparações múltiplas do fator principal a ser testado. R aplicado a Epidemiologia Rcmdr: Anova • Comando para calcular médias e IC para a interação dos dois fatores. • É necessário o pacote effects Médias e IC para a interação dos dois fatores. R aplicado a Epidemiologia Rcmdr: Anova • Comando para gráficos das médias e IC para a interação dos dois fatores. R aplicado a Epidemiologia Rcmdr: Anova 14000 Plot of Means Prestige$women_cat 10000 8000 6000 4000 2000 mean of Prestige$income 12000 (-0.0975,32.5] (32.5,65] (65,97.6] bc prof wc R aplicado a Epidemiologia Prestige$type Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia 15000 10000 5000 0 income 20000 25000 Rcmdr: Regressão linear 20 40 60 prestige R aplicado a Epidemiologia 80 Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear R aplicado a Epidemiologia Rcmdr: Regressão linear lm(income ~ prestige) 5000 6 PHY SICIANS 6000 10000 2 0 14000 -2 Fitted values 0 1 2 6 Residuals vs Leverage GENERAL.MANAGERS 4 PHY SICIANS Standardized residuals GENERAL.MANAGERS 2.0 -1 Theoretical Quantiles Scale-Location 1.5 OSTEOPATHS.CHIROPRACTORS -2 -5000 Residuals GENERAL.MANAGERS OSTEOPATHS.CHIROPRACTORS 2000 PHY SICIANS 2000 6000 2 LAWY ERS 0 -2 0.5 1.0 OSTEOPATHS.CHIROPRACTORS 0.0 Standardized residuals Normal Q-Q 4 GENERAL.MANAGERS PHY SICIANS Standardized residuals 15000 Residuals vs Fitted Cook's distance 10000 14000 a Epidemiologia 0.00 0.02 R aplicado Fitted values 0.04 Leverage 0.06 1 0.5 Rcmdr: Salvar – resultados R aplicado a Epidemiologia Rcmdr: Salvar – dados R aplicado a Epidemiologia Rcmdr: Salvar – sintaxe R aplicado a Epidemiologia Rcmdr: Exportar dados R aplicado a Epidemiologia Rcmdr: Exportar dados R aplicado a Epidemiologia BOM CONGRESSO!