R aplicado a Epidemiologia
Suzi Alves Camey
Luciana Neves Nunes
Departamento Estatística - UFRGS
R
• Página do R:
– http://www.r-project.org/
• Página com excelente tutorial do R:
– http://leg.ufpr.br/~paulojus/
• Página com material do curso:
– http://euler.mat.ufrgs.br/~camey/
R aplicado a Epidemiologia
R: Links para download
> CRAN
> http://cran.br.r-project.org/
> Windows
> base
> R-2.7.2-win32.exe
Para instalação execute o arquivo
R aplicado a Epidemiologia
Pacotes Epidemiológicos
•
•
•
•
•
Epi
epibasix
epicalc
epiR
epitools
• rmeta (Meta-analysis)
• survey (Complex survey analysis)
R aplicado a Epidemiologia
Instalar e carregar pacotes
• Instalar:
> Pacotes
> Instalar pacote(s)
> Brazil(PR)
> OK
> <escolher pacote>
> OK
R aplicado a Epidemiologia
Instalar e carregar pacotes
• Carregar:
> Pacotes
> Carregar pacote
> <escolher pacote>
> OK
R aplicado a Epidemiologia
Epi
•
Título: A package for statistical analysis in epidemiology.
• Autores:
– Bendix Carstensen, Martyn Plummer, Esa Laara, Michael Hills et. al.
• Conteúdo:
– Funções para análise demográficas e epidemiológicas no Diagrama de
Lexis, isto é, registro e acompanhamento de dados de coorte, incluindo
intervalos com dados censurados e representação de multiestados de
dados. Também apresenta algumas funções úteis para tabulação e
gráficos. Contém alguns bancos de dados epidemiológicos.
• Endereço: http://www.pubhealth.ku.dk/~bxc/Epi/
R aplicado a Epidemiologia
Epi
• ROC:
data(births)
help(births)
attach(births)
ROC(gestwks,(1-lowbw),plot="ROC“,MI=FALSE)
R aplicado a Epidemiologia
epibasix
• Título: Elementary Epidemiological Functions for a Graduate
Epidemiology Course
• Autor: Michael A Rotondi <[email protected]>
• Conteúdo: Esse pacote contém ferramentas elementares para
análise de problemas epidemiológicos comuns, tais como cálculo
de tamanho de amostra, análise de tabelas 2x2 e medidas de
concordância (kappa, sensibilidade/especificidade). Saídas e
resumos apropriados são produzidos de maneira a facilitar a
interpretação sempre que possível. Esse pacote está em
desenvolvimento, portanto comentários e sugestões são bem
vindos. O código é comentado para facilitar modificações.
R aplicado a Epidemiologia
epibasix
• Tamanho da amostra para ensaio clínico
randomizado:
– Suponha que uma nova droga promete
reduzir o risco da doença de 0.10 para 0.03.
n4props(0.03, 0.10, AR=1, alpha=0.05, power=0.80)
R aplicado a Epidemiologia
epicalc
• Título: Epidemiological calculator
• Autor: Virasakdi Chongsuvivatwong
[email protected]
• Conteúdo: Funções para fazer o R fácil para cálculos
epidemiológicos.
• Endereço: http://CRAN.R-project.org/
• Dica: Curso On Line - Próxima turma Jan/09
R aplicado a Epidemiologia
epicalc
• Medidas de efeito
table1 <- make2x2(25,70,22,7)
cc(outcome=NULL, exposure=NULL, cctable=table1)
cs(outcome=NULL, exposure=NULL, cctable=table1)
table1 <- make2x2(70,7,22,25)
cc(outcome=NULL, exposure=NULL, cctable=table1)
cs(outcome=NULL, exposure=NULL, cctable=table1)
R aplicado a Epidemiologia
epiR
• Título: Functions for analysing epidemiological data
• Autores:
– Mark Stevenson <[email protected]> with contributions from
Telmo Nunes, Javier Sanchez, and Ron Thornton.
• Conteúdo: Um pacote para analisar dados epidemiológicos. Contém
funções para ajustar, direta ou indiretamente, medidas de
freqüências das doenças.
• Endereço: http://epicentre.massey.ac.nz
R aplicado a Epidemiologia
epiR
• Estimação de prevalência:
Uma amostra aleatória simples de 150 mulheres é selecionada de
uma população de 2560.
Cada mulher é avaliada por um instrumento rastreador de
depressão.
– Sensibilidade = 96%
– Especificidade = 89%
– Casos positivos = 23
epi.prev(23, 150, 2560, se = 0.96, sp = 0.89, conf.level = 0.05)
R aplicado a Epidemiologia
epitools
• Título: Epidemiology Tools
• Autor: Tomas Aragon <[email protected]>
• Conteúdo: Pacote R para dados e gráficos
epidemiológicos.
• Endereço: http://www.epitools.net
R aplicado a Epidemiologia
epitools
• Risco relativo pessoa/ano
– Exemplo: Rothman 1998, p. 238
bc <- c(Unexposed = 15, Exposed = 41)
pyears <- c(Unexposed = 19017, Exposed = 28010)
rateratio.wald(bc,pyears)
R aplicado a Epidemiologia
Rcmdr
• Instalação como os demais pacotes
• Carregar:
– Na primeira vez vai solicitar a instalação de
pacotes auxiliares
R aplicado a Epidemiologia
Rcmdr: banco de dados
R aplicado a Epidemiologia
Rcmdr: banco de dados - texto
R aplicado a Epidemiologia
Rcmdr: banco de dados - SPSS
R aplicado a Epidemiologia
Rcmdr: banco de dados - Excel
R aplicado a Epidemiologia
Rcmdr: banco de dados - Excel
R aplicado a Epidemiologia
Rcmdr: Descritivas
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
O R representa os números com
notação científica.
7.764e-09 = 0.000000007764
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
O Rcmdr só permite análises
compatíveis com o tipo de variável
que há no banco de dados
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Qui-quadrado
R aplicado a Epidemiologia
Rcmdr: Regressão logística
R aplicado a Epidemiologia
Rcmdr: Regressão logística
R aplicado a Epidemiologia
Rcmdr: Regressão logística
•A função summary não exibe a
estimativa do O.R.
•Usar função logistic.display
do pacote epicalc para obter
O.R.
R aplicado a Epidemiologia
Rcmdr: Regressão logística
• Para usar a função o pacote
deve estar carregado
• Digitar o comando e clicar
em submeter
R aplicado a Epidemiologia
Rcmdr: Regressão logística
R aplicado a Epidemiologia
Rcmdr: Regressão logística
• Comando para regressão logística
condicional (caso-controle
pareado).
• Precisa do pacote survival
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• Precisamos dos pacotes carregados
nessa ordem:
– epicalc
– Rcmdr
– lmtest
– sandwich
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
Clicar 2x em “poisson” para
mudar a função link
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• O erro padrão da estimativa
apresentada nessa saída não
é robusta para resposta
binária.
• Nesse caso devemos usar
um estimador robusto.
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• Antes de estimar o erro padrão
robusto temos que tratar os valores
faltantes adequadamente.
• Caso contrário não conseguimos
fazer a estimativa robusta.
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
• Comandos para comparar modelos e estimar
o erro padrão robusto.
O erro padrão cai de 0.2474
para 0.22185.
R aplicado a Epidemiologia
Rcmdr: Regressão de Poisson
Comando para calcular a
exponencial do parâmetro e o
respectivo IC.
Estimativa e IC95%
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
Primeiro testar se
as variâncias são
iguais!
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
p>0,05  variâncias iguais
p0,05  variâncias diferentes
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: teste t
R aplicado a Epidemiologia
Rcmdr: Anova
Primeiro categorizar variável
women em três grupos com
igual amplitude.
R aplicado a Epidemiologia
Rcmdr: Anova
R aplicado a Epidemiologia
Rcmdr: Anova
Para escolher mais do
que um fator
pressionar Ctrl
R aplicado a Epidemiologia
Rcmdr: Anova
• Essa tabela de Anova
não é a que usamos
tradicionalmente.
• Teremos que construir
a tabela tradicional.
R aplicado a Epidemiologia
Rcmdr: Anova
R aplicado a Epidemiologia
Rcmdr: Anova
Este é o comando
Tabela Anova
R aplicado a Epidemiologia
Rcmdr: Anova
• Comando para teste de Tukey para
comparações múltiplas.
• Novo modelo deve ser construído
para as comparações múltiplas do
fator principal a ser testado.
R aplicado a Epidemiologia
Rcmdr: Anova
• Comando para calcular médias
e IC para a interação dos dois
fatores.
• É necessário o pacote effects
Médias e IC para a
interação dos dois
fatores.
R aplicado a Epidemiologia
Rcmdr: Anova
• Comando para gráficos das
médias e IC para a interação
dos dois fatores.
R aplicado a Epidemiologia
Rcmdr: Anova
14000
Plot of Means
Prestige$women_cat
10000
8000
6000
4000
2000
mean of Prestige$income
12000
(-0.0975,32.5]
(32.5,65]
(65,97.6]
bc
prof
wc
R aplicado a Epidemiologia
Prestige$type
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
15000
10000
5000
0
income
20000
25000
Rcmdr: Regressão linear
20
40
60
prestige
R aplicado a Epidemiologia
80
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
R aplicado a Epidemiologia
Rcmdr: Regressão linear
lm(income ~ prestige)
5000
6
PHY SICIANS
6000
10000
2
0
14000
-2
Fitted values
0
1
2
6
Residuals vs Leverage
GENERAL.MANAGERS
4
PHY SICIANS
Standardized residuals
GENERAL.MANAGERS
2.0
-1
Theoretical Quantiles
Scale-Location
1.5
OSTEOPATHS.CHIROPRACTORS
-2
-5000
Residuals
GENERAL.MANAGERS
OSTEOPATHS.CHIROPRACTORS
2000
PHY SICIANS
2000
6000
2
LAWY ERS
0
-2
0.5
1.0
OSTEOPATHS.CHIROPRACTORS
0.0
Standardized residuals
Normal Q-Q
4
GENERAL.MANAGERS
PHY SICIANS
Standardized residuals
15000
Residuals vs Fitted
Cook's distance
10000
14000 a Epidemiologia
0.00
0.02
R
aplicado
Fitted values
0.04
Leverage
0.06
1
0.5
Rcmdr: Salvar – resultados
R aplicado a Epidemiologia
Rcmdr: Salvar – dados
R aplicado a Epidemiologia
Rcmdr: Salvar – sintaxe
R aplicado a Epidemiologia
Rcmdr: Exportar dados
R aplicado a Epidemiologia
Rcmdr: Exportar dados
R aplicado a Epidemiologia
BOM CONGRESSO!
Download

R aplicado a Epidemiologia