Grupo: Alberto de Oliveira Martins
Igor Ryan Bernardo Santos
João Carlos Procópio Florêncio
Maria Marcela Soares de Meira Lins
Introdução
• Dados da Organização
Mundial de Saúde (OMS)
estima 17,5 milhões de mortes
por ano devido a problemas
cardiovasculares
• Doenças como infarto se
propagam de modo
assintomático
• Impacto pode ser visualizado
através de Estatística
Descritiva
Dados de estudo
• Dados de pacientes
internados nos hospitais de
Cleveland, Ohio, USA
• Uso de fatores de risco
para estudo:
• Taxa de Colesterol (em mg/dl)
• Pressão Sanguínea em
Repouso
• Freqüência cardíaca máxima
do paciente quando submetido
a esforço físico
• Pico da depressão ST induzida
pelo exercício
• Idade do paciente
Histogramas
• Gráficos usados para estimativas
• Obtenção de classes usa métodos
conceituais, porém não são
precisos:
•
Fórmula de Sturges:
K = 1 + 3.22 log n
•
Fórmula de FreedmanDiaconis(Fórmula de FD)
IQR é o intervalo entre o 1º
quartil e o 3º quartil
- n é o tamanho da amostra.
-
Histogramas – Descrição das variáveis
CHOL: Colesterol mg/dl
• Considerado o fator de
risco mais devastador das
doenças cardiovasculares
• Atinge cada vez mais
pessoas mais jovens,
mesmo crianças
• Fator ocasiona cerca de
4,4 milhões de mortes por
ano
Média: 246.6931
Desvio Padrão: 51.77692
Mediana: 241
Moda: 197, 204, 234
Histogramas – Descrição das variáveis
Método de Sturges
• Mostra gráfico mais normalizado
• Positivamente desviado
Método de Freedman-Diaconis (FD)
• Gráfico ligeiramente menos normalizado que o
anterior
• Possui mais classes, trazendo mais detalhes
Histogramas – Descrição das variáveis
TRESTBPS: Pressão
Sanguínea em Repouso
• Pressão exercida pelo
sangue nos vasos
sanguíneos
• Taxas elevadas de pressão
podem danificar ou romper
os vasos
• Variável aleatória contínua
Média: 131.6898
Desvio Padrão: 17.59975
Mediana: 130
Moda: 120
Histogramas – Descrição das variáveis
Método de Sturges
Método de Freedman-Diaconis (FD)
• Mostra gráfico mais normalizado
• Apresenta diversos picos no gráfico
• Positivamente desviado
• Histograma não recomendado se critérios de
normalidade gráfica forem recomendados
Histogramas – Descrição das variáveis
OLDPEAK: Depressão ST
•Se refere a depressões
anormais encontradas no
eletrocardiograma
• É frequente sinal de
isquemia no miocárdio
• Variável aleatória contínua
Média: 1.039604
Desvio Padrão: 1.161075
Mediana: 0,8
Moda: 0,0
Histogramas – Descrição das variáveis
Método de Sturges
Método de Freedman-Diaconis (FD)
• Mostra gráfico mais normalizado
• Apresenta diversos picos no gráfico
• Positivamente desviado
• Histograma não recomendado se critérios de
normalidade gráfica forem recomendados
Histogramas – Descrição das variáveis
THALACH: Frequência
cardíaca máxima alcançada
• Frequência cardíaca máxima
alcançada durante esforço
físico
• Pessoas com que atingem
maior frequência cadíaca
durante esforço físico indica
sedentarismo
• Variável aleatória contínua
Média: 149.6073
Desvio Padrão: 22.87500
Mediana: 153
Moda: 162
Histogramas – Descrição das variáveis
Método de Sturges
Método de Freedman-Diaconis (FD)
• Mostra gráfico mais normalizado
• Apresenta diversos picos no gráfico
• Positivamente desviado
• Histograma não recomendado se critérios de
normalidade gráfica forem recomendados
Histogramas – Descrição das variáveis
AGE: Idade
• Idade do paciente no
momento da pesquisa
• Pessoas com idade mais
avançadas tem maior risco
de ter problemas do
coração
• Variável aleatória discreta
Média: 54.43894
Desvio Padrão: 9.038662
Mediana: 56
Moda: 58
Histogramas – Descrição das variáveis
Método de Sturges
Método de Freedman-Diaconis (FD)
• Mostra gráfico mais normalizado
• Apresenta diversos picos no gráfico
• Positivamente desviado
• Histograma não recomendado se critérios de
normalidade gráfica forem recomendados
Testes de Hipótese
 Sabe-se que homens costumam ter maior
probabilidade infarto do que as mulheres.
Acredita-se, então, que a probabilidade dos
infartos nos homens esteja ligado a pressão
alta em repouso. Prove por teste de hipótese
com nível de significância de 95% e 99% que
homens têm pressão sanguínea maior que o
das mulheres.
Testes de Hipótese
 Dados:
 N: 33 indivíduos tanto
para a amostra de
homens quanto para a
de mulheres.
 Hipótese Nula: Homens
possuem pressão
sanguínea mais elevada
que mulheres.
Testes de Hipótese










Os dados gerados em R para nível de significância = .05:
Welch Two Sample t-test
data: pre and premu
t = -2.7073, df = 63.241, p-value = 0.008712
alternative hypothesis: true difference in means is not equal
to 4.727273
95 percent confidence interval:
-11.705394 2.250849
sample estimates:
mean of x mean of y
132.2727 137.0000
Testes de Hipótese










Para nível de significância = .01
WelchTwo Sample t-test
data: pre and premu
t = -2.7073, df = 63.241, p-value = 0.008712
alternative hypothesis: true difference in means is not
equal to 4.727273
99 percent confidence interval:
-14.002011 4.547466
sample estimates:
mean of x mean of y
132.2727 137.0000
Testes de Hipótese
 Estima-se que a média de nível de colesterol
da população mundial é de 235mg/dL com
desvio padrão de 40mg/dL. Teste a hipótese
de que esta é uma amostra representativa da
população mundial com nível de significância
de 95%.
Testes de Hipótese
 Dados:
 μ = 235,0 mg/dL
 x = 245.3824 mg/dL
 N = 34 indivíduos
 Hipótese Nula: A média de
colesterol dos individuas da
amostra é igual a média dos
indivíduos da população.
Testes de Hipótese
 data: c
 t = 1.3729, df = 33, p-value = 0.1790
 alternative hypothesis: true mean is not equal





to 235
95 percent confidence interval:
229.9967 260.7680
sample estimates:
mean of x
245.3824
Download

Projeto Linguagem R