Questionário GERAÇÃO SAUDÁVEL:
ANÁLISE ESTATÍSTICA
ANÁLISE DE DADOS
Os dados foram analisados na versão R 2.13.1.
Foi realizada uma análise descritiva exaustiva de todas as variáveis em estudo, usando
frequências absolutas, frequências relativas, medidas de localização e medidas de dispersão.
Realizou-se uma análise exploratória dos dados para caracterizar as diferentes variáveis, na
amostra global e estratificada segundo a variável de interesse: formação/sem formação.
A associação entre variáveis categóricas foi analisada usando o teste independência do Quiquadrado e o teste exacto de Fisher. Todos os testes de hipóteses foram efetuados considerando
um nível de confiança de 95%.
Ajustou-se um modelo regressão linear múltipla utilizando a função lm() do R e um modelo linear
generalizado utilizando a função glm() do R . A adequabilidade do modelo aos dados foi verificada
através da análise de resíduos.
RESULTADOS
CARACTERIZAÇÃO DA AMOSTRA
Foi recolhida informação de 804 alunos, com idades compreendidas entre os 9 e 17 anos (média =
11,46; desvio padrão=1,12;mediana=11,00).
A variável idade estava omissa em 44 (5,47%) questionários. A distribuição da variável idade
encontra-se representada no gráfico 1.
Gráfico 1 – Distribuição da amostra por idade
1
Em 14 (1,74 %) questionários não havia registo no que respeita à variável sexo. Dos restantes
alunos que responderam ao questionário 52,8% (n=417) eram do sexo masculino. Não se
verificaram diferenças estatisticamente significativas na distribuição da amostra por sexos (pvalue= 0,126).
A variável escolaridade estava omissa em 46 (5,72 %) questionários. De entre os restantes a
maioria (82,5%, n=625) frequentava o 6º ano.
Gráfico 2 – Distribuição da amostra por nível de escolaridade
Dos alunos inquiridos, 5 (0,62%) não responderam se tinham ou não tinham tido formação. Dos
respondentes, 44,9% (n=359) responderam não ter tido formação e enquanto 55,1% (n=440)
responderam ter recebido formação. A um nível de significância de 5%, esta diferença revelou ser
estatisticamente significativa (p-value= 0,004652).
Tabela1 – Caracterização Sócio-Demográfica dos alunos participantes
Sexo (NR=14)
n (%)
Feminino
Masculino
Idade (NR=44)
Média (dp)
Mínimo
Máximo
Mediana
373 (47,2)
417 (52,8)
Escolaridade (NR= 46)
n (%)
5 º ano
6º ano
7º ano
8ª ano
9ª ano
77 (10,2)
625 (82,5)
36 (4,7)
12 (1,6)
8 (1,1)
Localidade (NR=1)
Algoz
Amora
p-value= 0,126
11,46 (1,12)
9,00
17,00
11,00
p-value<0.001
n (%)
32 (4,07)
46 (5,85)
p-value<0.001
2
Bairro Padre Cruz
Bobadela
Carregado
Estremoz
Ferreira do Alentejo
Ferreira do Zezere
Oeiras
Parede
Reguengos de Monsaraz
Salir
Outros
34 (4,33)
44 (5,60)
39 (4,96)
36 (4,58)
34 (4,33)
43 (5,47)
87 (11,07)
48 (6,11)
45 (5,73)
36 (4,58)
262 (33,33)
Formação GS (NR=4)
n (%)
Sim
440 (55,1)
Não
359 (44,9)
p-value=
0,004652
NR-Não respondentes
A tabela 2 caracteriza a amostra consoante os alunos receberam ou não receberam formação.
Verificaram-se diferenças estatisticamente significativas no grupo etário e nível escolaridade.
Tabela 2 – Caracterização da amostra por grupo de intervenção
Formação GS
Sim
n (%)
Não
n (%)
[9-10] anos
53 (12,93)
23 (6,67)
11 anos
213 (51,95)
219 (63,48)
12 anos
77 (18,78)
73 (21,16)
13 anos
28 (6,83)
22 (6,38)
14 anos
17 (4,15)
7 (2,03)
[15-17] anos
22 (5,37)
1 (0,29)
Feminino
194 (45,12)
178 (50,00)
Masculino
236 (54,88)
178 (50,00)
5º ano
64 (15,50)
13 (3,80)
6º ano
308 (74,58)
314 (91,81)
41 (9,93)
15 (4,39)
p-value
Grupo etário
<0,0001
Sexo
0,1722
Escolaridade
7º,8º e 9º anos
<0,0001
*Teste Qui-quadrado
QUESTIONÁRIO GERAÇÃO SAUDÁVEL -1ªParte
3
O questionário aplicado era composto por 7 questões de escolha múltipla com uma única opção
correcta, 2 questões de verdadeiro ou falso (1ª parte do questionário) e 2 questões com a
possibilidade de escolha de mais do que uma opção entre as várias apresentadas (2ª parte do
questionário).
As diferenças observadas na proporção de respostas certas em cada questão foram
estatisticamente significativas (p-value<0,001). As questões com uma maior proporção de
respostas erradas foram “VI.O que é o preservativo?” e “IX.Quais as principais formas de
transmissão do HIV?”, com 34,3% e 41,7%, respectivamente.
0
200
400
600
800
Gráfico 3 – Distribuição do número de respostas corretas em cada questão
I
II
III
IV
V
VI
VII
VIII
IX
Certas
Erradas
Para cada uma das questões I-IX testou-se se a proporção de respostas certas era a mesma nos 2
grupos (com formação e sem formação). Analisando a proporção de respostas certas em cada
questão, verificou-se que na maioria das questões esta proporção foi superior no grupo que
recebeu formação (excepção das perguntas III e IV). Contudo apenas se verificaram diferenças
estatisticamente significativas nas questões V e IX.
Tabela 4 – Distribuição das proporções de respostas correctas encontradas em cada
questão, por grupo de intervenção
Questão
I
II
III
IV
V
VI
VII
VIII
Sem Formação
GS
Com Formação
GS
n
%
n
%
401
303
315
314
245
218
277
261
91,67
89,38
91,04
88,45
69,41
63,01
80,99
76,32
308
404
394
367
367
294
361
362
92,61
92,66
90,99
87,17
84,56
68,06
84,35
78,37
p-valuea
0,629
0,109
0,982
0,589
<0,001
0,140
0,220
0,502
4
IX
164
50,93
266
63,94
<0,001
a
Teste Qui-quadrado
Foi criada uma nova variável que correspondia ao número total de respostas correctas por aluno,
num máximo de 9 questões correctas. O número médio de respostas certas foi de 6,98 (dp=1,78)
[mediana=7,mínimo=0,máximo=9]. Verificou-se que a média foi superior no grupo que recebeu
formação comparativamente ao grupo que não recebeu (7,23 vs 6,70), sendo esta diferença
significativa (p-value<0,001).
Para cumprir os critérios de aplicabilidade do teste de Qui-quadrado, optou-se por agrupar o
número de respostas certas em categorias, para que as frequências esperadas fossem superior a
5. Criaram-se 3 categorias: 1-3 respostas correctas, 4 respostas correctas, 5 respostas correctas, 6
respostas correctas,7 respostas correctas, 8 respostas correctas e 9 respostas correctas. A tabela
de frequências relativas indica que a proporção de alunos que acertou entre 8 e 9 questões foi
maior entre o grupo dos alunos que receberam formação. Através do teste do Qui-quadrado testouse a independência entre a variável total de respostas correctas e a variável formação. A um nível
de significância de 5% verificou-se que a variável número total de respostas correctas estava
associada ao facto dos alunos terem ou não terem recebido formação (p-value=0,0006).
Tabela 5 – Distribuição da amostra por número total de questões correctas por aluno, global
e estratificada por grupo de formação
Formação GS
Total de
respostas
certas
n
%
n
%
n
%
1-3
4
5
6
7
8
9
Total
32
54
64
110
183
182
179
804
4,0
6,7
8,0
13,7
22,8
22,6
22,3
100,00
15
18
3,4
4,1
16
35
4,5
9,7
Global
Sim
28
57
96
111
115
440
Não
6,4
36
13,0
52
21,8
87
25,2
70
26,1
63
100,00
359
p-value= 0,0006 *
10,0
14,5
24,2
19,5
17,5
100,00
*Teste do Qui-quadrado
A variável sexo revelou estar associada à variável número de respostas corretas (p-value<0,001),
com uma maior proporção de raparigas a responder acertadamente a 9 questões (26,81% vs
18,47%).
Através do teste de independência verificou-se que o facto de os alunos terem ou não acertado
todas as questões, estava associado ao facto dos alunos terem tido ou não formação (pvalue=0,0037). O teste de independência também demonstrou existir associação entre a variável
sexo e o facto de os alunos terem acertado a todas as questões (p-value=0,005).
5
Tabela 6- Classificação dos alunos consoante acertaram ou não todas as questões e de
acordo com a formação e sexo
Acertou todas
as questões
Sim
Não
Total
p-value*
Formação GS
Sim
Não
115 (26,14)
63 (17,55)
325 (73,86)
296 (82,45)
440 (100)
32 (100)
0,0037
Sexo
F
100 (31,65)
273 (68,35)
373 (100)
M
77(18,47)
340 (81,53)
417 (100)
0,005
*Teste do Qui-quadrado
Um modelo de regressão linear foi ajustado para estimar o efeito das várias variáveis
independentes/explicativas na variável resposta número total de respostas correctas. Dada a
elevada dimensão da amostra admitiu-se a aproximação da distribuição dos dados a uma
distribuição normal. A escolaridade foi categorizada, e dadas as poucas observações, optou-se por
incluir 7º,8º e 9ºanos na mesma categoria.
A equação estimada foi a seguinte:
E (Nº respostas certas) = 5,82 – 0,55 Sexomasculino + 1,23 Escolaridade2+ 1,49 Escolaridade3+0,69
Formaçãosim
Tabela 7- Estimativa dos parâmetros do modelo de regressão
Co-Variável
Intercept
Sexo = Masculino
Escolaridade2
Escolaridade3
Formação=Sim
β
5,8215
- 0,5464
1,2316
1,4868
0,6883
DP
0,2226
0,1213
0,2043
0,2906
0,1250
P-value
<0,001
<0,001
<0,001
<0,001
<0,001
Escolaridade de referência=5º ano; Escolaridade1=5ºano; Escolaridade2=6º ano; Escolaridade3= [7º-9º anos]
Os parâmetros estimados indicam que o número médio de respostas certas é superior no grupo
que recebeu formação, comparativamente ao grupo que não recebeu formação, mantendo
constantes as co-variáveis sexo e escolaridade (p-value<0,001)- os alunos que receberam
formação acertaram em média mais 0,69 perguntas do que os alunos que não receberam
formação. A variável sexo também revelou ter influência no número de respostas certas. O número
médio de respostas certas estimado para os rapazes foi inferior ao das raparigas, controlando as
restantes co-variáveis do modelo (p-value<0,001). Ainda de acordo com o modelo estimado,
frequentar um nível de escolaridade mais elevado contribui para um maior número de respostas
correctas. Apesar da análise de resíduos sugerir a existência de heterocedasticidade e do
coeficiente de determinação ser baixo (R2 ajustado=0,09051) o que pode indicar um mau
ajustamento do modelo, o modelo estimado pode ter interesse para descrever o efeito parcial das
covariáveis na variável resposta.
Para estimar a associação entre as covariáveis formação, sexo e escolaridade versus a variável
binária acertar todas as perguntas do questionário, estimou-se um modelo linear generalizado com
função de ligação logit:
logit (pi)= - 2,28 – 0,51 Sexomasculino + 1,02 Escolaridade2+ 1,46 Escolaridade3+0,57 Formaçãosim
6
pi:probabilidade de acertar todas as perguntas
Tabela 8 – Estimativa dos parâmetros estimados no modelo linear generalizado para a variável
resposta “acerta todas as questões”
Co-Variável
Intercept
Escolaridade2
Escolaridade3
Sexo = Masculino
Formação=Sim
β
-2,2780
1,0196
1,4644
- 0,5138
0,5698
DP
0,3977
0,3747
0,4584
0,1793
0,1861
P-value
<0,001
0,0065
0,0014
0,0042
0,0022
Exp(β) (OR)
0,1025
2,7722
4,3248
0,5982
1,7678
IC OR (95%)
[0,047-0,2235]
[1,3302-5,7773]
[1,7609-10,6216]
[0,4209-0,8502]
[1,2275-2,5461]
Escolaridade de referência=5º ano; Escolaridade1=5ºano; Escolaridade2=6º ano; Escolaridade3= [7-9º anos]
De acordo com o modelo estimado, os alunos que receberam formação têm uma
chance/possibilidade 76% superior de acertar todas as perguntas, comparativamente ao grupo que
não recebeu formação, controlando para as restantes co-variáveis incluídas no modelo.
A análise das premissas subjacentes ao modelo foi efectuada através da análise gráfica. Verificouse que o ajustamento do modelo aos dados era razoável.
QUESTIONÁRIO GERAÇÃO SAUDÁVEL -2ªParte
O número médio de opções seleccionadas por cada aluno na questão X foi 2,10 (dp=1,47)
[mediana=2, mínimo=0, máximo=7]. Relativamente à questão XI, o número médio de opções
seleccionadas por cada aluno foi 1,51 (dp=0,94) [mediana=1, máximo =5 e mínimo=0]. A maioria
dos alunos (48,1%) seleccionou apenas uma opção.
A distribuição das proporções de alunos que assinalaram cada uma das opções possíveis para a
questão “X.Com quem tiras as dúvidas sobre ti e sobre o teu crescimento?” encontra-se na tabela
9. Os alunos indicaram recorrer mais frequentemente aos pais (77,7%) e ao farmacêutico (31,1%)
para esclarecer dúvidas sobre o seu crescimento.
Tabela 9- Distribuição das respostas à questão “X.Com quem tiras as dúvidas sobre ti e
sobre o teu crescimento?”
“Com quem tiras as dúvidas sobre ti e sobre
o teu crescimento?”
n (%)
Pais
625 (77,7)
Professores
172 (21,4)
Familiares
157 (19,5)
Farmacêutico
250 (31,1)
Médico
198 (24,6)
Enfermeiro
123 (15,3)
Amigos
164 (20,4)
*As proporções não somam 100%, porque existia a possibilidade de selecção de mais do que uma opção de resposta
Relativamente à questão “XI. Onde é que normalmente procuras informação sobre ti e sobre o teu
crescimento?” a distribuição de respostas encontra-se na tabela 10. A maioria (62,45%) dos
inquiridos assinalou apenas uma opção de resposta. Mais de 50% dos alunos referiu normalmente
consultar os livros para obter informação sobre o seu crescimento e 40% indicou a internet como
7
fonte de informação. A proporção de alunos que referiu procurar informação em vídeos, foi superior
entre os rapazes (18,7 vs 11,5), sendo a diferença significativa (p-value=0,005). A proporção de
alunos que referiu procurar informação na televisão, foi superior entre os rapazes (22,5 vs 13,9),
sendo a diferença significativa (p-value=0,002). Nas restantes opções não se verificaram diferenças
significativas entre os sexos.
Tabela 10- Distribuição das respostas à questão “XI.Onde é que normalmente procuras
informação sobre ti e sobre o teu crescimento?”
“Onde é que normalmente procuras
informação sobre ti e sobre o teu
crescimento?”
n (%)
Livros
435 (54,1)
Vídeos
123 (15,3)
TV
150 (18,7)
Internet
322 (40,0)
Folhetos
187 (23,3)
*As proporções não somam 100%, porque existia a possibilidade de selecção de mais do que uma opção de resposta
8
Download

ANÁLISE ESTATÍSTICA - Ordem dos Farmacêuticos