Questionário GERAÇÃO SAUDÁVEL: ANÁLISE ESTATÍSTICA ANÁLISE DE DADOS Os dados foram analisados na versão R 2.13.1. Foi realizada uma análise descritiva exaustiva de todas as variáveis em estudo, usando frequências absolutas, frequências relativas, medidas de localização e medidas de dispersão. Realizou-se uma análise exploratória dos dados para caracterizar as diferentes variáveis, na amostra global e estratificada segundo a variável de interesse: formação/sem formação. A associação entre variáveis categóricas foi analisada usando o teste independência do Quiquadrado e o teste exacto de Fisher. Todos os testes de hipóteses foram efetuados considerando um nível de confiança de 95%. Ajustou-se um modelo regressão linear múltipla utilizando a função lm() do R e um modelo linear generalizado utilizando a função glm() do R . A adequabilidade do modelo aos dados foi verificada através da análise de resíduos. RESULTADOS CARACTERIZAÇÃO DA AMOSTRA Foi recolhida informação de 804 alunos, com idades compreendidas entre os 9 e 17 anos (média = 11,46; desvio padrão=1,12;mediana=11,00). A variável idade estava omissa em 44 (5,47%) questionários. A distribuição da variável idade encontra-se representada no gráfico 1. Gráfico 1 – Distribuição da amostra por idade 1 Em 14 (1,74 %) questionários não havia registo no que respeita à variável sexo. Dos restantes alunos que responderam ao questionário 52,8% (n=417) eram do sexo masculino. Não se verificaram diferenças estatisticamente significativas na distribuição da amostra por sexos (pvalue= 0,126). A variável escolaridade estava omissa em 46 (5,72 %) questionários. De entre os restantes a maioria (82,5%, n=625) frequentava o 6º ano. Gráfico 2 – Distribuição da amostra por nível de escolaridade Dos alunos inquiridos, 5 (0,62%) não responderam se tinham ou não tinham tido formação. Dos respondentes, 44,9% (n=359) responderam não ter tido formação e enquanto 55,1% (n=440) responderam ter recebido formação. A um nível de significância de 5%, esta diferença revelou ser estatisticamente significativa (p-value= 0,004652). Tabela1 – Caracterização Sócio-Demográfica dos alunos participantes Sexo (NR=14) n (%) Feminino Masculino Idade (NR=44) Média (dp) Mínimo Máximo Mediana 373 (47,2) 417 (52,8) Escolaridade (NR= 46) n (%) 5 º ano 6º ano 7º ano 8ª ano 9ª ano 77 (10,2) 625 (82,5) 36 (4,7) 12 (1,6) 8 (1,1) Localidade (NR=1) Algoz Amora p-value= 0,126 11,46 (1,12) 9,00 17,00 11,00 p-value<0.001 n (%) 32 (4,07) 46 (5,85) p-value<0.001 2 Bairro Padre Cruz Bobadela Carregado Estremoz Ferreira do Alentejo Ferreira do Zezere Oeiras Parede Reguengos de Monsaraz Salir Outros 34 (4,33) 44 (5,60) 39 (4,96) 36 (4,58) 34 (4,33) 43 (5,47) 87 (11,07) 48 (6,11) 45 (5,73) 36 (4,58) 262 (33,33) Formação GS (NR=4) n (%) Sim 440 (55,1) Não 359 (44,9) p-value= 0,004652 NR-Não respondentes A tabela 2 caracteriza a amostra consoante os alunos receberam ou não receberam formação. Verificaram-se diferenças estatisticamente significativas no grupo etário e nível escolaridade. Tabela 2 – Caracterização da amostra por grupo de intervenção Formação GS Sim n (%) Não n (%) [9-10] anos 53 (12,93) 23 (6,67) 11 anos 213 (51,95) 219 (63,48) 12 anos 77 (18,78) 73 (21,16) 13 anos 28 (6,83) 22 (6,38) 14 anos 17 (4,15) 7 (2,03) [15-17] anos 22 (5,37) 1 (0,29) Feminino 194 (45,12) 178 (50,00) Masculino 236 (54,88) 178 (50,00) 5º ano 64 (15,50) 13 (3,80) 6º ano 308 (74,58) 314 (91,81) 41 (9,93) 15 (4,39) p-value Grupo etário <0,0001 Sexo 0,1722 Escolaridade 7º,8º e 9º anos <0,0001 *Teste Qui-quadrado QUESTIONÁRIO GERAÇÃO SAUDÁVEL -1ªParte 3 O questionário aplicado era composto por 7 questões de escolha múltipla com uma única opção correcta, 2 questões de verdadeiro ou falso (1ª parte do questionário) e 2 questões com a possibilidade de escolha de mais do que uma opção entre as várias apresentadas (2ª parte do questionário). As diferenças observadas na proporção de respostas certas em cada questão foram estatisticamente significativas (p-value<0,001). As questões com uma maior proporção de respostas erradas foram “VI.O que é o preservativo?” e “IX.Quais as principais formas de transmissão do HIV?”, com 34,3% e 41,7%, respectivamente. 0 200 400 600 800 Gráfico 3 – Distribuição do número de respostas corretas em cada questão I II III IV V VI VII VIII IX Certas Erradas Para cada uma das questões I-IX testou-se se a proporção de respostas certas era a mesma nos 2 grupos (com formação e sem formação). Analisando a proporção de respostas certas em cada questão, verificou-se que na maioria das questões esta proporção foi superior no grupo que recebeu formação (excepção das perguntas III e IV). Contudo apenas se verificaram diferenças estatisticamente significativas nas questões V e IX. Tabela 4 – Distribuição das proporções de respostas correctas encontradas em cada questão, por grupo de intervenção Questão I II III IV V VI VII VIII Sem Formação GS Com Formação GS n % n % 401 303 315 314 245 218 277 261 91,67 89,38 91,04 88,45 69,41 63,01 80,99 76,32 308 404 394 367 367 294 361 362 92,61 92,66 90,99 87,17 84,56 68,06 84,35 78,37 p-valuea 0,629 0,109 0,982 0,589 <0,001 0,140 0,220 0,502 4 IX 164 50,93 266 63,94 <0,001 a Teste Qui-quadrado Foi criada uma nova variável que correspondia ao número total de respostas correctas por aluno, num máximo de 9 questões correctas. O número médio de respostas certas foi de 6,98 (dp=1,78) [mediana=7,mínimo=0,máximo=9]. Verificou-se que a média foi superior no grupo que recebeu formação comparativamente ao grupo que não recebeu (7,23 vs 6,70), sendo esta diferença significativa (p-value<0,001). Para cumprir os critérios de aplicabilidade do teste de Qui-quadrado, optou-se por agrupar o número de respostas certas em categorias, para que as frequências esperadas fossem superior a 5. Criaram-se 3 categorias: 1-3 respostas correctas, 4 respostas correctas, 5 respostas correctas, 6 respostas correctas,7 respostas correctas, 8 respostas correctas e 9 respostas correctas. A tabela de frequências relativas indica que a proporção de alunos que acertou entre 8 e 9 questões foi maior entre o grupo dos alunos que receberam formação. Através do teste do Qui-quadrado testouse a independência entre a variável total de respostas correctas e a variável formação. A um nível de significância de 5% verificou-se que a variável número total de respostas correctas estava associada ao facto dos alunos terem ou não terem recebido formação (p-value=0,0006). Tabela 5 – Distribuição da amostra por número total de questões correctas por aluno, global e estratificada por grupo de formação Formação GS Total de respostas certas n % n % n % 1-3 4 5 6 7 8 9 Total 32 54 64 110 183 182 179 804 4,0 6,7 8,0 13,7 22,8 22,6 22,3 100,00 15 18 3,4 4,1 16 35 4,5 9,7 Global Sim 28 57 96 111 115 440 Não 6,4 36 13,0 52 21,8 87 25,2 70 26,1 63 100,00 359 p-value= 0,0006 * 10,0 14,5 24,2 19,5 17,5 100,00 *Teste do Qui-quadrado A variável sexo revelou estar associada à variável número de respostas corretas (p-value<0,001), com uma maior proporção de raparigas a responder acertadamente a 9 questões (26,81% vs 18,47%). Através do teste de independência verificou-se que o facto de os alunos terem ou não acertado todas as questões, estava associado ao facto dos alunos terem tido ou não formação (pvalue=0,0037). O teste de independência também demonstrou existir associação entre a variável sexo e o facto de os alunos terem acertado a todas as questões (p-value=0,005). 5 Tabela 6- Classificação dos alunos consoante acertaram ou não todas as questões e de acordo com a formação e sexo Acertou todas as questões Sim Não Total p-value* Formação GS Sim Não 115 (26,14) 63 (17,55) 325 (73,86) 296 (82,45) 440 (100) 32 (100) 0,0037 Sexo F 100 (31,65) 273 (68,35) 373 (100) M 77(18,47) 340 (81,53) 417 (100) 0,005 *Teste do Qui-quadrado Um modelo de regressão linear foi ajustado para estimar o efeito das várias variáveis independentes/explicativas na variável resposta número total de respostas correctas. Dada a elevada dimensão da amostra admitiu-se a aproximação da distribuição dos dados a uma distribuição normal. A escolaridade foi categorizada, e dadas as poucas observações, optou-se por incluir 7º,8º e 9ºanos na mesma categoria. A equação estimada foi a seguinte: E (Nº respostas certas) = 5,82 – 0,55 Sexomasculino + 1,23 Escolaridade2+ 1,49 Escolaridade3+0,69 Formaçãosim Tabela 7- Estimativa dos parâmetros do modelo de regressão Co-Variável Intercept Sexo = Masculino Escolaridade2 Escolaridade3 Formação=Sim β 5,8215 - 0,5464 1,2316 1,4868 0,6883 DP 0,2226 0,1213 0,2043 0,2906 0,1250 P-value <0,001 <0,001 <0,001 <0,001 <0,001 Escolaridade de referência=5º ano; Escolaridade1=5ºano; Escolaridade2=6º ano; Escolaridade3= [7º-9º anos] Os parâmetros estimados indicam que o número médio de respostas certas é superior no grupo que recebeu formação, comparativamente ao grupo que não recebeu formação, mantendo constantes as co-variáveis sexo e escolaridade (p-value<0,001)- os alunos que receberam formação acertaram em média mais 0,69 perguntas do que os alunos que não receberam formação. A variável sexo também revelou ter influência no número de respostas certas. O número médio de respostas certas estimado para os rapazes foi inferior ao das raparigas, controlando as restantes co-variáveis do modelo (p-value<0,001). Ainda de acordo com o modelo estimado, frequentar um nível de escolaridade mais elevado contribui para um maior número de respostas correctas. Apesar da análise de resíduos sugerir a existência de heterocedasticidade e do coeficiente de determinação ser baixo (R2 ajustado=0,09051) o que pode indicar um mau ajustamento do modelo, o modelo estimado pode ter interesse para descrever o efeito parcial das covariáveis na variável resposta. Para estimar a associação entre as covariáveis formação, sexo e escolaridade versus a variável binária acertar todas as perguntas do questionário, estimou-se um modelo linear generalizado com função de ligação logit: logit (pi)= - 2,28 – 0,51 Sexomasculino + 1,02 Escolaridade2+ 1,46 Escolaridade3+0,57 Formaçãosim 6 pi:probabilidade de acertar todas as perguntas Tabela 8 – Estimativa dos parâmetros estimados no modelo linear generalizado para a variável resposta “acerta todas as questões” Co-Variável Intercept Escolaridade2 Escolaridade3 Sexo = Masculino Formação=Sim β -2,2780 1,0196 1,4644 - 0,5138 0,5698 DP 0,3977 0,3747 0,4584 0,1793 0,1861 P-value <0,001 0,0065 0,0014 0,0042 0,0022 Exp(β) (OR) 0,1025 2,7722 4,3248 0,5982 1,7678 IC OR (95%) [0,047-0,2235] [1,3302-5,7773] [1,7609-10,6216] [0,4209-0,8502] [1,2275-2,5461] Escolaridade de referência=5º ano; Escolaridade1=5ºano; Escolaridade2=6º ano; Escolaridade3= [7-9º anos] De acordo com o modelo estimado, os alunos que receberam formação têm uma chance/possibilidade 76% superior de acertar todas as perguntas, comparativamente ao grupo que não recebeu formação, controlando para as restantes co-variáveis incluídas no modelo. A análise das premissas subjacentes ao modelo foi efectuada através da análise gráfica. Verificouse que o ajustamento do modelo aos dados era razoável. QUESTIONÁRIO GERAÇÃO SAUDÁVEL -2ªParte O número médio de opções seleccionadas por cada aluno na questão X foi 2,10 (dp=1,47) [mediana=2, mínimo=0, máximo=7]. Relativamente à questão XI, o número médio de opções seleccionadas por cada aluno foi 1,51 (dp=0,94) [mediana=1, máximo =5 e mínimo=0]. A maioria dos alunos (48,1%) seleccionou apenas uma opção. A distribuição das proporções de alunos que assinalaram cada uma das opções possíveis para a questão “X.Com quem tiras as dúvidas sobre ti e sobre o teu crescimento?” encontra-se na tabela 9. Os alunos indicaram recorrer mais frequentemente aos pais (77,7%) e ao farmacêutico (31,1%) para esclarecer dúvidas sobre o seu crescimento. Tabela 9- Distribuição das respostas à questão “X.Com quem tiras as dúvidas sobre ti e sobre o teu crescimento?” “Com quem tiras as dúvidas sobre ti e sobre o teu crescimento?” n (%) Pais 625 (77,7) Professores 172 (21,4) Familiares 157 (19,5) Farmacêutico 250 (31,1) Médico 198 (24,6) Enfermeiro 123 (15,3) Amigos 164 (20,4) *As proporções não somam 100%, porque existia a possibilidade de selecção de mais do que uma opção de resposta Relativamente à questão “XI. Onde é que normalmente procuras informação sobre ti e sobre o teu crescimento?” a distribuição de respostas encontra-se na tabela 10. A maioria (62,45%) dos inquiridos assinalou apenas uma opção de resposta. Mais de 50% dos alunos referiu normalmente consultar os livros para obter informação sobre o seu crescimento e 40% indicou a internet como 7 fonte de informação. A proporção de alunos que referiu procurar informação em vídeos, foi superior entre os rapazes (18,7 vs 11,5), sendo a diferença significativa (p-value=0,005). A proporção de alunos que referiu procurar informação na televisão, foi superior entre os rapazes (22,5 vs 13,9), sendo a diferença significativa (p-value=0,002). Nas restantes opções não se verificaram diferenças significativas entre os sexos. Tabela 10- Distribuição das respostas à questão “XI.Onde é que normalmente procuras informação sobre ti e sobre o teu crescimento?” “Onde é que normalmente procuras informação sobre ti e sobre o teu crescimento?” n (%) Livros 435 (54,1) Vídeos 123 (15,3) TV 150 (18,7) Internet 322 (40,0) Folhetos 187 (23,3) *As proporções não somam 100%, porque existia a possibilidade de selecção de mais do que uma opção de resposta 8