No estudo de fenômenos relacionados à saúde, muito poucas vezes utiliza-se de censo: em geral trabalha-se com amostra. Censo é um levantamento que inclui todos os elementos da população-alvo. Amostra é uma parte dessa população-alvo. População-alvo é o conjunto de elementos de interesse para um dado problema. Amostragem é o ato de obter amostra de uma população-alvo. Na população urbana de 20 a 59 anos residente no município de Prudente, SP, qual a proporção de hipertensos ? qual a proporção de diabéticos ? qual a média de colesterol total ? População urbana de 20-59 anos residente em Prudente O pesquisador não tem tempo nem dinheiro para estudar toda a população-alvo, mas quer respostas àquelas perguntas... O que pode ser feito ? 5 Amostragem Tipos de amostragem Probabilística Não probabilística - quando há sorteio Identifique a população-alvo e diga se a amostra é probabilística Em sua edição de domingo, 06/04/1986, o jornal O Estado de S. Paulo publica à página 12, sob o título "O favorito na Capital e GSP", resultado de prévia eleitoral para governador do Estado, que em parte é resumido a seguir. Em sondagem telefônica da Salles/Interamericana de Publicidade, de 29 de março a 02 de abril, foi ouvido um universo de 510 pessoas, sendo 355 na Capital e 155 na Grande São Paulo (GSP), que responderam à seguinte pergunta: "Se a eleição fosse hoje, em qual destes candidatos o(a) Sr(a). votaria para governador do Estado de São Paulo?" Candidato Antonio Ermírio de Morais (sem partido) Paulo Salim Maluf (PDS) Orestes Quércia (PMDB) Eduardo Matarazzo Suplicy (PT) Indecisos Nenhum dos quatro Anulados Capital 31 23 14 13 12 5 2 GSP 32 17 14 15 19 3 0 Total 31,3 21,2 14,0 13,6 14,1 4,4 1,4 Um biotério contém 1.000 ratinhos, dispostos em 100 gaiolas com 10 ratinhos cada. Um investigador, que suspeita seja a droga enfermina uma depressora do sistema nervoso central, resolve testar essa hipótese em uma amostra de 100 desses ratinhos. Para tanto, sorteia 50 gaiolas, e retira 2 ratinhos de cada uma, apanhando os dois primeiros capturados em cada gaiola. Hammond e Horn (1968) realizaram estudo em coortes da relação entre fumo e câncer de pulmão, incluindo 187.783 homens brancos com idades entre 50 e 69 anos. Contaram com a colaboração de 22.000 trabalhadoras voluntárias da American Cancer Society que se prontificaram a conseguir, cada uma, que cerca de 10 homens seus conhecidos, com as especificações de definição da população, preenchessem um questionário sobre o seu comportamento em relação ao tabagismo. Na avaliação da eficácia da vacina contra a hepatite B, metade da população de uma cidade voluntariou-se a receber a vacina. O grupo-controle ficou sendo a outra metade que não quis receber a vacina. Na amostragem probabilística a unidade amostral tem probabilidade conhecida e diferente de zero de fazer parte da amostra, o que não ocorre com a não-probabilística. Unidade amostral é a unidade básica (pessoa, residência, quarteirão) em torno da qual o procedimento amostral é planejado. Tipos de amostragem probabilística casual simples casual estratificada simples por conglomerados etapas múltiplas sistemática Número Nome casual simples Lista de todos os elementos da população-alvo Probabilidade igual para todos 223 Gustavo Montalvão 224 Alaíde Correia e Castro 225 Hilderaldo Luís Mancini 226 Ernestina Orlandi 227 Pu Lan Me 228 Tatiana Ishikawa 229 Washington Bispo dos Santos 230 Maria Almerinda Vieira 231 Beatriz Helena Klotz 232 Itiro Sawada 233 Natalício da Costa 234 Débora Pereira Pimental 235 Cristiano Varella 236 Eunice Ribeiro Tozaki 237 Priscila Costa Shimazu 238 Fernanda Casé Alencar 239 Kléber Machado da Silva 240 Andréia Hirschfield 241 Emerenciana Vilela Botelho 242 Francisco Gonçalves Moreira Número Nome Sorteia-se um indivíduo da lista e, a partir deste, tomase o xo seguinte, sistematicamente sistemática 223 Gustavo Montalvão 224 X Alaíde Correia e Castro 225 Hilderaldo Luís Mancini 226 Ernestina Orlandi 227 Pu Lan Me 228 Tatiana Ishikawa 229 X Washington Bispo dos Santos 230 Maria Almerinda Vieira 231 Beatriz Helena Klotz 232 Itiro Sawada 233 Natalício da Costa 234 X Débora Pereira Pimental 235 Cristiano Varella 236 Eunice Ribeiro Tozaki 237 Priscila Costa Shimazu 238 Fernanda Casé Alencar X 239 Kléber Machado da Silva 240 Andréia Hirschfield 241 Emerenciana Vilela Botelho 242 Francisco Gonçalves Moreira Número Nome Pode ocorrer que a população-alvo apresente desproporção de interesse (por exemplo, sexo), que o pesquisador deseje manter na amostra... casual estratificada Sexo 223 Gustavo Montalvão M 224 Alaíde Correia e Castro F 225 Hilderaldo Luís Mancini M 226 Ernestina Orlandi F 227 Pu Lan Me F 228 Tatiana Ishikawa F 229 Washington Bispo dos Santos M 230 Maria Almerinda Vieira F 231 Beatriz Helena Klotz F 232 Itiro Sawada M 233 Natalício da Costa M 234 Débora Pereira Pimental F 235 Cristiano Varella M 236 Eunice Ribeiro Tozaki F 237 Priscila Costa Shimazu F 238 Fernanda Casé Alencar F 239 Kléber Machado da Silva M 240 Andréia Hirschfield F 241 Emerenciana Vilela Botelho F 242 Francisco Gonçalves Moreira M Número Nome Uma maneira de fazer isto é organizar listas diferentes para cada sexo Número Nome Sexo 223 Gustavo Montalvão M 225 Hilderaldo Luís Mancini M 229 Washington Bispo dos Santos M 232 Itiro Sawada M 233 Natalício da Costa M 235 Cristiano Varella M 239 Kléber Machado da Silva M 242 Francisco Gonçalves Moreira Sexo M 224 Alaíde Correia e Castro F 226 Ernestina Orlandi F 227 Pu Lan Me F 228 Tatiana Ishikawa F 230 Maria Almerinda Vieira F 231 Beatriz Helena Klotz F 234 Débora Pereira Pimental F 236 Eunice Ribeiro Tozaki F 237 Priscila Costa Shimazu F 238 Fernanda Casé Alencar F 240 Andréia Hirschfield F 241 Emerenciana Vilela Botelho F e sortear em separado, fazendo a amostra conter proporções diferentes de cada sexo Neste caso, 60:40 simples por conglomerados etapas múltiplas Município Distritos Bairros Setores censitários Quarteirões Ruas Domicílios Moradores 1 2 6 14 23 22 21 15 16 17 18 7 20 19 24 29 28 25 26 27 30 37 36 35 31 32 33 34 38 39 41 40 4 3 13 5 12 11 10 8 9 Domicílio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 Endereço Av. Dorval, 2344 Av. Dorval, 2360 Av. Dorval, 2370 Av. Dorval, 2376 R. Mengálvio, 1174 R. Mengálvio, 1178 R. Mengálvio, 1184 R. Mengálvio, 1188 R. Mengálvio, 1194 R. Coutinho, 250 R. Coutinho, 246 R. Coutinho, 242 R. Coutinho, 234 Av. Dorval, 2390 Av. Dorval, 2394 R. Nascimento, 1176 R. Nascimento, 1180 R. Nascimento, 1182 Trav. Pepe, 49 Trav. Pepe, 45 R. Mengálvio, 1187 R. Mengálvio, 1179 R. Mengálvio, 1177 Trav. Pepe, 44 Trav. Pepe, 48 R. Nascimento, 1190 Trav. Edu, 49 Trav. Edu, 45 R. Mengálvio, 1197 Trav. Edu, 44 Trav. Edu, 48 R. Nascimento, 1206 R. Nascimento, 1208 Trav. Clodoaldo, 49 Trav. Clodoaldo, 45 R. Mengálvio, 1209 R. Mengálvio, 1207 Trav. Clodoaldo, 44 Trav. Clodoaldo, 48 Trav. Lula, 49 Trav. Lula, 45 População urbana de 20-59 anos residente em Prudente Tamanho da amostra: 300 pessoas de 20-59 anos de idade Sorteio Amostra Média de colesterol total obtida nessa amostra probabilística = 200 mg/dl A pergunta que fica é: Qual a VERDADEIRA média na população da qual a amostra foi retirada ? A resposta é: Não se sabe com certeza , A resposta é: Não se sabe com certeza , mas com 95% de confiança ela deve estar entre 196 e 204 mg/dl ! Intervalo de confiança de 95% mas com 95% de confiança ela deve estar entre 196 e 204 mg/dl ! Intervalo de confiança de 95% num parâmetro populacional estimado por amostragem probabilística O intervalo de confiança sempre é calculável se o estudo foi feito por amostragem probabilística Em um censo o cálculo de intervalo de confiança não faz sentido, porque o estudo de todos os elementos da população-alvo fornece o verdadeiro parâmetro populacional. O intervalo de confiança sempre é calculável se o estudo foi feito por amostragem probabilística Quem garante isso é o chamado teorema do limite central Suponha que esta seja a distribuição real da idade de todas as 6.000 mães de que deram à luz em 2001 no município de Santos. 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 Freq 12 24 72 114 192 300 464 524 500 446 410 340 350 396 346 256 142 % 0,2 0,4 1,2 1,9 3,2 5,0 7,7 8,7 8,3 7,4 6,8 5,7 5,8 6,6 5,8 4,3 2,4 Idade 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 Freq 600 % 48 0,8 48 0,8 78 1,3 114 1,9 136 2,3 184 3,1 184 3,1 130 2,2 70 1,2 26 0,4 6 0,1 6 0,1 12 0,2 30 0,5 30 0,5 10 0,2 ----- ---Total 6000 100,0 500 Freqüência Idade 400 300 200 100 0 12 16 20 24 28 32 36 40 Idade da mãe Observa-se que a distribuição populacional é muito diferente da distribuição normal. 44 Esta é a distribuição das médias de 100 amostras aleatórias (com reposição) de tamanho 30. 23,37 23,57 25,73 22,30 23,40 22,70 24,70 22,93 23,17 23,87 24,20 24,13 22,03 25,07 22,23 24,67 23,23 22,37 23,60 24,23 24,30 24,87 23,47 23,33 25,70 24,83 23,90 23,70 25,97 23,43 25,87 23,20 23,33 23,03 24,20 23,97 22,03 25,00 22,03 23,13 24,53 23,73 24,10 23,30 22,97 22,73 23,40 23,47 25,67 22,63 23,70 22,97 23,83 22,23 23,33 23,07 24,90 23,43 24,20 21,77 23,53 26,63 24,43 23,63 25,50 25,63 24,00 26,27 23,10 22,53 21,33 22,50 23,83 24,27 22,27 40 Freqüência 24,47 22,20 25,27 22,13 23,77 26,53 24,70 23,57 23,67 23,23 24,43 24,37 22,30 22,67 24,30 24,30 24,37 25,10 23,17 25,77 25,20 22,77 24,33 24,83 23,30 30 20 10 0 21 22 23 24 25 Distribuição das médias 26 PÁGINA A Association between depressive symptoms and mortality in older women JUSTIFICATIVA: A depressão grave está associada com mortalidade aumentada, mas não se sabe se pacientes que relatam sintomas de depressão têm maior mortalidade. PARTICIPANTES E MÉTODOS: Realizamos um estudo prospectivo de coortes com 7518 mulheres brancas de 67 ou mais anos de idade, selecionadas a partir de listas de base populacional em Baltimore, Minneapolis, Portland, e no Monongahela Valley. As participantes responderam ao Geriatric Depression Scale (versão reduzida) e eram consideradas depressivas quando relatassem 6 ou mais de 15 possíveis sintomas de depressão. Todas as mulheres foram acompanhadas pelo tempo médio de 6 anos. Em caso de falecimento, obtínhamos cópia do certificado de óbito e, se disponível, o prontuário hospitalar. Usando a Classificação Internacional de Doenças, agrupamos as causas de mortes em: cardiovasculares, neoplásicas, ou não-cardiovasculares, não-neoplásicas. RESULTADOS: A mortalidade durante os 7 anos de seguimento variou de 7% em mulheres sem sintomas de depressão, 17% naquelas com 3 a 5 sintomas, e 24% naquelas com 6 ou mais sintomas de depressão (p<0,001). De 473 mulheres (6,3%) com 6 ou mais sintomas depressivos no início, 24% morreram (111 óbitos em 2610 mulheresanos de seguimento), contra 11% das mulheres que tinham 5 ou menos sintomas de depressão [760 óbitos em 41.460 mulheres-anos (p<0,001)]. Mulheres com 6 ou mais sintomas depressivos apresentaram o dobro de risco de morte daquelas com 5 ou menos sintomas [hazard ratio (HR) ajustado para idade: 2,14; intervalo de confiança (IC) de 95%: 1,75-2,61; p<0,001]. Esta associação persistiu após ajuste para possíveis variáveis de confusão, incluindo história de infarto do miocárdio, derrame, diabetes melito, hipertensão, doença pulmonar obstrutiva crônica, tabagismo, percepção de saúde e função cognitiva (HR: 1,47; ICde95%: 1,14-1,88; p=0,003). Sintomas depressivos associaram-se com risco ajustado de morte por doenças cardiovasculares (HR: 1,8; ICde95%: 1,2-2,5; p=0,003) e por doenças não-neoplásicas e não-cardiovasculares (HR: 1,8; ICde95%: 1,2-2,7; p=0,01), mas não se associaram com mortes por doenças neoplásicas (HR: 1,0; ICde95%: 0,6-1,7; p=0,93). CONCLUSÕES: Sintomas depressivos são importantes fatores de risco para mortalidade por doenças cardiovasculares, não-neoplásicas e não-cardiovasculares, mas não por doenças neoplásicas, em mulheres idosas. Resta saber se sintomas depressivos são apenas marcadores ou causas em si de condições que ameaçam a vida.