AMOSTRAGEM Def: Ramo da Estatística que estuda técnicas de planejamento de pesquisa para possibilitar inferências sobre um universo a partir do estudo de uma pequena parte de seus componentes. Universo ou população = Conjunto de todos possíveis elementos (todo o grupo) que podem fazer parte do estudo. Exemplos: Altura média dos médicos do HC. População = Todos os médicos do HC; Percentual de peças com problemas numa fabrica. População= Todas as peças fabricadas. Efeitos de uma técnica nova de aprendizado para crianças com problemas aprendizagem. População = Todas crianças com problemas de aprendizado O pesquisador é que define a sua população, baseado no grau de abrangência que pretende tirar do seu estudo. Pode ter restrições geográficas, temporais ou de outras ordens. AMOSTRA : Pequena parte da população que se deseja estudar, fração da população alvo. Amostra1 População de idosos em Rib. Preto Amostra2 Logicamente quanto mais semelhante, mais parecida, mais próxima for a amostra da população mais consistente serão seus resultados, mais poderosas suas inferências, melhor o seu trabalho. Vantagens: Custo menor, resultado em menor tempo, dados mais fidedignos (??), ordem ética (novas drogas, vacinas). Linhas gerais de PLANEJAMENTO AMOSTRAL idealizado: 1 - Definição dos objetivos da pesquisa (não só no plano amostral), incluindo a população a ser amostrada, o universo dos possíveis participantes 2 - Escolha das variáveis a serem observadas em cada unidade amostral, conforme o tipo de variável há um tipo de cálculo de tamanho amostral. 3- Especificação do grau de precisão desejado (adiante mais detalhes), quanto maior a amostra (até um certo ponto) maior o grau de certeza a respeito dos resultados obtidos. 4 - Escolha dos instrumentos de medida (ex:questionário) e da forma de abordagem (ex: clássico) 5 - Realização de uma prova experimental, piloto, pré-teste; é conveniente pois testem-se os instrumentos de medida, o tempo, o custo, possíveis interferências não previstas, fornece estimativas, orienta ajustes necessários. 6 - Cálculo do tamanho da amostra, conhecido seus componentes. Estratégias ou Tipos de Amostragem Amostragem aleatória(probabilística) simples: Cada componente da população tem a mesma chance de ser escolhido para compor a amostra, através de uma seleção aleatória (ex: sorteio). Pode ser com ou sem reposição. Amostragem aleatória estratificada: A população é dividida em estratos subpopulações, havendo maior homogeneidade dentro dos elementos de cada estrato do que entre estratos diferentes. Os estratos devem respeitar a proporcionalidade com a população. Por exemplo, se sabemos que 70% dos elementos de uma escola são mulheres, 70% da nossa amostra deve ser de mulheres. A amostra foi estratificada por sexo. Dentro de cada estrato realiza-se uma amostragem simples. Amostragem por conglomerados: Conglomerado é um conjunto de unidades amostrais, p.ex. se crianças são a unidade amostral, as escolas são conglomerados. Cada conglomerado é uma miniatura da população, os conglomerados mais numerosos fornecerão mais unidades amostrais. Amostragem por estágios múltiplos: É uma combinação de dois ou mais planos amostrais. Por exemplo, pode-se fazer uma amostra aleatória simples na qual as unidades amostrais são os conglomerados e dentro dos conglomerados realizar-se uma amostra aleatória estratificada. Ausência de resposta Falha na obtenção dados de uma unidade amostral. Motivos: Unidade não encontrada; o entrevistado não sabe, não pode, recusa-se a responder; perda, extravio do dado; apresenta viés... Soluções: Reposição, substituição, da unidade amostral. Seleciona-se aleatoriamente uma nova unidade amostral. Se não for possível, em alguns casos pode-se estimar o valor que seria fornecido pela unidade perdida. Existem técnicas estatísticas que permitem estimar o valor perdido, substituir pela média, pelo valor semelhante ao que outra unidade com características parecidas forneceu,... Tamanho da amostra É conveniente, e cada vez mais cobrado por bancas e referers, planejar a priori o tamanho da amostra, para que se possa ter uma amostra suficiente para detectar uma diferença importante. Por outro lado, se não há planejamento, uma amostra excessivamente grande pode tornar diferenças irrelevantes em estatisticamente significativas, fora o tempo e o dinheiro jogados fora. Lembre sempre da diferença estatística e da diferença prática O que ou quem determina o tamanho da amostra ?? A pergunta da pesquisa, a hipótese a ser testada pelo pesquisador, conforme o desenho do estudo, o tipo das variáveis e, secundariamente, a precisão que o pesquisador deseja obter nos seus resultados. Cálculo do tamanho da amostra para a realização dos testes mais comuns 1 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos a média obtida nos nossos dados com uma média conhecida (da literatura, oficial, pesquisas anteriores), sendo s estimado a partir de algo,ou de um pré-levantamento. (s verdadeiro é desconhecido) -Tipo de variável envolvida: Quantitativa contínua ou discreta, ou até mesmo categórica ordinal .Teoricamente com distribuição Normal. Conhecimentos a priori: Diferença a ser detectada: É o valor da diferença entre a média conhecida e a média que será estimada dos nossos dados, que é considerada relevante pelo pesquisador. O valor que diferente da média conhecida produzirá uma mudança de comportamento, de padrão, de conhecimento. Ex: Sabe-se que pacientes com a doença X tem sobrevida de 40 meses, uma nova terapia esta sendo testada e será considerada superior se aumentar para 48 meses a sobrevida. Diferença a ser detectada é de 8 meses Desvio padrão (s): Estimado a partir dos nossos dados ou de outra fonte. Nível de significância (): Probabilidade de cometer o erro do tipo I, a chance de dizer que as médias são diferentes quando são iguais. H0: Média conhecida = média estim. X H1:Média conhecida média est. Normalmente utiliza-se 0.05 (5%), se pretendemos diminuir a chance desse erro para menos (0.01) paga-se o preço coletando uma amostra maio Poder do teste (1-): Probabilidade de detectar uma real diferença, se ela realmente existir. Normalmente utiliza-se 0.80 (80%), se pretendemos aumentar esta chance para mais (90%) paga-se o preço coletando uma amostra maior. Tipo do teste: Bicaudal, se há diferença (para cima ou para baixo) entre as médias ou Monocaudal, se interessa a diferença só para um lado. Na maioria esmagadora das vezes utiliza-se o Bicaudal. Portanto conhecimentos a priori: Diferença a ser detectada, Nível de significância (), Desvio padrão (s), Poder do teste (1-) e Tipo do teste Vamos em ‘Stats’, depois em ‘Power and Sample Size’ e finalmente em ‘1 Sample t’ Surgirá a tela onde colocaremos 8 (48-40) no campo Difference, 0.80 em ‘Power values’ e 10 em ‘Sigma’ que é o desvio padrão. Se clicarmos em ‘Options’ obteremos a seguinte tela. Repare que o tipo do teste de hipóte se já esta especificado como “Not equal” que é o mesmo que bicaudal bem como o nível de significância de 0.05 . Para alterar alguns deles basta alterar. Clicando em OK voltamos na tela anterior e novamente em OK temos o resultado. Power and Sample Size 1-Sample t Test Testing mean = null (versus not = null) Calculating power for mean = null + difference Alpha = 0,05 Sigma = 10 Difference 8 Sample Size 15 Target Power 0,8000 Actual Power 0,8213 Então para um = 0.05, 1- = 0.80, um dp = 10, num teste bicaudal é necessária uma amostra de tamanho 15 para se detectar um diferença de 8 em relação a 40. Se nesta amostra de 15 nossa média for 48 (ou 32) a diferença entre a nossa média e a conhecida será significativa (p 0.05 2 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos duas médias obtidas de uma amostra. Exemplo:Desejamos saber se o uso de anticoncepcional aumenta a pressão sistólica nas mulheres de 30 a 35 anos. Os médicos estabeleceram que qua quer diferença na ordem de 10 mmHg é importante. O desvio padrão é de 20 mmHg. Tipos de variáveis envolvidas:Quantitativa contínua ou discreta, ou até mesmo categórica ordinal que é a que será medida e a variável referente ao grupos, que pode ser categórica ordinal, nominal ou uma var. quantitativa que foi categorizada.Teoricamente a 1a. var.com distribuição Normal. Conhecimentos a priori: Diferença a ser detectada: Já especificada anteriormente Desvio padrão: Já fornecido (na verdade teria de ser estudado). Nível de significância, poder do teste e tipo do teste de hipótese: Adotaremos o padrão, 0.05; 0.80, Bicaudal. Voltamos à tela em ‘Power and Sample Size’ e vamos em ‘2 Sample t’. Surge uma nova tela onde colocamos os valores já definidos e damos OK Temos então para as condições estabelecidas que coletar uma amostra 2-Sample t Test Testing mean 1 = mean 2 (versus not =) Calculating power for mean 1 = mean 2 + difference Alpha = 0,05 Sigma = 20 Sample Target Actual Difference Size Power Power 10 64 0,8000 0,8015 Atenção, o n = 64 é o tamanho de cada grupo 3 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos mais de duas médias obtidas de uma amostra. Exemplo:Desejamos saber se o uso de determinadas técnicas fisioterapêuticas diminui o tempo de recuperação para determinada lesão. Sabe-se que a técnica padrão leva 60 dias para a recuperação e serão testadas 2 novas técnicas e uma terceira que é combinação das 2. Como são técnicas custosas estamos interessados em diferenças a partir de 15 dias. O desvio padrão é de 7 dias (estudos prévios). Tipos de variáveis envolvidas:Quantitativa contínua ou discreta, ou até mesmo categórica ordinal que é a que será medida e a variável referente aos grupos, que pode ser categórica ordinal, nominal ou uma var. quantitat que foi categorizada.Teoricamente a 1a. var.com distribuição Normal. Conhecimentos a priori Número de níveis, fatores, grupos, tratamentos,.. = 4 Diferença a ser detectada: Já especificada anteriormente Desvio padrão: Já fornecido. Nível de significância, poder do teste e tipo do teste de hipótese: Adotare mos o padrão, 0.05; 0.80, Bicaudal. Voltamos à tela em ‘Power and Sample Size’ e vamos em ‘Oneway ANOVA’. Na nova tela especificamos o no. de tratamentos, a dif. mínima a ser detectada, o poder e o dp e damos Ok. Portanto necessitaríamos de uma amostra de 6 elementos em cada grupo. One-way ANOVA Sigma = 7 Alpha = 0,05 Number of Levels = 4 Sample Target Actual Maximum SS Means Size Power Power Difference 112,5 6 0,8000 0,8158 15 4 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos uma proporção (percentual) em um experimento com uma proporção conhecida da população. Exemplo: Sabe-se que o percentual de crianças nascidas a pré-termo com problemas de aprendizagem é 40%. Um novo método de ensino para estas crianças foi desenvolvido, e será adotado se este percentual cair para 30%. Tipos de variáveis envolvidas:Qualitativa nominal, ou outros tipos que foram categorizadas. Conhecimentos a priori: Proporção na população: É o valor da proporção conhecido na população de estudos anteriores, da literatura, ou outras fontes. Se não tiver a menor idéia use 0.50 que fornecerá o maior tamanho de amostra. Segurança. Proporção sugerida (a ser detectada): É a proporção que se pretende observar, que se deseja obter. Nível de significância, poder do teste e tipo do teste de hipótese: São os mesmos Adotaremos o padrão, 0.05; 0.80, Bicaudal. Voltamos à tela em ‘Power and Sample Size’ e vamos em ‘1 Proportion’ Na nova tela inserimos a proporção sugerida em ‘Alternative values of p’ o poder do teste e em ‘Hypothesized p ‘ colocamos o valor da proporção conhecido na população. E OK Portanto se amostramos 182 crianças e o percentual delas com problemas for igual ou inferior a 30% (55) a diferença entre 30% e 40% será Test for One Proportion Testing proportion = 0,4 (versus not = 0,4) significativa ( p 0.05) O novo método será Alpha = 0,05 Alternative Sample Target Actual eficaz. Proportion 0,300000 Size 182 Power 0,8000 Power 0,8020 5 - Situação onde desejamos calcular um tamanho de amostra (n), com o objetivo de compararmos duas proporções obtidas em uma amostra Exemplo: Pacientes tratados com a droga A apresentam índice de melhora de 70%; os pacientes tratados com a droga B apresentam melhora de 85%. Qual o tamanho da amostra para que a diferença entre estas proporções se já significante? Tipos de variáveis envolvidas:Duas vars. qualitativa nominis, ou outros tipos que foram categorizadas. Uma para os tratamentos e a outra referente ao índice de melhora. Conhecimentos a priori: As duas proporções estimadas: Proporções estimadas de estudos anteriores, literatura, de experimentos prévios, da experiência. Nível de significância, poder do teste e tipo do teste de hipótese: São os mesmos Adotaremos o padrão, 0.05; 0.80, Bicaudal. Voltamos pela enésima tela em ‘Power and Sample Size’ e vamos em`2 Proportions Na nova tela inserimos os valores das nossas proporções (70% e 85%) e o poder do teste. E OK Portanto são necessário 121 pacientes em cada tratamento para que 85% seja significativamente superior a 70%. Test for Two Proportions Testing proportion 1 = proportion 2 (versus not =) Calculating power for proportion 2 = 0,85 Alpha = 0,05 Sample Target Actual Proportion 1 Size Power Power 0,700000 121 0,8000 0,8017 Nos estudos prospectivos, pode-se calcular um tamanho de amostra apropriado, com poder de teste controlado. Trabalhos consistentes do ponto de vista metodológico (estatístico). Nos estudos retrospectivos, quando em muitas situações não é possível se calcular um tamanho de amostra (não há mais dados disponíveis) pode-se estimar o poder do teste ( probabilidade de se detectar uma real diferença se ela realmente existir), de modo a termos real noção do nosso resultado. Exemplo: Depois de uma revisão de pastas, verificou-se que pac. portado res de um determinado gene Y tem glicemia média de 80 e os não portado res de média de 100. Haviam 7 pacientes em cada grupo e dp foi 15. Após irmos e ‘2- Sample t’ temos a tela onde colocaremos o tamanho dos grupos (7), a diferença detectada (100-80=20) e o dp = 15 e OK 2-Sample t Test Então para uma amostra de Testing mean 1 = mean 2 (versus not =) 7 em cada grupo a chance de Calculating power for mean 1 = mean 2 detectarmos uma diferença se + difference Alpha = 0,05 Sigma = 15 ela realmente existir(com os Sample parâmetros estipulados) é de Difference Size Power 63%. 20 7 0,6301 20 14 0,9243 Repare que se dobrarmos o tamanho da amostra o poder do nosso teste vai para 92.4% Para delineamentos mais complexos que exijam testes mais sofisticados existem fórmulas de cálculo de tamanho de amostra específicos. Quando não houver a menor idéia das diferenças a serem detectadas, ou das estimativas necessárias para o cálculo de um tamanho amostral a priori, siga a seguinte regra para responder à pergunta qual o tamanho da amostra ? Dentro da sua possibilidade de TEMPO(de conclusão, de obter amostras, de paciência,...) e de CUSTO (de obter amostras ou de qquer origem) COLETE A MAIOR QUANTIDADE POSSÍVEL DE DADOS.