Universidade do Estado do Rio de Janeiro L@MPADA – informática Médica Bioestatística Prof. Liana 2006/1 Ementa Bioestatística (45 h) Aula Teórica Estatística – Conceitos Organização e Apresentação de Dados Medidas de posição e dispersão Probabilidade e Distribuições de Probabilidade Intervalos de confiança Testes de Hipóteses Correlação e Regressão Introdução a Técnicas Não-Paramétricas Ementa Bioestatística (45 h) Aulas práticas Bibliografia TRIOLA, M. Introdução à estatística. 9 ed. Rio de Janeiro: LTC, 2005. Cronograma das aulas Data Conteúdo horário 08/05/06 Unidade 1 + Unidade 2 (até tabelas) 8:00 – 12:00 15/05/06 Unidade 2 (gráficos) 8:00 – 12:00 22/05/06 Unidade 3 (posição) 10:00 – 12:00 29/05/06 Unidade 3 (dispersão) 10:00 – 12:00 05/06/06 Unidade 4 (probabilidade e dist. de prob.) 8:00 – 12:00 12/06/06 Avaliação 1 8:00 – 12:00 19/06/06 Unidade 5 (intervalos de confiança) 8:00 – 12:00 26/06/06 Unidade 6 (teste de hipóteses - + teste t) 8:00 – 12:00 03/07/06 Unidade 6 (teste qui) 8:00 – 12:00 10/07/06 Unidade 6 (ANOVA) 8:00 – 12:00 17/07/06 Unidade 7 (Correlação e regressão) 8:00 – 12:00 24/07/06 Unidade 8 (testes não paramétricos) 8:00 – 12:00 31/07/06 Avaliação 2 8:00 – 12:00 Conceitos Estatística Estatística Indutiva e Inferencial Bioestatística Exemplos de utilização da bioestatística População e amostra Parâmetro e estatística Dados primários e secundários Censo Variável Conceitos Estatística: é a ciência que tem por objetivo planejar, coletar, tabular, analisar e interpretar informações e delas extrair conclusões que permitam a tomada de decisões acertadas mediante incertezas. Áreas: Estatística Descritiva Estatística Inferencial ou Indutiva e Bioestatística: aplicação da estatística nos campos relacionados a saúde. Bioestatística na Medicina Avaliação da literatura. Aplicação de resultados de estudos no atendimento aos pacientes. Interpretação de estatísticas vitais. Interpretação de informações sobre fármacos e equipamentos. Utilização de procedimentos diagnósticos. Manter-se informado. Avaliação de protocolos de estudo e artigos. Participação ou coordenação de projetos de pesquisa. Conceitos População: é o conjunto de elementos (valores, pessoas, medidas etc) que tem pelos menos uma característica em comum. População do município do Rio de Janeiro; População de pacientes internados no HUPE; População de pacientes atendidos ambulatório de dermatologia do HUPE; no População de ratos Wistar machos do Biotério da Faculdade de Medicina da UERJ População de seringas descartáveis do Posto de Saúde do bairro de Vila Isabel. Amostra: é um subconjunto de elementos extraídos de uma população. Conceitos Parâmetro: é uma medida numérica que descreve uma característica de uma população. Estatística: é uma medida numérica que descreve uma característica da amostra. Dados primários: dados coletados pelo próprio pesquisador e sua equipe. Dados secundários: não foram obtidos pelo pesquisador e sua equipe (diversas fontes como artigos em periódicos, institutos de pesquisa, DATASUS, IBGE, OMS, OPAS). Conceitos Censo: é uma coleção de dados relativos a todos os elementos de uma população. Variável: é a característica de interesse que é medida em cada elemento da amostra ou população, podendo ter resultados numéricos ou não. Seus valores variam de elemento a elemento. Variáveis Classificação Nominal Qualitativa Ordinal Variável Discreta Quantitativa Contínua Tipos de estudo Estudo observacional: verificamos e medimos características específicas, mas não tentamos manipular ou modificar os elementos a serem estudados. Estudo transversal: dados são observados, medidos e coletados em um ponto no tempo. Estudo retrospectivo ou de caso controle: os dados são coletados do passado, voltando-se no tempo. Estudo prospectivo ou longitudinal ou de coorte: os dados são coletados no futuro, de grupos (coortes) que compartilham fatores comuns. Tipos de estudos Experimento: aplicamos determinado tratamento e passamos então a observar seus efeitos sobre os elementos a serem pesquisados. Confundimento: ocorre em um experimento quando o pesquisador não está apto a distinguir os efeitos de diferentes fatores. Experimentos Controlando os efeitos das variáveis Experimentos cegos: o sujeito não sabe se está recebendo o tratamento ou o placebo. Blocos: para testar a eficácia de um ou mais tratamentos é importante colocar os sujeitos em grupos diferentes (ou blocos) de tal modo que os grupos sejam muito semelhantes. Planejamento experimental completamente aleatorizado: os sujeitos são colocados nos blocos através de um processo de seleção aleatória. Planejamento rigorosamente controlado: sujeitos são escolhidos cuidadosamente de modo que em cada bloco sejam similares. Tipos de estudos Levantamento de dados Problemas usuais - Representatividade Fator associado à forma de amostragem. Na seleção da amostra procura-se reproduzir as características observáveis da população - uso do critério de proporcionalidade. Em caso de desconhecimento da composição da população deve-se utilizar algum critério de aleatoriedade (sorteio). Amostra tendenciosa – conclusões sem consistência. Levantamento de dados Problemas usuais – Fidedignidade Relacionada à precisão ou qualidade dos dados. Motivos da falta de precisão: Falhas nos instrumentos de aferição; Problemas nos questionários empregados na obtenção dos dados; Falha humana. Amostragem Se os dados amostrais não forem coletados de maneira apropriada, eles podem ser de tal modo inúteis que nenhuma manipulação estatística poderá salvá-los. A aleatoriedade comumente desempenha papel crucial na determinação de quais dados coletar. Amostragem Vantagens do levantamento por amostragem: custo menor, menor tempo e objetivos mais amplos. Situações para trabalho com amostras: população muito grande, dificuldade de acesso, grande número de variáveis. Tipos Aleatória Estratificada Sistemática Conglomerados Conveniência Amostragem Apresentação de dados - Tabelas Componentes Representação tabular Apresentação de tabelas A tabela deve ser simples, claras e objetivas. Grandes volumes de dados devem ser divididos em várias tabelas. A tabela deve ser auto-explicativa. Nenhuma casa da tabela deve ficar em branco, apresentando sempre um número ou um símbolo. As tabelas, excluídos os títulos, serão delimitadas, no alto e em baixo, por traços horizontais grossos, preferencialmente. Representação tabular Apresentação de tabelas Recomenda-se não delimitar as tabelas à direita e à esquerda, por traços verticais. Será facultativo o emprego de traços verticais para a separação de colunas no corpo da tabela. Deve-se manter a uniformidade quanto ao número de casas decimais. Os totais e destacados. subtotais devem ser Tabelas de contingência Conjugando duas séries em uma única tabela, obtém-se uma tabela de dupla entrada. Distribuições de Freqüência Relacionam categorias ou classes de valores, juntamente com contagens (ou freqüência) do número de valores que se enquadram em cada categoria. Exemplo 1: VARIÁVEL QUALITATIVA Distribuições de Freqüência Exemplo 2: VARIÁVEL QUANTITATIVA Distribuição de freqüência para dados não agrupados ou não tabulados em classes; Distribuição de freqüência para agrupados ou tabulados em classes. dados Distribuições de Freqüência Dados agrupados em classes Distribuições de Freqüências Elementos: Classes: cada uma das linhas contendo um intervalo de valores. As classes são limitadas por dois valores: limite inferior de classe (li) e limite superior de classe (Li). Maneiras de expressar os limites de classes: 10 -- 12: compreende todos os valores entre 10 e 12, excluindo o 12. 10 -- 12: limites aparentes; os limites reais nesta situação são 9,5 e 12,5. Amplitude de classe: é a diferença entre dois limites inferiores de classe consecutivos. Ponto médio: é a média aritmética simples entre o limite superior e o inferior de uma mesma classe. Distribuições de Freqüências Elementos: Freqüência absoluta simples (ni): é o número de informações verificadas em cada classe. Freqüência total: é a soma de todas as informações observadas. Freqüência relativa simples (fi): é o quociente entre a freqüência da classe e a freqüência total. freqüênciade classe freqüênciarelativa soma de todasas freqüências Freqüência acumulada (Fi): é obtida através da soma da freqüência daquela classe mais as freqüências de todas as classes anteriores. Distribuições de Freqüências Distribuições de freqüência 1) Etapas para a construção de tabelas de freqüências para dados agrupados: Encontrar o menor e o maior valores (denominados mínimo e máximo) do conjunto de dados. 2) Escolher a amplitude de classe com que se deseja trabalhar. 3) A seguir, coloca-se o menor valor encontrado nos dados (ou um valor mais conveniente) como limite inferior da primeira classe e acrescenta-se a amplitude de classe escolhida. Esse processo é repetido até que seja criada a classe que inclui o valor máximo do conjunto de dados. 3) Contar o número de elementos que pertencem a cada classe (freqüência). Distribuições de Freqüências Etapas para a construção de tabelas de freqüências para dados agrupados: 1) Decida sobre o número de classes desejado. (entre 5 e 20). 2) Calcule amplitude de classe (maior val or) - (menor val or) número de classes 3) Ponto inicial: Comece escolhendo um número para limite inferior da primeira classe. Escolha ou o valor mínimo dos dados, ou um valor conveniente que seja um pouco menor. Distribuições de Freqüências Etapas para a construção de tabelas de freqüências para dados agrupados: 4) Usando o limite inferior da primeira classe e a amplitude de classe, prossiga e liste os outros limites inferiores de classe. 5) Liste os limites inferiores de classe em uma coluna vertical e prossiga para preencher os limites superiores de classe. 6) Percorra o conjunto de dados verificando o número de elementos que se encaixam em dada uma das classes. Distribuições de Freqüências Na construção de tabelas de freqüência, devemos observar as seguintes diretrizes: As classes devem excludentes. ser mutuamente Todas as classes devem ser incluídas, mesmo as de freqüência zero. Procurar utilizar a mesma amplitude para todas as classes. Escolher números limites de classe.. convenientes para A soma das freqüências das diversas classes deve ser igual ao número de observações originais.