MÉTODOS BIOESTATÍSTICOS APLICADOS A EPIDEMIOLOGIA MODELO DE TABELAS Tabulação de dados Tabelas Título: O que? Quando? Onde? Frase começa com letra maiúscula e com ponto final Cabeçalho: Abaixo do título e diz tudo o que tem na tabela, em maiúsculo Corpo: Composto por filas e colunas Tem que ter total Casa: encontro da fila com a coluna • Distribuição de bovinos por sexo e idade, município de Araguari, 2010. IDADE SEXO Cabeçalho MACHO (x100.000) FÊMEA(x100.000) < 1 ano 20 15 1 – 2 anos 38 39 >2 anos 25 23 TOTAL 83 77 Fonte: Nota: Chamada casa Coluna Linha Cabeçalho: – Pode deixar a quantidade se o número for grande – Não indicar medida no plural, sempre no singular (Kg, m, ano, tonelada) – Rigorosamente zero: Z – Quando não dispõe de dados: Usar ... – Valor não quantificado: Usar ___ – Menor que 0,5: Usa-se 0 Série cronológica, temporal, histórica ou em massa: Análise do fenômeno ocorrido ao longo do tempo Ex: 0-4 (inclusive 0 e 4) 0 4 5 10 (inclusive 5 e 10) 5 10 (inclusive 5 exclui 10) 1. Série cronológica, temporal, histórica ou em marcha: Analisa o fenômeno ocorrido em marcha de tempo • Ex. Óbitos por doenças infecciosas e parasitárias em Uberlândia , 2004-2009. ANO 2004 2005 2006 2007 2008 2009 NÚMERO 2700 2600 3000 3100 2800 4000 Dados hipotéticos 2. Série geográfica ou territorial Mortalidade geral em algumas capitais do Brasil em 1994. CAPITAIS TAXA(X1000ha) Manaus 10,3 Recife 12,8 Salvador 10,7 Belo Horizonte 11,4 Brasília 5,9 Fonte: Anuário estatístico do Brasil, 1975. Apresenta o fenômeno por região 3. Série especificativa ou categórica Cinco principais causas de mortalidade de bezerros em Araguari, 2009. CAPITAIS Número % Colibacilose 40 40 Salmonelose 20 20 Onfaloflebite 15 15 Coccidiose 15 15 Pneumonia 10 10 As causas são categorias 4. Distribuição de Freqüência: Distribuição de suínos mestiços de 6 meses de idade segundo classes de peso corporal, Uberlândia 2007. CLASSES DE PESO (Kg) Número % 55 – 65 5 10 65 – 75 12 24 75 – 85 20 40 85 – 95 10 20 95 – 105 3 6 TOTAL 50 100 Analisa os fenômenos através de uma quantidade (medida, peso ou graduação) ELABORAÇÃO DE GRÁFICOS • Título – Claro, indicativo • O que? Onde? Quando? • Tamanho – Formato retangular sendo a relação ordenada e abscissa não em L o r d e n a d a Abscissa • Espaço para representação gráfica pequeno: – Quebrar o eixo das abscissas ou ordenadas, de acordo com a necessidade do autor (só uma quebra) – No gráfico representa-se valores aproximados – não se usa valores intermediários 100 50 Formas de apresentação Gráfica Séries: conjunto de dados ordenados segundo uma característica comum 1. Série especificativa (atributos) • Gráfico de barra simples • Gráfico de barras proporcionais • Gráfico de barras agrupadas • Diagrama setorial Varia o fato e permanece constante a época e o local. 2. Variável discreta • Cada classe está determinada pela unidade • Ex. Número de filhos por família – não há continuidade – Barra simples 3.0. Variável contínua • Valores se apresentam de forma contínua • Ex. Estatura, idade, peso corporal – Histograma – Polígono de freqüência 4. Setores cronológicos • Barra simples • Gráfico linear aritmético • Gráfico logaritmo • Pictogramas 5.Séries Geográficas • Barra simples • Barras proporcionais • Cartogramas A. Gráfico de barra simples ou coluna Distribuição de 160 rebanhos bovinos segundo tipo de exploração Barra Coluna B. Gráfico de barras agrupadas ou justapostas Cães internados no hospital veterinário, Uberlândia, 2009 de acordo com a doença neurológica Demonstra relação entre dois fatos ou mais C. Gráfico em barras proporcionais Porcentagem de bovinos protegidos, 100 dias após vacinação anti-botulínica em 3 vacinações experimentais Fazenda X, 2009. Mostra a composição proporcional das diversas categorias D. Diagrama Setorial: Proteção contra New Castle com o uso da vacinação, 1989. Compara a freqüência de uma classe com o total Usar até 6 informações Representação no sentido horário do maior para o menor 3600 -------------------100% proteção X -------------------60% X = 2160 PROTEGIDOS 360-144 = 144 não protegidos E. PICTOGRAMA: Utiliza figuras para representar o fato estudado F. HISTOGRAMA: Usado para variável contínua Representação gráfica da distribuição de freqüência – gráfico de barras verticais G. POLÍGONO DE FREQUÊNCIA: Colunas paralelas Distribuição de cabras mestiças de 3 meses de idade. O polígono de freqüência, calcula o ponto médio de cada coluna e depois os une. É sempre em cima do histograma Histograma A base de cada retângulo corresponde ao intervalo de classe e a sua altura à respectiva freqüência. H. Gráfico linear simples: Usado em séries cronológicas ou em marcha do tempo Óbitos por doenças entéricas em bezerros, Uberlândia, 2000-2009. I. Ogiva, curva de Galton ou de freqüência Acumulada • Representa freqüência acumulada • Com estas freqüências – Freqüências acumuladas será construído o gráfico Distribuição de enfermos por colibacilose em bezerros de acordo com a faixa etária, Fazenda AA, março 2007. Faixa etária Doentes FA 0-5 5 5 5-10 2 7 10-15 3 10 15-20 2 12 J. CARTOGRAMA • Informação quantitativa mantendo um certo grau de precisão geográfica – É um mapa k. Escala Mono-log 10.000 1.000 100 10 MEDIDAS DE TENDÊNCIA CENTRAL MÉDIA ARITMÉTICA 1. Média Aritmética numa série simples • Cada elemento equivale a uma única classe Número de leitoas nascidos por leitegada na fazenda X, Udia, 2009. Número marrãs Número de leitões 1 9 2 8 3 10 4 12 5 11 TOTAL 50 MÉDIA= 50/5 = 10 leitões por marrã 2. MÉDIA ARITIMÉTICA EM SÉRIE COM FREQUÊNCIA SIMPLES Altura dos 25 alunos do 8 período do curso de M. Veterinária da Ufu, 2010. Altura F x.F 1,60 4 6,40 1,65 2 3,30 1,70 6 10,20 1,75 10 17,30 1,80 3 5,5 TOTAL 25 42,60 MÉDIA=42,60/25= 1,70 metros 3. MÉDIA ARITIMÉTICA EM SÉRIE COM FREQUÊNCIA EM CLASSE Período de incubação em dias da doença X em ovinos, Uberlândia, 2009. PI (dias) F PM xf 1I-3 2 2 4 4l-6 4 5 20 7l-9 6 8 48 10l-12 5 11 55 TOTAL 17 MÉDIA=127/17 = 6,4 dias 127 MEDIANA • Divide a série em dois grupos • Posição: P=(n+1)/2 • Colocar em ordem crescente • Mediana em uma distribuição de classes – Me=Li+H((P-Facum.ant)/f) Li: limite inferior, H: intervalo de classe, P: posição da mediana Faumcant: frequencia acumulada anterior, f: frequencia simples de classe, Me: mediana Ex 1. 5,8,3,2,10 Primeiro: Ordem crescente: 2,3,5,8,10 P=(5+1)/2 = 3=> terceiro termo é a mediana Mediana = 5 Ex 2. 5,8,3,2,10, 12 Primeiro: Ordem crescente: 2,3,5,8,10, 12 P=(6+1)/2 = 3,5=> Entre terceiro e quarto temo Mediana = (5+8)/2=6,5 MEDIANA NUMA DISTRIBUIÇÃO SIMPLES Peso de 45 alunos do quarto ano do CMV, UFU, 2010 Peso F Facum 50 5 5 60 10 15 70 15 30 80 10 40 90 5 45 TOTAL 45 P=(45+1)/2=23 Me=70 MEDIANA NUMA DISTRIBUIÇÃO DE CLASSES Peso de 20 alunos do 8 período do curso de mv, UFU, 2009. Peso (Kg) F F acum Me=Li+H((P-Facum.ant)/f) 37 47 1 1 47 57 1 2 57 67 8 10 67 77 3 13 77 87 6 19 Me=67+10(10,5-10)/3 87 97 1 20 Me=68,66Kg > 97 0 TOTAL 20 PM=(20+1)/2 = 10,5 MODA • Número que está em maior evidência • Moda bruta: Ponto médio da classe de maior freqüência • Valor modal Mo=Li+H(fpost/(fant+fpost) Distribuição de Freqüência Simples Peso de 45 alunos do 8 período da Faculdade de Medicina, UFMG, 2009. Peso (Kg) F f.Acum 50 5 5 60 10 15 70 15 30 80 10 40 90 5 45 TOTAL 45 Moda = 70 Distribuição com classe Peso de 20 alunos do 8 período do curso de Med. Veterinária, UFU, 2010. PESO (Kg) F 37 - 46 1 47 - 56 1 57 - 66 8 67 - 76 3 77 - 86 6 87 - 96 1 TOTAL MoB=(57+66)/2=123/2=61,5 Valor Modal=57+10(3/1+3)=64,5 20 Valor Modal=Li+H(fpost/(fant+fpost) Numa curva normal, média, mediana e moda são iguais Curvas assimétricas Me Me X Mo X Mo 3. Amostragem estratificada.(AE) • Ex. Suponha que pretende obter amostras de 58 ovinos de uma população de 7800 constituidos em 4 categorias Classe No. rebanho No. amostrado Ovelhas 3000 Borregas 800 = 6 Borregos 2500 = 19 Cordeiros/as 1500 = 12 Total 7800 = 60 58*3000/7800=23 Grupos de indivíduos existem naturalmente (ninhadas, rebanhos manadas etc.). Os grupos podem ser seleccionados atravéz de métodos AE,AS ou AE e depois todos os indivíduos do grupo são testados. Algumas vezes o grupo é a unidade de interesse e portanto não é considerado da mesma forma. Como exemplo temos o caso de pertendermos identificar manadas infectadas com brucelose. No caso da brucelose uma amostra por grupos poderia ser obtida fazendo uma amostragem simples aleatória de todas as manadas (U.P) da população e testar todas as vacas nas manadas selecccionadas. (U.P) 5. Amostragem por etapes. (AET) Semelhante a AG mas amostragem tem lugar em todos os estádios i.e primeiro as unidades primárias ex. manadas e depois dentro da manada os animais (unidades secundárias). A diferença com a amostragem por grupos está relacionada com o facto de que há sub-amostragem dentro do grupo seleccionado. A principal desvantagem deste método e do anterior é de que possivelmente mais animais são necessários na amostra para obter a mesma precisão que seria obtida numa amostragem aleatória simples. No. de empresas existentes(M= 120) No. de animais na população (N= 8000) No. de animais a seleccionar n= 800 No. da empresa No. de animais Total de animais 1 62 1-62 2 48 63-110 3 74 111-184 4 36 185-220 . . . . . . 119 42 7900-7941 120 59 7942-8000 5. Amostragem por etapes. (AET) Suponha que o número de unidades primárias a (UP) a seleccionar é de n1= 40 e que o número de unidades secundárias (animais) é de n2=20. Então n= n1 x n2. Se o no. de animais em cada empresa for desconhecido pode-se tirar uma amostra simples ou sistemática aleatória de 40 empresas e aleatóriamente seleccionar uma amostra (%) fixa de animais = Mn/mN i.e = 30% de animais em cada empresa a testar. Quando o No. de animais em cada empresa/manada é conhecido o melhor é seleccionar as unidades primárias com probabilidade proporcional ao seu tamanho e depois seleccionar um No. fixo de animais de cada manada. Neste exemplo selecciona-se 1o. 40 Nos. entre 1 e 8000. Cada No. identifica uma manada/empresa de acordo com a coluna dos totais. Seguidamente 20 animais podem ser seleccionados de cada manada. Se uma empresa for seleccionada uma segunda vez deixa-se e selecciona-se outra. Se há menos de 20 animais numa manada então todos devem ser incluidos. Uma modificação deste método para assegurar que cada empresa/manada seja seleccionada apenas uma vez é usar-se um método aleatório sistemático. Por ex. o intervalo k=N/n1 i.e 8000/40 = 200. Um número é escolhido ao acaso dentro do intervalo 1 - k (ex. 151). Os restantes 39 números com intervalo k=200 ie 351, 551 etc. vão identificar as restantes empresas/manadas a incluir na amostra. Este processo faz com que se seleccione uma empresa/manada só uma vez desde que o intervalo k seja superior ao número de animais na maior empresa/manada. • Ir para página: http://www.teledata.mz/uevdinap/epidem4.h tml