Estatística – Aula 02 IMES – Fafica Curso de Publicidade e Propaganda Prof. M.S.c. Fabricio Eduardo Ferreira [email protected] Tabelas Uma tabela consiste de um quadro onde várias observações são feitas possibilitando ao leitor uma interpretação precisa do fato analisado. Os elementos mais notáveis das tabelas são: • Título: que deve ser o mais claro possível e traduzir convenientemente o intuito do estudo; • Cabeçalho: que deve informar sobre o conteúdo das colunas e linhas; • Coluna indicadora: que é o local onde serão especificados os conteúdos da tabela; • Corpo: que é o conjunto de linhas e colunas que comporão as células da tabela; • Rodapé: onde indicamos informações para validar os dados (fonte de pesquisa). Um pouco mais sobre tabelas O corpo da tabela deverá conter colunas (verticais) e linhas (horizontais) que se interceptarão compondo as células para inserirmos os dados. De acordo com o I.B.G.E. devemos colocar: um traço horizontal ( – ) quando o valor é zero; três pontos ( . . . ) quando não temos dados; um ponto de interrogação ( ? ) quando temos dúvidas quanto à exatidão de determinado valor; zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Exemplo de tabela Produção de Café no Brasil Coluna indicadora Corpo Título Anos Produção (1.000 t) Cabeçalho 1991 2.535 Célula 1992 2.666 1993 2.122 Linhas Rodapé 1994 3.750 1995 2.007 FONTE: I.B.G.E. Coluna numérica Séries estatísticas Caso uma tabela apresente uma distribuição de dados estatísticos em função de uma característica específica (tempo, local, espécie) a denominaremos série estatística. As séries estatísticas podem ser: • Temporais (históricas, cronológicas, marchas): quando descrevem valores em função de intervalos de tempos discretizados. • Geográficas (espaciais, territoriais, localização): quando descrevem valores em função de localidades num determinado instante temporal. • Específicas (categóricas): quando descrevem valores sobre determinada espécie ou categoria representando um determinado local e instante. • Conjugadas (dupla–entrada): quando combinam em seu corpo tipos variados de séries. Por exemplo, enquanto as linhas representam séries geográficas as colunas representam séries temporais. • Distribuição de frequência: consiste numa série específica onde os dados levantados são apresentados em sua totalidade. Séries temporais Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempos constantes. Preço do Acém no Varejo – São Paulo Anos Preço médio (US$) 1989 2,24 1990 2,73 1991 2,12 1992 1,89 1993 2,62 FONTE: A.P.A. Séries geográficas Descrevem os valores da variável, em determinado instante, discriminados segundo regiões, localidades ou territórios. Duração Média dos Estudos Superiores - 1994 Países Número de Anos Itália 7,5 Alemanha 7,0 França 7,0 Holanda 5,9 Inglaterra Menos de 4 FONTE: Revista Veja Séries específicas Descrevem os valores da variável, em determinado tempo e local, discriminado segundo especificações ou categorias. Rebanhos Brasileiros - 1992 Espécies Bovinos Qtde. (1000 cabeças) 154.440,8 Suínos 34.532,2 Ovinos 19.955,9 Caprinos 12.159,6 Outros FONTE: I.B.G.E. 2.234,5 Séries conjugadas Combinam em seu corpo tipos variados de série. Terminais Telefônicos em Serviço Regiões 1991 1992 1993 342.938 375.658 403.494 Nordeste 1.287.813 1.379.101 1.486.649 Sudeste 6.234.501 6.729.467 7.231.634 Sul 1.497.315 1.608.989 1.746.232 713.357 778.925 884.822 Norte Centro-Oeste FONTE: Ministério das Comunicações Distribuição de frequência Consiste numa série específica onde os dados levantados são apresentados em sua totalidade. Tempo de gestação de alguns mamíferos (dias) Dias de gestação f 017 ├ 086 13 086 ├ 155 08 155 ├ 224 05 224 ├ 293 09 293 ├ 362 02 362 ├ 431 04 431 ├ 500 01 Σf = 42 FONTE: Matemática E. M. V. 2 SMOLE & KIUKAWA Dados e informações Caso os dados reflitam diretamente a realidade sem algum tratamento matemático os chamaremos de dados absolutos, enquanto dados que mereçam uma comparação através de razões são denominados dados relativos. Entre os dados relativos destacam-se: • as porcentagens: que comparam as informações pertinentes ao denominador 100; • os índices: que comparam informações, na forma de razão, independentes entre si; • os coeficientes: que comparam informações, na forma de razão, interligadas entre si; • as taxas: uma outra forma de apresentar os coeficientes na forma de produto de potência de base 10. Tabela primitiva Uma tabela cujos elementos não foram numericamente organizados, denomina-se tabela primitiva. Por exemplo, uma professora organizou os resultados obtidos em uma avaliação da seguinte forma. Notas obtidas por 25 alunos do Colégio X 4,0 9,0 6,0 9,0 7,0 9,0 5,0 9,0 4,0 9,0 6,0 9,0 4,0 8,0 9,0 8,0 4,0 7,0 9,0 5,0 9,0 9,0 5,0 7,0 4,0 R.O.L. Organizando os dados através de uma ordenação crescente ou decrescente. A tabela obtida após esta ordenação de dados recebe o nome de rol. Notas obtidas por 25 alunos do Colégio X 4,0 5,0 7,0 9,0 9,0 4,0 5,0 7,0 9,0 9,0 4,0 5,0 7,0 9,0 9,0 4,0 6,0 8,0 9,0 9,0 4,0 6,0 8,0 9,0 9,0 Amplitude total Observando o R.O.L. podemos verificar a variação entre o menor e o maior valor apresentado. A esta diferença chamamos de Amplitude Total. No caso 9,0 – 4,0 = 5,0. Distribuição de frequência Colocando ao lado da variável nota o número de vezes que aparece repetida, estaremos determinando a frequência absoluta (f) desta nota. Dispondo estas frequências numa tabela, obtemos assim, o que chamamos de distribuição de frequência. Frequência absoluta (f) Nota Frequência (f) 4,0 5 5,0 3 4,0 5,0 7,0 9,0 9,0 4,0 5,0 7,0 9,0 9,0 6,0 2 4,0 5,0 7,0 9,0 9,0 7,0 3 4,0 6,0 8,0 9,0 9,0 8,0 2 4,0 6,0 8,0 9,0 9,0 9,0 10 Total 25 Frequência relativa (fr) Caso queiramos podemos determinar o percentual que cada nota representa no total dos alunos. Neste caso estaríamos calculando a frequência relativa (fr) com que as notas aparecem. A frequência relativa é a razão entre a frequência absoluta e o total dos dados. Nota Frequência (f) Frequência relativa (fr) 4,0 5 20 5,0 3 12 6,0 2 08 7,0 3 12 8,0 2 08 9,0 10 40 Total 25 100 5 = 0,20 = 20% 25 3 = 0,12 = 12% 25 2 = 0,08 = 8% 25 10 = 0,40 = 40% 25 Frequência acumulada (fa) Se considerarmos até um certo dado numa distribuição de frequência e somarmos as frequências dos dados anteriores, estaremos determinando a frequência acumulada (fa) até este dado. Nota f fa fr 4,0 05 05 20 5,0 03 08 12 6,0 02 10 08 7,0 03 13 12 8,0 02 15 08 9,0 10 25 40 Total 25 100 Frequência acumulada relativa (far) A frequência acumulada relativa (far) de um dado é a razão entre a frequência acumulada até um certo dado e o total de dados. Nota f fa fr far 4,0 05 05 20 20 5,0 03 08 12 32 6,0 02 10 08 40 7,0 03 13 12 52 8,0 02 15 08 60 9,0 10 25 40 100 Total 25 100 Frequência acumulada relativa (far) A frequência acumulada relativa (far) de um dado é a razão entre a frequência acumulada até um certo dado e o total de dados. Nota f fa fr far 4,0 05 05 20 20 5,0 03 08 12 32 6,0 02 10 08 40 7,0 03 13 12 52 8,0 02 15 08 60 9,0 10 25 40 100 Total 25 100 Para Refletir 1) Qual a importância das tabelas na estatística? Quais são os elementos fundamentais nas tabelas? 2) Numa das células de uma tabela encontra-se o valor zero (0). Isto significa que não havia dados daquela espécie? 3) Qual diferença entre as fontes diretas e as fontes indiretas? 4) O que são séries estatísticas? Classifique-as de acordo com seus tipos. 5) Diferencie dados absolutos de dados relativos. 6) Diferencie tabela primitiva de rol. 7) Como calcula-se a amplitude total de uma distribuição de dados? 8) Diferencie frequência absoluta de frequência relativa. Como calcula-se a frequência relativa. 9) Para quê serve a frequência acumulada? E a frequência acumulada relativa?