Introdução à Estatística Análise de Dados O que é estatística... ... É uma área da Matemática que trabalha com a coleta de informações, bem como a sua organização e análise. Com a análise dos dados coletados, pode-se tomar decisões e realizar planejamentos com mais segurança. Conceitos básicos População: todos os elementos de um conjunto que têm pelo menos uma característica em comum. Amostra: é um subconjunto formado por elementos extraídos de uma dada população. Variável: característica população. estudada de uma Conceitos básicos Variável Quantitativa Discreta Contínua Qualitativa Conceitos básicos Quantitativa discreta: expressa por um número inteiro. Por exemplo, número de irmãos, quantidade de computadores, número de animais. Quantitativa contínua: expressa por um número real e proveniente de uma medida. Por exemplo, massa, idade, altura, temperatura, volume. Exercício Pag. 398 1) Identifique as variáveis e classifique-as em quantitativa discreta, quantitativa contínua ou qualitativa. a) Classificação das colunas de um jornal, por seu editor, como excelentes, boas ou ruins. b) Os números de telefone de uma lista telefônica. c) Grau de escolaridade dos governantes dos estados brasileiros. d) Vendas anuais de uma empresa do setor da telefonia celular. e) Marcas de desodorante. Distribuição de frequências Frequência absoluta: quantidade de vezes que o valor de uma variável é citado. Frequência Relativa: razão entre a frequência absoluta e o número total de observações. Representada também na forma de porcentagem. Distribuição de frequências Frequência absoluta acumulada: soma das frequências absolutas, até determinado dado. Frequência relativa acumulada: soma das frequências relativas acumuladas, até determinado dado. Corresponde à proporção da frequência acumulada em relação ao total da tabela. Exemplo Preço (R$) Frequência absoluta Frequência relativa (%) Frequência absoluta acumulada fr fi 2.000 6 30 % 2.500 x 2.600 Total Frequência relativa acumulada (%) Fi Fr 6 30% y 10=6+4 50%=30%+20% 10 w z k 20 100% 20 100% Exercício Pag. 400 6) Os conceitos dos alunos de uma turma de pós-graduação em Administração de Empresas foram os seguintes: a) Construa uma tabela com todas as frequências. CABCABC AEDCACE BBDECDB CDCBDEC CBBCACA Exercício Nota Frequência absoluta fi A B C D E Total Frequência relativa (%) fr Frequência absoluta acumulada Fi Frequência relativa acumulada (%) Fr Exercício Nota A B C D E Total Frequência absoluta Frequência relativa (%) fi fr 6 8 12 4 5 35 17,14 % 22,85 % 34,28% 11,42% 14,31% 100% Frequência absoluta acumulada Frequência relativa acumulada (%) Fr Fi 6 14 26 30 35 35 17,41% 39,99% 74,27% 85,69% 100% 100% Exercício b) Quantos alunos obtiveram nota A? c) Sabendo que a média de aprovação é o conceito C, quantos alunos estão reprovados? d) Qual é a porcentagem de alunos que obtiveram conceito C? e) Qual é a porcentagem de alunos que obtiveram conceitos D ou E? f) Qual é a porcentagem de alunos que obtiveram conceitos A ou b? Distribuição de frequências para dados agrupados por intervalos As vezes a quantidade de medidas ou observações feitas é muito grande, ficando difícil a interpretação dos dados. A solução é agrupálos em intervalos de classes, ou simplesmente classes Distribuição de frequências para dados agrupados por intervalos Como determinar os intervalos de classe? 1 – Calcular a diferença entre o maior e o menor dado indicado, obtendo o que chamamos de amplitude . 2 – Escolher um número conveniente maior ou igual o número da amplitude, dividir pelo número de intervalos que desejamos, obtendo a amplitude de cada intervalo. 3 – A partir do menor valor some a amplitude do intervalo e encontre cada classe. Distribuição de frequências para dados agrupados por intervalos É importante salientar que a escolha da amplitude de classe depende do bom senso. Se os intervalos forem muito pequenos, teremos um número muito grande deles, e isso pode significar que os dados não foram resumidos. Se forem muito grandes, pode significar que houve excessiva perda de informações. Exercício Pag. 402 8) Observe as diárias de um grande hotel: Diária (R$) Número de apartamentos [150, 180[ 3 [180, 210[ 8 [210, 240[ 10 [240, 270[ 13 [270, 300[ 33 [300, 330[ 40 [330, 360[ 35 [360, 390[ 30 [390, 420[ 16 [420, 450[ 12 Total 200 Exercício Complete a tabela com as frequências: absoluta acumulada, relativa e relativa acumulada. Diária (R$) Número de apartamentos [150, 180[ 3 [180, 210[ 8 [210, 240[ 10 [240, 270[ 13 [270, 300[ 33 [300, 330[ 40 [330, 360[ 35 [360, 390[ 30 [390, 420[ 16 [420, 450[ 12 Total 200 Frequência relativa Frequência Absoluta acumulada Frequência relativa acumulada Exercício Diária (R$) [150, 180[ [180, 210[ [210, 240[ [240, 270[ [270, 300[ [300, 330[ [330, 360[ [360, 390[ [390, 420[ [420, 450[ Total Número de apartamentos Frequência relativa 3 8 10 13 33 40 35 30 16 12 200 0,015 0,04 0,05 0,065 0,165 0,2 0,175 0,15 0,08 0,06 1 Frequência Absoluta acumulada 3 11 21 34 67 107 142 172 188 200 200 Frequência relativa acumulada 0,015 0,055 0,105 0,170 0,335 0,535 0,71 0,86 0,94 1 1 Exercício a) Qual é o extremo inferior da 6ª classe? b) Que intervalo apresenta as diárias mais comuns? c) Qual é a porcentagem de apartamentos cujas diárias são menores que R$ 270,00? d) Quantos apartamentos têm diárias menores que R$ 390,00? e) Quantos apartamentos têm diárias a partir de RS 390,00? Representações Gráficas Série 3 Série 2 Categ… Categ… Categ… Categ… 15 10 5 0 Série 1 Categoria 1 Série 3 Série 2 Série 1 Vendas 5 0 15 10 5 0 Série 1 Série… Série 2 Série 3 1º Tri 2º Tri 3º Tri 4º Tri Representações Gráficas Gráfico de colunas O gráfico de colunas apresentam os dados por meio de colunas (retângulos) dispostas em posição vertical. A altura de cada coluna equivale à frequência (absoluta ou relativa) dos valores observados. Representações Gráficas Representações Gráficas Gráfico de barras Esse tipo de gráfico utiliza as barras (retângulos) dispostas em posição horizontal. Os comprimentos das barras correspondem à frequência (absoluta ou relativa) dos valores observados. Representações Gráficas Representações Gráficas Gráfico de segmentos Conhecido também como gráfico de linha é bastante utilizado para representar duas grandezas que se relacionam. Para sua construção, adotamos um referencial parecido ao plano cartesiano. Marcamos os pontos e em seguida os unimos por meio de segmento de reta. Representações Gráficas Representações Gráficas Gráfico de setores Os gráficos de setores apresentam os dados por meio de um círculo, no qual cada setor indica a quantidade (ou frequência relativa) de um valor observado. Obs: A área e o ângulo de cada setor são diretamente proporcionais à porcentagem que representam em relação ao todo. Representações Gráficas Representações Gráficas Gráficos múltiplos Quando é necessário representar simultaneamente duas ou mais características de uma amostra pode-se construir gráficos múltiplos. Representações Gráficas Histograma O histograma é um gráfico formado por retângulos cujas bases são construídas sobre o eixo das abscissas. As larguras correspondem à amplitude de cada intervalo e as alturas indicam a frequência (absoluta ou relativa) de cada intervalo. Histograma Exemplo: Em um concurso público realizado pela prefeitura de certo município, 200 candidatos foram submetidos a uma prova escrita. A distribuição de frequência segundo as notas obtidas pelos candidatos está representada na tabela a seguir. Histograma Histograma Histograma Polígono de Frequências Os dados de uma tabela de frequências também podem ser representados por um tipo de gráfico denominado polígono de frequências. Polígono de Frequências Polígono de Frequências Note que o polígono de frequências foi obtido ligando-se, por meio de segmentos de reta, os pontos médios das bases superiores das barras do histograma. Cada um desses pontos representa a média do intervalo de classe correspondente. Além disso, note que foram utilizados pontos equidistantes correspondentes à média de uma classe imediatamente inferior e de uma classe imediatamente superior. Medidas estatísticas As medidas estatísticas que descrevem a tendência que os dados têm de agrupamento em torno de certos valores recebem o nome de medidas de tendência central. Média Aritmética Exercício Média Aritmética Ponderada Exercício Moda Indicaremos por moda (Mo), o número que aparecer em maior quantidade de vezes no conjunto de valores observados. Exercício Mediana A mediana (Md) é um valor que divide um conjunto de dados ordenados em dois grupos com o mesmo número de valores: um grupo terá valores menores ou iguais à mediana e o outro grupo terá valores maiores ou iguais a ela. Mediana Exemplo : Quantidade ímpar de valores Mediana Exemplo : Quantidade par de observações Exercício