Estatística e Probabilidade Aula 2 – Cap 02 Estatística Descritiva f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Neste capítulo... estudaremos formas de organizar e descrever conjuntos de dados. O objetivo é tornar os dados mais compreensíveis de modo a enxergar neles tendências, médias e variações. f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Dados etários da população de Akhiok-Alasca 0 1 1 1 2 2 2 3 3 4 4 4 5 5 5 6 6 6 6 7 7 8 8 9 10 10 10 11 11 11 12 12 13 15 16 16 17 17 21 21 22 23 24 25 25 26 27 27 28 28 29 30 31 31 32 32 33 33 34 36 39 41 42 45 46 47 48 49 50 50 51 52 53 54 55 56 63 er r h e c h a eim mac t i S e t on Sem uma n Smaneira de organizar estes dados é difícil enxergarlypadrões. s o s s r. A Alys . D r . f f. D Pro Pro Estatística e Probabilidade Distribuição de freqüência e seus gráficos Distribuição de freqüências é uma tabela que mostra classes ou intervalo de entrada de dados com um número total de entradas em cada classe. A freqüência f de uma classe é o número de entrada de dados na classe. Classe Frequência, f 1-5 5 6-10 8 11-15 6 16-20 8 21-25 ss 26-30 . Aly r f. D o r P a5ch m i te on S 4 er As classes possuem amplitudes iguais e cada classe possui um limite inferior da classe, que é menor número que pode pertencer à classe, e o limite superior que é o maior her c a eim t S número que pode yspertencer so n l r. A D a classe. . f Pro Estatística e Probabilidade Amplitude das classes: Distância entre os limites inferiores (ou superiores) de classes consecutivas. Amplitude total: Diferença entre o máximo e o mínimo das entradas. Classe Frequência,f 1-5 5 6-10 8 11-15 6 16-20 8 her c a 21-25 n Steim 5 so s y l r. A D 26-30 4 . f Pro Amplitude das classes: 6-1=5 Amplitude total: 30 - 1 = 29 a ch m i te S n o er ss y l O número de classes deve A . r D rof. estar Pentre 5 e 20. Estatística e Probabilidade Exemplo: Minutos/mês gastos na internet para 30 assinantes 102 71 103 105 109 124 104 116 97 99 108 112 85 107 105 86 118 122 67 99 103 87 87 78 101 82 95 100 125 92 Faça uma tabela de distribuição de freqüência com 5 classes. f. Pro D her c a teim S n Valores-chave: so s y l r. A Valor mínimo = Valor máximo = 67 s ly s A . r 125 D rof. P a ch m i te S n o er Estatística e Probabilidade Como construir uma distribuição de frequências 1. Decida o número de classes, que deve ficar entre 5 e 20. (Para este problema use 5.) 2. Calcule a amplitude das classes. Primeiro calcule: amplitude total = valor máximo – mínimo. Em seguida, divida o resultado pelo número de classes. Por fim, arredonde até o próximo número conveniente. (125 – 67)/5 = 11,6 (arredondado para 12) 3. Calcule os limites das classes. O limite inferior da classe é o valor mais baixo que pertence a ela e o limite superior é o mais alto. Use o valor mínimo (67) como limite inferior da primeira classe. er r h e c h a c cada entrada de dado na classe apropriada. teim 4. Marque um risco m|aem i e t nS S o n s o s ly Quando osr. A riscos em cada lyss todos os valores estiverem marcados, conte D A . r . f f. D Pro Pro classe para determinar a freqüência dessa classe. Estatística e Probabilidade Mínimo = 67, Máximo = 125 Número de classes = 5 Amplitude de classe = 12 Classe 67 - 78 79 - 90 91 - 102 103 - 113 115 - 126 f. Pro Dr ss . Aly her c a teim S n o Riscos Freqüência ||| 3 |||| 5 |||| ||| 8 |||| |||| 9 |||| 5 .D ss y l A r. f Dica: Faça primeiro todos os limites Proinferiores. a ch m i te S n o er Estatística e Probabilidade Definições importantes Ponto médio de uma classe: é a caracteristica de uma classe. É a metade da soma entre os limites inferior e superior da classe (limite inferior + limite superior) / 2 Freqüência relativa de uma classe: é a porção ou porcentagem dos dados que entra nessa classe. frel = (freqüência da classe) / (tamanho da amostra n) Freqüência cumulativa er rde uma classe: é a soma da frequencia daquela h e c h a ac im eda t classe com a deStodas S eim as classes anteriores. A frequencia cumulativa t on n s o s s y l s A última classe . Aly é igual ao tamanho da amostra n. Dr . f. Pro Dr f. Pro Estatística e Probabilidade Definições importantes Tabela: possibilidade de identificar padrões Classe f Ponto médio (67 + 78)/2 Freqüência relativa ( f / n) Freqüência cumulativa 67-78 3 72,5 (3 / 30) = 0,10 3 79-90 5 84,5 (5 / 30) = 0,17 8 91-102 8 96,5 0,27 16 103-113 9 108 0,30 25 115-126 5 120,5 0,17 30 f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Gráficos das distribuições de freqüência f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Histograma de freqüência é um gráfico de barras que representa a distribuição de freqüência de um conjunto de dados. Um histograma possui as seguintes propriedades: 1 – A escala horizontal é quantitativa 2 – A escala vertical mede as freqüências das classes 3 – Barras consecutivas devem estar encostadas umas as outras Como as barras de freqüência devem se encostar elas começam e terminam na fronteira das classes, e não nos limites das classes. Fronteira das classes são os números que separam as classes sem deixar er uma falha entre elas. r h e c h a c f. Pro Dr ss . Aly ma i e t on S f. Pro D ss y l A r. eim t S on Estatística e Probabilidade Para determinar a fronteira de classe encontre a média do valor entre o limite inferior da segunda classe e o limite superior da primeira classe. Subtraia este valor da fronteira inferior da primeira classe e some ao valor superior da primeira classe e assim sucessivamente para as outras classes. (79 – 78) / 2 = 0,5 Classe f Fronteiras 67-78 3 66,5–78,5 Tempo na internet 9 9 8 8 7 79-90 91-102 78,5–90,5 5 90,5–102,5 8 103-113 9 115-126 5n Steim 114,5–126,5 r f. D o r P so s y l .A 102,5–114,5 a r ch e 6 5 5 5 4 3 3 2 a ch m i te S n o 1 0 66,5 er ss y l A 78,5 90,5 r. 102,5 114,5 126,5 D . f Pro minutos Estatística e Probabilidade Polígono de freqüência é um gráfico em forma de linha que enfatiza a mudança contínua nas freqüências. Para traçar um polígono de freqüência marque o ponto médio no topo de cada barra. Conecte os pontos médios consecutivos. Estenda o polígono até os eixos. 9 9 8 8 Tempo na internet 7 6 5 5 4 3 5 3 2 1 r. D . f Pro Al her c 0 a teim S n 72,5 84,5 ysso 96,5 108,5 minutos ss 120,5 y l A r. D . f Pro a ch m i te S n o er Estatística e Probabilidade Histograma de freqüência relativa Freqüência relativa Apresenta em sua escala vertical as freqüências relativas. f. Pro Dr ss . Aly Tempo na internet 0,30 0,30 0,27 0,20 0,10 her c a teim S n o 0 0,17 0,17 0,10 66,5 78,5 90,5 102,5 114,5 126,5 minutos f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Gráfico de freqüência cumulativa Freqüência cumulativa Um gráfico de freqüência cumulativa (ou ogiva) mostra o número de valores, em um conjunto de dados, que são iguais ou inferiores a um dado valor x. f. Pro Dr ss . Aly Tempo na internet 30 30 25 20 16 10 8 3 0 ma i e t on S 0 r ch e 66,5 78,5 90,5 102,5 minutos 114,5 f. Pro 126,5 D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Mais gráficos e representações f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Diagrama de tronco e folhas é similar ao histograma, mas com a vantagem de que o gráfico ainda contém os valores dos dados originais. 102 71 103 105 109 124 104 116 97 99 108 112 85 107 105 86 118 122 67 99 103 87 87 78 101 82 95 100 125 92 Se o valor mais baixo é 67 e o mais alto é 125, o tronco vai de 6 a 12. f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Diagrama de tronco e folhas 102 71 103 105 109 tronco f. Pro D on s s y l r. A 124 104 116 97 99 108 112 87 107 105 6 |7 7 |18 8 |25677 9 |25799 10 | 0 1 2 3 3 4 5 5 7 8 9 11 | 2 6 8r he c a |245 teim S12 82 118 122 67 99 103 86 87 78 101 85 95 100 125 92 Chave: 6|7 significa 67 folhas f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Diagrama de tronco e folhas – 2 linhas/tronco Chave: 6|7 significa 67 Dígitos da 1a linha 0 1 2 3 4 Dígitos da 2a linha 5 6 7 8 9 er h c a im 1a linha 0 1 2 3 4 Dígitos da e t S on s s y . AlDígitos da 2a linha 5 6 7 8 9 r D f. Pro 6| 6|7 7|1 7|8 8|2 8|5677 9|2 9|5799 10 | 0 1 2 3 3 4 10 | 5 5 7 8 9 11 | 2 11 | 6 8 her c a 12 | 2 4 on Steim ss y l A Dr . | 5 . 12 f Pro Estatística e Probabilidade Plote de pontos Em um plote de pontos cada entrada é desenhada, usando um ponto ● sobre um eixo horizontal. minutos/mês na Internet 66 76 86 96 106 116 126 minutos r Um plote dempontos che permite que se veja como os dados estão teimach a tei e se determinem entradas específicas de dados. nS S o distribuídos n s o s ly ss Aly . r f. D Pro r D . f Pro .A er Estatística e Probabilidade Diagrama de Pizza tem a forma de um círculo que mostra as relações das partes como um todo. Para encontrar o angulo central para uma entrada de dados multiplique 3600 pela frequência relativa da entrada de dados. Exemplo O orçamento da Nasa (em bilhões de dólares) dividido em três categorias Bilhões de US$ Vôo espacial humano Tecnologia her c Apoio às missões a teim 5,7 5,9 2,7 a ch m i te S n o nS o ss s y l s A y r. dados. Construa um diagrama de pizza para esses . Al D r . f D f. Pro Pro er Estatística e Probabilidade Bilhões de US$ Vôo espacial humano Tecnologia Apoio às missões Apoio às missões 19% Total 5,7 5,9 2,7 14,3 Graus 143 149 68 360 5,7 14,3 5,9 14,3 her c a teim S n Tecnologia so s y l A r.41% D . f Pro Vôo espacial humano 40% Orçamento da Nasa er a ch eim t S on (em bilhões lyss de dólares) r D . f Pro .A Estatística e Probabilidade Diagrama de Pareto é um gráfico de dados qualitativos no qual a altura de cada barra representa a freqüência ou a freqüência relativa. É frequentemente usado no contexto de negócios. Exemplo: Recentemente uma industria varejista perdeu 45 milhões de dólares de seus ativos. Os dados das perdas são mostrados na tabela abaixo: Se você fosse o varejista qual causa escolheria para atacar primeiro? administrativas furtos de funcionários assaltos a lojas teima S so n fraudes Alys nas . r f. D vendas Pro 7,8 15,6 r ch e 14,7 18 16 Milhões de dólares Causas Valores (em milhões) 14 12 10 8 6 4 2 0 administrativas 2,9 furtos de funcionários nas ss fraudes y l A vendas r. assaltos a lojas D rof. PCausas a ch m i te S n o er Estatística e Probabilidade Gráficos de conjuntos de dados emparelhados Se dois conjuntos de dados têm o mesmo número de entradas e cada entrada do primeiro corresponde a uma entrada do segundo, eles são chamados de conjuntos de dados emparelhados. Uma maneira de fazer o gráfico de dados emparelhados é usar um mapa de dispersão. f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Mapa de Dispersão é um plote dos pares (x,y) de dados sendo a horizontal o eixo x e a vertical o eixo y. Exemplo: Na tabela abaixo temos a duração do vínculo empregatício e o salário anual correspondente de dez trabalhadores 5 32000 4 32500 8 40000 4 27350 2 25000 10 43000 7 her c a 39225 teim S n o 6 r f. D o r P . Salário (R$) s Al9ys 3 41650 45100 28000 45000 salario (em reais) Permanência no emprego (anos) 40000 35000 30000 25000 a ch m i te S n o 10 ss8 y l A r. D . f Permanência no emprego (anos) Pro 2 4 6 er Estatística e Probabilidade Gráfico da série temporal é um plote de um conjunto de entradas de dados tomadas a intervalos regulares durante um período de tempo. Exemplo: Na tabela ao lado, número de assinantes de telefones celulares em milhões e o valor médio da conta mensal local. Assinantes (em milhoes) 100 80 60 40 20 r f. D o r P her c a teim S n o s Alys1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 . 1987 0 Anos Ano Assinantes (em milhões) Conta média (em reais) 1987 1.2 96.83 1988 2.1 98.02 1989 3.5 89.3 1990 5.3 80.9 1991 7.6 72.74 1992 11 68.68 1993 16 61.48 1994 24.1 56.21 1995 33.8 51 1996 44 1997 55.3 1998 f. D Pro 1999 ss y l A r. 69.2 86 r 47.7 ch e ma i e t on S 42.78 39.43 41.24