Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 48 GRÁFICOS ESTATÍSTICOS O gráfico estatístico é uma forma de apresentação dos dados estatístico, cuja principal finalidade é produzir no leitor do gráfico, uma impressão mais rápida e clara do fenômeno estudado. Para tornarmos a representação gráfica possível, devemos estabelecer uma correspondência, proporcional, entre os termos da série e uma determinada figura. A representação gráfica de um fenômeno deve ser simples1 , clara2 e veraz3 para que realmente seja útil. Os principais tipos de gráficos são os diagramas, os cartogramas e os pictogramas. Diagramas São gráficos geométricos, que usam , no máximo, duas dimensões para a sua construção, e normalmente fazem uso do referencial cartesiano.Dentre os principais diagramas temos: Gráfico em linha ou em curva Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística. O gráfico em linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Exemplo: Considere a série abaixo: PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ 1987 - 1992 ANOS 1987 1988 1989 1990 1991 1992 QUANTIDADE (1.000 t ) 39,3 39,1 53,9 65,1 69,1 59,5 FONTE: Agropalma Com os dados da tabela acima podemos conseguir todos os pontos formados pela comparação do ano e a respectiva quantidade produzida. Ao ligarmos esses pontos através de segmentos de reta, teremos o nosso gráfico em linha ou em curva. PRODUÇÃO BRASILEIRA DE ÓLEO DE DENDÊ Mil 1987 - 1992 toneladas 70 60 50 40 30 20 0 1987 88 89 90 91 92 Anos Obs.: Observe que o zero foi representado no eixo vertical, e isso, de modo geral, sempre acontecerá. Se por algum motivo não for possível representar o zero no eixo vertical, procure chamar a atenção para o fato. Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 49 Gráfico em colunas ou em barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas os retângulos tem a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Dessa maneira estamos assegurando que as áreas das surpefícies frontais sejam proporcionais aos respectivos dados. Exemplos: a) Gráfico em colunas PRODUÇÃO BRASILEIRA DE CARVÃO MINERAL BRUTO 1989 - 1992 ANOS 20000 QUANTIDADE (1.000 t ) 1989 1990 1991 1992 18.189 11.168 10.468 9.241 15000 1989 1990 10000 1991 1992 5000 0 FONTE: Ministério da Agricultura 1989 1990 1991 1992 b) Gráfico em barras EXPORTAÇÕES BRASILEIRAS MARÇO – 1995 ESTADOS São Paulo Minas Gerais Rio Grande do Sul Espírito Santo Paraná Santa Catarina FONTE: Secex Santa Catar Santa Catarina VALOR (US$ MILHÕES ) 1.344 542 332 285 250 202 Paraná Paraná Espírito San Espírito Santo Rio Grande do Sul Rio Grande Sul Minas Gerais São Paulo Minas Gerai São Paulo 0 500 1000 1500 Observação : Sempre que os dizeres a serem escritos forem muito longos, devemos dar preferência ao gráfico em barras. Porém, se mesmo assim quisermos fazer o gráfico em colunas , os dizeres deverão estar dispostos de baixo para cima. Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 50 c) Gráfico em colunas ou em barras múltiplas Este tipo de gráfico é geralmente usado quando queremos representar, simultaneamente, dois ou mais fenômenos estudados , com o propósito de comparação. Exemplo: Especificações Exportações Importações BALANÇA COMERCIAL DO BRASIL 1989-93 VALOR (US$ 1.000.000) 1989 1990 1991 1992 34383 31414 31620 35793 18263 20661 20041 20554 1993 38783 25711 FONTE : Ministério da Fazenda BALANÇA COMERCIAL BRASIL – 1989 – 93 US$ milhão 40000 35000 30000 25000 20000 Exportações Importações 15000 10000 5000 0 1989 1990 1991 FONTE : Ministério da Fazenda 1992 1993 d) Gráfico em setores Este tipo de gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação da parte no todo. Exemplo: REBANHO SUÍNO DO SUDESTE DO BRASIL 1992 ESTADOS Minas Gerais Espírito Santo Rio de Janeiro Sào Paulo Total QUANTIDADE (mil cabeças) REBANHO SUÍNO DO SUDESTE DO BRASIL 1992 3.363,7 430,4 308,5 2.035,9 6.138,5 Minas Gerais Espírito Santo Rio de Janeiro São Paulo FONTE : IBGE FONTE : IBGE NOTA: O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas e) Pictograma Este tipo de gráfico é o que melhor transmite ao público em geral os seus dados, pela forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Exemplos: Para a série estatística: POPULAÇÃO DO BRASIL 1960 - 1990 ANOS 1960 1970 1980 1990 HABITANTES (milhares) 70.070,4 93.139,0 118.562,5 155.822,4 FONTE:IBGE temos a seguinte representação pictórica: POPULAÇÃO DO BRASIL 1960 - 90 1960 1970 1980 1990 Cada símbolo representa 20.000.000 de habitantes FONTE : IBGE Na verdade o gráfico acima é um gráfico em barras; porém as figuras o tornam mais atrativo. Na confecção de gráficos pictóricos devemos utilizar muita criatividade, procurando obter uma otimização na união da arte com a técnica. Observa mais um gráfico abaixo: Cresce o total de drogados no Brasil casos de AIDS no Brasil FONTE:Ministério da Saúde 51 Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 52 DISTRIBUIÇÃO DE FREQÜÊNCIA Tabela primitiva e rol A forma pela qual podemos descrever os dados estatísticos resultantes de variáveis quantita-tivas, como é o caso da estatura dos alunos de uma classe, representadas nas tabelas abaixo,podem ser : Uma tabela primitiva, quando os seus elementos não foram numericamente organizados. 166 162 155 154 160 161 152 161 Estatura de 40 alunos de um colégio x 161 150 162 160 165 167 168 163 156 173 160 155 163 160 155 155 169 151 156 172 153 157 156 158 164 164 170 158 160 168 164 161 Uma tabela com seus dados organizados através de uma certa ordem (crescente ou decrescente). A essa tabela damos o nome de rol. 150 151 152 153 154 155 155 155 Estatura de 40 alunos de um colégio x 155 157 160 161 162 164 156 156 156 158 158 160 160 160 160 161 161 161 162 163 163 164 164 165 166 167 168 168 169 170 172 173 Agora podemos saber, com relativa facilidade , qual a menor estatura (150 cm), qual a maior estatura (173 cm) ; que a amplitude de variação foi 173 – 150 = 23 cm; e a ordem que um determinado valor ocupa no conjunto. Agrupamento de dados Agrupar os dados significa reduzir informacões sem perdê-las. Aproveitando o exemplo acima, podemos demonstrar que uma tabela onde uma coluna tem os valores ordenados e na coluna ao lado, a respectiva freqüência, ou seja o número de vezes que cada valor aparece, tornase mais fácil observar e estudar a variável. A essa tabela damos o nome de distribuição de freqüência: ESTAT. FREQ. (cm) 150 1 151 1 152 1 153 1 154 1 155 4 156 3 157 1 ESTAT. (cm) FREQ. 158 2 160 5 161 4 1`62 2 163 2 164 3 165 1 166 1 ESTAT. FREQ. (cm) 167 1 168 2 169 1 170 1 172 1 173 1 Total 40 Embora esse processo tenha melhorado a nossa tabela, ainda não está de maneira aceitável.Sendo possível pela própria natureza da variável contínua, o agrupamento dos valores em intervalos. Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 53 Assim , se um dos intervalos for, por exemplo,154 158 , em vez de dizermos que a estatura de 1 aluno é 154 cm ; de 4 alunos , 155 cm;de 3 alunos , 156; e de 1 aluno, 157, diremos que 9 alunos tem estaturas entre 154 (inclusive) e 158 cm. Estatura Freqüência (em cm) 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 Perceba que com essa nova tabela acabamos perdendo pormenores, mas como o que realmente nos interessa é realçar o que há de essencial nos dados, e também tornar possível o uso de técnicas analíticas para a sua total descrição, até porque a estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA Classe Classes de freqüência ou ,simplesmente, classes , são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1,2,3,..,k ( onde k é o número total de classes da distribuição). Assim, na tabela acima , o intervalo 158 162 define a terceira classe ( i = 3). Como a distribuição é formada por seis classes podemos afirmar que k = 6. Limites de classe Denominamos limites de classe os extremos de cada classe. Assim sendo o menor valor da classe é o limite inferior da classe ( li) e o maior número, o limite superior da classe (Li). Na teceira classe , por exemplo, temos: limite inferior l3 = 158 e limite superior L3 = 162 Amplitude de um intervalo de classe É a medida que define a classe. Ela é obtida através da diferença entre os limites superior e inferior da classe e indicaremos por hi. Assim : hi = Li - li Na distribuição anterior temos: h2 = L2 – l2 ⇒ h2= 158 – 154 = 4 ⇒ h2 = 4 cm Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 54 Amplitude total da distribuição Amplitude total da distribuição (AT) é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L (max.) – l (mín.) Na nossa distribuição anterior temos que AT = 174 – 150 = 24 cm Amplitude amostral Amplitude amostral (AA) é a diferença entre o valor máximo e valor mínimo da amostra. Ainda na distribuição anterior temos: AA = 173 – 150 = 23 cm Observação: Perceba que a amplitude da distribuição “jamais” coincide com a amplitude amostral. Ponto médio de uma classe Ponto médio de uma classe (xi), é como o próprio nome indica, é o ponto que divide o intervalo em duas partes iguais.Podemos obter o ponto médio de uma classe através da semi-soma dos limites da classe (média aritmética). xi = li + L i 2 Freqüência simples ou absoluta Freqüência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. A freqüência simples é simbolizada por fi ( lemos: f índice i ou freqüência da classe i). Na distribuição que estamos usando como exemplo temos : k f1 = 4 ,f2 = 9 , f3 = 11 , f4 = 8 , f5 = 5 e f6 = 3 fi . ∑ A soma de todas as freqüências é representada por i =1 No nosso exemplo temos: 6 ∑ f i = 40 i =1 Podemos usar também Observe como ficou agora a nossa distribuição de freqüência das estaturas dos alunos do colégio x. ESTATURA DE 40 ALUNOS DO COLÉGIO X i Estatura (em cm) 1 2 3 4 5 6 150 154 158 162 166 170 154 158 162 166 170 174 fi 4 9 11 8 5 3 ∑ fi = 40 Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 55 Numero de classes e Intervalos de classe. Uma das melhores maneiras para obtermos o número de classes é o julgamento pessoal, sempre que possível evitando classes com freqüência nula. Deteminado o número de classes que deve ter a distribuição , vamos agora determinar a amplitude do intervalo de classe, o que conseguirenmos dividindo a amplitude total pelo número de classes: h= AT i Quando o resultado não for exato devemos arredondá-lo para mais. No nosso exemplo temos: 173 − 150 23 = = 3,8 = 4 6 6 Isto é, seis classes de intervalos iguais a 4. h= EXERCICIOS 1º) As notas obtidas por 50 alunos de uma classe foram: 1 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9 9 a) Complete a distribuição de freqüência abaixo: i 1 2 3 4 5 NOTAS xi fi ∑ fi = b) Agora responda: Qual a amplitude amostral? Qual a amplitude da distribuição? Qual o número de classes da distribuição? Qual o limite inferior da quarta classe? Qual o limite superior da classe de ordem 2? Qual a amplitude do segundo intervalo de classe? c) Complete: h3 = AA= AT= l1 = L3= x2 = f5= l5 = Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 56 TIPOS DE FREQÜÊNCIAS Freqüência simples ou absoluta ( f i ) É o valor que representa o número de dados da classe Já vimos que a soma das freqüências simples é igual ao número total dos dados: ∑ fi Freqüência relativa ( f r ) =n É o valor que se obtém através da razão entre a freqüência simples da classe e a freqüência total. fr i = fi ∑ fi NOTA: O intuito das freqüências relativas é o de permitir a análise ou facilitar as comparações. Freqüência acumulada (Fi) É o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Fk = f1 + f2 + f3 +…+ f k Freqüência acumulada relativa ( Fr i ) A freqüência acumulada relativa de uma classe é o quociente entre a freqüência acumulada da classe e a freqüência total da distribuição. Fr i = Fi ∑ fi Observe o exemplo abaixo: ESTATURA DE 40 ALUNOS DO COLÉGIO X i 1 2 3 4 5 6 Estatura (em cm) 150 154 158 162 166 170 154 158 162 166 170 174 fi xi fri 4 9 11 8 5 3 ∑ f i = 40 152 156 160 164 168 172 0,100 0,225 0,275 0,200 0,125 0,075 Σ=1,000 Fi 4 13 24 32 37 40 Fri 0,100 0,325 0,600 0,800 0,925 1,000 Com o conhecimento dos vários tipos de freqüência podemos responder perguntas como: a) Quantos alunos tem estatura abaixo de 162 cm? Resposta: Esse valor vamos conseguir através da freqüência acumulada da 3ª classe que é F3 = 24 alunos. b) Qual a percentagem de alunos cujas estaturas são inferiores a 158 cm? Resposta: Esse valor vamos obter através do produto da freqüência relativa acumulada da 2ª classe por 100, ou seja Fr2 . 100 , que nos dá o resultado 0,325 . 100 = 32,5% dos alunos da distribuição. Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 57 DISTRIBUIÇÃO DE FREQÜÊNCIA SEM INTERVALO DE CLASSE Quando se tratar de variável discreta, de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe ( intervalo degenerado), e nesse caso a distribuição de freqüência é sem intevalo de classe. Exemplo: Uma pesquisa foi elaborada para constatar o número de comodos existentes nas casas de 20 famílias entrevistadas, onde xi é a variável número de cômodos: i 1 2 3 4 5 6 xi 2 3 4 5 6 7 fi 4 7 5 2 1 1 Σ=20 Podemos agora completar a tabela acima com os vários tipos de freqüência: i 1 2 3 4 5 6 xi 2 3 4 5 6 7 fi 4 7 5 2 1 1 Σ=20 fri 0.20 0,35 0,25 0,10 0,05 0,05 Σ=1,00 Fi 4 11 16 18 19 20 EXERCÍCIOS 1º) Complete a distribuição abaixo, determinando as freqüências simples: i 1 2 3 4 5 xi 2 3 4 5 6 fi Σ=34 Fi 2 9 21 29 34 Fri 0,20 0,55 0,80 0,90 0,95 1,00 Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 58 2º) Conhecidas as notas de 50 alunos: 8 7 6 7 6 7 7 8 4 9 3 8 4 8 6 5 9 5 6 5 5 7 5 9 4 7 5 7 4 2 1 4 2 8 9 6 4 9 5 9 7 8 7 6 3 7 8 4 2 1 Obtenha a distribuição de freqüência com intervalos de classe sabendo que a distribuição tem 5 classes. i NOTAS xi fi 3º) Complete a tabela abaixo: i 1 2 3 4 5 CLASSES 0 8 16 24 32 8 16 24 32 40 fi 4 10 14 9 3 Σ= fri .... .... .... .... .... Σ= Fi .... .... .... .... .... Fri .... .... .... .... .... Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 59 4º) A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: ÁREAS 300 400 500 600 700 800 900 1000 1100 1200 (m2) Nº DE 14 46 58 76 68 62 48 22 6 LOTES Com referência a essa tabela, determine: a)a amplitude total; b)o limite superior da quinta classe; c)o limite inferior da oitava classe; d)o ponto médio da sétima classe; e)a amplitude do intervalo da quarta classe; f)a freqüência da quarta classe; g)a freqüência relativa da sexta classe; h)a freqüência acumulada da quinta classe; i)o número de lotes que não atinge 700m2; j)o percentual de lotes cuja área não atinge 600m2; 5º) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus: Nº de acidentes Nº de motoristas 0 1 2 3 4 5 6 7 20 10 16 9 6 5 3 1 Determine: a)o número de motoristas que não sofreram nenhum acidente; b)o número de motoristas que sofreram pelo menos 4 acidentes; c)o número de motoristas que sofreram no mínimo 3 acidentes e no máximo 5 acidentes. Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 60 MEDIDAS DE TENDÊNCIA CENTRAL As medidas de tendência central são as mais importantes das medidas de posição, e recebem essa de-nominação pelo fato de os dados observados tederem, em geral, a se agrupar em torno dos valores cen-trais. Dentre as medidas de tendência central, destacamos a média aritmética; a mediana e a moda. Média aritmética ( x ) Média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles: x= ∑ xi n Sendo que: x = média aritmética xi = valores da variável n = número de valores DADOS NÃO AGRUPADOS Para determinarmos a média dos dados não-agrupados, determinamos a média aritmética simples. Exemplo: Sabendo-se que a produção leiteira diária da vaca Mimosa, durante uma semana, foi de 12,14,10,15,16,18 e 13 litros, temos para a produção média da semana: x= 12 + 14 + 10 + 15 + 16 + 18 + 13 98 = = 14 litros 7 7 DADOS AGRUPADOS Sem intervalos de classe Neste caso as freqüências são números que indicam as intensidades de cada valor da variável, logo elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, obtida pela fórmula: x= ∑ x ifi ∑ fi O modo mais prático de obtermos a média ponderada é abrir, na tabela , uma coluna correspondente aos produtos xifi : Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 61 Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para a variável o número de filhos do sexo masculino: Nº de meninos 0 1 2 3 4 fi 2 6 10 12 4 Σ = 34 Podemos agora abrir uma coluna na tabela ,com os produtos xifi: Nº de meninos 0 1 2 3 4 Temos, então: fi xifi 2 0 6 6 10 20 12 36 4 16 Σ = 34 Σ = 78 Σ xifi = 78 e Σ fi = 34 Logo: x= ∑ x ifi ⇒ x = 78 = 2,29 ⇒ x = 2,3 meninos 34 ∑ fi Nota: Sendo o x uma variável discreta, o valor médio 2,3 meninos sugere ,neste caso, uma leve supe-rioridade numérica no número de meninos em relação ao número de meninas. Com intervalos de classe Neste caso, vamos calcular a média através do ponto médio determinado em cada intervalo de classe. Com isso a fórmula para o cálculo da média aritmética ponderada será a mesma. x= ∑ x ifi ∑ fi Apostila de matemática aplicada – Prof.Renato A .Toledo Análise e desenvolvimento de sistemas 62 EXERCÍCIOS 1º) Complete o esquema para o cálculo da média aritmética da distribuição de freqüência: CUSTO 450 (R$) fi 550 8 650 10 750 11 850 16 950 13 1050 5 1150 1 Temos: i xi 500 .... .... .... .... .... .... 1 2 3 4 5 6 7 fi 8 … … … … … … xifi 2º) Calcule a média aritmética ponderada, de um aluno que obteve as seguintes notas nas provas parciais de matemática: 1ª prova parcial (peso1) .............50 2ª prova parcial (peso2) .............70 3ª prova parcial (peso2) .............45 4ª prova parcial (peso3) .............60 3º) Um escritório negociou os seguintes títulos: Títulos de $1.000 .......18 Títulos de $ 500 .........8 Títulos de $ 200 .........2 Qual o valor médio dos títulos negociados? 4º) Calcule a média aritmética , considerando a distribuição abaixo: i 1 2 3 4 5 Estatura 140 150 160 170 180 150 160 170 180 190 fi 2 6 8 6 2