Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Lição 5 – Medidas Descritivas – Medidas de Dispersão Após concluir o estudo desta lição, esperamos que você possa: • identificar o objetivo das medidas de dispersão; • identificar o conceito de variância; • identificar o conceito de desvio-padrão; • identificar o conceito de coeficiente de variação; • executar operações de cálculo de variância; • executar operações de cálculo de desvio-padrão; • executar operações de cálculo de coeficiente de variação. Veja os temas que você irá estudar nesta lição: • Tema 1 – Finalidade das medidas de dispersão. • Tema 2 – Cálculo das medidas de dispersão: variância, desvio-padrão e coeficiente de variação. 99 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão CONVERSA INICIAL Provavelmente você já se familiarizou com as principais operações estudadas até o momento, principalmente aquelas relacionadas à captação de dados, apresentação tabular de dados, apresentação gráfica de dados e estatística descritiva. Todos esses conceitos, regras e instrumentos, associados com outros conhecimentos e habilidades, serão muito úteis quando, no seu dia-a-dia pessoal e profissional, você for incumbido de realizar tarefas que envolvem a Estatística Básica, inclusive a elaboração de certos relatórios. Conforme você estudou na Lição 4, as medidas descritivas dividem-se em medidas de tendência central e medidas de dispersão. Nesta lição você estudará três medidas de dispersão: a variância, o desvio-padrão e o coeficiente de variação. TEMA 1 – FINALIDADE DAS MEDIDAS DE DISPERSÃO Qual é a finalidade das medidas de dispersão? As medidas de dispersão servem para indicar a ocorrência de muita discrepância entre o valor mínimo e o valor máximo de um conjunto de dados. Essas medidas indicam se os dados estão concentrados ou dispersos e o quanto são adequados para representar um conjunto. Entenda melhor esse conceito com as explicações a seguir: 101 102 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Tomemos como referência a média de altura dos brasileiros. O Brasil apresenta uma grande miscigenação de povos e, por isso, há uma grande variação (dispersão) na altura dos habitantes. Quando se diz que a altura média do brasileiro é de 1,65m, com certeza há pessoas de 1,20m a 2,20m. Em países onde não ocorre essa miscigenação tão marcante, para uma população com altura média de 1,65m, provavelmente, os extremos irão variar entre 1,55m e 1,75m. Perceba que a média é a mesma, mas os extremos dos dados são bastante diferentes. Para entender melhor as medidas de dispersão, vamos retomar um pouco as medidas de tendência central, mais precisamente a média aritmética simples. Acompanhe nos exemplos a seguir: Exemplo nº 1 Caso alguém se referisse a uma média de 58,1, pode ser que você não imaginasse que 9 e 100 fazem parte desse conjunto, não é mesmo? Esses números estão muito longe da média, mas é bastante razoável pensar que a média 63,3 inclui o valor 55 ou 70. Confira: Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão A = { 50, 55, 60, 65, 70, 75 } Média aritmética = 62,5 B = { 9, 9, 40, 80, 81, 88, 100 } Média aritmética = 58,1 Dois grupos de números podem possuir a mesma média, mas serem muito diferentes na amplitude de variação de seus dados. Por exemplo: Grupos (dados observados) Números A 5; 5; 5 B 4; 5; 6 C 0; 5; 10 Nesse caso, a média dos três grupos é igual a 5. Exemplo nº 2 Observe outra situação-problema: Três operadores de determinada Unidade Operacional dos Correios triam objetos em 3 caixetas de correspondências, simultaneamente. Ao final da operação, a média de objetos triados foi a mesma para os três operadores. Será que a quantidade triada, em cada caixeta, foi a mesma? 103 104 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Verifique na tabela: Quantitativo de Objetos Triados Operador Caixeta 1 Caixeta 2 Caixeta 3 Média 1 450 210 120 260 2 310 290 180 260 3 50 400 330 260 No exemplo dos grupos: A, B e C, a média aritmética dos objetos triados é a mesma, mas há variação dos dados. Dessa forma, uma maneira mais minuciosa e completa de apresentar os dados (além de aplicar uma medida de tendência central como a média), é aplicar uma medida de dispersão. Quando um conjunto de dados varia pouco em relação à média, é porque essa média representa bem o conjunto. TEMA 2 – CÁLCULO DAS MEDIDAS DE DISPERSÃO: VARIÂNCIA, DESVIO-PADRÃO E COEFICIENTE DE VARIAÇÃO Afinal, como proceder para efetuar o cálculo das medidas de dispersão? As medidas são calculadas pela aplicação de fórmulas que utilizam símbolos. Para melhor entendimento dessas fórmulas serão apresentados alguns desses símbolos, ou seja, você vai conhecer a notação utilizada nas fórmulas. Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Notação é o conjunto dos símbolos utilizados nas fórmulas para expressar corretamente as medidas e potências envolvidas nos dados. Genericamente, um número pertence a um conjunto e é representado por uma letra e um índice: xi. A notação “x” representa um dado qualquer de um conjunto onde o índice “i” indica a ordem do número no conjunto. Se i = 1 é porque se trata do primeiro elemento do conjunto; sendo i = 2 o segundo elemento e assim por diante. Acompanhe um exemplo: O conjunto {7, 8, 10, 9} representa as notas obtidas por um empregado dos Correios que participou do Curso de Formação de Técnicos Operacionais – TOP. Observe a representação: x1 = 7 x2 = 8 x3 = 10 x4 = 9 O tamanho do conjunto é representado pela letra n. Nesse exemplo, n = 4, ou seja, o conjunto possui 4 elementos. A letra n indica ainda, o maior valor possível para i. A letra grega Σ, chamada sigma é também um símbolo importante e representa o somatório ou a soma de um conjunto de números. A soma de um conjunto de n elementos é representada pela seguinte fórmula: 105 106 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão De posse dessas informações, conheça as medidas de dispersão. Variância Vamos começar pela variância. Para a estatística, a variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando quão longe, em geral, os seus valores se encontram do valor esperado. O seu símbolo é s². Observe a fórmula: onde, • • • • s² é a variância; xi é o i-ésimo dado observado; é a medida de tendência central; “n” é a quantidade de dados. Para exemplificar, vamos utilizar a média aritmética como medida de tendência central, a partir da situação de postagens de cartas simples abordada nas lições anteriores: Dia da semana Quantidade de cartas simples Segunda-feira 1.027,0 1.947,9 848.056,8 Segunda-feira 1.259,0 1.947,9 474.583,2 Quinta-feira 1.852,0 1.947,9 9.196,8 Quarta-feira 1.935,0 1.947,9 166,4 Quinta-feira 2.004,0 1.947,9 3.147,2 Quarta-feira 2.004,0 1.947,9 3.147,2 Terça-feira 2.198,0 1.947,9 62.550,0 Terça-feira 2.312,0 1.947,9 132.568,8 Sexta-feira 2.327,0 1.947,9 143.716,8 Sexta-feira 2.561,0 1.947,9 375.891,6 Somatório 2.053.024,9 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Desvio-padrão O desvio-padrão é representado pela raiz quadrada da variância, seu símbolo é s e o seu cálculo é efetuado por meio da utilização da seguinte fórmula: Veja um exemplo, a partir daquele apresentado para a variância: Você provavelmente percebeu que o desvio-padrão é uma medida mais fácil de ser entendida, pois se encontra na mesma dimensão dos dados e não ao quadrado. Coeficiente de variação Para quem não possui formação em estatística, talvez seja a medida mais simples de ser usada para verificar se os dados estão variando muito ou pouco. Trata-se da divisão do desvio-padrão pela medida de tendência central utilizada e o seu valor varia entre zero e um. Sua fórmula é a seguinte: 107 108 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Partindo ainda do exemplo apresentado anteriormente e considerando que foi utilizada a média aritmética para calcular o desvio-padrão, então temos: Veja 2 importantes dicas para facilitar a sua compreensão: • Quanto menor o coeficiente de variação, menos dispersos estão os dados, ou seja, estão mais próximos da medida de tendência central utilizada. • Uma vez que o coeficiente de variação do exemplo apresentado foi de 0,25, isso indica que os dados estão bastante concentrados em relação à média. Sendo assim, pode-se concluir que a postagem de cartas simples no período observado, segue um padrão regular e ocorre pouca variação. Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Nesta lição você aprendeu que: • As medidas de dispersão servem para indicar a ocorrência de muita discrepância entre o valor mínimo e o valor máximo de um conjunto de dados. • Quando um conjunto de dados varia pouco em relação à média, é porque essa média representa bem o conjunto. • A variância de uma variável aleatória é uma medida da sua dispersão estatística, indicando quão longe, em geral, os seus valores se encontram do valor esperado. • O desvio-padrão é representado pela raiz quadrada da variância. • O coeficiente de variação é obtido por meio da divisão do desvio-padrão pela medida de tendência central utilizada e o seu valor varia entre zero e um. • As medidas de tendência central (média aritmética, moda e mediana), descrevem apenas uma das características dos valores numéricos de um conjunto de observações: o da tendência central. Porém, nenhuma delas informa sobre o grau de variação ou dispersão dos valores observados. • Em qualquer grupo de dados, os valores numéricos não são semelhantes e apresentam desvios variáveis em relação à tendência geral da média. Por isso, as medidas de dispersão servem para avaliar o quanto os dados são semelhantes e o quanto estão distantes do valor central. Servem também para avaliar qual o grau de representação da média. 109 Estatística Básica 111 Lição 5 – Medidas Descritivas – Medidas de Dispersão EXERCÍCIO Instruções: 1. Este exercício tem o objetivo de consolidar a sua aprendizagem. 2. Após a conclusão, verifique as “Respostas e Comentários das Atividades de Autoavaliação da Aprendizagem”, disponíveis no final deste livro didático. 3. Se necessário, retorne aos conteúdos para reforçar a sua aprendizagem. 4. Este exercício não valerá nota. Questão nº 1 Escreva a letra V para as afirmativas verdadeiras e a letra F para as falsas, em relação ao objetivo das medidas de dispersão. ( ( ( ( ) As medidas de dispersão indicam a ocorrência de muita discrepância entre o valor mínimo e o valor máximo de um conjunto de dados. ) As medidas de dispersão indicam os valores centrais ou típicos de um conjunto. ) As medidas de dispersão indicam a média aritmética de um conjunto de dados e têm a finalidade de auxiliar a compreensão dos problemas e a representação de ideias e conceitos. ) As medidas de dispersão indicam se os dados estão concentrados ou dispersos e o quanto são adequados para representar um conjunto. Selecione a alternativa que apresenta a CORRETA indicação, de cima para baixo: A. ( B. ( C. ( D. ( ) V, F, F, V ) V, F, V, F ) V, V, F, F ) V, V, V, F 112 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Questão nº 2 Associe os conceitos às respectivas medidas de dispersão: (1) Variância (2) Desvio-padrão (3) Coeficiente de variação ( ( ( ) Divisão do desvio-padrão pela medida de tendência central utilizada, sendo que seu valor varia entre zero e um. ) Raiz quadrada da variância. ) Indica quão longe, em geral, os seus valores se encontram do valor esperado. Selecione a alternativa que apresenta a CORRETA associação, de cima para baixo: A. ( B. ( C. ( D. ( ) 3, 2, 1 ) 1, 2, 3 ) 2, 3, 1 ) 2, 1, 3 Questão nº 3 O cliente Brasil Representações S/A tem um contrato de postagem de Sedex a faturar com os Correios. De acordo com os dados abaixo e tendo como base a média aritmética, calcule a variância, o desvio-padrão e o coeficiente de variação. a) O valor da variância é: ___________________________________________________ b) O valor do desvio-padrão é: _______________________________________________ c) O valor do coeficiente de variação é: ________________________________________ Estatística Básica 113 Lição 5 – Medidas Descritivas – Medidas de Dispersão Dias de Postagem Peso dos objetos (Kg) 1 1,020 2 0,890 3 2,560 4 1,560 5 0,750 6 1,800 7 0,560 8 0,480 9 1,250 10 0,720 11 0,320 12 0,560 Variância Desvio-padrão Coeficiente de variação peso-média (peso-média)² 114 Estatística Básica Lição 5 – Medidas Descritivas – Medidas de Dispersão Parabéns! Você concluiu o estudo da lição 5! Faça, agora, uma autoavaliação da sua aprendizagem. Relembre os objetivos de aprendizagem apresentados no início desta lição: • • • • • • • identificar o objetivo das medidas de dispersão; identificar o conceito de variância; identificar o conceito de desvio-padrão; identificar o conceito de coeficiente de variação; executar operações de cálculo de variância; executar operações de cálculo de desvio-padrão; executar operações de cálculo de coeficiente de variação. Verifique agora: Se você então • verifique se há pendências nas lições estudadas; • verifique sua agenda de estudo no cronograma de atividades no Guia do Participante; atingiu os objetivos de aprendizagem desta lição, • acesse o ambiente UniCorreios Virtu@l no endereço http://unicovirtual/moodle/, faça seu login e realize as seguintes atividades: a) Avaliação da Aprendizagem Final; b) Avaliação de Reação (pesquisa de satisfação). não atingiu os objetivos de retorne aos conteúdos necessários para reforçar a sua aprendizagem desta lição, aprendizagem.