TEXTO BÁSICO
ESTATÍSTICA APLICADA
PROF. JOSÉ MILTON SANCHES
CAMPINAS - 2014
1
CAPÍTULO 1
CONCEITOS BÁSICOS
Toda vez que se pretende avaliar um conjunto de informações, o pesquisador deparase com um volume enorme de dados que deverão ser observados, organizados e
apresentados de tal forma que os aspectos relevantes possam ser utilizados no
processo de tomada de decisão.
Assim sendo, as informações estatísticas fornecidas pelas variáveis servirão de base
para a realização dos estudos. A consistência do estudo depende de como os dados
foram coletados, já que a variabilidade presente em qualquer variável poderá distorcer
os resultados das análises.
1.1 Tipos de variáveis e níveis de mensuração
O termo variável é autodefinido, ou seja, é aquilo que pode assumir valores diferentes.
As variáveis estatísticas se dividem em:
a) Variável qualitativa: é aquela cuja classificação é discreta, exaustiva e mutuamente
exclusiva. Os níveis de mensuração dessas variáveis são:
Nominal: é caracterizado por dados que consistem apenas em nomes, rótulos ou
categorias. Neste caso, os dados não contemplam qualquer organização
predeterminada. Exemplo: sexo, raça, estado civil, cor, etc.
Ordinal: é caracterizado por dados que podem ser apresentados em alguma ordem
que impossibilita a quantificação das diferenças. Exemplo: nível de instrução,
classes socioeconômicas, resultado de um concurso, etc.
b) Variável quantitativa: é aquela cujo nível de mensuração permite a ordenação e a
quantificação das diferenças existentes nos dados. Este tipo de variável pode ser:
discreta – assume apenas valores inteiros numa determinada escala – ou contínua –
assume qualquer valor numa determinada escala. Os níveis de mensuração dessas
variáveis são:
Intervalar: é idêntico ao nível ordinal, só que neste caso é perfeitamente possível
identificar diferenças entre os dados apresentados. Exemplo: idade, peso, preço de
mercado, quantidade demandada ou ofertada, etc.
Razão: é utilizada quando se pretende apresentar a variável em forma de escala
proporcional, por exemplo, um terreno de 500 m 2 tem o dobro da área de um
terreno de 250 m2.
2
1.2 População e amostra
Ao se estudar um atributo qualquer presente em todos os elementos de um conjunto,
estamos identificando uma população. Na análise estatística, a identificação da
população – ou público-alvo da pesquisa – é fundamental para que os objetivos do
estudo
sejam
atingidos.
Por
exemplo,
se
uma
pesquisa
deseja
características de consumo para o produto “fralda descartável” é
identificar
evidente que a
população a ser pesquisada só pode ser de mulheres que têm ou tiveram filhos. Ainda
assim, é necessário verificar se a mulher em questão utilizou “fralda descartável” nos
seus filhos. Uma vez definida a população de estudo é necessário selecionar uma
amostra representativa da população. Apesar do processo de amostragem ser
complicado, é possível obterem-se informações importantes a partir da amostra que
serão generalizadas para a população – inferência estatística –, desde que o
pesquisador haja com o máximo de precaução, caso contrário, os dados obtidos serão
tão inúteis que nenhum tratamento estatístico poderá resgatá-los.
Em muitos casos, torna-se impossível trabalhar com a população. Vejamos um
exemplo: o exame de sangue é feito retirando-se do paciente uma pequena
quantidade; seria inadequado – creio impossível – retirarmos todo o sangue para
realizar o referido exame. Além disso, poderíamos colocar a seguinte questão: uma
pequena amostra de sangue é representativa da população? Sim, desde que o
indivíduo tenha feito o jejum de doze horas, normalmente solicitado neste tipo de
exame.
1.3 Métodos de amostragem
O processo de generalização das informações obtidas na amostra para a população
chama-se “inferência estatística”. A validade desse processo está fundamentada na
hipótese de que a amostra obtida é representativa da população em estudo. As
amostras podem ser obtidas de quatro formas básicas:
a) Amostra aleatória simples: neste tipo de amostragem os elementos da população
são escolhidos de tal forma que todos tenham igual probabilidade de figurar na
amostra. Atualmente, a amostragem aleatória pode ser feita utilizando-se “pacotes
estatísticos” que geram números aleatórios automaticamente. Por exemplo, se a
população é formada por 500 indivíduos devidamente identificados por números que
variam de um a quinhentos, como obter uma amostra N=50?
3
Aplicação no Excel
Para obtermos a amostra N=50, procede-se da seguinte forma:
digite numa célula qualquer do Excel a seguinte fórmula:
=aleatórioentre(1;500)
pressione “enter” (é gerado um número aleatório entre 1 e 500)
clique no canto inferior direito e arraste até selecionar as cinquenta células que
conterão os números aleatórios.
Uma vez gerados, os números aleatórios poderão ser modificados. Para tanto,
basta pressionar “F9”.
b) Amostragem estratificada: neste tipo de amostragem, a população do estudo é
subdividida em grupos (ou estratos). Na sequencia é feita uma amostragem aleatória
simples de cada grupo. Nestas condições, a representatividade de todos os grupos é
garantida na amostra final. Exemplo: faixa etária, sexo, estado civil, etc.
c) Amostragem sistemática: neste tipo de amostragem, os elementos são escolhidos
sistematicamente utilizando uma escala previamente definida. Por exemplo, se uma
empresa com 640 colaboradores desejasse obter uma amostra N=80, poderia
selecionar todos os indivíduos partindo de um número aleatório qualquer entre 1 e 8
(640 80), por exemplo, a partir do 5º. Dessa forma, seriam escolhidos, além deste, o
13º, 21º, 29º, 37º, e assim por diante.
d) Amostragem por conglomerados ou áreas: neste tipo de amostragem,
inicialmente divide-se a área da população em partes (ou conglomerados); na
sequência escolhem-se aleatoriamente alguns dos conglomerados e, finalmente,
realiza-se uma amostragem em cada um deles. Um exemplo típico desse tipo de
amostragem se aplica às pesquisas eleitorais; primeiramente identificam-se todas as
zonas eleitorais do município, para depois selecionarmos aleatoriamente aquelas que
serão amostradas.
4
CAPÍTULO 2
DESCRIÇÃO DE DADOS
A partir da constituição da amostra passa-se à caracterização dos dados. Essa fase
denominada de “Estatística descritiva” tem por objetivo organizar os dados de tal forma
que aspectos relevantes presentes no conjunto possam ser observados. Basicamente,
procura-se apresentá-los em forma de tabelas e gráficos, além de calcular as medidas
de tendência central e de dispersão que irão sumarizá-los.
2.1 Sumários de dados quantitativos
Um sumário de ocorrências em cada atributo (ou classe) da variável indica que se está
apresentado os dados em uma distribuição de frequência. Esta abordagem vale tanto
para dados qualitativos, quanto para quantitativos. Apesar disso, devem-se tomar
determinadas precauções que envolvem a apresentação desse tipo de dados. Por
exemplo, se os valores da variável apresentam pouca variabilidade e muitas
repetições, deve-se optar por apresentá-lo de forma isolada e ponderada – também
denominada “valores isolados ponderados”.
Digamos que o gerente financeiro esteja interessado em avaliar o tempo de atraso (em
dias) no pagamento de faturas emitidas pela empresa. Uma amostra aleatória simples
de 30 faturas apresentou os seguintes tempos de atraso.
20
18
20
24
15
21
20
18
20
17
17
20
24
20
20
21
21
18
21
20
18
21
21
21
20
24
20
15
24
18
Observe que temos apenas seis tempos diferentes, o que permitiria a apresentação da
distribuição de freqüência na forma de valores isolados ponderados.
Tempo
Frequência absoluta
simples (Fi)
Frequência relativa
simples (Fri%)
5
Você, no papel de gerente financeiro da empresa, que avaliação faria observando os
dados tabulados?
Ainda que a apresentação de dados na forma de “valores isolados ponderados” seja
muito comum, na maioria das vezes opta-se por outro tipo de distribuição de
frequência, em que os dados referentes a uma determinada variável quantitativa serão
apresentados no nível intervalar.
Considere o seguinte exemplo:
As despesas mensais (em R$) de viagens para uma amostra de 60 colaboradores da
empresa ALFA estão apresentadas na tabela abaixo.
900
1099
1050
1000
979
1298
1151
1243
1280
1112
1300
1498
1400
1451
1325
700
705
897
801
788
1233
1138
1281
1166
1201
1108
845
737
877
500
928
1036
977
1069
945
699
525
643
587
688
1700
1500
1652
1578
1604
1488
1425
1376
1349
1317
1200
1145
1254
1121
1199
911
967
1003
1052
904
A apresentação dos dados no nível intervalar – valores agrupados em classes – exige
o cumprimento de três etapas fundamentais:
Determinar o número de classes.
Determinar a amplitude (tamanho) de cada classe.
Definir o intervalo de classe a ser adotado.
Determinação do número de classes
A literatura a respeito do assunto sugere que uma distribuição de freqüência
apresentada no nível intervalar deve utilizar no mínimo cinco e no máximo vinte
classes. Na realidade, o número de classes a ser adotado depende, em grande parte,
do número de ocorrências constantes na amostra. Assim sendo, é mais indicado obter
um número de classes “referencial” que leva em consideração o tamanho da amostra.
A fórmula proposta por Sturges indica o número aproximado de classes que se deve
adotar ao tabularmos dados no nível intervalar:
Utilizando logaritmo neperiano: n 1 (1,43 ln N)
Utilizando logaritmo decimal: n 1 (3,3 log N)
6
Aplicada a fórmula de Sturges para a amostra de despesas de viagens, obteve-se um
número referencial de 7 classes.
Determinação da amplitude do intervalo de classe
Uma vez identificado o número de classes sugerido por Sturges, parece simples
imaginar que a amplitude de cada classe será definida dividindo-se a amplitude total
(At)1 da distribuição pelo número de classes proposto. Na realidade, o método a ser
utilizado é este mesmo, só que devemos observar e adotar – se possível – alguns
aspectos importantes ao montarmos distribuição de frequência.
Observações
Adotar menos de cinco classes concentraria demais os dados;
Adotar mais de dez classes dispersaria demais os dados, a não ser que a amostra
fosse muito grande;
Adotar um número de classes que permita iniciar com o primeiro valor observado e
terminar com o último;
Adotar intervalos que sejam valores inteiros. Se não for possível, que sejam valores
exatos;
Evitar a montagem de uma distribuição de frequência com classes que não
apresentem ocorrências ou que tenham frequência igual a um.
Agora é possível responder à seguinte questão: é ideal adotar-se sete classes –
sugerido por Sturges – para os dados apresentados na tabela? Para responder, leve
em consideração que a identificação da amplitude total da distribuição é fundamental.
Intervalo de classe
Uma vez definido o número de classes e a amplitude do intervalo deve-se adotar um
intervalo padronizado que informe se os limites – inferior ou superior – estão incluídos
ou excluídos na classe. Para tanto se adota quatro tipos de intervalo:
Intervalo aberto: identificado por (a ── b), inclui todos os valores entre “a e b”,
menos “a e b”.
Intervalo fechado: identificado por (a I──I b), inclui todos os valores entre “a e b”,
inclusive “a e b”.
1
A amplitude total (At) da distribuição de valores é dada pela diferença entre o maior e o menor valor
observado.
7
Intervalo semi-aberto à direita: identificado por (a I── b), inclui todos os valores
entre “a e b”, incluindo “a” e excluindo “b”.
Intervalo semi-aberto à esquerda: identificado por (a ──I b), inclui todos os valores
entre “a e b”, excluindo “a” e incluindo “b”.
O intervalo semi-aberto à direita é muito utilizado na prática, pois permite a tabulação
de dados contínuos ou discretos.
Com base nas informações desenvolvidas até este ponto, pode-se tabular os dados da
tabela no nível intervalar.
Despesas
Fi
Fac
Fac
xxxx xxxx
Fri%
Facr%
Facr%
Pmi
xxxx
Xxxx
xxxx
Definição dos sumários estatísticos:
1. Frequência absoluta simples (Fi): já definido anteriormente, indica o número de
ocorrências em cada classe da variável. Para obtê-la, basta elaborar uma contagem
dos dados enquadrando-os nas respectivas classes.
2. Frequência absoluta acumulada direta (Fac): indica a frequência absoluta
acumulada “abaixo de” qualquer limite superior (inclusive ou exclusive). Para obtê-la,
basta acumular as ocorrências de cada classe, partindo-se da primeira classe.
3. Frequência absoluta acumulada indireta (Fac): indica a frequência absoluta
acumulada “acima de” qualquer limite inferior (inclusive ou exclusive). Para obtê-la,
basta acumular as ocorrências de cada classe, partindo-se da última classe.
4. Frequência relativa simples (Fri%): já definido anteriormente, indica o número
relativo de ocorrências em cada classe da variável. Para obtê-la, basta dividir a
frequência simples de cada classe pelo número total de observações e multiplicar por
100.
5. Frequência relativa acumulada direta (Facr%): indica a frequência relativa
acumulada “abaixo de” qualquer limite superior (inclusive ou exclusive). Para obtê-la,
basta acumular o número relativo de ocorrências de cada classe, partindo-se da
primeira classe.
8
6. Frequência relativa acumulada indireta (Facr%): indica a frequência relativa
acumulada “acima de” qualquer limite inferior (inclusive ou exclusive). Para obtê-la,
basta acumular o número relativo de ocorrências de cada classe, partindo-se da última
classe.
7. Ponto médio da classe (Pmi): é uma medida-resumo do número de ocorrências em
cada classe. Para obtê-lo, basta somar os limites da classe e dividir por dois.
Utilizando os sumários estatísticos apresentados na Tabela 2.6, responda às seguintes
questões:
a) qual é o percentual de colaboradores na classe de maior densidade?
b) qual
é o número de colaboradores que gastam pelo menos
(no mínimo)
R$ 1300,00?
c) qual é o percentual de colaboradores que gastam no máximo R$ 900,00?
d) 31 colaboradores que se encontram nas classes intermediárias, gastam quanto?
e) esboce um gráfico e identifique o tipo de assimetria da distribuição de gastos.
Exercícios
1. Uma faculdade decidiu avaliar o quociente de inteligência dos alunos matriculados
num determinado curso. Para uma população de 1200 alunos, optou-se por uma
amostra aleatória de 60 alunos (5% do total).
Aplicado os testes obteve-se a seguinte pontuação:
118 120
104
111
103
95
87
79
117
119
105 110
102
94
86
78
116
118
106
109
101
93
85
76
115 117
107
108
100
92
84
75
116
108
107
99
91
83
72
115
109
106
98
90
82
114
110 105
97
89
80
113
111
104
96
88
112
100
101 102
Pede-se:
a) Sumarizar os dados no nível intervalar adotando intervalo semi-aberto à direita e
número de classes referencial segundo o processo de Sturges.
b) Quantos alunos têm QI superior a 104 pontos?
c) Qual é o percentual de alunos que tem QI inferior a 96 pontos?
d) Qual o QI médio dos alunos que se encontram na 5º classe?
e) Qual é a frequência relativa da classe de maior densidade?
f) Qual é o tipo de assimetria da distribuição?
9
2. Os histogramas abaixo apresentam o quociente de inteligência de duas amostras
(masculino e feminino) de estudantes de uma determinada escola.
Identifique a partir das assimetrias, o grupo que apresenta melhor desempenho em
termos de QI.
3. Qual é o tipo de assimetria que se espera para a distribuição de salários de uma
empresa de alta tecnologia? Justifique.
4. Sabe-se que o tempo de atendimento é um dos fatores que mais contribuem para a
satisfação do cliente em vários ramos de atividade. Decidido a enfrentar o problema, o
gerente de uma agência bancária encomendou um estudo estatístico para avaliar a
questão.
O polígono de frequência relativa acumulada direta apresentada a seguir se refere ao
tempo de atendimento (em minutos) para 200 clientes que realizaram alguma operação
na agência num determinado dia.
Frequência relativa acumulada
Tempo de atendimento (em minutos)
100
90
80
70
60
50
40
30
20
10
0
30
35
40
45
50
55
60
Tempo
10
Pergunta-se:
a) Qual é o percentual de clientes que foram atendidos no máximo em 50 minutos?
b) Qual o percentual de clientes com tempo de atendimento superior a 48 minutos?
c) Qual é o tempo mediano de atendimento nesta agência?
d) Quantos clientes foram atendidos entre 40 e 50 minutos?
e) Se o gerente define como satisfatório um atendimento em até 35 minutos, qual é o
percentual de clientes que foram atendidos de forma insatisfatória?
f) Obter a partir do polígono de frequência acumulada direta, as frequências – relativas
e absolutas – de todas as classes.
11
CAPÍTULO 3
MEDIDAS DE TENDÊNCIA CENTRAL E SEPARATRIZES
A distribuição de frequências fornece um sistema de classificação que permite avaliar
o padrão de variação de uma determinada variável a partir do valor isolado ou por
classes, caso os dados sejam apresentados no nível intervalar. Embora essa
classificação seja fundamental para a análise do fenômeno, pode ser necessária a
utilização de medidas estatísticas que objetivam sumarizar (resumir) as características
importantes da distribuição de dados. Assim sendo, será desenvolvido o procedimento
para se obter as três medidas de tendência central mais importante: média aritmética,
mediana e moda.
3.1 Média aritmética
É a medida de tendência central mais importante. Fornece um valor central em torno do
qual se distribuem os valores observados. Se o conjunto de dados se refere a uma
amostra, a média aritmética é indicada por " x " , caso contrário, se os dados são
originários de uma população, a média será indicada pela letra grega ““. De qualquer
forma, o método de cálculo é exatamente o mesmo, independente de os dados
provirem de uma amostra ou de uma população.
Média aritmética ( x) para valores isolados simples
Caso os dados da variável sejam apresentados de forma isolada, a média será dada
pela seguinte fórmula:
x
x i
n
Onde, o numerador é a soma – indicada pela letra grega – dos valores observados.
O denominador representa o número de observações do conjunto.
Exemplo:
As quantidades diárias de calorias ingeridas por seis indivíduos são as seguintes:
1800
x
2100
2150
2500
2400
2250
x i 1800 2100 2150 2500 2400 2250 13200
2200
n
6
6
12
Portanto, os seis indivíduos consomem em média 2200 calorias por dia.
Vejamos outro exemplo. O tempo gasto (em minutos) por um grupo de 14 indivíduos
que realizam caminhadas diariamente é o seguinte.
70
65
65
68
80
73
70
60
65
69
70
72
85
68
Neste caso, qual seria o tempo médio diário gasto pelo grupo em caminhadas?
Média aritmética ( x) para valores isolados ponderados
Observe que no exemplo anterior existem valores repetidos, neste caso poderíamos
utilizar uma fórmula alternativa para se calcular a média aritmética.
x
x i . fi
n
Verifique que estamos incorporando ao numerador a freqüência de cada valor
observado. Assim sendo, a freqüência funciona como um fator de ponderação para
cada valor da variável.
Exemplo:
A tabela abaixo apresenta a taxa de juros mensal (em %) praticada por 10 instituições
financeiras.
4,8
5,3
6,2
4,8
Taxa
Fi
x
5,3
4,8
2
5,7
5,3
3
5,7
5,7
3
6,2
5,7
5,3
6,2
2
x i .fi ( 4,8 * 2) (5,3 * 3) (5,7 * 3) (6,2 * 2) 55,3
5,53
n
10
10
Portanto, as 10 instituições financeiras praticam em média taxa de juros de 5,53% ao
mês.
Atenção: observe que o denominador é composto pelo número total de observações
(n=10).
Para os dados apresentados no nível intervalar (por classes) o procedimento para o
cálculo da média aritmética é o mesmo, só que devemos considerar como valor
observado (xi), o ponto médio de cada classe (Pmi).
13
Vejamos um exemplo: a tabela abaixo apresenta as despesas mensais (em R$) de 60
colaboradores da empresa ALFA.
Despesa
Fi
500 | 700
6
700 | 900
8
900 | 1100
15
1100 | 1300
16
1300 | 1500
10
1500 | 1700
5
Pmi
Qual o valor médio das despesas mensais para os 60 colaboradores da empresa Alfa?
Características da média aritmética
A média é altamente sensível a valores extremos da distribuição. Portanto, não é
indicada quando o conjunto apresenta freqüências elevadas nas extremidades,
nem quando apresenta valores discrepantes (outliers).
A média nem sempre apresenta valor real, apesar de situar-se entre os limites da
distribuição.
A média é o valor central da distribuição, pois a soma dos desvios calculados em
relação à média é igual a zero.
Aplicação na HP-12C
Na HP-12C é possível calcular a média aritmética para valores isolados simples, bem
como para ponderados.
Para valores isolados simples, o procedimento é o seguinte:
limpar os registradores pressionando “ f ” ;
digitar o primeiro valor observado, depois pressione +;
proceder da mesma forma até introduzir o último valor;
observar a contagem de valores introduzidos que aparece seqüencialmente no
visor;
após a introdução do último valor, pressione “ g ” x ;
aparecerá no visor o valor da média aritmética simples.
14
Para valores isolados ponderados, o procedimento é o seguinte:
limpar os registradores pressionando “ f ”;
digitar o primeiro valor observado, depois pressione ENTER;
digitar a freqüência correspondente, depois pressione +;
proceder da mesma forma até introduzir o último par (valor observado e respectiva
freqüência);
observar
a
contagem
dos
pares
de
valores
introduzidos
que
aparece
seqüencialmente no visor;
após a introdução do último par de valores, pressione “ g ” x w ;
aparecerá no visor o valor da média aritmética ponderada.
Aplicação no Excel
O cálculo da média aritmética simples no Excel é bastante simplificado. Para tanto,
proceda da seguinte forma:
digitar o conjunto de dados em uma matriz, linha ou coluna (por exemplo, 10 dados
no intervalo A1:A10);
digitar
numa
célula
qualquer
(por
exemplo,
A11)
a
seguinte
fórmula:
=média(A1:A10);
pressionar enter;
aparecerá na célula o valor da média aritmética simples.
3.2 Mediana (Md)
É aquele valor que divide a distribuição em duas partes, estabelecendo um limite que
separa a metade inferior da metade superior. Portanto, 50% das ocorrências ficam
abaixo do valor mediano, e 50% ficam acima. Por exemplo, se estamos interessados
em saber qual é a nota de corte para aprovação de 50% dos alunos, devemos recorrer
à mediana que indicará qual será esta nota mínima.
Mediana para valores isolados simples
Ordenando-se um conjunto de dados com número ímpar de observações, a mediana é
aquele valor que fica na posição central. Se o número de observações for par, a
mediana será dada pela média aritmética dos dois valores centrais.
Verifica-se, portanto, que a ordenação dos dados é pré-condição fundamental para se
identificar o valor mediano da série.
Exemplo:
15
A tabela apresenta o salário mensal (em R$) de 9 indivíduos.
452
550
650
480
355
310
400
660
545
Seria um equívoco assumir que o valor que se encontra na 5ª posição da série é a
Mediana, pois os valores estão desordenados.
Assim sendo, primeiro deve-se ordenar o conjunto de dados:
310
355
400
452
480
545
550
650
660
Agora sim, o valor que se encontra na 5ª posição é o salário mediano da série, que
corresponde a R$ 480,00.
Veja outro exemplo:
A idade de 10 indivíduos está apresentada na tabela abaixo.
55
60
57
65
68
64
72
69
58
62
65
68
69
72
Primeiro deve-se ordenar o conjunto de dados:
55
57
58
60
62
64
Observe que o número de observações é par, portanto, a idade mediana é aquela que
se encontra entre a 5ª e a 6ª posição. Neste caso, basta calcular a média aritmética
dos valores que se encontram nas posições:
Md
62 64
63anos
2
Mediana para valores isolados ponderados
Para dados apresentados de forma isolada, mas que tenham freqüências, o
procedimento para identificação da mediana é análogo ao anterior.
Veja um exemplo:
A tabela apresenta o tempo (em minutos) de espera numa fila de banco para 25
clientes.
Tempo
40
45
55
58
65
Fi
2
5
8
6
4
Pergunta-se: qual o tempo mediano de espera dos clientes?
16
Veja outro exemplo:
As notas obtidas em uma prova por 18 alunos foram as seguintes:
Nota
6
7
8
9
10
Fi
3
6
4
3
2
Pergunta-se: qual a nota mediana dos alunos?
Se os dados da variável são apresentados no nível intervalar (por classes), a mediana
será definida a partir da seguinte fórmula:
Em Fac anterior
Md Li
.h
Fi
da
classe
onde:
Li limite inferior da classe mediana.
Em N 2
Fac anterior freqüência absoluta acumulada até a classe anterior à classe
mediana.
Fi da classe é a freqüência absoluta simples da classe mediana.
h é a amplitude do intervalo da classe mediana.
Observe que a identificação da classe mediana na distribuição é condição fundamental
para que se possa calcular o valor mediano. Portanto, deve-se responder à seguinte
pergunta: qual é a classe mediana da distribuição de valores?
Para responder a pergunta, basta identificar a classe que contém a posição do valor
mediano (Em).
Veja um exemplo:
O nível de precipitação (em mm) durante o mês de janeiro em 70 regiões brasileiras é o
seguinte:
Precipitação
120 | 150
150 | 180
180 | 210
210 | 240
240 | 270
Fi
6
8
13
25
18
Fac
6
14
27
52
70
Pergunta-se: qual é a precipitação mediana nas 70 regiões pesquisadas?
Como a distribuição em questão apresenta um número total de observações igual a 70;
então, a precipitação mediana encontra-se na 35ª posição (70 2).
17
Olhando para a distribuição, verifica-se que a 35ª posição encontra-se na 4ª classe,
portanto, esta é a classe mediana.
Agora ficou fácil calcular o valor mediano da precipitação, basta substituir os valores na
fórmula:
35 27
Md 210
. 30 219,6 mm
25
Verifica-se que entre as regiões pesquisadas, 50% tiveram precipitação mensal inferior
a 219,6 mm. Por outro lado, 50% das regiões tiveram precipitação mensal entre 219,6
e 270 mm.
Veja outro exemplo:
O departamento de pessoal de uma empresa verificou que 120 colaboradores
realizaram horas extras durante um determinado mês. Os números são os seguintes:
Horas
20 | 30
30 | 40
40 | 50
50 | 60
60 | 70
70 |I 80
Fi
30
40
20
15
8
7
Fac
Pergunta-se: para metade dos colaboradores que menos fez horas extras, qual o
número máximo de horas extras realizadas?
Características da Mediana
Uma vez que o valor mediano não depende de todos os dados da série, poderá
ficar inalterado quando modificamos alguns deles.
O valor mediano é indicado para representar conjuntos que apresentam valores
discrepantes (outliers), pois não é influenciada por dados que se encontram na
extremidade da distribuição.
Aplicação no Excel
O cálculo da mediana para valores isolados simples no Excel é bastante simplificado.
Para tanto, proceda da seguinte forma:
digitar o conjunto2 de dados em uma matriz, linha ou coluna (por exemplo, 10
dados no intervalo A1:A10);
digitar numa célula qualquer (por exemplo, A11) a seguinte fórmula: =med(A1:A10);
pressionar enter;
aparecerá na célula o valor da mediana.
2
Cabe esclarecer que para se calcular a mediana no Excel, os dados da variável não precisam estar
ordenados.
18
3.3 Moda (Mo)
O valor modal de um conjunto de dados é aquele que aparece com maior freqüência.
Em determinadas situações podem aparecer mais de um valor modal. Neste caso, o
conjunto é chamado de plurimodal. Caso o conjunto de dados não tenha valor mais
freqüente será considerado “amodal”, devendo-se utilizar outra medida de tendência
central para representá-lo.
Para dados qualitativos, a moda é a medida de tendência central indicada. Veja um
exemplo: a distribuição de freqüências para a compra de cerveja está apresentada na
seqüência:
Cerveja
Skol
Antártica
Brahma
Nova Skin
Bavaria
Kaiser
Fi
30
44
28
20
12
8
Observe que a moda (a cerveja mais comprada) é a Antártica. Fica claro que para este
conjunto de dados, o cálculo da média ou mediana é injustificável. A moda fornece a
informação que nos interessa, ou seja, qual a cerveja mais consumida.
Moda para valores isolados simples
Para conjunto de dados apresentados de forma isolada e sem freqüência, a
identificação do valor modal é visual. Basta identificar aquele valor que aparece com
maior freqüência.
Para fixar o conceito, identifique o valor modal nos conjuntos abaixo:
A = {40, 50, 50, 60, 60, 60, 70, 80, 80}
B = {8, 8, 9, 9, 10, 10}
C = {10, 20, 20, 20, 30, 30, 40, 50, 50, 50, 60, 60}
Moda para valores isolados ponderados
Para dados apresentados de forma isolada e com frequência, a identificação do valor
modal também é visual.
Identifique na distribuição abaixo a idade modal.
Idade
Fi
8
4
9
5
10
7
11
4
19
Se os dados da variável são apresentados no nível intervalar (por classes), o valor
modal – segundo o processo de Czuber – será definido pela seguinte fórmula:
1
Mo c Li
.h
2
1
onde:
Li limite inferior da classe modal 3;
1 Fi máxima – Fi anterior;
2 Fi máxima – Fi posterior;
h amplitude do intervalo da classe modal.
Vejamos um exemplo de aplicação:
A distribuição de frequências abaixo apresenta a produção diária (em unidades) de um
artigo para 150 operários de uma empresa.
Qtdade
Fi
100 | 110
12
110 | 120
20
120 | 130
43
130 | 140
47
140 | 150
18
150 | 160
10
Observa-se que a 4ª classe é a modal, pois possui a freqüência máxima. Para obter a
produção modal, basta substituir os valores na fórmula.
( 47 43)
Mo c 130
. 10
( 47 43) ( 47 18)
4
Mo c 130
. 10
4 29
Mo c 131,21 131unidades
Portanto, a produção diária modal dos 150 operários é de aproximadamente 131
unidades.
Vejamos outro exemplo:
O índice de analfabetismo (em percentual da população) para 50 países está
apresentado na tabela abaixo:
Índice
10 | 15
15 | 20
20 | 25
25 | 30
30 | 35
Fi
10
17
8
8
7
Pergunta-se: qual o índice modal de analfabetismo dos 50 países?
3
Classe modal é aquela que possui a freqüência absoluta simples máxima.
20
Características da Moda
Por não depender de todos os valores da série, o valor modal pode ficar inalterado
quando modificamos alguns deles.
É indicada para representar conjuntos que apresentam valores discrepantes
(outliers), pois não é influenciada por valores que se encontram na extremidade da
distribuição.
Aplicação no Excel
O cálculo do valor modal para valores isolados simples no Excel é bastante
simplificado. Para tanto, proceda da seguinte forma:
digitar o conjunto4 de dados em uma matriz, linha ou coluna (por exemplo, 10
dados no intervalo A1:A10);
digitar
numa
célula
qualquer
(por
exemplo,
A11)
a
seguinte
fórmula:
=modo(A1:A10);
pressionar enter;
aparecerá na célula o valor modal 5 da distribuição.
Identificação da assimetria a partir das medidas de tendência central
Através da média aritmética, mediana e moda, é possível definir o tipo de assimetria da
distribuição de dados, de tal forma que se possa identificar em que área se encontra a
concentração. Do ponto de vista descritivo este aspecto é importante, pois permite uma
primeira interpretação dos dados referentes a uma determinada variável que está
sendo estudada. Por exemplo, se a distribuição de notas dos alunos apresenta
concentração em classes superiores – assimétrica negativa –, pode-se dizer que a
classe teve um bom desempenho.
4
Cabe esclarecer que para se calcular o valor modal no Excel, os dados da variável não precisam estar
ordenados.
5
Se o conjunto de dados for plurimodal, então, o Excel identificará como valor modal o menor deles.
21
Quando a distribuição de dados é unimodal com concentração em classes
intermediárias, diz-se que apresenta simetria, ou seja, não apresenta deformação.
Em muitos casos a concentração de dados poderá ocorrer do lado esquerdo da
distribuição, caracterizando-a como unimodal e assimétrica positiva, pois a cauda mais
alongada se posiciona do lado direito.
Por fim, se a distribuição é unimodal com dados concentrados em classes superiores,
diz-se que é assimétrica negativa, pois a cauda mais alongada se posiciona do lado
esquerdo.
22
3.4 Percentis
Além das medidas de tendência central, existem outras que são utilizadas para
determinar a posição de um determinado valor em relação ao grupo que pertence. Por
exemplo, se num teste qualquer as notas variam de zero a dez, pode-se estar
interessado em identificar a nota máxima para 70% dos indivíduos que obtiveram as
menores notas. Neste caso, seriam determinadas duas faixas de notas: aquela
correspondente a 70% dos indivíduos que tiveram o pior desempenho, e outra
correspondente a 30% dos indivíduos que tiveram o melhor desempenho.
Fica claro, portanto, que através dos percentis6 é possível identificar a participação
relativa – numa escala de zero a 100% – para qualquer faixa de valores da variável.
Percentis para valores isolados simples e ponderados
Para se calcular um percentil qualquer adote o seguinte procedimento:
ordenar os dados de forma crescente;
calcular o elemento percentil (Eci), que é dado por:
p
Ec i
.N
100
onde:
p percentil de interesse;
N número de ocorrências.
Vejamos um exemplo:
A tabela abaixo apresenta a nota obtida por 20 alunos numa prova de estatística.
6
9
5
8
9
6
8
5
4
4
5
9
10
9
10
3
2
4
4
7
Qual a nota máxima de 70% dos alunos que tiveram o pior desempenho?
1ª etapa: ordenar os dados.
2
3
4
4
4
4
6
7
8
8
9
9
2ª etapa: calcular o elemento percentil:
5
9
5
9
5
10
6
10
70
Ec 70
. 20 14
100
6
Também chamada de medidas de ordenamento, pois exige que os dados da variável estejam
ordenados de forma crescente ou decrescente.
23
Portanto, a nota máxima de 70% dos alunos que tiveram o pior desempenho
corresponde à nota do aluno que se encontra na 14ª posição, isto é, 8 pontos.
Pode-se dizer ainda que 70% dos alunos tiveram nota entre 2 e 8 pontos, enquanto
30% tiveram nota acima de 8 pontos.
É muito comum em aplicações estatísticas buscar-se a faixa de valores da variável que
se encontra entre o primeiro e o terceiro quartil da distribuição. Neste caso, estamos
interessados em definir a faixa de valores que corresponde a 50% das observações
que se encontra na intermediária. Para tanto, deve-se definir dois percentis:
P25 que corresponde ao primeiro quartil;
P75 que corresponde ao terceiro quartil.
Veja um exemplo:
A tabela abaixo apresenta o preço (em R$) de um produto em 30 pontos de venda.
8,50
8,70
8,70
9,00
9,00
9,10
9,20
9,30
9,30
9,50
9,50
9,50
9,80
10,20
10,50
11,00
11,00
11,20
11,20
11,30
11,50
11,50
11,60
11,70
11,80
11,90
12,00
12,20
12,20
12,30
Observe que neste caso os dados já estão ordenados, portanto, basta calcular os dois
elementos percentis que nos interessa.
25
Ec 25
. 30 7,5ª posição
100
75
Ec 75
. 30 22,5ª posição
100
O P25 encontra-se na 7,5ª posição. Neste caso, o P25 será dado pela média aritmética
dos valores que encontram na 7ª e 8ª posição.
P25
9,20 9,30
R$ 9,25
2
De forma análoga, o P75 será dado pela média aritmética dos valores que se encontram
na 22ª e 23ª posição.
P75
11,50 11,60
R$ 11,55
2
Verifica-se, portanto, que 50% dos pontos de venda que se encontram
na
intermediária praticam preço entre R$ 9,25 e R$ 11,55.
Caso os dados sejam apresentados de forma isolada e com ponderação, a
identificação do percentil será feita através do sumário estatístico “Freqüência absoluta
acumulada direta (Fac)”.
24
Veja um exemplo:
A tabela a seguir apresenta a idade de 50 indivíduos adultos.
Idade
Fi
28
31
32
34
35
38
4
7
12
15
7
5
4
11
23
38
45
50
Fac
Pergunta-se: qual a faixa de idade de 40% dos indivíduos que têm a menor idade?
Calculando-se a posição Ec40 obtemos:
40
Ec 40
. 50 20ª posição
100
Observando o sumário acumulado da distribuição de idade, verifica-se que na 20ª
posição se encontra a idade de 32 anos. Portanto, 40% dos indivíduos mais novos têm
idade entre 28 e 32 anos.
Percentis para dados apresentados no nível intervalar
Neste caso devemos recorrer a uma fórmula semelhante à da mediana para se calcular
os percentis. A fórmula é a seguinte:
Ec Fac anterior
Pi Li i
.h
Fi da classe
onde:
Li limite inferior da classe que contém a posição Eci;
p
Ec i
.N
100
Fac anterior freqüência absoluta acumulada até a classe anterior à classe que
contém a posição Ec i;
Fi da classe é a freqüência absoluta simples da classe que contém a posição Ec i;
h é a amplitude do intervalo de classe.
Vejamos um exemplo:
A distribuição abaixo se refere ao gasto semanal fora do domicílio (em R$) de 80
adolescentes da classe média.
R$
30 | 40 40 | 50 50 | 60 60 | 70 70 | 80
9
19
31
16
5
Fi
9
28
59
75
80
Fac
Qual é a faixa de gastos semanais de 35% dos adolescentes que mais gastam?
25
Observe que neste caso devemos calcular o P65, pois estamos interessados em definir
a faixa de 35% que mais gastam.
Calculando a posição Ec65 obtemos:
65
Ec 65
. 80 52ª posição
100
Observando o sumário acumulado da distribuição de gastos, verifica-se que na 52ª
posição se encontra na terceira classe.
Substituindo os dados na fórmula:
52 28
P65 50
. 10 57,74
31
Portanto, 35% dos adolescentes que se encontram na faixa superior gastam entre R$
57,74 e R$ 80,00.
Aplicação no Excel
Qualquer percentil pode ser calculado diretamente no Excel, desde que os dados
sejam apresentados de forma isolada. O procedimento é o seguinte:
digitar o conjunto de dados em uma matriz, linha ou coluna (por exemplo, 12 dados
no intervalo A1:A12);
digitar
numa
célula
qualquer
(por
exemplo,
A13)
a
seguinte
fórmula:
=percentil(matriz;k);
O valor se refere ao percentil que se deseja expresso na forma unitária.
pressionar enter;
aparecerá na célula o valor do percentil que se deseja.
Exemplo de aplicação:
Identifique no conjunto abaixo o valor correspondente ao 60º percentil.
43
50
31
39
36
44
44
30
55
27
51
52
=percentil(A1:A12;0,6) 44
O valor encontrado indica que 60% das observações estão abaixo de 44. Por outro
lado, 40% das observações estão acima de 44.
26
Esquema de cinco números e gráfico box-plot7
O gráfico box-plot fornece rapidamente uma série de informações acerca da
distribuição de valores que se está estudando. Os aspectos relevantes a serem
identificados são os seguintes:
tipo de assimetria;
menor e maior valor observado;
mediana da distribuição;
primeiro e terceiro quartil;
intervalo interquartil;
nível de dispersão dos dados.
Para construir o gráfico box-plot deve-se obter inicialmente cinco medidas estatísticas
da distribuição: menor valor, 25º percentil, mediana, 75º percentil e maior valor.
Considere o seguinte exemplo:
As taxas anuais (em percentual) de evasão escolar em vinte escolas públicas estão
apresentadas na tabela abaixo.
5
5
7
8
9
9
9
10
10
10
10
10
11
11
11
12
12
14
15
17
Calculando-se as medidas temos:
Menor=5
P25=9
Me=10
P75=11
Maior=17
A representação gráfica dos cinco números (box-plot) é feita sobre um segmento de
reta que indica a amplitude total da distribuição.
5
9
10
11
17
Informações relevantes sobre a distribuição:
a amplitude total da distribuição é igual a 12%;
50% das escolas (P25 até P75) têm taxas ente 9 e 11%;
25% das escolas têm taxas abaixo de 9%;
25% das escolas têm taxas acima de 11%;
a distribuição é aproximadamente simétrica;
o nível de dispersão dos dados não é muito grande, pois a caixa é relativamente
pequena.
7
Em Portugal, o gráfico box-plot é chamado de “caixa de bigodes”
27
Exercícios
1. As idades de 40 indivíduos que responderam a uma pesquisa de opinião estão
apresentadas na tabela abaixo:
20
29
27
22
25
31
26
23
19
31
36
28
28
45
42
34
19
44
31
35
34
43
48
31
35
31
47
26
42
47
52
25
33
46
51
49
30
32
41
50
a) Calcular as medidas de tendência central: média aritmética, mediana e moda.
b) Identificar a faixa de idade dada pelo intervalo interquartil.
2. Uma amostra de 40 páginas de um livro apresentou a seguinte distribuição de
freqüências de erros de impressão.
Nº de erros
Freqüência
15
4
10
6
6
8
4
10
2
12
40
a) Calcular o número médio de erros por página.
b) Se o livro tem 400 páginas, qual o número de erros de impressão esperado?
3. Um teste realizado com 73 modelos de carros de passeio apresentou o seguinte
consumo de gasolina (em litros) para 100 quilômetros percorridos:
Consumo
6,2
7,5
7,7
8,4
9,2
9,5
10,5
11,6
12,5
Frequência
4
7
8
14
15
9
7
6
3
a) Calcular o consumo médio e o mediano
b) Qual é a interpretação para o consumo mediano?
c) Qual é o consumo mínimo para 20% dos veículos que mais gastam?
4. Qual o tipo de assimetria que caracterizam as distribuições com:
a) cauda alongada à direita?
b) cauda alongada à esquerda?
28
CAPÍTULO 4
MEDIDAS DE VARIABILIDADE
Através de uma medida de tendência central é possível obter o valor característico do
conjunto de dados. Há que se considerar, contudo que o valor médio pode apresentar
problemas de confiabilidade na utilização, principalmente quando a variabilidade em
torno dele é muito grande. Veja um exemplo: você aplicaria recursos em ações de uma
empresa cuja variabilidade em torno dos retornos médios é muito grande? Caso a
resposta seja afirmativa, deve-se considerar também que o risco envolvido no processo
é grande.
Para avaliar o grau de dispersão – absoluto e relativo – em torno da média utilizam-se
as seguintes medidas:
4.1 Intervalo total8
É a diferença entre o maior e o menor valor observado da distribuição. Assim sendo, é
altamente afetado pelos valores discrepantes da distribuição, tornando a sua utilização
muito restrita em análises de variabilidade.
4.2 Intervalo interquatil
É a diferença entre o 75º e o 25º percentil, ou seja, corresponde ao intervalo que
abrange 50% das observações – caixa do box-plot – que se encontram na faixa
intermediária da distribuição. Neste sentido, se o intervalo for pequeno, significa que os
dados estão concentrados em torno da média; caso contrário, apresentarão uma
grande dispersão.
4.3 Variância e desvio padrão
É sem dúvida a medida de dispersão mais utilizada. Ao se calcular a diferença entre
um valor observado é a média da distribuição obtém-se um desvio. A variância é
definida como sendo o desvio quadrático médio da distribuição. O desvio padrão é
dado pela raiz quadrada da variância. Dessa forma, o resultado volta a ser expresso na
unidade de medida dos dados, e não em quadrados de unidades.
8
Como visto no capítulo 2, também é utilizado para se determinar o número de classes quando se
pretende tabular os dados no nível intervalar.
29
Desvio padrão para valores isolados simples
Quando os dados são apresentados de forma isolada, calcula-se o desvio padrão
amostral a partir da seguinte fórmula:
S
( x i x)2
n 1
onde: x i x desvio em relação à média.
Quando se calcula o desvio padrão amostral e não populacional – o que ocorre com
maior freqüência – deve-se adotar no denominador do quociente n-1, em vez de n. Em
termos práticos esse procedimento possibilita uma estimativa melhor do parâmetro
populacional. Para amostras grandes (n > 30) não há diferenças significativas ao se
adotar “n ou n-1”.
Vejamos um exemplo:
A tabela apresenta o salário mensal (em R$) de 10 indivíduos.
770
650
680
580
760
800
820
730
750
730
Pergunta-se: qual o desvio padrão dos salários?
1º passo: calcula-se a média aritmética;
x
7270
R$ 727,00
10
2º passo: calcula-se o desvio em relação à média para cada valor observado;
43
-77
-47
-147
33
73
93
3
23
3
9
529
9
3º passo: eleva-se ao quadrado cada desvio calculado;
1849 5929 2209 21609 1089 5329 8649
4º passo: soma-se os quadrados dos desvios e divide-se por n-1.
S2
47210
5245,56 esse valor é chamado de variância
10 1
5º passo: extraindo-se a raiz quadrada obtém-se o desvio padrão
S
47210
5245,56 R$ 72,43
10 1
Portanto, o salário médio é de R$ 727,00 com desvio padrão em torno da média de R$
72,43.
30
Aplicação na HP-12C
Na HP-12C é possível calcular o desvio padrão para valores isolados simples. O
procedimento é o seguinte:
limpar os registradores pressionando f ;
digitar o primeiro valor observado, depois pressione
;
proceder da mesma forma até introduzir o último valor;
observar a contagem de valores introduzidos que aparece seqüencialmente no
visor;
após a introdução do último valor, pressione g s;
aparecerá no visor o valor do desvio padrão.
Aplicação no Excel
O cálculo do desvio padrão no Excel é bastante simplificado. Para tanto, proceda da
seguinte forma:
digitar o conjunto de dados em uma matriz, linha ou coluna (por exemplo, 10 dados
no intervalo A1:A10);
digitar
numa
célula
qualquer
(por
exemplo,
A11)
a
seguinte
fórmula:
=desvpada(A1:A10);
pressionar enter;
aparecerá na célula o valor do desvio padrão amostral 9.
Desvio padrão para valores ponderados
Quando os dados são ponderados – isolados ou intervalar – deve-se considerar a
freqüência de cada valor10 observado para calcular o desvio padrão.
A fórmula do desvio padrão amostral para valores ponderados é a seguinte:
S
( x i x )2 . fi
onde: x i x desvio em relação à média.
N 1
Veja um exemplo aplicado:
A tabela apresenta as notas obtidas para uma amostra de 40 alunos em um exame de
estatística.
9
Neste caso estaremos considerando no denominador n-1, pois se trata de amostra. Para calcular o
desvio padrão populacional utiliza-se “desvpadp” ao invés de “desvpada”. Dessa forma estaremos
considerando no denominador “n” e não “n-1”.
10
Se os dados forem apresentados no nível intervalar adota-se o “ponto médio da classe” como valor
observado.
31
Notas (x i)
Freqüência (f i)
4
4
5,5
7
6
10
7
12
7,5
4
8
3
Qual o desvio padrão da distribuição de notas?
1º passo: calcula-se a média aritmética;
x
252,5
6,3 pontos
40
2º passo: primeiramente calcula-se o desvio em relação à média para cada valor
observado, depois eleve esse valor ao quadrado;
5,29 0,64 0,09 0,49
1,44 2,89
3º passo: multiplica-se o quadrado de cada desvio pela respectiva freqüência;
21,16 4,48 0,90 5,88 5,76 8,67
4º passo: somam-se os quadrados dos desvios ponderados pela freqüência e divide-se
por N-1;
S2
46,85
1,201 esse valor é chamado de variância
40 1
5º passo: extraindo-se a raiz quadrada obtém-se o desvio padrão.
46,85
1,201 1,1ponto
40 1
S
Portanto, a nota média é de 6,3 pontos com desvio padrão aproximado de 1,1 ponto.
Veja um exemplo com dados no nível intervalar:
O departamento de pessoal de uma empresa verificou que 150 colaboradores
realizaram horas extras durante um determinado mês. Os números são os seguintes:
Horas
20 | 30
30 | 40
40 | 50
50 | 60
60 | 70
70 |I 80
Fi
35
45
25
20
13
12
Pmi
25
35
45
55
65
75
Qual o desvio padrão das horas extras?
Atenção: observe que o valor observado (x i) será dado pelo ponto médio de cada
classe.
32
1º passo: calcula-se a média aritmética;
x
6420
42,8 horas
150
2º passo: primeiramente calcula-se o desvio em relação à média para cada valor
observado, depois eleve esse valor ao quadrado;
316,84 60,84 4,84 148,84 492,84 1036,84
3º passo: multiplica-se o quadrado de cada desvio pela respectiva freqüência;
11089,40 2737,80 121,00 2976,80 6406,92 12442,08
4º passo: somam-se os quadrados dos desvios ponderados pela freqüência e divide-se
por N-1;
S2
35774
240,1 esse valor é chamado de variância
150 1
5º passo: extraindo-se a raiz quadrada obtém-se o desvio padrão.
S
35774
240,1 15,5 horas
150 1
Portanto, cada colaborador realiza mensalmente 42,8 horas extra com desvio padrão
de 15,5 horas.
4.4 Coeficiente de Variação proposto por Pearson
Quando se pretende expressar a variabilidade em torno da média através de medida
relativa (percentual) utiliza-se o coeficiente de variação.
Coeficiente de variação
Desvio padrão
. 100
média
Por exemplo, se a idade média é de 30,6 anos com desvio padrão de 2,3 anos, obtémse um coeficiente de variação de:
CVp
2,3
. 100 7,52%
30,6
Esse valor indica que o desvio padrão corresponde a 7,52% da média calculada.
Em análises comparativas que procuram avaliar o grau de confiabilidade da média
calculada, a utilização do coeficiente de variação facilita a interpretação, principalmente
quando as médias apresentam diferenças. Veja um exemplo:
33
A média e o desvio padrão para duas amostras – masculino e feminino – de pesos (em
kg) de crianças apresentaram os seguintes valores:
Amostra
Média
Desvio padrão
Masculino
45
4,5
CVp
10
Feminino
30
3,5
11,7
Observe que o desvio padrão é menor para o grupo feminino, o que poderia indicar
maior confiabilidade para esta média. Contudo, quando se calcula o coeficiente de
variação verifica-se que a variabilidade é maior. De certa forma, se poderia argumentar
que a média do grupo masculino é mais confiável, pois apresenta uma variabilidade
relativa menor.
Considere a seguinte situação:
O gerente de um banco deseja que o tempo de atendimento médio seja de 20 minutos
com variabilidade máxima11 de 20%. Uma pesquisa realizada com uma amostra de 70
clientes num determinado dia apresentou média de 19 minutos com desvio padrão de 5
minutos. Neste caso, a meta de variabilidade igual a 20%, proposta pelo gerente, foi
atingida?
Para responder à questão, calcula-se o coeficiente de variação:
CVp
5
. 100 26,3%
19
Observa-se que a meta não foi atingida, pois a variabilidade de 26,3% é superior à
meta pré-estabelecida de 20%. Dessa forma, espera-se que a gerência identifique as
causas da variabilidade, procurando reduzi-las ao máximo.
4.5 Coeficiente de Assimetria (As)
Pode-se identificar o tipo de assimetria da distribuição de valores a partir de um
coeficiente que é calculado utilizando-se três medidas estatísticas. A assimetria está
caracterizada quando os desvios em relação à média tendem a serem maiores em uma
direção do que na outra. Dessa forma, uma das caudas da distribuição alonga-se para
um dos lados.
O coeficiente de assimetria é dado por:
Coeficiente de assimetria
Média - Moda
Desvio padrão
11
Observe que neste caso será considerada apenas a variabilidade de 20% acima da média, pois
qualquer atendimento abaixo da média seria satisfatório.
34
Como a distribuição pode assumir três formas: simétrica, assimétrica positiva e
assimétrica negativa, a identificação se dá observando o sinal e o valor do coeficiente
calculado.
Para facilitar a interpretação oriente-se pelo quadro abaixo:
–0,3
–0,1
0
0,1
0,3
distribuição simétrica
distribuição levemente assimétrica (positiva ou negativa)
distribuição assimétrica (positiva ou negativa)
Veja um exemplo para dados apresentados no nível intervalar:
Uma amostra de 150 faturas emitidas por uma empresa apresentou os seguintes
valores (em R$).
Valor
600 | 650
650 | 700
700 | 750
750 | 800
800 | 850
850 |I 900
Fi
35
45
25
20
13
12
x
107100
R$ 714,00
150
10
Mo c 650
. 50 R$ 666,67
10 20
S
894350
6002,35 R$ 77,47
150 1
Coeficiente de assimetria
714 - 666,67
0,61
77,47
Com base no coeficiente calculado (0,61), pode-se concluir que a distribuição
apresentada assimetria positiva, ou seja, possui concentração de dados em classes
inferiores.
35
Exercícios
1. A produção diária de dois operários durante 10 dias está apresentada na tabela
abaixo.
A
65
77
69
68
71
72
67
70
73
71
B
75
87
79
78
81
82
77
80
83
81
a) Calcular o desvio padrão da produção para os dois operários.
b) Ainda que as produções sejam diferentes para os dois operários, os desvios são
iguais. Por quê?
c) Calcule o coeficiente de variação e identifique o operário que tem produção mais
homogênea.
2. Uma pesquisa realizada com uma amostra de 120 alunos dividida eqüitativamente
por sexo apresentou as seguintes pontuações de quociente de inteligência.
QI
Fem.
72 | 80
80 | 88
88 | 96
96 | 104
104 | 112
112 |I 120
Fi
5
7
8
11
16
13
60
QI
Masc.
65 | 75
75 | 85
85 | 95
95 | 105
105 | 115
115 |I 125
Fi
12
16
10
8
7
7
60
a) Calcular o desvio padrão para os dois grupos.
b) Calcular o coeficiente de variação para os dois grupos. A variabilidade em torno da
média é muito diferente entre os grupos? Justifique.
c) Calcular o coeficiente de assimetria para os dois grupos. Qual dos dois grupos
apresenta melhor desempenho em termos de quociente de inteligência?
3. A distribuição de tempo de atraso (em dias) no pagamento de faturas emitidas por
uma empresa apresentou coeficiente de assimetria igual a 0,5. O atraso médio foi de
15 dias. Se o desvio padrão foi de 4 dias, qual o tempo modal de atraso?
36
4. O risco de uma ação no mercado pode ser avaliado através da variabilidade dos
retornos esperados, pois permite ao investidor perceber os diferentes graus de riscos.
A partir do coeficiente de variação de Pearson indique qual das ações abaixo é menos
arriscada.
Discriminação
Ação A
Ação B
Ação C
Ação D
Ação E
Retorno médio
12%
14%
8%
10%
4%
Desvio padrão
6%
5,6%
2%
3%
1,2%
37
CAPÍTULO 5
PROBABILIDADE
Quando falamos em probabilidades estamos associando alguma incerteza à ocorrência
de um evento qualquer. Por exemplo:
Quais são as chances de as vendas crescerem no Natal?
Qual é a possibilidade de que a ação de uma empresa possa se valorizar num
determinado mês?
Qual é a plausibilidade de chover amanhã?
Para se avaliar a probabilidade de ocorrência de um evento qualquer é necessário que
se tenha às informações disponibilizadas. Se o índice histórico de reprovação numa
disciplina ministrada por um professor é de 25%, espera-se que numa nova turma
também ocorra esse nível de reprovação.
A probabilidade associada a um evento qualquer é um número que varia de zero a um,
podendo, no entanto, ser expresso em termos percentuais. Se um indivíduo concorre a
uma vaga entre três, a probabilidade de ser escolhido é de aproximadamente 33%
(relativamente grande), porém, se a concorrência é entre cem indivíduos, a
probabilidade de ser escolhido é de 1% (relativamente pequena).
Em muitos experimentos, a probabilidade de ocorrência de um evento é igual à
probabilidade de não-ocorrência. Neste caso, se diz que a ocorrência é tão provável
quanto improvável. O exemplo típico desse evento é o lançamento de uma moeda
perfeita, cujos resultados só podem ser cara ou coroa.
5.1 Espaço amostral
Ao realizarmos um experimento qualquer é possível identificar o espaço amostral, ou
seja, apresentar todos os resultados possíveis. Observe, no entanto, que em muitos
casos o número de possibilidades é tão grande que se torna praticamente impossível
enumerá-las. Neste caso, para se calcular a probabilidade de um evento qualquer,
basta que se tenha o número total de possibilidades. Vamos exemplificar:
Experimento:
jogar a moeda
Uma vez
Duas vezes
Três vezes
Quatro vezes
Cinco vezes
Dez vezes
Resultado
(2)1
(2)2
(2)3
(2)4
(2)5
(2)10
Nº de
possibilidades
2
4
8
16
32
1024
38
Se estivermos interessados na ocorrência de cara em um único lançamento da moeda,
1
a probabilidade é de .100 50% , pois temos apenas dois resultados possíveis (K ou
2
C).
Se estivermos interessados na ocorrência de duas caras em dois lançamentos da
1
moeda, a probabilidade é de .100 25% , pois temos quatro resultados possíveis
4
(KK; CC; KC e CK).
Se estivermos interessados na ocorrência de cinco caras em cinco lançamentos da
moeda, a probabilidade é de
1
.100 3,125% , pois temos 32 resultados possíveis.
32
Observe que, neste caso, começa a ficar difícil a enumeração das combinações.
Em muitos experimentos, o espaço amostral não é definido por dicotomia; por exemplo,
o lançamento de um dado, cujos resultados possíveis são as seis faces: 1, 2, 3, 4, 5 ou
6. Portanto, a probabilidade de ocorrência de uma face qualquer quando se joga um
dado é de
1
.100 16,67% .
6
Se lançarmos dois dados (um branco e o outro preto) obtém-se 62=36 resultados
possíveis que eventualmente poderiam ser apresentados:
1
2
3
4
5
6
1
1e1
1e2
1e3
1e4
1e5
1e6
2
2e1
2e2
2e3
2e4
2e5
2e6
3
3e1
3e2
3e3
3e4
3e5
3e6
4
4e1
4e2
4e3
4e4
4e5
4e6
5
5e1
5e2
5e3
5e4
5e5
5e6
6
6e1
6e2
6e3
6e4
6e5
6e6
Se estivermos interessados na ocorrência de um total de dois pontos no lançamento de
dois dados, a probabilidade é de
1
.100 2,78% . Para obtermos um total de 12
36
pontos, a probabilidade é exatamente a mesma. Por outro lado, se estamos
interessados num total de 7 pontos devemos considerar todas as combinações que se
encontram na diagonal secundária da tabela acima, ou seja, seis combinações cuja
probabilidade é de
6
.100 16,67% .
36
A distribuição de probabilidades no lançamento de dois dados pode ser representada
graficamente:
39
16.67
13.89
13.89
11.11
11.11
8.33
8.33
5.56
5.56
2.78
2
2.78
3
4
5
6
7
8
9
10
11
12
Total de pontos
Observe que a soma das probabilidades é igual a 100%, ou seja, esgotam-se todos os
resultados possíveis.
Neste caso também pode se tornar impraticável a enumeração dos resultados;
lançando-se três dados obtém-se 63=216 combinações possíveis.
5.2 Tipos de evento
a) Evento simples
É aquele formado por um único elemento do espaço amostral. Por exemplo, a
ocorrência de face 3 no lançamento de um dado.
b) Evento composto
É aquele formado por mais de um elemento do espaço amostral. Por exemplo, a
ocorrência de face par no lançamento de um dado.
40
c) Evento certo
Ocorre em qualquer realização do experimento. Por exemplo, a ocorrência de cara ou
coroa no lançamento de uma moeda.
d) Evento impossível
Não ocorre em qualquer realização do experimento. Por exemplo, a ocorrência de face
7 no lançamento de um dado.
e) Eventos complementares
Considerando-se um evento “A” qualquer, o complementar de “A” será dado por um
conjunto formado por todos os elementos que pertencem ao espaço amostral, mas que
não pertencem ao evento “A”. Por exemplo, o evento “múltiplo de três” no lançamento
de um dado fornece como resultado as faces “3 ou 6”, cuja probabilidade de ocorrência
é
2
.100 33,33% . Neste caso, as faces (1, 2, 4 ou 5) formam outro conjunto que
6
define o evento complementar, cuja probabilidade é
4
.100 66,67%
6
Cabe lembrar que todos os eventos complementares são mutuamente exclusivos, ou
seja, esgotam todos os resultados possíveis do experimento
f) Eventos mutuamente exclusivos
Caracterizam-se quando dois ou mais eventos não podem ocorrer simultaneamente, ou
seja, a ocorrência de um exclui a possibilidade de ocorrência do outro e vice-versa. Por
exemplo, num jogo de futebol temos três possibilidades: vitória de “A”, vitória de “B” ou
empate. Se estivermos interessados na vitória de “A” ou “B”, a probabilidade é
2
.100 66,67% . Esses eventos são considerados mutuamente exclusivos, pois ao
3
mesmo tempo não poderá ocorrer vitória dos dois times. Apesar de serem mutuamente
exclusivos, os dois eventos não são complementares, pois não esgotam todos os
resultados possíveis do experimento.
Eventualmente poderiam esgotar todos os resultados, neste caso seriam chamados de
mutuamente exclusivos e exaustivos. Vejamos um exemplo: a probabilidade de face
par no lançamento de um dado é
ímpar, cuja probabilidade é
3
.100 50% . O complementar de face par é face
6
3
.100 50% . Portanto, além de mutuamente exclusivos
6
41
os eventos são complementares, pois esgota todas as possibilidades de resultados ao
se lançar um dado.
g) Eventos independentes
Dois ou mais eventos são considerados independentes quando a ocorrência de um
deles não é afetada pela ocorrência do outro. Por exemplo, se efetuarmos “n”
lançamentos de uma moeda, os resultados obtidos (cara ou coroa), são completamente
independentes. Normalmente, esse tipo de evento fica caracterizado quando o espaço
amostral é recomposto a cada realização do experimento.
h) Eventos condicionados
É o oposto dos eventos independentes, ou seja, a ocorrência de um evento qualquer é
completamente afetada pela ocorrência do outro evento. Assim sendo, fica claro que o
espaço amostral não é recomposto a cada realização do experimento. Por exemplo, se
retirarmos duas de um baralho completo12, sem reposição, e estamos interessados na
ocorrência de cartas vermelhas, então as probabilidades são as seguintes:
1ª retirada
2ª retirada
26
.100 50% (espaço amostral completo)
52
25
.100 49,02% (espaço amostral reduzido)
51
Observe que na segunda retirada, o espaço amostral diminuiu para 51 cartas, pois o
experimento foi realizado sem reposição.
5.3 Regras para combinação de probabilidades
a) Teorema da adição (ou)
Para combinar probabilidades utilizando o teorema da adição devemos considerar o
fato de que os eventos em questão podem (ou não) ser mutuamente exclusivos. Assim
sendo, existem duas fórmulas que contemplam a sua utilização:
Adição para eventos não-mutuamente exclusivos
Neste caso, espera-se a ocorrência conjunta dos eventos, já que os mesmos não
são mutuamente exclusivos.
P (A ou B) = P (A) + P (B) – P (A x B)
12
Um baralho completo é formado por 52 cartas, sendo 13 cartas de cada naipe: ouros e copas
(vermelhas) e paus e espadas (pretas). Cada naipe é composto por: Ás, 2, 3, 4, 5, 6, 7, 8, 9, 10, Valete,
Dama e Rei.
42
Vejamos um exemplo:
Retira-se uma carta de um baralho completo. Qual a probabilidade de que seja ás ou
carta de ouros?
A solicitação “ás ou carta de ouros” indica que a ocorrência dos dois eventos é
alternativa, ou seja, retira-se uma carta e espera-se que seja ás, mas também pode
ser ouros.
P (A ou B)
P (ás ou ouros)
P (A)
P (ás)
P (B)
P (AxB)
P (ouros)
P (ás de ouros)
13
4 13
1
4
x
7,69%
25%
1,92%
P (ás ou ouros)
52
52 52 52
52
Não basta somar as probabilidades de cada evento para obter o resultado, deve-se
considerar a subtração da probabilidade de ocorrência conjunta (ás de ouros).
P (ás ou ouros) = 7,69 + 25 – 1,92 = 30,77%
Esse resultado também poderia ser obtido por contagem, uma vez que a carta “ás de
ouros” está incluída nos dois eventos. Subtraindo-a uma vez, obtém-se a probabilidade
“16 em 52”, cujo resultado é igualmente 30,77%.
Veja outro exemplo:
Uma urna contém quinze bolas numeradas de 1 a 15. Retira-se uma bola da urna, qual
a probabilidade dela ser múltiplo de três ou múltiplo de cinco.
P (A ou B)
P (M3 ou M5)
P (M3 ou M5)
P (A)
P (M3)
P (B)
P (AxB)
P (M5)
P (M3 e M5)
3
5 3
1
5
33,33%
20%
x
6,67%
15
15
15 15 15
P (M3 ou M5) = 33,33 + 20 – 6,67 = 46,66%
Adição para eventos mutuamente exclusivos
Neste caso, não se espera a ocorrência conjunta dos eventos, já que os mesmos
são mutuamente exclusivos.
P (A ou B) = P (A) + P (B)
Vejamos um exemplo:
43
Retira-se uma carta de um baralho completo. Qual a probabilidade de que seja valete
ou dama?
P (A ou B)
P (valete ou dama)
P (valete ou dama)
P (A)
P (valete)
4
7,69%
52
P (B)
P (dama)
4
7,69%
52
P (valete ou dama) = 7,69 + 7,69 = 15,38%
Observe que os eventos são mutuamente exclusivos, ou seja, a possibilidade de
ocorrência conjunta está descartada, pois “valete e dama” não podem ocorrer ao
mesmo tempo.
Vejamos outro exemplo:
Uma urna contém 8 bolas pretas, 10 bolas brancas e 12 azuis. Retira-se uma bola da
urna, qual a probabilidade dela ser preta ou azul?
P (A ou B)
P (preta ou azul)
P (preta ou azul)
P (A)
P (preta)
8
26,67%
30
P (B)
P (azul)
12
40%
30
P (preta ou azul) = 26,67 + 40 = 66,67%
b) Teorema da multiplicação (e)
Para combinar probabilidades utilizando o teorema da adição devemos considerar o
fato de que os eventos em questão podem condicionados ou independentes. Assim
sendo, existem duas fórmulas que contemplam a sua utilização:
Multiplicação para eventos condicionados
Neste caso, espera-se que a ocorrência de um evento “B” qualquer esteja
condicionada à ocorrência do evento “A”. Por exemplo, a probabilidade de se retirar
uma segunda carta vermelha sabendo-se que na primeira tentativa ocorreu uma
carta vermelha.
P (A e B) = P (A) x P (B A)
P (B A) probabilidade de “B” dado que “A” ocorreu.
Vejamos um exemplo:
44
Retiram-se sucessivamente13 duas cartas de um baralho completo. Qual a
probabilidade de as duas serem ouros, se não houver reposição?
P (A e B)
P (ouros e ouros)
P (ouros e ouros)
P (B A)
P (ouros)
12
0,2353
51
P (A)
P (ouros)
13
0,25
52
P (ouros e ouros) = (0,25 x 0,2353) x 100 = 5,88%
Vejamos outro exemplo:
Uma urna contém 6 bolas pretas e 8 brancas e 4 azuis. Retiram-se sucessivamente
três bolas. Qual a probabilidade delas serem brancas, se o experimento for realizado
sem reposição?
P (A e B e C)
P (três brancas)
P (três brancas)
P (A)
P (branca)
8
0,4444
18
P (B A)
P (branca)
7
0,4118
17
P (C A e B)
P (branca)
6
0,375
16
P (três brancas) = (0,4444 x 0,4118 x 0,375) x 100 = 6,86%
Multiplicação para eventos independentes
Neste caso, espera-se que a ocorrência de um evento “B” qualquer não esteja
condicionada à ocorrência do evento “A”. Supõe-se, portanto, que o espaço
amostral seja reconstituído a cada realização do experimento.
P (A e B) = P (A) x P (B)
Vejamos um exemplo:
Retiram-se duas cartas de um baralho completo. Qual a probabilidade delas serem
pretas, se o experimento for realizado com reposição?
P (A e B)
P (ambas pretas)
P (ambas pretas)
P (A)
P (preta)
26
0,5
52
P (B)
P (preta)
26
0,5
52
P (ambas pretas) = (0,5 x 0,5) x 100 = 25%
Vejamos outro exemplo:
13
Na prática, quando se fala em retiradas sucessivas entende-se que o experimento seja realizado sem
reposição. Em muitos casos, o experimento sem reposição está caracterizado pelo enunciado da
questão; por exemplo, retiram-se lâmpadas de uma caixa colocando-as nos soquetes.
45
No próximo sábado haverá três jogos do campeonato brasileiro. Considerando os três
resultados possíveis, qual a probabilidade de que um indivíduo qualquer possa acertálos?
P (A e B e C)
P (três acertos)
P (três acertos)
P (A)
P (acerto)
1
0,3333
3
P (B)
P (acerto)
1
0,3333
3
P (C)
P (acerto)
1
0,3333
3
P (acertar os três resultados) = [(0,3333)3] x 100 = 3,7%
Exercícios
1. Se o experimento consiste num único lançamento de um dado. Qual a probabilidade
de:
a) sair face par?
b) sair face ímpar?
c) sair 1< face < 6?
d) sair face múltipla de 3?
e) Os eventos “face par” e “face ímpar” são complementares e mutuamente exclusivos?
Justifique.
2. Um experimento consiste no lançamento de dois dados. Qual a probabilidade:
a) da soma das faces ser igual a cinco?
b) da soma das faces ser maior que nove?
c) de se obter faces iguais?
d) de eles apresentarem face 3 e 4?
3. Uma urna contém as letras A A C E I I S S T T T. Retira-se aleatoriamente uma letra
de cada vez. Qual a probabilidade de obter a palavra ESTATÍSTICA se:
a) o experimento for realizado com reposição?
b) o experimento for realizado sem reposição?
4. Um experimento consiste no lançamento de uma moeda três vezes. Qual a
probabilidade de se:
a) obter exatamente duas caras?
b) obter três caras?
c) obter pelo menos duas caras?
46
5. Numa reunião estão presentes três casais. Escolhe-se aleatoriamente um dos
componentes de cada casal. Qual a probabilidade de:
a) pertencerem todos ao mesmo sexo?
b) escolhermos dois homens e uma mulher?
c) escolhermos dois do mesmo sexo e um do outro?
6. A probabilidade de Carlos resolver um problema específico de matemática é 2/3.
Para Antonio a probabilidade é 4/5. Se ambos tentarem, qual a probabilidade do
problema ser resolvido?
7. Uma empresa produz um eixo com 5% de probabilidade de apresentar defeito. Outra
empresa produz um rolamento com 3% de probabilidade de apresentar defeito. Na
montagem as duas peças deverão se ajustar. Qual a probabilidade de:
a) ambas serem defeituosas?
b) ambas serem perfeitas?
8. A probabilidade um homem estar vivo daqui a quinze anos é 3/5. A probabilidade de
sua mulher também estar viva na mesma época é de 2/3. Qual a probabilidade de:
a) ambos estarem vivos?
b) somente o homem estar vivo?
c) somente a mulher estar viva?
d) ambos estarem mortos?
e) Pelo menos um estar vivo?
9.
Uma
caixa
contém
dez
lâmpadas,
sendo
seis
queimadas.
Retiram-se
sucessivamente três lâmpadas colocando-as em três soquetes. Qual a probabilidade
de:
a) pelo menos uma acender?
b) todas acenderem?
c) nenhuma acender?
10. Em uma loteria com 200 bilhetes distribuem-se três prêmios de igual valor. Uma
pessoa compra dez bilhetes. Qual a probabilidade dela obter ao menos um prêmio?
47
11. Uma urna contém quatro bolas brancas, cinco vermelhas e seis pretas. Outra
contém cinco brancas, seis vermelhas e sete pretas. Extrai-se uma bola de cada urna,
qual a probabilidade de serem todas da mesma cor?
12. Em uma fábrica de calçados, as coberturas, as solas e os saltos são fabricados
separadamente (independentemente) e unidos ao acaso, a fim de ser montado o
calçado. Sabe-se, por experiência, que 5% das coberturas, 4% das solas e 1% dos
saltos apresentam defeitos. Qual a probabilidade de calçados perfeitos no processo de
fabricação?
13. Uma gaveta contém dezesseis meias, sendo dez verdes e seis azuis. Retirando-se
aleatoriamente duas meias da gaveta, qual a probabilidade de se formar:
a) um par verde?
b) um par da mesma cor?
14. Uma caixa contém oito bolas vermelhas, três brancas e nove azuis. Extraindo-se ao
acaso três bolas, sem reposição, qual a probabilidade de que tenhamos uma bola de
cada cor?
15. Numa corrida da qual participam vários esportistas, a probabilidade de João vencêla é ¼ e a de José 1/5. Qual a probabilidade de que um dos dois vença?
16. O elo de uma corrente tem probabilidade ¼ de se romper quando submetida a uma
determinada carga. Se aplicarmos a carga a uma corrente de três elos, qual a
probabilidade dela se romper?
17. De cem pessoas selecionaram-se cinco aleatoriamente, as quais deverão opinar
sobre a adoção da pena de morte. Sabe-se que sessenta dentre as cem são
favoráveis. Qual a probabilidade de que pelo menos uma das pessoas selecionadas
seja contra a pena de morte?
18. A e B jogam doze partidas de xadrez, das quais 6 são vencidas por A, 4 são
vencidas por B e 2 terminam empatadas. Eles combinam a disputa de mais três
partidas. Qual a probabilidade de:
a) A vencer as três partidas?
b) duas partidas terminarem empatadas?
48
c) B vencer pelo menos uma partida?
19. A probabilidade de ocorrer número ímpar no lançamento de dois dados viciados é o
triplo de ocorrer par. Lançando-se os dois dados, qual a probabilidade de que a soma
das faces seja igual a três?
20. A probabilidade de nascer menina é o dobro de nascer menino. Num casal com três
filhos, qual a probabilidade de que ao menos um seja menino?
49
CAPÍTULO 6
NÚMEROS - ÍNDICES
Normalmente, os números - índices são utilizados para expressar a variações que
ocorrem em preços, quantidades ou valores, através de um relativo (percentual). Por
isso, é também chamado de número relativo14. Por exemplo, o gasto mensal de uma
família passou de R$ 280,00 para R$ 322,00. Em termos absolutos, o crescimento foi
de R$ 42,00, porém, em termos percentuais foi de 15%.
Observe que a aplicabilidade é muito vasta, pois permite avaliar o crescimento relativo
de bens e serviços consumidos por um indivíduo, família, organização, país, etc. Além
disso, é perfeitamente possível criar-se séries de números - índices que irão refletir a
evolução do crescimento relativo de um determinado item, por exemplo: exportação,
importação, saldo da balança comercial, PIB, índices de custo de vida, etc.
6.1 Índice simples
Devido à facilidade de cálculo, o índice simples é mais freqüentemente utilizado para
expressar o crescimento relativo de um item entre duas datas quaisquer. Cabe
esclarecer que o índice simples pode ser obtido a partir de séries de preço, quantidade
ou valor, sendo este último, o produto do preço pela quantidade.
O índice simples é dado por um quociente em que o numerador é valor do período
atual. O denominador é o valor do período básico. Para expressá-lo em termos
percentuais deve-se multiplicar o resultado por 100.
Índice simples
Valor do período atual
. 100
Valor do período básico
A fim de aprofundarmos o conceito, considere a produção (em R$ mil) de uma empresa
no período 2000/03 está expressa na tabela abaixo:
Ano
2000
2001
2002
2003
Produção
750
810
729
780
14
Fala-se em “relativo” porque o crescimento percentual (índice) será obtido a partir da “relação” entre
dois preços, quantidades ou valores.
50
Neste caso, quais seriam os índices de produção utilizando o ano de 2000 como base?
Definindo o ano de 2000 como período básico, assume-se que esse valor corresponde
a 100. Portanto, o índice de 2001 será dado por:
Índice simples
Valor de 2001 810
1,08.100 108
Valor de 2000 750
O valor obtido indica que a variação percentual na produção (em 2001 com base em
2000) foi de 8%, pois o índice passou de 100 para 108.
Para os anos de 2002 e 2003, os índices seriam:
Índice simples
Valor de 2002 729
0.972.100 97,2
Valor de 2000 750
O valor obtido indica que a produção (em 2002 com base em 2000) apresentou
variação percentual negativa de 2,8%, pois o índice passou de 100 para 97,2.
Índice simples
Valor de 2003 780
1,04.100 104
Valor de 2000 750
O valor obtido indica que a variação percentual na produção (em 2003 com base em
2000) foi de 4%, pois o índice passou de 100 para 104.
A série de números - índices que indica a evolução do crescimento da produção (2000
= 100) está apresentada na tabela abaixo:
Ano
2000
2001
2002
2003
Índice (2000 = 100)
100
108
97,2
104
Com base nesta primeira aplicação, é possível definirmos algumas regras que norteiam
a utilização de números - índices:
O número-índice obtido a partir do quociente tem sempre uma base “100” incluída.
Para obter a variação percentual deve-se excluir a base “100”. Portanto:
Índice = % + 100 e
% = índice 100
Toda vez que o índice for maior que 100, a variação percentual será positiva
variando de zero a infinito. Por outro lado, quando o índice for menor que 100, a
variação será negativa variando de zero a 100. Portanto:
Índice > 100 = % positiva e Índice < 100 = % negativa
51
Ao se relacionar dois valores obtém-se um índice na forma unitária (1,08). Para
expressá-lo na forma percentual deve-se multiplicar por 100 (108). Da mesma
forma procede-se com a variação percentual; 0,08 é a forma unitária e 8 é a forma
percentual. Este conceito é importante, pois a operacionalização com números índices é feita utilizando-se a forma unitária.
Aplicação na HP-12C
Tanto o índice simples, bem como a variação percentual pode ser calculada
diretamente na HP-12C.
O índice simples é calculado utilizando a função %T. Veja o procedimento:
digite o valor básico no visor e pressione “enter”;
digite o valor atual no visor;
pressione: %T (aparecerá no visor o valor do índice).
A variação percentual é calculada utilizando a função %. Veja o procedimento:
digite o valor básico no visor e pressione “enter”;
digite o valor atual no visor;
pressione: % (aparecerá no visor a variação percentual).
Além dessas duas funções, a HP-12C possui a função “%” que permite calcular
diretamente o percentual de um valor qualquer. Veja o procedimento:
digite o valor no visor e pressione “enter”;
digite o percentual que se deseja no visor;
pressione: % (aparecerá no visor o valor correspondente ao percentual indicado).
Vejamos alguns exemplos:
1. A quantidade demandada de um artigo passou de 80 unidades em Abril para 92
unidades em Maio. Qual o índice simples em Maio tomando como base o mês de Abril?
digite o valor básico no visor: 80;
pressione enter;
digite o valor atual no visor: 92;
pressione: %T;
resultado = 115 (indica uma variação percentual de 15%).
2. O preço de uma geladeira em Maio era de R$ 1200,00. Em Junho, o preço passou
para R$ 1146,00. Qual a variação percentual em Junho com base em Maio?
digite o valor básico no visor: 1200;
52
pressione enter;
digite o valor atual no visor: 1146;
pressione: %;
resultado = 4,5 (indica uma queda de 4,5% no preço).
3. O dispêndio mensal de uma família é de R$ 1500,00. Sabe-se que o item educação
compromete 25% do gasto total. Quanto isto representa em termos monetários?
digite o dispêndio mensal no visor: 1500;
pressione enter;
digite o percentual correspondente ao item educação: 25;
pressione: %;
resultado = R$ 375 (é o quanto se gasta com educação).
6.2 Base de cálculo dos índices simples
Quando se pretende montar uma série de números - índices é fundamental identificar a
base de cálculo que está sendo utilizada para apresentar a evolução do crescimento.
Normalmente adota-se dois tipos de base15:
a) Base fixa
Neste caso, os índices simples são calculados utilizando como base um determinado
período identificado como “básico”. A identificação do período básico não é uma atitude
arbitrária, normalmente, procura-se defini-lo levando em consideração uma situação de
normalidade. Por exemplo, o crescimento de preços por ocasião da mudança de
governo pode estar influenciado por questões políticas naquele momento. Em séries
mensais, é muito comum adotar-se o mês de dezembro como base, obtendo-se, dessa
forma, a evolução do crescimento acumulado durante o ano.
b) Base móvel
Neste caso, os índices simples são sempre calculados tomando como base o valor
imediatamente anterior, obtendo-se o crescimento com base móvel de comparação. É
muito utilizado, pois permite avaliar o crescimento recente (período a período) da
variável em estudo. Um exemplo típico de índice base móvel é a inflação 16, pois a
evolução dos preços é medida (publicada) mensalmente.
Vejamos alguns exemplos:
15
Um terceiro tipo de base – de uso mais restrito – chamada de base média, utiliza como base a média
aritmética dos valores de “n” períodos.
16
Cabe esclarecer, no entanto, que a inflação é um índice agregativo e não um índice simples.
53
1. Uma concessionária de automóveis comercializou as seguintes quantidades no
segundo semestre de 2002.
Mês
Jul
Ago
Set
Out
Nov
Dez
Quantidade
315
335
290
310
345
370
Vamos criar uma série de números - índices utilizando como base o mês que
apresentou pior desempenho, qual seja, o mês de setembro. Neste caso, vamos
calcular os índices utilizando o critério da base fixa.
Mês
Índice (set=100)
Jul
108,6
Ago
115,5
Set
100
Out
106,9
Nov
119
Dez
127,6
Observe que todos os meses apresentaram crescimento positivo, o que é óbvio, uma
vez que foi adotado como base o mês de pior desempenho.
Verifica-se que o maior crescimento ocorreu em dezembro; 27,6% em relação a
setembro.
2. As vendas anuais (em R$ milhões) de um hipermercado estão apresentadas na
tabela abaixo:
Ano
Vendas
1999
78
2000
86
2001
90
2002
81
2003
95
Se estivermos interessados no crescimento anual das vendas, devemos adotar o
critério de base móvel de comparação para obter os índices. O resultado seria o
seguinte:
Ano
1999
Índice (base móvel)
2000 2001
110,3 104,7
2002
90
2003
117,3
Observe que o maior crescimento ocorre em 2003 quando comparado com 2002
(17,3%).
Ressalte-se que o ano de 1999 não apresenta índice, uma vez que a venda de 1998
não está especificada.
6.3 Construção de séries de números - índices a partir de variações percentuais
base móvel
Muitas séries de dados secundários publicadas não apresentam os valores absolutos
das variáveis. O caso clássico diz respeito aos índices de inflação que apresentam as
variações percentuais mensais, mas que não disponibilizam os preços dos “n” produtos
e serviços que são utilizados para se efetuar a medida.
54
Ainda assim, é perfeitamente possível obter-se uma série de números - índices com
base no período imediatamente anterior, bem como mudar a base da série para
qualquer período de interesse, utilizando-se apenas as variações percentuais
calculadas com base móvel de comparação.
Para obter tais séries procede-se da seguinte forma:
Transforme as diversas variações percentuais em índices expressos na forma unitária.
Para facilitar chamaremos esse índice de fator de multiplicação:
%
Fator de multiplicação =
1
100
Aplique sobre uma base “100” os fatores previamente calculados. Dessa forma, a cada
multiplicação obtém-se a série acumulada de índices referentes à variável de estudo.
Veja um exemplo:
O IGPM (índice geral de preços do mercado) calculado pela Fundação Getúlio Vargas
apresentou as seguintes variações percentuais mensais no 2º semestre de 2003.
Mês
Jul
%
0,42
Ago
0,38
Set
1,18
Out
0,38
Nov
0,49
Dez
0,61
Obtendo-se fatores de multiplicação:
0,42
Fator de multiplicação (julho) =
1 0,9958
100
0,38
Fator de multiplicação (agosto) =
1 1,0038
100
E assim por diante, temos:
Mês
%
Jul
0,9958
Ago
1,0038
Set
1,0118
Out
1,0038
Nov
1,0049
Dez
1,0061
Para obter a série de números - índices acumulada aplica-se sobre a base “100”
(junho), o fator de multiplicação de cada mês. O resultado está expresso na tabela
abaixo:
Mês
Jul
Ago
Set
Out
Nov
Dez
Índice
(junho=100)
99,58
99,96
101,14
101,52
102,02
102,64
55
Verifica-se que o IGPM apresentou uma variação acumulada de 2,64% no segundo
semestre de 2003. Nota-se também que o acumulado em julho e agosto ficou abaixo
da base “100”, em virtude da variação percentual negativa ocorrida em julho/03.
Caso se esteja interessado em mudar a base da série, adota-se o mesmo
procedimento desenvolvido no item 8.3.
Aplicação na HP-12C
Como acumular taxas ou variações percentuais na HP-12C?
Acumular taxas ou variações percentuais – desde que tenham sido calculadas com
base móvel de comparação – na HP-12C é um processo extremamente simplificado.
Vejam quais são os procedimentos no caso do exemplo anterior:
Digite 100 pressione enter digite 0,42 pressione % pressione (menos)
Resultado = 99,58 (índice de julho);
Digite 0,38 pressione % pressione +
Resultado = 99,96 (índice de agosto);
Digite 1,18 pressione % pressione +
Resultado = 101,14 (índice de setembro);
Digite 0,38 pressione % pressione +
Resultado = 101,52 (índice de outubro);
Digite 0,49 pressione % pressione +
Resultado = 102,02 (índice de novembro);
Digite 0,61 pressione % pressione +
Resultado = 102,64 (índice de dezembro);
Atenção: o índice acumulado no último período apresenta o crescimento total do
período. Neste caso, a taxa acumulada de seis meses do IGPM.
6.4 Média de variações percentuais
A operação básica utilizada na acumulação de taxas de variação é a multiplicação. Isto
quer dizer que o índice acumulado é obtido adotando-se um sistema de taxas
compostas17. Neste caso, utiliza-se a média geométrica18 para definir o crescimento
médio de uma variável qualquer num período específico de tempo.
17
Como num regime de juros compostos em que se aplica taxa sobre taxa.
Quando o índice do período está acumulado de forma composta não se deve utilizar a média
aritmética para expressar a média de crescimento. Na prática, este fato constitui-se em um erro
conceitual grotesco.
18
56
A média das taxas é dada pela raiz enésima do índice acumulado no período expresso
na forma unitária. Veja a fórmula:
Índice acumulado
1 . 100
X g n
100
Vejamos alguns exemplos:
1. A quantidade demandada de um produto em 1998 foi de 1300 unidades. Em 2003, a
demanda passou para 1480 unidades. Qual a taxa média anual de crescimento da
demanda no período?
Primeiramente calcula-se o índice acumulado de crescimento no período (índice
simples entre pontas):
Índice de quantidade
1480
. 100 113,85
1300
Observe que o crescimento acumulado de 13,85% se refere a um período de 5 anos,
pois na base (ano de 1998) não existe variação. Na realidade, a variação passa a
ocorrer a partir do ano de 1999. Agora podemos calcular a taxa média anual de
crescimento:
113,85
1 . 100 2,63%
X g 5
100
A quantidade demandada cresceu em média 2,63% ao ano no período considerado.
Aplicação na HP-12C
Procedimento para se extrair raiz enésima na HP-12C
113,85 ENTER 100 5
1
/x y x
1 – 100 x
2. O preço de um produto em janeiro/02 era R$ 580,00. Em janeiro/03, o preço passou
para R$ 500,00. Qual a taxa média mensal de crescimento do preço no período?
Índice de preço
500
. 100 86,21
580
O índice simples 86,21 indica um decréscimo de 13,79% no preço em 12 meses.
86,21
1 . 100 1,23%
X g 12
100
57
Atenção: de janeiro a janeiro são treze meses, porém a base não é considerada no
cálculo do índice entre pontas.
Observa-se que o decréscimo médio do preço foi de 1,23% ao mês no período
considerado.
3. A variação percentual acumulada do IGPM em 2003 foi de 8,69%. Qual a taxa média
mensal do IGPM no ano?
Observe que está sendo fornecida a variação percentual acumulada de 12 meses. Para
obter o índice acumulado basta somar uma base “100”, portanto, índice de 108,69.
108,69
1 . 100 0,7%
X g 12
100
A variação média mensal do IGPM em 2003 foi de 0,7%.
Aplicação na HP-12C
É perfeitamente possível calcular a média de taxas utilizando as funções financeiras da
HP-12C. Veja o procedimento para o exemplo nº 1:
limpe os registradores financeiros pressionando: f REG;
digite o valor base 1300 e pressione: CHS;
pressione: PV;
digite o valor atual 1480 e pressione: FV;
digite o número de períodos 5 e pressione: n
pressione: i
Resultado = 2,63%
Quando se calcula a taxa média a partir de um índice entre pontas, deve-se
considerar “n 1”. Para taxas acumuladas deve-se considerar “n”.
6.5 Propriedades dos Índices simples
Podemos destacar três propriedades fundamentais que ajudam na resolução de
problemas que envolvem a utilização de
números - índices: circularidade,
decomposição de fatores e reversibilidade no tempo.
a) Circularidade
Esta propriedade sustenta que o produto dos índices simples calculados com base
móvel de comparação é igual ao índice simples calculado na última data com base na
primeira, também chamado de “índice entre pontas”.
58
Vamos provar a propriedade através de um exemplo:
O preço de um produto apresentou os seguintes valores no primeiro quadrimestre de
um ano qualquer.
Mês
Jan
Fev
Mar
Abr
Preço (R$)
18,00
21,50
20,40
22,30
Calculando os índices simples com base móvel de comparação, temos:
Mês
Jan
Fev
Mar
Abr
Índice
119,44
94,88
109,31
Calculando o índice de abril tomando como base janeiro, temos:
Índice simples
Preço de abril
22,30
1,2388.100 123,88
Preço de Janeiro 18,00
Segundo a propriedade circularidade:
Pjan, fev x Pfev, mar x Pmar, abr = Pjan, abr
119,44 x 0,9488 x 1,0931 = 123,88
Para facilitar o cálculo mantivemos o primeiro índice na forma percentual e os demais
na forma unitária.
O que significa esta propriedade na prática?
Se estivermos interessados em obter o crescimento total em uma série de preço,
quantidade, valor ou números - índices acumulados, basta calcular o índice simples na
última data com base na primeira (índice entre pontas). No exemplo em questão, o
índice entre pontas indica que o preço aumentou 23,88%.
Por outro lado, se apenas as variações percentuais base móvel estiverem
disponibilizadas, basta acumulá-las no período em questão para obter o crescimento
total. No exemplo em questão, as três variações acumuladas indicam um crescimento
de 23,88%, idêntico ao obtido pelo índice simples entre pontas.
b) Decomposição de fatores
Esta propriedade sustenta que o produto de um índice simples de preço pelo respectivo
índice simples de quantidade é igual ao índice simples de valor. Ou seja, se estiverem
disponibilizados dois fatores é perfeitamente possível obter o terceiro.
Vamos provar a propriedade através de um exemplo:
Um comerciante vendeu em janeiro 80 unidades de um artigo ao preço unitário de R$
5,00. Em fevereiro vendeu 90 unidades do mesmo artigo ao preço de R$ 5,20. Neste
59
caso, o valor total auferido passou de R$ 400,00 em janeiro para R$ 468,00 em
fevereiro.
Calculando os índices simples:
Preço =
5,20
.100 104
5,00
Quantidade =
Valor =
90
.100 112,5
80
468
.100 117
400
Segundo a propriedade decomposição dos fatores:
P jan, fev x Qjan, fev = Vjan, fev
104
x 1,125 = 117
Para facilitar o cálculo mantivemos o primeiro índice na forma percentual e o segundo
na forma unitária.
O que significa esta propriedade na prática?
Se estivermos interessados em obter o crescimento de um preço, quantidade ou valor,
não é necessário ter os valores absolutos disponibilizados, basta dispormos dos
índices simples de dois fatores que se obtém o terceiro.
Por exemplo: uma empresa tem como meta aumentar o faturamento em 12%. Para
alcançá-la reduziu os preços em 5%. Neste caso, qual deverá ser a variação nas
quantidades comercializadas?
Índice de valor = 112
Índice de preço = 95
112
.100 117,89
Índice de quantidade =
95
Para aumentar o faturamento em 12%, com uma redução de 5% no preço, a empresa
deverá aumentar as quantidades comercializadas em 17,89%.
c) Reversibilidade no tempo
Esta propriedade sustenta que ao se permutarem dois períodos no cálculo de um
índice, os índices resultantes serão o inverso um do outro. Ou seja, a variação positiva
será compensada pela variação negativa, e vice-versa.
Vamos provar a propriedade através de um exemplo:
Uma empresa produziu 80 unidades de um artigo em janeiro. No mês de fevereiro, a
produção passou para 100 unidades. Qual o índice de produção em fevereiro com base
em janeiro?
60
Índice de quantidade =
100
.100 125
80
Verifica-se que a produção cresceu 25% em fevereiro com base em janeiro.
E se fizéssemos a seguinte pergunta?
Qual o índice de produção em janeiro com base em fevereiro?
Neste caso, estaríamos aplicando a reversibilidade no tempo, pois o período básico
passa ser o mês de fevereiro.
Índice de quantidade =
80
.100 80
100
Verifica-se que a produção em janeiro é 20% inferior à de fevereiro.
Então, uma variação positiva de 25% é compensada por uma variação negativa de
20%? Perfeitamente, pois se multiplicarmos os dois índices, o resultado será igual a
100.
125 . 80
100
100
O que significa esta propriedade na prática?
Muitos indivíduos cometem equívocos quando elaboram cálculos que envolvem a
utilização de números - índices. O mais comum deles é considerar que um acréscimo
percentual equivale a um decréscimo. Por exemplo, é possível considerar que uma
inflação de 100% num determinado período equivale a uma perda salarial na mesma
magnitude? Claro que não, porque um acréscimo médio de 100% nos preços
determina uma redução de 50% no poder de compra do assalariado, considerando que
não houve reajuste salarial no mesmo período.
6.6 Deflacionamento de valores nominais
A tabela abaixo apresenta o faturamento nominal (em R$ mil) da empresa “Alfa” e o
índice de preços (1999=100) que serviu de base para reajuste durante o período
1999/2003.
Ano
1999
2000
2001
2002
2003
Faturamento
nominal
300
330
350
400
420
Índice de preços
(1999=100)
100
110
125
128
130
61
Verifica-se que o faturamento entre pontas apresentou um crescimento de 40%. Seria
equivocado afirmar que a empresa vendeu 40% a mais, pois no período considerado
(2003 com base em 1999) houve reajuste de 30% no preço dos produtos
comercializados. Diante disso, fica claro que o crescimento real do faturamento será
determinado descontando-se o reajuste de preços. Esse processo é chamado de
deflacionamento. Caso persistam variações no valor real do faturamento após a
retirada do efeito causado pelo preço, elas se devem a variações nas quantidades,
indicando, portanto, um crescimento real.
O valor real – também chamado de constante – será obtido através de um quociente
em que o numerador é o valor nominal (ou corrente) e o denominador o respectivo
deflator19.
Veja a fórmula:
Valor real
Valor nominal
. 100
Deflator
Atenção: a multiplicação por “100” poderia ser desconsiderada se adotarmos o deflator
na forma unitária.
Para os dados em questão, poderíamos estar interessados em obter o faturamento real
da empresa “Alfa” com base em 1999. Neste caso, há interesse em comparar o
faturamento – ou avaliar o crescimento das quantidades comercializadas – de cada ano
com o faturamento de 1999, já que a base da série de deflatores está fixada neste
ano20.
Vamos então obter o valor real do faturamento com base em 1999:
Valor real (1999)
300
. 100 300
100
Valor real (2000)
330
. 100 300
110
Valor real (2001)
350
. 100 280
125
Valor real (2002)
400
. 100 312,50
128
Valor real (2003)
420
. 100 323,1
130
19
Qualquer índice de preços utilizado para atualizar valores monetários correntes. Quanto se trata de
uma série de valores nominais devemos utilizar uma série de deflatores com base em um período de
interesse.
20
O valor real pode ser obtido em qualquer base. Para tanto, basta efetuar a mudança de base da série
de deflatores.
62
Observe que na base o valor real é igual ao valor nominal.
Podemos agora obter o índice do faturamento real21 com base em 1999. Para tanto,
basta construir uma série de números - índices com base em 1999.
Ano
1999
2000
2001
2002
2003
Faturamento
real (em R$
mil)
300
300
280
312,5
323,1
Índice de
quantidades
(1999=100)
100
100
93,3
104,2
107,7
Com base nos dados pode-se chegar às seguintes conclusões:
o crescimento real do faturamento (índice de quantidades) entre pontas é de 7,7%.
Este resultado é muito inferior ao crescimento nominal que foi de 40%;
de 1999 para 2000, o faturamento real não cresceu, pois a variação no faturamento
nominal foi igual a do índice de preços;
em 2001, o faturamento real apresentou crescimento negativo de 6,7% em relação
a 1999;
decompondo-se o faturamento nominal entre dois fatores: preço e quantidade,
pode-se comprovar o seguinte: os preços entre pontas aumentaram 30%; já as
quantidades comercializadas aumentaram 7,7%; acumulando-se esses dois
percentuais obtemos o crescimento nominal do faturamento entre pontas que foi de
40%.
Finalmente, cabe esclarecer que em muitas aplicações, os deflatores podem ser
obtidos a partir de índices de preços (ou de custo de vida) oficiais. Neste caso, a partir
das variações percentuais disponibilizadas monta-se a série de deflatores com base
em um período de interesse, utilizando-a para obter os valores monetários reais.
21
Na realidade se trata de uma série de índices de quantidades comercializadas, pois o efeito do preço
já foi retirado da série.
63
Exercícios
1. O preço de um artigo em Jul/11 era R$ 20,00, passando para R$ 22,08 em Dez/11.
Pergunta-se:
a) Qual o índice relativo de preço em Dez/11, tomando como base o mês de Jul/11
(entre pontas)? E a variação percentual?
b) Qual a taxa média mensal de crescimento do preço no período considerado?
c) Fazer uma estimativa do preço para Jan/12 utilizando a taxa média obtida no item b.
2. O valor real faturado por uma empresa em Jan/11 foi de R$ 400 mil, passando para
R$ 338,73 mil em Dez/11. Com base nesses dados, pergunta-se:
a) Qual a variação percentual do faturamento no período?
b) Qual a taxa média mensal de crescimento do faturamento real no período?
c) Qual a estimativa do valor faturado para Fev/12 utilizando-se da taxa média obtida
no item b?
3. O crescimento populacional no Brasil apresentou os seguintes números (em milhões
de habitantes).
Ano
População
1960
70,2
1970
93,1
1980
119,0
1990
150,3
2000
175,0
2010
190,7
Pede-se:
a) O crescimento decenal da população.
b) A taxa média anual de crescimento populacional no período
4. O setor de comercialização de uma empresa observou que a quantidade e o preço
cresceram respectivamente 8% e 4%, num determinado período. Com base nesses
dados, qual foi o crescimento percentual do valor faturado?
5. Um supermercado vendeu 5% a mais em Dez/11 comparativamente a Nov/11.
Quantos por cento vendeu a menos em Nov/11 com relação a Dez/11?
6. A inflação brasileira, medida pelo ICV (DIEESE), apresentou uma variação
acumulada de 2,62% no primeiro trimestre de 2011. No segundo trimestre do mesmo
ano apresentou um acumulado de 0,50%. Qual foi a inflação média mensal no período?
64
7. Na década de 1980 a economia brasileira apresentou taxas mensais de inflação de
dois dígitos. Dessa forma, era comum que a variação acumulada em um semestre
qualquer atingisse 200%. Assim sendo, qual seria a perda salarial de uma categoria
que não teve reajustes?
8. A tabela apresenta a variação percentual mensal de três índices de preços no
primeiro semestre de 2011.
Índice
Jan
Fev
Mar
Abr
Mai
Jun
INPC (IBGE)
0,94
0,54
0,66
0,72
0,57
0,22
IPC (FIPE)
1,15
0,6
0,35
0,7
0,31
0,01
ICV (DIEESE) 1,28
0,41
0,91
0,8
0,04
-0,34
a) A variação percentual acumulada de cada índice no período.
b) A taxa média mensal de crescimento de cada índice no período.
c) Em quantos por cento o maior índice acumulado é superior ao menor?
d) Considere que o salário de um operário tenha sido reajustado pelo ICV, enquanto a
cesta básica foi reajustada pelo INPC, qual seria a perda salarial deste operário?
9. A variação percentual acumulada do IGP-DI (FGV) no primeiro semestre de 2011 foi
de 2,96%. Supondo-se que a variação média mensal do segundo semestre seja de
0,5%, qual será a inflação acumulada no ano de 2011?
10. O consumo de combustível numa determinada cidade apresentou as seguintes
variações % mensais no segundo semestre de 2011.
Mês
Consumo
Jul
2,06
Ago
2,95
Set
0,26
Out
4,16
Nov
- 4,78
Dez
- 4,29
a) A variação percentual acumulada no semestre.
b) Considerando que a quantidade consumida em Jun/11 foi de 5380 m3, determine o
consumo para todos os meses do semestre.
11. A inflação brasileira, medida pelo IPCA (IBGE), apresentou as seguintes variações
percentuais mensais no período Jan/Ago de 2011.
Mês
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
65
%
0,83
0,8
0,79
0,77
0,47
0,15
0,16
0,37
a) Uma série de números-índices com base em Dez/10.
b) A variação percentual acumulada do IPCA no período.
c) A taxa média mensal de crescimento do IPCA no período.
12. A série abaixo se refere aos índices mensais de produção (Dez/10=100) de uma
empresa no período Jan/Set de 2011.
Mês
Índices
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
98
103
107
104
106
97
107
114
113
a) As variações percentuais mensais da produção com base móvel de comparação.
b) Mude a base da série de índices de produção para o mês que apresentou o pior
desempenho.
c) Qual o significado do índice de produção obtido em Set/11 com base em Jun/11?
d) Supondo-se que a produção física em Jun/11 tenha sido de 60 mil unidades, calcule
a produção para todos os meses da série.
13. A inflação anual de um país qualquer apresentou taxa de 3%. No Brasil, a inflação
foi de 8% no mesmo período. Qual deverá ser a desvalorização cambial da moeda
nacional para que se possa manter a paridade?
14. Em Fevereiro o preço de um artigo foi 5% menor do que o preço de Abril. Em
Agosto o preço do mesmo artigo era 14% superior ao de Abril. Pergunta-se: qual o
aumento de preço em Agosto relativo a Fevereiro?
15. O preço de mercado de um artigo apresentou as seguintes variações: em março
era 12% inferior a janeiro e 25% inferior a abril. Em fevereiro era 18% superior a janeiro
e 10% inferior a maio. Monte uma série de números-índices com base em Maio.
16. Os preços nominais de um artigo nos meses de Janeiro, Fevereiro e Março foram
respectivamente: R$ 125,00; R$ 130,00 e R$ 140,00. O deflator em Fevereiro foi 5%
inferior a Janeiro e 8% inferior a Março. Pergunta-se: quais os preços reais com base
em Março?
66
17. O salário nominal de um operário em Dez/10 era de R$ 500,00 passando para R$
600,00 em Dez/11. Considerando-se que a inflação acumulada em 2011 foi de 5%,
pergunta-se: o salário do operário apresentou ganho ou perda salarial? De quantos por
cento?
18. As vendas nominais (em R$ mil) mensais de uma empresa em 2011 e a variação
percentual mensal do custo que serviu de base para reajustes dos preços foram os
seguintes:
Mês
Vendas
Variação
Jul
42,0
3,72
Ago
45,0
1,43
Set
46,0
0,74
Out
47,5
1,48
Nov
49,0
1,17
Dez
51,5
1,30
a) Valor real das vendas com base em Dezembro/11.
b) Variações percentuais mensais das vendas reais com base móvel de comparação.
c) A taxa média mensal de crescimento das vendas reais no período.
d) Utilizando a taxa média mensal obtida no item c, faça uma estimativa das vendas
reais para Fev/12.
67
RESPOSTAS DOS EXERCÍCIOS
Capítulo 2
1a.
72 | 80
QI
Fi
5
5
Fac
60
Fac
Fri%
8
8
Facr%
100
Facr%
Pmi
76
1b. 49 alunos
80 | 88
88 | 96
96 | 104
104 | 112
112 |I 120
7
12
55
12
20
92
84
8
20
48
13
33
80
92
11
31
40
18
51
67
100
16
47
29
27
78
49
108
13
60
13
22
100
22
116
1c. 33%
1d. 108 pontos
1e. 27%
60
XX
XX
100
XX
XX
XX
1f. negativa
2. O grupo que apresenta melhor desempenho é o feminino, pois apresenta assimetria negativa
(concentração em classes superiores). Por outro lado, o grupo masculino apresenta assimetria positiva
(concentração em classes inferiores), indicando um pior desempenho quando comparado com o grupo
feminino.
3. Espera-se uma distribuição de salários assimétrica negativa, pois se tratando de empresa de alta
tecnologia, é provável que a maior parte dos colaboradores tenha remuneração em faixas superiores.
4a. 80%
4b. 30%
4c. 43 minutos
4d. 90 clientes
4e. 85%
4f.
Tempo 30 | 35
35 | 40
40 | 45
45 | 50
50 | 55
55 | 60
Fi
30
40
46
44
24
16
200
Fri%
15
20
23
22
12
8
100
Capítulo 3
1a média = 34,7 anos
mediana = 32,5 anos
moda = 31 anos
1b intervalo interquartil vai de 27 a 43 anos
2a. 5,8 erros
2b. 2320 erros
3a. consumo médio = 9 litros
consumo mediano = 9,2 litros
3b. significa que 50% dos veículos consomem abaixo de 9,2 litros.
3c. 10,5 litros.
4a. assimetria positiva
4b. assimetria negativa
68
Capítulo 4
1a. 3,37 para os dois operários
1b. O fato de a produção diária ser diferente para os dois operários não implica em desvios diferentes.
Na realidade, a variabilidade em torno da média é igual para os dois operários, só que “A” produz menos
do que “B”.
1c. A CVp = 4,79%
B CVp = 4,2%
Apesar de a diferença ser mínima, o operário B apresenta produção mais homogênea, pois o CV p é
menor.
2a. Fem 13 pontos
Masc 17 pontos
2b. Fem = 12,87%
Masc = 18,68%
Observa-se que no grupo feminino a variabilidade em torno da média é menor, indicando que os dados
estão mais concentrados em torno desse valor.
2c. Fem = -0,62
Masc = 0,71
O grupo feminino apresenta melhor desempenho, pois a assimetria negativa indica concentração de
indivíduos em classes superiores de QI.
3. Tempo modal de atraso igual a 13 dias.
4. Ação C, pois apresenta a menor variabilidade (25%).
Capítulo 5
1a. 50%
1b. 50%
1c. 66,67%
1d. 33,33%
1e. Sim, pois não podem ocorrer ao mesmo tempo e esgotam todos os resultados possíveis do
experimento.
2a. 11,11%
2b. 16,67%
2c. 16,67%
2d. 5,56%
11
3a. 1728 possibilidades em (11) .
3b. uma possibilidade em 831600.
4a. 37,5%
4b. 12,5%
4c. 50%
5a. 25%
5b. 37,5%
5c. 75%
6. 93,3%
7a. 0,15%
7b. 92,15%
8a. 40%
8b. 20%
8c. 26,7%
9a. 83,3
9b. 3,3%
9c. 16,67%
8d. 13,3%
8e. 86,7%
10. 14,33%
11. 34,1%
12. 90,3%
13a. 37,5%
13b. 50%
14. 18,9%
15. 40%
16. 57,81%
17. 92,75%
18a. 12,5%
18b. 6,9%
18c. 70,4%
19. 4,16%
20. 70,4%
69
Capítulo 6
1a. índice 110,4 / % = 10,4%
2a. 15,32%
2b. 1,5%
1b. 2%
1c. R$ 22,52
2c. R$ 328,64 mil
3a.
Ano
%
1960
1970
32,62
1980
27,82
IPC
3,16
0,52
ICV
3,13
0,51
1990
26,3
2000
16,43
2010
8,97
3b. 2,02%
4. 12,32%
5. 4,76%
6. 0,52%
7. perda de 66,67%
Índice
8ª
8b
INPC
3,7
0,61
8c. 0,5527%
8d. perda de 0,5497%
9. 6,09%
10a. zero
10b.
Jul
5491
Ago
5653
Set
5668
Out
5903
Nov
5621
Dez
5380
11a.
Jan
100,83
Fev
101,64
Mar
102,44
Abr
103,23
Mai
103,71
Jun
103,87
11b. 4,42%
12a
12b
12d
Jul
104,04
Ago
104,42
11c. 0,54%
Jan
2
101
60,6
Fev
5,1
106
63,6
Mar
3,9
110
66
Abr
2,8
107
64,2
Mai
1,9
109
65,4
Jun
8,5
100
60
Jul
10,3
110
66
Ago
6,5
118
70,8
Set
0,9
116
69,6
12c. a produção em setembro foi 16% superior à de junho.
13. desvalorização de 4,63%
14. 20%
15.
Jan
76,3
Fev
90
Mar
67,1
Fev
141,30
Mar
140
Abr
89,5
Mai
100
Set
47,8
1,49
Out
48,7
1,88
16.
Jan
129,08
17. ganho de 14,29%
18a
18b
18c. 2,92%
Jul
44,6
Ago
47,1
5,61
Nov
49,6
1,85
Dez
51,5
3,83
18d. R$ 54,55 mil
70
BIBLIOGRAFIA
Anderson, David R. e outros. Estatística Aplicada à Administração e Economia. São
Paulo: Pioneira Thomson Learning, 2002.
Kirsten, José Tiacci.
Custo de Vida - Metodologia de Cálculos, Problemas e
Aplicações. São Paulo: FIPE/Pioneira, 1985.
Lapponi, Juan Carlos. Estatística usando Excel. São Paulo: Lapponi Treinamento e
Editora, 2000.
Levine, David M. e outros. Estatística: Teoria e Aplicações. Rio de Janeiro: LTC
Editora, 2000.
Malhotra, Naresh K. Pesquisa de Marketing – Uma Orientação Aplicada. Porto Alegre:
Bookman, 2001.
Matos, Orlando Carneiro.
Econometria Básica – Teoria e Aplicações. São Paulo:
Editora Atlas, 1995.
Pereira, Wilson e Tanaka, Oswaldo K. Estatística: Conceitos Básicos.
São Paulo:
Editora McGraw-Hill, 2º edição, 1990.
Stevenson, William J.
Estatística Aplicada à Administração.
São Paulo: Editora
Harbra, 1981.
Toledo, Geraldo Luciano e Ovalle, Ivo Izidoro. Estatística Básica. São Paulo: Editora
Atlas, 1983.
71