BANCO DO BRASIL E CAIXA ECONÔMICA FEDERAL
Prof. Daniel Almeida
Estatística
b) Variável qualitativa
Estatistica
Introdução: A Estatística talvez seja a parte da
Matemática que mais se preocupa com o comportamento
social, visto que tal conteúdo é repleto de coletas de
dados, para que se possa então fazer a análise deles.
A Estatística envolve um conjunto de métodos
desenvolvidos para a coleta, classificação, apresentação,
análise e interpretação de dados quantitativos(ou
qualitativos) e a utilização desses dados para a tomada
de decisões.
Por exemplo, podemos pensar no caso de duas
turmas que, em um determinado teste de matemática,
tenham ambas obtido média aritmética 6 nas notas, pois
é possível que, em uma turma, todos tenham tirado notas
muito próximas de 6 e na outra turma a variação de notas
tenha sido muito discrepante, daí a importância da
Estatística, pois através dela traçaremos parâmetros para
que possamos diferenciar e personalizar as coletas
analisadas.
•
São aquelas variáveis que procuram passar
uma certa característica do dado que está sendo
analisado, como, por exemplo: cor do cabelo,
cor da pele, feio ou bonito, alegre ou triste e
assim por diante.
•
Obs.: Essas variáveis podem ser de dois tipos:
Qualitativas Nominais (atributos)
Qualitativas Ordinais (ordem)
Freqüências
a) Freqüência absoluta:
•
É aquela que indica o número de elementos
coletados da variável analisada.
b) Freqüência relativa:
POPULAÇÃO E AMOSTRA
População é um conjunto de elementos que têm pelo
menos uma característica (variável) comum objeto de
estudo.
•
É aquela que representa a proporção entre a
variável analisada e o todo, e que, por isso,
pode ser representada por uma fração, por uma
porcentagem ou por uma dízima.
População Finita: Limitada em tamanho
População Infinita: Ilimitada em tamanho. Consiste num
processo que gera itens.
Fr
Fabs
N
Nomenclatura Básica
Tabela de freqüências
Tipos de variáveis
Tabela sem intervalo de classe:
a) Variável quantitativa
•
Quando as variáveis de uma pesquisa são, por
exemplo, altura, peso, idade em anos e número
de irmãos, dizemos que elas são quantitativas,
pois seus possíveis valores são números.
•
As variáveis quantitativas podem ser discretas,
quando se trata de contagem (números inteiros),
ou contínuas, quando se trata de medida
(números reais). Veja:
A tabela abaixo relaciona a preferência pelo time de
futebol em relação a 560 pessoas entrevistadas, em que,
para cada time, podemos utilizar a proporção entre a
freqüência relativa e o setor do gráfico.
• “Número de irmãos” é uma variável quantitativa discreta,
pois podemos contar (0, 1, 2 etc.).
• “Altura” é uma variável quantitativa contínua, uma vez
que pode ser medida (l,55 m, l,80 m, l,73 m etc.).
• “A idade em anos exatos” pode ser considerada variável
quantitativa discreta (8, 10, 17 etc.).
Neste curso os melhores alunos estão sendo preparados pelos melhores Professores
1
BANCO DO BRASIL E CAIXA ECONÔMICA FEDERAL
Prof. Daniel Almeida
Estatística
2 – Média ponderada
Tabela com intervalo de classe:
Quando alguns valores se repetem, torna-se mais fácil o
cálculo da média aritmética.
Vejamos:
Calcular
a
média
aritmética
dos
valores
27,27,30,30,30,30,32,32 e 32.
Nesse caso, observamos que:
- o valor 27 se repete 2 vezes;
- o valor 30 se repete 5 vezes;
- o valor 32 se repete 3 vezes;
OBS.: As classes são intervalos fechados no início e
abertos no final.
x
a b [a, b[
Quando for necessário podemos representar cada classe
pelo seu elemento central.
Medidas de Centralidade (MÉDIAS)
A medida de centralidade é um número que está
representando todo o conjunto de dados; nas pesquisas
tal número é conhecido como medida de tendência
central, que pode ser encontrado a partir da média
aritmética, da moda ou da mediana, e o uso de cada
uma delas é mais conveniente de acordo com o nível
de mensuração, o aspecto ou forma da distribuição
de dados e o objetivo da pesquisa.
1 – Média Aritmética:
Terça
23
27.2 30.5 32.3 54 150 96 300
30
253
10
10
A média aritmética é 30.
O número de vezes que o valor se repete chama-se
peso, e à média assim calculada dá-se o nome de
média ponderada.
3 – Média Moda
A moda é o elemento da seqüência de dados que possui
a maior freqüência, em que ela será localizada. Para ficar
mais fácil de você lembrar, associe o fato de que aquilo
que está na moda é o que as pessoas mais usam.
A moda é facilmente reconhecida: basta, de acordo com
definição, procurar o valor que mais se repete.
Uma livraria vende a seguinte quantidade de livros de
literatura durante certa semana:
Seg
22
Assim, a média pode ser calculada de uma forma mais
simples:
Quarta
22
Quinta
27
Sexta
25
Ex: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é
igual a 10.
Sábado
13
Qual foi a média de livros vendidos durante essa
semana?
Há séries nas quais não exista valor modal, isto é, nas
quais nenhum valor apareça mais vezes que outros.
Ex: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é
amodal.
Para resolver esse problema, devemos fazer:
22 23 22 27 25 13 132
22
6
6
Em outros casos, pode haver dois ou mais valores de
concentração. Dizemos, então, que a série tem dois ou
mais valores modais.
Esse número é chamado de média aritmética dos
números 22, 23, 22, 27, 25 e 13
Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 }
apresenta duas modas: 4 e 7
Média
aritmética
x1 x2 x3 .... xn
(x)
dos
valores
A série é bimodal.
é o quociente entre a soma
desse valores e seu número total n.
x
x1 x2 x3 .... xn
n
Neste curso os melhores alunos estão sendo preparados pelos melhores Professores
2
BANCO DO BRASIL E CAIXA ECONÔMICA FEDERAL
Prof. Daniel Almeida
4 – Média Mediana
A mediana representa o elemento que se encontra no
centro da distribuição, quando a seqüência de dados se
apresenta ordenada de forma crescente ou decrescente,
cortando, assim, a distribuição em duas partes com o
mesmo número de elementos.
Dada uma série de valores como, por exemplo:
{ 5, 2, 6, 13, 9, 15, 10 }
De acordo com a definição de mediana, o primeiro passo
a ser dado é o da ordenação (crescente ou decrescente)
dos valores:
{ 2, 5, 6, 9, 10, 13, 15 }
Estatística
Desvio Absoluto Médio
Como a palavra desvio está associada à diferença, temos
que, o desvio deve ser empregado com a diferença do
elemento analisado em relação à média, ou seja, o
quanto o elemento se afasta da média da seqüência. Daí,
é importante perceber que essa diferença deve ser
necessariamente trabalhada em módulo, pois não tem
sentido a distância negativa. E o desvio médio, então,
passa a ser encontrado a partir da média aritmética de
todos os desvios.
Daí, temos:
O valor que divide a série acima em duas partes iguais é
igual a 9, logo a Md = 9.
N
DM
| x
i 1
Em que
Observe a seguinte situação: quatro turmas do 3º ano do
Ensino Médio fizeram uma prova de estatística e quando
o professor verificou a média das notas de cada turma,
constatou que, em cada uma das quatro turmas, a média
dos alunos foi igual a 6,0. E aí? Será que podemos
concluir que o desempenho das quatro turmas foi o
mesmo? Será que todos os alunos, de todas as turmas,
tiraram nota 6,0 na prova? É óbvio que, nesse momento,
o bom senso fala mais alto e podemos, no mínimo,
desconfiar de que não.
x|
N
Medidas de Dispersão
Vimos que a moda, a mediana e a média aritmética
possuem a função de representar, a partir de um único
número, a seqüência a ser analisada. Porém, tal método
ainda é muito incompleto para que nós possamos tirar
alguma conclusão sobre o trabalho. É necessário que
possamos enxergar algo mais nessa seqüência que
estamos analisando, como, por exemplo, uma certa
“personalidade” da seqüência.
i
xi
são os valores tomados, x é a média
aritmética desses valores e N é a quantidade de valores.
Exemplo
Então, na tabela acima, temos que:
Pois é exatamente aí que reside a tal
“personalidade” que podemos atribuir a cada turma em
relação ao comportamento das notas.
O que quero dizer é que, com as medidas de dispersão,
seremos capazes de verificar que, por mais que a média
das turmas na prova de estatística tenha sido 6,0,
poderemos com tais medidas determinar as turmas que
tiveram um comportamento homogêneo, em que os
alunos tiraram notas próximas de 6,0, como também
determinar as turmas que tiveram um comportamento
heterogêneo em relação à nota 6,0, ou seja, por mais que
a média tenha sido 6,0, as notas não foram próximas de
6,0.
Variância
A variância é uma medida de dispersão muito parecida
com o desvio médio, a única diferença em relação a este
é que, na variância, ao invés de trabalharmos em módulo
as diferenças entre cada elemento e a média, tomamos
os quadrados das diferenças. Isso se dá pelo fato de que,
elevando cada diferença ao quadrado, continuamos
trabalhando com números não negativos, como também
pelo fato de que, em procedimentos estatísticos mais
avançados, tal método facilita futuras manipulações
algébricas.
Neste curso os melhores alunos estão sendo preparados pelos melhores Professores
3
BANCO DO BRASIL E CAIXA ECONÔMICA FEDERAL
Prof. Daniel Almeida
N
Var
(x
i 1
Em que
i
TESTES:
x) 2
N
xi
Estatística
são os valores tomados,
xé
a média
aritmética desses valores e N é a quantidade de valores.
Exemplo
01.(Mackenzie SP/2006) A média aritmética de n
números positivos é 7. Retirando-se do conjunto
desses números o número 5, a média aritmética dos
números que restam passa a ser 8. O valor de n é
a) 2
b) 3
c) 5
d) 6
e) 9
02. (UEPB PB/2006) A média aritmética das alturas de
cinco edifícios é de 85 metros. Se for acrescentado a
apenas um dos edifícios mais um andar de 3 metros
de altura, a média entre eles passará a ser:
a) 85,6 m
b) 86 m
c) 85,5 m
d) 86,6 m
e) 86,5 m
Ainda tomando como exemplo a situação anterior,
teremos:
Desvio-padrão
Para entendermos o procedimento para o cálculo do
desvio-padrão, é interessante percebermos que, no
cálculo da variância, cometemos um “erro técnico” que
será corrigido pelo desvio-padrão, ou seja, no momento
em que elevamos ao quadrado as dispersões
(diferenças) de cada elemento em relação à média,
automaticamente alteramos a unidade de trabalho. Por
exemplo: se estivermos trabalhando com a coleta das
alturas, em metro, das pessoas de uma determinada
comunidade, a unidade da variância encontrada será o
m² (metro quadrado), que representa áreas. E é aí que
entra o desvio-padrão, ou seja, extraindo a raiz quadrada
da variância.
Desvio padrão
var
Então, se no exemplo do item anterior a variância
encontrada foi 345,57, temos que o desvio-padrão foi de
345,57 18,58
03.(FGV SP/1ªFase/Economia/2005) A média das
alturas dos 6 jogadores em quadra de um time de
vôlei é 1,92 m. Após substituir 3 jogadores por
outros, a média das alturas do time passou para 1,90
m.
Nessas condições, a média, em metros, das alturas
dos jogadores que saíram supera a dos que
entraram em:
a) 0,03.
b) 0,04.
c) 0,06.
d) 0,09.
e) 0,12.
04. (UFMS MS/2005) A média aritmética das notas dos
alunos de uma classe de 40 alunos é 7,2 . Se a média
aritmética das notas das meninas é 7,6 e a dos meninos
é 6,6 , então o número de meninas na classe é
a) 20.
b) 18.
c) 22.
d) 24.
e) 25.
05.(PUC RJ/Janeiro/2002) Um aluno faz 3 provas com
pesos 2, 2 e 3. Se ele tirou 2 e 7 nas duas primeiras,
quanto precisa tirar na terceira prova para ficar com
média maior ou igual a 6?
a) Pelo menos 4.
b) Pelo menos 5.
c) Pelo menos 6.
d) Pelo menos 7.
e) Pelo menos 8.
06. (UFRN RN/2000) Uma p ro va f oi apl icada em
du as tu rmas d istin tas. Na prime ira , com 30
al unos, a mé dia aritmética das notas foi 6,40. Na
segunda, com 50 alunos, foi 5,20. A média aritmética
das notas dos 80 alunos foi:
a) 5,65
b) 5,70
c) 5,75
d) 5,80
Neste curso os melhores alunos estão sendo preparados pelos melhores Professores
4
BANCO DO BRASIL E CAIXA ECONÔMICA FEDERAL
Prof. Daniel Almeida
07. (ESPP-MPP-PR-2010) Num escritório de engenharia
há 20 engenheiros ganhando cada um R$ 2000 de
salário, e 10 engenheiros ganhando cada um R$ 5000 de
salário. O salário médio dos 30 engenheiros é igual a:
a) R$ 2500
b) R$ 2750
c) R$ 3500
d) R$ 3250
e) R$ 3000
GABARITO:
0
0
1
C
1
B
*
2
A
3
B
4
D
5
E
6
A
7
D
8
D
9
E
TESTES ESTATÍSTICA - CESGRANRIO
08. (SANEPAR – 2008) A
média
aritmética
das
temperaturas máximas, em graus centígrados, em
Curitiba nos últimos sete dias foi 28. Em dois dias as
temperaturas máximas foram iguais e, retirando esses
números do cálculo, a média dos outros cinco dias
também foi 28. Qual foi a temperatura daqueles dois
dias?
a)
b)
c)
d)
e)
Estatística
Para responder às questões de nos 1 e 2, utilize os
dados da tabela abaixo, que apresenta as freqüências
acumuladas das idades de 20 jovens entre 14 e 20
anos.
25.
26.
27.
28.
29.
09. (UFPel RS/2005) Na busca de solução para o
problema da gravidez na adolescência, uma equipe de
orientadores educacionais de uma instituição de ensino
pesquisou um grupo de adolescentes de uma
comunidade próxima a essa escola e obteve os seguintes
dados:
01.(CESGRANRIO-CEF-2008) Um desses jovens será
escolhido ao acaso. Qual a probabilidade de que o jovem
escolhido tenha menos de 18 anos, sabendo que esse
jovem terá 16 anos ou mais?
a)
b)
c)
d)
e)
8/14
8/16
8/20
3/14
3/16
02. (CESGRANRIO-CEF-2008) Uma das medidas de
dispersão é a variância populacional, que é calculada por
Com base nos textos e em seus conhecimentos, é
correto afirmar, em relação às idades das adolescentes
grávidas, que
a)
b)
c)
d)
e)
a média é 15 anos.
a mediana é 15,3 anos.
a mediana 16,1 anos.
a moda é 16 anos.
a média é 15,3 anos.
10. (UFPR-2008) Uma determinada região apresentou, nos
últimos cinco meses, os seguintes valores (fornecidos em
mm) para a precipitação pluviométrica média:
Sabendo-se que m é a média aritmética dessas idades,
qual a variância das idades na população formada pelos
20 jovens?
A média, a mediana e a variância do conjunto de valores
acima são, respectivamente:
(A) 0,15
(B) 0,20
(C) 1,78
(D) 3,20
(E) 3,35
a) 30, 27 e 6,8.
b) 27, 30 e 2,4.
c) 30, 29 e 6,8.
d) 29, 30 e 7,0.
e) 30, 29 e 7,0.
Neste curso os melhores alunos estão sendo preparados pelos melhores Professores
5
BANCO DO BRASIL E CAIXA ECONÔMICA FEDERAL
Prof. Daniel Almeida
03. (CESGRANRIO-ANP-2008) Pedro fez três avaliações
de Matemática e obteve notas 6,7, 5,8 e 7,6. Ele fará
mais uma avaliação e sua média final será a média
aritmética dessas quatro notas. Qual é a nota mínima que
Pedro deverá obter na quarta prova para que sua média
final seja igual ou superior a 7,0?
(A) 7,3
(B) 7,5
(C) 7,7
(D) 7,9
(E) 8,1
04. (CESGRANRIO-ANP-2008) O gerente do restaurante
de certa empresa fez uma pesquisa e concluiu que os
funcionários homens consumiam, em média, 540g por
refeição e as mulheres, 450g. Se 60% dos funcionários
dessa empresa são homens, qual é, em gramas, o
consumo médio, por funcionário, em cada refeição?
(A) 485
(B) 495
(C) 504
(D) 514
(E) 525
O enunciado abaixo refere-se às questões de nos 05
e 06.
Uma pesquisa foi feita com 40 mulheres a respeito da
quantidade de filhos de cada uma delas e das idades
desses filhos. Abaixo, vêem-se:
- um gráfico de barras com a distribuição das 40
mulheres conforme a quantidade de filhos;
- uma tabela com as quantidades de filhos de 1, 2, 3 e 4
anos dessas 40 mulheres.
Estatística
05. (CESGRANRIO-INEP-2007) Analisando-se os dados
em relação ao conjunto desses filhos, conclui-se
corretamente que
(A) há, ao todo, 32 filhos.
(B) há exatamente 8 filhos que não possuem qualquer
irmão.
(C) há exatamente 10 filhos que possuem um único
irmão.
(D) há mais de 30 filhos que possuem mais de um irmão.
(E) o número de filhos que não possuem qualquer irmão
é maior do que o número de filhos que possuem pelo
menos um irmão.
06. (CESGRANRIO-INEP-2007) Analisando-se os dados
em relação ao conjunto desses filhos, conclui-se
corretamente que há crianças
(A) com menos de 1 ano.
(B) de 1 ano que possuem irmão.
(C) de 2 anos que possuem irmão.
(D) de 3 anos que possuem mais de um irmão.
(E) com menos de 3 anos que possuem mais de um
irmão.
O enunciado abaixo refere-se às questões de nos 07
e 08.
Um grupo é formado por 10 pessoas, cujas idades são:
17 19 19 20 20 20 20 21 22 22
07. (CESGRANRIO-BNDES-2007) Seja 𝜇 a média
aritmética das idades e seu 𝜎 desvio padrão. O número
de pessoas desse grupo cujas idades pertencem ao
intervalo 𝜇 − 𝜎, 𝜇 + 𝜎 é:
(Considere 2 = 1,4
(A) 9
(B) 8
(C) 7
(D) 6
(E) 5
08. (CESGRANRIO-BNDES-2007) Escolhendo-se,
aleatoriamente, uma pessoa do grupo, qual a
probabilidade de que sua idade seja maior do que a
moda?
(A) 30%
(B) 25%
(C) 20%
(D) 15%
(E) 10%
Neste curso os melhores alunos estão sendo preparados pelos melhores Professores
6
BANCO DO BRASIL E CAIXA ECONÔMICA FEDERAL
Prof. Daniel Almeida
Estatística
O enunciado abaixo refere-se às questões de nos 09
e 10.
Vinte alunos foram submetidos a uma prova de 5
questões. O gráfico mostra, para cada uma das questões,
a porcentagem dos alunos que acertaram a tal questão.
09. (CESGRANRIO -2007) Se cada uma das questões
valia 1 ponto, qual a média de pontos da turma?
(A) 3,1
(B) 3,0
(C) 2,9
(D) 2,8
(E) 2,7
10. (CESGRANRIO -2007) Quantas questões foram
acertadas por mais de 60% dos alunos?
(A) 1
(B) 2
(C) 3
(D) 4
(E) 5
GABARITO:
0
0
1
1
B
2
D
3
D
4
C
5
D
6
C
7
C
8
A
9
D
B
Neste curso os melhores alunos estão sendo preparados pelos melhores Professores
7