ESTATÍSTICA
Estatística é a parte da matemática aplicada que fornece métodos para a coleta, organização,
descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de
decisões.
A estatística compreende três ramos:
- Estatística descritiva
- Teoria da probabilidade
- Inferência (ou amostragem)
A estatística descritiva compreende a organização, o resumo e, em geral, a simplificação de
informações que podem ser muito complexas. Portanto, a coleta, a organização e a
descrição dos dados estão a cargo de estatística descritiva.
Exemplos:
01. Taxa de desemprego
02. Custo de vida
03. Índice pluviométrico
04. As medias dos estudantes
A teoria da probabilidade é útil para analisar situações que envolvem o acoso. Como por
exemplo: Jogos de dados e cartas,ou lançamento de uma moeda.
A inferência (ou amostragem) diz respeito a análise e interpretação de dados amostrais. A
amostragem é um exemplo vivo do adágio, não é preciso comer um bolo inteiro para saber se
o bolo é gostoso, A ideia básica da amostragem é efetuar determinada mensuração sobre uma
parcela pequena, mas típica, de determinada população e utilizar essa informação para fazer
inferência sobre a população toda.
Exemplos:
01. Mergulhar a ponta do pé na água para avaliar a temperatura da piscina,
02. Folhear um livro.
A palavra estatística numa conceituação genérica pode ser considerada como a ciência que se
preocupa com a coleta, organização, descrição, análise e interpretação de dados
experimentais.
O objetivo de reunir dados é o de fornecer informações sobre as características de grupos de
pessoas ou coisas. As informações têm por objetivo conhecer o problema e, desta forma, servir
de base para a escolha dos procedimentos mais adequados para resolvê-lo.
Quando um cardiologista, por exemplo, solicita do seu paciente informações referentes ao seu
histórico familiar sobre doenças cardiovasculares, DCV, está levantando um dado que já
mostrou, a partir de dados referentes a outros pacientes, apresentar uma possível relação com
o seu prognóstico cardiológico. Essa e outras informações, como tipo de alimentação irão
auxiliar a compor um quadro dos fatores que podem contribuir para melhorar ou prejudicar a
saúde do paciente. Essas informações são de natureza estatística, aplicadas, neste caso, à
medicina.
Evidentemente, trata-se de fornecer a informação da forma mais legível e completa possível.
Desta forma, são utilizados rotinas e meios que permitam um bom entendimento das
informações, organizando os dados. A organização de vários grupos de dados dá origem aos
bancos de dados.
Definem-se como primeiro(porém não mais importante) objetivo da estatística tornar a
informação clara e precisa ao receptor, valendo-se do ferramental disponível. Atualmente, os
recursos automáticos e gráficos da computação são ferramentas indispensáveis para o
tratamento da informação e, por extensão, para a estatística.
Nem sempre a estatística é bem vista. Essa má fama deve-se ao fato de ser, muitas vezes, mal
aplicada, pela não compreensão do significado correto de termos.
A estatística geralmente é dividida em duas partes:


Descritiva: encarrega-se de levantamento, organização, classificação e descrição dos
dados em tabelas, gráficos ou outros recursos visuais, além do cálculo de parâmetros
representativos desses dados.
Analítica: trabalha com os dados de forma a estabelecer hipóteses em funções desses
dados, procede a sua comprovação e, posteriormente, elabora conclusões cientificas.
DADOS ESTATÍSTICOS
Os dados estatísticos se obtêm mediante um processo que envolve a observação ou outra
mensuração de itens tais como renda anual numa comunidade, escores de testes, quantidade
de café por xícara servida por uma máquina automática, percentual de açúcar em cereais, etc.
Tais itens chamam-se variáveis, porque originam valores que tendem a exibir certo grau de
variabilidade quando se fazem mensurações sucessivas.
VARIÁVEL
Quando você vai comprar, por exemplo, um aparelho de televisão, você antes de comprar faz,
em princípio, algumas perguntas, tais como: Por quero comprar um aparelho de televisão? Que
marca devo comprar? Qual o tempo de utilização desse aparelho sem que ele vá ao reparo?
De quantas polegadas eu quero a televisão? Devo comprar à vista ou a prazo? E assim por
diante. Quando você faz isto ou algo parecido, você está levantando dados para tomar uma
decisão. Mas, antes de você tomar a decisão, você sempre faz uma analise das informações
obtidas durante o teu processo de solução do problema central: comprar uma televisão.
Assim sendo, aqui temos um problema, as variáveis, alguns dados que poderão ser obtidos,
uma vez que esses dados são buscados nas amostras que estou a consultar. Ou seja,
compreendo estas apurações de dados como um problema de estatística.
Assim, podemos compreender o trabalho estatístico como sendo um processo de pesquisa
estatística, que envolve amostras, levantamento de dados e análise as informações obtidas.
Portanto, variável é qualquer tipo de dado que pode apresentar uma quantidade ou categoria
de interesse no estudo estatístico.
As variáveis podem ser classificadas em:

QUANTITATIVAS: Discretas ou contínuas.
Uma variável é discreta quando só pode assumir certos valores, em geral inteiros.
Exemplos:
01. Números diários de clientes
02. Números de alunos numa sala de aula
03. Números de defeitos de um carro
04. Números de acidentes
05. Números de praias poluídas
As variáveis contínuas são aquelas que podem assumir virtualmente qualquer valor num
intervalo de valores.
Exemplos:
01. Altura
02. Peso
03. Comprimento
04. Espessura
05. Velocidade

QUALITATIVAS (ou categóricas): Nominal ou ordinal.
As variáveis nominais envolvem categorias tais como:
01. Sexo
02. Cor dos olhos (azuis, castanhos, verdes)
03. Campo de estudo (medicina, enfermagem, administração)
04. Desempenho (excelente, bom, ruim, sofrível)
05. Grupo de fumantes e não fumantes.
As variáveis ordinais consistem de valores relativos atribuídos para denotar ordem:
Exemplos:
01. Hipertensão (leve, moderado, grave)
02. Grupo de fumantes ou não fumantes.
03. Classificação em um concurso.
POPULAÇÃO E AMOSTRA
Normalmente entende-se o termo população como um conjunto de pessoas. Em estatística o
sentido da palavra se torna mais amplo.
Entende-se por população a totalidade dos elementos ou de um atributo dos elementos
referentes a um conjunto determinado.
Exemplos:
01. População de Recife.
02. População de pacientes internados no HR.
03. População de ratos machos.
04. População de seringas descartáveis de um posto de saúde.
A população pode ser:
Finita: quando apresenta um número limitado de indivíduos.
Exemplos:
01. A população constituída por todos os parafusos produzidos em uma fábrica em um dia.
02. Nascimento de crianças em um dia em Novo Hamburgo.
Infinita: quando o número de observações for infinito.
Exemplo. A população constituída de todos os resultados (cara e coroa) em sucessivos lances
de uma moeda.
A dificuldade de enumerar ou tratar conjuntos completos de dados faz com que se trabalhe
com partes do conjunto original, tidas como representantes do conjunto. Convenciona-se
denominar essas partes amostra. Deste modo, amostra é o conjunto de elementos retirados
da população, suficientemente representativos dessa população. Através da análise dessa
amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos
toda a população.
A seleção de uma amostra na qual cada membro do conjunto selecionado tenha a mesma
chance de incluído é chamada de amostragem.
Exemplo:
Podemos tirar conclusões sobre as alturas (ou pesos) de 12.000 estudantes adultos
(população), observando 100 estudantes (amostra) selecionados na população.
Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo.
 Parâmetro: É uma característica numérica estabelecida para toda uma população.
 Estimador: É uma característica numérica estabelecida para uma amostra.
 Dado Estatístico: É sempre um número real.
1) Primitivo ou Bruto: É aquele que não sofreu nenhuma transformação matemática.
Número direto.
2) Elaborado ou secundário: É aquele que sofreu transformação matemática. Ex.
porcentagem, média, etc.
FASES DO TRABALHO ESTATÍSTICO





Definição do problema
Planejamento: Consiste em determinar o procedimento necessário para resolver o
problema e, em especial, como levantar informações sobre o assunto objeto de estudo.
Que dados deverão ser obtidos? Como se deve obtê-los?
Coleta de dados: é normalmente feita através de um questionário ou de observação
direta de uma população ou amostra.
Organização dos dados: consiste na ordenação e crítica quanto à correção dos
valores observados, falhas humanas, omissões, abandono de dados duvidosos.
Apresentação dos dados: os dados estatísticos podem ser mais facilmente
compreendidos quando apresentados através de tabelas e gráficos, que permite uma
visualização instantânea de todos os dados.
APRESENTAÇÃO DE DADOS ESTATÍSTICOS
APRESENTAÇÃO TABULAR
A apresentação de dados estatísticos na forma tabular consiste na reunião ou
grupamento dos dados em tabelas ou quadros com a finalidade de apresenta-los de modo
ordenado, simples e de fácil percepção e com economia de espaço.
Componentes Básicos
Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos:
Exemplo:
Principais Elementos de uma Tabela
Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela,
respondendo às perguntas: O quê? Onde? Quando?
Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas.
Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas.
Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se
inscrevem nos seus cruzamentos com as colunas.
Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as
notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados.
SÉRIES ESTATÍSTICAS
É toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função de
três elementos:
Da época;
Do local;
Da espécie.
Esses elementos determinam o surgimento de quatro tipos fundamentais de séries estatísticas:
Séries Temporais ou Cronológicas: são aquelas nas quais os dados são reunidos segundo o
tempo que varia, permanecendo fixos o local e a espécie.
Exemplo:
Séries Geográficas: são aquelas nas quais os dados são reunidos segundo o local que varia
permanecendo fixos o tempo e a espécie.
Exemplo:
.
Séries Específicas: são aquelas nas quais os dados são reunidos segundo o espécie que varia
permanecendo fixos o tempo e o local.
Exemplo:
Séries Composta ou Mista: é a combinação de dois ou mais fundamentais de séries
estatísticas.
Exemplo: Geográfica – Temporal.
* Os dados estão em toneladas.
A apresentação tabular de dados estatísticos é normalizada pela resolução nº 886 de 26-101966 do Conselho Nacional de Estatística a fim de uniformizar a apresentação de dados.
Exercício 1: De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito,
27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478
condutores. Faça uma tabela para apresentar esses dados.
Exercício 2: De acordo com o Ministério dos transportes, em 1998, o tamanho das malhas de
transporte no Brasil é, assim distribuído: 320480 km de Rodovias (estradas municipais não
estão incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de
Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para
apresentar esses dados.
Exercício 3: De acordo com Ministério da Educação a quantidade e alunos matriculados no
ensino de 1º grau no Brasil nos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 –
21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para apresentar esses dados.
Exercício 4: Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte
subdivide-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de
29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente, segundo o MEC. . Faça
uma tabela para apresentar esses dados.
TIPOS DE GRÁFICOS
Gráfico em linha: é um dos mais importantes gráficos; representa observações feitas ao longo
do tempo. Tais conjuntos de dados constituem as chamadas séries históricas ou temporais.
Gráfico em setores: É um gráfico construído no círculo, que é dividido em setores
correspondentes aos termos da série e proporcionais aos valores numéricos dos termos da
série. É mais utilizado para séries específicas ou geográficas com pequeno número de termos
e quando se quer salientar a proporção de cada termo em relação ao todo.
Exemplo:
Gráficos em Barras (ou em colunas). É a representação de uma série por meio de
retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas).
Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais
aos respectivos dados.
Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos
respectivos dados.
Cartograma. É representação sobre uma carta geográfica.
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente
relacionados com as áreas geográficas ou políticas.
Pictograma. Constitui um dos processos gráficos que melhor fala ao público, pela sua forma
ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras.
Ex.: População Urbana do Brasil em 1980 (x 10)
Fonte: Anuário Estatístico (1984)
TABELA PRIMITIVA – ROL
1) Foram coletados os pesos(kg) de 20 homens entre 20 e 40 anos
80 55 60 65
60 70 75 70 70 90
55 80 70 100 60 70 80 65 55 90
a) Vamos agrupar os dados em ordem crescente
b) Vamos organizar os dados na tabela a seguir
PESOS (kg)
FREQUÊNCIA
FREQUÊNCIA
RELATIVA (%)
55
60
65
70
75
80
90
100
SOMA
20
100%
2) Foi feito uma coleta de dados relativos às estaturas de quarenta alunos de um colégio.
Estatura dos 40 alunos em centímetro
166
162
155
161
160
161
152
154
161
168
163
156
150
163
160
172
162
156
155
153
160
173
169
157
165
160
151
156
167
155
170
158
164
164
164
158
160
168
155
161
A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos
tabela primitiva.
Organização dos dados: ordem crescente ou decrescente
Agora podemos saber, com relativa facilidade, qual a menor (150cm) e qual a maior(173 cm)
estatura; que a amplitude da variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor
particular da variável ocupa no conjunto. Analisando um pouco mais, veremos que há uma
concentração maior nas estaturas entre 160 cm e 165 cm e, mais ainda, que há poucos valores
abaixo de 155 cm e acima de 170 cm.
DISTRIBUIÇÃO DE FRENQUÊNCIA
Denomina-se frequência o número de alunos que fica relacionado a um determinado valor da
variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência.
DADOS AGRUPADOS
Estatura
(cm)
150
151
Frequência
absoluta
Frequência
relativa
Estatura
(cm)
158
Frequência
relativa
160
152
161
153
154
162
163
155
164
156
165
157
166
Estatura
(cm)
167
168
169
170
172
173
Frequência
absoluta
Frequência
absoluta
Frequência
relativa
Veja que este processo pode ser bem demorado, mesmo que os valores da variável (n) seja de
tamanho razoável. Podemos dar uma solução mais aceitável e mais rápida, que consiste em
agruparmos os valores em intervalos de classe ou tabulagem.
A tabulagem dos dados é feita dividindo-se a amplitude total (diferença entre o maior valor e
o menor valor observado) da distribuição pelo número k de classes, previamente fixado.
Geralmente o número de classes varia entre 8 e 12. Entretanto existe uma formula empírica
para se determinar k(número de classes) K =
, onde n é o tamanho da amostra.
Voltando ao exemplo anterior (das alturas dos 40 alunos) veja que aplicando a formula para
obtermos o número de classes teremos:
K=
, ou seja teremos 6 classes.
Tomando a amplitude total da distribuição 173 – 150 = 23. O quociente da amplitude total pelo
número de classes constitui no intervalo de classes (h)
. Devemos aproximar o intervalo para um número
inteiro. Vamos aproximar para h =4.
DADOS AGRUPADOS EM INTERVALOS DE CLASSE
ESTATURA (cm)
150
PONTO MÉDIO
DAS CLASSSES
(Xi)
FREQUÊNCIA
DAS CLASSES
(fi)
FREQUÊNCIA
RELATIVA
(fr)
154
154 158
158 162
162 166
166 170
170 174
ELEMENTOS DA DISTRIBUIÇÃO EM INTERVALOS DE CLASSE
1) Classe: é cada um dos intervalos em que os dados são agrupados.
2) Limites de classes: são os valores extremos de cada classe.
li = limite inferior de uma classe;
Li = limite superior de uma classe.
3) Amplitude: é a diferença entre o maior valor e o menor valor de certo conjunto de dados.
Pode ser referida ao total de dados ou a uma das classes em particular.
Amplitude Total (At) – é calculada pela seguinte expressão:
At = Max. (rol) – Min.(rol).
Amplitude das classes (h) – é a relação entre a amplitude total e o número de classes,
conforme mostra a expressão a seguir:
h
Máx(rol)  Mín.(rol)
, onde n é o número de intervalos de classe.
n
4) Ponto médio de classe (xi): é calculado pela seguinte expressão:
xi 
Li  li
2
5) Frequência absoluta (fi): frequência absoluta de uma classe de ordem i, é o número de
dados que pertencem a essa classe.
6) Frequência relativa (fri): frequência relativa de uma classe de ordem i, é o quociente da
frequência absoluta dessa classe (fi), pelo total, ou seja,
fri 
fi
Total
EXEMPLOS:
01. Admitamos que uma empresa que possui um número muito grande de empregados (20.000
por exemplo) está interessada em mandar confeccionar uniformes (macacões) para seus
empregados. O fornecedor fabrica 8 tamanhos diferentes (números de 1 a 8). A empresa
deseja fazer uma encomenda de 40.000 uniformes. Quantos uniformes deverão ser feitos de
cada tamanho? Abaixo segue uma lista com as alturas de 50 empregados dessa empresa.
168
173
198
176
171
167
170
173
168
173
175
159
174
161
164
166
191
184
162
169
158
172
173
161
171
172
187
185
166
180
176
165
173
181
188
160
162
177
163
178
175
167
178
168
183
187
179
181
177
172
02. Considere os seguintes dados relativos ao número de acidentes diário num grande
estacionamento, durante um período de 50 dias.
6
5
3
4
5
9
4
8
7
1
2
4
8
5
2
7
4
4
3
3
0
4
4
7
6
8
2
4
1
0
2
5
7
3
5
5
6
7
8
6
4
3
6
0
6
2
7
5
6
3
Vamos montar uma tabela para k = 5
CLASSES
(Xi)
(fi)
(fr)
0
03. Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos
40 alunos da Turma A:
4
2
1
0
3
1
2
0
2
1
0
2
1
1
0
4
3
2
3
5
8
0
1
6
5
3
2
1
6
4
3
4
3
2
1
0
2
1
0
3
Organize os dados em uma tabela adequada.
Qual o percentual de alunos que adquiriram menos do que 3 livros? R: 60%
Qual o percentual de alunos que adquiriram pelo menos 4 livros? R: 22,5%
A partir do item (b), quantos livros foram adquiridos pelos 40 alunos? R: 92
04. Considere os dados abaixo referentes ao consumo de água, em m3, de 75 contas da
CORSAN:
32 6 22 11 34 40 16 26 23 31 27 10 38 17 13
45 25 50 18 23 35 22 30 14 18 20 13 24 35 29
33 48 20 12 31 39 17 58 19 16 12
21 15 12 20
51 12 19 15 41 29
25 13
23 32 14 27 43 37 21
28 37 26 44 11 53 38 46 17 36 28 49
56 19 11
Organize os dados numa distribuição de frequência com 9 classes de amplitudes iguais.
05. A altura de 60 alunos da FACE-PUC foi registrada abaixo, em cm:
174 170 156 168 176 178 162 182 172 168
166 156 169 168 162 160 163 168 162 172
168 167 170 153 171 166 168 156 160 172
173 163 170 175 176 182 158 176 161 175
173 163 172 167 170 179 179 170 151 175
152 151 172 173 170 174 167 167 158 174
a) Construa uma distribuição de frequência com 8 classes de amplitudes iguais, adotando
como limite inferior da distribuição 150 cm.
b) Qual o percentual de alunos com altura mínima de 166 cm? R: 70%
c) Quantos alunos têm menos de 162 cm? R: 12
d) Qual o percentual de alunos com altura média de 164 cm? Qual a soma total aproximada
das alturas dos 60 alunos? R: 10%, 10.108 cm
MEDIDADAS DE TENDÊNCIA CENTRAL
Há diversas medidas que possibilitam condensar as informações dentro da fase analítica da
estatística descritiva.
As medidas de tendência central são usadas para indicar um valor que tende a caracterizar, ou
a representar melhor, um conjunto de números. As três medidas mais usadas são: A média, a
moda e a mediana.
Dados agrupados
MEDIAS
O número destinado a resumir uma série de dados diz – se média, designação que significa
que a síntese deve ser um valor intermediário aos valores dados.
Tipos de médias
- Média aritmética simples e ponderada
- Média geométrica
- Média harmônica
Media aritmética simples: média de um conjunto de valores numéricos é calculada somandose todos estes valores e dividindo-se o resultado pelo número de elementos somados
Considere uma sequência numérica
Exemplo: Considere os números 2, 5, 7, 9 e 12, a média aritmética simples desses valores é:
Média aritmética ponderada: A média ponderada é calculada através do somatório das
multiplicações entre valores e pesos atribuídos a cada valor divididos pelo somatório dos
pesos.
Exemplo:
Na escola de Gabriel, a média anual de cada matéria é calculada de acordo com os princípios
da média ponderada. Considerando que o peso das notas esteja relacionado ao bimestre em
questão, determine a média anual de Gabriel sabendo que as notas em Matemática foram
iguais a:
1º Bimestre: 7,0 (peso 1)
2º Bimestre: 6,0 (peso 2)
3º Bimestre: 8,0 (peso 3)
4º Bimestre: 7,5 (peso 4)
Média geométrica
Dados
a média geométrica é igual a
EXEMPLOS:
01. Determine a média geométrica de 4, 16 e 8
02. Determine a média geométrica de 2 5 7 10 12
Média harmônica
A média harmônica
de n valores de uma variável é o inverso da media aritmética dos
inversos dos valores dados.
Dados
, a média harmônica é:
EXEMPLOS:
Calcule a média harmônica nos casos abaixo:
01. 2 e 6
02. 3, 6, 9 e 12
MODA
,
A moda de uma distribuição simples é o valor que ocorre com mais frequência.
Exemplo: Considere os números abaixo.
20 20 10 10 10 50 50 20 60 40
40 50 80 60 60 40 50 50 50 20
Observe que o número que aparece com mais frequência é o 50, logo a moda dessa amostra é
50.
OBSERVAÇÕES:
01. Existem distribuições que não possuem moda.
Exemplo: 2
3 5 6 9 1 0 12 15
02. Existem distribuições que possuem várias modas (multimodais)
Exemplo:
3 3 3 5 7 7 7 8 10 12 (duas modas:3 e 7) BIMODAL
4
5
5
5
6
7
7
7
9
10
10
10
15 (três modas: 5, 8 e 10) TRIMODAL
MEDIANA
A mediana é outra medida de posição definida como o número que se encontra no centro de
uma série de números organizados em ordem crescente ou decrescente.
Exemplo:
01. Considere a distribuição 10 12 15 16 20 35 40, veja que o termo central é 16, logo a
mediana vale 16.
02. Agora considere essa distribuição 10 12 15 16 20 35 40 80, veja que agora temos
dois termos centrais, 16 e 20, então a mediana será a média aritmética dos dois centrais.
EXERCICIOS
1) Considere a distribuição
N° de meninos
fi
0
2
1
6
2
10
3
12
4
4
34
Determine a média, a moda e a mediana da distribuição.
2) Os salários dos funcionários de uma empresa estão distribuídos na tabela abaixo:
Salário
Frequência
$400,00
5
$600,00
2
$1.000,00
2
$5.000,00
1
10
Determine o salário médio, o salário mediano e o salário modal.
MÈDIA ARITMÉTICA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES
Onde: é o ponto médio de cada classe e é a frequência de cada classe
Exemplo:
01. Determine a média aritmética das alturas dos estudantes de uma classe de ensino médio
apresentada na tabela abaixo.
Estaturas(cm)
150 155
155 160
160 165
165 170
170 175
175 180
xi
fi
6
9
16
5
3
1
40
Xi fi
6465
02. Calcule a média aritmética dos dados abaixo
Salários (R$)
500
xi
900 1100
1300
1300 1500
1700
1900
fi
18
31
15
3
1
1
1
70
Xi fi
59000
03. Calcule a média aritmética dos dados abaixo.
Custos (R$)
450
650
0
0
0
950 1050
0
xi
fi
8
10
11
16
13
5
1
64
Xi fi
48300
MEDIANA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES
Neste caso, o problema consiste em determinar o ponto do intervalo em que está
compreendida a mediana.
Para tanto temos que inicialmente determinar a classe na qual se acha a mediana. Tal classe
será aquela correspondente à frequência acumulada imediatamente superior a
.
A fórmula abaixo mostra como calcular a mediana de uma distribuição em intervalos d classes.
é o limite inferior da classe da mediana
é a frequência acumulada da classe anterior à classe mediana
é a frequência simples da classe mediana
h é a amplitude do intervalo da classe mediana
Exemplos:
01. Calcule a mediana da distribuição abaixo.
Estaturas (cm)
fi
fa
150 154
154 158
158 162
4
9
11
4
13
24
162 166
8
32
166 170
170 174
5
3
40
37
40
02. Calcule a mediana da distribuição
Custos (R$)
fi
8
450
10
11
650
0
16
0
13
0
5
950 1050
1
0
64
03. Calcule a mediana da distribuição.
NOTAS
fi
0
2
4
5
8
14
6
8
10
7
44
fa
fa
MODA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES
A moda é a media aritmética do limite inferior(
modal(classe que tem maior frequência)
com o limite superior
da classe
Exemplos:
01. Vamos calcular a moda da distribuição.
Estaturas (cm)
fi
150 154
154 158
158 162
4
9
11
162 166
8
166 170
170 174
5
3
40
02 Vamos calcular a moda da distribuição.
Salários (R$)
500
900 1100
1300
1300 1500
1700
1900
fi
18
31
15
3
1
1
1
70
MEDIDAS DE DISPERSÃO
As medidas de dispersão de uma distribuição são valores que indicam o grau de afastamento
dos valores da variável em relação à média.
Para qualificar os valores de uma dada variável, ressaltando a maior ou a menor dispersão ou
a variabilidade entre esses valores e a sua medida de posição, a estatística recorre às medidas
de dispersão ou coeficiente de variação.
As principais medidas de dispersão são:
 Intervalo (amplitude total)
 Desvio médio absoluto
 Variância
 Desvio padrão
 Coeficiente de variação
INTERVALO (AMPLITUDE TOTAL)
O intervalo de um grupo de números é de um modo geral, a medida mais simples de calcular e
entender. Focalizar o maior e o menor valor no conjunto (valores extremos). O intervalo pode
ser obtido de duas maneiras:
01. A diferença entre o maior e o menor valor (amplitude total).
02. O maior e o menor valor no grupo.
Exemplo: Considere os valores 1, 10, 15, 25. A diferença entre o maior valor e o menor valor é
25 – 1 = 24, que é a amplitude total. Tambem podemos dizer que o intervalo vai de 1 até 25.
DESVIO MÈDIO ABSOLUTO
O desvio médio absoluto (Dm) de uma distribuição é a média aritmética dos módulos dos
desvios (diferença entre o valor da variável e a média).
Dada a distribuição
médio é:
, os desvios são
e o desvio
ou
OBS.: Para o cálculo do desvio médio são tomados os módulos dos desvios, pois a soma dos
desvios é zero.
EXEMPLOS:
01. Calcule o desvio médio da distribuição 7
10
12
15
Solução
Primeiramente vamos calcular a média aritmética dos dados:
Ma =
Agora vamos calcular o desvio médio.
16
18
20
02. Determine o desvio médio de 2 4
6
8
10
03. Determine o desvio médio para o conjunto de valores 1
2
3
4
5.
VARIÂNCIA
A variância de uma distribuição é a média aritmética dos quadrados dos desvios. A variância
de uma amostra é representada por S² e constitui uma estimativa da variância da população.
A variância é uma medida que dá o grau de dispersão (ou concentração) de probabilidade em
torno da média.
Assim, se
, é uma amostra de n elementos da variável x, então
EXEMPLOS:
01. Determine a variância dos números
7 10 12 15 16 18 20
Solução
Vamos achar a média.
Agora a variância
02. Determine a variância da população 2
4
6
8
10
03. Determine a variância da amostra 1
3
4
3
4
2
4
1
2
2
1
0
VARIÂNCIA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE
EXEMPLOS:
01. Seja a distribuição
0
1
2
6
2
3
4
12
7
3
30
Vamos calcular a variância
02. Calcule a variância da distribuição
1
2
2
3
4
5
8
6
5
3
6
1
25
03. Calcule a variância da distribuição
2
1
3
4
5
6
7
8
3
5
8
5
4
2
VARÂNCIA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES
Onde
é a média da classe
EXEMPLOS
Calcular a variância das seguintes distribuições
01.
Estaturas (cm)
fi
150 154
154 158
158 162
4
9
11
162 166
8
166 170
170 174
5
3
40
Solução
Para o calculo da variância, devemos abrir colunas para as expressões:
e
Estaturas (cm)
150 154
154 158
158 162
152
156
160
4
9
11
-9
-5
-1
81
25
1
324
225
11
162 166
164
8
3
9
72
166 170
170 174
168
172
=161
5
3
40
7
11
49
121
245
363
1240
Logo, temos:
02.
Classes
155,5 160,5
3
160,5 165,5
7
165,5
170,5
175,5
180,5
170,5
175,5
180,5
185,5
9
13
8
5
185,5 190,5
190,5 195,5
3
2
50
DESVIO PADRÃO
É a raiz quadrada da variância.
Representamos o desvio padrão de uma amostra por S.
Desse modo se
padrão é:
é uma amostra de n elementos da variável x, então o desvio
Exemplos:
01. Determine o desvio padrão dos valores abaixo
5
10
15
20
25
Solução
Vamos calcula a media
Agora a variância
Agora o desvio padrão, que é a raiz quadrada da variância.
02. Determine o desvio padrão dos números abaixo
1 2 4 8
03. Em uma escola, a direção decidiu observar a quantidade de alunos que apresentam todas
as notas acima da média em todas as disciplinas. Para analisar melhor, a diretora Ana resolveu
montar uma tabela com a quantidade de notas “azuis” em uma amostra de quatro turmas ao
longo de um ano. Observe a seguir a tabela organizada pela diretora:
Vamos calcular o desvio padrão de cada turma.
04. O dono de uma microempresa pretende saber, em média, quantos produtos são produzidos
por cada funcionário em um dia. O chefe tem conhecimento que nem todos conseguem fazer a
mesma quantidade de peças, mas pede que seus funcionários façam um registro de sua
produção em uma semana de trabalho. Ao fim desse período, chegou-se à seguinte tabela:
Vamos determinar o desvio padrão de cada funcionário
COEFICIENTE DE VARIAÇÃO
É a relação entre o desvio padrão e a média. Geralmente é expresso em porcentagem, o que
facilita a comparação da variabilidade entre variáveis com valores em medidas diferentes.
Os coeficientes de variação podem ser considerados BAIXOS, quando são inferiores a 10%,
MÉDIOS quando de 10 a 20%, ALTOS, quando de 20 a 30% e MUITO ALTOS quando
superiores a 30%.
O coeficiente de variação é dado pela formula:
Exemplos:
01. Determine o coeficiente de variação dos valores abaixo
5
10
15
20
25
02. Determine o coeficiente de variação dos números
7 10 12 15 16 18 20
EXERCÍCIOS
1) (ENEM) Na tabela, são apresentados dados da cotação mensal do ovo extra branco vendido
no atacado, em Brasília, em reais, por caixa de 30 dúzias de ovos, em alguns meses dos anos
2007 e 2008.
De acordo com esses dados, o valor da mediana das cotações mensais do ovo extra branco
nesse período era igual a:
A) R$ 73,10.
B) R$ 81,50.
C) R$ 82,00.
D) R$ 83,00.
E) R$ 85,30.
2) (ENEM) O quadro seguinte mostra o desempenho de um time de futebol no último
campeonato. A coluna da esquerda mostra o número de gols marcados e a coluna da direita
informa em quantos jogos o time marcou aquele número de gols.
Se X, Y e Z são, respectivamente, a média, a mediana e a moda desta distribuição, então
a) X = Y < Z.
b) Z < X = Y.
c) Y < Z < X.
d) Z < X < Y.
e) Z < Y < X.
3) Uma equipe de especialistas do centro metrológico de uma cidade mediu a temperatura do
ambiente, sempre no mesmo horário, durante 15 dias intercalados, a partir do primeiro dia de
um mês. Esse tipo de procedimento é frequente, uma vez que os dados coletados servem de
referencia para estudos e verificações de tendências climáticas ao longo dos meses e anos. As
medições ocorridas nesse período estão indicadas no quadro:
Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais
a
a) 17 °C, 17 °C e 13,5 °C.
B 17 °C, 18 °C e 13,5 °C.
C 17 °C, 13,5 °C e 18 °C.
D 17 °C, 18 °C e 21,5 °C.
E 17 °C, 13,5 °C e 21,5 °C.
4) (ENEM) Depois de jogar um dado em forma de cubo e de faces numeradas de 1 a 6, por 10
vezes consecutivas, e anotar o número obtido em cada jogada, construiu-se a seguinte tabela
de distribuição de frequências.
A média, mediana e moda dessa distribuição de frequências são, respectivamente
a) 3, 2 e 1
b) 3, 3 e 1
c) 3, 4 e 2
d) 5, 4 e 2
e) 6, 2 e 4
5) (UPE SSA 3) Ao término do ano letivo, um professor de química aplicou um simulado com
50 questões, cada uma valendo um ponto, para avaliar estatisticamente o rendimento dos
estudantes de uma turma da escola onde trabalha. Os resultados de cada estudante nessa
avaliação estão descritos a seguir:
Com base nesses resultados, analise as sentenças seguintes:
Está CORRETO o que se afirma, apenas, em
a) I
b) II
c) III
d) I e II
e) II e III
6) (UPE SSA 3) Para controlar o desperdício de alimentos, o gerente do Restaurante Kilobom
anotou o peso dos pratos de 50 clientes no almoço da quarta-feira e obteve uma amostra com
os seguintes resultados aproximados, em gramas:
O valor da amplitude da amostra obtida é de
A) 720
B) 600
C) 420
D) 380
E) 120
7) (UPE SSA 2) Depois dos Estados Unidos, o Brasil é o país com maior número de pessoas
na rede social Facebook, com 49 milhões de usuários. O quadro a seguir mostra, em milhões,
o número de usuários do Facebook, de alguns países.
De acordo com esses dados, a moda, a média e a mediana de usuários do Facebook em
milhões, nesses países, são, respectivamente,
A) 49, 26 e 31
B) 35, 49 e 26
C) 35, 31 e 26
D) 26, 35 e 31
E) 26, 31 e 35
7) (UPE SSA 1) O quadro a seguir mostra o número de gols feitos na fase de classificação por
cada um dos times que participaram da Copa das Confederações no Brasil.
Considerando o número total de gols de cada país nessa fase, qual o valor da diferença entre a
mediana e a média aritmética do total de gols?
a) 0,15
b) 0,25
c) 0,35
d) 0,50
e) 0,75
8) Os salários dos funcionários de uma empresa estão distribuídos na tabela abaixo:
Salário
Freqüência
$400,00
5
$600,00
2
$1.000,00
2
$5.000,00
1
Determine o salário médio, o salário mediano e o salário modal.
9) A tabela adiante apresenta o levantamento das quantidades de peças defeituosas para cada
lote de 100 unidades fabricadas em uma linha de produção de autopeças, durante um período
de 30 dias úteis. Considerando S a série numérica de distribuição de freqüências de peças
defeituosas por lote de 100 unidades, julgue os itens abaixo.
(1) A moda da série S é 5. ( )
(2) Durante o período de levantamento desses dados, o percentual de peças defeituosas ficou,
em média, abaixo de 3,7%. ( )
(3) Os dados obtidos nos 10 primeiros dias do levantamento geram uma série numérica de
distribuição de freqüências com a mesma mediana da série S. ( )
10) Encontre a média para o salário destes funcionários.
Salários semanais para 100 operários não especializados
Salários semanais fi
xi
xi.fi
140 |-- 160
7
160 |-- 180
20
180 |-- 200
33
200 |-- 220
25
220 |-- 240
11
240 |-- 260
4
100

11)
Salários semanais para 100 operários não especializados
Salários semanais fi
xi
(xi- x )2
(xi- x )2fi
140 |-- 160
160 |-- 180
180 |-- 200
200 |-- 220
220 |-- 240
240 |-- 260

7
20
33
25
11
4
100
Encontre o desvio padrão para o salário destes funcionários.
12) Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo
necessário para realizar a auditoria de 50 balanços contábeis.
Tempo necessário para a auditoria de balanços contábeis.
Tempo de auditoria.
Nº de balanços.
(min.)
(fi)
10 |-- 20
3
20 |-- 30
5
30 |-- 40
10
40 |-- 50
12
50 |-- 60
20
Total
50
Calcular
a) a média,
b) o desvio padrão, para o tempo de auditoria necessário para esta amostra de registro.
R: a) 43,2; b)12,28.
13) Os salários semanais de 50 funcionários de um hospital, em reais, foram os seguintes:
100
104
116
120
122
126
128
128
130
134
138
140
140
146
150
150
152
156
156
156
160
160
162
162
164
170
170
176
176
176
178
180
180
184
186
186
188
190
190
192
192
194
196
196
200 216
200 218
200
210
a) Construa uma distribuição de frequências, com h = 20 e limite inferior para a primeira classe
igual a 100.
b) Quantos funcionários tem um salário semanal situado entre R$ 120,00 (inclusive) e R$
160,00 (exclusive)? 17 funcionários
c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180,00
(inclusive) e R$ 200,00 (exclusive)?26%
d) Qual o salário médio semanal destes funcionários utilizando o item a)?166,4
e) Determine o desvio padrão e o coeficiente de variação da distribuição. 28,76; 17,28%
14) Os 20 alunos de uma turma especial de Estatística obtiveram as notas abaixo.
84
88
78
80
89
94
95
83
87
91
83
92
90
92
Determine:
a) a amplitude total das notas; R. 22
b) o desvio padrão das notas; R. 6,13677
c) a variância absoluta das notas; R. 37,66
d) o coeficiente de variação; R. 0.0707
e) a proporção de alunos com notas maiores que 90; R. 0,3
77
77
81
86
90
99
15) Os dados abaixo foram colhidos de uma amostra de aves de certa espécie, onde estudouse o tempo, em dias, que os filhotes levavam para abandonar o ninho:
TEMPO
5  10
10  15
15  20
20  25
25  30
Nº DE FILHOTES
14
16
18
15
7
Determine e interprete:
a) o tempo médio; R: 16,43
b) o tempo mediano; R: 16,39
c) o tempo modal. R: 17,5
16) A poluição causada por óleo em mares e oceanos estimula o crescimento de certos tipos
de bactérias. Uma contagem de micro-organismos presentes no petróleo (número de bactérias
por 100 mililitros), em 10 porções de água do mar, indicou as seguintes medidas:
49
70
54
67
59
40
71
67
67
52
a) Determine e interprete a média, mediana e moda. R: 59,6; 63; 67
b) Calcule o desvio padrão. R: 10,48
Download

ESTATÍSTICA - Colégio Rosa Gattorno