Introdução à Estatística
Análise de Dados
O que é estatística...
... É uma área da Matemática que trabalha com
a coleta de informações, bem como a sua
organização e análise. Com a análise dos dados
coletados, pode-se tomar decisões e realizar
planejamentos com mais segurança.
Conceitos básicos
População: todos os elementos de um conjunto
que têm pelo menos uma característica em
comum.
Amostra: é um subconjunto formado por
elementos extraídos de uma dada população.
Variável: característica
população.
estudada
de
uma
Conceitos básicos
Variável
Quantitativa
Discreta
Contínua
Qualitativa
Conceitos básicos
Quantitativa discreta: expressa por um número
inteiro. Por exemplo, número de irmãos,
quantidade de computadores, número de
animais.
Quantitativa contínua: expressa por um número
real e proveniente de uma medida. Por exemplo,
massa, idade, altura, temperatura, volume.
Exercício
Pag. 398
1) Identifique as variáveis e classifique-as em quantitativa
discreta, quantitativa contínua ou qualitativa.
a) Classificação das colunas de um jornal, por seu editor,
como excelentes, boas ou ruins.
b) Os números de telefone de uma lista telefônica.
c) Grau de escolaridade dos governantes dos estados
brasileiros.
d) Vendas anuais de uma empresa do setor da telefonia
celular.
e) Marcas de desodorante.
Distribuição de frequências
Frequência absoluta: quantidade de vezes que o
valor de uma variável é citado.
Frequência Relativa: razão entre a frequência
absoluta e o número total de observações.
Representada
também
na
forma
de
porcentagem.
Distribuição de frequências
Frequência absoluta acumulada: soma das
frequências absolutas, até determinado dado.
Frequência relativa acumulada: soma das
frequências
relativas
acumuladas,
até
determinado dado. Corresponde à proporção da
frequência acumulada em relação ao total da
tabela.
Exemplo
Preço (R$)
Frequência absoluta
Frequência relativa (%)
Frequência absoluta
acumulada
fr
fi
2.000
6
30 %
2.500
x
2.600
Total
Frequência relativa
acumulada (%)
Fi
Fr
6
30%
y
10=6+4
50%=30%+20%
10
w
z
k
20
100%
20
100%
Exercício
Pag. 400
6) Os conceitos dos alunos de uma turma de
pós-graduação em Administração de Empresas
foram os seguintes:
a) Construa uma tabela com todas
as frequências.
CABCABC
AEDCACE
BBDECDB
CDCBDEC
CBBCACA
Exercício
Nota
Frequência absoluta
fi
A
B
C
D
E
Total
Frequência relativa (%)
fr
Frequência absoluta
acumulada
Fi
Frequência relativa
acumulada (%)
Fr
Exercício
Nota
A
B
C
D
E
Total
Frequência absoluta
Frequência relativa (%)
fi
fr
6
8
12
4
5
35
17,14 %
22,85 %
34,28%
11,42%
14,31%
100%
Frequência absoluta
acumulada
Frequência relativa
acumulada (%)
Fr
Fi
6
14
26
30
35
35
17,41%
39,99%
74,27%
85,69%
100%
100%
Exercício
b) Quantos alunos obtiveram nota A?
c) Sabendo que a média de aprovação é o conceito C, quantos
alunos estão reprovados?
d) Qual é a porcentagem de alunos que obtiveram conceito C?
e) Qual é a porcentagem de alunos que obtiveram conceitos D
ou E?
f) Qual é a porcentagem de alunos que obtiveram conceitos A
ou b?
Distribuição de frequências para
dados agrupados por intervalos
As vezes a quantidade de medidas ou
observações feitas é muito grande, ficando difícil
a interpretação dos dados. A solução é agrupálos em intervalos de classes, ou simplesmente
classes
Distribuição de frequências para
dados agrupados por intervalos
Como determinar os intervalos de classe?
1 – Calcular a diferença entre o maior e o menor dado
indicado, obtendo o que chamamos de amplitude .
2 – Escolher um número conveniente maior ou igual o
número da amplitude, dividir pelo número de intervalos
que desejamos, obtendo a amplitude de cada intervalo.
3 – A partir do menor valor some a amplitude do
intervalo e encontre cada classe.
Distribuição de frequências para
dados agrupados por intervalos
É importante salientar que a escolha da
amplitude de classe depende do bom senso. Se
os intervalos forem muito pequenos, teremos
um número muito grande deles, e isso pode
significar que os dados não foram resumidos. Se
forem muito grandes, pode significar que houve
excessiva perda de informações.
Exercício
Pag. 402
8) Observe as diárias de um grande hotel:
Diária (R$)
Número de apartamentos
[150, 180[
3
[180, 210[
8
[210, 240[
10
[240, 270[
13
[270, 300[
33
[300, 330[
40
[330, 360[
35
[360, 390[
30
[390, 420[
16
[420, 450[
12
Total
200
Exercício
Complete a tabela com as frequências: absoluta
acumulada, relativa e relativa acumulada.
Diária (R$)
Número de apartamentos
[150, 180[
3
[180, 210[
8
[210, 240[
10
[240, 270[
13
[270, 300[
33
[300, 330[
40
[330, 360[
35
[360, 390[
30
[390, 420[
16
[420, 450[
12
Total
200
Frequência relativa
Frequência Absoluta
acumulada
Frequência relativa
acumulada
Exercício
Diária (R$)
[150, 180[
[180, 210[
[210, 240[
[240, 270[
[270, 300[
[300, 330[
[330, 360[
[360, 390[
[390, 420[
[420, 450[
Total
Número de apartamentos Frequência relativa
3
8
10
13
33
40
35
30
16
12
200
0,015
0,04
0,05
0,065
0,165
0,2
0,175
0,15
0,08
0,06
1
Frequência Absoluta
acumulada
3
11
21
34
67
107
142
172
188
200
200
Frequência relativa
acumulada
0,015
0,055
0,105
0,170
0,335
0,535
0,71
0,86
0,94
1
1
Exercício
a) Qual é o extremo inferior da 6ª classe?
b) Que intervalo apresenta as diárias mais comuns?
c) Qual é a porcentagem de apartamentos cujas diárias são
menores que R$ 270,00?
d) Quantos apartamentos têm diárias menores que R$
390,00?
e) Quantos apartamentos têm diárias a partir de RS 390,00?
Representações Gráficas
Série 3
Série 2
Categ…
Categ…
Categ…
Categ…
15
10
5
0
Série 1
Categoria 1
Série 3
Série 2
Série 1
Vendas
5
0
15
10
5
0
Série 1
Série…
Série 2
Série 3
1º Tri
2º Tri
3º Tri
4º Tri
Representações Gráficas
Gráfico de colunas
O gráfico de colunas apresentam os dados
por meio de colunas (retângulos) dispostas em
posição vertical. A altura de cada coluna
equivale à frequência (absoluta ou relativa) dos
valores observados.
Representações Gráficas
Representações Gráficas
Gráfico de barras
Esse tipo de gráfico utiliza as barras
(retângulos) dispostas em posição horizontal. Os
comprimentos das barras correspondem à
frequência (absoluta ou relativa) dos valores
observados.
Representações Gráficas
Representações Gráficas
Gráfico de segmentos
Conhecido também como gráfico de linha
é bastante utilizado para representar duas
grandezas que se relacionam. Para sua
construção, adotamos um referencial parecido
ao plano cartesiano. Marcamos os pontos e em
seguida os unimos por meio de segmento de
reta.
Representações Gráficas
Representações Gráficas
Gráfico de setores
Os gráficos de setores apresentam os
dados por meio de um círculo, no qual cada
setor indica a quantidade (ou frequência
relativa) de um valor observado.
Obs: A área e o ângulo de cada setor são
diretamente proporcionais à porcentagem que
representam em relação ao todo.
Representações Gráficas
Representações Gráficas
Gráficos múltiplos
Quando
é
necessário
representar
simultaneamente duas ou mais características
de uma amostra pode-se construir gráficos
múltiplos.
Representações Gráficas
Histograma
O histograma é um gráfico formado por
retângulos cujas bases são construídas
sobre o eixo das abscissas. As larguras
correspondem à amplitude de cada
intervalo e as alturas indicam a frequência
(absoluta ou relativa) de cada intervalo.
Histograma
Exemplo:
Em um concurso público realizado pela
prefeitura de certo município, 200 candidatos
foram submetidos a uma prova escrita. A
distribuição de frequência segundo as notas
obtidas pelos candidatos está representada na
tabela a seguir.
Histograma
Histograma
Histograma
Polígono de Frequências
Os dados de uma tabela de
frequências
também
podem
ser
representados por um tipo de gráfico
denominado polígono de frequências.
Polígono de Frequências
Polígono de Frequências
Note que o polígono de frequências foi
obtido ligando-se, por meio de segmentos de
reta, os pontos médios das bases superiores das
barras do histograma. Cada um desses pontos
representa a média do intervalo de classe
correspondente. Além disso, note que foram
utilizados pontos equidistantes correspondentes
à média de uma classe imediatamente inferior e
de uma classe imediatamente superior.
Medidas estatísticas
As medidas estatísticas que descrevem a
tendência que os dados têm de agrupamento
em torno de certos valores recebem o nome de
medidas de tendência central.
Média Aritmética
Exercício
Média Aritmética Ponderada
Exercício
Moda
Indicaremos por moda (Mo), o número
que aparecer em maior quantidade de vezes no
conjunto de valores observados.
Exercício
Mediana
A mediana (Md) é um valor que divide um
conjunto de dados ordenados em dois grupos
com o mesmo número de valores: um grupo
terá valores menores ou iguais à mediana e o
outro grupo terá valores maiores ou iguais a ela.
Mediana
Exemplo : Quantidade ímpar de valores
Mediana
Exemplo : Quantidade par de observações
Exercício
Download

Introdução à Estatística