Estatística e Probabilidade
Aula 2 – Cap 02
Estatística Descritiva
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Neste capítulo...
estudaremos formas de organizar e
descrever conjuntos de dados. O objetivo
é tornar os dados mais compreensíveis
de modo a enxergar neles tendências,
médias e variações.
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Dados etários da população de
Akhiok-Alasca
0
1
1
1
2
2
2
3
3
4
4
4
5
5
5
6
6
6
6
7
7
8
8
9
10 10 10 11 11 11
12
12
13
15 16 16 17 17
21 21 22 23 24 25 25
26
27
27
28 28 29 30 31
31 32 32 33 33 34 36
39
41
42
45 46 47 48 49
50 50 51 52 53 54 55
56
63
er
r
h
e
c
h
a
eim
mac
t
i
S
e
t
on
Sem uma
n Smaneira de organizar estes dados é difícil enxergarlypadrões.
s
o
s
s
r. A
Alys
.
D
r
.
f
f. D
Pro
Pro
Estatística e Probabilidade
Distribuição de freqüência e seus gráficos
Distribuição de freqüências é uma tabela que mostra
classes ou intervalo de entrada de dados com um número
total de entradas em cada classe. A freqüência f de uma
classe é o número de entrada de dados na classe.
Classe
Frequência, f
1-5
5
6-10
8
11-15
6
16-20
8
21-25
ss
26-30
. Aly
r
f. D
o
r
P
a5ch
m
i
te
on S
4
er
As
classes
possuem
amplitudes iguais e cada
classe
possui
um
limite inferior da classe, que
é menor número que pode
pertencer à classe, e o
limite superior que é o maior
her
c
a
eim
t
S
número que pode yspertencer
so n
l
r. A
D
a classe.
.
f
Pro
Estatística e Probabilidade
Amplitude das classes: Distância
entre
os
limites
inferiores
(ou superiores) de classes consecutivas.
Amplitude total: Diferença entre o máximo e o mínimo das entradas.
Classe Frequência,f
1-5
5
6-10
8
11-15
6
16-20
8
her
c
a
21-25 n Steim 5
so
s
y
l
r. A
D
26-30
4
.
f
Pro
Amplitude das classes:
6-1=5
Amplitude total:
30 - 1 = 29
a ch
m
i
te
S
n
o
er
ss
y
l
O número de classes
deve
A
.
r
D
rof.
estar Pentre
5 e 20.
Estatística e Probabilidade
Exemplo:
Minutos/mês gastos na internet para 30 assinantes
102
71
103
105
109
124
104
116
97
99
108
112
85
107
105
86
118
122
67
99
103
87
87
78
101
82
95
100
125
92
Faça uma tabela de distribuição de freqüência com
5 classes.
f.
Pro
D
her
c
a
teim
S
n
Valores-chave:
so
s
y
l
r. A
Valor mínimo =
Valor máximo =
67 s
ly s
A
.
r
125
D
rof.
P
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Como construir uma distribuição de frequências
1. Decida o número de classes, que deve ficar entre 5 e 20.
(Para este problema use 5.)
2. Calcule a amplitude das classes.
Primeiro calcule: amplitude total = valor máximo – mínimo. Em seguida,
divida o resultado pelo número de classes. Por fim, arredonde até o
próximo número conveniente. (125 – 67)/5 = 11,6 (arredondado para 12)
3. Calcule os limites das classes.
O limite inferior da classe é o valor mais baixo que pertence a ela e o
limite superior é o mais alto. Use o valor mínimo (67) como limite inferior
da primeira classe.
er
r
h
e
c
h
a
c cada entrada de dado na classe apropriada. teim
4. Marque um risco
m|aem
i
e
t
nS
S
o
n
s
o
s
ly
Quando
osr. A
riscos
em cada
lyss todos os valores estiverem marcados, conte D
A
.
r
.
f
f. D
Pro
Pro classe para determinar a freqüência dessa classe.
Estatística e Probabilidade
Mínimo = 67, Máximo = 125
Número de classes = 5
Amplitude de classe = 12
Classe
67 - 78
79 - 90
91 - 102
103 - 113
115 - 126
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
Riscos
Freqüência
|||
3
||||
5
|||| |||
8
|||| ||||
9
||||
5
.D
ss
y
l
A
r.
f
Dica: Faça primeiro todos os limites
Proinferiores.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Definições importantes
Ponto médio de uma classe: é a caracteristica de uma classe. É a metade da
soma entre os limites inferior e superior da classe
(limite inferior + limite superior) / 2
Freqüência relativa de uma classe: é a porção ou porcentagem dos dados
que entra nessa classe.
frel = (freqüência da classe) / (tamanho da amostra n)
Freqüência cumulativa
er
rde uma classe: é a soma da frequencia daquela
h
e
c
h
a
ac
im
eda
t
classe com a deStodas
S
eim as classes anteriores. A frequencia cumulativa
t
on
n
s
o
s
s
y
l
s
A
última classe
. Aly é igual ao tamanho da amostra n.
Dr .
f.
Pro
Dr
f.
Pro
Estatística e Probabilidade
Definições importantes
Tabela: possibilidade de identificar padrões
Classe
f
Ponto médio
(67 + 78)/2
Freqüência
relativa ( f / n)
Freqüência
cumulativa
67-78
3
72,5
(3 / 30) = 0,10
3
79-90
5
84,5
(5 / 30) = 0,17
8
91-102
8
96,5
0,27
16
103-113
9
108
0,30
25
115-126
5
120,5
0,17
30
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Gráficos das distribuições
de freqüência
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Histograma de freqüência
é um gráfico de barras que representa a distribuição de freqüência de um
conjunto de dados. Um histograma possui as seguintes propriedades:
1 – A escala horizontal é quantitativa
2 – A escala vertical mede as freqüências das classes
3 – Barras consecutivas devem estar encostadas umas as outras
Como as barras de freqüência devem se encostar elas começam e
terminam na fronteira das classes, e não nos limites das classes.
Fronteira das classes são os números que separam as classes sem deixar
er
uma falha entre elas.
r
h
e
c
h
a
c
f.
Pro
Dr
ss
. Aly
ma
i
e
t
on S
f.
Pro
D
ss
y
l
A
r.
eim
t
S
on
Estatística e Probabilidade
Para determinar a fronteira de classe encontre a média do valor entre o
limite inferior da segunda classe e o limite superior da primeira classe.
Subtraia este valor da fronteira inferior da primeira classe e some ao valor
superior da primeira classe e assim sucessivamente para as outras classes.
(79 – 78) / 2 = 0,5
Classe
f
Fronteiras
67-78
3
66,5–78,5
Tempo na internet
9
9
8
8
7
79-90
91-102
78,5–90,5
5
90,5–102,5
8
103-113
9
115-126
5n Steim 114,5–126,5
r
f. D
o
r
P
so
s
y
l
.A
102,5–114,5
a
r
ch e
6
5
5
5
4
3
3
2
a ch
m
i
te
S
n
o
1
0
66,5
er
ss
y
l
A
78,5
90,5
r. 102,5 114,5 126,5
D
.
f
Pro minutos
Estatística e Probabilidade
Polígono de freqüência
é um gráfico em forma de linha que enfatiza a mudança contínua nas
freqüências.
Para traçar um polígono de freqüência marque o ponto médio no topo de cada barra.
Conecte os pontos médios consecutivos. Estenda o polígono até os eixos.
9
9
8
8
Tempo na internet
7
6
5
5
4
3
5
3
2
1
r.
D
.
f
Pro
Al
her
c
0
a
teim
S
n
72,5
84,5
ysso
96,5
108,5
minutos
ss
120,5
y
l
A
r.
D
.
f
Pro
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Histograma de freqüência relativa
Freqüência relativa
Apresenta em sua escala vertical as freqüências relativas.
f.
Pro
Dr
ss
. Aly
Tempo na internet
0,30
0,30
0,27
0,20
0,10
her
c
a
teim
S
n
o
0
0,17
0,17
0,10
66,5
78,5
90,5
102,5 114,5 126,5
minutos
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Gráfico de freqüência cumulativa
Freqüência cumulativa
Um gráfico de freqüência cumulativa (ou ogiva) mostra o número de
valores, em um conjunto de dados, que são iguais ou inferiores a um
dado valor x.
f.
Pro
Dr
ss
. Aly
Tempo na internet
30
30
25
20
16
10
8
3
0
ma
i
e
t
on S
0
r
ch e
66,5
78,5
90,5
102,5
minutos
114,5
f.
Pro
126,5
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Mais gráficos e representações
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Diagrama de tronco e folhas
é similar ao histograma, mas com a vantagem de que o gráfico ainda
contém os valores dos dados originais.
102
71
103
105
109
124
104
116
97
99
108
112
85
107
105
86
118
122
67
99
103
87
87
78
101
82
95
100
125
92
Se o valor mais baixo é 67 e o mais alto é 125,
o tronco vai de 6 a 12.
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Diagrama de tronco e folhas
102
71
103
105
109
tronco
f.
Pro
D
on
s
s
y
l
r. A
124
104
116
97
99
108
112
87
107
105
6 |7
7 |18
8 |25677
9 |25799
10 | 0 1 2 3 3 4 5 5 7 8 9
11 | 2 6 8r
he
c
a
|245
teim
S12
82
118
122
67
99
103
86
87
78
101
85
95
100
125
92
Chave: 6|7 significa 67
folhas
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Diagrama de tronco e folhas – 2 linhas/tronco
Chave: 6|7 significa 67
Dígitos da 1a linha 0 1 2 3 4
Dígitos da 2a linha 5 6 7 8 9
er
h
c
a
im 1a linha 0 1 2 3 4
Dígitos
da
e
t
S
on
s
s
y
. AlDígitos da 2a linha 5 6 7 8 9
r
D
f.
Pro
6|
6|7
7|1
7|8
8|2
8|5677
9|2
9|5799
10 | 0 1 2 3 3 4
10 | 5 5 7 8 9
11 | 2
11 | 6 8
her
c
a
12 | 2 4 on Steim
ss
y
l
A
Dr . | 5
. 12
f
Pro
Estatística e Probabilidade
Plote de pontos
Em um plote de pontos cada entrada é desenhada, usando um ponto ●
sobre um eixo horizontal.
minutos/mês na Internet
66
76
86
96
106
116
126
minutos
r
Um plote dempontos
che permite que se veja como os dados estão teimach
a
tei e se determinem entradas específicas de dados.
nS
S
o
distribuídos
n
s
o
s
ly
ss
Aly
.
r
f. D
Pro
r
D
.
f
Pro
.A
er
Estatística e Probabilidade
Diagrama de Pizza
tem a forma de um círculo que mostra as relações das partes como um
todo.
Para encontrar o angulo central para uma entrada de dados multiplique
3600 pela frequência relativa da entrada de dados.
Exemplo
O orçamento da Nasa (em bilhões de dólares) dividido em
três categorias
Bilhões de US$
Vôo espacial humano
Tecnologia
her
c
Apoio às missões
a
teim
5,7
5,9
2,7
a ch
m
i
te
S
n
o
nS
o
ss
s
y
l
s
A
y
r. dados.
Construa um diagrama de pizza para esses
. Al
D
r
.
f
D
f.
Pro
Pro
er
Estatística e Probabilidade
Bilhões de US$
Vôo espacial humano
Tecnologia
Apoio às missões
Apoio às
missões
19%
Total
5,7
5,9
2,7
14,3
Graus
143
149
68
360
5,7
14,3
5,9
14,3
her
c
a
teim
S
n
Tecnologia
so
s
y
l
A
r.41%
D
.
f
Pro
Vôo espacial
humano
40%
Orçamento da Nasa
er
a ch
eim
t
S
on
(em bilhões
lyss de dólares)
r
D
.
f
Pro
.A
Estatística e Probabilidade
Diagrama de Pareto
é um gráfico de dados qualitativos no qual a altura de cada barra
representa a freqüência ou a freqüência relativa. É frequentemente
usado no contexto de negócios.
Exemplo: Recentemente uma industria varejista perdeu 45 milhões de
dólares de seus ativos. Os dados das perdas são mostrados na tabela
abaixo:
Se você fosse o varejista qual causa
escolheria para atacar primeiro?
administrativas
furtos de
funcionários
assaltos a lojas teima
S
so n
fraudes
Alys nas
.
r
f. D vendas
Pro
7,8
15,6
r
ch e
14,7
18
16
Milhões de dólares
Causas
Valores (em
milhões)
14
12
10
8
6
4
2
0
administrativas
2,9
furtos de
funcionários
nas
ss fraudes
y
l
A
vendas
r.
assaltos a
lojas
D
rof.
PCausas
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Gráficos de conjuntos de dados
emparelhados
Se dois conjuntos de dados têm o mesmo número de entradas e cada
entrada do primeiro corresponde a uma entrada do segundo, eles são
chamados de conjuntos de dados emparelhados.
Uma maneira de fazer o gráfico de dados emparelhados é usar um
mapa de dispersão.
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Mapa de Dispersão
é um plote dos pares (x,y) de dados sendo a horizontal o eixo x e a
vertical o eixo y.
Exemplo:
Na tabela abaixo temos a duração do vínculo empregatício e o salário
anual correspondente de dez trabalhadores
5
32000
4
32500
8
40000
4
27350
2
25000
10
43000
7
her
c
a
39225
teim
S
n
o
6
r
f. D
o
r
P
.
Salário (R$)
s
Al9ys
3
41650
45100
28000
45000
salario (em reais)
Permanência no
emprego (anos)
40000
35000
30000
25000
a ch
m
i
te
S
n
o
10
ss8
y
l
A
r.
D
.
f
Permanência
no
emprego (anos)
Pro
2
4
6
er
Estatística e Probabilidade
Gráfico da série temporal
é um plote de um conjunto de entradas de dados tomadas a intervalos
regulares durante um período de tempo.
Exemplo:
Na tabela ao lado, número de
assinantes de telefones celulares em milhões e
o valor médio da conta mensal local.
Assinantes (em milhoes)
100
80
60
40
20
r
f. D
o
r
P
her
c
a
teim
S
n
o
s
Alys1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
. 1987
0
Anos
Ano
Assinantes
(em milhões)
Conta média
(em reais)
1987
1.2
96.83
1988
2.1
98.02
1989
3.5
89.3
1990
5.3
80.9
1991
7.6
72.74
1992
11
68.68
1993
16
61.48
1994
24.1
56.21
1995
33.8
51
1996
44
1997
55.3
1998
f. D
Pro
1999
ss
y
l
A
r. 69.2
86
r
47.7
ch e
ma
i
e
t
on S 42.78
39.43
41.24
Download

Aula 2 - gpcmb-ufma