Estatística e Probabilidade
Aula 3 – Cap 02
Estatística Descritiva
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Nesta aula...
estudaremos medidas de tendência
central, medidas de variação
e medidas de posição.
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Medidas de tendência central
Uma medida de tendência central é um valor que
representa uma entrada típica, ou central, de um conjunto
de dados.
Os três tipos de medidas de tendência central mais usadas
são:
• Média
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
• Mediana
• Moda
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Média
A média de um conjunto de dados é
a soma de toda as entradas de
dados dividida pelo números de
entradas.
Em uma população:
Em uma amostra:
f.
Pro
ly s s
A
.
Dr
a ch
m
i
te
on S
er
Dica de estudo
Símbolo
Descrição
Σ
Indica uma soma de
valores
x
Variável que representa
uma entrada de dados
N
Número de entradas em
uma população
n
Número de entradas em
uma amostra
r
μ
ma
Média de uma
i
e
t
nS
o
população
s
s
ly
ch e
r. A
D
.
xProf Média de uma amostra
Estatística e Probabilidade
Mediana
A Mediana de um conjunto de dados é o dado que fica no meio
quando as entradas são colocadas em ordem crescente ou
decrescente.
Moda
A Moda de um conjunto de dados é o dado que ocorre com maior
freqüência.
Se nenhuma entrada é repetida, o conjunto de dados não possui moda.
er
r
h
Se duas entradas ocorrem
com
freqüência
elevada
→
dados
são
e
c
h
a
ac
eim
m
t
i
S
e
t
bimodais on S
n
sso
f.
Pro
ly s s
A
.
Dr
Aly
.
r
f. D
Pro
Estatística e Probabilidade
Exemplo...
Um instrutor registra a média de faltas de seus alunos em
determinado semestre. Em uma amostra aleatória, os dados são:
2
4
2
0
40
2
4
3
6
Calcule a média, a mediana e a moda.
Média:
Mediana:
Ordene os dados.
0
2
2
2
3
4
4
6
40
er
r
h
e
c
h
a
O valor que fica
eim
mac no meio é 3, logo a mediana é 3.
t
i
S
e
t
on
nS
s
o
s
s
y
l
r. A
Alys
.
D
r
.
Moda:
ocorre
mais vezes.
r of
f. D A moda é 2, pois esse é o valor que P
Pro
Estatística e Probabilidade
Exemplo...
Em um debate político pediu-se que uma amostra dos membros do
público citasse o partido a qual eles pertenciam.
As respostas estão na Tabela abaixo:
Partido Político frequência
PT
PSDB
PMDB
Outros
Qual é a moda das
respostas?
34
56
21
9
er
r
h
e
c
h
a
ac
eim
t
A moda é aSúnica
utilizada
S
eim medida de tendência central que pode ser
t
on
n
s
o
s
s
y
l
para. descrever
dados no nível nominal de medida.
r. A
Alys
D
r
.
f
f. D
Pro
Pro
Estatística e Probabilidade
Média Ponderada
Uma média ponderada é a média de um conjunto de dados cujas
entradas tem pesos variáveis. Uma média ponderada é dada por:
( x.w)
∑
x=
∑w
Onde w é o peso de cada entrada
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Exemplo...
Você está fazendo uma disciplina na qual sua nota final é composta
por:
Fonte
f.
Pro
notas,x
Pesos, w
xw
Média dos testes
8,6
0,5
4,3
Exame no meio do
semestre
9,6
0,15
1,44
Exame final
8,2
0,2
1,64
Laboratório de
computação
9,8
0,1
0,98
Trabalho extra-classe
10,0
0,05
0,5
ly s s
A
.
Dr
her
c
a
teim
S
n
o
a ch
m
i
Σ(xw)=8,86
Σw=1
te
S
n
sso
y
l
A
r.
D
.
f
Assim, sua média ponderada para a disciplina
é
de 88,6
Pro
er
Estatística e Probabilidade
Média de uma distribuição de freqüência
A média de uma distribuição de freqüências de uma amostra é
aproximada por:
( x. f )
∑
x=
n
n=∑f
Onde x e f são os pontos médios e freqüências, respectivamente.
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Aspecto das distribuições de freqüência
As distribuições de frequência
freqüência podem ser:
Simétricas:
Uniforme:
Quando pudermos traçar uma linha
vertical pelo ponto médio do gráfico e
as duas metades forem iguais.
Quando todas as entradas, ou classes
na distribuição tiverem freqüências
iguais
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Assimétricas à direita:
Se a ‘cauda’ do gráfico se prolongar
mais para a direita, a distribuição é
chamada de assimétrica à direita.
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
Média > Mediana
Assimétricas à esquerda:
Se a ‘cauda’ do gráfico se prolongar
mais para a esquerda, a distribuição é
chamada de assimétrica à esquerda.
ss
y
l
A
r.
a ch
m
i
te
S
n
o
f. D < Mediana
Média
Pro
er
Estatística e Probabilidade
Medidas de variação
• Desvio,
• Variância e
• Desvio padrão
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Desvio populacional
O desvio de uma entrada x em um conjunto de dados de uma população
ou amostra é a diferença entre a entrada e a média (μ ou x ) do conjunto
de dados
Em uma população, o desvio de cada valor x é:
Em uma amostra, o desvio de cada valor x é:
Como a soma dos desvios de todas as entradas é igual a zero, não faz
sentido determinar a média dos desvios.
Desta maneira, você pode elevar ao quadrado cada desvio e obter a
er
r
h
média...
e
c
h
a
c
teim
ima
r.
D
.
f
Pro
Al
Ste
n
o
yss
r
D
.
f
Pro
sso
y
l
A
.
nS
Estatística e Probabilidade
Variância populacional
É a média da soma dos quadrados dos desvios de um conjunto de
dados de uma população com N entradas, ou seja
σ
2
(x − μ )
∑
=
2
N
Desvio Padrão populacional
É a raiz quadrada da variância populacional:
r
f. D
o
r
P
ss
. Aly
her
c
a
teim
S
n
o
σ= σ =
2
∑ (x − μ )
N
2
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Variância amostral
A média dos quadrados dos desvios padrão é chamada de variância
amostral. Para um conjunto de dados de uma amostra com n
entradas é:
2
s
2
(x − x )
∑
=
n −1
Uma desvantagem da variância consiste no fato de suas unidades
normalmente não terem sentido (como dólares ao quadrado, por
exemplo). Assim, pode-se retornar a unidade original dos dados
tomando sua raiz quadrada.
Desvio Padrão amostral
É a raiz quadrada da variância amostral:
r
f. D
o
r
P
ss
. Aly
her
c
a
teim
S
n
o
s= s =
2
2
(
)
x
−
x
∑
n −1
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Resumindo...
Para obter a variância e o desvio padrão
1. Obtenha a média do conjunto de
dados
2. Obtenha o desvio de cada entrada
3. Eleve ao quadrado cada desvio
4. Some os resultados para obter a
soma dos quadrados
5. Divida por (n – 1) para obter a
variância
her
c
a
6. DetermineStaeim
raiz quadrada da
n
so para obter o desvio padrão
s
variância
y
l
r. A
D
.
f
Pro
x
∑
x=
n
x= x−x
(x − x)
2
∑(x − x )
2
s2 =
2
(
)
x
−
x
∑
n −1
ss
y
l
A
s = Drs. =
f.
Pro
2
her
c
a
eim 2
t
S
on ( x − x )
∑
n −1
Estatística e Probabilidade
Existe ainda...
Desvio Padrão para dados agrupados
Grandes conjuntos de dados são normalmente mais bem representados
por uma distribuição de freqüência.
A fórmula para o desvio padrão da amostra de uma distribuição de
freqüência é
s=
2
(
)
x
−
x
f
∑
n −1
na qual n=Σf é o número de entradas no conjunto de dados.
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Estatística e Probabilidade
Medidas de Posição
São utilizadas para identificar a posição de uma entrada dentro de um
conjunto de dados. Quartis, por exemplo, são números que dividem
em partes iguais um conjunto de dados ordenados.
Definição:
Os três quartis Q1, Q2 e Q3 dividem aproximadamente um conjunto
ordenado de dados em quatro partes.
• 1/4 dos dados ficam dentro ou abaixo do primeiro quartil
• metade dos dados ficam dentro ou abaixo do segundo quartil (é
er
igual a mediana do
conjunto
de dados)
r
h
e
c
h
a
eim
mac
t
i
S
e
t
on
nS
s
o
s
s
y
l
• ¾ Ados
dados
ficam
dentro
ou
abaixo
de
terceiro
quartil
ly s
r. A
.
D
r
.
f
f. D
Pro
Pro
Estatística e Probabilidade
Exemplo:
A pontuação nos testes de 15 empregados envolvidos em um
curso de treinamento estão dispostos abaixo. Obtenha Q1, Q2 e
Q3.
13
9
18
15
14
21
7
10
11
Metade inferior
5
7
9
10
11
13
Q1
her
c
Q1 = Mediana dos dados
a
teim
S
n
abaixo
de
Q2
so
s
y
l
r. A
D
.
f
Pro
20
5
18
37
16
17
21
37
Metade superior
14
15
16
Q2
Q2 = Mediana
17
18
18
20
Q3
a ch
Q3 = Mediana dos dados
m
i
te
S
n
acima de lQ2
sso
y
A
r.
D
.
f
Pro
er
Estatística e Probabilidade
Amplitude interquartil (AIQ)
A amplitude interquartil (AIQ) de um conjunto de dados é a diferença
entre o primeiro e o terceiro quartis.
Amplitude interquartil (AIQ)= Q3 – Q1
A AIQ é uma medida da variação que fornece uma idéia de quanto os
50% médios dos dados variam.
(AIQ)= Q3 – Q1 = 18-10 = 8
(as pontuações no teste na metade do conjunto de dados varia em 8 pontos)
A AIQ também serve para identificar dados estranhos (discrepantes).
Qualquer valor acima de 1,5 AIQ à esquerda de Q1 ou a direita de Q3
er
r
h
e
c
é estranho.
h
a
eim
mac
t
i
S
e
t
on
nS
s
o
s
s
y
l
No rexemplo
anterior, 37 é um dado estranho as pontuações.
r. A
Alys
.
D
.
f
f. D
Pro
Pro
Estatística e Probabilidade
Outras medidas de posição...
• Decis → Divide o conjunto de dados em dez partes
iguais (D1, D2, D3.......D9)
• Percis → Divide o conjunto de dados em cem partes
iguais (P1, P2, P3.......P99)
f.
Pro
Dr
ss
. Aly
her
c
a
teim
S
n
o
f.
Pro
D
ss
y
l
A
r.
a ch
m
i
te
S
n
o
er
Download

Aula 3 - gpcmb-ufma