Medidas descritivas
Medidas de dispersão para amostras
A amplitude (R)
A amplitude é a diferença entre o maior e o menor valor de uma
amostra de dados.
Ex. dois alunos fizeram, cada um, quatro provas e obtiveram as
notas apresentadas na tabela abaixo.
Aluno
Pedro
Paulo
Notas
4
9
6
1
4
5
6
5
É fácil ver que as notas obtidas pelo primeiro aluno são mais
próximas entre si do que as notas obtidas pelo segundo aluno.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
1
Medidas descritivas
Medidas de dispersão para amostras
Amplitude
Então, as notas obtidas pelo primeiro aluno têm menor dispersão.
Dentre as formas existentes para medir a dispersão de dados
numéricos a amplitude é a mais fácil de calcular.
Entretanto ela poderá não medir bem a dispersão. Dois conjuntos de
números podem ter dispersão diferentes e apresentar a mesma
amplitude. Ver tabela abaixo:
Aluno
Paulo
José
Notas
9
9
1
1
5
1
5
9
A amplitude das notas é a mesma para os dois alunos, mas as notas
de José têm maior dispersão.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
2
Medidas descritivas
Medidas de dispersão para amostras
A variância
Por definição, o desvio em relação à média é a diferença entre o valor
observado e a média do conjunto.
Para medir o grau de dispersão de um conjunto de dados, é preciso
considerar todos os desvios. Mas não se pode usar a soma dos desvios
como medida de dispersão porque esta soma é sempre igual a zero.
Como exemplo, observe os dados apresentados na tabela abaixo –
notas do aluno Carlos, em quatro provas:
05/11/2015 20:58
Prova
Notas
1ª
2ª
3ª
4ª
9
1
2
8
Prof. Alexandre José de Oliveira
3
Medidas descritivas
Medidas de dispersão para amostras
A variância
Os desvios das notas em relação à média são:
9-5= 4
1-5= -4
2-5= -3
8-5= 3
Qualquer que seja o conjunto de dados, a soma dos desvios em
relação a média é sempre igual a zero porque valores positivos e
negativos se anulam. Por esta razão, não tem sentido propor a
média dos desvios com medida de dispersão. No entanto, se os
sinais forem eliminados, os desvios podem ser usados para
construir uma medida de dispersão.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
4
Medidas descritivas
Medidas de dispersão para amostras
A variância
Para eliminar os sinais negativos, eleva-se cada desvio ao
quadrado. Depois, somam-se os quadrados. Como os
quadrados de números negativos são positivos, toda soma de
quadrados é positiva ou, no mínimo, nula (quando todos os
desvios são iguais a zero).
Entretanto, como a soma de quadrados dos desvios aumenta
quando aumenta o número de dados – mesmo que a
dispersão se mantenha constante – por uma razão óbvia: o
número de parcelas somadas aumenta.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
5
Medidas descritivas
Medidas de dispersão para amostras
A variância
Para medir a dispersão dos dados em torno da média usa-se, então,
a variância, que leva em consideração o número de dados. A
variância pode ser definida como a soma dos quadrados dos
desvios, dividida por n. Indica-se a variância obtida dessa forma por
(lê-se sigma estimado ao quadrado), isto é:
Então, a variância é definida pela soma de quadrados dos desvios,
dividida pelo número de dados menos 1, isto é, por n – 1 . Os
estatísticos chamam o valor n – 1 de número de graus de liberdade.
A variância, obtida por essa nova definição, é indicada por S2.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
6
Medidas descritivas
Medidas de dispersão para amostras
A variância
Escreve-se:
ou,
Embora pareça mais complicado, essa segunda fórmula
permite que o cálculo da variância seja feito com menor
número de operações aritméticas.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
7
Medidas descritivas
Medidas de dispersão para amostras
A variância
Exemplo. São dados os valores 0, 1, 2, 3 e 4. Para calcular a variância, aplicando
a primeira fórmula, é preciso obter a média dos dados:
xbarra= (0+1+2+3+4)/5= 2
Em seguida calcula-se
x
x - xbarra
(x-xbarra)2
0
1
2
3
4
0-2=-2
1-2=-1
2-2=0
3-2=1
4-2=2
4
1
0
1
4
10
0
10
Agora, fica fácil obter:
S2=∑(x-xbarra)2/n-1 = 10/4 = 2,5
05/11/2015 20:58
Prof. Alexandre José de Oliveira
8
Medidas descritivas
Medidas de dispersão para amostras
A variância
Para calcular a variância dos mesmos dados usando a segunda
fórmula, são necessários apenas os cálculos intermediários
apresentados na tabela abaixo
x
x2
0
1
2
3
4
0
1
4
9
16
10
30
A variância é:
S2=∑ x2-((∑x)2/n)/n-1 = (30-((10)2/5))/4 = 2,5
05/11/2015 20:58
Prof. Alexandre José de Oliveira
9
Medidas descritivas
Medidas de dispersão para amostras
O desvio padrão
Como medida de dispersão, a variância tem a desvantagem de
apresentar unidade de medida igual ao quadrado da unidade de
medida dos dados. Qualquer que seja a unidade de medida dos
dados originais, a variância os expressará elevado ao quadrado. Isso
acontece porque a variância é obtida a partir de uma soma de
quadrados dos desvios.
Foi então proposta uma medida de dispersão associada a variância,
mas com a mesma unidade de medida dos dados. É o desvio
padrão. Por definição, o desvio padrão é a raiz quadrada da
variância, com sinal positivo. Representa-se por s.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
10
Medidas descritivas
Medidas de dispersão para amostras
O desvio padrão
Para os dados do último exemplo, ou seja: 0, 1, 2, 3, 4, obteve-se a
variância de S2=2,5. Para esses dados, o desvio padrão é igual a:
s=√2,5 = 1,58
Como o que nos interessa são as medidas de dispersão, o desvio
padrão mede bem a dispersão e apresenta os resultados na mesma
unidade de medida do conjunto dos dados. De outra forma, quando
há maior dispersão em um conjunto de dados, maior será o valor do
desvio padrão e vice-versa. Ainda, o desvio padrão não reflete a
magnitude dos dados amostrais, reflete apenas a dispersão em torno da
média.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
11
Medidas descritivas
Medidas de dispersão para amostras
O desvio padrão
Ex.
a)As notas de Pedro têm menor dispersão e o menor desvio padrão
b)As notas de Paulo têm dispersão maior do que as notas de Pedro; o
desvio padrão de Paulo é maior do que o desvio padrão de Pedro
c)As notas de Carlos têm a maior dispersão e o maior desvio padrão
05/11/2015 20:58
Prof. Alexandre José de Oliveira
12
Medidas descritivas
Medidas de dispersão para amostras
O desvio padrão
Outra forma de calcular o desvio padrão, desde que a variável
tenha distribuição normal, é por meio da seguinte fórmula
onde R é a amplitude e o valor de d2, que depende do
tamanho da amostra, é encontrado na Tabela 2 do apêndice.
Este método de calcular o desvio padrão fornece boas
estimativas para amostras de pequeno tamanho (n = 4, 5 ou
6), mas perde a eficiência se n > 10.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
13
Medidas descritivas
Medidas de dispersão para amostras
O desvio padrão
A utilização da amplitude para estimar σ data dos primeiros
dias do controle estatístico da qualidade e era popular por sua
facilidade de cálculo. Com o advento dos computadores e
calculadoras, esta não é mais uma consideração importante.
Em geral o “estimador quadrático” baseado em S é preferível.
No entanto se o tamanho de n da amostra é relativamente
pequeno, o método da amplitude funciona bastante bem. A
eficiência relativa do método da amplitude comparada com S
é exibida a seguir para diferentes tamanhos de amostra:
05/11/2015 20:58
Prof. Alexandre José de Oliveira
14
Medidas descritivas
Medidas de dispersão para amostras
O desvio padrão
Tamanho da Amostra n
Eficiência relativa
2
1,000
3
0,992
4
0,975
5
0,955
6
0,930
10
0,850
Para valores moderados de n – digamos, n ≥ 10 – o método da
amplitude perde eficiência rapidamente, uma vez que ele ignora toda
a informação da amostra compreendida entre os dois valores
extremos.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
15
Medidas descritivas
Medidas de dispersão para amostras
Erro padrão da média
Por definição, erro padrão da média é a raiz quadrada, com
sinal positivo, de s2xbarra, isto é:
O erro padrão da média é igual ao desvio padrão dividido
pela raiz quadrada do tamanho da amostra.
O erro padrão da média é uma medida de dispersão das
médias de todas as amostras possíveis (que, na prática, são
desconhecidas) em torno da média da população (que, na
prática, também é desconhecida).
05/11/2015 20:58
Prof. Alexandre José de Oliveira
16
Medidas descritivas
Medidas de dispersão para amostras
Exercício
Você foi contratado para gerenciar a produção em uma indústria de
biscoitos. Como você ainda não conhece bem o processo, e o produto,
você realizou testes sobre quantidade de açúcar (em grs./100 grs. no
produto final) em três marcas diferentes de biscoitos concorrentes,
marcas A, B e C (ver dados na Tabela).
A
23
22
19
21
20
17
27
05/11/2015 20:58
B
11
7
43
8
48
14
45
Prof. Alexandre José de Oliveira
C
24
26
27
25
25
26
28
17
Medidas descritivas
Medidas de dispersão para amostras
Exercício
Calcule:
a) a média e a variância de cada marca
b) a média das médias e a média das variâncias
c)a média e a variância de todos os dados
d) compare as respostas dadas em b e em c.
e) Baseado nos dados e sabendo que um dos atributos que o consumidor
estabelece para a compra de biscoitos é a presença de açúcar, como você
avalia a qualidade dessas três marcas? Discuta os dados e que decisões
você pretende tomar.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
18
Medidas descritivas
Medidas de dispersão para amostras
Exercício
Calcule:
a) a média e a variância de cada marca
A 21,29 e 10,24; B 25,14 e 364; C 25,86 e 1,81.
b) a média das médias e a média das variâncias
24,10 e S2 = 125
c)a média e a variância de todos os dados
24,10 e S2= -3674. A média geral é igual a média das médias.
d) compare as respostas dadas em b e em c.
A variância geral mede a variabilidade dos dados em torno da média
geral, enquanto as variâncias das amostras medem a variabilidade dos
dados em torno da respectiva média.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
19
Medidas descritivas
Medidas de dispersão para amostras
Exercício
Calcule:
e) Baseado nos dados e sabendo que um dos atributos que o consumidor
estabelece para a compra de biscoitos é a presença de açúcar, como você
avalia a qualidade dessas três marcas? Discuta os dados e que decisões
você pretende tomar.
05/11/2015 20:58
Prof. Alexandre José de Oliveira
20
Disciplina Engenharia da Qualidade II
Por hoje é só,
Boa noite a todos
FIM
05/11/2015 20:58
Prof. Alexandre José de Oliveira
21
Download

Medidas descritivas Medidas de dispersão para amostras