Medidas descritivas Medidas de dispersão para amostras A amplitude (R) A amplitude é a diferença entre o maior e o menor valor de uma amostra de dados. Ex. dois alunos fizeram, cada um, quatro provas e obtiveram as notas apresentadas na tabela abaixo. Aluno Pedro Paulo Notas 4 9 6 1 4 5 6 5 É fácil ver que as notas obtidas pelo primeiro aluno são mais próximas entre si do que as notas obtidas pelo segundo aluno. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 1 Medidas descritivas Medidas de dispersão para amostras Amplitude Então, as notas obtidas pelo primeiro aluno têm menor dispersão. Dentre as formas existentes para medir a dispersão de dados numéricos a amplitude é a mais fácil de calcular. Entretanto ela poderá não medir bem a dispersão. Dois conjuntos de números podem ter dispersão diferentes e apresentar a mesma amplitude. Ver tabela abaixo: Aluno Paulo José Notas 9 9 1 1 5 1 5 9 A amplitude das notas é a mesma para os dois alunos, mas as notas de José têm maior dispersão. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 2 Medidas descritivas Medidas de dispersão para amostras A variância Por definição, o desvio em relação à média é a diferença entre o valor observado e a média do conjunto. Para medir o grau de dispersão de um conjunto de dados, é preciso considerar todos os desvios. Mas não se pode usar a soma dos desvios como medida de dispersão porque esta soma é sempre igual a zero. Como exemplo, observe os dados apresentados na tabela abaixo – notas do aluno Carlos, em quatro provas: 05/11/2015 20:58 Prova Notas 1ª 2ª 3ª 4ª 9 1 2 8 Prof. Alexandre José de Oliveira 3 Medidas descritivas Medidas de dispersão para amostras A variância Os desvios das notas em relação à média são: 9-5= 4 1-5= -4 2-5= -3 8-5= 3 Qualquer que seja o conjunto de dados, a soma dos desvios em relação a média é sempre igual a zero porque valores positivos e negativos se anulam. Por esta razão, não tem sentido propor a média dos desvios com medida de dispersão. No entanto, se os sinais forem eliminados, os desvios podem ser usados para construir uma medida de dispersão. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 4 Medidas descritivas Medidas de dispersão para amostras A variância Para eliminar os sinais negativos, eleva-se cada desvio ao quadrado. Depois, somam-se os quadrados. Como os quadrados de números negativos são positivos, toda soma de quadrados é positiva ou, no mínimo, nula (quando todos os desvios são iguais a zero). Entretanto, como a soma de quadrados dos desvios aumenta quando aumenta o número de dados – mesmo que a dispersão se mantenha constante – por uma razão óbvia: o número de parcelas somadas aumenta. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 5 Medidas descritivas Medidas de dispersão para amostras A variância Para medir a dispersão dos dados em torno da média usa-se, então, a variância, que leva em consideração o número de dados. A variância pode ser definida como a soma dos quadrados dos desvios, dividida por n. Indica-se a variância obtida dessa forma por (lê-se sigma estimado ao quadrado), isto é: Então, a variância é definida pela soma de quadrados dos desvios, dividida pelo número de dados menos 1, isto é, por n – 1 . Os estatísticos chamam o valor n – 1 de número de graus de liberdade. A variância, obtida por essa nova definição, é indicada por S2. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 6 Medidas descritivas Medidas de dispersão para amostras A variância Escreve-se: ou, Embora pareça mais complicado, essa segunda fórmula permite que o cálculo da variância seja feito com menor número de operações aritméticas. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 7 Medidas descritivas Medidas de dispersão para amostras A variância Exemplo. São dados os valores 0, 1, 2, 3 e 4. Para calcular a variância, aplicando a primeira fórmula, é preciso obter a média dos dados: xbarra= (0+1+2+3+4)/5= 2 Em seguida calcula-se x x - xbarra (x-xbarra)2 0 1 2 3 4 0-2=-2 1-2=-1 2-2=0 3-2=1 4-2=2 4 1 0 1 4 10 0 10 Agora, fica fácil obter: S2=∑(x-xbarra)2/n-1 = 10/4 = 2,5 05/11/2015 20:58 Prof. Alexandre José de Oliveira 8 Medidas descritivas Medidas de dispersão para amostras A variância Para calcular a variância dos mesmos dados usando a segunda fórmula, são necessários apenas os cálculos intermediários apresentados na tabela abaixo x x2 0 1 2 3 4 0 1 4 9 16 10 30 A variância é: S2=∑ x2-((∑x)2/n)/n-1 = (30-((10)2/5))/4 = 2,5 05/11/2015 20:58 Prof. Alexandre José de Oliveira 9 Medidas descritivas Medidas de dispersão para amostras O desvio padrão Como medida de dispersão, a variância tem a desvantagem de apresentar unidade de medida igual ao quadrado da unidade de medida dos dados. Qualquer que seja a unidade de medida dos dados originais, a variância os expressará elevado ao quadrado. Isso acontece porque a variância é obtida a partir de uma soma de quadrados dos desvios. Foi então proposta uma medida de dispersão associada a variância, mas com a mesma unidade de medida dos dados. É o desvio padrão. Por definição, o desvio padrão é a raiz quadrada da variância, com sinal positivo. Representa-se por s. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 10 Medidas descritivas Medidas de dispersão para amostras O desvio padrão Para os dados do último exemplo, ou seja: 0, 1, 2, 3, 4, obteve-se a variância de S2=2,5. Para esses dados, o desvio padrão é igual a: s=√2,5 = 1,58 Como o que nos interessa são as medidas de dispersão, o desvio padrão mede bem a dispersão e apresenta os resultados na mesma unidade de medida do conjunto dos dados. De outra forma, quando há maior dispersão em um conjunto de dados, maior será o valor do desvio padrão e vice-versa. Ainda, o desvio padrão não reflete a magnitude dos dados amostrais, reflete apenas a dispersão em torno da média. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 11 Medidas descritivas Medidas de dispersão para amostras O desvio padrão Ex. a)As notas de Pedro têm menor dispersão e o menor desvio padrão b)As notas de Paulo têm dispersão maior do que as notas de Pedro; o desvio padrão de Paulo é maior do que o desvio padrão de Pedro c)As notas de Carlos têm a maior dispersão e o maior desvio padrão 05/11/2015 20:58 Prof. Alexandre José de Oliveira 12 Medidas descritivas Medidas de dispersão para amostras O desvio padrão Outra forma de calcular o desvio padrão, desde que a variável tenha distribuição normal, é por meio da seguinte fórmula onde R é a amplitude e o valor de d2, que depende do tamanho da amostra, é encontrado na Tabela 2 do apêndice. Este método de calcular o desvio padrão fornece boas estimativas para amostras de pequeno tamanho (n = 4, 5 ou 6), mas perde a eficiência se n > 10. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 13 Medidas descritivas Medidas de dispersão para amostras O desvio padrão A utilização da amplitude para estimar σ data dos primeiros dias do controle estatístico da qualidade e era popular por sua facilidade de cálculo. Com o advento dos computadores e calculadoras, esta não é mais uma consideração importante. Em geral o “estimador quadrático” baseado em S é preferível. No entanto se o tamanho de n da amostra é relativamente pequeno, o método da amplitude funciona bastante bem. A eficiência relativa do método da amplitude comparada com S é exibida a seguir para diferentes tamanhos de amostra: 05/11/2015 20:58 Prof. Alexandre José de Oliveira 14 Medidas descritivas Medidas de dispersão para amostras O desvio padrão Tamanho da Amostra n Eficiência relativa 2 1,000 3 0,992 4 0,975 5 0,955 6 0,930 10 0,850 Para valores moderados de n – digamos, n ≥ 10 – o método da amplitude perde eficiência rapidamente, uma vez que ele ignora toda a informação da amostra compreendida entre os dois valores extremos. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 15 Medidas descritivas Medidas de dispersão para amostras Erro padrão da média Por definição, erro padrão da média é a raiz quadrada, com sinal positivo, de s2xbarra, isto é: O erro padrão da média é igual ao desvio padrão dividido pela raiz quadrada do tamanho da amostra. O erro padrão da média é uma medida de dispersão das médias de todas as amostras possíveis (que, na prática, são desconhecidas) em torno da média da população (que, na prática, também é desconhecida). 05/11/2015 20:58 Prof. Alexandre José de Oliveira 16 Medidas descritivas Medidas de dispersão para amostras Exercício Você foi contratado para gerenciar a produção em uma indústria de biscoitos. Como você ainda não conhece bem o processo, e o produto, você realizou testes sobre quantidade de açúcar (em grs./100 grs. no produto final) em três marcas diferentes de biscoitos concorrentes, marcas A, B e C (ver dados na Tabela). A 23 22 19 21 20 17 27 05/11/2015 20:58 B 11 7 43 8 48 14 45 Prof. Alexandre José de Oliveira C 24 26 27 25 25 26 28 17 Medidas descritivas Medidas de dispersão para amostras Exercício Calcule: a) a média e a variância de cada marca b) a média das médias e a média das variâncias c)a média e a variância de todos os dados d) compare as respostas dadas em b e em c. e) Baseado nos dados e sabendo que um dos atributos que o consumidor estabelece para a compra de biscoitos é a presença de açúcar, como você avalia a qualidade dessas três marcas? Discuta os dados e que decisões você pretende tomar. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 18 Medidas descritivas Medidas de dispersão para amostras Exercício Calcule: a) a média e a variância de cada marca A 21,29 e 10,24; B 25,14 e 364; C 25,86 e 1,81. b) a média das médias e a média das variâncias 24,10 e S2 = 125 c)a média e a variância de todos os dados 24,10 e S2= -3674. A média geral é igual a média das médias. d) compare as respostas dadas em b e em c. A variância geral mede a variabilidade dos dados em torno da média geral, enquanto as variâncias das amostras medem a variabilidade dos dados em torno da respectiva média. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 19 Medidas descritivas Medidas de dispersão para amostras Exercício Calcule: e) Baseado nos dados e sabendo que um dos atributos que o consumidor estabelece para a compra de biscoitos é a presença de açúcar, como você avalia a qualidade dessas três marcas? Discuta os dados e que decisões você pretende tomar. 05/11/2015 20:58 Prof. Alexandre José de Oliveira 20 Disciplina Engenharia da Qualidade II Por hoje é só, Boa noite a todos FIM 05/11/2015 20:58 Prof. Alexandre José de Oliveira 21