Medidas Estatísticas Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Medidas Estatísticas Posição (Tendência Central) Variação (Dispersão) Forma Quem está com a razão? $4.000,00 $700,00 ... Empregados reclamam que, na maioria, recebem apenas $200,00 por mês. $500,00 $300,00 $200,00 ... Presidente diz que, em média, eles recebem $700,00! Notação Medida Média Desv. Padrão Amostra População `X m S s Variância S Tamanho n 2 s N 2 Medidas de Posição (Tendência Central) Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Média Uma das medidas mais utilizadas para representar uma distribuição de dados Reflete um ponto de equilíbrio Influenciada por valores extremos Só deve ser utilizada em distribuições: Não heterogêneas Simétricas ou levemente assimétricas Média População N m= Xi i =1 = X1 + X 2 + L + X N N Amostra X = N n xi i =1 n = x1+ x 2 +L+ x n n Exemplo Dados: 10 4 8 11 6 7 n X = = Xi i =1 n = X1 + X 2 + X 3 + X 4 + X 5 + X 6 6 10 + 4 + 8 + 11 + 6 + 7 = 7,67 6 Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Mediana Valor que divide a distribuição em duas partes iguais Se o de obs. for ímpar, a mediana será a obs. que ocupa a posição central Se o de obs. for par, a mediana será a média dos dois valores centrais Não é influenciada por valores extremos Mediana: Método de Cálculo 1. Ordenar a série de valores 2. Determinar a posição da mediana n +1 Se n é ímpar: 2 Se n é par: n 2 e n +1 2 O valor da mediana é o valor da variável relativo à posição encontrada Mediana: Exemplo 1 Dados: 24 Ordenar: 21 Posição: 1 Posição Mediana= 22 22 22 2 21 22 3 23 23 4 22 24 5 n +1 5 +1 = = =3 2 2 Mediana: Exemplo 2 Dados: 10 Ordenar: 4 Posição: 1 4 6 2 8 7 3 11 8 4 6 10 5 Posição1 = n = 6 = 3 2 2 n 6 Posição2 = + 1 = +1 = 4 2 2 7 + 8 Mediana = =7 ,5 2 7 11 6 Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Moda Valor mais freqüente Não é afetada por valores extremos Pode haver mais de uma moda Pode ser utilizada para dados qualitativos e quantitativos Uso do Cinto de Segurança 500 Moda = ‘SEMPRE’ 499 400 300 200 124 115 Algumas vezes Nunca 100 0 Sempre Resumo das Medidas de Posição Medida Equação Média S Xi / n Ponto de equilíbrio ( n +1) Posição 2 - Valor central quando ordenado Mediana Moda Descrição Mais freqüente Medidas de Variação Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Amplitude Diferença entre a maior e a menor observação Ignora como os dados estão distribuídos Amplitude = Xmáx - xmín 7 8 9 10 7 8 9 10 Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Desvio Médio Indica o desvio das observações em relação à média da distribuição m DM = | `X i -X i=1 S fi | fi Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Variância & Desvio Padrão Medidas mais comuns de variação absoluta Indica como os dados estão distribuídos em torno da média ` X = 8,3 4 6 8 10 12 Variância da Amostra Fórmula n S = 2 = ( X - X )2 i i =1 n -1 n - 1 no denominador! (Use N no caso de Variância da População) ( X - X )2 + ( X - X )2 + L + ( X - X )2 1 2 n n -1 Desvio Padrão Fórmula S= S 2 n = = i =1 (X (X i 2 ) -X n -1 1 2 ) ( X + X 2 2 ( ) ) + L + Xn - X 2 - X n -1 Variância Exemplo Dados: ( X S = S = 2 i =1 ( ) -X i n -1 10 - 8 = 6,8 4 8 11 6 9 6 2 n 2 10 onde X = ) +( 4 -8 ) 2 2 6 -1 Xi i =1 6 ( +L+ =8 9-8 ) 2 Medida de Forma Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Forma Descreve a forma da distribuição Medida pelo coeficiente de assimetria Assimetria negativa Simétrica Assimetria positiva Média Mediana Moda Média = Mediana = Moda Moda Mediana Média Outras Medidas Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Coeficiente de Variação Medida relativa de variação Indica se a distribuição é heterogênea ou homogênea Mede a dispersão dos dados em relação à média CV = Desvio Padrão Média Se o Coeficiente de Variação for menor do que 20%, a amostra é considerada homogênea Quartis & Box Plots Quartis Medidas de posição Separa os dados ordenados em 4 partes iguais 25% 25% Q1 25% Q2 25% Q3 Posição o i-ésimo Quartil = i . ( n + 1 ) 4 Quartil (Q1): Exemplo Dados: 10 Ordenados:4 Posição: 1 4 6 2 8 7 3 11 8 4 6 10 5 7 11 6 1 (n+ 1) 1 (6+ 1) Q 1 Posição = . = = 175 @2 4 4 Q1 = 6 Quartil (Q2): Exemplo Dados: 10 Ordenados:4 Posição: 1 4 6 2 8 7 3 11 8 4 6 10 5 2 (n+ 1) 2 (6+ 1) Q 2 Posição = = = 3.5 4 4 7 +8 Q2 = = 7.5 2 7 11 6 Quartil (Q3): Exemplo Dados: 10 Ordenados: 4 Posição: 1 4 6 2 8 7 3 11 8 4 6 10 5 7 11 6 3 (n+ 1) 3 (6+ 1) Q 3 Posição = = = 5.25 @ 5 4 4 Q 3 = 10 Medidas Estatísticas Posição Variação Média Amplitude Mediana Desvio médio Moda Variância Desvio Padrão Forma Assimetri a Outras Coeficiente de variação Distância Interquartil Distância Interquartil Medida de dispersão Diferença entre o 3º & o 1º quartis Não é afetado por valores extremos Distância Interquartil =Q3- Q 1 Box Plot Apresenta a dispersão dos dados usando 5 números resumo X mín 4 Q1 6 Mediana Q 3 8 10 X máx 12 Outlier Observação discrepante Distância Interquartil (d) Q1 OUTLIER * 4 Q3 1,5 d 6 OUTLIER * 1,5 d 8 10 12 Forma & Box Plot Assimetria negativa Q 1 Mediana Q 3 Assimetria positiva Simétrico Q 1 Mediana Q3 Q 1 Mediana Q 3 Medidas de Variação: Resumo Medida Amplitude Intervalo Quartílico Fórmula X maior - X menor Q3 - Q1 Desvio Padrão (Amostra) (X Variância (Amostra) S (X i - `X )2 Desvio Médio i - X) n -1 n-1 S Xi - X n Coeficiente de Variação Descrição s X Variação dos dados Variação dos 50% centrais 2 Dispersão em torno da Média da Amostra Dispersão quadrática em torno da média da amostra Dispersão em torno da Média Amostral Medida relativa de variação