Estatística 2 – Estatística Descritiva Prof. Antonio Fernando Branco Costa Página da FEG: www.feg.unesp.br/~fbranco • Parâmetros de Posição: – Média – Mediana (2 partes) – Moda • Parâmetros de Dispersão: – Variância (1, 2, 3)=1 – Desvio-Padrão – Amplitude (1, 23, 390)=47749 Média da População : Dados em frequências: k N x i i 1 x i fi i 1 N xi = valores da variável N = tamanho da População N k k 1 ' x i pi fi = frequência da classe (i) pi’= frequência relativa k = número de linhas da tabela X i i, i (1,2,...,6), N 6, pi 1/ 6 MÉDIA AMOSTRAL: Exemplo da Fundição Variável X: número de defeitos por peça Tabela de Distribuição de frequência de Valores Número de Defeitos frequência f i Xi X i fi 0 8 0 1 2 3 4 5 9 5 2 0 0 9 10 6 0 0 6 1 6 25 31 total k X Xi fi i 1 n 31 1,24 25 MÉDIA AMOSTRAL: Altura dos alunos de Estatística Variável Y: Altura(cm) Tabela de Distribuição de frequência das Classes Classes <=160 160-|165 165-|170 170-|175 175-|180 >180 fi Lim. Inf. Lim. Sup. 4 155 160 5 160 165 6 165 170 3 170 175 3 175 180 3 180 185 24 Soma fi 4 5 6 3 3 3 24 Yi 157,5 162,5 167,5 172,5 177,5 182,5 k Y Yi f i i 1 n 4045 168,5 24 Yi*fi 630 812,5 1005 517,5 532,5 547,5 4045 Mediana (md) Idéia: dividir o conjunto ordenado de valores em 2 parte 1 - Considerando conjunto com n valores ordenados 35 36 37 38 n (ímpar) n=9 40 40 41 43 46 md = valor de ordem (n + 1)/2 md = 40 ( valor de ordem 5 ) n (par ) md = valor médio entre o de ordem n/2 e o de ordem (n/2) + 1 12 n=8 14 14 15 valor de ordem n/2 = 15 md 16 16 17 valor de ordem(n/2) + 1 = 16 15 16 15,5 2 20 Mediana (md) 2 - Considerando distribuição em classes de frequências: n Fa 2 h m d Li md f md onde: Li: limite inferior da classe que contém a mediana n: número de elementos do conjunto de dados; Fa: frequência acumulada das classes anteriores à classe que contém a mediana; fmd: frequência da classe que contém a mediana; hmd: amplitude da classe que contém a mediana. frequência Limites Reais classe Lim. inf. absoluta Lim. sup. fi Acumulada Fi 1 11,705 11,835 5 5 2 11,835 11,965 3 8 3 11,965 12,095 7 15 4 12,095 12,225 6 21 5 12,225 12,355 4 25 Li = 11,965 n = 25 Fa = 8 fmd = 7 hmd = 0,13 25 8 2 0,13 12,05 md 11,965 7 Moda: mo Valor de máxima freqüência dentro de um conjunto de dados Dados em Tabela de frequência dos valores Exemplo da Fundição Variável X: número de defeitos por peça Ordem fi Xi frequência (absoluta) pi' 1 0 8 32% 2 1 9 36% 3 2 5 20% 4 3 2 8% 5 4 0 0% 6 5 0 0% 7 6 1 4% total 25 (relativa) 100% mo = 1 moda é apresentar 1 defeito por peça Moda: mo Dados em Tabelas de frequência das classes Classe Modal: aquela(s) de maior frequência d1 mo Li h d1 d 2 Li : limite inferior da classe modal d1 : diferença entre a freqüência da classe modal e a imediatamente anterior d2 : diferença entre a freqüência da classe modal e a da imediatamente seguinte h : amplitude das classes Moda: mo Dados em Tabelas de frequência das classes Exemplo da Fundição Variável Y: diâmetro do furo (mm) frequência Limites Reais classe Lim. inf. absoluta Lim. sup. fi Acumulada Fi 1 11,705 11,835 5 5 2 11,835 11,965 3 8 3 11,965 12,095 7 15 4 12,095 12,225 6 21 5 12,225 12,355 4 25 d1 mo Li h d1 d 2 d1 7 3 4 d2 7 6 1 4 mo 11,965 0,13 12,07 4 1 Variância Idéia: Média do quadrado da diferença dos dados em relação ao valor médio. 1 - Considerando dados de toda a População: N σ2 X i i, i (1,2,...,6), 3,5 (x i ) 2 i 1 N 2 - Considerando dados de uma Amostra da População: n s 2 (x i x) 2 i 1 n 1 Variância Exemplo: Seja os valores da amostra: 70 x 14 5 15 12 10 (xi – x ) 1 -2 -4 3 2 0 xi 15 12 10 17 16 70 n n s2 i 1 (x i x) 2 n 1 17 s 2 (x i x) 2 i 1 n -1 16 (xi – x )2 1 4 16 9 4 34 34 8,5 5 1 Variância Amostral Considerando distribuição de frequências de valores n S2X i 1 n (xi x) 2 f i S2X n -1 Classes <=160 160-|165 165-|170 170-|175 175-|180 >180 2 sX fi 4 5 6 3 3 3 24 155 160 165 170 175 180 160 165 170 175 180 185 Soma x i2 f i ( i 1 24 1 x i fi )2 / n i 1 n 1 fi 4 5 6 3 3 3 24 ( 4045 ) 683300 n Xi 157,5 162,5 167,5 172,5 177,5 182,5 Xi*fi 630 812,5 1005 517,5 532,5 547,5 4045 Xi*Xi*fi 99225 132031,25 168337,5 89268,75 94518,75 99918,75 683300 2 24 67cm2 Desvio-Padrão População: Amostra: x sx 2 x 2 sx S X 67 8cm X 3S X 168,5 24cm Coeficiente de Variação (CV) Relação entre o desvio-padrão amostral e a média amostral (%) sx cv 100 x Regra empírica: • CV < 15% • 15% < CV < 30% • CV > 30% baixa dispersão média dispersão elevada dispersão Amplitude: R(X) R( X ) X máx X min Exemplo da Fundição: X: número de defeitos por peça Xmáx = 6 R(X) = 6 – 0 = 6 Xmín = 0 Y: diâmetro do furo (mm) Ymáx = 12,29 Ymín = 11,77 R(Y) = 12,29 - 11,77 = 0,52 Medidas de Assimetria Assimetria: Assimetria Positiva Assimetria negativa Medidas de Achatamento ou Curtose Forma da distribuição quanto ao seu achatamento comparado com a distribuição Normal Platicúrtica (coef. curtose < 3) Mesocúrtica (Normal) (coef. curtose = 3 ) Leptocúrtica (coef. curtose > 3) Estatística Descritiva - Excel 61 52 53 48 55 65 53 56 54 46 43 62 48 57 57 53 49 50 41 54 55 68 61 54 48 51 51 44 71 63 58 50 64 57 49 55 67 53 53 55 59 62 54 46 52 56 64 55 48 51 Estatística Descritiva - Excel Estatística Descritiva - Excel Estatística Descritiva - Excel Estatística Descritiva - Excel Estatística Descritiva - Excel Estatística Descritiva - Excel Estatística Descritiva - Excel