Introdução à Estatística Júlio Cesar de C. Balieiro 1 Estatística 9 É a ciência que se preocupa com: (i) Organização; Estatística Descritiva (ii) Descrição; (iii) Análises; (iv) Interpretações. Estatística Indutiva ou Estatística Inferencial 2 Introdução à Estatística 1 Alguns Conceitos 9 População • É o conjunto de elementos com pelo menos uma característica em comum. • Esta característica comum deve delimitar claramente quais os elementos que pertencem à população e quais os elementos que não pertencem. 9 Amostra • É um subconjunto de uma população, onde todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado. 3 Alguns Conceitos 9 OBJETIVO DA ESTATÍSTICA: “tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações”. 9 Variável • É a característica dos elementos da amostra que nos interessa averiguar estatisticamente. • Ex.: variável Idade - se houver “n” elementos fisicamente considerados no estudo, esses elementos fornecerão “n” valores da variável idade, os quais serão tratados convenientemente pela Estatística Descritiva 4 e/ou pela Estatística Inferencial. Introdução à Estatística 2 Tipos de Variáveis As variáveis de interesse podem ser classificadas em: (i) Qualitativas => quando resultar de uma classificação por tipos ou atributos. (ii) Quantitativas => quando seus valores forem expressos em números. Podem ser subdivididas: (a) Discretas; (b) Contínuas. 5 Tipos de Variáveis (a) Variáveis Quantitativas Discretas Assumem apenas valores pertencentes a um conjunto enumerável. São obtidos mediante alguma forma de contagem. Exemplos de Discretas: y População: Ovinos da raça Santa Inês da ASCCO; Variável: número de cordeiros ao parto (1, 2 ou 3). y População: Bovinos Nelore da Agro-pecuária CFM Ltda. Variável: Escores de Musculosidade (1, 2, 3, 4 ou 5). y População: Bovinos Nelore da Agro-pecuária CFM Ltda. Variável: Prenhez aos 14 meses de idade (0 ou 1). 6 Introdução à Estatística 3 Tipos de Variáveis (b) Variáveis Quantitativas Contínuas São aquelas, teoricamente, que podem assumir qualquer valor em um certo intervalo de variação. Resultam, em geral, de uma medição, sendo freqüentemente expressos em alguma unidade. Exemplos de Contínuas: y População: Bovinos Nelore da Agro-pecuária CFM Ltda. Variável: PN (28,0; 28,5; 30,2; 32,58) y População: Bovinos Nelore da Agro-pecuária CFM Ltda. Variável: Peso aos 18 meses, em kg (250,0 até 415,0 kg) 7 Características Numéricas de uma Distribuição de Dados Júlio Cesar de C. Balieiro Introdução à Estatística 8 4 Introdução 9 As vezes é necessário resumir certas características das distribuições de dados (ou mesmo de freqüências dados) por meio de certas quantidades. 9 Tais quantidades são usualmente denominadas de MEDIDAS, por quantificarem alguns aspectos de nosso interesse. 9 Nosso objetivo é apresentar algumas das chamadas MEDIDAS DE POSIÇÃO, bem como, algumas MEDIDAS DE DISPERSÃO, consideradas mais importantes no campo da aplicabilidade prática do nosso dia a dia. 9 Tais medidas servem para: (a) Localizar uma distribuição; (b) Caracterizar sua variabilidade. 9 Medidas de Posição (ou de Tendência Central) 9 Servem para localizar a distribuição dos dados brutos (ou das freqüências) sobre o eixo de variação da variável em questão. 9 Veremos os três tipos principais de medidas de posição: (a) Média Aritmética; (b) Mediana; (c) Moda. 10 Introdução à Estatística 5 Medidas de Posição (ou de Tendência Central) 9 Média (Aritmética) => A notação internacional recomenda símbolos específicos para a Média: (a) AMOSTRA: n Conjunto de Dados => x = µˆ = m̂ = Σ Xi i =1 n k Tabelas de Freqüência => x = µˆ = m̂ = Σ X i fi i =1 k = Σ X i p 'i i =1 n 11 Medidas de Posição (ou de Tendência Central) 9 Média (Aritmética) (b) POPULAÇÃO: n Conjunto de Dados => µ = m = Σ Xi i =1 n k Tabela de Freqüência => µ = m = Σ X i fi i =1 n k = Σ X i p 'i i =1 12 Introdução à Estatística 6 Medidas de Posição (ou de Tendência Central) Exemplo 2: 50 determinações do tempo (em segundos) gasto por um funcionário 684 k x = µˆ = m̂ = Σ X i fi i =1 n = 2.725 = 54,5 50 13 Medidas de Posição (ou de Tendência Central) 9 Propriedades da Média (a) Multiplicando todos os valores de uma variável por uma constante, a média do conjunto fica multiplicada por essa constante. (b) Somando-se ou subtraindo-se uma constante a todos os valores da variável, a média do conjunto fica acrescida ou subtraída dessa constante. 14 Introdução à Estatística 7 Medidas de Posição (ou de Tendência Central) 9 Mediana => A mediana é uma quantidade que, como a média, também caracteriza o centro de uma distribuição pertencente a um conjunto de dados. (a) AMOSTRA: m̂d (b) POPULAÇÃO: md 15 Medidas de Posição (ou de Tendência Central) Conjunto de Dados: Para obtenção da estimativa de mediana de um conjunto de dados são necessários os seguintes passos: 1º Passo: Ordenar de forma crescente os “n” valores da variável em questão; 2º Passo: (i) Sendo “n” ímpar, a mediana será igual ao valor de ordem (n + 1) ; 2 (ii) Sendo “n” par, a mediana será o valor médio entre os valores de ordem n e n + 1 . 2 Introdução à Estatística 2 16 8 Medidas de Posição (ou de Tendência Central) 9 Mediana Tabelas de Freqüência => ˆ d = Li + m (n/ 2) − Fa hmd fmd Li = limite inferior da classe que contém a mediana; n = números de elementos do conjunto da dados; Fa = soma das freqüências das classes anteriores que contém a mediana; fmd = freqüência da classe que contém a mediana; hmd= amplitude da classe que contém a mediana. 17 Medidas de Posição (ou de Tendência Central) 9 Mediana Exemplo 2: 50 determinações do tempo (em segundos) gasto por um funcionário mˆ d = Li + 684 (n / 2) − Fa hmd f md Li = 49,5; n = 50; Fa = 11; fmd = 16; hmd = 5. Introdução à Estatística 18 9 Medidas de Posição (ou de Tendência Central) 9 Mediana Exemplo 2: 50 determinações do tempo (em segundos) gasto por um funcionário Li = 49,5; n = 50; Fa = 11; fmd = 16; hmd = 5. mˆ d = Li + mˆ d = 49,5 + ( n / 2 ) − Fa hmd f md (50 / 2) − 11 .5 = 53,875 16 19 Medidas de Posição (ou de Tendência Central) 9 Moda => A moda (ou modas) de um conjunto de valores é definida como o valor (ou valores) de máxima freqüência. => É uma quantidade que, como a média, também caracteriza o centro de uma distribuição, indicando a região das máximas freqüências. (a) AMOSTRA: m̂ O (b) POPULAÇÃO: mO 20 Introdução à Estatística 10 Medidas de Posição (ou de Tendência Central) 9 Moda Tabelas de Freqüência => mˆ o = Li + d1 h d1 + d 2 Li = limite inferior da classe modal; d1 = diferença entre a classe modal e a da classe imediatamente anterior; d2 = diferença entre a classe modal e a da classe imediatamente seguinte; h = amplitude das classes. 21 Medidas de Posição (ou de Tendência Central) 9 Moda Exemplo 2: 50 determinações do tempo (em segundos) gasto por um funcionário mˆ o = Li + 684 d1 h d1 + d 2 Li = 49,5; d1 = 16 – 8 = 8; d2 = 16 – 12 = 4; h = 5. Introdução à Estatística 22 11 Medidas de Posição (ou de Tendência Central) 9 Moda Exemplo 2: 50 determinações do tempo (em segundos) gasto por um funcionário Li = 49,5; d1 = 16 – 8 = 8; d2 = 16 – 12 = 4; h = 5. mˆ o = Li + mˆ o = 49,5 + d1 h d1 + d 2 8 .5 = 52,833 8+ 4 23 Medidas de Dispersão (ou de Variabilidade) 9 A informação fornecida pelas Medidas de Posição em geral necessitam de ser complementas pelas Medidas de Dispersão. 9 As Medidas de Dispersão servem para indicar o “quanto os dados se apresentam dispersos em torno da região central”. 9 Portanto caracterizam o grau de variação existente em um conjunto de valores. 9 As Medidas de Dispersão que mais nos interessam são: (a) Amplitude; (b) Variância; (c) Desvio Padrão; (d) Coeficiente de Variação. Introdução à Estatística 24 12 Medidas de Dispersão (ou de Variabilidade) 9 Amplitude => A amplitude, já mencionada, é definida como a diferença entre o maior e o menor valores do conjunto de dados. (a) AMOSTRA: Rˆ = X MAX − X MIN (b) POPULAÇÃO: R = X MAX − X MIN => Vantagem e Desvantagem. => Salvo aplicações de Controle de Qualidade, a amplitude não é muito utilizada como Medida de Dispersão. 25 Medidas de Dispersão (ou de Variabilidade) 9 Variância => A variância é definida como a “média dos quadrados das diferenças entre os valores em relação a sua própria média”. 2 2 2 2 2 2 (a) AMOSTRA: S = S X = S ( X ) = σˆ = σˆ ( X ) = σˆ X (b) POPULAÇÃO: σ 2 = σ 2 ( X ) = σ X2 => Em se tratando de Amostra: n Conjunto de Dados => S 2 ( X ) = S X2 = Σ ( X i − X )2 i =1 N −1 k Tabela de Freqüência => S ( X ) = S = 2 Introdução à Estatística 2 X Σ ( X i − X )2 fi i =1 N −1 26 13 Medidas de Dispersão (ou de Variabilidade) 9 Variância => Em se tratando de População: n Conjunto de Dados => σ 2 = σ 2 ( X ) = σ X2 = Σ ( X i − X )2 i =1 N Σ ( X i − X )2 fi k Tabela de Freqüência => σ 2 = σ 2 ( X ) = σ X2 = i =1 N OBS: (i) A variância calculada para dados agrupados deverá ser superestimada em relação à variância exata dos “N” dados originais. 27 Medidas de Dispersão (ou de Variabilidade) 9 Variância Exemplo: Executar o cálculo da variância de um conjunto pequeno de dados, formado pelos valores seguinte: {15, 12, 10, 17, 16} n É fácil ver que: x = µˆ = m̂ = Σ Xi i =1 N = 14 n Logo: S 2 ( X ) = S X2 = Σ ( X i − X )2 i =1 N −1 Poderemos montar a seguinte Tabela Auxiliar nos cálculos: Introdução à Estatística 28 14 Medidas de Dispersão (ou de Variabilidade) 9 Variância Exemplo: Cálculo da variância de um conjunto pequeno de dados: {15, 12, 10, 17, 16} n S (X ) = S = 2 2 X Σ ( X i − X )2 i =1 S 2 ( X ) = S X2 = N −1 34 = 8,5 4 Nota-se que as expressões apresentadas não são as mais apropriadas para o cálculo da variância, pois a média é quase sempre um valor fracionário, o que viria a dificultar o 2 29 cálculo dos desvios ( X i − X ) . Medidas de Dispersão (ou de Variabilidade) 9 Variância n Σ ( X i − X )2 Note que o numerador pode ser trabalhado: S 2 ( X ) = S X2 = i =1 n −1 Σ( X i − X ) 2 = Σ( X i2 − 2 X i X + X 2 ) = ΣX i2 − 2 XΣX i + NX 2 ΣX i ⎛ ΣX ⎞ = ΣX − 2 ΣX i + N ⎜ i ⎟ N ⎝ 2N ⎠ 2 X X ( Σ ) ( Σ i i) = ΣX i2 − 2 + N N 2 ( ΣX i ) Σ( X i − X ) 2 = ΣX i2 − N 2 2 i Introdução à Estatística 30 15 Medidas de Dispersão (ou de Variabilidade) 9 Variância Assim, para um conjunto com “N” dados: ⎛n ⎞ ⎜ iΣ=1 X i ⎟ n n 2 ⎝ ⎠ Σ ( X i − X ) 2 iΣ=1 X i − 2 2 N = S ( X ) = S X = i =1 N −1 N −1 2 Da mesma forma, para dados agrupados em Tabela de freqüência, teremos: ⎛k ⎞ ⎜ iΣ=1 X i f i ⎟ k k 2 ⎝ ⎠ Σ ( X i − X ) 2 f i iΣ=1 X i f i − 2 2 N i =1 = S (X ) = SX = N −1 N −1 2 31 Medidas de Dispersão (ou de Variabilidade) 9 Variância Exemplo: 50 determinações do tempo (em segundos) gasto por um funcionário 684 2 ⎛k ⎞ ⎜ iΣ=1 X i f i ⎟ k (2.725)2 ⎠ Σ X i2 f i − ⎝ 150.775 − i =1 50 N = = 46,17 S 2 ( X ) = S X2 49 N −1 Introdução à Estatística 32 16 Medidas de Dispersão (ou de Variabilidade) 9 Propriedades da Variância (a) Multiplicando-se todos os valores de uma variável por uma constante, a variância do conjunto fica multiplicada pelo quadrado dessa constante. (b) Somando-se ou subtraindo-se uma constante a todos os valores de uma variável, a variância não se altera. OBS: (i) A variância é uma medida de dispersão importante na teoria estatística; (ii) Do ponto de vista prático, ela tem o inconveniente de se expressar em unidade quadrática em relação a variável em questão. 33 Medidas de Dispersão (ou de Variabilidade) 9 Desvio Padrão => Definimos desvio padrão como “a raiz quadrada positiva da variância”. => O cálculo do desvio padrão é feito por meio da variância. (a) AMOSTRA: S = S X = S ( X ) = σˆ = σˆ ( X ) = σˆ X (b) POPULAÇÃO: σ = σ (X ) = σ X => Em se tratando de Amostra: S ( X ) = S X = + S X2 34 Introdução à Estatística 17 Medidas de Dispersão (ou de Variabilidade) 9 Desvio Padrão OBS: (i) O desvio padrão se expressa na mesma unidade da variável, sendo por isso, de maior interesse que a variância nas aplicações práticas; (ii) É mais realístico para efeito de comparação de dispersões. Exemplo: 50 determinações do tempo (em segundos) gasto por um funcionário 2 ⎛k ⎞ Σ X f ⎜ ⎟ i i k i =1 (2.725)2 ⎠ Σ X i2 f i − ⎝ 150.775 − i =1 50 N = = 46,17 S 2 ( X ) = S X2 49 N −1 S ( X ) = S X = 46,17 = 6,79 35 Medidas de Dispersão (ou de Variabilidade) 9 Coeficiente de Variação => O coeficiente de variação é definido como “o quociente entre o desvio padrão e a média”, sendo frequentemente expresso em porcentagem. ^ ( X ) = CV ^ (a) AMOSTRA: CV X (b) POPULAÇÃO: CV ( X ) = CV X => Em se tratando de Amostra: ^ ( X ) = CV ^ = SX CV X X Introdução à Estatística 36 18 Medidas de Dispersão (ou de Variabilidade) 9 Coeficiente de Variação Exemplo: 50 determinações do tempo (em segundos) gasto por um funcionário ^ ( X ) = CV ^ = SX CV X X S 6,79 ^ ^ CV ( X ) = CV X = X = = 0,125 = 12,46% X 54,5 37 Medidas de Dispersão (ou de Variabilidade) 9 Coeficiente de Variação OBS: (i) A vantagem é caracterizar a dispersão dos dados em termos relativos ao seu valor médio; (ii) Pequena dispersão absoluta pode ser, na verdade considerável, quando comparada com a ordem de grandeza dos valores da variável. Quando consideramos o CV, enganos de interpretações desse tipo não ocorrem; (iii) Além disso, por ser adimensional, o CV fornece uma maneira de se compararem as dispersões de variáveis cujas medidas são irredutíveis. 38 Introdução à Estatística 19 Momentos de uma Distribuição de Dados Júlio Cesar de C. Balieiro 39 Momentos de uma Distribuição 9 Alguns conceitos Definimos o momento de ordem “t” de um conjunto de dados como: n Mt = Σ X it i =1 n Definimos o momento de ordem “t” centrado em relação a uma constante “a” como: n M ta = Introdução à Estatística Σ ( X i − a)t i =1 n 40 20 Momentos de uma Distribuição de Freqüências 9 Alguns conceitos Já vimos que temos interesse no caso de “momento centrado em relação a média”, o qual designaremos simplesmente por “momento centrado”, dado por: n mt = Σ ( X i − X )t i =1 n Também sabemos que, nos casos da média e da variância, as expressões podem ser reescritas levando-se em consideração Tabelas de freqüências dos diferentes valores existentes. 41 Momentos de uma Distribuição de Freqüências 9 Alguns conceitos Assim, para dados agrupados em Tabela de Freqüência, teremos: k M t Σ X it f i = i =1 => Para momento de ordem “t” n k Σ ( X i − a)t fi Mta = i=1 n n mt = Introdução à Estatística Σ ( X i − X )t f i i =1 n => Para momento de ordem “t” centrado em relação a uma constante “a” => Para momento de ordem “t” centrado em relação a uma constante “média” 42 21 Momentos de uma Distribuição de Freqüências 9 Alguns conceitos Nos interessa particularmente saber calcular os momentos centrados de terceira e quarta ordem. n mt = n m3 = Σ ( X i − X )3 i =1 n m4 = i =1 n i =1 n n n Σ X i3 = Σ X i2 − 3X i =1 n n Σ ( X i − X )4 Σ ( X i − X )t i =1 n n Σ X i4 = i =1 n + 2X 3 n − 4X Σ X i3 i =1 n n + 6X 2 Σ X i2 i =1 n − 3X 4 43 Momentos de uma Distribuição de Freqüências 9 Alguns conceitos Havendo Tabelas de Freqüências com “k” classes a considerar, as expressões equivalentes são: k mt = k m3 = Σ X i3 f i i =1 n m4 = Introdução à Estatística i =1 n i =1 n k Σ X i2 f i − 3X n Σ X i4 f i Σ ( X i − X )t f i i =1 n + 2X 3 n − 4X Σ X i3 f i i =1 n n + 6X 2 Σ X i2 f i i =1 n − 3X 4 44 22 Medidas de Assimetria Essas medidas procuram caracterizar como e quanto a distribuição dos Dados(ou freqüências) se afasta da condição de simetria. Distribuições alongadas a direita são ditas Positivamente Assimétricas. Distribuições alongadas a Negativamente Assimétricas. esquerda são ditas 45 Medidas de Assimetria O momento centrado de terceira ordem pode ser usado como medida de assimetria. Entretanto é mais conveniente a utilização de uma medida adimensional, definida como Coeficiente de Assimetria, dado por: m a3 = 3 (S X )3 Assim basta criamos uma 3 nova coluna com X i f i . 684 E utilizarmos momento centrado de 3ª ordem: k Σ X i3 f i m3 = i =1 Introdução à Estatística n k − 3X Σ X i2 f i i =1 n + 2 X 346 23 Medidas de Assimetria Desta forma, poderemos classificar o Coeficiente de Assimetria (a3) da seguinte forma: (i) Se a3 = 0 Î a distribuição é Simétrica; (ii) Se a3 > 0 Î a distribuição é Assimétrica à direita (Assimetria Positiva); (iii) Se a3 < 0 Î a distribuição é Assimétrica à Esquerda (Assimetria Negativa). Fonte: Ferreira, D. F. Estatística Básica. Ed. UFLA, 2005. 664 p. 47 Medidas de Assimetria Outra medida de assimetria mais simples pode ser obtido pelo Índice de Assimetria de Pearson: A= X − mˆ 0 SX O Índice de Assimetria de Pearson também pode ser facilmente classificado: | A |< 0 ,15 => Distribuição praticamente Simétrica; 0 ,15 < | A |< 1, 0 => Distribuição moderadamente Assimétrica; | A | > 1, 0 Introdução à Estatística => Distribuição fortemente Assimétrica. 48 24 Medidas de Assimetria Exemplo: 50 determinações do tempo (em segundos) gasto por um funcionário k Σ X i fi 2.725 x = µˆ = m̂ = i =1 = = 54,5 50 n mˆ o = Li + d1 h d1 + d 2 mˆ o = 49,5 + 8 5 = 52,833 8+ 4 684 2 ⎛k ⎞ ⎜ iΣ=1 X i f i ⎟ k 2 ⎠ Σ X i fi − ⎝ i =1 2 N SX = = 46,17 N −1 S X = 46,17 = 6,79 A= X − mˆ 0 54,5 − 52,833 = = 0,246 6,79 SX 49 Medidas de Assimetria Exemplo: 50 determinações do tempo (em segundos) gasto por um funcionário A= X − mˆ 0 54,5 − 52,833 = = 0,246 SX 6,79 Pelo Índice de Assimetria de Pearson essa distribuição seria classificada como “Moderadamente Assimétrica”, pois 0 ,15 < | A |< 1, 0 . De fato isso ocorre, pois quando utilizados uma Técnica de Descrição Gráfica para Variáveis Quantitativas Contínuas, detectamos a Assimetria Moderada. Introdução à Estatística 50 25 Medidas de Achatamento ou Curtose Essas medidas procuram caracterizar a forma da distribuição quanto ao seu achatamento. O termo médio de comparação é dado pela Distribuição Normal, que é um modelo teórico de distribuição a ser estudado no capítulo relacionado à Probabilidades. Quanto ao achatamento, podemos ter as seguintes situações: Platicúrticas, Mesocúrticas e Leptocúrticas. 51 Medidas de Achatamento ou Curtose A caracterização do achatamento de uma distribuição só tem sentido, em termos práticos, se a distribuição for aproximadamente Simétrica. Entre as possíveis medidas de achatamento, destacamos o Coeficiente de Curtose. O Coeficiente de Curtose é obtido pelo quociente do momento centrado de 4ª ordem pelo quadrado da variância, ou seja: a4 = m4 m4 = ( S X2 ) 2 S X4 52 Introdução à Estatística 26 Medidas de Achatamento ou Curtose Trata-se de coeficiente adimensional, permitindo a sua classificação: a 4 < 3,0 => Distribuição Platicúrtica; a 4 = 3,0 => Distribuição Mesocúrtica; a 4 > 3,0 => Distribuição Leptocúrtica. 53 Medidas de Achatamento ou Curtose Exemplo: 50 determinações do tempo (em segundos) gasto por um funcionário Assim, basta criamos duas novas colunas com: X i3 f i e X i4 f i . 684 E utilizarmos momento centrado de 4ª ordem: n m4 = Introdução à Estatística Σ X i4 f i i =1 n n − 4X Σ X i3 f i i =1 n n + 6X 2 Σ X i2 f i i =1 n − 3X 4 54 27 Medidas de Achatamento ou Curtose Exemplo: 50 determinações do tempo (em segundos) gasto por um funcionário a4 = m4 m = 44 ≅ 2 , 21 => Distribuição ligeiramente 2 2 Platicúrtica. (S X ) SX 55 Medidas de Achatamento ou Curtose Outra medida de achatamento mais simples pode ser obtido pelo Grau de Curtose, dado pelo coeficiente: K= Q3 − Q1 2( P90 − P10 ) em que, Q3 Q1 P90 = é o 1º Quartil; P90 = é o 10º Percentil. = é o 3º Quartil; = é o 90º Percentil; 56 Introdução à Estatística 28 Medidas de Achatamento ou Curtose Quartis => dividem um conjunto de dados em quatro partes iguais. 0% 25% 50% 75% Q1 Q2 Q3 100% em que, Q1 Q2 = o 1º Quartil deixa 25% dos elementos; Q3 = o 3º Quartil deixa 75% dos elementos. = o 2º Quartil deixa 50% dos elementos e coincide com a Mediana; 57 Medidas de Achatamento ou Curtose 9 Fórmulas para cálculo de Q1 e Q3 para o caso de variáveis quantitativas contínuas (a) Determinação de Q1: N; 4 (ii) Identifica-se a classe de Q1 pela Fi (freq. acumulada); (i) Calcula-se: (iii) Aplica-se a fórmula: Q1 = LQ1 + (n / 4) − Fa h f Q1 58 Introdução à Estatística 29 Medidas de Achatamento ou Curtose 9 Fórmulas para cálculo de Q1 e Q3 para o caso de variáveis quantitativas contínuas (continuação) (b) Determinação de Q3: (i) Calcula-se: 3N 4 (ii) Identifica-se a classe de Q3 pela Fi (freq. acumulada); (iii) Aplica-se a fórmula: Q3 = LQ3 + (3n / 4) − Fa h f Q3 59 Medidas de Achatamento ou Curtose Exemplo: Dada a distribuição, determinar os Quartis (Q1 e Q3) e a mediana. Classes fi Fi 7 – 17 6 6 17 – 27 15 21 Classe Q1 27 – 37 20 41 Classe m̂d 37 – 47 10 51 Classe Q3 47 – 57 5 56 Q1 = LQ1 + (n / 4) − Fa h f Q1 mˆ d = Li + (n / 2) − Fa hmd f md Q3 = LQ3 + (3n / 4) − Fa h fQ3 60 Introdução à Estatística 30 Medidas de Achatamento ou Curtose Exemplo: Dada a distribuição, determinar os Quartis (Q1 e Q3) e a mediana. Classes n = 56; fi Fi 7 – 17 17 – 27 6 15 6 21 Q1 = n 56 = = 14 o elemento 4 4 27 - 37 37 - 47 47 - 57 20 10 5 41 51 56 Q3 = 3n 3.56 = = 42o elemento 4 4 ⎛ n ⎞ ⎛ n ⎞ ⎛ 56 ⎞ ⎛ 56 ⎞ ⎜ ⎟ + ⎜ + 1⎟ ⎜ ⎟ + ⎜ + 1⎟ 2 2 ⎠ ⎝2⎠ ⎝2 ⎠ = 28 o e 29 o elementos mˆ d = ⎝ ⎠ ⎝ = 2 2 61 Medidas de Achatamento ou Curtose Exemplo: Dada a distribuição, determinar os Quartis (Q1 e Q3) e a mediana. Classes fi Fi 7 – 17 17 – 27 6 15 6 21 27 - 37 37 - 47 47 - 57 20 10 5 41 51 56 Q1 = LQ1 + ( n / 4) − Fa h f Q1 mˆ d = Li + (n / 2) − Fa hmd f md Q3 = LQ3 + (3n / 4) − Fa h f Q3 Para Q3 temos: Para m̂ d temos: Para Q1 temos: n = 56 F = 21 ; a ; LQ = 37 ; n = 56 ; Fa LQ = 17 ; n = 56 ; Fa = 6 ; Li = 27 ; h = 10 h = 10 ; f mˆ d = 20 h = 10 ; f Q = 15 ; f Q 3 = 10 3 1 1 Introdução à Estatística = 41; 62 31 Medidas de Achatamento ou Curtose Exemplo: Dada a distribuição, determinar os Quartis (Q1 e Q3) e a mediana. ⎛ 56 ⎞ ⎜ − 6⎟ (n / 4) − Fa 2 ⎝ ⎠ .10 = 22,33 Q1 = LQ1 + h = 17 + f Q1 15 mˆ d = Li + (n / 2) − Fa hmd f md ⎛ 56 ⎞ ⎜ − 21⎟ 2 ⎝ ⎠ .10 = 30,50 = 27 + 15 ⎛ 3.56 ⎞ − 41⎟ ⎜ (3n / 4) − Fa 4 ⎠ .10 = 38,00 Q3 = LQ3 + h = 37 + ⎝ fQ3 10 63 Medidas de Achatamento ou Curtose Exemplo: Dada a distribuição, determinar os Quartis (Q1 e Q3) e a mediana. Q1 25% 7 ,00 22 ,33 Q3 Q2 25% 30 ,50 25% 38 ,00 25% 57 ,00 64 Introdução à Estatística 32 Medidas de Achatamento ou Curtose Decis => são os valores que dividem um conjunto de dados em 10 partes iguais. 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% D1 D5 D2 D3 D4 D6 D7 D8 D9 em que, D1 D2 = o 1º Decil deixa 10% dos elementos; ... = o 2º Decil deixa 20% dos elementos; ... D9 = o 9º Decil deixa 90% dos elementos. 65 Medidas de Achatamento ou Curtose Determinação de um Decil Di: (i) Calcula-se: i.N em que i = 1, 2, ..., 9; 10 (ii) Identifica-se a classe de Di pela Fi (freq. acumulada); (iii) Aplica-se a fórmula: Di = Li + em que, (i.N / 10) − Fa h f Di Li = limite inferior da classe Di ; n = tamanho da amostra; Fa = soma das freqüências das classes anteriores a que Di ;fDi= freqüência da classe Di; h = amplitude da classe Di. Introdução à Estatística 66 33 Medidas de Achatamento ou Curtose Percentis => são os valores que dividem um conjunto de dados em 100 partes iguais. 0% 1% 2% 3% ... 50% ... P1 P2 P3 ... P50 ... 97% 98% 99% 100% P97 P98 P99 em que, P1 P2 = o 1º Percentil deixa 1% dos elementos; ... = o 2º Percentil deixa 2% dos elementos; ... P99 = o 99º Percentil deixa 99% dos elementos. 67 Medidas de Achatamento ou Curtose Determinação de um Percentil Pi: i.N em que i = 1, 2, ..., 98, 99; 100 (ii) Identifica-se a classe de Pi pela Fi (freq. acumulada); (i) Calcula-se: (iii) Aplica-se a fórmula: Pi = Li + em que, (i.N / 100) − Fa h f Pi Li = limite inferior da classe Pi; n = tamanho da amostra; Fa = soma das freqüências das classes anteriores a que Pi; fPi= freqüência da classe Pi; h = amplitude da classe Di. Introdução à Estatística 68 34 Medidas de Achatamento ou Curtose Exemplo: Dada a distribuição, determinar o Grau de Curtose (K). Classes 7 – 17 17 – 27 27 - 37 37 - 47 47 - 57 fi 6 15 20 10 5 Fi 6 21 41 51 56 K= Q3 − Q1 2( P90 − P10 ) Já tínhamos obtidos: Q1 = 22,33 e Q3 = 38,00 Pi = Li + (i.N / 100) − Fa h f Pi Para P90 temos: Para P10 temos: LP10 = 7 ; n = 56 ; Fa = 0; LP90 = 37 ; n = 56 ; Fa = 41 ; h = 10 ; f P10 = 6 h = 10 ; f P90 = 10 P90 = 46,40 P10 = 16,33 69 Medidas de Achatamento ou Curtose Exemplo: Dada a distribuição, determinar o Grau de Curtose (K). Classes 7 – 17 17 – 27 27 - 37 37 - 47 47 - 57 K= Q3 − Q1 2( P90 − P10 ) fi Fi K= 6 15 20 10 5 6 21 41 51 56 Agora temos tudo: Q1 = 22,33 e Q3 = 38,00 P10 = 16,33 e P90 = 46,40 Q3 − Q1 38,00 − 22,33 = = 0,2606 2( P90 − P10 ) 2(46,40 − 16,33) 70 Introdução à Estatística 35 Medidas de Achatamento ou Curtose Assim o Grau de Curtose, de ser classificado da seguinte forma: K= Q3 − Q1 2( P90 − P10 ) K = 0 , 263 => Distribuição de freqüência Mesocúrtica; K > 0 , 263 => Distribuição de freqüência Platicúrtica; K < 0 , 263 => Distribuição de freqüência Leptocúrtica. 71 Introdução à Estatística 36