CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE Número de classes a considerar (k): a) Tabela de Truman L. Kelley n k 5 2 10 4 25 6 50 8 100 10 200 12 500 15 1000 15 b) k=5 para n≤25 e ≅ √ para n >25. c) Fórmula de Sturges: ≅ + , , em que n é a dimensão da amostra. Etapas para a construção de tabelas de frequência (dados contínuos ou discretos com valores muito distintos): 1) Definição das classes a) Determinar a amplitude da amostra (máximo - mínimo) b) Dividir esta amplitude pelo número de classes, k. c) Tomar para amplitude de classe, h, um valor aproximado por excesso do valor obtido em b). d) Construir as classes de modo a que tenham todas a mesma amplitude e cuja união contenha todos os elementos da amostra. 2) Contagem do número de elementos de cada classe. Exemplo: Consideremos a amostra constituída pelas notas obtidas num ponto de Geografia, de uma determinada turma: 12.1 7.5 15.5 8.9 8.8 7.8 16.2 12.4 12.5 8.2 16.1 13.2 15.1 15.2 11.0 14.5 13.5 10.5 13.4 13.8 9.8 14.7 14.6 1 Tabela de frequências da distribuição das notas de Geografia Frequência Frequência Absoluta relativa [7.5, 9.3[ 5 0.218 [9.3 , 11.1[ 3 0.130 [11.1, 12.9[ 3 0.130 [12.9, 14.7[ 6 0.261 [14.7, 16.5[ 6 0.261 Total 23 1 Classes 2 MEDIDAS DE TENDÊNCIA CENTRAL A) Média Aritmética Caso de Dados não agrupados 1 = = Caso de Dados agrupados Obs. : 1 = , com i=1, 2, …, n representa todos os valores observados, pelo que alguns deles podem ser iguais. , com i=1, 2, …, m representa todos os valores diferentes observados, pelo que alguns deles podem ser iguais. Fi – frequência absoluta para fi – frequência relativa para No caso de dados agrupados em classes considera-se para valores os valores médios desses intervalos ( é o representante da classe). 3 B) Mediana , , … , Sendo valores ordenados (por ordem crescente ou n decrescente) de uma variável quantitativa, mediana é o elemento que ocupa a posição central. Caso de variável discreta Se n for ímpar, a mediana será o elemento central (de ordem ). Caso n seja par, a mediana será a média entre os elementos centrais (de ordem e + 1). Caso de variável contínua 1º- Calcula-se a ordem 2º - Pela Fac identifica-se a classe que contém a mediana (classe Md). 3º - Utiliza-se a fórmula: Em que: l ! " − ∑ & . ℎ = l ! + 2 ! - limite inferior da classe Md n - dimensão da amostra ∑f - soma das frequências anteriores à classe Md h - amplitude da classe Md FMd- frequência da classe Md 4 C) Moda Caso de variável discreta Determinar a moda num conjunto de dados deste tipo, não é mais do que verificar o valor que se apresentou mais vezes. Caso de variável contínua Fórmula de Czuber 1º - Identifica-se a classe modal 2º- Aplica-se a fórmula: )* = l + Em que: ∆ ℎ ∆ + ∆ l - limite inferior da classe modal ∆1 - diferença entre a frequência da classe modal e a anterior ∆2 - diferença entre a frequência da classe modal e a posterior h - amplitude da classe. 5 QUANTIS, DECIS E PERCENTIS A) Quartis Os quartis dividem um conjunto de dados em 4 partes iguais. Assim: O primeiro quartil, Q1, é o valor que divide a sequência em duas partes, de tal modo que pelo menos esse valor e valor; , , ou 25% das observações sejam iguais ou inferiores a ou 75% das observações sejam superiores ou iguais a esse O terceiro quartil, Q3, é o valor que divide a sequência em duas partes, de tal modo que pelo menos esse valor e valor. , , ou 75% das observações sejam iguais ou inferiores a ou 25% das observações sejam superiores ou iguais a esse Caso de variável discreta +2 4 +1 4 Localização de Q1 n par n ímpar 3 + 2 4 +1 30 1 4 Localização de Q3 Caso de variável contínua Determinação de Q1 1º- Calcula-se a ordem , 2º -Pela Fac identifica-se a classe que contém Q1 3º- Utiliza-se a fórmula: 2 = l 3 + "4 − ∑ & . ℎ 34 6 Determinação de Q3 1º- Calcula-se a ordem - , 2º -Pela Fac identifica-se a classe que contém Q3 3º- Utiliza-se a fórmula: 3 − ∑ & . ℎ 2- = l 3- + 4 35 " 7 B) Decis São os valores que dividem a série em 10 partes iguais 1º- Calcula-se a ordem . 6 , em que i=1, 2, 3, 4, 5, 6, 7, 8, 9 2º -Pela Fac identifica-se a classe que contém Di 3º- Utiliza-se a fórmula: 7 = l 8 + 9 Em que: :. " 10 − ∑ & . ℎ 89 l 8 - limite inferior da classe Di, i=1, 2, 3, …, 9 9 n - dimensão da amostra ∑f - soma das frequências anteriores à classe Di h - amplitude da classe FDi - frequência da classe Di 8 C) Percentis São as medidas que dividem a amostra em 100 partes iguais 1º- Calcula-se a ordem . 66 , em que i=1, 2, 3, …, 99 2º - Pela Fac identifica-se a classe que contém Pi 3º- Utiliza-se a fórmula: < = l = + 9 Em que: :. "100 − ∑ & . ℎ =9 l = – limite inferior da classe Pi, i=1, 2, 3, …, 99 9 n - dimensão da amostra ∑f - soma das frequências anteriores à classe Pi h - amplitude da classe FPi - frequência da classe Pi 9 MEDIDAS DE DISPERSÃO A) Amplitude Total É a diferença entre o maior e o menor valor da série estatística. B) Desvio Médio É a média dos valores absolutos dos desvios. Dados não agrupados 1 > = | − | Dados agrupados 1 > = | − | Sendo: m - número de classes Fi - frequência absoluta xi - representante da classe n - dimensão da amostra 10 C) Desvio Padrão Dados não agrupados Dados agrupados 1 @ = A B − C 1 @ = A B − C Sendo: m- número de classes Fi – frequência absoluta xi – representante da classe n – dimensão da amostra Obs. Para valores reduzidos de n é usual utilizar o desvio padrão corrigido da amostra (dados não agrupados): 1 @=A B − C −1 11 D) Variância O quadrado de S é designado por variância da amostra Dados não agrupados Dados agrupados 1 @ = B − C 1 @ = B − C Sendo: m- número de classes Fi – frequência absoluta xi – representante da classe n – dimensão da amostra Obs. Para valores reduzidos de n é usual utilizar a variância corrigida da amostra (dados não agrupados): 1 @ = B − C −1 E) Coeficiente de Variação DE = @ G X 12