CRITÉRIOS PARA A DETERMINAÇÃO DOS INTERVALOS DE CLASSE
Número de classes a considerar (k):
a) Tabela de Truman L. Kelley
n
k
5
2
10
4
25
6
50
8
100
10
200
12
500
15
1000
15
b) k=5 para n≤25 e ≅ √ para n >25.
c) Fórmula de Sturges: ≅ + , , em que n é a dimensão da
amostra.
Etapas para a construção de tabelas de frequência (dados contínuos
ou discretos com valores muito distintos):
1) Definição das classes
a) Determinar a amplitude da amostra (máximo - mínimo)
b) Dividir esta amplitude pelo número de classes, k.
c) Tomar para amplitude de classe, h, um valor aproximado por
excesso do valor obtido em b).
d) Construir as classes de modo a que tenham todas a mesma
amplitude e cuja união contenha todos os elementos da amostra.
2) Contagem do número de elementos de cada classe.
Exemplo:
Consideremos a amostra constituída pelas notas obtidas num ponto de
Geografia, de uma determinada turma:
12.1
7.5
15.5
8.9
8.8
7.8
16.2
12.4
12.5
8.2
16.1
13.2
15.1
15.2
11.0
14.5
13.5
10.5
13.4
13.8
9.8
14.7
14.6
1
Tabela de frequências da distribuição das notas de Geografia
Frequência
Frequência
Absoluta
relativa
[7.5, 9.3[
5
0.218
[9.3 , 11.1[
3
0.130
[11.1, 12.9[
3
0.130
[12.9, 14.7[
6
0.261
[14.7, 16.5[
6
0.261
Total
23
1
Classes
2
MEDIDAS DE TENDÊNCIA CENTRAL
A) Média Aritmética
Caso de Dados não agrupados
1
= = Caso de Dados agrupados
Obs. :
1
= , com i=1, 2, …, n representa todos os valores observados, pelo que
alguns deles podem ser iguais.
, com i=1, 2, …, m representa todos os valores diferentes observados,
pelo que alguns deles podem ser iguais.
Fi – frequência absoluta para fi – frequência relativa para No caso de dados agrupados em classes considera-se para valores os
valores médios desses intervalos ( é o representante da classe).
3
B) Mediana
, , … , Sendo
valores ordenados (por ordem crescente ou
n
decrescente) de uma variável quantitativa, mediana é o elemento que ocupa a
posição central.
Caso de variável discreta
Se n for ímpar, a mediana será o elemento central (de ordem
).
Caso n seja par, a mediana será a média entre os elementos centrais (de
ordem
e
+ 1).
Caso de variável contínua
1º- Calcula-se a ordem
2º - Pela Fac identifica-se a classe que contém a mediana (classe Md).
3º - Utiliza-se a fórmula:
Em que:
l
!
" − ∑ & . ℎ
= l ! + 2
!
- limite inferior da classe Md
n - dimensão da amostra
∑f - soma das frequências anteriores à classe Md
h - amplitude da classe Md
FMd- frequência da classe Md
4
C) Moda
Caso de variável discreta
Determinar a moda num conjunto de dados deste tipo, não é mais do que
verificar o valor que se apresentou mais vezes.
Caso de variável contínua
Fórmula de Czuber
1º - Identifica-se a classe modal
2º- Aplica-se a fórmula:
)* = l +
Em que:
∆
ℎ
∆ + ∆
l - limite inferior da classe modal
∆1 - diferença entre a frequência da classe modal e a anterior
∆2 - diferença entre a frequência da classe modal e a posterior
h - amplitude da classe.
5
QUANTIS, DECIS E PERCENTIS
A) Quartis
Os quartis dividem um conjunto de dados em 4 partes iguais. Assim:
O primeiro quartil, Q1, é o valor que divide a sequência em duas partes, de tal
modo que pelo menos
esse valor e
valor;
,
,
ou 25% das observações sejam iguais ou inferiores a
ou 75% das observações sejam superiores ou iguais a esse
O terceiro quartil, Q3, é o valor que divide a sequência em duas partes, de tal
modo que pelo menos
esse valor e
valor.
,
,
ou 75% das observações sejam iguais ou inferiores a
ou 25% das observações sejam superiores ou iguais a esse
Caso de variável discreta
+2
4
+1
4
Localização de Q1
n par
n ímpar
3 + 2
4
+1
30
1
4
Localização de Q3
Caso de variável contínua
Determinação de Q1
1º- Calcula-se a ordem
,
2º -Pela Fac identifica-se a classe que contém Q1
3º- Utiliza-se a fórmula:
2 = l 3 +
"4 − ∑ & . ℎ
34
6
Determinação de Q3
1º- Calcula-se a ordem
-
,
2º -Pela Fac identifica-se a classe que contém Q3
3º- Utiliza-se a fórmula:
3
− ∑ & . ℎ
2- = l 3- + 4
35
"
7
B) Decis
São os valores que dividem a série em 10 partes iguais
1º- Calcula-se a ordem
.
6
, em que i=1, 2, 3, 4, 5, 6, 7, 8, 9
2º -Pela Fac identifica-se a classe que contém Di
3º- Utiliza-se a fórmula:
7 = l 8 +
9
Em que:
:. " 10 − ∑ & . ℎ
89
l 8 - limite inferior da classe Di, i=1, 2, 3, …, 9
9
n - dimensão da amostra
∑f - soma das frequências anteriores à classe Di
h - amplitude da classe
FDi - frequência da classe Di
8
C) Percentis
São as medidas que dividem a amostra em 100 partes iguais
1º- Calcula-se a ordem
.
66
, em que i=1, 2, 3, …, 99
2º - Pela Fac identifica-se a classe que contém Pi
3º- Utiliza-se a fórmula:
< = l = +
9
Em que:
:. "100 − ∑ & . ℎ
=9
l = – limite inferior da classe Pi, i=1, 2, 3, …, 99
9
n - dimensão da amostra
∑f - soma das frequências anteriores à classe Pi
h - amplitude da classe
FPi - frequência da classe Pi
9
MEDIDAS DE DISPERSÃO
A) Amplitude Total
É a diferença entre o maior e o menor valor da série estatística.
B) Desvio Médio
É a média dos valores absolutos dos desvios.
Dados não agrupados
1
> = | − |
Dados agrupados
1
> = | − |
Sendo:
m - número de classes
Fi - frequência absoluta
xi - representante da classe
n - dimensão da amostra
10
C) Desvio Padrão
Dados não agrupados
Dados agrupados
1
@ = A B − C
1
@ = A B − C
Sendo:
m- número de classes
Fi – frequência absoluta
xi – representante da classe
n – dimensão da amostra
Obs. Para valores reduzidos de n é usual utilizar o desvio padrão corrigido da
amostra (dados não agrupados):
1
@=A
B − C
−1
11
D) Variância
O quadrado de S é designado por variância da amostra
Dados não agrupados
Dados agrupados
1
@ = B − C
1
@ = B − C
Sendo:
m- número de classes
Fi – frequência absoluta
xi – representante da classe
n – dimensão da amostra
Obs. Para valores reduzidos de n é usual utilizar a variância corrigida da
amostra (dados não agrupados):
1
@ =
B − C
−1
E) Coeficiente de Variação
DE =
@
G
X
12
Download

critérios para a determinação dos intervalos de classe