ESTATÍSTICA
DECRITIVA
CURSO DE SI
FATEC/FUNCESI 2004-1
Questões
1) Como obter dados confiáveis?
2) Como coletá-los?
3) Como tratá-los corretamente?
4) Qual a melhor forma de
representação?
5) Qual conclusões eles nos
proporcionam?
Estatística Descritiva
Compreende:
1) Descrição (questionário e relatórios)
2) Tabulação (planilhas e tabelas)
3) Representação em forma visual
adequada (Gráficos)
4) Cálculo de medidas de tendência
central e variabilidade
MEDIDAS DE
TENDÊNCIA CENTRAL
1 - MÉDIA ARITMÉTICA
SIMPLES
Somam-se todos os dados e
divide-se o resultado pelo
número dos dados.
FÓRMULA
n
x1  x 2  x 3  ...  x n
x

n
40  56  38  38  63  59  52  49  46
x 
i 1
n
441

9
x
 49, 0
9
i
MEDIDAS DE
TENDÊNCIA CENTRAL
2 - MEDIANA
É o resultado que representa o ponto médio
de uma série de dados ordenados, isto é,
metade estão acima e outra metade
abaixo.
Procedimento:
• Ordena-se o conjunto de dados
• Se o conjunto for ímpar = dado do meio (metade
abaixo e metade acima)
• Se for par = média aritmética dos dados centrais
MEDIDAS DE
TENDÊNCIA CENTRAL
3 - MODA
É o valor que ocorre com maior
freqüência
Procedimento:
Toma-se o conjunto de daos e verificase o que mais se repete.
EXERCÍCIOS
1) Calcular a média aritmética, a
mediana e a moda das idades,das
alturas e dos pesos dos alunos desta
turma
2) Qual melhor representa a realidade
da turma? Por que?
3) Represente as 3 medidas numa reta
ordenada e faça a comparação
MEDIDAS DE DISPERSÃO
Dispersão = Grau de afastamento de um
conjunto de dados de sua média.
Representa o grau de homogeneidade ou
heterogeneidade do conjunto.
1 - AMPLITUDE
Distância entre o dado de maior grandeza e
o de menor grandeza. Sensível a valores
muito grandes ou muito pequenos.
Exercício: Calcular a amplitude entre
as idades dos alunos desta sala
MEDIDAS DE
DISPERSÃO
2 - INTERVALO INTERQUARTIL (IIQ)
Distância entre o dado do 3º
quartil e do 1º quartil.
Exercícios: na folha à parte
MEDIDAS DE
DISPERSÃO
3 - DESVIO MÉDIO ABSOLUTO
Média aritmética dos desvios
absolutos entre todos os
dados observados e a média
aritmética desses dados.
Exercícios: na folha à parte
MEDIDAS DE
DISPERSÃO
4 – DESVIO MÉDIO ABSOLUTO
Dá a distância média de cada dado
em relação à média da amostra.
Fórmula:
D.M.A 
x1 x  x 2 x  x 3 x  ...  x n x
n
MEDIDAS DE
DISPERSÃO
5 – VARIÂNCIA
É mais conveniente que o D.M.A. É a
soma dos quadrados dos desvios de
cada dados em relação à média,
dividido por n.
Fórmula:
n
( x1  x)  ( x2  x)  ( x3  x)  ...  ( xn  x)
 

n
2
2
2
2
2
2
(
x

x
)

i 1
n
MEDIDAS DE
DISPERSÃO
6 - DESVIO PADRÃO
n
( x1  x) 2  ( x2  x) 2  ( x3  x) 2  ... ( xn  x) 2


n
2
(
x

x
)

i 1
n
MEDIDAS DE
DISPERSÃO
VARIÂNCIA E DESVIO PADRÃO
AMOSTRAL
2
2
2
2
n
(
x

x
)

(
x

x
)

(
x

x
)

...

(
x

x
)
( xi  x )
2
1
2
3
n
s 

n1
i 1 n  1
( x1  x ) 2  ( x 2  x ) 2  ( x 3  x ) 2  ...  ( x n  x ) 2
s

n1
( xi  x )

n1
i 1
n
MEDIDAS DE
DISPERSÃO
7 – COEFICIENTE DE VARIAÇÃO
Fórmula:
desvio  padrão

Coefic . var iação 

média
x
REPRESENTAÇÃO DE
DADOS
8 – TABELAS E QUADROS
É a forma mais comum de apresentação de
relatórios técnicos. Segue normas
metodológicas rígidas (Norma ABNT). Em
monografias, por exemplo, os dados
devem ficar em anexo e deve-se
transcrever para o corpo do texto apenas
as tabelas e quadros, fazendo –se
referência à fonte e ao anexo para
checagem do leitor.
REPRESENTAÇÃO DE
DADOS
9 – GRÁFICOS
O gráfico é um método de representação dos dados
que permite uma melhor comunicação com o
leitor. Traduz a intenção do relator em realçar ou
esconder determinado dado. A escolha da escala,
da cor, da textura traduzem esta intenção. É uma
forma elegante de representação e
tecnicamente muito bem aceita.
REPRESENTAÇÃO DE
DADOS
10 - PRINCIPAIS TIPOS DE GRÁFICOS:
• Gráficos de barras
• Gráficos de setores (pizza)
• Gráficos de pontos
• Gráficos de dispersão
• Gráficos de linha
• Pictogramas
• Histogramas diagramas de freqüência
DADOS AGRUPADOS
11- Histogramas
Os gráficos, às vezes, não ficam bem
quando tenho uma relação longa de
dados. Para melhor visualização e
precisão nas estatísticas, precisamos
agrupá-los convenientemente. Existem
softwares que fazem isso para nós:
SAS, SPSS, Minitab.
PROCESSO DE
AGRUPAMENTO
1) Decidir o número de classes de sua
tabela (sugerido: entre 5 e 20 classes)
2) Determinar a amplitude de classe,
divide-se a amplitude pelo numero de
classes (arredonde para mais
3) Escolher como limite inferior da
primeira classe o menor valor
observado ou ligeiramente inferior
EXERCÍCIO 1: Fazer isso para os dados
de idade de sua turma.
PROCESSO DE
AGRUPAMENTO
4) Some a amplitude da classe ao menor
valor e obtenha a segunda classe e
assim sucessivamente até completar o
número de classes escolhidas.
5) Faça uma coluna com esses limites de
classe
6) Conte os elementos agrupando-os em
cada intervalo de classe (use traços)
7- Represente estas contagens num gráfico.
EXERCÍCIO 2: Fazer os passos de 4 a 7 para os
dados anteriores.
EXERCÍCIO 3: Repetir os passos de 1 a 7 para peso
e altura.
ESTATÍSTICAS DE DADOS
AGRUPADOS
12- Média aritmética ponderada
n
f1 x1  f 2 x2  f 3 x3  ...  f n xn
x

n
fx
i i
i 1
n
n  f1  f 2  f 3  ...  f n
ESTATÍSTICAS DE DADOS
AGRUPADOS
13- Mediana
( N / 2  n L )w
Mediana  x L 
Onde:
nm
xL= limite inferior da classe da mediana
N = Total de elementos da amostra
nL = Número de elementos da classe abaixo da
mediana
nm= número de elementos da classe mediana
w = amplitude da classe da mediana
ESTATÍSTICAS DE DADOS
AGRUPADOS
PERCENTIL
(0,01* kN  n L ) w
Pk  x L 
nm
Pk = Percentil k (1  k  100)
xL= limite inferior da classe do percentil
N = Total de elementos da amostra
nL = Número de elementos da classe abaixo do
percentil
nm= número de elementos da classe percentil
w = amplitude da classe do percentil
ESTATÍSTICAS DE DADOS
AGRUPADOS
14 - Moda
É o ponto médio do intervalo de
classe com maior freqüência.
Pode ser mais de uma como nos
dados desagrupados
ESTATÍSTICAS DE DADOS
AGRUPADOS
15 - Variância


f1 ( xi  x)  f1 xi   f1 xi 


Var( x)  i 1
 i 1
  i 1
 n 
n
n




m
m
2
2
m
2
ESTATÍSTICAS DE DADOS
AGRUPADOS
16 - Desvio Padrão
(raiz quadrada da variância)


f1 ( xi  x)
f1 xi   f1 xi 



D.Padrão( x)  i 1
 i 1
  i 1
 n 
n
n




m
m
2
2
m
2
ESTATÍSTICAS DE DADOS
AGRUPADOS
17 – Variância e Desvio Padrão
Amostral
n
s
2

 (x
i 1
i
n 1
n
s

 x)
 (x
i 1
i

2
 x)
n 1

2
n
n 1
n
n 1
ESTATÍSTICAS DE DADOS
AGRUPADOS
18 – Polígono de Freqüência
É um gráfico de linha que liga os
pontos médios das classes no
histograma.
17 – Ogiva
É um gráfico feito com as freqüências
acumuladas. Representa os valores
abaixo do limite superior da classe.
Download

POR QUE ESTATÍSTICA?