ESTATÍSTICA I
Estatística I
Definição
Antonio A. Crespo define Estatística como :
Estatística é uma parte da matemática aplicada
que fornece métodos para a coleta, a organização,
a descrição, a análise e a interpretação de dados
quantitativos e qualitativos, e a utilização desses
dados para a tomada de decisão.
Análise Exploratória de Dados
Introdução
População
(características)
Técnicas de
Amostra
Amostragem
Análise
Exploratória
Conclusões
sobre as
características
da população
AES
Inferência
Estatística
Informações
contidas nos
dados
Análise Exploratória de Dados
Utilidade da Estatística na Gestão
A Estatística permite:
• Resolver problemas mediante a coleta de dados de boa qualidade
• Argumentar utilizando dados
• Analisar e interpretar dados
• Detectar situações fora de controle e outras fontes de dificuldades que
requerem atenção e medidas corretivas
• Coletar evidências para fins legais
•Determinar ociosidade de recursos e eficiência na utilização dos
mesmos
•Determinar custos de atividades, de produtos, de unidades
organizacionais etc
•Melhorar a qualidade de dados, desempenhos, decisões, ações,
produtos, processos e serviços
Análise Exploratória de Dados
Algumas Dificuldades com a Estatística
•
Culturais / Rejeição às "matemáticas" / Contato
prematuro inadequado
•
“Invisibilidade” da Estatística
•
Armadilha da atividade
Método Estatístico
O
método
estatístico,
diante
da
impossibilidade de manter as causas
constantes, admite todas as causas
presentes variando-as, registrando essas
variações e procurando determinar, no
resultado final, que influências cabem a
cada uma delas.
MÉTODO ESTATÍSTICO
As fases são :
• Coletas de dados : é a obtenção, reunião e registro sistemático de
dados, com um objetivo determinado.
• Direta : quando é obtida diretamente da fonte e pode ser :
- Contínua : Obtida ininterruptamente
- Registro de nascimentos, etc.
- Periódica : em períodos curtos
- Censos
- Ocasional : esporadicamente
- Surto epidêmico
• Indireta : Quando é inferida ( deduzida ) a partir dos elementos
conseguidos pela coleta direta
- Mortalidade infantil
MÉTODO ESTATÍSTICO
Crítica dos dados :
devem ser criticados à procura de
erros grosseiros ou de certos vultos, que possam influir
sensivelmente nos resultados como:
- Externa :
Informante
- Interna :
dados da coleta
Apuração dos dados :é a soma e o processamento dos
dados obtidos e a disposição mediante critérios de
classificação.
AES
MÉTODO ESTATÍSTICO
Exposição dos dados : devem ser apresentados sob forma de
tabelas ou gráficos tornando mais fácil e
compreensão do objeto de tratamento
estatístico
Análise dos resultados : É o estudo dos resultados com o objetivo
de tirar conclusões sobre o todo
(população), a partir de informações
fornecidas por parte representativa do
todo ( amostra).
AES
População e Amostra
População : é o conjunto de entes
portadores de , pelo menos, uma
característica comum
Amostra :
é um subconjunto finito
de uma população
POPULAÇÃO E AMOSTRA
Devido a quantidade
excessivamente grande de elementos que
constantemente fazem parte da população, trabalhamos com uma
amostra.
O aspecto comum dentre todas as técnicas existentes é a aleatoriedade,
isto é, a igual chance que cada elemento da população deve ter de ser
escolhido, as principais:
a) Casual Simples -
sorteio
b) Sistemática - Os elementos já se encontram ordenados e então,
sorteamos um número e sistematicamente os outros ficam determinados
c) Estratificada - Quando a população esta dividida em estratos de
acordo com o fato em estudo
Variável
Variável - é convencionalmente, o conjunto de
resultados possíveis de um fenômeno.
Tipos de variáveis:
Nominais
Qualitativas
Ordinais
Variáveis
Discretas
Quantitativas
Contínuas
Variável
Exemplo ( Variáveis em uma ficha cadastral PF )
Variável
1
Número de dependentes
Quantitativa, discreta
2
Idade
Quantitativa, contínua
3
Local de nascimento
Qualitativa, nominal
4
Nível educacional
Qualitativa, ordinal
5
6
7
8
AES
Tipo
Variável
DISCRETA - É uma representação tabular de um conjunto de
valores em que colocamos na primeira coluna em ordem crescente
apenas os valores distintos de série e na segunda coluna
colocamos os valores das freqüências simples correspondentes.
Devemos optar por uma variável discreta na representação de uma
série de valores quando o número de elementos distintos da série
for pequeno
xi = número de
fi = freqüência
filhos
absoluta
0
1
1
5
2
6
3
10
total
22
Variável
CONTÍNUA - É uma representação tabular de um conjunto de
valores em que colocamos na primeira coluna faixa de valores
agrupados em ordem crescente da série e na segunda coluna
coloca os valores das freqüências simples correspondentes.
Devemos optar por uma variável contínua na representação de uma
série de valores quando o número de elementos distintos da série
for grande.
xi = número de
fi = freqüência
filhos
absoluta
AES
2 /------ 4
4
4 /------ 6
12
6 /------ 8
10
8 /------ 10
4
total
30
Conceitos a serem aplicados
- Amplitude total de uma seqüência = é a diferença entre o Limite
superior e o Limite inferior de uma seqüência. At = Ls – Li
- Intervalo de Classe = é qualquer subdivisão da amplitude total de uma
série estatística.
2 /------ 4
- Limite de Classe = cada intervalo de classe fica caracterizado por dois
números reais. O menor valor chamado de Limite inferior (Li) da classe
e o maior valor chamado de Limite superior (Ls) da classe.
2 = Li
e
4 = Ls
- Amplitude do intervalo de classe = é a diferença entre o Ls e o Li do
intervalo de classe. A = Ls – Li  4-2 = 2  A = 2
- Freqüência simples ou absoluta de uma classe (fi) = é o número de
elementos da seqüência que são maiores ou iguais ao Li desta classe e
menores que o Ls desta classe.
Distribuição de Freqüências
Freqüência Relativa (fir%) = é a divisão
da freqüência simples deste elemento
pelo número total de elementos da série:
fir = fi / n onde n ou somatória de fi,
é o número total de elementos da série.
Ex: fir = 4 / 30 = 0,1333 ou 13,33%
Distribuição de Freqüências
Freqüência Acumulada direta (fad) = é a
soma de fi simples deste elemento com as fi
dos elementos que o antecedem.
fad = fi1 + fi2 + fi3 ...fin
Freqüência acumulada relativa (fr) ou
percentual = é a divisão da freqüência
acumulada deste elemento pelo número
total de elementos da série.
AES
Distribuição de Freqüências
AES
xi
fi
fi %
fad
Fad %
0
1
3,33
1
3,33
1
5
16,67
6
20,00
2
6
20,00
12
40,00
3
10
33,34
22
73,34
4
4
13,33
26
86,67
5
4
13,33
30
100
Total
30
100
Distribuição de Freqüências
xi
fi
fir%
fiac
firac%
2 /------ 4
4
13,33
4
13,33
4 /------ 6
12
40,00
16
53,33
6 /------ 8
10
33,34
26
86,67
8 /------ 10
4
13,33
30
100
Total
30
100
Representação Gráfica - Histograma
0,35
0,34
0,3
0,26
Proporção
0,25
0,2
0,16
0,15
0,12
0,1
0,04
0,05
0,04
0,02
0,02
553,5
61,5
0
5,5
13,5
21,5
29,5
37,5
Tributo ( % faturam ento )
45,5
Representação Gráfica - Histograma
Histograma
Área = 1.00 ( ou 100% )
Área ~ freqüência ( f ou p )
Classes de mesma amplitude : altura ~ freqüência ( f ou p )
Notas :
Histograma é a representação gráfica adequada para o
caso de variáveis contínuas
Pode ser utilizada para variáveis discretas agrupadas
em classes
Representação Gráfica
Polígono de % acumulada
100
90
80
% acumulada
70
60
50
40
30
20
10
0
1.5
9.5
17.5
25.5
33.5
41.5
Tributo ( % faturamento )
49.5
57.5
65.5
Representação Gráfica
Polígono de % acumulada
Mostra a porcentagem de empresas cujo
recolhimento de tributos é menor ou igual a um dado
valor
Podemos ter também:
Polígono de freqüências acumuladas
Polígono de proporções acumuladas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
Alguns Padrões de Histogramas
AES
Medidas de Tendência Central
• Tendência Central de um conjunto de
dados é a tendência das medidas destes
dados em se acumular em torno de certos
valores numéricos.
Medidas de Tendência Central
• É a soma das medidas dividida pelo número
de elementos do conjunto de dados.
• Vantagens – reflete cada valor e possui
propriedades matemáticas atraentes.
• Limitações – é influenciada por valores
extremos.
Medidas de Tendência Central
Exemplo :
• Calcule a média dos seguintes grupos de dados:
1, 2, 3, 4, 5
e
n
2, 3, 3, 3, 4
x
x
i 1
n
i
Medidas de Tendência Central
Mediana - Para números aleatórios
• É o valor intermediário de um conjunto de medidas
colocadas em ordem crescente (ou decrescente).
Vantagens - muito interessante para grande massa de dados
- divide a área do histograma em partes iguais.
- menos suscetível a valores extremos.
Limitações – difícil de determinar para grande quantidade de
dados.
Medidas de Tendência Central
Média e Mediana
Sua comparação indica a assimetria da distribuição.
Média
Mediana
Medidas de Tendência Central
Moda - Para números aleatórios
•
É a medida que ocorre com maior freqüência no
conjunto de dados.
–
Exemplo:
notas de degustadores de vinho:
8, 7, 9, 6, 8, 10, 9, 9, 5, 7.
Moda: 9
Medidas de Tendência Central
Moda
• Vantagens
- indica onde os dados tendem a se concentrar.
- útil para dados qualitativos (Ex. notas de jurados).
- pode haver mais de uma ou não ter sentido (Ex.
pesquisa de lazer).
• Limitações
- não se presta a análise matemática;
- pode não ser moda para certos conjuntos de dados.
Medidas de Tendência Central
Exemplo:
• Preferência do produto A (em %) colhida em diversas
regiões do Brasil por meio de uma pesquisa de
mercado.
56, 63, 64, 65, 66, 69, 71, 57,
64, 66, 64, 65, 66, 66, 68 e 72.
N = 16
 x = 1042
Média = 65,125
Mediana = 65,5
Moda =66
Medidas de Tendência Central
Média Para variáveis discretas
• Se os dados estão apresentados na forma de uma variável
discreta, utilizamos a média ponderada, considerando as
freqüências (fi) como sendo as ponderações dos elementos
(xi) correspondentes.
xi = número de
filhos
fi = freqüência
absoluta
fi * xi
0
1
0
1
5
5
2
6
12
3
10
30
total
22
47
Média =
47 / 22 =
2,14 filhos
Medidas de Tendência Central
Mediana para variáveis discretas
• Para encontrarmos a mediana, dividimos por dois o total das
freqüências absolutas ( 22 / 2 = 11) e calculamos a Freqüência
acumulada (fiac)
• Procuramos qual xi que conta o número (11) na Fi xi = 2
xi = número de
filhos
fi = freqüência
absoluta
fiac
0
1
1
1
5
6
Mediana = 2
6
12 (11)
3
10
22
total
22
Mediana
= 2 filhos
Medidas de Tendência Central
Moda para variáveis discretas
• Para encontrarmos a moda, basta verificar o elemento xi de maior
freqüência (fi).
xi = número de
filhos
fi = freqüência
absoluta
0
1
1
5
2
6
Moda = 3
10
total
22
Moda = 3 filhos
Medidas de Tendência Central
Média para variáveis contínuas
Se os dados estão apresentados na forma de uma variável
contínua,utilizaremos a média aritmética ponderada, considerando as
freqüências (fi) de cada classe ponderando com o ponto médio destas
classe. PM = ((Li + LS) / 2)
Média = Somatória de PM*fi / somatória de fi
 178 / 30 = 5,93 filhos
xi = número de
filhos
Ponto Médio
(PM)
fi = freqüência
absoluta
PM * fi
2 /------ 4
3
4
12
4 /------ 6
5
12
60
6 /------ 8
7
10
70
8 /------ 10
9
4
36
30
178
total
Medidas de Tendência Central
Mediana para variáveis contínuas
• Para encontrarmos a mediana, dividimos por dois o total das freqüências
absolutas ( 30 / 2 = 15) e calculamos a Freqüência acumulada (fiac)
•Procuramos qual xi que conta o número (15) na fiac  xi = 4 /---6
Este será o intervalo que usaremos como base para resolvermos a fórmula
da mediana.
xi = número de filhos
fi = freqüência
absoluta
fiac
2 /------ 4
4
4
4 /------ 6
12
16 (15)
6 /------ 8
10
26
8 /------ 10
4
30
total
30
Medidas de Tendência Central
Mediana para variáveis contínuas
• Fórmula da Mediana para variáveis contínuas
n / 2  fiacant
m d  Li 
.h
fi
Onde :
Li = Limite inferior do intervalo de classe  4
n = Total de fi  30
fiacant = freqüência acumulada anterior ao intervalo de
classe  4
fi = freqüência do intervalo de classe  12
h = amplitude da classe = Ls – Li  6 – 4 = 2
Medidas de Tendência Central
Mediana para variáveis contínuas
• Então :
30 / 2  4
md  4
.2
12
m d  5,83
Obs: o valor obtido pela fórmula é um valor
aproximado
Medidas de Tendência Central
Moda para variáveis contínuas
• Fórmula da Moda para variáveis contínuas
fipost
m o  Li 
.h
fipost  fiant
Onde :
Li = Limite inferior do intervalo de classe  4
fipost = freqüência absoluta posterior ao intervalo de
classe  10
fiant = freqüência absoluta anterior ao intervalo de
classe  4
h = amplitude da classe = Ls – Li  6 – 4 = 2
Medidas de Tendência Central
Moda para variáveis contínuas
Então:
10
mo 4 
.2
10  4
m o  5,43
Exercícios de aplicação
• A média mínima para aprovação de determinado
produto é 5,0 ppm de Ni. Se um analista, obtem os
resultados 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5 e 4,0 nas
análises de diversas amostras em questão,
pergunta-se: pode ele aprovar o produto?
• Calcule a mediana da seguinte distribuição de
freqüência:
• custos($)450├─550├─650├─750├─850├─950├─1050├─ 1150
•
fi 8
10 11
16
13
5
1
Medidas de Dispersão
• São medidas estatísticas utilizadas para avaliar o grau
de variabilidade ou dispersão, dos valores em torno da
média. Servem para medir a representatividade da
média.
•
•
•
•
Desvio Médio
Variância
Desvio-Padrão
Coeficiente de variação
Medidas de Dispersão
• Desvio Médio = é a média dos desvios dos
valores a contar de média. Ignorando-se o sinal
de diferença
.fi
Medidas de Dispersão
• Variância = é a média dos quadrados dos
desvios dos valores a contar da média,
calculada usando-se n-1 em lugar de n, como
fator de ajuste.

xi  x 

S 
2
n 1
2
.fi
Medidas de Dispersão
• Desvio-padrão = é simplesmente a raiz
quadrada positiva da variância.
s s
2
Medidas de Dispersão
• Coeficiente de variação = trata-se de uma medida
relativa de dispersão útil para a comparação em
termos relativos do grau de concentração em torno
da média de séries distintas.
S
CV  .100
X
Medidas de Dispersão
xi = número
de filhos
fi
xi * fi
xi - x
/xi-x/ * fi
(xi-x)2 * fi
0
1
0
-2,14
2,14
4,58
1
5
5
-1,14
5,7
6,50
2
6
12
-0,14
0,84
0,12
3
10
30
0,86
8,6
7,40
total
22
47
17,28
18,6
Média=2,14
DM =
0,79
S2 =
0,89
S=
0,94
CV =
43,93%
Para variáveis contínuas xi = PM
Exercícios de aplicação
Probabilidade
•Freqüência e probabilidade
•Eventos
•Definição subjetiva de probabilidade
Freqüência é o percentual de ocorrencia de uma
determinada observação dentro de uma amostra
Resultados do lançamento de um dado (n=10 lançamentos)
Resultado
do dado
Número de ocorrências
do resultado (f)
Freqüência
(f/n)
1
1
0,1 ou 10%
2
0
0
3
1
0,1 ou 10%
4
2
0,2 ou 20%
5
3
0,3 ou 30%
6
3
0,3 ou 30%
A medida que a amostra cresce, a freqüência se
estabiliza: temos então a probabilidade
Resultados do lançamento de um dado
n = 50 lançamentos
n=
Resultado
do dado
Núm. de ocorrências
do resultado (f)
Freq.
Rela(f/n)
Número de ocorrências
do resultado (f)
Freqüência
(f/n)
1
11
0,22 ou 22%
1/6 * n
16,7%
2
6
0,12 ou 12%
1/6 * n
16,7%
3
7
0,14 ou 14%
1/6 * n
16,7%
4
7
0,14 ou 14%
1/6 * n
16,7%
5
7
0,14 ou 14%
1/6 * n
16,7%
6
12
0,24 ou 24%
1/6 * n
16,7%
Portanto, a probabilidade pode ser encarada como o limite da freqüência
de um determinado evento dentro da população em estudo
A freqüência pode ser representada graficamente
Representação gráfica dos resultados obtidos no lançamento repetido
de um dado (n = número de lançamentos)
0,4
n = 50
n = 10
n = infinito
0,3
0,2
0,1
0,0
1
2
3
4
5
6
1
2
3
4
5
6
1
2
3
4
5
6
Probabilidade
• Freqüência e probabilidade
• Eventos
– Representações gráficas
– Compostos
– Condicionais
– Dependentes e independentes
• Definição subjetiva de probabilidade
Formas de representação gráfica de eventos
Diagrama de árvore
Diagrama de Venn
A árvore permite a representação exaustiva dos
eventos
Representação dos eventos possíveis para o sexo de
cada criança de um casal que tenha três filhos
Criança 1
Criança 2
M
M
F
M
F
F
Criança 3
M
F
M
F
M
F
M
F
Resultado
final
M, M, M
M, M, F
M, F, M
M, F, F
F, M, M
F, M, F
F, F, M
F, F, F
O diagrama de Venn é adequado ao agrupamentos dos
eventos de interesse
Agrupamento de casais segundo o sexo dos filhos
Casais com
meninos somente
Casais com
meninas somente
Casais com
meninos e meninas
A combinação dos diagramas de árvore e de
Venn permite representações mais complexas
Agrupamento de casais com quatro filhos e pelo menos duas meninas
M
M
F
M
M
F
F
M
M
F
F
M
F
F
M
M, M, M, M
F
M, M, M, F
M
F
M, M, F, M
M, M, F, F
M, F, M, M
M, F, M, F
M
M, F, F, M
F
M, F, F, F
M
F, M, M, M
F
F, M, M, F
M
F
M
F, M, F, M
F, M, F, F
F, F, M, M
F
F, F, M, F
M
F, F, F, M
F, F, F, F
F
M
F
Agrupamento
dos resultados
que apresentem
ao menos
duas meninas.
Dependência e independência são termos que
obedecem a regras precisas
Exemplo de evento independente
Probabilidade de ocorrência do número 6 em um lançamento de dado,
condicionado ao resultado anterior ter sido 3.
Resultado 1 Resultado 2 Probabilidade
3
Lançamento
já realizado
e resultado
conhecido!
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6
•O resultado conhecido do primeiro lançamento não altera a probabilidade de
ocorrência do número 6 no segundo lançamento
•Mais formalmente, o evento B é independente se: P(B) = P(B | A)
Dependência e independência são termos que
obedecem a regras precisas
Exemplo de evento dependente
•Probabilidade de uma pessoa consumir requeijão e manteiga,
dado que ela consome manteiga
RM = 50
130
•P(RM) = 50/300 =
1/6
200
Requeijão (R)
•P(RM | M) =
(50/300) / (200/300) =
1/4
Manteiga (M)
Não é consumidor: 20
•O resultado conhecido do consumo de manteiga altera a probabilidade
de ocorrência do consumo dos dois produtos
Mais formalmente, o evento B é dependente se:P(B)  P(B | A)
Eventos compostos são formados por dois ou mais eventos
Exemplos de eventos compostos
• Um casal com três crianças ter somente meninos
• Um casal com três crianças ter uma ou duas
meninas
• Um consumidor comprar requeijão e manteiga
O termo eventos condicionais indica que a ocorrência
de um está condicionada à do outro
Descrição do caso
•
•
Uma pesquisa com 300 pessoas, realizada
em um supermercado, teve os seguintes
resultados:
– 130 pessoas consomem requeijão
– 200 pessoas consomem manteiga
– 50 pessoas consomem os dois
produtos
– 20 pessoas não consomem nenhum
dos dois
Sabendo que uma pessoa escolhida ao
acaso é consumidora de manteiga, qual é a
probabilidade de que ela também consuma
requeijão?
Manteiga
Tabela de
respostas
Sim Não
Total
Sim
50
80
130
Não
150
20
170
Requeijão
Total
200 100 300
Em casos como esse, uma parte da incerteza já foi
eliminada
Após a escolha do consumidor
RM = 50
130
Requeijão (R)
200
Manteiga (M)
Antes da escolha do consumidor
RM = 50
200
Manteiga (M)
Não é consumidor: 20
•Probabilidade de a pessoa ser
consumidora dois produtos: P(RM) =
50/300 = 1/6
Neste caso, a incerteza é total. Você não
sabe nada sobre a pessoa que foi escolhida.
Portanto, a probabilidade de que ela
consuma os dois produtos é simplesmente
a freqüência de ocorrência desse tipo de
consumidor na amostra
•Probabilidade de a pessoa ser
consumidora dois produtos, condicionado
a ela consumir manteiga: P(RM | M) =
50/200 = 1/4
Sinal “condicionado a”
•Neste caso, você sabe que pessoa
consome manteiga, portanto os outros
grupos de consumidores não devem ser
considerados no cálculo. Em outras
palavras, uma parte da incerteza foi
eliminada.
Às vezes, não se pode determinar a probabilidade de um
evento, ou pode ser muito demorado e custoso fazê-lo
Exemplos de eventos cuja probabilidade de ocorrência não pode ser
(facilmente) determinada
Evento
Comentário
•
Probabilidade de um time ganhar
de outro em uma partida de futebol
Probabilidade não pode ser determinada
•
Probabilidade de o mercado
acionário subir amanhã
Probabilidade não pode ser determinada
•
Probabilidade de o lançamento de
um novo produto ser um sucesso
Probabilidade pode ser estimada através de
pesquisa de mercado, porém:
Estudo pode ser muito caro
Pesquisa não fornece, nem pode
fornecer, 100% de certeza sobre o
resultado do lançamento do produto
Probabilidade
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Binomial
– Poisson
• Distribuições contínuas de probabilidade
– Normal
Probabilidade
• Distribuição de probabilidade
– Uma distribuição de probabilidade é uma
distribuição de freqüências para os resultados de um
espaço amostral (isto é, para os resultados de uma
variável aleatória).
Probabilidade
• Distribuições descontínuas de probabilidade
– Binomial – Usa-se o termo binomial para designar situações em
que os resultados de uma variável aleatória podem ser agrupados
em duas classes ou categorias.
– A utilização da binomial, exige certas hipótese como:
• Há n observações ou provas idênticas
• Cada prova tem dois resultados possíveis, um chamado “sucesso” e o
outro “fracasso”.
• As probabilidades p de sucesso e 1 – p de fracasso permanecem
constantes em todas as provas.
• Os resultados das provas são independentes uns dos outros.
Probabilidade
• Distribuições descontínuas de probabilidade
– Fórmula da Binomial
n-x
n
x
P ( x)    p ( sucesso). p ( fracasso)
 x
Onde:
n = numero de amostras
x = número de sucesso
p(s) = percentual de sucesso
p (f) = percentual de fracasso
Exemplo
• Binomial – suponha que 8% dos
cachorros-quentes
vendidos
num
estádio de beisebol sejam pedidos
sem
n-x
x
mostarda. Se sete pessoas pedem
cachorro-quente,
determine
a
probabilidade de que:
– Todos queiram mostarda
– Apenas um não queira
Exemplo
a-
0
7
7

P ( x)  
 0 (0,08).(0,92)
 
= 0,5578
1
b-
6
7

P ( x)  
1 (0,08).(0,92)
 
= 0,3396
Probabilidade
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Poisson – É útil para descrever as probabilidades do número de
ocorrências num campo ou intervalo contínuo (em geral tempo ou
espaço).
– A utilização da Poisson, exige certas hipótese como:
• A probabilidade de uma ocorrência é a mesma em todo o campo
de observação.
• A probabilidade de mais de uma ocorrência num único ponto é
aproximadamente zero.
• O número de ocorrências em qualquer intervalo é independente do
número de ocorrências em outros intervalos.
Probabilidade
• Distribuição de probabilidade
• Distribuições descontínuas de probabilidade
– Formula de Poisson
e
( )x

P( x) 
x
!
Onde:

= média
x = número de ocorrências

e =valor tabelado
Exemplo
Poisson – Uma mesa telefônica recebe chamadas a razão de
4,6 chamadas por minuto. Determine a probabilidade de
cada uma das ocorrências abaixo:
1- Exatamente 2 chamadas
2 -Nenhuma chamada
2
• 1
P( x) 
0,0 1 0 1
( 4,6)
!
2
= 0,1063
0
• 2
P( x) 
0,0 1 0 1
( 4,6)
0
!
= 0,0101
Probabilidade
• Distribuições contínuas de probabilidade
– Normal – É a mais importante distribuição de probabilidade, sendo aplicada em
inúmeros fenômenos e utilizada para desenvolvimento teórico da estatística.
– As características das curvas normais são:
• A curva normal tem forma de sino
• É simétrica em relação a média
• Prolonga-se de – infinito a + infinito
• Cada distribuição normal fica completamente especificada por sua média e
seu desvio padrão; há uma distribuição normal distinta para cada combinação
de média e desvio padrão
• A área total sob a curva normal é considerado 100%
• A área sob a curva entre dois pontos é a probabilidade de uma variável
normalmente distribuída tomar um valor entre esses pontos
• A área sob a curva entre a média e um ponto arbitrário é função do número de
desvios padrões entre a média e aquele ponto.
Probabilidade
• Distribuições contínuas de probabilidade
– Normal Fórmula
população
amostra
( x  x)
z
s
z
(x  )
Onde:
Z= número de desvios padrões a contar da média
X = valor arbitrário
= o desvio padrão
= a média da distribuição normal



Exemplo
Normal – dado que uma população com média 25 e desvio
padrão 2 tem distribuição normal, determine os valores de z
para os seguintes valores da população:
a) 23,0
(23  25)
z
2
z  1,0
Corresponde a 0,3413 ou
34,13% da área sobre a
curva
normal
ou
a
probabilidade,
conforme
tabela z
b)25,5
(25,5  25)
z
2
z  0,1
Corresponde a 0,0398
ou 3,98% da área sobre
a curva normal ou a
probabilidade, conforme
tabela z
Desvio padrão : interpretação
•
Regra de Chebyshev:
• Ao menos 3/4 estará dentro de 2 s.
• Ao menos 8/9 estará dentro de 3 s.
• P/ k>1, ao menos (1-1/k2) das medidas cairá dentro de k desvios-padrão.
•
Distribuição Normal
• Aproximadamente 68% das medidas caem dentro de 1 s.
• Aproximadamente 95% das medidas caem dentro de 2 s.
• Aproximadamente 99,7% das medidas caem dentro de 3 s.
• Aplicações de todos os conceitos estudados em
exercícios práticos........
Download

Medidas de Tendência Central