15/07/2014
Distribuições Comuns
2
Uniforme
Normal
Poisson
Hipergeométrica
Binomial
Student's
Geométrica
Lognormal
Avaliação de Desempenho de
Sistemas Discretos
Probabilidade e Estatística
Exponencial
Beta
Gamma
Qui-Quadrado
Weibull
Pareto
Erlang
Pascal
Professor: Reinaldo Gomes
[email protected]
Distribuição de Poisson
3
Distribuição de Poisson
4
Parâmetro: λ (média)
Utilização:
Número de pessoas que chegam em um lugar por hora
Número de chamadas telefônicas em uma central
Número de conexões TCP recebidas em um servidor por hora
Número de vezes que um servidor Web é acessado por minuto
Número de carros que passam na rua em um período
Número de navios que chegam no porto por dia
Em geral: Processos de nascimento
Distribuição Uniforme - Contínua
5
Distribuição Uniforme - Contínua
6
Parâmetros: a e b (limite inferior e superior)
Utilização:
Quando a probabilidade de eventos é a mesma
O número observado no lançamento de um dado
Direção do movimento de um usuário em um rede
celular
Dia do mês do aniversário de uma pessoa
1
15/07/2014
Distribuição Exponencial
Distribuição Uniforme - Discreta
7
8
Parâmetro: λ (média)
Utilização:
Tempo entre eventos sucessivos
O tempo entre acidentes de carro
Tempo entre chamadas telefônicas
Tempo entre requisições a um servidor de BD
Tempo entre falhas de um equipamento
Distribuição Exponencial
9
Distribuição Normal (Gaussiana)
10
Parâmetros: µ, σ² (média e variância)
Utilização:
Aleatoriedade causada por várias fontes independentes
agindo em conjunto
Erros em medições
Dados “relativamente padronizados”
Distribuição Normal
Distribuição Normal (Gaussiana)
11
12
Aplicações da Distribuição Normal
Normal (m, v)
Média
Variância
Altura das mulheres entre 18 e 24 é uma Normal( 164, 6²) cm
68% têm entre 158 e 170 (média ± 1 Desvio Padrão)
95% têm entre 154 e 176 (média ± 2 Desvios Padrão)
2
15/07/2014
Distribuição Normal
Distribuição Normal
13
14
Se a média é µ=100 e o desvio padrão é σ =10,
qual a probabilidade de uma ocorrência entre A e B
Aplicações da Distribuição Normal
A probabilidade de uma variável aleatória X ter um valor
dentro do intervalo [a,b] é a área sob a curva no intervalo
entre x=a e x=b
Assuma um coeficiente
k que determina os
pontos A e B em função
do desvio padrão.
A=µ - kσ, B= µ + kσ
k=0.1
A=99
B=101
P[A ≤ x ≤ B]=7.96%
Distribuição Normal
Distribuição Normal
15
16
Se a média é µ=100 e o desvio padrão é σ =10,
qual a probabilidade de uma ocorrência entre A e B
Se a média é µ=100 e o desvio padrão é σ =10,
qual a probabilidade de uma ocorrência entre A e B
A=µ - kσ, B= µ + kσ
k=0.5
A=95
B=105
P[A ≤ x ≤ B]=38.29%
A=µ - kσ, B= µ + kσ
k=1
A=90
B=110
P[A ≤ x ≤ B]=68.27%
Distribuição Normal
Distribuição Normal
17
18
Se a média é µ=100 e o desvio padrão é σ =10,
qual a probabilidade de uma ocorrência entre A e B
Se a média é µ=100 e o desvio padrão é σ =10,
qual a probabilidade de uma ocorrência entre A e B
A=µ - kσ, B= µ + kσ
k=2
A=80
B=120
P[A ≤ x ≤ B]=95.45%
A=µ - kσ, B= µ + kσ
k=3
A=70
B=130
P[A ≤ x ≤ B]=99.73%
3
15/07/2014
Distribuição Normal
Distribuição Normal
19
20
Se a média é µ=100 e o desvio padrão é σ =10,
qual a probabilidade de uma ocorrência entre A e B
Se a média é µ=100 e o desvio padrão é σ =10,
qual a probabilidade de uma ocorrência entre A e B
A=µ - kσ, B= µ + kσ
k=4
A=60
B=140
P[A ≤ x ≤ B]=99.99%
A=µ - kσ, B= µ + kσ
k=5
A=50
B=150
P[A ≤ x ≤ B]=99.9999%
Distribuição Normal
21
Caracteristicas
22
A função densidade é simétrica em torno da média
A média é também a moda e a mediana
68.26894921371% da área sob a curva está a 1 desvio padrão
(DP) da média
95.44997361036% da área sob a curva está a 2 DP da média
99.73002039367% da área sob a curva está a 3 DP da média
99.99366575163% da área sob a curva está a 4 DP da média
99.99994266969% da área sob a curva está a 5 DP da média
99.99999980268% da área sob a curva está a 6 DP da média
99.99999999974% da área sob a curva está a 7 DP da média
População, Amostra e Estimador
23
Probabilidade e Estatística
•
Amostragem e estimação de parâmetros
•
Intervalo de confiança para média
População, Amostra e Estimador
24
Amostra é um subconjunto de uma população
Exemplo:
População: Todas as mulheres do Brasil
Amostra: 1000 mulheres de 5 cidades diferentes
Qual a altura média da mulher brasileira?
Usamos a média da amostra para estimar a média da
população
Média da amostra = 168cm, desvio padrão = 4cm
µ é a média da população (parâmetro estimado)
χ é a média amostral (da amostra) e o estimador de µ
Qual a certeza de que a média da amostra estima bem a média da
população?
Não é possível ter um estimador perfeito a partir de uma amostra de tamanho
finito
O melhor que podemos fazer é obter limites probabilísticos,
Ou seja, ao invés de dizermos:
“a média de altura da mulher brasileira é 168cm” …
Dizemos:
“a média da mulher brasileira é algum valor entre 168-c e 168+c, com
probabilidade p”
Quanto mais próximo de 1 for p, mais “certeza” haverá
E c depende:
De p: maior p → maior c
Do tamanho da amostra: poucas amostras → maior c
Da variabilidade observada na amostra: muita variabilidade → maior c
4
15/07/2014
Média Amostral
Intervalo de confiança
26
Intervalo de confiança é um intervalo que contém o
parâmetro estimado com uma certa probabilidade
Determina os limites probabilísticos:
Seja xi uma V.A. obtida de uma população que tem
distribuição de probabilidade estacionária com
média finita e variância 2
Probabilidade{ c1 ≤ µ ≤ c2 } = 1 – α
c1 = x – c
e
c2 = x + c
Seja xm a média amostral quando n observações
independentes são feitas para xi (observe que xi
também é uma V.R.), onde:
O intervalo (c1,c2) é o intervalo de confiança
α é o nível de significância (menor é melhor)
100(1-α) é o nível de confiança (ex: 90%, 95%, 99%)
p=(1-α) é a probabilidade de acerto do estimador
n
xm = 1/n ∑ xi
i=1
Como calcular c?
Intervalo de Confiança
Sem Intervalo de Confiança
28
Deseja-se encontrar um intervalo em torno de xm onde se
pode afirmar que a média verdadeira µ se localiza com
probabilidade 1- α (chamada nível de confiança)
Do Teorema do Limite Central, a distribuição de xm tende
a uma distribuição normal com média µ e variância σ2
(σ2 é a verdadeira variância da medida)
Para se usar tabelas estatísticas padrões, considera-se a V.R.
Z = (xm - µ ) / (σ
σ / √ n)
que aproximadamente tem distribuição normal com média
0 e variância 1 (distribuição normal padrão)
Com Intervalo de Confiança
Distribuição t-student
29
Na prática, σ2 não é conhecida, sendo substituída por
n
s2 = 1/(n-1) ∑ (xi - xm )2
i=1
Agora, a variável z não pode mais ser aproximada pela
distribuição normal e sim pela distribuição t-student
ou, simplesmente distribuição t, com (n-1) graus de
liberdade
5
15/07/2014
Nível de confiança
Nível de confiança
Resumindo: para encontrar um intervalo em torno de
xm (xm - w ; xm + w) onde se pode afirmar que a
média verdadeira µ se localiza com probabilidade
1- α (Nível de Confiança - NC) temos:
Que nível de confiança usar?
Quanta perda você pode suportar caso o parâmetro da
população esteja fora do seu intervalo? Quanto ganho você
teria se o parâmetro estivesse dentro do intervalo?
Precisão: repetibilidade dos valores obtidos através das
medições feitas – Se medir várias vezes o mesmo
fenômeno, quão dispersos são os resultados?
Acurácia: é a diferença entre o valor medido e um valor de
referência – Quão perto do “correto” está a medição?
Menor α => Maior IC => Maior confiança
IC maior => Menor a precisão – Existe mais incerteza
sobre quem de fato é a “média
α /2, n-1) * √ s2 / n
W = t (α
Onde:
NC = (1- α)%
t (α
α /2, n-1) = valor da distribuição t (t-distribution), para
NC (100- α)%, com n-1 graus de liberdade
Nível de confiança
Calculando o Intervalo de Confiança
34
Amostras=1000
Média=168
Desvio=4
Nível de confiança=95%
α = 0.05
P=1- α = 0.95
Probabilidade{ 167.75 ≤ µ ≤ 168.25 } = 0.95
Ou “a mulher brasileira tem entre 167.75 e 168.25 de
altura com probabilidade de 95%”
Com Intervalo de Confiança
Exemplo
35
Um modelo de um canal de comunicação de uma RC
foi simulado para se obter o tempo médio de
transmissão de pacotes (microsegundos). Os valores
encontrados em 10 simulações realizadas foram:
9,252; 9,273; 9,413; 9,198; 9,532
9,355; 9,155; 9,558; 9,310; 9,269
Deseja-se encontrar o tempo médio de transmissão dos
pacotes e o intervalo de confiança para um nível de
confiança igual a 95%.
6
15/07/2014
Exemplo
Temos:
n = 10
NC = 95% = (100- α)% => α =0.05
Da distribuição t, para α /2=0,025, com 9 graus de liberdade
t (α
α /2, n-1) = t (0,025, 9) = 2,26
n
xm = 1/n ∑ xi
i=1
=> xm =9,331
n
s2 = 1/(n-1) ∑ (xi - xm )2 => s2 = 0,018
i=1
<=
Então:
xm ± w = 9.331 ± 0.096
9,235
=>
9,331
xm
9,427
Com Intervalo de Confiança
Calculando o Intervalo de Confiança
40
39
é um valor tabelado, baseado na
distribuição Normal Reduzida N(0,1)
s é o desvio padrão da amostra
n é o tamanho da amostra
Tamanho da Amostra
41
Quantas observações são necessárias para obtermos
uma precisão de r% com um nível de confiança de
100(1- α)%?
O intervalo de confiança deve ficar entre
Quantidade de repetições:
42
7
Download

6 slides