15/07/2014 Distribuições Comuns 2 Uniforme Normal Poisson Hipergeométrica Binomial Student's Geométrica Lognormal Avaliação de Desempenho de Sistemas Discretos Probabilidade e Estatística Exponencial Beta Gamma Qui-Quadrado Weibull Pareto Erlang Pascal Professor: Reinaldo Gomes [email protected] Distribuição de Poisson 3 Distribuição de Poisson 4 Parâmetro: λ (média) Utilização: Número de pessoas que chegam em um lugar por hora Número de chamadas telefônicas em uma central Número de conexões TCP recebidas em um servidor por hora Número de vezes que um servidor Web é acessado por minuto Número de carros que passam na rua em um período Número de navios que chegam no porto por dia Em geral: Processos de nascimento Distribuição Uniforme - Contínua 5 Distribuição Uniforme - Contínua 6 Parâmetros: a e b (limite inferior e superior) Utilização: Quando a probabilidade de eventos é a mesma O número observado no lançamento de um dado Direção do movimento de um usuário em um rede celular Dia do mês do aniversário de uma pessoa 1 15/07/2014 Distribuição Exponencial Distribuição Uniforme - Discreta 7 8 Parâmetro: λ (média) Utilização: Tempo entre eventos sucessivos O tempo entre acidentes de carro Tempo entre chamadas telefônicas Tempo entre requisições a um servidor de BD Tempo entre falhas de um equipamento Distribuição Exponencial 9 Distribuição Normal (Gaussiana) 10 Parâmetros: µ, σ² (média e variância) Utilização: Aleatoriedade causada por várias fontes independentes agindo em conjunto Erros em medições Dados “relativamente padronizados” Distribuição Normal Distribuição Normal (Gaussiana) 11 12 Aplicações da Distribuição Normal Normal (m, v) Média Variância Altura das mulheres entre 18 e 24 é uma Normal( 164, 6²) cm 68% têm entre 158 e 170 (média ± 1 Desvio Padrão) 95% têm entre 154 e 176 (média ± 2 Desvios Padrão) 2 15/07/2014 Distribuição Normal Distribuição Normal 13 14 Se a média é µ=100 e o desvio padrão é σ =10, qual a probabilidade de uma ocorrência entre A e B Aplicações da Distribuição Normal A probabilidade de uma variável aleatória X ter um valor dentro do intervalo [a,b] é a área sob a curva no intervalo entre x=a e x=b Assuma um coeficiente k que determina os pontos A e B em função do desvio padrão. A=µ - kσ, B= µ + kσ k=0.1 A=99 B=101 P[A ≤ x ≤ B]=7.96% Distribuição Normal Distribuição Normal 15 16 Se a média é µ=100 e o desvio padrão é σ =10, qual a probabilidade de uma ocorrência entre A e B Se a média é µ=100 e o desvio padrão é σ =10, qual a probabilidade de uma ocorrência entre A e B A=µ - kσ, B= µ + kσ k=0.5 A=95 B=105 P[A ≤ x ≤ B]=38.29% A=µ - kσ, B= µ + kσ k=1 A=90 B=110 P[A ≤ x ≤ B]=68.27% Distribuição Normal Distribuição Normal 17 18 Se a média é µ=100 e o desvio padrão é σ =10, qual a probabilidade de uma ocorrência entre A e B Se a média é µ=100 e o desvio padrão é σ =10, qual a probabilidade de uma ocorrência entre A e B A=µ - kσ, B= µ + kσ k=2 A=80 B=120 P[A ≤ x ≤ B]=95.45% A=µ - kσ, B= µ + kσ k=3 A=70 B=130 P[A ≤ x ≤ B]=99.73% 3 15/07/2014 Distribuição Normal Distribuição Normal 19 20 Se a média é µ=100 e o desvio padrão é σ =10, qual a probabilidade de uma ocorrência entre A e B Se a média é µ=100 e o desvio padrão é σ =10, qual a probabilidade de uma ocorrência entre A e B A=µ - kσ, B= µ + kσ k=4 A=60 B=140 P[A ≤ x ≤ B]=99.99% A=µ - kσ, B= µ + kσ k=5 A=50 B=150 P[A ≤ x ≤ B]=99.9999% Distribuição Normal 21 Caracteristicas 22 A função densidade é simétrica em torno da média A média é também a moda e a mediana 68.26894921371% da área sob a curva está a 1 desvio padrão (DP) da média 95.44997361036% da área sob a curva está a 2 DP da média 99.73002039367% da área sob a curva está a 3 DP da média 99.99366575163% da área sob a curva está a 4 DP da média 99.99994266969% da área sob a curva está a 5 DP da média 99.99999980268% da área sob a curva está a 6 DP da média 99.99999999974% da área sob a curva está a 7 DP da média População, Amostra e Estimador 23 Probabilidade e Estatística • Amostragem e estimação de parâmetros • Intervalo de confiança para média População, Amostra e Estimador 24 Amostra é um subconjunto de uma população Exemplo: População: Todas as mulheres do Brasil Amostra: 1000 mulheres de 5 cidades diferentes Qual a altura média da mulher brasileira? Usamos a média da amostra para estimar a média da população Média da amostra = 168cm, desvio padrão = 4cm µ é a média da população (parâmetro estimado) χ é a média amostral (da amostra) e o estimador de µ Qual a certeza de que a média da amostra estima bem a média da população? Não é possível ter um estimador perfeito a partir de uma amostra de tamanho finito O melhor que podemos fazer é obter limites probabilísticos, Ou seja, ao invés de dizermos: “a média de altura da mulher brasileira é 168cm” … Dizemos: “a média da mulher brasileira é algum valor entre 168-c e 168+c, com probabilidade p” Quanto mais próximo de 1 for p, mais “certeza” haverá E c depende: De p: maior p → maior c Do tamanho da amostra: poucas amostras → maior c Da variabilidade observada na amostra: muita variabilidade → maior c 4 15/07/2014 Média Amostral Intervalo de confiança 26 Intervalo de confiança é um intervalo que contém o parâmetro estimado com uma certa probabilidade Determina os limites probabilísticos: Seja xi uma V.A. obtida de uma população que tem distribuição de probabilidade estacionária com média finita e variância 2 Probabilidade{ c1 ≤ µ ≤ c2 } = 1 – α c1 = x – c e c2 = x + c Seja xm a média amostral quando n observações independentes são feitas para xi (observe que xi também é uma V.R.), onde: O intervalo (c1,c2) é o intervalo de confiança α é o nível de significância (menor é melhor) 100(1-α) é o nível de confiança (ex: 90%, 95%, 99%) p=(1-α) é a probabilidade de acerto do estimador n xm = 1/n ∑ xi i=1 Como calcular c? Intervalo de Confiança Sem Intervalo de Confiança 28 Deseja-se encontrar um intervalo em torno de xm onde se pode afirmar que a média verdadeira µ se localiza com probabilidade 1- α (chamada nível de confiança) Do Teorema do Limite Central, a distribuição de xm tende a uma distribuição normal com média µ e variância σ2 (σ2 é a verdadeira variância da medida) Para se usar tabelas estatísticas padrões, considera-se a V.R. Z = (xm - µ ) / (σ σ / √ n) que aproximadamente tem distribuição normal com média 0 e variância 1 (distribuição normal padrão) Com Intervalo de Confiança Distribuição t-student 29 Na prática, σ2 não é conhecida, sendo substituída por n s2 = 1/(n-1) ∑ (xi - xm )2 i=1 Agora, a variável z não pode mais ser aproximada pela distribuição normal e sim pela distribuição t-student ou, simplesmente distribuição t, com (n-1) graus de liberdade 5 15/07/2014 Nível de confiança Nível de confiança Resumindo: para encontrar um intervalo em torno de xm (xm - w ; xm + w) onde se pode afirmar que a média verdadeira µ se localiza com probabilidade 1- α (Nível de Confiança - NC) temos: Que nível de confiança usar? Quanta perda você pode suportar caso o parâmetro da população esteja fora do seu intervalo? Quanto ganho você teria se o parâmetro estivesse dentro do intervalo? Precisão: repetibilidade dos valores obtidos através das medições feitas – Se medir várias vezes o mesmo fenômeno, quão dispersos são os resultados? Acurácia: é a diferença entre o valor medido e um valor de referência – Quão perto do “correto” está a medição? Menor α => Maior IC => Maior confiança IC maior => Menor a precisão – Existe mais incerteza sobre quem de fato é a “média α /2, n-1) * √ s2 / n W = t (α Onde: NC = (1- α)% t (α α /2, n-1) = valor da distribuição t (t-distribution), para NC (100- α)%, com n-1 graus de liberdade Nível de confiança Calculando o Intervalo de Confiança 34 Amostras=1000 Média=168 Desvio=4 Nível de confiança=95% α = 0.05 P=1- α = 0.95 Probabilidade{ 167.75 ≤ µ ≤ 168.25 } = 0.95 Ou “a mulher brasileira tem entre 167.75 e 168.25 de altura com probabilidade de 95%” Com Intervalo de Confiança Exemplo 35 Um modelo de um canal de comunicação de uma RC foi simulado para se obter o tempo médio de transmissão de pacotes (microsegundos). Os valores encontrados em 10 simulações realizadas foram: 9,252; 9,273; 9,413; 9,198; 9,532 9,355; 9,155; 9,558; 9,310; 9,269 Deseja-se encontrar o tempo médio de transmissão dos pacotes e o intervalo de confiança para um nível de confiança igual a 95%. 6 15/07/2014 Exemplo Temos: n = 10 NC = 95% = (100- α)% => α =0.05 Da distribuição t, para α /2=0,025, com 9 graus de liberdade t (α α /2, n-1) = t (0,025, 9) = 2,26 n xm = 1/n ∑ xi i=1 => xm =9,331 n s2 = 1/(n-1) ∑ (xi - xm )2 => s2 = 0,018 i=1 <= Então: xm ± w = 9.331 ± 0.096 9,235 => 9,331 xm 9,427 Com Intervalo de Confiança Calculando o Intervalo de Confiança 40 39 é um valor tabelado, baseado na distribuição Normal Reduzida N(0,1) s é o desvio padrão da amostra n é o tamanho da amostra Tamanho da Amostra 41 Quantas observações são necessárias para obtermos uma precisão de r% com um nível de confiança de 100(1- α)%? O intervalo de confiança deve ficar entre Quantidade de repetições: 42 7