1/144 Modelagem Estatística 2/144 População e Amostra População: Conjunto dos elementos que se deseja abranger no estudo considerado. Amostra: Subconjunto população. dos elementos da 3/144 População Finita - Alunos do mestrado, funcionários de uma empresa, eleitores etc. Infinita - Nascimentos em um cidade, produção de uma máquina etc. 4/144 População e Amostra Censo: Estudo através do exame de todos os elementos da população. Amostragem: Estudo por meio do exame de uma amostra. 5/144 Técnicas de Amostragem Amostragem probabilística (aleatória) a probabilidade de um elemento da população ser escolhido é conhecida. Amostragem não probabilística (não aleatória) - Não se conhece a probabilidade de um elemento da população ser escolhido para participar da amostra. 6/144 Amostragem Aleatória Simples Faz-se uma lista da população e sorteiam-se os elementos que farão parte da amostra. Cada subconjunto da população com o mesmo nº de elementos tem a mesma chance de ser incluído na amostra. pr = n/N 7/144 DISTRIBUIÇÕES AMOSTRAIS 8/144 Parâmetro e Estatística Parâmetro população. - característica relacionada à Estatística amostra. - característica relacionada à 9/144 Parâmetros Média Proporção p Desvio Padrão etc 10/144 Estatísticas Média X Proporção p Desvio Padrão s etc 11/144 Distribuições Amostrais Qualquer característica de uma amostra aleatória (estatística) é uma variável aleatória. Em outras palavras, se tomarmos várias amostras de forma parecida, os resultados da característica (estatística) que nos interessa variarão por causa da aleatoriedade do sorteio. 12/144 Distribuições Amostrais Distribuição Amostral - Distribuição probabilidades de uma estatística. de 13/144 Exemplo A população de um estudo é composta de 4 pessoas (N=4) e a variável de interesse é a altura. X1=1,50m X2=1,60m X3=1,70m X4=1,80m 14/144 Parâmetros N=4 X1=1,50m X3=1,70m X2=1,60m X4=1,80m Média populacional: = 1,65m Desvio Padrão: = 0,1118m 15/144 Exemplo Retira-se uma amostra aleatória simples com 2 elementos (n=2), com reposição. Qual será a média amostral? Qual é a distribuição de probabilidades da média amostral? 16/144 Exemplo Amostra X1 X 1 X1 X 2 X1 X 3 X1 X 4 X2 X 1 X2 X 2 X2 X 3 X2 X 4 Amostra X3 X 1 X3 X 2 X3 X 3 X3 X 4 X4 X 1 X4 X 2 X4 X 3 X4 X 4 17/144 Exemplo Amostra X1 X 1 X1 X 2 X1 X 3 X1 X 4 X2 X 1 X2 X 2 X2 X 3 X2 X 4 X 1,50 1,55 1,60 1,65 1,55 1,60 1,65 1,70 Amostra X3 X 1 X3 X 2 X3 X 3 X3 X 4 X4 X 1 X4 X 2 X4 X 3 X4 X 4 X 1,60 1,65 1,70 1,75 1,65 1,70 1,75 1,80 18/144 Exemplo Amostra X1 X 1 X1 X 2 X1 X 3 X1 X 4 X2 X 1 X2 X 2 X2 X 3 X2 X 4 X 1,50 1,55 1,60 1,65 1,55 1,60 1,65 1,70 Prob. 1/16 1/16 1/16 1/16 1/16 1/16 1/16 1/16 Amostra X3 X 1 X3 X 2 X3 X 3 X3 X 4 X4 X 1 X4 X 2 X4 X 3 X4 X 4 Total X 1,60 1,65 1,70 1,75 1,65 1,70 1,75 1,80 - Prob. 1/16 1/16 1/16 1/16 1/16 1/16 1/16 1/16 1 Distribuição Amostral da Média X 1,50 1,55 1,60 1,65 1,70 1,75 1,80 Total P(X) 1/16 2/16 3/16 4/16 3/16 2/16 1/16 1 P(X) 0,0625 0,1250 0,1875 0,2500 0,1875 0,1250 0,0625 19/144 Distribuição Amostral da Média 20/144 4/16 3/16 3/16 2/16 2/16 1/16 1,50 1/16 1,55 1,60 1,65 1,70 1,75 1,80 Distribuição Amostral da Média 21/144 Calcular o valor esperado (média) e o desvio padrão da média amostral. 22/144 Média e Variância X P(X) x1 x2 ... xn p1 p2 ... pn Total 1 E(X) = x = (xi.pi) VAR(X) = x = pi.(xi-x)2 23/144 Distribuição Amostral da Média X 1,50 1,55 1,60 1,65 1,70 1,75 1,80 Total P(X) 1/16 2/16 3/16 4/16 3/16 2/16 1/16 1 P(X) 0,0625 0,1250 0,1875 0,2500 0,1875 0,1250 0,0625 24/144 Distribuição Amostral da Média X = E(X) = 1,65 m X = 0,0791 m 30/144 Distribuição Amostral da Média Características a) x = 31/144 Distribuição Amostral da Média Características b) x= x= n n população infinita ou muito grande ou amostragem com reposição N-n N-1 população finita 32/144 Distribuição Amostral da Média Características c) A distribuição da média amostral é normal. 33/144 Exercício Uma fábrica de pneus alega que a vida média dos pneus é 30.000 Km, com desvio padrão de 2.000 Km. Tomando-se como verdadeiros estes dados, qual é a probabilidade de uma amostra com 40 pneus apresentar vida média menor que 29.500 Km? 34/144 Exercício x= x= n 2000 40 x = 316,22777 35/144 Exercício P(X<29500) X 29,5 30 36/144 Exercício 29500 = 29.500 - 30.000 316,23 = -1,58 0,057053 -1,58 0 Z 37/144 Exercício Um lote com 100 pneus apresenta vida útil média de 30.000 Km, com desvio padrão de 2.000 Km. Qual é a probabilidade de uma amostra aleatória simples com 40 pneus apresentar vida média de menos que 29.500 Km? 38/144 Exercício x= x= N-n N-1 n 2000 40 100 - 40 100 - 1 x = 246,18298 39/144 Exercício P(X<29500) X 29,5 30 40/144 Exercício 29500 = 29.500 - 30.000 246,18 = -2,03 0,021178 -2,03 0 Z 41/144 Exercício 1 Se a vida útil média de uma peça é 5.000 horas, com desvio padrão de 200 horas, qual é a probabilidade de que uma amostra com 25 produtos apresente média superior a 5.100 horas? 0,00621 42/144 Exercício 2 Um banco informa que o saldo médio das 2000 contas de pessoas físicas é $ 500, com desvio padrão de $ 100. Se uma amostra aleatória de 50 correntistas (pessoa física) daquele banco for retirada, qual é a probabilidade do saldo médio ser menor que $ 480? 43/144 Exercício População finita : Resp = 0,076359 População infinita: Resp = 0,079270 44/144 Modelagem Estatística Distribuição Amostral da Proporção 45/144 Distribuição Amostral da Proporção p - prop. populacional p - prop. amostral População Plano de amostragem p Amostra p 46/144 Exemplo A população de um estudo é composta de 4 pessoas (N=4) e a variável de interesse é a proporção de pessoas altas (altura > 1,75m). N=4 X1=1,50m X3=1,70m X2=1,60m X4=1,80m 47/144 Parâmetro N=4 X1=1,50m X3=1,70m X2=1,60m X4=1,80m Proporção populacional: 1/4 = 0,25 48/144 Exemplo Retira-se uma amostra aleatória simples com 2 elementos (n=2), com reposição. Qual será a proporção amostral? Qual é a distribuição de probabilidades da proporção amostral? 53/144 Distribuição Amostral da Proporção Binomial (n=2 , p=1/4) número de pessoas altas proporção = tamanho da amostra 65/144 Distribuição Amostral da Proporção Características a) p = p 66/144 Distribuição Amostral da Proporção Características b) p= p.(1-p) n população infinita ou muito grande ou amostra com reposição p= p.(1-p) n N-n N-1 população finita 67/144 Distribuição Amostral da Proporção Características c1) A distribuição das proporções amostrais é binomial no caso de população infinita. Quando o tamanho da amostra for grande, esta distribuição pode ser aproximada por uma distribuição normal. c2) A distribuição das proporções amostrais é hipergeométrica no caso de população finita. Quando o tamanho da amostra for grande, esta distribuição pode ser aproximada por uma distribuição normal. 68/144 Exercício Uma fábrica de pneus alega que 99% de seus produtos possuem vida útil longa (duram mais que 30.000 Km). Tomando-se como verdadeiros estes dados, qual é a probabilidade de uma amostra com 400 pneus apresentar menos que 2% dos pneus com vida útil menor que 30.000 Km? 69/144 Exercício p= p.(1-p) n p= 0,01.0,99 400 p = 0,004975 70/144 Exercício P(p<0,02) 0,01 0,02 P 71/144 Exercício 0,02 - 0,01 Z 0,02 = 0,004975 = 2,01 0,977784 0 2,01 Z 76/144 Exercício 3 Um banco informa que apenas 10% dos 5000 clientes possuem saldo médio acima de $500. Se uma amostra aleatória de 100 correntistas daquele banco for retirada, qual é a probabilidade de haver mais de 15 clientes na amostra com saldo acima de $500? 77/144 Exercício População finita : Resp = 0,046479 População infinita: Resp = 0,047460 78/144 Modelagem Estatística Estimação 79/144 Estimação de Parâmetros População Amostra X 2 p S2 P 80/144 Estimação Conhecidas as estatísticas (amostra), estimar quais são os parâmetros (população). Amostra População X S2 P ? 81/144 Estimação Pontual Estima-se apenas um valor para o parâmetro. Intervalar Estima-se um intervalo de valores onde deve-se encontrar o parâmetro (intervalo de confiança). 82/144 Propriedades Desejáveis de um Estimador Não-tendenciosidade ou justeza: um estimador é justo (não tendencioso, não viesado; não viciado) se sua média (ou valor esperado) for o próprio parâmetro que se pretende estimar. 83/144 Tendenciosidade Ex:Média X= Xi n E( X ) = Não-tendencioso X = 84/144 Tendenciosidade Ex: Proporção Xi P= n E( P) = Não-tendencioso P = p 85/144 Tendenciosidade X ^ 2 = (Xi - n Tendencioso ^ )= E( 2 n -1 n 2 86/144 Tendenciosidade X ^ 2 = (Xi - n Tendencioso X (Xi - 2 2 ^ =S = n-1 E (^ ) = 2 n -1 n 2 2 2 2 ^ E( ) = E(s ) = Não-tendencioso 87/144 Consistência Um estimador é consistente se o aumento do tamanho da amostra leva a uma redução da variância. 88/144 Eficiência Um estimador não-tendencioso (E1) é mais eficiente que outro estimador não-tendencioso (E2) se a variância de E1 for menor que a variância de E2. E 2 1 < E 2 2 89/144 Eficiência E1 é mais eficiente que E2 x x xxx x x xx x xx x xxx xxx x x x x x x x xxxx x x xx xx xx x xxxx x xx x xx x xxx xxxx x x x x xx x x x xxx x x x x x x xx x x xx x x x x x xx x x x xx x x xx xx x xx xx x x xxxx xxx xxxx xxxx x x xxx x x x x x x xx x x x x x x x xxxx x x x xx x x xxxxxx x x xx x x x xx xxxx E1 E2 Não-tendenciosos x x xxx x x xx x xx x xxx xxx x x x x x x x xxxx x x xx xx xx x xxxx x xx x xx x xxx xxxx E3 Tendencioso 90/144 Métodos de Estimação Como selecionar o melhor estimador? Método da Máxima Verossimilhança Método dos Mínimos Quadrados Métodos Bayesianos ... 91/144 Intervalos de Confiança Problema: Estimar 2 limites, dentro dos quais deve se encontrar o valor real, com um determinado nível de confiança. 92/144 Exemplo: Média População infinita (valor real = ) (desconhecido) 93/144 Exemplo: Média Amostra: média amostral (X ) X= n E( X ) = 94/144 Exemplo População infinita (valor real = ) (desconhecido) = 10 95/144 Exemplo Distribuição Amostral Amostra: média amostral (X ) X= 10 25 =2 96/144 Exemplo Qual a probabilidade de X ser maior que ? 97/144 Exemplo Qual a probabilidade de X ser maior que ? 0,50 98/144 Exemplo Qual a probabilidade de X - 1,96 vezes o desvio padrão? ser maior que Qual a probabilidade da distância entre a média populacional (µ) e a média amostral (X) ser maior do que 1,96 vezes o desvio padrão da distribuição amostral da média? 99/144 Exemplo X= 10 25 =2 1,96 . 2 = 3,92 Qual a probabilidade da distância entre a média populacional (µ) e a média amostral (X) ser maior do que 3,92? 100/144 Exemplo Qual a probabilidade de X - ser maior que 1,96 vezes o desvio padrão? Resp: 5% 0,025 0,025 -1,96 0 1,96 101/144 Exemplo: Média Se alguém afirmar que X estará a menos de 1,96 vezes o desvio padrão da média (para mais ou para menos), terá 95% de probabilidade de estar certo e 5% de probabilidade de estar errado. 102/144 Simbologia Probabilidade de erro admitida (probabilidade do parâmetro encontrarse fora do intervalo a ser criado). No exemplo, 103/144 Simbologia Grau de confiança (probabilidade do parâmetro encontrar-se no intervalo) No exemplo, 104/144 Simbologia Limite do I.C. na distribuição padronizada. No exemplo, 105/144 Limites O intervalo é construído somando-se e diminuindo-se Z vezes o desvio padrão da média amostral obtida. 106/144 Limites A média da amostra não se diferenciará da média populacional em mais que Z vezes o desvio padrão (da distribuição amostral) Int. Conf.: _ X +- x 107/144 Limites Int. Conf.: x = n x= n _ X +- x População infinita N -n N -1 População finita 108/144 Exemplo Foi retirada uma amostra com 64 elementos de uma população com desvio padrão igual a 100. A média encontrada foi 300. Construir um intervalo para a média com: a) 90% de confiança 109/144 Exemplo 5% Z0,05 0 110/144 Exemplo X Lim= 300 +-1,645 100 64 20,5625 n Linf = 279,4 Lsup = 320,6 111/144 Exemplo b) 99% de confiança Lim= 300 +-2,575 100 64 32,1875 Linf = 267,8 Lsup = 332,2 112/144 Exemplo Encontrar, na tabela da normal reduzida, os valores de Z para: 113/144 Exemplo Encontrar, na tabela da normal reduzida, os valores de Z para: 114/144 Intervalo de Confiança Média ( conhecido) Int. Conf.: x = n x= n _ X +- x População infinita N -n N -1 População finita 115/144 Intervalo de Confiança Média ( desconhecido) Normalmente, não se conhece o desvio padrão da população cuja média se deseja estimar. Então, utiliza-se um estimador pontual para o desvio padrão populacional. 116/144 Intervalo de Confiança Média ( desconhecido) s = Desvio padrão da amostra s Xi - X)2 n-1 117/144 Intervalo de Confiança Média ( desconhecido) Nesta situação, a distribuição correta a ser utilizada é a distribuição “t” de Student, com (n-1) graus de liberdade. (supondo que a população seja normal). Obs: se a amostra for grande, pode utilizar-se a distribuição normal como aproximação. 118/144 Intervalo de Confiança Média ( desconhecido) normal t 0 t 119/144 Interv.Conf. Média ( desconhecido) Int. Conf.: ^ x = s x = s ^ n n _ ^ + X - t x População infinita N -n N -1 População finita 120/144 Limites do Intervalo t - valor limite da distribuição t, para a probabilidade de erro , com (n-1) graus de liberdade. tabela t. 121/144 Exemplo Encontrar o valor limite de t/2 para: a) = 1%, com 19 graus de liberdade (amostra com 20 elementos) 2,861 122/144 Exemplo Encontrar o valor limite de t/2 para: a) = 10%, com 19 graus de liberdade (amostra com 20 elementos) 1,729 123/144 Exemplo Encontrar o valor limite de t/2 para: a) = 5%, com 19 graus de liberdade (amostra com 20 elementos) 2,093 124/144 Exemplo Encontrar o valor limite de t/2 para: a) = 5%, com 29 graus de liberdade (amostra com 30 elementos) 2,045 125/144 Exemplo Encontrar o valor limite de t/2 para: a) = 5%, com graus de liberdade 1,960 Comparar este resultado com Z0,025. 126/144 Exemplo Na construção de um motor, o diâmetro dos cilindros é de grande importância. Em uma pesquisa feita com 5 blocos com 4 cilindros cada (20 furos), o diâmetro médio encontrado foi 82 mm e o desvio padrão 0,1 mm. Construir um intervalo com 95% de confiança para este parâmetro. 127/144 Exemplo n = 20 (19 graus de liberdade) s = 0,1 mm X = 82 mm = 5% - da tabela: t19 = 2,093 128/144 Exemplo IC : _ X +- tc s n LS = 82,05 mm LI = 81,95 mm 82 +- 2,093 0,1 20 0,05 81,95 < < 82,05 com 95% de confiança 129/144 Intervalo de confiança para a proporção População com proporção p (desconhecida). Amostra com n elementos e proporção p conhecidos. 130/144 Distribuição Amostral da Proporção p LI (1-) P LS 131/144 Intervalo de Confiança Limites: _ P +- P(1-P) n (População infinita) 132/144 Exemplo Foi retirada uma amostra com 100 itens de um grande lote de peças, sendo encontrados 10 defeituosos. Construa um intervalo de confiança com 3% de erro para a percentagem de defeituosos no lote. 133/144 Exemplo 1,5% Z0,05 0 134/144 Exemplo p Lim= 0,10 +-2,17 n 0,10.0,90 100 0,0651 Linf = 0,035 Lsup = 0,165 135/144 Tamanho de Amostras 136/144 Intervalo de Confiança Média _ X +- Z/2 n erro máximo (e) (população infinita) 137/144 Tamanho de Amostras Média (erro máximo ou margem de erro) n e = Z/2 n= Z/2 x e 2 (População infinita) 138/144 Tamanho de Amostras Média n= Z/2 x (População infinita) e 2 n= 2 Z/2 x 2 Z/2 x 2 x N 2 2 + e (N-1) (População finita) 139/144 Tamanho de Amostras Estimação “a priori” do desvio padrão: Estudos passados Amostra piloto Fixando-se um valor teórico 140/144 Intervalo de Confiança Proporção _ P +- p(1-p) n erro máximo (e) (População infinita) 141/144 Tamanho de Amostras Proporção e = Z/2 p (1-p) n 2 Z/2 p (1-p) n= (População infinita) e2 142/144 Tamanho de Amostras Proporção 2 Z/2 p (1-p) (População infinita) n= 2 e 2 Z/2 x p (1-p) x N n= 2 (População finita) 2 Z/2 x p (1-p) + e (N-1) 143/144 Tamanho de Amostras Estimação “a priori” da proporção: Estudos passados Amostra piloto Fixando-se um valor teórico (0,5) 144/144 Tamanho de Amostras Se p = 0,5 máximo tamanho de amostra. 2 Z n= 2 e x 0,25 2 0,25 x Z n= 0,25 x Z 2+ e (população infinita) N 2 x (N-1) x (população finita)