Aula 1. Introdução à Inferência Estatística Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição População é o conjunto de todos os elementos ou resultados sob investigação Estatística Amostra é qualquer subconjunto da população Técnicas de amostragem Amostra / dados 𝑥1 , 𝑥2, … , 𝑥𝑛 População Características Análise descritiva Conclusões sobre as características da população Inferência estatística Informações contidas nos dados População ↔ Amostra Exemplo 10.1: Consideramos uma pesquisa para estudar os salários dos 500 funcionários da Companhia M&B. Seleciona-se uma amostra de 36 indivíduos, e anotam-se os seus salários. População = 500 salários correspondentes aos 500 funcionários Amostra = 36 salários de funcionários selecionados Esperamos que amostra reflita as caraterísticas principais da distribuição populacional de salários da empresa = Amostra representativa População ↔ Amostra Exemplo 10.3: Consideramos uma pesquisa para estudar a duração de vida útil de um novo tipo de lâmpadas, pois acredita-se que a duração desse novo tipo é maior. Então 100 lâmpadas do novo tipo são deixadas acesas até queimarem. População = a vida útil de todas as lâmpadas fabricadas ou que venham a ser fabricadas por essa empresa; = a distribuição de vida útil de lâmpada fabricada por empresa Amostra = tempos de vida observada de 100 lâmpadas selecionados Esperamos que amostra reflita as caraterísticas principais da distribuição populacional de vida útil de lâmpadas produzidas pela empresa = Amostra representativa Técnicas de amostragem População Características A.A.S. Amostra / dados 𝑥1 , 𝑥2, … , 𝑥𝑛 Amostragem Aleatória Simples Aleatoriamente sorteia-se um elemento da população, sendo que todos os elementos têm a mesma chance de ser escolhidos. Repete-se o procedimento até que sejam sorteadas as n unidades da amostra. AAS com/sem reposição. AAS com reposição implica a propriedade de independência entre unidades selecionadas. Isso facilita o tratamento matemático de propriedades de estimadores que vamos construir em cima de amostra. Amostra / dados 𝑥1 , 𝑥2, … , 𝑥𝑛 Amostra aleatória simples 𝑋1, 𝑋2, … , 𝑋𝑛 Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória 𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias independentes 𝑋1, 𝑋2, … , 𝑋𝑛 cada uma com a mesma distribuição de 𝑋. Amostra / dados 𝑥1 , 𝑥2, … , 𝑥𝑛 População Características é v.a. 𝑋 Amostra aleatória simples 𝑋1, 𝑋2, … , 𝑋𝑛 Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória 𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias independentes 𝑋1, 𝑋2, … , 𝑋𝑛 cada uma com a mesma distribuição de 𝑋. Amostra / dados 𝑥1 , 𝑥2, … , 𝑥𝑛 População Características é v.a. 𝑋 Amostra aleatória simples 𝑋1, 𝑋2, … , 𝑋𝑛 Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória 𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias independentes 𝑋1 , 𝑋2 , … , 𝑋𝑛 cada uma com a mesma distribuição de 𝑋. Em caso de população 𝑋 contínua, com função de densidade 𝑓(𝑥), a densidade conjunta da amostra (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) será dada por 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) tal que 𝑓 𝑥1 , 𝑥2 , … , 𝑥𝑛 = 𝑓 𝑥1 𝑓(𝑥2 ) … 𝑓(𝑥𝑛 ) Estatística Qualquer função de amostra (𝑋1, 𝑋2, … , 𝑋𝑛 ) chamaremos estatística 1 𝑋= 𝑛 𝑛 𝑋𝑖 𝑖=1 𝑋(1) = min 𝑋1 , 𝑋2, … , 𝑋𝑛 1 𝑆2 = 𝑛−1 𝑛 𝑋𝑖 − 𝑋 𝑖=1 𝑊 = 𝑋(𝑛) − 𝑋(1) 𝑋(𝑛) = max 𝑋1 , 𝑋2, … , 𝑋𝑛 𝑋(𝑖) − 𝑖-gêsima maior observação da amostra 2 Amostra ↔amostra amostra (𝑋1, 𝑋2, … , 𝑋𝑛 ) é vetor aleatório amostra (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) é vetor de números observados 1 1 𝑛 estatística 𝑋 = 𝑋 𝑛 𝑖=1 𝑖 é variável aleatória 1 estatística 𝑆 2 = 𝑛−1 é variável aleatória 𝑛 𝑖=1 𝑛 estatística 𝑥 = 𝑥 𝑛 𝑖=1 𝑖 é valor observado de 𝑋 𝑋𝑖 − 𝑋 2 1 estatística 𝑠 2 = 𝑛−1 𝑛𝑖=1 𝑥𝑖 − 𝑥 é valor observado de 𝑆 2 2 distribuição populacional 𝑋~𝑓(𝑥) distribuição populacional 𝑋~𝑁(𝜇, 𝜎 2 ) distribuição amostral da estatística 𝑇𝑛 = 𝑇𝑛 𝑋1, 𝑋2, … , 𝑋𝑛 𝑇𝑛 ~𝑔(𝑦) distribuição amostral da estatística 1 𝑋= 𝑛 𝑛 𝑋𝑖 𝑖=1 𝜎2 𝑋 ~𝑁 𝜇, 𝑛 Distribuição amostral da média Teorema. Seja 𝑋 uma variável aleatória com média 𝜇 e variância 𝜎 2, e seja 𝑋1 , 𝑋2, … , 𝑋𝑛 uma amostra aleatória simples (AAS) de variável 𝑋. Então 𝜎2 𝐸 𝑋 = 𝜇, 𝑉𝑎𝑟 𝑋 = 𝑛 1 𝐸 𝑋 =𝐸 𝑛 1 𝑉𝑎𝑟 𝑋 = 𝑉𝑎𝑟 𝑛 𝑛 𝑋𝑖 𝑖=1 𝑛 𝑋𝑖 𝑖=1 1 = 𝑛 1 = 𝑛 𝑛 𝑖=1 𝑛 𝑖=1 1 𝐸 𝑋𝑖 = 𝑛 𝑛 𝑖=1 1 𝑉𝑎𝑟 𝑋𝑖 = 𝑛 1 𝜇 = 𝑛𝜇 = 𝜇 𝑛 𝑛 1 2 𝜎 = 𝑛𝜎 = 𝜎 2 𝑛 2 𝑖=1 Distribuição amostral da média 𝑋−𝜇 𝑛(𝑋 − 𝜇) aprox 𝑍= = ≈ 𝑁 0,1 𝜎 𝜎/ 𝑛 Distribuição amostral da média Teorema. Seja 𝑋 uma variável aleatória normal com média 𝜇 e variância 𝜎 2, 𝑋~𝑁(𝜇, 𝜎 2) , e seja 𝑋1, 𝑋2, … , 𝑋𝑛 uma amostra aleatória simples (AAS) de variável 𝑋. Então 𝜎2 𝑋 ~𝑁 𝜇, 𝑛 𝑋−𝜇 𝑛(𝑋 − 𝜇) 𝑍= = ~𝑁 0,1 𝜎 𝜎/ 𝑛 distribuição populacional 𝑋~𝑁(2,1) distribuição amostral da estatística 𝑛 = 5 1 𝑋 ~𝑁 2, 5 Exemplo 10.11 Uma máquina está regulada para encher pacotes de café automaticamente segundo a distribuição normal com média de 500 gramas e desvio padrão de 10 gramas. Colhendo-se uma amostra de 𝑛 = 100 pacotes e pesando-os. Qual é a probabilidade de encontramos a média 𝑥 defirindo de 500 g. de menos de 2 gramas. 𝑃 𝑋 − 500 < 2 = 𝑃 498 < 𝑋 < 502 = = 𝑃 −2 < 𝑍 < 2 ≈ 0.95 Distribuição amostral de proporção distribuição populacional 𝑋~𝐵 (𝑝) 𝐸 𝑋 =𝑝 𝑉𝑎𝑟 𝑋 = 𝑝(1 − 𝑝) Distribuição amostral de proporção distribuição amostra 𝑋1, 𝑋2, … , 𝑋𝑛 𝑋𝑖 ~𝐵 (𝑝) 𝐸 𝑋𝑖 = 𝑝 𝑉𝑎𝑟 𝑋𝑖 = 𝑝(1 − 𝑝) 𝑋−𝜇 𝑛(𝑋 − 𝜇) 𝑍= = ≈ 𝑁 0,1 𝜎 𝜎/ 𝑛 𝑍= 𝑛(𝑝 − 𝑝) 𝑝(1 − 𝑝) ≈ 𝑁 0,1 Exemplo 10.12 Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhemos uma AAS de 𝑛 = 10 estudantes e calculamos 𝑝 proporção de mulheres na amostra. Qual probabilidade de que 𝑝 difira de 𝑝 em menos de 0,01? 𝑝(1 − 𝑝) 𝐸 𝑝 = 𝑝, 𝑉𝑎𝑟 𝑝 = 𝑛 𝑝 1−𝑝 𝑝 ≈ 𝑁 𝑝, = 𝑁(0.3, 0.021) 𝑛 𝑃 𝑝 − 𝑝 < 0.01 = 𝑃 −0.01 < 𝑝 − 𝑝 < 0.01 ≈ 0.01 0.01 ≈𝑃 − <𝑍< = 𝑃 −0.07 < 𝑍 < 0.07 = 0.056 0.021 0.021 Dimensionamento da amostra p(1 p ) εz , n segue que o tamanho amostral n, dados e a margem de erro , tem a forma Da relação 2 z n p(1 p ), ε onde z é tal que = P(-z Z z) e Z ~ N(0,1). Entretanto, nesta expressão, n depende de p(1-p), que é desconhecido. Como calcular o valor de n? Gráfico da função p(1-p), para 0 p 1. Pela figura observamos que: • a função p(1-p) é uma parábola simétrica em torno de p = 0,5; • o máximo de p(1-p) é 0,25, alcançado quando p = 0,5. Assim, na prática, substituímos p(1-p) por seu valor máximo, 2 obtendo z n 0,25 , ε que pode fornecer um valor de n maior do que o necessário. Pergunta: É possível reduzir o tamanho da amostra quando temos alguma informação a respeito de p? Por exemplo, sabemos que: • p não é superior a 0,30, ou • p é pelo menos 0,80, ou • p está entre 0,30 e 0,60. Resposta: Depende do tipo de informação sobre p. Em alguns casos, podemos substituir a informação p(1-p), que aparece na expressão de n, por um valor menor que 0,25. Redução do tamanho da amostra Vimos que, se nada sabemos sobre o valor de p, no cálculo de n, substituímos p(1-p) por seu valor máximo, e calculamos 2 z n 0,25 . ε Se temos a informação de que p é no máximo 0,30 (p 0,30), então o valor máximo de p(1-p) será dado por 0,3x0,7 = 0,21. Logo, reduzimos o valor de n para 2 z n 0,21 . ε Agora, se p é pelo menos 0,80 (p 0,80), então o máximo valor de p(1-p) é 0,8x0,2 = 0,16, e temos 2 z n 0,16 . ε Mas, se 0,30 p 0,60, o máximo valor de p(1-p) é 0,5x0,5=0,25 e, neste caso, não há redução, ou seja, 2 z n 0,25. ε Exemplo 3: No Exemplo 2, suponha que temos a informação de que no máximo 30% dos alunos da USP foram ao teatro no último mês. Portanto, temos que p 0,30 e, como vimos, o máximo de p(1-p) neste caso é 0,21. Assim, precisamos amostrar 2 2 1,96 z n 0,21 0,21 2017 estudantes , ε 0,02 conseguindo uma redução de 2401- 2017 = 384 estudantes. Intervalo de confiança para p Vimos que a estimativa intervalar para p tem a forma: pˆ ε ; pˆ ε , p( 1 p ) e z tal que = P(-z Z z) na N(0,1). com ε z n Na prática, substituímos a proporção desconhecida p pela proporção amostral p̂, obtendo o seguinte intervalo de confiança com coeficiente de confiança : pˆ( 1 pˆ ) pˆ( 1 pˆ ) IC( p ; γ ) pˆ z ; pˆ z n n