Aula 2. Estimação I. Capítulo 11, Bussab&Morettin βEstatística Básicaβ 7ª Edição distribuição populacional π~π΅(π) Estimar a proporção π, π β (0,1) de pessoas favoráveis (desfavoráveis 1 β π, π β (0,1) ) a politica de governo atual. distribuição populacional π~π(π, π 2 ) Estimar a vida média útil de novo tipo de lâmpada π , e estimar a variância π 2 , sabendo que a distribuição é normal. Estimação de parâmetros Parâmetro = função qualquer da distribuição populacional população π~π΅(π) π = πΈ(π) população π~π(π, π 2 ) π=πΈ π π 2 = πππ(π) Estatística = função qualquer da amostra população π~π΅(π) amostra π1 , β¦ , ππ , ππ β {0,1} estimador de π é estatística πβ‘π população π~π(π, π 2 ) amostra π1 , β¦ , ππ , ππ β β estimador de π é estatística πβ‘π estimador de π 2 é estatística π2 β‘ π2 Dois possíveis procedimentos de estimação: β’ Estimação pontual β’ Estimação intervalar - Para estimação de proporção vamos observar π elementos, extraídos ao acaso e com reposição da população; - Para cada elemento selecionado, verificamos a presença (sucesso) ou não (fracasso) da característica de interesse. Exemplo: Sejam, π: proporção de alunos da USP que foram ao teatro pelo menos uma vez no último mês, e π: número de estudantes que respondem βsimβ em uma pesquisa com n entrevistados. Suponha que foram entrevistados π = 500 estudantes e que, desses, π = 100 teriam afirmado que foram ao teatro pelo menos uma vez no último mês. A estimativa pontual (proporção amostral) para π é dada por: π 100 π= = = 0.20 π 500 ou seja, 20% dos estudantes entrevistados afirmaram que foram ao teatro pelo menos uma vez no último mês. Note que, outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para π. Estimativa intervalar ou intervalo de confiança β’ Para uma amostra observada, os estimadores pontuais fornecem como estimativa um único valor numérico para o parâmetro. β’ Os estimadores pontuais são variáveis aleatórias e, portanto, possuem uma distribuição de probabilidade, em geral, denominada distribuição amostral. Idéia: construir intervalos de confiança, que incorporem à estimativa pontual informações a respeito de sua variabilidade (erro amostral). Intervalos de confiança são obtidos por meio da distribuição amostral do estimador pontual. A estimativa intervalar corresponde a um intervalo determinado da seguinte maneira: π β π; π + π sendo π o erro amostral ou margem de erro. Pergunta: Como encontrar π ? Seja π(Ξ΅) a probabilidade da estimativa pontual estar a uma distância de, no máximo, ο₯ da proporção verdadeira π, ou seja, π π =π πβπ β€π A probabilidade π(ο₯) é também denominada coeficiente de confiança do intervalo, que denotamos pela letra grega πΎ (gama). Afirma-se ainda que a estimativa intervalar tem coeficiente de confiança πΎ = π(ο₯). Formalmente, π π =π πβπ β€π =π π βπ β€π π π =π πβπ β€ β€π+π π = π ππ β ππ β€ π β€ ππ + ππ βππ π β ππ =π β€ β€ ππ(1 β π) ππ(1 β π) ππ ππ(1 β π) Como π ~ π΅(π, π) temos que, para π grande, a variável πβππ aleatória π = tem distribuição π(0,1). ππ(1βπ) Deste modo, para n grande, π π β π βππ ππ 1 β π =π onde π~π(0,1). β ππ π 1βπ β€πβ€ β€πβ€ ππ ππ 1 β π ππ π 1βπ Denotando ππ π 1βπ = π§ temos que π π = πΎ = π βπ§ β€ π β€ π§ Assim, podemos obter π§ conhecendo-se ο§ (ou π(ο₯)). Por exemplo, considere ο§ = 0,80. π§ é tal que π΄(π§) = 0,90. Pela tabela, temos π§ = 1,28. Erro da estimativa intervalar Da igualdade π§ = ππ π 1βπ é imediato mostrar que o erro amostral ο₯ é dado por π(1 β π) π=π§ π onde π§ é tal que ο§ = π(βπ§ ο£ π ο£ π§), com π ~ π(0,1). Intervalo de confiança para π Vimos que a estimativa intervalar para π tem a forma: π β π; π + π com π = π§ π(1βπ) π e π§ tal que πΎ = π βπ§ β€ π β€ π§ na π(0,1) Na prática, substituímos a proporção desconhecida π pela proporção amostral π , obtendo o seguinte intervalo de confiança com coeficiente de confiança ο§ : π 1βπ π 1βπ πΌπΆ π; πΎ = π β π§ ;π + π§ π π No exemplo temos π = 500 e π = 0,20. Construir um intervalo de confiança para π com coeficiente de confiança ο§ = 0,95. Como ο§ = 0,95 fornece π§ = 1,96, o intervalo é dado por: π 1βπ π 1βπ πβπ§ ;π +π§ π π 0,20 × 0,80 0,20 × 0,80 = 0,20 β 1,96 ; 0,20 + 1,96 500 500 = 0,20 β 0,035; 0,20 + 0,035 = 0,165; 0,235 Nesse intervalo (ο§ = 0,95), a estimativa pontual para π é 0,20, com um erro amostral ο₯ igual a 0,035. Interpretação do IC com ο§ = 95%: Se sortearmos 100 amostras de tamanho n = 500 e construirmos os respectivos 100 intervalos de confiança, com coeficiente de confiança de 95%, esperamos que, aproximadamente, 95 destes intervalos contenham o verdadeiro valor de p. Comentários: Da expressão π = π§ π(1βπ) π é possível concluir que: β’ para ο§ fixado, o erro diminui com o aumento de π. β’ para π fixado, o erro aumenta com o aumento de ο§. Ainda no exemplo da USP, temos k = 100 e n = 500. Qual é a probabilidade da estimativa pontual estar a uma distância de, no máximo, 0,03 da proporção verdadeira? Dados do problema: π = 500, π = 0,20 e π = 0,03 β π π = πΎ =? Como a proporção verdadeira π é desconhecida, utilizamos a estimativa pontual π para calcular π§ e, assim, obter ο§ (ou π(ο₯)). Cálculo de z: zο½ Ξ΅ n 0,03 500 ο ο½ 1,68 . p( 1 ο p) 0,2 ο΄ 0,8 Logo, obtemos P( Ξ΅ ) ο 2 ο΄ A( z ) ο 1 ο½ 2 ο΄ A(1,68) ο 1 ο½ 2 ο΄ 0,953 ο 1 ο½ 0,906 (90,6%). Exemplo 6: Suponha que estamos interessados em estimar a proporção p de pacientes com menos de 40 anos diagnosticados com câncer nos pulmões que sobrevivem pelo menos 5 anos. Em uma amostra aleatoriamente selecionada de 52 pacientes, somente 6 sobreviveram mais de 5 anos. 6 - Estimativa por ponto para p: pΛ ο½ ο½ 0,115(proporção amostral) 52 - Intervalo de confiança aproximado de 95% para p: 0,115(1 ο 0,115) 0,115(1 ο 0,115) (0,115 ο 1,96 ; 0,115 ο« 1,96 ) 52 52 ο½ (0,028, 0,202) Comentário: Embora esse intervalo tenha sido construído usando a aproximação normal para a distribuição binomial, poderíamos ter gerado um intervalo de confiança exato para p usando a própria distribuição binomial. Um intervalo exato é particularmente útil para pequenas amostras, em que o uso da aproximação normal não pode ser justificada.