Inferência Estatística: Amostragem Estatística Cálculo de Descritiva Probabilidade Inferência Estatística Estimação Pontual Por Intervalo Teste de Hipótese Conceitos básicos Estimação É um processo que consiste em avaliar os parâmetros de uma distribuição de estimadores obtidos em uma amostral. Parâmetro As quantidade da população, em geral, desconhecidas e sobre as quais temos interesse, e usualmente representadas por letras gregas tais como , , e , entre outras. Estimativa Valor numérico de um estimador. Prof. Propriedades de um Estimador 1. Não - Viciado O valor esperado coincide com o valor que ele estima. 2. Consistência Um estimador E (ˆ ) ̂ de um parâmetro é consistente se: E (ˆ ) 3. Eficiência e lim Var ( ˆ ) 0 n Um estimador é dito ser eficiente, quando gera a menor dispersão possível. 4. Suficiente Se contém o máximo possível de informação com referência ao parâmetro por ele estimado. Prof. são usados para descrever a Parâmetros ,,p População X1, X2, X3, ..., XN São usadas para estimar O pesquisador seleciona uma Estimativas: 7,0; 1,2; 80% Amostra: X10, X21, ..., Xn As estatísticas geram A amostra gera Dados 7,0; 5,8; 6,4; ... Os dados são processados por Estatísticas ou estimadores: X, s, p Distribuições Amostrais Definição: Uma distribuição amostral é uma distribuição de freqüência ou distribuição de probabilidade de uma estatística da amostra que é formada quando amostras de tamanho n são repetidamente colhidas de uma população. - Se a estatística da amostra for a média amostral, resultará em uma distribuição amostral das médias amostrais; - Se for a variância, resultará em uma distribuição amostral das variâncias amostrais. - Se for a proporção de itens com cada característica, será a distribuição amostral das proporções amostrais. Prof. Exemplo 1: 8 amostras aleatórias de 10 elementos Amostra Valores x ~ x x(1) 1 -1 0 -2 2 -0,10 0 -3 2 0 2 0 1 1 0,80 1 -1 -2 -1 1 2 1 -1 -1 0,00 -1 -2 2 -1 -3 0 1 -5 1 -3 -0,90 -0,5 -5 1 0 1 0 -2 1 -2 1 -2 -0,40 0 -2 -1 -1 0 1 3 -2 -1 -4 2 -1 -0,40 -1 -4 1 1 1 0 0 -3 2 2 1 -1 0 3 -1 4 -2 4 -1 0 5 -2 6 7 1 1 -1 1 0 0 -5 1 0 1 -0,10 0,5 -5 8 0 1 0 3 1 0 3 -2 0,80 0,5 -2 0 2 ~ x é a média amostral, x Em que x(1) é o mínimo amostral. é a mediana amostral e Prof. Exemplo 2: Um jogo consiste em lançar uma moeda 3 vezes. Para cada lançamento: Se cair cara você ganha 1 ponto Caso saia coroa, você perde um ponto - Determine as distribuições de probabilidade dos estimadores x e S2. Solução: Em uma população podemos assumir os valores –1 e 1, com probabilidades iguais. c= cara e k=coroa, 23=8 lançamentos. ( ), ( ), ( ), ( ), ( ), ( ). ( ), ( ), (X1,X2, X3) Probabilidade X S2 (-1,-1,-1) 1/8 -1 0 (-1,-1,1) 1/8 -1/3 4/3 (-1,1,-1) 1/8 -1/3 4/3 (-1,1,1) 1/8 1/3 4/3 (1,-1,-1) 1/8 -1/3 4/3 (1,-1,1) 1/8 1/3 4/3 (1,1,-1) 1/8 1/3 4/3 (1,1,1) 1/8 1 0 Baseando-se na tabela acima, podemos construir as distribuições dos estimadores, dada por: X -1 -1/3 1/3 1 pi 1/8 3/8 3/8 1/8 E ( X ) 1* S2 0 4/3 pi 2/8 6/8 1 1 1 1 1 1 * * 1* 0 8 3 8 3 8 8 E (S 2 ) 0 * 2 4 6 * 1 8 3 8 Estimação Pontual Definição: As estimativas são ditas pontuais quando apontam para um único valor. Tabela: Estimadores para Média, Variância e Proporção Parâmetro Estimador Estimativa por ponto X X 27 anos 2 S2 S 2 10 anos S s 3,16 anos P p pˆ 0,3 Prof. Teorema Central do Limite 1. Quando a população é normal N(;), a média amostral X de amostras de tamanho n tem distribuição N ; n 2. Para uma pop. Não-normal com média e d.p. , a distribuição da média amostral X para amostras de tamanho n suficientemente grande é aproximadamente normal com média e desvio padrão n , isto é: X ~ N (0,1) n Prof. Teorema Central do Limite Prof. Exemplo 3: Coleta-se uma amostra de 10 observações independentes de uma N(2;2). Determine a probabilidade de a média amostral: a) Ser inferior a 1. Solução: 2; 2 2 e n 10 X 1 2 P( X 1) P P( Z 2,23) 0,0125 1 , 42 n 10 Portanto, a probabilidade de a média amostral ser inferior a 1 é de 0,0125. b) Ser Superior a 2,5. X 2,5 2 P( X 2,5) P 1 P( Z 1,11) 0,1314 1,42 n 10 Prof. Exemplo 4: O gráfico enumera os períodos de tempos que os adultos gastam lendo jornais. Selecione ao acaso 50 adultos com idade entre 18 e 24 anos. Qual é a probabilidade de que o tempo médio gasto por eles lendo jornal esteja entre 8,7 e 9,5 minutos? Suponha = 1,5 minutos. Solução: Como n >30, então pelo TCL a distribuição de médias das amostras é aproximadamente normal N ; n X 9 1,5 X 0,2121 n 50 8,7 9 X 9,5 9 P (8,7 X 9,5) P 1 , 5 1 , 5 n 50 50 P(1,41 Z 2,36) Continuação, P(8,7 X 9,5) P( Z 2,36) P( Z 1,41) 0,9909 0,0793 0,9116. Então, a probabilidade de que o tempo médio gasto pelos 50 adultos lendo jornal esteja entre 8,7 e 9,5 minutos é 0,9116. Assim, 91,16% das amostras de 50 adultos com idade entre 18 e 24 anos apresentarão uma média situada entre 8,7 e 9,5 minutos. Isso significa que, assumindo que o valor =9 esteja correto, somente 8,84% de médias das amostras estarão fora do intervalo dado. Dica de estudo 1. Para obter as probabilidades de membros individuais de uma população com uma variável aleatória x, distribuída normalmente, use a fórmula: z X 2. Para obter probabilidade para a média X de uma amostra de tamanho n, use a fórmula: z X x x onde, X n Prof. Estimação Intervalar Definição: Uma estimativa intervalar é um intervalo de valores usados para estimar um parâmetro populacional. Definição: O Nível de Confiança é a probabilidade de que o intervalo estimado contenha o parâmetro populacional. Intervalo de Confiança para a média populacional () IC 100(1 )% para a média populacional, onde a é População Normal e desvio-padrão é conhecido (), temos: ; X z * Fórmula: X z * 1 n n 2 2 IC 100(1 )% para a média populacional, onde a é População Normal e desvio-padrão é desconhecido (), temos: s s Fórmula: X t 2;n1 * n ; X t 2;n1 * n 1 Dica: IC para pequenas mostras. Usa a distribuição t, quando n<30 Intervalo de Confiança para a média populacional () População Não-Normal. Grande Amostras, Fórmula: pg 146, Chico s s X z 2 * n ; X z 2 * n 1 Exercício 1, Cap 9: Uma amostra de 80 motoristas de determinado estado indica que um automóvel roda, em média, 22.000 km por ano, com d.p de 3.800 km. Construa um intervalo de confiança de 98% de confiança para a rodagem anual média dos carros. Solução: n 80, (amostra grande) x 2000km , 3800 km (d . p populac. conhecido ) 1 0,98 0,02 0,02 z 0,01 Procura 0,01 dentro da tabela e encontra o valor de 2 2,32 em módulo. 2 ; X z * X z * 1 n n 2 2 3800 3800 22000 2 , 32 * ; 22000 2 , 32 * 21014,34 ; 22985,66 80 80