1) ([1], Ex 2, p. 244) Duas pesquisas independentes sobre salários em duas áreas metropolitanas muito separadas revelaram a seguinte informação sobre o salario médio de operadores de equipamento pesado: ̅ Área A B R$ 6,50 p/h R$ 7,00 p/h R$ 1,50 p/h R$ 1,00 p/h 25 25 Pode-se concluir que as variâncias são as mesmas e se podemos concluir que os salários são diferentes? Use nível de significância de 5%. Solução. Primeiramente verificaremos se as variâncias são iguais. Formulamos hipótese nula e alternativa. (as variâncias populacionais de salários em duas áreas são iguais); (as variâncias populacionais de salários em duas áreas são diferentes). Se a hipótese nula é verdadeira então a estatística do teste Para realizar esse teste e lembrando que os valores usados na tabela são maiores de que 1, vamos dividir o valor maximal da variância para o valor minimal, mas precisaremos por isso comparar com o valor crítico para uma cauda com área de : esse valor vamos comparar com valor crítico. O valor crítico esta na tabela VI – distribuição F para uma cauda de 2,5% para 24,24 graus de liberdades que da o valor de . Já que não rejeitamos a hipótese nula. O que significa que as variâncias populacionais em duas áreas podem ser consideradas iguais. Como podemos concluir se os salários são iguais? Comparando os salários médios populacionais. as medias (populacionais) de salários em duas áreas são iguais; as medias (populacionais) de salários em duas áreas são diferentes. Para calcular a estatística de teste primeiramente calcularemos a estimativa conjunta de variância ( ) ( ) Revisão FEA Contabilidade Noturno 2014 em que são número de observações em áreas correspondentes. Se a hipótese nula é verdadeira e se nos podemos aceitar que as variâncias populacionais são iguais (mas desconhecidas) in duas áreas (verificamos isso no item anterior), então a estatística do teste é t-estatística: ̅ ̅ √ √ √ para achar o valor critico usaremos a tabela V (distribuição t-Student) onde o valor de vai ser exatamente o valor de nível de significância 5%, pois a tabela usa p para bilateral teste o que é o nosso caso. Se a hipótese nula é verdadeira, então t estatística do teste tem a distribuição t-Student com graus de liberdades: ̅ ̅ √ então pela tabela com e 48 graus de liberdades (usaremos 50) obtemos o valor critico de 2.009. O que significa que valores em intervalo [-2.009, 2.009] são valores de t estatística que indicam aceitar a hipótese nula. O nosso valor observado -1.58 pertence a esse intervalo, o que significa que não podemos rejeitar a hipótese que os salários médios populacionais de duas áreas são iguais. 2) ([1], Ex 4, p. 244) Uma grande cadeia de magazines esta interessada em saber se o valor médio das compras é maior em suas lojas do centro da cidade ou no shopping center de certa localidade. Teste a afirmação de que ambas são iguais, contra a alternativa de que ambas não são iguais, ao nível de significância de 1%. Uma amostra aleatória das transações nos dois locais deu os seguintes dados: ̅ n Centro Shopping center $45,00 100 $43,50 100 (Suponha que o desvio padrão populacional seja de $10,00 em ambos os casos) Solução. Formulemos hipóteses as medias (populacionais) de valor das compras em dois locais são iguais; as medias (populacionais) de valor das compras em dois locais são diferentes. Lembrando, que o desvio padrão de valor de venda populacional nos dois centros é conhecido, neste caso a estatística do teste já não é mais t-Student, mas normal: Revisão FEA Contabilidade Noturno 2014 ̅ ̅ ( ) √ Assim o valor do teste ̅ ̅ √ √ teste é bilateral, acharemos o valor critico usando a tabela da distribuição normal, Tabela III, onde o valor de p usaremos como . Procurando o valor mais próximo a esse na tabela, , o que da o valor crítico . Isso significa que os valores no intervalo são os valores de aceitação de hipótese nula. O nosso valor de teste calculado é 1.06 pertence a esse intervalo, o que leva a conclusão de não rejeitar a hipótese sobre a igualdade de valores médios (populacionais) das compras em dois centros. 3) Uma pesquisa deseja verificar se o número de livros emprestados por uma biblioteca pública muda conforme o dia da semana. Durante uma determinada semana, o número de livros emprestados foi: Dia da semana No. de livros emprestados Segunda 135 Terça 108 Quarta 120 Quinta 114 Sexta 116 (a) Quais são as hipóteses estatísticas adequadas a essa situação? Hipóteses estatísticas são seguintes. Hipótese nula : o número de livros emprestados não mude conforme o dia da semana, seja a probabilidade de um livre ser emprestado em -gesimo dia de semana, então a hipótese nula pode ser reescrita da seguinte maneira Assim a hipótese alternativa para algum dia de semana . (b) Supondo que o número de livros emprestados não mude conforme o dia da semana, calcule o número esperado de livros emprestados na quarta-feira. E calcule a estatística adequada Número total de livros emprestados nestes dias é 135+108+120+114+116=593. Assim, se a hipótese nula é verdadeira, então o numero esperado tem que ser o mesmo para cada dia e igual a livros esperados em cada dia da semana: Revisão FEA Contabilidade Noturno 2014 Dia da semana No Observado No Esperado Segunda 135 118,6 Terça 108 118,6 Quarta 120 118,6 A estatística para calcular é estatística chi-quadrado ( ) ( ) ( ( Quinta 114 118,6 ) Sexta 116 118,6 ( ) ) (c) Qual é o número de graus de liberdade associado ao teste e como ele é calculado? O teste a realizar é o teste de aderência temos 5 categorias e 5-1=4 graus de liberdades. (d) Qual a sua conclusão, considerando um nível de significância de 5%? Valor crítico de chi-quadrado com 4 graus de liberdades para 5% na cauda, pela tabela de chi-quadrado é 9,488. Valor observado de chi-quadrado é 3,47. Assim 3,47 < 9,488 e não vamos rejeitar a hipótese nula. 4) Investiga-se, para um certo produto, a existência de possíveis diferenças de grau de fidelidade entre os sexos de seus consumidores. 200 homens e 200 mulheres foram entrevistados fornecendo o seguinte resultado: Sexo\Grau de fidelidade Homem Mulher alto 120 80 médio 50 50 baixo 30 70 (a) Quais são as hipóteses estatísticas adequadas a essa situação? A hipótese nula H: sexo e grau de fidelidade são independentes A hipótese alternativa A: sexo e grau de fidelidade são dependentes (b) Supondo que o grau de fidelidade não depende do sexo do usuário do produto, calcule o número esperado de homens com alto grau de fidelidade. Calcule a estatística adequada Revisão FEA Contabilidade Noturno 2014 A estatística é chi-quadrado: ( ) ( ( ) ( ) ( ) ( ) ) (c) Qual é o número de graus de liberdade associado ao teste e como ele é calculado? 3 colunas e 2 linhas vão dar ( ) ( ) graus de liberdade (d) Qual a sua conclusão, considerando um nível de significância de 5%? Valor crítico para chi-quadrado com 2 graus de liberdades para 5% pela tabela de chiquadrado é 5,991. O valor observado da estatística do teste, 20, é maior de que o valor crítico, o que significa que temos que rejeitar a hipótese nula. O que significa que existe alguma associação entre sexo e graus de fidelidade. Revisão FEA Contabilidade Noturno 2014 5) Para os dados gerados durante 30 anos de (1959 até 1988), foram ajustados (1) os dados gasto com moradia (y) em relação a renda individual, x, (2) os gastos com moradia (y) em relação a tendência exponencial em tempo (t), onde t=1 para o ano de 1959, 2 para 1960,....(erro padrão entre parêntesis): (1) log y = -2.5 + 1.61 log x (e.p.) (0.22) (0.17) (2) log y = 5.09 + 0.09 t (e.p.) (0.27) (0.10) a) Dar a interpretação para coeficientes. b) Construir o 95% intervalo de confiança para coeficiente de inclinação para a regressão (1). Com esse intervalo testa a hipótese sobre a significância desse coeficiente. Qual é o erro do tipo I vai dar esse intervalo de confiança? c) Descrever os modelos teóricos para duas regressões: dependência funcional entre as variáveis, condições de Gauss-Markov para termo perturbativo. Solução. a) Faremos transformação inversa: o coeficiente de inclinação 1.61 em primeira regressão tem seguinte interpretação: 1.61 é a elasticidade de gastos em moradia (y) em relação a renda individual (x), para quem não conhece conceito de elasticidade, podemos explicar isso de seguinte forma: se aumentamos a renda individual em 1%, então em 1.61% vai aumentar o gasto em moradia. O que significa que os gastos em moradia são elásticos (ou sensíveis) a variação de renda individual. Nessa regressão o coeficiente -2.5 não possua a interpretação. Para segunda regressão faremos transformação inversa: o que observamos que a regressão modela uma tendência exponencial pelo tempo. O coeficiente de inclinação 0.09 nessa regressão vai ter a seguinte interpretação: a tendência exponencial durante esses anos é de 0.09, ou seja, cada ano os gastos em moradia aumentam em 9%. Nesta regressão o coeficiente 5.09 tem a interpretação: quando , ou seja, em ano 1958 os gastos em moradia eram aproximadamente, em média, unidades. b) o intervalo de confiança de 95% estamos construindo baseando-se em distribuição da estatística: ( ) Revisão FEA Contabilidade Noturno 2014 assim, seja é o valor crítico de t distribuição correspondente a confiança de 95%, então a fórmula para intervalo de confiança é ( ) ( ) ( ) em que, para achar o valor critico, usaremos graus de liberdades para tdistribuição (Tabela V) e . Com o intervalo de confiança construído podemos testar a hipótese sobre a significância: hipótese nula contra alternativa . Se o intervalo de confiança é de 95% então o erro de tipo I correspondente é , ou seja é de 5%. Para verificar a hipótese somente verificamos se o valor de que esta em hipótese nula (no nosso caso é 0) pertence ao intervalo de confiança. No nosso caso ( ) ( ), o que significa que deveríamos rejeitar a hipótese nula com nível de significância de 5%. c) Os modelos teóricos para regressões (1) e (2) são em que ( ) tem que satisfazer todas as condições de Gauss-Markov: ( ) ( ) para qualquer , que { } são mutuamente independentes, e e são independentes para qualquer i, e que distribuição de erros é normal. 6) ([1], Ex 5, p 393) Os dados seguintes se referem a uma amostra de vendas (y) versus área de mostruário (x) para livros num supermercado: vendas (livros /dia) 40 25 30 32 17 38 44 27 30 20 área mostruário (em pés) 7,0 4,0 4,4 5,0 3,2 6,0 8,0 4,2 4,8 3,4 Baseando nesses dados calculamos a variância amostras , e ajustando a reta da regressão pelo mínimos quadrados o erro padrão residual deu . Usando esses dados construir a tabela de analise de variância e realizar o teste de significância. Solução. A tabela ANOVA para a regressão tem seguinte forma Revisão FEA Contabilidade Noturno 2014 e a relação entre variâncias calculadas e elementos da tabela são seguintes: Assim logo obtemos que ( ( ) ) o correspondente nível descritivo para esse valor de estatística é com certeza menor de que 1%. Assim a tabela ANOVA vai ter a seguinte forma 647.822 647.822 o teste de significância é realizado pela F-estatística, cuja nível descritivo neste caso deu quase 0. Isso significa que teremos que rejeitar a hipótese nula que neste caso é contra alternativa . 7) Para observações anuais 1959-1985 a regressão linear simples logarítmica foi aplicada para explicar os gastos em alimentos ( ) atraves de salario liquido ( ) (com erro padrão em parêntesis): ( ) ( (0.156) ) (0.024) Com objetivo achar o modelo mais adequado o pesquisador adicionou mais duas variáveis em regressão – índice de preço relativo ( ) e o tempo ( para 1959 ect.) ( ( ) (0.863) (0.112) ) ( (0.058) ) , (0.006) Revisão FEA Contabilidade Noturno 2014 a) Quais modelos são consideradas para consumo de alimentos? Os modelos que estão sendo considerados são: (1) ( ) (2) ( ) ( ) parâmetros de estimação , em que são b) Dê a interpretação para cada equação obtida e realiza os testes de significância para coeficientes. (1) Elasticidade de gastos com alimentos em relação ao salario liquido é de 0.56 – ou seja, se em 1% aumenta salario liquido, então aproximadamente em 0.56% aumentam gastos com alimentos. (2) Elasticidade de gastos com alimentos em relação ao salario liquido é quase zero, é de , se o preço e tempo são fixos – ou seja, se em 1% aumenta salario liquido, então quase não aumenta aumentam gastos com alimentos quando outras variáveis, preço e tempo são fixos. Elasticidade de gastos com alimentos em relação ao salario liquido é de , se o salario e tempo são fixos – ou seja, se em aumenta o índice de preço, então em diminuam gastos com alimentos quando outras variáveis, salario e tempo são fixos. Taxa de crescimento anual de gastos em alimentos é de aproximadamente mantendo salario e preço fixos. , c) Como você explica o aumento de e diminuição de da primeira equação para a segunda. Somente esse fato significa que o modelo "melhorou"? Adição de qualquer variável na regressão vai diminuir e consequentemente aumentar coeficiente de determinação quase sempre. Somente esse fato não indica o aumento de qualidade de modelo. d) Realize o F-teste para dois modelos. Anos de observações são 1985-1958=27, então (1) , o valor crítico para 2.5% e graus de liberdade 1 e 25 é 5.69, então rejeitamos a hipótese nula que afirma insignificância de coeficiente , ou afirmamos que a regressão é significante e . Revisão FEA Contabilidade Noturno 2014 (2) o valor crítico para 2.5% e graus de liberdade 3 e 23 é 3.75, então rejeitamos a hipótese nula que afirma insignificância de coeficientes , ou afirmamos que a regressão é significante. e) Realize o F-teste para adição de variáveis em segundo equação. A adição de índice de preço para alimentos e o tempo é significante com o nível de significância de 1%? A formula para F-teste é ( ( ) ( )) ( ( ) ( ) ) Em que ( ) é soma de quadrados de resíduos ( ) em regressão com variáveis explicativas: assim, temos para segunda regressão e para a primeira, e, lembrando que , obtemos ( ( ) ( )) ( ( ) ( ) ) ( ) ( ( ) ) Se a hipótese nula (que os coeficientes adicionais não são significantes) é verdadeira, então F-estatística tem que ter a distribuição F com 2 e 23 graus de liberdades. Valor crítico para, digamos, 5% é 3.42. Então valor observado da estatística é maior de que o valor crítico, isso leva a gente rejeitar a hipótese nula e afirmar que a qualidade de modelo aumentou depois de adição de variáveis e . f) Como você explicaria o fato que a variável ( primeira equação é não significante em segunda? ) é extremamente significante em Provavelmente, isso ocorreu porque na primeira equação a variável desempenhou o papel como substituto de variáveis que deveriam ficar no modelo, neste caso tempo e índice de preço; por causa disso ela sofreu o viés na primeira equação que deu a significância para a equação. Revisão FEA Contabilidade Noturno 2014 Referencia: [1] William J.Stevenson. Estatística Aplicada à Administração. Editora HARBRA ltda. Edição 2001. Revisão FEA Contabilidade Noturno 2014