1) ([1], Ex 2, p. 244) Duas pesquisas independentes sobre salários em duas áreas
metropolitanas muito separadas revelaram a seguinte informação sobre o salario médio de
operadores de equipamento pesado:
̅
Área
A
B
R$ 6,50 p/h
R$ 7,00 p/h
R$ 1,50 p/h
R$ 1,00 p/h
25
25
Pode-se concluir que as variâncias são as mesmas e se podemos concluir que os salários são
diferentes? Use nível de significância de 5%.
Solução.
Primeiramente verificaremos se as variâncias são iguais. Formulamos hipótese nula e
alternativa.
(as variâncias populacionais de salários em duas áreas são iguais);
(as variâncias populacionais de salários em duas áreas são diferentes).
Se a hipótese nula é verdadeira então a estatística do teste
Para realizar esse teste e lembrando que os valores usados na tabela são maiores de que 1,
vamos dividir o valor maximal da variância para o valor minimal, mas precisaremos por
isso comparar com o valor crítico para uma cauda com área de
:
esse valor vamos comparar com valor crítico. O valor crítico esta na tabela VI –
distribuição F para uma cauda de
2,5% para 24,24 graus de liberdades que da o valor de
. Já que
não rejeitamos a hipótese nula. O que significa que as variâncias
populacionais em duas áreas podem ser consideradas iguais.
Como podemos concluir se os salários são iguais? Comparando os salários médios
populacionais.
as medias (populacionais) de salários em duas áreas são iguais;
as medias (populacionais) de salários em duas áreas são diferentes.
Para calcular a estatística de teste primeiramente calcularemos a estimativa conjunta de
variância
(
)
(
)
Revisão FEA Contabilidade Noturno 2014
em que
são número de observações em áreas correspondentes. Se a hipótese nula é
verdadeira e se nos podemos aceitar que as variâncias populacionais são iguais (mas
desconhecidas) in duas áreas (verificamos isso no item anterior), então a estatística do teste
é t-estatística:
̅
̅
√
√
√
para achar o valor critico usaremos a tabela V (distribuição t-Student) onde o valor de vai
ser exatamente o valor de nível de significância 5%, pois a tabela usa p para bilateral teste o
que é o nosso caso. Se a hipótese nula é verdadeira, então t estatística do teste tem a
distribuição t-Student com
graus de liberdades:
̅
̅
√
então pela tabela com
e 48 graus de liberdades (usaremos 50) obtemos o valor
critico de 2.009. O que significa que valores em intervalo [-2.009, 2.009] são valores de t
estatística que indicam aceitar a hipótese nula. O nosso valor observado -1.58 pertence a
esse intervalo, o que significa que não podemos rejeitar a hipótese que os salários médios
populacionais de duas áreas são iguais.
2) ([1], Ex 4, p. 244) Uma grande cadeia de magazines esta interessada em saber se o valor
médio das compras é maior em suas lojas do centro da cidade ou no shopping center de
certa localidade. Teste a afirmação de que ambas são iguais, contra a alternativa de que
ambas não são iguais, ao nível de significância de 1%. Uma amostra aleatória das
transações nos dois locais deu os seguintes dados:
̅
n
Centro
Shopping center
$45,00
100
$43,50
100
(Suponha que o desvio padrão populacional seja de $10,00 em ambos os casos)
Solução. Formulemos hipóteses
as medias (populacionais) de valor das compras em dois locais são iguais;
as medias (populacionais) de valor das compras em dois locais são diferentes.
Lembrando, que o desvio padrão
de valor de venda populacional nos dois centros é
conhecido, neste caso a estatística do teste já não é mais t-Student, mas normal:
Revisão FEA Contabilidade Noturno 2014
̅
̅
(
)
√
Assim o valor do teste
̅
̅
√
√
teste é bilateral, acharemos o valor critico usando a tabela da distribuição normal, Tabela
III, onde o valor de p usaremos como
. Procurando o
valor mais próximo a esse na tabela,
, o que da o valor crítico
. Isso significa
que os valores no intervalo
são os valores de aceitação de hipótese nula. O
nosso valor de teste calculado é 1.06 pertence a esse intervalo, o que leva a conclusão de
não rejeitar a hipótese sobre a igualdade de valores médios (populacionais) das compras em
dois centros.
3) Uma pesquisa deseja verificar se o número de livros emprestados por uma biblioteca
pública muda conforme o dia da semana. Durante uma determinada semana, o número de
livros emprestados foi:
Dia da semana
No. de livros
emprestados
Segunda
135
Terça
108
Quarta
120
Quinta
114
Sexta
116
(a) Quais são as hipóteses estatísticas adequadas a essa situação?
Hipóteses estatísticas são seguintes.
Hipótese nula : o número de livros emprestados não mude conforme o dia da semana, seja
a probabilidade de um livre ser emprestado em -gesimo dia de semana, então a hipótese
nula pode ser reescrita da seguinte maneira
Assim a hipótese alternativa
para algum dia de semana .
(b) Supondo que o número de livros emprestados não mude conforme o dia da semana,
calcule o número esperado de livros emprestados na quarta-feira. E calcule a
estatística adequada
Número total de livros emprestados nestes dias é 135+108+120+114+116=593. Assim, se a
hipótese nula é verdadeira, então o numero esperado tem que ser o mesmo para cada dia e
igual a
livros esperados em cada dia da semana:
Revisão FEA Contabilidade Noturno 2014
Dia da semana
No Observado
No Esperado
Segunda
135
118,6
Terça
108
118,6
Quarta
120
118,6
A estatística para calcular é estatística chi-quadrado
(
)
(
)
(
(
Quinta
114
118,6
)
Sexta
116
118,6
(
)
)
(c) Qual é o número de graus de liberdade associado ao teste e como ele é calculado?
O teste a realizar é o teste de aderência temos 5 categorias e 5-1=4 graus de liberdades.
(d) Qual a sua conclusão, considerando um nível de significância de 5%?
Valor crítico de chi-quadrado com 4 graus de liberdades para 5% na cauda, pela tabela de
chi-quadrado é 9,488. Valor observado de chi-quadrado é 3,47. Assim 3,47 < 9,488 e não
vamos rejeitar a hipótese nula.
4) Investiga-se, para um certo produto, a existência de possíveis diferenças de grau de
fidelidade entre os sexos de seus consumidores. 200 homens e 200 mulheres foram
entrevistados fornecendo o seguinte resultado:
Sexo\Grau de fidelidade
Homem
Mulher
alto
120
80
médio
50
50
baixo
30
70
(a) Quais são as hipóteses estatísticas adequadas a essa situação?
A hipótese nula H: sexo e grau de fidelidade são independentes
A hipótese alternativa A: sexo e grau de fidelidade são dependentes
(b) Supondo que o grau de fidelidade não depende do sexo do usuário do produto, calcule
o número esperado de homens com alto grau de fidelidade. Calcule a estatística
adequada
Revisão FEA Contabilidade Noturno 2014
A estatística é chi-quadrado:
(
)
(
(
)
(
)
(
)
(
)
)
(c) Qual é o número de graus de liberdade associado ao teste e como ele é calculado?
3 colunas e 2 linhas vão dar (
) (
)
graus de liberdade
(d) Qual a sua conclusão, considerando um nível de significância de 5%?
Valor crítico para chi-quadrado com 2 graus de liberdades para 5% pela tabela de chiquadrado é 5,991. O valor observado da estatística do teste, 20, é maior de que o valor
crítico, o que significa que temos que rejeitar a hipótese nula. O que significa que existe
alguma associação entre sexo e graus de fidelidade.
Revisão FEA Contabilidade Noturno 2014
5) Para os dados gerados durante 30 anos de (1959 até 1988), foram ajustados (1) os dados
gasto com moradia (y) em relação a renda individual, x, (2) os gastos com moradia (y) em
relação a tendência exponencial em tempo (t), onde t=1 para o ano de 1959, 2 para
1960,....(erro padrão entre parêntesis):
(1)
log y = -2.5 + 1.61 log x
(e.p.)
(0.22)
(0.17)
(2)
log y = 5.09 + 0.09 t
(e.p.)
(0.27) (0.10)
a) Dar a interpretação para coeficientes.
b) Construir o 95% intervalo de confiança para coeficiente de inclinação para a
regressão (1). Com esse intervalo testa a hipótese sobre a significância desse
coeficiente. Qual é o erro do tipo I vai dar esse intervalo de confiança?
c) Descrever os modelos teóricos para duas regressões: dependência funcional
entre as variáveis, condições de Gauss-Markov para termo perturbativo.
Solução.
a) Faremos transformação inversa:
o coeficiente de inclinação 1.61 em primeira regressão tem seguinte interpretação: 1.61 é a
elasticidade de gastos em moradia (y) em relação a renda individual (x), para quem não
conhece conceito de elasticidade, podemos explicar isso de seguinte forma: se aumentamos
a renda individual em 1%, então em 1.61% vai aumentar o gasto em moradia. O que
significa que os gastos em moradia são elásticos (ou sensíveis) a variação de renda
individual. Nessa regressão o coeficiente -2.5 não possua a interpretação.
Para segunda regressão faremos transformação inversa:
o que observamos que a regressão modela uma tendência exponencial pelo tempo. O
coeficiente de inclinação 0.09 nessa regressão vai ter a seguinte interpretação: a tendência
exponencial durante esses anos é de 0.09, ou seja, cada ano os gastos em moradia
aumentam em 9%. Nesta regressão o coeficiente 5.09 tem a interpretação: quando
, ou
seja, em ano 1958 os gastos em moradia eram aproximadamente, em média,
unidades.
b) o intervalo de confiança de 95% estamos construindo baseando-se em distribuição da
estatística:
( )
Revisão FEA Contabilidade Noturno 2014
assim, seja é o valor crítico de t distribuição correspondente a confiança de 95%, então a
fórmula para intervalo de confiança é
( )
( )
(
)
em que, para achar o valor critico, usaremos
graus de liberdades para tdistribuição (Tabela V) e
. Com o intervalo de confiança construído podemos testar
a hipótese sobre a significância: hipótese nula
contra alternativa
. Se o
intervalo de confiança é de 95% então o erro de tipo I correspondente é
, ou seja é de 5%. Para verificar a hipótese somente verificamos se o valor de
que
esta em hipótese nula (no nosso caso é 0) pertence ao intervalo de confiança. No nosso caso
( ) (
), o que significa que deveríamos rejeitar a hipótese nula com
nível de significância de 5%.
c) Os modelos teóricos para regressões (1) e (2) são
em que
( ) tem que satisfazer todas as condições de Gauss-Markov: ( )
( )
para qualquer
, que { } são mutuamente independentes, e
e
são independentes para qualquer i, e que distribuição de erros é normal.
6) ([1], Ex 5, p 393) Os dados seguintes se referem a uma amostra de vendas (y) versus
área de mostruário (x) para livros num supermercado:
vendas
(livros /dia)
40
25
30
32
17
38
44
27
30
20
área mostruário
(em pés)
7,0
4,0
4,4
5,0
3,2
6,0
8,0
4,2
4,8
3,4
Baseando nesses dados calculamos a variância amostras
,
e ajustando
a reta da regressão pelo mínimos quadrados o erro padrão residual deu
. Usando
esses dados construir a tabela de analise de variância e realizar o teste de significância.
Solução. A tabela ANOVA para a regressão tem seguinte forma
Revisão FEA Contabilidade Noturno 2014
e a relação entre variâncias calculadas e elementos da tabela são seguintes:
Assim logo obtemos que
(
(
)
)
o correspondente nível descritivo para esse valor de estatística é com certeza menor de que
1%. Assim a tabela ANOVA vai ter a seguinte forma
647.822
647.822
o teste de significância é realizado pela F-estatística, cuja nível descritivo neste caso deu
quase 0. Isso significa que teremos que rejeitar a hipótese nula que neste caso é
contra alternativa
.
7) Para observações anuais 1959-1985 a regressão linear simples logarítmica foi aplicada
para explicar os gastos em alimentos (
) atraves de salario liquido ( ) (com erro
padrão em parêntesis):
(
)
(
(0.156)
)
(0.024)
Com objetivo achar o modelo mais adequado o pesquisador adicionou mais duas variáveis
em regressão – índice de preço relativo (
) e o tempo (
para 1959 ect.)
(
(
)
(0.863)
(0.112)
)
(
(0.058)
)
,
(0.006)
Revisão FEA Contabilidade Noturno 2014
a) Quais modelos são consideradas para consumo de alimentos?
Os modelos que estão sendo considerados são:
(1)
( )
(2)
( )
(
)
parâmetros de estimação
, em que
são
b) Dê a interpretação para cada equação obtida e realiza os testes de significância para
coeficientes.
(1) Elasticidade de gastos com alimentos em relação ao salario liquido é de 0.56 –
ou seja, se em 1% aumenta salario liquido, então aproximadamente em 0.56%
aumentam gastos com alimentos.
(2) Elasticidade de gastos com alimentos em relação ao salario liquido é quase
zero, é de
, se o preço e tempo são fixos – ou seja, se em 1%
aumenta salario liquido, então quase não aumenta aumentam gastos com
alimentos quando outras variáveis, preço e tempo são fixos.
Elasticidade de gastos com alimentos em relação ao salario liquido é de
,
se o salario e tempo são fixos – ou seja, se em
aumenta o índice de preço,
então em
diminuam gastos com alimentos quando outras variáveis,
salario e tempo são fixos.
Taxa de crescimento anual de gastos em alimentos é de aproximadamente
mantendo salario e preço fixos.
,
c) Como você explica o aumento de
e diminuição de
da primeira equação
para a segunda. Somente esse fato significa que o modelo "melhorou"?
Adição de qualquer variável na regressão vai diminuir
e consequentemente
aumentar coeficiente de determinação quase sempre. Somente esse fato não indica
o aumento de qualidade de modelo.
d) Realize o F-teste para dois modelos.
Anos de observações são 1985-1958=27, então
(1)
, o valor crítico para 2.5% e graus de liberdade
1 e 25 é 5.69, então rejeitamos a hipótese nula que afirma insignificância de
coeficiente
, ou afirmamos que a regressão é significante e
.
Revisão FEA Contabilidade Noturno 2014
(2)
o valor crítico para 2.5% e graus de liberdade 3
e 23 é 3.75, então rejeitamos a hipótese nula que afirma insignificância de
coeficientes
, ou afirmamos que a regressão é
significante.
e) Realize o F-teste para adição de variáveis em segundo equação. A adição de índice
de preço para alimentos e o tempo é significante com o nível de significância de
1%?
A formula para F-teste é
(
( )
( )) (
( ) (
)
)
Em que
( ) é soma de quadrados de resíduos (
) em regressão com
variáveis explicativas: assim, temos
para segunda regressão e
para a
primeira, e, lembrando que
, obtemos
(
( )
( )) (
( ) (
)
)
(
) (
(
)
)
Se a hipótese nula (que os coeficientes adicionais não são significantes)
é verdadeira, então F-estatística tem que ter a distribuição F com 2 e 23 graus de
liberdades. Valor crítico para, digamos, 5% é 3.42. Então valor observado da
estatística é maior de que o valor crítico, isso leva a gente rejeitar a hipótese nula e
afirmar que a qualidade de modelo aumentou depois de adição de variáveis
e .
f) Como você explicaria o fato que a variável (
primeira equação é não significante em segunda?
) é extremamente significante em
Provavelmente, isso ocorreu porque na primeira equação a variável
desempenhou o papel como substituto de variáveis que deveriam ficar no modelo,
neste caso tempo e índice de preço; por causa disso ela sofreu o viés na primeira
equação que deu a significância para a equação.
Revisão FEA Contabilidade Noturno 2014
Referencia:
[1] William J.Stevenson. Estatística Aplicada à Administração. Editora HARBRA ltda.
Edição 2001.
Revisão FEA Contabilidade Noturno 2014