C
iências
ontábeis
ADMINISTRAÇÃO
Caderno de Estatística II
Dom Alberto
Prof: Carina Inês Panke da Silva
Página 2 / 51
C122
SILVA, Carina Inês Panke da
Caderno de Estatística II Dom Alberto / Carina Inês Panke da Silva.
– Santa Cruz do Sul: Faculdade Dom Alberto, 2010.
Inclui bibliografia.
1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística II
– Teoria I. SILVA, Carina Inês Panke da II. Faculdade Dom Alberto III.
Coordenação de Administração IV. Coordenação de Ciências Contábeis
V. Título
CDU 658:657(072)
Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10
Página 3 / 51
Apresentação
O Curso de Administração da Faculdade Dom Alberto iniciou sua
trajetória acadêmica em 2004, após a construção de um projeto pautado na
importância de possibilitar acesso ao ensino superior de qualidade que,
combinado à seriedade na execução de projeto pedagógico, propiciasse uma
formação sólida e relacionada às demandas regionais.
Considerando esses valores, atividades e ações voltadas ao
ensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bem
como o aprendizado efetivo dos alunos, o que permitiu o reconhecimento pelo
MEC do Curso de Administração em 2008.
Passados seis anos, o curso mostra crescimento quantitativo e
qualitativo, fortalecimento de sua proposta e de consolidação de resultados
positivos, como a publicação deste Caderno Dom Alberto, que é o produto do
trabalho intelectual, pedagógico e instrutivo desenvolvido pelos professores
durante esse período. Este material servirá de guia e de apoio para o estudo
atento e sério, para a organização da pesquisa e para o contato inicial de
qualidade com as disciplinas que estruturam o curso.
A todos os professores que com competência fomentaram o
Caderno Dom Alberto, veículo de publicação oficial da produção didáticopedagógica do corpo docente da Faculdade Dom Alberto, um agradecimento
especial.
Lucas Jost
Diretor Geral
Página 4 / 51
PREFÁCIO
A arte de ensinar e aprender pressupõe um diálogo entre aqueles que
interagem no processo, como alunos e professores. A eles cabe a tarefa de
formação, de construção de valores, habilidades, competências necessárias à
superação dos desafios. Entre estes se encontra a necessidade de uma
formação profissional sólida, capaz de suprir as demandas de mercado, de
estabelecer elos entre diversas áreas do saber, de atender às exigências legais
de cada área de atuação, etc.
Nesse contexto, um dos fatores mais importantes na formação de um
profissional
é
saber
discutir
diversos
temas
aos
quais
se
aplicam
conhecimentos específicos de cada área, dispondo-se de uma variedade ampla
e desafiadora de questões e problemas proporcionada pelas atuais
conjunturas. Para que isso se torne possível, além da dedicação daqueles
envolvidos no processo de ensino-aprendizagem, é preciso haver suporte
pedagógico que dê subsídios ao aprender e ao ensinar. Um suporte que
supere a tradicional metodologia expositiva e atenda aos objetivos expressos
na proposta pedagógica do curso.
Considerando esses pressupostos, a produção desse Caderno Dom
Alberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto.
Com este veículo, elaborado por docentes da instituição, a faculdade busca
apresentar um instrumento de pesquisa, consulta e aprendizagem teóricoprática, reunindo materiais cuja diversidade de abordagens é atualizada e
necessária para a formação profissional qualificada dos alunos do curso.
Ser um canal de divulgação do material didático produzido por
professores da instituição é motivação para continuar investindo da formação
qualificada e na produção e disseminação do que se discute, apresenta, reflete,
propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem o
Caderno Dom Alberto com a mesma satisfação que a Faculdade tem em
elaborar esta coletânea.
Elvis Martins
Diretor Acadêmico de Ensino
Página 5 / 51
Sumário
Apresentação........................................................................................................ 3
Prefácio................................................................................................................. 4
Plano de Ensino.................................................................................................... 6
Aula 1
Distribuição de Probabilidades............................................................................. 10
Aula 2
Distribuição de Probabilidades (Continuação)...................................................... 10
Aula 3
Distribuição de Probabilidades (Continuação)......................................................10
Aula 4
Estimativas........................................................................................................... 19
Aula 5
Estimativas (Continuação) .................................................................................... 19
Aula 6
Estimativas (Continuação) ....................................................................................19
Aula 7
Estimativas (Continuação) ....................................................................................19
Aula 8
Teste de Hipóteses................................................................................................ 27
Aula 9
Teste de Hipóteses (Continuação)........................................................................ 27
Aula 10
Teste de Hipóteses (Continuação)........................................................................ 27
Aula 11
Correlação e Regressão....................................................................................... 34
Aula 12
Séries Temporais................................................................................................... 40
Aula 13
Séries Temporais (Continuação)........................................................................... 40
Página 6 / 51
Centro de Ensino Superior Dom Alberto
Plano de Ensino
Identificação
Curso: Administração/Ciências Contábeis
Disciplina: Estatística II
Carga Horária (horas): 60
Créditos: 4
Semestre: 3º
Ementa
Inferência estatística. Testes de Hipóteses. Correlação e regressão. Números Índices e Análise de Séries
Temporais.
Objetivos
Geral: Oferecer condições para que o aluno possa utilizar esta ferramenta dando-lhe condições para que
possa coletar, interpretar e concluir sobre os resultados obtidos através da observação de dados coletados.
Que o aluno possa ainda verificar as variações dos preços de produtos utilizados em sua empresa através
da compreensão da Série de Números índices, podendo inclusive projetar estas variações, a fim de
implementar estratégias competentes para a empresa.
Específicos: Apresentação de exemplos de distribuição de probabilidades, que sejam capazes de propiciar
ao aluno uma identidade com problemas específicos da empresa, possibilitando melhor preparo na
identificação de problemas podendo preveni-los no futuro. Através da compreensão da série de números
índices, a realização de uma pesquisa dentro da empresa em que o aluno está familiarizado, identificando
produtos com preços e quantidades para que dessa forma possa calcular as variações de preços.
Inter-relação da Disciplina
Horizontal: Matemática Aplicada I, Estatística Aplicada I.
Vertical: Administração Estratégica, Elaboração e Análise de Projetos, Orçamento Empresarial e Mercado
de Capitais.
Competências Gerais
Realizar tomada de decisão: coletar, interpretar e concluir sobre os resultados obtidos.
Desenvolver raciocínio lógico, crítico e analítico: verificar variações (números índices), projetar as variações
para implementar estratégias competentes. Revelar-se um profissional adaptável.
Competências Específicas
Identificar problemas específicos, compreender e ler dados coletados , produzir estratégias eficazes e
eficientes.
Habilidades Gerais
Reconhecer e definir problemas, pensar estrategicamente, transferir e generalizar conhecimentos e
transferir conhecimentos de experiências cotidianas para o ambiente de trabalho.
Habilidades Específicas
Equacionar soluções, inferir, testar, correlacionar, calcular números índices e analisar séries temporais.
Conteúdo Programático
PROGRAMA:
1.
2.
3.
4.
Distribuição de Probabilidades;
Distribuição Binomial de Probabilidades;
Distribuição Normal de Probabilidades;
Inferência Estatística:
- Amostragem;
- Margem de erro;
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Página 7 / 51
5.
6.
7.
8.
9.
- Intervalos de Confiança;
- Tamanho da Amostra;
Testes de Hipóteses para médias e proporções;
Análise de Regressão e Correlação;
Análise de Séries Temporais;
Números índices;
Série de números índices.
Estratégias de Ensino e Aprendizagem (metodologias de sala de aula)
Aulas participativas, aulas expositivas, exercícios, trabalhos individuais.
Avaliação do Processo de Ensino e Aprendizagem
A avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa e
sistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação à
programação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos da
metodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade de
currículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc.
A forma de avaliação será da seguinte maneira:
1ª Avaliação
–
Peso 8,0 (oito): Prova;
–
Peso 2,0 (dois): Trabalho
O Trabalho será definido no decorrer das aulas, sendo algumas questões dissertativas que os
alunos terão que resolver e entregar.
2ª Avaliação
Peso 8,0 (oito): Prova;
Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas
provas do SPE)
Observação: As provas do SPE deverão ser realizas até o dia 30/09/2010 (1ª prova SPE) e até o dia
30/11/2010 (2ª prova SPE), sendo obrigatória a realização de ao menos uma prova.
Avaliação Somativa
A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez,
permitindo-se a fração de 5 décimos.
O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele
obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas.
Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no
bimestre.
O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários,
pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma
nota representativa de cada avaliação bimestral.
Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete
(7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados.
Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral,
no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de
substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como
média final de aprovação igual ou superior a cinco (5,0).
Sistema de Acompanhamento para a Recuperação da Aprendizagem
Serão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas que
são realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula.
Recursos Necessários
Humanos
Professor.
Físicos
Laboratórios, visitas técnicas, etc.
Materiais
Recursos Multimídia.
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Página 8 / 51
Bibliografia
Básica
CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002.
SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências
contábeis. São Paulo: Atlas, 1999. 1 e 2 v.
MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
SPIEGEL, Murray R.. Estatística. 3. ed. São Paulo: Pearson Education, 1994.
Complementar
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002.
MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005.
BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999.
FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990.
Periódicos
Jornais: Gazeta do Sul, Zero Hora.
Revistas: Exame, Amanhã, Veja, Isto É.
Sites para Consulta
http://www.ime.usp.br
http://www.ibge.gov.br
Outras Informações
Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca:
http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Página 9 / 51
Cronograma de Atividades
Aula
Consolidação
Avaliação
Conteúdo
Introdução da disciplina (apresentação, acordos e
cronograma). Revisão de probabilidades. Distribuição de
Probabilidade Binomial.
Distribuição
Probabilidade
Binomial
e
Distribuição
Probabilidade Normal.
1ª
2ª
Procedimentos
Recursos
AE
QG/DS/LB
AE/TG
QG/DS/LB
3ª
Distribuição Probabilidade Normal.
AE
QG/DS
4ª
Distribuição Probabilidade Normal.
AE
QG/DS
5ª
Estimativas: Margem de erro e Intervalos de Confiança para
grandes e pequenas amostras Para médias.
AE
QG
6ª
Estimativas: Tamanho da Amostra
AE
QG
AE
QG
AE
QG
Teste de Hipóteses para média. Interpretação.
AE
QG
Teste de Hipóteses para média. Interpretação.
AE
QG
AE/TG
QG
AE
QG/DS /LB
AE
QG/DS /LB
AE
QG/DS
AE
QG
Estimativas: Margem de erro e Intervalos de Confiança para
proporções.
Consolidação e Sistematização dos Conteúdos da 1ª
Avaliação.
7ª
1
1
8ª
9ª
Primeira Avaliação.
Testes de Hipóteses para proporção. Teste de Hipóteses com
duas médias e proporções. Interpretação.
Introdução a Correlação e Regressão. Cálculos e
interpretação.
Cálculos de Correlação e Regressão através das funções
estatísticas e Análise de Dados.
Séries Temporais. Números Índices e seus métodos de
cálculo. Séries de Números Índices.
Consolidação e Sistematização dos Conteúdos da 2a
Avaliação.
10ª
11ª
12ª
13ª
2
2
Segunda Avaliação.
3
Avaliação Substitutiva
Legenda
Código
AE
TG
TI
SE
PA
Descrição
Aula expositiva
Trabalho em grupo
Trabalho individual
Seminário
Palestra
Código
QG
RE
VI
DS
FC
Descrição
Quadro verde e giz
Retroprojetor
Videocassete
Data Show
Flipchart
Código
LB
PS
AP
OU
Descrição
Laboratório de informática
Projetor de slides
Apostila
Outros
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Página 10 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
I.
DISTRIBUIÇÃO DE PROBABILIDADES
1.1 Distribuição Binomial – Variáveis Discretas
Uma variável aleatória associa um valor numérico a cada resultado de um experimento
aleatório e uma distribuição de probabilidades associa uma probabilidade a cada valor de uma
variável aleatória. Os experimentos binomiais têm a característica de apresentarem exatamente
dois resultados complementares: em processos industriais as pessoas falham ou não falham. Na
medicina um paciente sobrevive um ano, ou morre. Em propaganda, um consumidor reconhece
um produto, ou não.
Definição:
Um experimento binomial é um experimento que satisfaz as seguintes condições:
1. O experimento deve comportar um numero fixo de provas;
2. As provas devem ser independentes (o resultado de qualquer prova não afeta as
probabilidades das outras provas);
3. Cada prova deve ter todos os resultados classificados em duas categorias;
4. As probabilidades devem permanecer constantes para cada prova.
Se fizermos um experimento binomial, a distribuição da variável aleatória x é chamada
uma distribuição de probabilidade binomial (ou distribuição binomial). Usa-se a seguinte
denominação: S e F (sucesso ou falha) denotam as duas categorias possíveis de todos os
resultados: p e q denotam as possibilidades de S e F, respectivamente; assim:
P( s) = p
P( F ) = 1 − p = q
Sendo
n = denota o numero fixo de provas;
x = denota um número específico de sucesso em n provas, podendo ser qualquer inteiro
entre 0 e n, inclusive;
p = denota a probabilidade de sucesso em uma das n provas;
q = denota a probabilidade de falha em uma das n provas;
P(x) = denota a probabilidade de obter exatamente x sucessos em n provas;
Fórmula utilizada para calcular a probabilidade binomial:
P( x) =
n!
⋅ p x ⋅ q n− x
(n − x)! x !
Exemplo: Dado que 10% das pessoas são canhotas, suponha que queiramos achar a
probabilidade de obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes.
Questiona-se:
a) Trata-se de um experimento binomial?
b) Em caso afirmativo, identifique os valores de n, x, p e q.
c) Aplicando a formula da probabilidade binomial, determine a probabilidade de obter
3 estudantes canhotos em uma turma de 15 estudantes.
2
Página 11 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
d) A probabilidade de ao menos 3 sucessos (alunos canhotos).
EXERCÍCIOS
1. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que contêm 12
peças. Calcule a probabilidade de um cliente comprar uma caixa contendo:
(a) nenhuma peça defeituosa;
(b) uma peça defeituosa.
2. Um produtor de sementes vende pacotes com 20 sementes cada. Os pacotes que apresentarem
mais de uma semente sem germinar são indenizados. A probabilidade de uma semente germinar é
0,98.
(a) Qual é a probabilidade de que um pacote não seja indenizado?
(b) Se o produtor vende 1.000 pacotes, em quantos se espera indenização?
3. Estatísticas de tráfego revelam que 25% dos veículos interceptados numa auto-estrada não passam
no teste de segurança. De 10 veículos interceptados, determine a probabilidade de 2 ou mais não
passarem.
4. Numa criação de coelhos, 40% são machos. Qual a probabilidade de que nasçam pelo menos 2
coelhos machos num dia em que nasceram 20 coelhos?
5. O fabricante de drives de disco utilizados em uma das mais conhecidas marcas de
microcomputadores espera que 2% dos drives de disco apresentem defeitos durante o período de
garantia do microcomputador. Numa amostra de 10 drives de disco, qual é a probabilidade de que:
a) Nenhum irá apresentar defeito durante o período de garantia?
b) Exatamente um irá apresentar defeito durante o período de garantia?
c) Pelo menos dois irão apresentar defeito durante o período de garantia?
d) Quais seriam as respostas para a letra (a) e (b) se fosse esperado que 1% dos drives de disco
apresentasse defeito?
1.2 DISTRIBUIÇÃO NORMAL
A distribuição normal desempenha papel importantíssimo na Teoria Estatística.
Deduzida por De Moivre em 1753 como forma limite da Binominal, foi posteriormente
redescoberta em 1774 por Laplace, e em 1809 por Gauss. Por essa razão é conhecida ainda pelo
nome de Distribuição de Gauss, de Laplace, ou ainda Laplace-Gauss.
A Distribuição Normal é a mais importante distribuição de variável aleatória contínua e
é básica para o desenvolvimento da inferência estatística. Entre as distribuições teóricas de
variável aleatória contínua, uma das mais empregadas é a distribuição normal.
A distribuição normal é caracterizada por uma função, cujo gráfico descreve uma curva
em forma de sino. Esta distribuição depende de dois parâmetros:
• µ (média) – este parâmetro especifica a posição central da distribuição de
probabilidades.
• σ (desvio padrão) – este parâmetro especifica a variabilidade da distribuição de
probabilidades.
Existem infinitas distribuições normais, cada uma com usa própria média e desvio
padrão. A distribuição normal com media zero e desvio padrão de 1 é chamada de distribuição
normal padrão ou padronizada. A escala horizontal do gráfico da distribuição normal padrão
3
Página 12 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
corresponde aos escores z (uma medida de posição que indica o numero de desvios-padrão de
um valor a partir da media). Pode-se transformar um valor x em um escore z, usando a seguinte
fórmula:
z=
onde:
x−µ
σ
x = valores arbitrários (intervalos)
µ = média da distribuição normal
σ = desvio-padrão da distribuição normal
- ∞
+∞
Após usar a fórmula dada acima para transformar um valor x num escore z, pode-se usar a
Tabela Normal Padrão. A tabela enumera a área acumulada sob a curva normal padrão à esquerda de
z para escores z de –3,49 a 3,49.
Área na tabela
-
A distribuição normal possui as seguintes características:
Variável aleatória contínua.
Tem a forma de um sino.
É simétrica em relação a média.
Prolonga-se de - ∞ a + ∞.
A área sob a curva normal é considerada de tamanho 1 (100%).
Exemplos.
1. Determina a área que corresponde ao escore z de 1,15.
2. Determina a área acumulada que corresponde ao escore z de 1,15.
4
Página 13 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
3. Calcule a área acumulada que corresponde ao escore z de -0,24.
4.
Esboce a curva normal padrão e sombreie a área apropriada sob a curva:
a) para obter a área a esquerda de z = 1,23.
b) para obter a área a direita de z = 1,23.
c) para obter a área entre dois escores z, -0,75 e 1,23.
5. Determine a área sob a curva padrão à direita de z = 1,06.
6. Se um escore z for zero, qual das afirmações a seguir será verdadeira. Explique seu
raciocínio.
(a) a média é zero.
(b) o valor x correspondente é igual a zero.
(c) o valor x correspondente é igual à média.
7. Analise os gráficos e obtenha a probabilidade de z ocorrer na região indicada.
8. Determine a probabilidade indicada usando a distribuição normal padrão:
a) P (z < 1,45)
b) P (z > -1,95)
c) P ( 0 < z < 2,05)
d) P (z < -2,58 ou z > 2,58)
e) P ( -0,95 < z < 1,44)
Exemplos para transformar um escore z em um valor x.
1. As velocidades de veículos ao longo de um trecho de uma via expressa tem uma media de 56km/h
e um desvio padrão de 8km/h. Obtenha as velocidades x correspondentes aos escores z = 1,96; -2,33
e 0. Interprete os seus resultados.
2. As notas dos candidatos ao concurso público do INSS estão normalmente distribuídas com uma
média de 75 pontos e um desvio padrão de 6,5. Para poder entrar no serviço público, o candidato
precisa figurar entre os 5% melhores. Qual é a menor pontuação possível para a aprovação de um
candidato?
3. Em uma amostra selecionada ao acaso de 1169 homens com idade entre 40 e 49 anos, foi
constatado um nível médio total de colesterol de 211 miligramas por decilitros, com desvio padrão de
39,2 miligramas por decilitros. Suponha que os níveis totais de colesterol sejam normalmente
distribuídos. Obtenha o mais alto nível total de colesterol que um homem com idade entre 40 e 49
anos pode ter e ainda assim ficar entre o 1% mais baixo.
5
Página 14 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
EXERCÍCIOS
1. Um levantamento indica que pessoas usam seus computadores em media durante 2,4 anos
antes de adquirir uma nova máquina. O desvio padrão é de 0,5 anos. Selecionando ao acaso
alguém que tenha computador, obtenha a probabilidade de que ele o use por menos de dois
anos antes de comprar outro.
2. A taxa de hemoglobina no sangue de pessoas que possuem boa saúde segue uma distribuição
normal com média 12 e desvio padrão 1. Qual a probabilidade de se encontrar uma pessoa
normal com taxa de hemoglobina:
(a) superior a 15?
(b) Inferior a 10?
(c) Entre 10 e 13
(d) Num grupo de 500 pessoas, em quantas devemos esperar as características acima?
3. Os depósitos mensais na caderneta de poupança têm distribuição normal com média igual a $
500 e desvio padrão $ 150. Se um depositante realizar um depósito, pede-se calcular a
probabilidade de que esse depósito seja igual ou menor que $ 650.
4. A análise estatística de um investimento mostrou que seu resultado líquido é uma variável
aleatória X com valor esperado $ 10 000 e desvio padrão $ 4 000. Sabendo que a variável X
tem distribuição normal, pede-se calcular a probabilidade de que o resultado X seja menor
que $ 5000.
5. As vendas mensais dos últimos 50 meses apresentam uma média igual a $ 500 mil com
desvio padrão igual a $ 80 mil. Se a empresa estabeleceu uma meta de vendas para o próximo
mês de $ 550 mil, pede-se calcular, considerando que os dados históricos se repetem no
futuro próximo:
a) A probabilidade de ficar abaixo da meta.
b) A probabilidade de superar a meta.
c) A probabilidade de que as vendas se situem entre 80 % e 110 % da média.
6. Uma população X tem distribuição normal com média igual a 20 e desvio padrão igual a 5.
Retirando aleatoriamente um elemento dessa população, pede-se calcular a probabilidade
desse elemento ser igual ou menor que 22.
7. A distribuição dos salários anuais dos auxiliares de escritório de uma grande empresa tem
distribuição normal com média igual a R$12.500,00 e desvio padrão igual a R$2.800,00.
Calcular:
a) A proporção dos auxiliares de escritório que ganha mais que R$14.500,00.
b) A proporção dos auxiliares de escritório que ganha menos que R$11.000,00
c) A proporção dos auxiliares de escritório que ganha entre R$10.000,00 e R$14.000,00.
8. Suponha que um consultor esteja investigando o tempo que os trabalhadores de uma fábrica
de automóveis levam para montar determinada peça depois de terem sido treinados para
realizar a tarefa por um método de aprendizagem individual. O consultor determina que o
tempo em segundos para montar a peça para os trabalhadores treinados por esse método é
distribuído de maneira normal com média igual a 75 segundos e desvio padrão igual a 6.
Pede-se:
a) A probabilidade de um trabalhador montar uma peça em 81 segundos?
b) Quantos segundos devem transcorrer antes que 10% dos trabalhadores da fabrica
montam uma peça?
9. Um conjunto de notas finais de provas da disciplina de Estatística II foi considerado como
sendo normalmente distribuído com uma média aritmética de 73 e um desvio padrão de 8.
6
Página 15 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
a)
b)
c)
d)
Qual é a probabilidade de se obter no máximo uma nota 91 nesta prova?
Que porcentagem de alunos tirou entre 65 e 89?
Que porcentagem de alunos tirou entre 81 e 89?
Qual é a nota final do exame se somente 5% dos alunos que fizeram a prova tiram nota
mais alta?
10. Uma fabrica de carros sabe que os motores de sua fabricação têm duração normal com
150.000 km e desvio padrão de 5000 km. Se a fabrica substitui o motor que apresenta
duração inferior a garantia, qual deve ser esta garantia para que a porcentagem de motores
substituídos seja inferior a 0,2%?
11. As alturas dos alunos de uma determinada escola são normalmente distribuídas com média
1,60m e desvio padrão 0,30. Encontre a probabilidade de uma aluna escolhida ao acaso
medir:
a) Entre 1,50 e 1,80 m.
b) Mais que 1,60 m.
c) Menos que 1,48m.
d) Entre 1,54 e 1,58m.
e) Mais que 1,55m.
f)
Menos que 1,55m ou mais que 1,75m.
12. Suponha-se que a renda anual de uma determinada cidade tenha uma média de R$ 5.000,00
com desvio padrão de R$ 1.500,00. Admitindo-se uma distribuição normal, que podemos
dizer de uma renda de R$ 7.000,00?
EXEMPLO DE DISTRIBUIÇÃO NORMAL COMO APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL
Se n.p ≥ 5 e n.q ≥ 5, então a variável aleatória binomial x tem distribuição aproximadamente
normal, com média µ = np e desvio padrão σ = npq
1. Uma maquina produz parafusos, dos quais 10% são defeituosos. Determinar a probabilidade de,
em uma amostra tomada ao acaso de 400 parafusos produzidos por essa maquina, serem
defeituosos: (a) no máximo 30; (b) entre 30 e 50
(c) 55 ou mais.
2. Numa cidade haverá um plebiscito em que 1.250.000 eleitores decidirão entre aceitar (SIM) ou
rejeitar (NÃO) certa política. Suponha que um partidário da aceitação dessa política afirme que
80% dos votos serão SIM. Admitindo essa previsão como verdadeira, qual é a probabilidade de, em
uma amostra de 900 eleitores, menos de 684 serem partidários do SIM?
3. Cerca de 4,4% dos acidentes fatais com automóveis são causados por pneus defeituosos (com base
em dados do Conselho Nacional de Segurança). Se um estudo de segurança em uma rodovia
começa com a escolha aleatória de 750 casos de acidentes fatais com veículos motorizados, estime
a probabilidade de exatamente 35 deles terem sido causados por pneus defeituosos.
7
Página 16 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Tabela Z – Áreas sob a curval Normal
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
0,0
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,4990
0,4993
0,4995
0,4997
0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,4991
0,4993
0,4995
0,4997
0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,4991
0,4994
0,4995
0,4997
0,03
0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,4991
0,4994
0,4996
0,4997
0,04
0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2704
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
0,4992
0,4994
0,4996
0,4997
0,05
0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,4992
0,4994
0,4996
0,4997
0,06
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,4992
0,4994
0,4996
0,4997
0,07
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,4992
0,4995
0,4996
0,4997
0,08
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,4993
0,4995
0,4996
0,4997
0,09
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
0,4993
0,4995
0,4997
0,4998
8
Página 17 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Cursos de Administração e
Ciências Contábeis
ESTATÍSTICA II
Professora:
Carina Inês Panke da Silva
[email protected]
Página 18 / 51
1
Página 19 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
II - ESTIMATIVAS
2.1 Estimativas pontuais e intervalares
As estatísticas amostrais são utilizadas como estimadores de parâmetros
populacionais. Por exemplo, uma média aritmética da amostra é usada como estimativa de
ponto da média populacional.
Existem dois tipos principais de estimativas: estimativas de ponto e estimativas de
intervalo.
A estimativa pontual é um valor (ou ponto) único usado para aproximar um
parâmetro populacional. A média amostral x é a melhor estimativa pontual da média
populacional µ . Mas, a estatística de uma amostra, tal como x , varia de amostra para
amostra, uma vez que depende dos itens selecionados na amostra, e esta variação deve ser
levada em consideração ao se fornecer estimativas para a população. Pensando nessa variação
é que foi desenvolvido a estimativa intervalar.
A estimativa intervalar é um intervalo de valores que tem probabilidade de conter o
verdadeiro valor da população. Ou seja, o intervalo que é construído terá uma confiança ou
probabilidade especificada de estar estimando corretamente o verdadeiro valor do parâmetro da
população.
2.2 Intervalos de confiança
Um intervalo de confiança está associado a um grau de confiança que é uma medida
da nossa certeza de que o intervalo contém o parâmetro populacional. A definição grau de
confiança utiliza α (alfa) para descrever uma probabilidade que corresponde a uma área.
São escolhas comuns para o grau de confiança (ou nível de confiança, ou coeficiente
de confiança): 90%, 95% e 99%, veja a tabela.
Grau de confiança
90%
95%
99%
α
0,10
0,05
0,01
Valor Crítico z
1,645
1,96
2,575
Um valor crítico é um número na fronteira que separa os valores das estatísticas
amostrais prováveis de ocorrerem, dos valores que têm pouca chance de ocorrer.
9
Página 20 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Região
crítica
Região
crítica
Valor crítico
Valor crítico
Para calcular limites de confiabilidade, utilizamos a seguinte equação
x = µ ± Z(σ/√̅n)
No nosso caso, inverte-se o x com µ, para se saber se é o que se espera.
Exemplo:
1. Um fabricante de papel para impressora possui um processo de produção que opera
de maneira contínua, através de um turno completo de produção. É esperado que o
papel tenha um comprimento de 11 polegadas, e o desvio padrão conhecido sejam
0,02 polegadas. A intervalos periódicos, são selecionadas amostras para determinar
se o comprimento médio do papel ainda se matém igual a 11 polegadas ou se algo
de errado aconteceu no processo de produção para que tenha modificado o
comprimento do papel produzido. Uma amostra aleatória de 100 folhas foi
selecionada e verificou-se que o comprimento médio do papel era de 10,998
polegadas. Caso seja desejada uma estimativa do intervalo de confiança de 95% do
comprimento médio do papel na população, teremos
x ± Z(σ/√̅n) = 10,998 ± (1,96)(0,02/√̅100) = 10,998 ± 0,00392
10,99408 ≤ µ ≤ 11,00192
Como 11 está entre o intervalo encontrado, o fabricante não tem com o que se preocupar.
Caso se queira um intervalo de confiança maior, por exemplo 99%, aí o que teremos?
2. A variabilidade do tempo de atendimento em um caixa bancário é conhecida σ =
0,10min. e tem distribuição normal. Uma amostragem de 40 pessoas indicou tempo
médio de atendimento de x = 1,5 min. Construir um intervalo de confiança de 95%
para o tempo médio de atendimento.
10
Página 21 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
EXERCÍCIOS
1. O gerente do controle aéreo do aeroporto de São Paulo está interessado em conhecer o tempo
que os aviões 737 necessitam para aterrissar, medindo este tempo entre o instante que o piloto
inicia a operação de descida e o instante que o avião abandona a pista de aterrissagem. Se a média
de uma amostra aleatória de 33 aviões é igual a 21 minutos com desvio padrão igual a 4,5 minutos,
pede-se estimar o valor da média da população considerando dois valores de intervalo de
confiança: 90% e 95%.
2. Numa amostra aleatória de 32 notas de despesa numa semana em dezembro, um auditor
constatou uma despesa média de R$220,00, com desvio padrão de R$20,00.
a) Qual a estimativa pontual da quantia média?
b) Construa um intervalo de 99% de confiança para a quantia média.
3. De uma população com distribuição normal e desvio-padrão igual a 5 foi retirada uma amostra
aleatória de tamanho 20 e sua média calculada foi 24. Estime o valor da média da população com
índice de confiança igual a 90%.
4. Uma amostra consiste em 75 aparelhos de TV adquiridos há vários anos. Os tempos de
substituição destes aparelhos têm média de 8,2 anos e desvio-padrão de 1,1 ano. Construa um
intervalo de 90% de confiança para o tempo médio de substituição de todos os aparelhos de TVs.
5.
Suponha que o proprietário de uma loja de materiais de construção é revendedor de
tintas e queira calcular a verdadeira quantidade de tinta contida nas latas de um galão de 1 l,
compradas de um fabricante nacionalmente conhecido. Sabe-se, pelas especificações contidas
no galão, que o desvio padrão da quantidade de tinta é igual a 0,02 l. Uma amostra aleatória de
50 latas é selecionada, e a quantidade média de tinta por lata de 1 galão é igual a 0,995 l.
a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira média da
população da quantidade de tinta contida em uma lata de 1 galão.
b) Com base nos seus resultados, você acha que o proprietário da loja tem o direito de
reclamar ao fabricante? Por que?
c) A população de quantidade de tinta por lata tem que ser distribuída normalmente neste
caso? Explique.
d) Explique por que um valor observado de 0,98 l para cada lata não seria incomum, apesar
de estar fora do intervalo de confiança que você calculou?
e) Suponha que você utilizasse uma estimativa do intervalo de confiança de 95%, quais
seriam suas respostas para (a) e (b)?
6.
O gerente de controle de qualidade de um fábrica de lâmpadas de filamento precisa
calcular a vida útil média de uma remessa de lâmpadas. Sabe-se que o desvio padrão do
processo é de 100 horas. Uma amostra aleatória de 50 lâmpadas indicou uma vida útil média da
amostra igual a 350 horas.
a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira média
útil das lâmpadas nesta remessa.
b) Você, conhecendo estes resultados, compraria uma lâmpada deste fabricante?
Explique.
c) Suponha que o desvio padrão do processo mudasse para 80 horas. Qual seria sua
resposta para (a)?
7.
Um comerciante ficou muito curioso para descobrir qual a real quantidade de
refrigerante que é colocada em garrafas de 2 litros. Foi informado ao comerciante que o desvio
11
Página 22 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
padrão para garrafas de 2 litros é 0,05 litro. Uma amostra aleatória, de 100 garrafas de 2 litros,
indica uma média da amostra de 1,99 litro.
a) Desenvolva a estimativa do intervalo de confiança de 95% da verdadeira média da
quantidade de refrigerante de cada garrafa.
b) A população de quantidade de refrigerante tem que ser distribuída normalmente
neste caso? Explique.
c) Explique por que um valor observado de 2,02 litros não seria incomum.
d) Suponha que a média da amostra mudasse para 1,97 litro. Quais seriam suas
respostas para (a) e (b)?
2.3 Determinação do tamanho da amostra
Exemplos:
1) Qual o tamanho da amostra necessário pra estimar a média populacional de uma característica
dimensional de um processo com 95% de confiança cujo desvio-padrão populacional é σ = 2,45
cm e precisão de 0,5 cm?
2) Você pretende fazer uma pesquisa para atualizar os dados sobre média salarial dos funcionários
de uma indústria de cigarros. Estudos anteriores sugerem um desvio-padrão de R$330,00. Sabendo
que a empresa tem 3400 funcionários quantas pessoas você deve pesquisar para estimar a média
salarial de todos os funcionários, quando
a) o erro máximo tolerável for 50 reais e o nível de confiança 99%?
b) o erro máximo tolerável for 50 reais e o nível de confiança 95%?
c) o erro máximo tolerável for 20 reais e o nível de confiança 95%?
3) Para planejar o manuseio adequado do lixo doméstico, uma cidade deve estimar o peso médio do
lixo descartado pelas residências em uma semana. Determine o tamanho da amostra necessário
para estimar essa média, para que tenhamos 96% de confiança em que a média amostral esteja a
menos de 0,9 kg da verdadeira média populacional. Para o desvio-padrão populacional use o valor
5,65 kg, que é o desvio padrão duma cidade vizinha de mesmo porte.
2.4 Estimativas para a média populacional: pequenas amostras
Em muitas situações da vida real, o desvio padrão populacional é desconhecido. Além
disso, em função de fatores como tempo e custo, frequentemente não é prático colher amostras
de tamanho superior a 30. Assim, como construir intervalos de confiança para a média
populacional nessas condições? Se a variável aleatória é normalmente distribuída (ou
aproximadamente normalmente distribuída), a distribuição amostral para x é uma distribuição t
(Student).
A distribuição t é uma família de curvas, cada uma delas determinada por um
parâmetro chamado grau de liberdade. Os graus de liberdade são os números de escolhas
livres deixados após uma amostra estatística, tal como a média de x ter sido calculada. Quando
se usa uma distribuição t para estimar uma média populacional, o número de graus de liberdade
é igual ao tamanho da amostra menos um.
Grau de Liberdades = n – 1
12
Página 23 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Quando o número de graus de liberdade cresce, a distribuição tende para a
distribuição normal. Após 30 graus de liberdade distribuição t está muito próxima da
distribuição normal padrão z.
Condições para utilização da Distribuição t de Student
1. O tamanho da amostra deve ser pequeno, n ≤ 30 ;
2. σ é desconhecido;
3. A população original tem distribuição essencialmente normal.
2.5 Obtendo os valores críticos de t
1. Determinar o valor crítico t para 95% de confiança quando o tamanho da amostra for 15.
2. Determinar o valor crítico de t para 90% de confiança quando o tamanho da amostra for 22.
2.6 Intervalos de confiança e a distribuição t
O intervalo de confiança para uma média amostral quando se usa desvio padrão amostral é
muito semelhante ao intervalo quando se usa desvio padrão da população.
Exemplos:
1. Você seleciona ao acaso 16 restaurantes e mede a temperatura do café vendido em cada um. A
temperatura média amostral é de 72ºC, com um desvio padrão amostral de 12ºC. Obtenha o
intervalo de confiança de 95% para a temperatura média. Suponha que as temperaturas estejam
normalmente distribuídas.
2. Você seleciona ao acaso 20 casas hipotecárias e determina a atual taxa de juro que cada uma
cobra. A taxa média amostral é de 6,93% com desvio padrão de 0,42% Obtenha o intervalo de
confiança de 99% para a população da taxa media de juro para as hipotecas. Suponha que as taxas
de juros tenham distribuição aproximadamente normal.
EXERCÍCIOS
1. Nosso interesse é estimar a média de consumo em quilômetros por litro de um novo modelo de
carro da montadora líder do mercado de carros populares. Sabendo que a população tem
distribuição normal e o consumo em quilômetros por litros de uma amostra aleatória de 16
carros do novo modelo de carro é igual a 14,8 com desvio padrão igual a 2, pede-se estimar o
valor da média da população com intervalo de confiança igual a 95%.
2. Um analista de um departamento de pessoal seleciona aleatoriamente os registros de 16
empregados horistas e calcula a taxa média de salário, R$ 7,50. Supõe-se que os salários na
firma sejam distribuídos normalmente. Se o desvio-padrão dos salários é conhecido, e igual a
R$1,00, estimar a taxa média de salário na firma usando um intervalo de confiança de 90%.
3. O diâmetro médio de uma amostra de 12 bastões cilíndricos incluídos em um carregamento é
de 2,350 mm com um desvio padrão de 0,050 mm. A distribuição dos diâmetros de todos os
bastões incluídos no carregamento é aproximadamente normal. Determinar o intervalo de
confiança de 99% para estimar o diâmetro médio de todos os bastões incluídos no
carregamento.
13
Página 24 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
2.7 Estimação da proporção numa população
Exemplos:
1. Determine um intervalo de confiança de 98% para a verdadeira proporção populacional, se x =
50 e n = 200.
2) Qual o tamanho da amostra necessário para estimar a verdadeira porcentagem populacional a
menos de 4% usando um intervalo de confiança de 90%. É razoável suspeitar que o verdadeiro
valor seja 0,30 ou menos.
3) Qual o tamanho da amostra necessário para obter um intervalo de 95% de confiança para a
proporção populacional, se o erro tolerável é 0,08?
EXERCÍCIOS
1. Em recente pesquisa levada a efeito junto a 200 habitantes de uma grande cidade, 30 se
mostraram favoráveis ao restabelecimento da pena de morte.
a) Construa um intervalo de 99% de confiança para a verdadeira proporção dos habitantes
daquela cidade favoráveis à pena capital.
b) Que se pode dizer quanto ao tamanho do erro máximo para esse intervalo de confiança?
2. Uma biblioteca pública deseja estimar a percentagem de livros de seu acervo publicados até
2000. Qual deve ser o tamanho da amostra aleatória para se ter 90% de confiança de ficar a
menos de 5 % da verdadeira proporção?
3. Uma amostra aleatória de 40 homens trabalhando num grande projeto de construção revelou
que 6 não estavam usando capacetes protetores. Construa um intervalo de 99% de confiança
para a verdadeira proporção dos que estão usando capacetes neste projeto.
4. Uma amostra de 50 bicicletas de um estoque de 400 bicicletas acusou 7 com pneus vazios.
Construa um intervalo de 99% de confiança para a população das bicicletas com pneus vazios.
5. Selecionado aleatoriamente e pesquisados 500 universitários, verificou-se que 135 deles têm
computador pessoal.
a) Determine a estimativa pontual da verdadeira proporção de todos os universitários que
têm computador pessoal.
b) Determine um intervalo de 95% de confiança para a verdadeira proporção de todos os
universitários que têm computador pessoal.
6. Se uma faculdade tem 1200 alunos, qual tamanho de amostra necessário para estimar a
proporção de alunos que são a favor da pena de morte? Use um erro amostral de 2% e índice de
confiança de 95%.
7. Um estudo de saúde envolve 1000 mortes selecionadas aleatoriamente, dentre as quais 331
causadas por doenças cardíacas.
a) Com os dados amostrais, construa um intervalo de confiança de 99% para a proporção
de todas as mortes causadas por doenças cardíacas.
14
Página 25 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
b) Utilizando os dados amostrais como piloto, determine o tamanho da amostra
necessário para estimar a proporção de todas as mortes causadas por doenças
cardíacas. Admita um nível de confiança de 98%, em que o erro da estimativa não
supere 1%.
8. Uma papelaria gostaria de calcular o valor médio do preço dos cartões de cumprimentos
existente em seu estoque. Uma amostra aleatória de 20 cartões indica um valor médio de $1,67
e um desvio padrão de $0,32. Se o número de cartões no estoque da loja fosse igual a 300:
a) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor médio de
todos os cartões no estoque da loja.
b) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor médio da
população de todos os cartões que estão no estoque.
c) Compare os resultados obtidos em (a) e (b).
d) Quais seriam a respostas para (b) e (c) se a loja tivesse 500 cartões no estoque?
9. Uma concessionária de automóveis gostaria de calcular a proporção de consumidores que ainda
possuem o carro que compraram 5 anos atrás. Uma amostra aleatória de 200 consumidores,
selecionados a partir dos registros da concessionária de automóveis, indica que 82
consumidores ainda possuem os carros que compraram a 5 anos. Suponha que a população
consiste em 4.000 proprietários:
a) Desenvolva uma estimativa, com intervalo de confiança de 95%, da verdadeira
proporção de clientes que ainda possuem os carros que adquiriram cinco anos atrás.
b) E se a população fosse de 6.000 proprietários?
10.O gerente de um banco em uma cidade pequena gostaria de determinar a proporção de seus
correntistas que recebem salários semanais. Uma amostra aleatória de 100 correntistas é
selecionada, e 30 afirmam que são pagas semanalmente. Se o banco possui 1.000 correntistas:
a) Desenvolva uma estimativa, com intervalo de confiança de 90%, para a verdadeira
proporção de correntistas que recebem salários semanais.
b) Determine o tamanho da amostra necessário para se calcular a vida útil média, em uma
margem de ± 0,05, com 90% de confiança.
c) Quais seriam as respostas para (a) e (b), se o banco tivesse 2.000 depositantes?
11.Observe os dados do problema do refrigerante (exercício 7 da 1ª lista de exercícios de
Estimativas). Se a população consiste em 2.000 garrafas:
a) Desenvolva uma estimativa, com intervalo de confiança de 95% da quantidade média
de refrigerante em cada garrafa do total da população.
b) Determine o tamanho da amostra necessário para se calcular a quantidade média da
população, em uma margem de ±0,01, com 95% de confiança.
c) Quais seriam suas respostas para (a) e (b) se a população consistisse em 1.000 garrafas?
12.Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias dos
empregados de uma grande empresa. A gerência da empresa deseja ter 95% de confiança de
que a média da amostra está correta, e de ± 0,05 da média real das despesas médias familiares.
Um estudo-piloto indica que o desvio padrão pode ser calculado como sendo igual a $400.
Que tamanho da amostra seria necessário se a companhia tivesse 3.000 empregados?
15
Página 26 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Tabela de Distribuição t de Student
GL
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
75%
15%
30%
1,9626
1,3862
1,2498
1,1896
1,1558
1,1342
1,1192
1,1081
1,0997
1,0931
1,0877
1,0832
1,0795
1,0763
1,0735
1,0711
1,0690
1,0672
1,0655
1,0640
1,0627
1,0614
1,0603
1,0593
1,0584
1,0575
1,0567
1,0560
1,0553
1,0547
80%
10%
20%
3,0777
1,8856
1,6377
1,5332
1,4759
1,4398
1,4149
1,3968
1,3830
1,3722
1,3634
1,3562
1,3502
1,3450
1,3406
1,3368
1,3334
1,3304
1,3277
1,3253
1,3232
1,3212
1,3195
1,3178
1,3163
1,3150
1,3137
1,3125
1,3114
1,3104
I.C.
90%
95%
96%
98%
99%
Bilateral
5%
2,5%
2%
1%
0,5%
Unilateral
10%
5%
4%
2%
1%
6,3137 12,7062 15,8945 31,8210 63,6559
2,9200 4,3027 4,8487 6,9645 9,9250
2,3534 3,1824 3,4819 4,5407 5,8408
2,1318 2,7765 2,9985 3,7469 4,6041
2,0150 2,5706 2,7565 3,3649 4,0321
1,9432 2,4469 2,6122 3,1427 3,7074
1,8946 2,3646 2,5168 2,9979 3,4995
1,8595 2,3060 2,4490 2,8965 3,3554
1,8331 2,2622 2,3984 2,8214 3,2498
1,8125 2,2281 2,3593 2,7638 3,1693
1,7959 2,2010 2,3281 2,7181 3,1058
1,7823 2,1788 2,3027 2,6810 3,0545
1,7709 2,1604 2,2816 2,6503 3,0123
1,7613 2,1448 2,2638 2,6245 2,9768
1,7531 2,1315 2,2485 2,6025 2,9467
1,7459 2,1199 2,2354 2,5835 2,9208
1,7396 2,1098 2,2238 2,5669 2,8982
1,7341 2,1009 2,2137 2,5524 2,8784
1,7291 2,0930 2,2047 2,5395 2,8609
1,7247 2,0860 2,1967 2,5280 2,8453
1,7207 2,0796 2,1894 2,5176 2,8314
1,7171 2,0739 2,1829 2,5083 2,8188
1,7139 2,0687 2,1770 2,4999 2,8073
1,7109 2,0639 2,1715 2,4922 2,7970
1,7081 2,0595 2,1666 2,4851 2,7874
1,7056 2,0555 2,1620 2,4786 2,7787
1,7033 2,0518 2,1578 2,4727 2,7707
1,7011 2,0484 2,1539 2,4671 2,7633
1,6991 2,0452 2,1503 2,4620 2,7564
1,6973 2,0423 2,1470 2,4573 2,7500
16
Página 27 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
17
TESTE DE HIPÓTESES
Muitas vezes o pesquisador tem alguma idéia ou conjectura, sobre o comportamento de
uma variável. Neste caso, o planejamento de pesquisa deve ser de tal forma que permita, com os
dados amostrais, testar a veracidade de suas idéias sobre a população em estudo. Considera-se
que a população seja o mundo real e as idéias sejam hipóteses de pesquisa, que poderão ser
testadas por técnicas estatísticas denominadas de testes de hipóteses ou testes de significância.
Neste sentido, Teste de Hipótese consiste em analisar as diferenças entre os resultados
obtidos, e verificar se a hipótese levantada condiz com a realidade.
Em outras palavras, o objetivo do teste estatístico de hipótese é fornecer ferramentas
que nos permitam validar ou recusar uma hipótese através dos resultados da amostra.
Na intenção de confirmar ou rejeitar uma hipótese, temos nominá-la (nula ou
alternativa).
Para escrever as hipóteses nula e alternativa, transforme a formulação verbal da
alegação sobre um parâmetro populacional em uma formulação matemática.
Exemplos:
1. Escreva a formulação matemática da alegação. Estabeleça as hipóteses nula e alternativa e
identifique qual delas representa a alegação.
(a) Uma fabrica de bateria para automóveis alega que a vida média de um determinado
modelo é de 74 meses.
(b) Uma estação de rádio alega que sua proporção de audiência local é maior do que 39%.
• Tipos de erros
Não importando qual das hipóteses representa a alegação, você começará sempre um
teste de hipótese assumindo que a condição de igualdade na hipótese nula é verdadeira. Assim,
quando realizar um teste de hipótese, você deve tomar uma das duas decisões: rejeitar a
hipótese nula ou não rejeitar a hipótese nula.
Uma vez que sua decisão baseia-se em informação incompleta (uma amostra em vez de
toda a população), há sempre a possibilidade de se tomar a decisão errada.
Então, quando se realiza um teste de hipótese, podem-se cometer dois tipos de erro: Erro
tipo I ou Erro tipo II. Veja a Tabela.
Realidade
H 0 verdadeira
H 0 falsa
Decisão
Aceitar H 0
Decisão correta
Erro tipo II
Rejeitar H 0
Erro tipo I
Decisão Correta
Observe que o erro tipo I só poderá acontecer se for rejeitado H 0 e o erro tipo II quando
for aceito H 0 .
Página 28 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
18
Exemplo:
O limite do Departamento de Agricultura para a contaminação por salmonela em frangos é de 20%.
Uma granja alega que seus frangos estão dentro do limite. Você realiza um teste de hipótese para
determinar se a alegação da granja é verdadeira. Quando ocorrerão os erros do tipo I e II? Qual deles
é o mais grave?
• Estatística de teste: é uma estatística amostral, ou um valor baseado nos dados
amostrais. Utiliza-se uma estatística de teste para tomar uma decisão sobre a rejeição da hipótese
nula. Dado por
x −µ
zt =
σ
n
• Região crítica: é o conjunto de todos os valores da estatística de teste que levam à
rejeição da hipótese nula.
• Nível de significância: é probabilidade de rejeitar a hipótese nula quando ela é
verdadeira. Denota por α .
• Valor crítico: é o valor, ou valores, que separa(m) a região crítica dos valores da
estatística de teste que não levam à rejeição da hipótese nula. Dependem da natureza da
hipótese nula, da distribuição amostral, e do nível de significância α .
INTERPRETANDO UMA DECISÃO
Exemplo 1. Você realiza um teste de hipótese para a alegação a seguir: Uma
universidade alega que a proporção de seus estudantes graduados em 4 anos é de 82%.
( H 0 contém a afirmação original)
a) Interpretar a decisão quando for rejeitada a hipótese nula .
Há evidências suficientes para garantir a rejeição da hipótese de que a proporção dos
estudantes da Universidade graduados em 4 anos é de 82%.
b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita).
Não há evidência suficiente para garantir a rejeição da afirmação de que a proporção
dos estudantes da Universidade graduados em 4 anos é de 82%.
Exemplo 2. Você realiza um teste de hipótese para a alegação a seguir: Uma
universidade alega que a proporção de seus estudantes graduados em 4 anos é superior a 82%.
( H 0 NÃO contém a afirmação original)
a) Interpretar a decisão quando for rejeitada a hipótese nula.
Os dados amostrais apóiam a afirmação de que a proporção dos estudantes da
Universidade graduados em 4 anos é superior 82%.
b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita).
Não há evidência amostral para apoiar a afirmação de que a proporção dos estudantes
da Universidade graduados em 4 anos é superior 82%.
Quando se aceita ou rejeita uma hipótese, estamos sempre
falando da hipótese nula, mesmo que esta não tenha a alegação.
Página 29 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
19
Teste de hipótese quando
O desvio-padrão populacional σ é conhecido
Usamos a distribuição normal (Tabela z) para comparar com a estatística de teste
zt :
zt =
x −µ
σ
n
O desvio-padrão populacional σ é DESCONHECIDO (n pequeno)
Usamos a distribuição t de Student (Tabela t) com Grau de Liberdade n − 1 para
comparar com a estatística de teste tt :
tt =
x −µ
s
n
Exemplo 1.
Os dois registros dos últimos anos de um colégio atestam para os calouros admitidos
uma nota média de 115 com desvio-padrão de 20 pontos (teste vocacional). Para testar a hipótese
de que a média de uma nova turma é a mesma, tirou-se, ao acaso, uma amostra de 20 notas
obtendo-se média de 118 no teste. Com um nível de significância α = 5% , faça o teste.
Exemplo 2.
Um empresário desconfia que o tempo médio de espera para atendimento de seus
clientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou
quanto tempo demoravam a serem atendidas. O resultado dessa pesquisa aparece a seguir:
x = 21,8 min. e s = 1, 40 min. Teste as hipóteses usando α = 0,05
3.1. Teste de hipótese sobre uma proporção
Segue os mesmos procedimentos para testes com médias, sendo que a estatística de
teste é dada por
zt =
pˆ − p
p (1 − p )
n
Exemplo 1. Em um teste de gosto de consumidores, 100 bebedores regulares de Pepsi
receberam amostras cegas de Coca e Pepsi; 48 deles preferiram a Coca. Ao nível de significância
Página 30 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
20
de 0,05, teste a afirmação de que a Coca é preferida por 50% dos bebedores de Pepsi que
participam de tais testes.
Exemplo 2:
Um jornal afirma que aproximadamente 25% dos adultos em sua área de circulação são
analfabetos segundo os padrões governamentais. Teste essa afirmação contra a alternativa de que
a verdadeira percentagem não é 25% e use um nível de significância de 5%. Uma amostra de 740
pessoas indica que apenas 20 % seriam consideradas analfabetas segundo os mesmos padrões.
Atividades
1. A Farmácia X vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas
no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de
eficiência de 380 horas.
a) Teste a alegação da companhia, contra a alternativa que a duração é inferior a 400 horas,
ao nível de 0,01, se o desvio padrão amostral é de 60 horas.
b) Repita a questão anterior sabendo que o desvio padrão populacional é 90 horas.
2. Um fabricante de automóveis alega que seus carros tamanho-família, quando equipados com
um tipo de pára-choques absorvente, podem suportar um choque de frente a uma velocidade
de 10 mph, com um custo de conserto de no máximo R$ 100, Uma amostra de seis carros,
examinada por um escritório independente de pesquisa, revelou um custo médio de reparo de
R$ 150 por carro. O desvio padrão amostral foi de R$ 30. Admita que a distribuição dos
custos de conserto seja aproximadamente normal. Há indício suficiente para rejeitar a
alegação da firma, ao nível de 0,01?
3. Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender
apólices de seguro de vida, se verificar que a quantia média segurada por família é inferior a
R$10.000,00. Tomou-se uma amostra aleatória de 50 famílias, que acusaram seguro médio
de R$9.600,00, com desvio padrão de R$1.000,00.
a) Com base na evidência amostral, a alegação deve ser aceita ou rejeitada, ao nível de
0,05?
b) A conclusão a que se chegou, utilizando a evidência amostral, pode estar errada? Qual
seria o tipo de erro? Por quê?
4. Uma cervejaria distribui um tipo de cerveja sem álcool em garrafas que indicam o conteúdo
de 940 ml. Um Instituto de pesquisa seleciona 50 dessas garrafas, mede seu conteúdo e
obtém uma média amostral de 934 ml, com desvio-padrão de 22 ml. Ao nível de significância
de 0,01, teste a afirmação do Instituto de que a companhia está ludibriando os consumidores.
5. O gerente de controle de qualidade de certa empresa considera que a fabricação de secretárias
eletrônicas como “fora de controle” quando a taxa geral de defeitos excede 4%. O teste de
uma amostra de 150 secretárias eletrônicas acusou 9 defeituosas, o que corresponde a uma
porcentagem de 6% de defeitos. O gerente de produção alega tratar-se apenas de uma
diferença casual, e que a produção realmente está sob controle, não sendo necessária
qualquer medida corretiva. Teste a afirmação do gerente de produção, ao nível de 0,05 de
significância.
Página 31 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
21
6. As condições de mortalidade de uma região são tais que a proporção de nascidos que
sobrevivem até 60 anos é de 0,6. Testar essa hipótese ao nível de 2%, se em 1000
nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos. (R =
rejeita-se H 0 )
7. A compra de uma lavanderia operada por moedas está sendo levada em conta por um
empresário. O atual proprietário declara que, nos últimos 5 anos, a receita era de $675
diários, com um desvio padrão de $75. Uma amostra de 30 dias selecionados revela uma
receita diária média de $650.
a) Há evidências de que a declaração do atual proprietário não seja válida, para um nível
de significância de 0,01?
b) Qual seria a resposta em (a) se o desvio padrão fosse de $100?
8. Suponha que o diretor de produção de uma fábrica de tecidos precise determinar se uma
nova máquina está produzindo determinado tipo de tecido de acordo com as
especificações do fabricante, que indicam que o tecido deve ter resistência de
rompimento de pelo menos 70 libras e um desvio padrão de 3,5 libras. Uma amostra de
36 peças revela uma média da amostra igual a 69,7 libras. (Use nível de significância de
0,01)
a) Há evidências de que a máquina não está atendendo às especificações, em termos da
resistência de rompimento?
b) Qual seria a resposta em (a) se a média da amostra fosse 69 libras?
9. O diretor pessoal de uma grande companhia de seguros está interessado em reduzir a taxa
de rotatividade de funcionários no setor de processamento de dados no primeiro ano de
emprego. Registros do passado indicam que 25% dos novos contratados nesta área não
estão mais empregados no final de um ano. Novos e extensos métodos de treinamento são
implementados para uma amostra de 150 funcionários do processamento de dados. Ao
final do período de um ano, 29 desses 150 indivíduos não estão mais empregados. No
nível de significância de 0,01, há evidências de que a proporção de funcionários de
processamento de dados que tenham passado pelo novo treinamento e não estejam mais
empregados seja diferente de 25%?
3.2. Teste para a diferença entre duas médias
Caso 1: Desvios-padrão populacionais σ 1 e σ 2 conhecidos
zt =
x1 − x2
σ 12
n1
+
σ 22
n2
Caso 2: Desvio padrão populacionais σ 1 e σ 2 desconhecidos ( n ≤ 30 )
Estatística calculada:
tt =
x1 − x2
2
1
2
2
s
s
+
n1 n2
Escolher o menor grau de liberdade
GL = n1 − 1 ou GL = n2 − 1
Página 32 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Hipóteses:
H 0 : µ1 = µ 2
H1 : µ1 ≠ µ 2
ou
H 0 : µ1 ≤ µ2
ou
H1 : µ1 > µ2
22
H 0 : µ1 ≥ µ2
H1 : µ1 < µ 2
3.3. Teste para a diferença entre duas proporções populacionais p1 e p2
Estatística calculada:
zt =
pˆ1 − pˆ 2
p⋅q p⋅q
+
n1
n2
sendo
p=
x1 + x2
n1 + n2
e
q = 1− p
Exemplo:
Numa pesquisa sobre possuidores de videocassete, encontrou-se 120 nas 200 casas
pesquisadas do bairro X e 240 nas 500 pesquisas do bairro Y. Há diferença entre a proporção dos
possuidores de videocassete nos dois bairros? Use α = 10%
EXERCÍCIOS
1.
Duas pesquisas independentes sobre salários em duas áreas metropolitanas muito separadas
revelaram a seguinte informação sobre o salário médio de operadores de equipamento
pesado:
A
B
x
6,50/h
7,00/h
s
1,50/h
1,00/h
n
25
25
Pode-se concluir, ao nível de 0,05, que os salários médios sejam diferentes?
2.
Uma empresa de pesquisa de opinião seleciona, aleatoriamente, 300 eleitores de Santa
Catarina e 400 do Rio Grande do Sul, e pergunta a cada um deles votará ou não num
determinado candidato nas próximas eleições, 75 eleitores de SC e 120 do RS
responderam afirmativo. Há diferença entre as proporções de eleitores favoráveis ao
candidato nesses dois estados? Use α= 5%
3.
Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista,
acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância, os
homens e as mulheres apreciam igualmente a revista?
4.
Página 33 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
23
Mais atividades:
1.
A compra de uma lavanderia operada por moedas está sendo levada em conta por um
empresário. O atual proprietário declara que, nos últimos 5 anos, a receita era de $675
diários, com um desvio padrão de $75. Uma amostra de 30 dias selecionados revela uma
receita diária média de $650.
a) Teste a hipótese de que a declaração do atual proprietário não seja válida, para um
nível de significância de 0,01.
b) Qual seria a resposta em (a) se o desvio padrão fosse de $100?
2. Suponha que o diretor de produção de uma fábrica de tecidos precise determinar se uma
nova máquina está produzindo determinado tipo de tecido de acordo com as
especificações do fabricante, que indicam que o tecido deve ter resistência de
rompimento de pelo menos 70 libras e um desvio padrão de 3,5 libras. Uma amostra de
36 peças revela uma média da amostra igual a 69,7 libras. (Use nível de significância de
0,01)
a) Há evidências de que a máquina não está atendendo às especificações, em termos da
resistência de rompimento?
b) Qual seria a resposta em (a) se a média da amostra fosse 69 libras?
3. O gerente do departamento de crédito de uma companhia de petróleo gostaria de
determinar se a renda mensal média de possuidores de cartões de crédito é igual a $75.
Um auditor seleciona uma amostra aleatória de 50 contas e descobre que a média é
$83,40 com um desvio padrão da amostra de $23,65. Utilizando o nível de significância
de 0,05, o auditor deveria concluir que há evidências de que a renda média seja
diferente de $75?
4. Um fabricante de televisores declarou, no rótulo de garantia, que, no passado, não mais
de 10% de seus aparelhos de televisão precisou de reparo durante os 2 primeiros anos de
funcionamento. Para testar a validade dessa declaração, uma agência de testes do
governo seleciona uma amostra de 100 aparelhos e descobre que 14 aparelhos
necessitaram de algum reparo nos primeiro 2 anos de funcionamento. Utilizando um
nível de significância de 0,01, a declaração do fabricante é válida?
5. O diretor pessoal de uma grande companhia de seguros está interessado em reduzir a taxa
de rotatividade de funcionários no setor de processamento de dados no primeiro ano de
emprego. Registros do passado indicam que 25% dos novos contratados nesta área não
estão mais empregados no final de um ano. Novos e extensos métodos de treinamento
são implementados para uma amostra de 150 funcionários do processamento de dados.
Ao final do período de um ano, 29 desses 150 indivíduos não estão mais empregados.
No nível de significância de 0,01, há evidências de que a proporção de funcionários de
processamento de dados que tenham passado pelo novo treinamento e não estejam mais
empregados seja diferente de 25%?
Página 34 / 51
24
Página 35 / 51
25
Página 36 / 51
26
Página 37 / 51
27
Página 38 / 51
28
Página 39 / 51
29
Exercícios:
Calcule a correlação existente entre as variáveis apresentadas:
1) Preços e Quantidades vendidas do mesmo produto verificados em vários locais de
vendas:
Preços (x)
Quant. Vend(y)
12
41
13
22
14,5
15
15
10
12,6
44
X²
Y²
X.Y
∑
2) Dados os valores x (5, 10,20, 8, 4, 6, 12 e 15) e y (27, 46,73, 40, 30, 28, 46 e 59),
nesta ordem respectivamente, e supondo que x expresse os valores de aquisição de
plano de saúde numa determinada empresa e y a produtividade de seus empregados,
determine a correlação entre os dados.
3) Uma amostra aleatória de 10 alunos foi retirada de uma sala de 98 alunos. Deste foi
verificado as notas de matemática e estatística:
8,0
7,0
10,0 6,0
7,0
9,0
3,0
8,0
2,0
Matemática 5,0
Estatística
6,0
9,0
8,0
10,0 5,0
7,0
8,0
4,0
6,0
2,0
Existe correlação entre as duas disciplinas? Qual?
4) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de
aço varia conforme a temperatura
Temperatura (°C)
10
15
20
25
30
Comprimento
1.003
1.005
1.010
1.011
1.014
(mm)
Determine:
a) O coeficiente de correlação;
b) A reta ajustada a essa correlação;
c) O valor estimado do comprimento da barra para a temperatura de 18°C
d) O valor estimado do comprimento da barra para a temperatura de 35°C
5) Calcular a propaganda necessária para se alcançar uma venda prevista R$ 3.200,00 para
2007, sabendo-se que existe forte correlação direta entre as vendas e propaganda.
Anos Vendas (x)
2002
1.500
2003
1.900
2004
2.300
2005
2.450
2006
2.700
Propag (y)
75
118
155
215
230
x.y
x²
Página 40 / 51
30
SÉRIES TEMPORAIS
Conjunto de medidas de uma mesma grandeza, relativos a vários períodos consecutivos.
A análise de dados das Séries temporais tem dois objetivos: descrever os padrões da série no passado e
predizer valores futuros.
PIB → trimestralmente
IPC e taxa de desemprego → mensalmente
Índice da Bovespa ou da Dow Jones → diário
Muitas séries apresentam tendências definidas
1. Componentes de dados de séries temporais
Podem ser encaradas em três componentes:
- a componente tendencional;
- a componente cíclica;
- a componente irregular.
Componente sazonal: não há quando considerados dados anuais, mas de grande importância para
séries de dados trimestrais, mensais, semanais.
2. Determinação da tendência pelo cálculo de médias móveis
Exemplo: considerando o PIB real de 1980 a 2000, qual a tendência móvel para 1998.
Ano
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
PIB real a preços de 2000
(em milhões de reais)
678,03
661,32
669,32
665,30
713,29
767,66
816,71
840,99
863,90
904,12
837,49
846,11
841,51
882,95
934,63
974,10
1.000,02
1.032,75
1.035,00
1.043,20
1.089,69
Média móvel - 5 anos
(em milhões de reais)
677,51
695,44
726,52
760,79
800,51
838,68
852,64
858,52
858,63
862,44
868,54
895,86
926,64
964,89
995,30
1.017,01
1.040,13
-
Razão
0,988358
0,956657
0,981795
1,009033
1,020242
1,002757
1,013199
1,053111
0,975382
0,981073
0,968882
0,985593
1,008622
1,009538
1,004744
1,015477
0,995063
-
Página 41 / 51
31
PIB A PREÇOS REAIS BASE 2000
Azul: PIB Real
Vermelho: Média móvel
3. Determinação da tendência por meio de regressão
Considere a série abaixo de valores de rendas anuais de pizza em uma pequena cidade:
50, 66, 81, 90, 98,
106, 115, 130, 146, 162,
177, 186, 194, 202, 211,
226, 242, 258, 273, 282,
290, 298, 307, 322, 338
Considerando a progressão dos anos x e as vendas y, podemos calcular:
Coeficiente angular = 11,862
Coeficiente linear = 51,662, então y = 51,662 + 11,862x
Página 42 / 51
32
Ano
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Vendas
efetivas
50,00
66,00
81,00
90,00
98,00
106,00
115,00
130,00
146,00
162,00
177,00
186,00
194,00
202,00
211,00
226,00
242,00
258,00
273,00
282,00
290,00
298,00
307,00
322,00
338,00
Valor da
tendência
Resíduo
51,66
-1,66
63,52
2,48
75,39
5,61
87,25
2,75
99,11
-1,11
110,97
-4,97
122,83
-7,83
134,70
-4,70
146,56
-0,56
158,42
3,58
170,28
6,72
182,14
3,86
194,01
-0,01
205,87
-3,87
217,73
-6,73
229,59
-3,59
241,45
0,55
253,32
4,68
265,18
7,82
277,04
4,96
288,90
1,10
300,76
-2,76
312,63
-5,63
324,49
-2,49
336,35
1,65
Vendas de Pizzas
Vendas de Pizzas com a regressão
Página 43 / 51
33
Reíduo – diferença entre o valor de tendência e vendas efetivas
Página 44 / 51
34
EXERCÍCIOS
1. Em certa empresa as importações de matéria prima (em milhões de toneladas), no período de 2000 a
2006, apresenta o comportamento demonstrado na tabela abaixo:
Ano
2000 2001
Importações 130 120
2002
105
2003 2004 2005
100
85
80
2006
75
(a) Qual a estimativa do decréscimo anual dessas importações? Para estimar o decréscimo anual
encontre a reta de regressão.
(b) Para que ano espera-se que essas importações reduzam-se para 30.000.000 de toneladas?
(c) Calcule a dispersão anual
2. Em uma dada região da fronteira, acredita-se que o gado alimentado em um determinado pasto tem
um ganho maior que o usual. Estudos de laboratório detectaram uma substância no pasto e deseja-se
verificar se ela pode ser utilizada para melhorar o ganho de peso dos bovinos. Foram escolhidos 15
bois de mesma raça e idade, e cada animal recebeu uma determinada concentração da substância X
(em mg/l). O ganho de peso após 30 dias, denotado Y, foi anotado e os dados foram os seguintes (em
kg):
X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
Y 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 22,5 24,7 23,1
a) Calcule o coeficiente de correlação linear entre as variáveis.
b) Determine o modelo de regressão linear que representa o efeito da concentração de certa substância
no pasto e o ganho de peso de bovinos.
c) Construa o gráfico de dispersão.
d) Interprete os coeficientes a e b encontrados no item (b).
Página 45 / 51
35
NÚMEROS-ÍNDICES
Um jornal, por ocasião de um pleito eleitoral, publicou uma tabela com os resultados da apuração na região:
CIDADES
CANDIDATO CANDIDATO
VOTOS
VOTOS
TOTAL
X
Y
BRANCOS
NULOS
A
39.544
30.279
980
11.549
82.352
B
18.872
19.897
787
6.210
45.766
C
8.139
4.903
177
1.324
14.543
D
16.263
8.659
464
2.997
28.383
E
746
899
45
216
1.996
F
3.149
3.120
93
517
6.879
Números Relativos:
CIDADES
VOTOS BRANCOS
(%)
1,19
1,72
1,22
1,63
2,36
1,35
A
B
C
D
E
F
Números relativos X Números absolutos
1. NÚMEROS ÍNDICES
ANOS
MATRÍCULA
NÚMERO-ÍNDICE
1989
1.050
100,0
1990
1.150
109,5
1991
1.200
114,3
1992
1.400
133,3
1993
1.560
148,6
1994
1.700
161,9
Número-índice ou, simplesmente, índice é a relação entre dois estados de uma variável ou de um grupo
de variáveis, suscetível de variar no tempo ou no espaço (ou de grupo de indivíduos para grupo de indivíduos).
O índice representa, portanto, o nível de um fenômeno em relação ao nível que ele tinha num dado
período (ou numa dada região) tomado como base, e é geralmente expresso em porcentagem.
Os índices mais utilizados relacionam, em geral, variações de preço, de quantidade ou de valor (preço x
quantidade) ao longo do tempo. Mas não somente na economia, como também nas ciências físicas, químicas,
naturais e sociais (Psicologia – quociente de inteligência – QI).
2. RELATIVOS DE PREÇOS
Quando queremos analisar a variação no preço (ou na quantidade e no valor)
Página 46 / 51
36
p0: preço na época base
pt: preço na época atual
p0,t: relativo de preço
q0: quantidade na época base
qt: quantidade na época atual
p0,t: relativo de quantidade
v0: valor na época base
vt: valor na época atual
v0,t: relativo de valor
Exemplo:
Sabendo que o preço de determinado produto era de R$ 50 em 2004 e de R$ 60 em 2005, determine o
relativo de preço em 2005, tomando como base o ano de 2004. (É comum a notação 2004 = 100 para indicar que
o ano de 2004 é tomado como base.)
3. ELOS DE RELATIVOS
Quando cada um deles é calculado tomando como base o ano anterior, são os relativos de base móvel.
Fazemos uso destes para acompanhar crescimento de período a período
Assim, se um bem apresentou, um período de 2001 a 2004, respectivamente os preços de R$ 240, R$
300, R$ 360 e R$ 540, os elos relativos são:
4. RELATIVOS EM CADEIA
É o índice de base fixa: todos relativos são calculados tomando como base uma determinada época.
Com os dados do caso anterior teremos:
Página 47 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
5. ÍNDICES AGREGATIVOS
Até agora os índices estudados servem somente para acompanhar preço de um bem só. Porém a variação nos
preços exige um conjunto de bens (agregado): índice agregativo.
5.1 Índice agregativo simples
Índice médio dos relativos
BENS
A (m)
B (kg)
C (l)
n=3
RELATIVOS DE PREÇOS
2004
2005
100
150
100
125
100
160
∑ = 300
∑ = 435
Ip = 435/3 = 145%
5.2 Índice agregativo ponderado
Coeficientes de ponderação, atribuindo, a cada item, a importância que lhe cabe.
Várias fórmulas: de Laspeyres, de Paasche, de Fischer etc.
Muito utilizados nos índices de investigação econômica.
5.2.1
Fórmula de Laspeyres ou método da época-base
Página 48 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo:
Considera a tabela:
Bens
A
B
C
2003
p
20
40
15
2004
q
4
3
8
p
28
56
30
q
3
3
12
5.3 Índices de preços
Embora, sem respostas imediatas, para construir um índice preço devemos considerar os seguintes pontos:
a) Qual o objetivo do índice? Determinar o que ele está medindo e a quem se refere. Seleção dos produtos
que comporão o índice.
b) Que produtos devem ser incluídos no seu cálculo? Os mais importantes e representativos.
c) Quais os preços a serem incluídos no seu cálculo? Identificar o setor (atacado, varejo, ...), decidir a
cotação e a forma de coleta dos preços.
d) Qual o peso a ser atribuído a cada bem em particular? Depende da finalidade ou da utilidade do índice.
Deve refletir a importância do bem.
e) Qual a fórmula adequada? Em geral, quando se trata de índices preços, é usada a fórmula de
Laspeyers, que possibilita revisões periódicas.
5.3.1 Índice de custos de vida
O índice de custo de vida ou índice de preços ao consumidor é um número-índice que procura medir a variação
de preços de um conjunto de bens e serviços necessários à vida do consumidor final padrão (família padrão).
É evidente que devem ser considerados os preços dos bens consumidos em alimentação, vestuário, mobiliário,
habitação, lazer, saúde, higiene etc., além, é claro, dos gatos com água, luz, transportes, educação e outros.
5.3.2
5.3.3
5.3.4
5.3.5
– IPC
– Índice da Cesta Básica
– IGP
– IPC da FIPE
6. DEFLACIONAMENTO DE DADOS
Aumento de preços implica baixas no poder aquisitivo.
Salários nominais X Salários reais = Poder aquisitivo
Onde: SR – Salários Reais
St – Salários atuais
IP – Índice de preço das épocas correspondentes ou deflator
Página 49 / 51
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Exemplo: O salário de um professor, em dezembro de 2005, era de R$ 1.071 e o IP de dezembro de 2005, com
base em novembro, era de 101,24%, o valor aquisitivo desse professor é dado por:
Outro exemplo: O faturamento de uma empresa no período de 2001 a 2004 é dado pela tabela abaixo. Vamos
determinar o seu faturamento atual, relativamente ao período de 2000.
ANOS
2001
2002
2003
2004
FATURAMENTO (R$)
180.000
220.000
430.000
480.000
IP (2000 = 100)
140,8
291,1
362,5
410,3
FATURAMENTO A
PREÇOS DE 2000 (R$)
Obs.: Qualquer ano pode ser tomado por base, basta recalcular o IP (base fixa)
Exercícios:
1) Dada a tabela:
Quantidade de bens (2001-2004)
Bens
Auto-veículos (mil unid.
Cimento (milhões de t)
Aço (milhões de t)
Petróleo bruto (milhões de m³)
2001
1.128,00
24,90
13,90
9,60
Anos
2002
1.165,20
27,20
15,20
10,60
2003
780,90
26,10
13,10
12,40
2004
859,30
25,40
12,90
15,10
a. Calcule os relativos para o bem auto-veículos, tomando 2001 = 100;
b. Forme a tabela dos elos de relativos para o cimento;
c. Forme a tabela dos relativos em cadeia para o aço, tomando 2002 = 100
d. Calcule os relativos para o petróleo bruto, tomando 2002 = 100
e. Represente a evolução dos índices das questões a e c, usando o gráfico em linha
2) O salário médio de determinada classe operária, em 2004, foi de R$ 1.280,00. O IP, nesse mesmo
ano, era igual a 257,57 e o de 2001 era igual a 187,20, referidos ao período-base de 1992.
Tomando o ano de 2001 como base, determine o salário real dessa classe operária em 2004.
3) O IP, em dado período, aumenta de 15%. Qual deve ser o aumento dos salários dos empregados de
uma empresa, para que tenham um aumento real de 5%?
Página 50 / 51
Exercícios complementares de correlação e regressão:
1) Prevendo necessidades gerenciais. Gestores são parte importante da base de
recursos humanos de qualquer organização. Dessa forma, uma organização
deveria estar tão preocupada com a previsão das necessidades futuras da
gestão como está em relação a suas próprias necessidades – digamos, recursos
naturais usados no processo de produção. Um procedimento comum de
previsão é estruturar a relação entre vendas e o número de gestores
necessários, uma vez que a demanda por gestores é o resultado de aumentos e
diminuições na demanda por produtos e serviços que uma firma oferece a seus
consumidores. Para desenvolver essa relação, os dados mostrados na tabela
abaixo são coletados dos registros de uma firma.
Unidades
Gestores
vendidas
(y)
(x)
5
10
4
11
8
10
7
10
9
9
15
10
20
11
21
17
25
19
24
21
30
22
31
25
36
30
38
30
40
31
41
31
51
32
40
30
48
32
47
32
a) Existe correlação entre as duas variáveis? Qual? Sim. r = 0,96
b) Determine a reta de ajustamento, se existir. y = 0,59x + 5,22
c) Qual a previsão do número de gestores necessários se a firma alcançar 50
unidades vendidas? y = 34,72
2) De acordo com a tabela abaixo:
Página 51 / 51
3) a) Verifique a correlação existente entre a distância em km da Sede do Corpo de
Bombeiros e o estrago provocado pelo incêndio em milhares de reais. R = 0,96
Forte correlação direta
b) Qual a previsão de gastos em reparação dos estragos se o incêndio ocorrer a
7 km de distância da sede do Corpo de Bombeiros? y = 4,92x + 10,28
y=
44,72
c) Qual a previsão de gastos em reparação dos estragos se o incêndio ocorrer a
10 km de distância da sede do Corpo de Bombeiros? y = 59,48
d) Qual seria a distância da sede do Corpo de Bombeiros se os estragos com
incêndio somaram a importância de R$ 30,4 mil reais? x = 4,09
Distância
Estrago
da Estação
do
dos
Incêndio
Bombeiros
(y)
(x)
3,4
26,2
1,8
17,8
4,6
31,3
2,3
23,1
3,1
27,5
5,5
36,0
0,7
14,1
3,0
22,3
2,6
19,6
4,3
31,3
2,1
24,0
1,1
17,3
6,1
43,2
4,8
36,4
3,8
26,1
Download

Livro Estatística II Carina