C iências ontábeis ADMINISTRAÇÃO Caderno de Estatística II Dom Alberto Prof: Carina Inês Panke da Silva Página 2 / 51 C122 SILVA, Carina Inês Panke da Caderno de Estatística II Dom Alberto / Carina Inês Panke da Silva. – Santa Cruz do Sul: Faculdade Dom Alberto, 2010. Inclui bibliografia. 1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística II – Teoria I. SILVA, Carina Inês Panke da II. Faculdade Dom Alberto III. Coordenação de Administração IV. Coordenação de Ciências Contábeis V. Título CDU 658:657(072) Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10 Página 3 / 51 Apresentação O Curso de Administração da Faculdade Dom Alberto iniciou sua trajetória acadêmica em 2004, após a construção de um projeto pautado na importância de possibilitar acesso ao ensino superior de qualidade que, combinado à seriedade na execução de projeto pedagógico, propiciasse uma formação sólida e relacionada às demandas regionais. Considerando esses valores, atividades e ações voltadas ao ensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bem como o aprendizado efetivo dos alunos, o que permitiu o reconhecimento pelo MEC do Curso de Administração em 2008. Passados seis anos, o curso mostra crescimento quantitativo e qualitativo, fortalecimento de sua proposta e de consolidação de resultados positivos, como a publicação deste Caderno Dom Alberto, que é o produto do trabalho intelectual, pedagógico e instrutivo desenvolvido pelos professores durante esse período. Este material servirá de guia e de apoio para o estudo atento e sério, para a organização da pesquisa e para o contato inicial de qualidade com as disciplinas que estruturam o curso. A todos os professores que com competência fomentaram o Caderno Dom Alberto, veículo de publicação oficial da produção didáticopedagógica do corpo docente da Faculdade Dom Alberto, um agradecimento especial. Lucas Jost Diretor Geral Página 4 / 51 PREFÁCIO A arte de ensinar e aprender pressupõe um diálogo entre aqueles que interagem no processo, como alunos e professores. A eles cabe a tarefa de formação, de construção de valores, habilidades, competências necessárias à superação dos desafios. Entre estes se encontra a necessidade de uma formação profissional sólida, capaz de suprir as demandas de mercado, de estabelecer elos entre diversas áreas do saber, de atender às exigências legais de cada área de atuação, etc. Nesse contexto, um dos fatores mais importantes na formação de um profissional é saber discutir diversos temas aos quais se aplicam conhecimentos específicos de cada área, dispondo-se de uma variedade ampla e desafiadora de questões e problemas proporcionada pelas atuais conjunturas. Para que isso se torne possível, além da dedicação daqueles envolvidos no processo de ensino-aprendizagem, é preciso haver suporte pedagógico que dê subsídios ao aprender e ao ensinar. Um suporte que supere a tradicional metodologia expositiva e atenda aos objetivos expressos na proposta pedagógica do curso. Considerando esses pressupostos, a produção desse Caderno Dom Alberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto. Com este veículo, elaborado por docentes da instituição, a faculdade busca apresentar um instrumento de pesquisa, consulta e aprendizagem teóricoprática, reunindo materiais cuja diversidade de abordagens é atualizada e necessária para a formação profissional qualificada dos alunos do curso. Ser um canal de divulgação do material didático produzido por professores da instituição é motivação para continuar investindo da formação qualificada e na produção e disseminação do que se discute, apresenta, reflete, propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem o Caderno Dom Alberto com a mesma satisfação que a Faculdade tem em elaborar esta coletânea. Elvis Martins Diretor Acadêmico de Ensino Página 5 / 51 Sumário Apresentação........................................................................................................ 3 Prefácio................................................................................................................. 4 Plano de Ensino.................................................................................................... 6 Aula 1 Distribuição de Probabilidades............................................................................. 10 Aula 2 Distribuição de Probabilidades (Continuação)...................................................... 10 Aula 3 Distribuição de Probabilidades (Continuação)......................................................10 Aula 4 Estimativas........................................................................................................... 19 Aula 5 Estimativas (Continuação) .................................................................................... 19 Aula 6 Estimativas (Continuação) ....................................................................................19 Aula 7 Estimativas (Continuação) ....................................................................................19 Aula 8 Teste de Hipóteses................................................................................................ 27 Aula 9 Teste de Hipóteses (Continuação)........................................................................ 27 Aula 10 Teste de Hipóteses (Continuação)........................................................................ 27 Aula 11 Correlação e Regressão....................................................................................... 34 Aula 12 Séries Temporais................................................................................................... 40 Aula 13 Séries Temporais (Continuação)........................................................................... 40 Página 6 / 51 Centro de Ensino Superior Dom Alberto Plano de Ensino Identificação Curso: Administração/Ciências Contábeis Disciplina: Estatística II Carga Horária (horas): 60 Créditos: 4 Semestre: 3º Ementa Inferência estatística. Testes de Hipóteses. Correlação e regressão. Números Índices e Análise de Séries Temporais. Objetivos Geral: Oferecer condições para que o aluno possa utilizar esta ferramenta dando-lhe condições para que possa coletar, interpretar e concluir sobre os resultados obtidos através da observação de dados coletados. Que o aluno possa ainda verificar as variações dos preços de produtos utilizados em sua empresa através da compreensão da Série de Números índices, podendo inclusive projetar estas variações, a fim de implementar estratégias competentes para a empresa. Específicos: Apresentação de exemplos de distribuição de probabilidades, que sejam capazes de propiciar ao aluno uma identidade com problemas específicos da empresa, possibilitando melhor preparo na identificação de problemas podendo preveni-los no futuro. Através da compreensão da série de números índices, a realização de uma pesquisa dentro da empresa em que o aluno está familiarizado, identificando produtos com preços e quantidades para que dessa forma possa calcular as variações de preços. Inter-relação da Disciplina Horizontal: Matemática Aplicada I, Estatística Aplicada I. Vertical: Administração Estratégica, Elaboração e Análise de Projetos, Orçamento Empresarial e Mercado de Capitais. Competências Gerais Realizar tomada de decisão: coletar, interpretar e concluir sobre os resultados obtidos. Desenvolver raciocínio lógico, crítico e analítico: verificar variações (números índices), projetar as variações para implementar estratégias competentes. Revelar-se um profissional adaptável. Competências Específicas Identificar problemas específicos, compreender e ler dados coletados , produzir estratégias eficazes e eficientes. Habilidades Gerais Reconhecer e definir problemas, pensar estrategicamente, transferir e generalizar conhecimentos e transferir conhecimentos de experiências cotidianas para o ambiente de trabalho. Habilidades Específicas Equacionar soluções, inferir, testar, correlacionar, calcular números índices e analisar séries temporais. Conteúdo Programático PROGRAMA: 1. 2. 3. 4. Distribuição de Probabilidades; Distribuição Binomial de Probabilidades; Distribuição Normal de Probabilidades; Inferência Estatística: - Amostragem; - Margem de erro; Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. Página 7 / 51 5. 6. 7. 8. 9. - Intervalos de Confiança; - Tamanho da Amostra; Testes de Hipóteses para médias e proporções; Análise de Regressão e Correlação; Análise de Séries Temporais; Números índices; Série de números índices. Estratégias de Ensino e Aprendizagem (metodologias de sala de aula) Aulas participativas, aulas expositivas, exercícios, trabalhos individuais. Avaliação do Processo de Ensino e Aprendizagem A avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa e sistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação à programação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos da metodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade de currículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc. A forma de avaliação será da seguinte maneira: 1ª Avaliação – Peso 8,0 (oito): Prova; – Peso 2,0 (dois): Trabalho O Trabalho será definido no decorrer das aulas, sendo algumas questões dissertativas que os alunos terão que resolver e entregar. 2ª Avaliação Peso 8,0 (oito): Prova; Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas provas do SPE) Observação: As provas do SPE deverão ser realizas até o dia 30/09/2010 (1ª prova SPE) e até o dia 30/11/2010 (2ª prova SPE), sendo obrigatória a realização de ao menos uma prova. Avaliação Somativa A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez, permitindo-se a fração de 5 décimos. O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas. Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no bimestre. O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários, pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma nota representativa de cada avaliação bimestral. Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete (7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados. Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral, no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como média final de aprovação igual ou superior a cinco (5,0). Sistema de Acompanhamento para a Recuperação da Aprendizagem Serão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas que são realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula. Recursos Necessários Humanos Professor. Físicos Laboratórios, visitas técnicas, etc. Materiais Recursos Multimídia. Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. Página 8 / 51 Bibliografia Básica CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002. SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências contábeis. São Paulo: Atlas, 1999. 1 e 2 v. MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003. TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995. SPIEGEL, Murray R.. Estatística. 3. ed. São Paulo: Pearson Education, 1994. Complementar BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002. MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005. BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999. FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996. MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990. Periódicos Jornais: Gazeta do Sul, Zero Hora. Revistas: Exame, Amanhã, Veja, Isto É. Sites para Consulta http://www.ime.usp.br http://www.ibge.gov.br Outras Informações Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca: http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. Página 9 / 51 Cronograma de Atividades Aula Consolidação Avaliação Conteúdo Introdução da disciplina (apresentação, acordos e cronograma). Revisão de probabilidades. Distribuição de Probabilidade Binomial. Distribuição Probabilidade Binomial e Distribuição Probabilidade Normal. 1ª 2ª Procedimentos Recursos AE QG/DS/LB AE/TG QG/DS/LB 3ª Distribuição Probabilidade Normal. AE QG/DS 4ª Distribuição Probabilidade Normal. AE QG/DS 5ª Estimativas: Margem de erro e Intervalos de Confiança para grandes e pequenas amostras Para médias. AE QG 6ª Estimativas: Tamanho da Amostra AE QG AE QG AE QG Teste de Hipóteses para média. Interpretação. AE QG Teste de Hipóteses para média. Interpretação. AE QG AE/TG QG AE QG/DS /LB AE QG/DS /LB AE QG/DS AE QG Estimativas: Margem de erro e Intervalos de Confiança para proporções. Consolidação e Sistematização dos Conteúdos da 1ª Avaliação. 7ª 1 1 8ª 9ª Primeira Avaliação. Testes de Hipóteses para proporção. Teste de Hipóteses com duas médias e proporções. Interpretação. Introdução a Correlação e Regressão. Cálculos e interpretação. Cálculos de Correlação e Regressão através das funções estatísticas e Análise de Dados. Séries Temporais. Números Índices e seus métodos de cálculo. Séries de Números Índices. Consolidação e Sistematização dos Conteúdos da 2a Avaliação. 10ª 11ª 12ª 13ª 2 2 Segunda Avaliação. 3 Avaliação Substitutiva Legenda Código AE TG TI SE PA Descrição Aula expositiva Trabalho em grupo Trabalho individual Seminário Palestra Código QG RE VI DS FC Descrição Quadro verde e giz Retroprojetor Videocassete Data Show Flipchart Código LB PS AP OU Descrição Laboratório de informática Projetor de slides Apostila Outros Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. Página 10 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO I. DISTRIBUIÇÃO DE PROBABILIDADES 1.1 Distribuição Binomial – Variáveis Discretas Uma variável aleatória associa um valor numérico a cada resultado de um experimento aleatório e uma distribuição de probabilidades associa uma probabilidade a cada valor de uma variável aleatória. Os experimentos binomiais têm a característica de apresentarem exatamente dois resultados complementares: em processos industriais as pessoas falham ou não falham. Na medicina um paciente sobrevive um ano, ou morre. Em propaganda, um consumidor reconhece um produto, ou não. Definição: Um experimento binomial é um experimento que satisfaz as seguintes condições: 1. O experimento deve comportar um numero fixo de provas; 2. As provas devem ser independentes (o resultado de qualquer prova não afeta as probabilidades das outras provas); 3. Cada prova deve ter todos os resultados classificados em duas categorias; 4. As probabilidades devem permanecer constantes para cada prova. Se fizermos um experimento binomial, a distribuição da variável aleatória x é chamada uma distribuição de probabilidade binomial (ou distribuição binomial). Usa-se a seguinte denominação: S e F (sucesso ou falha) denotam as duas categorias possíveis de todos os resultados: p e q denotam as possibilidades de S e F, respectivamente; assim: P( s) = p P( F ) = 1 − p = q Sendo n = denota o numero fixo de provas; x = denota um número específico de sucesso em n provas, podendo ser qualquer inteiro entre 0 e n, inclusive; p = denota a probabilidade de sucesso em uma das n provas; q = denota a probabilidade de falha em uma das n provas; P(x) = denota a probabilidade de obter exatamente x sucessos em n provas; Fórmula utilizada para calcular a probabilidade binomial: P( x) = n! ⋅ p x ⋅ q n− x (n − x)! x ! Exemplo: Dado que 10% das pessoas são canhotas, suponha que queiramos achar a probabilidade de obter exatamente 3 estudantes canhotos em uma turma de 15 estudantes. Questiona-se: a) Trata-se de um experimento binomial? b) Em caso afirmativo, identifique os valores de n, x, p e q. c) Aplicando a formula da probabilidade binomial, determine a probabilidade de obter 3 estudantes canhotos em uma turma de 15 estudantes. 2 Página 11 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO d) A probabilidade de ao menos 3 sucessos (alunos canhotos). EXERCÍCIOS 1. Uma empresa produz 10% de peças defeituosas. As peças são embaladas em caixas que contêm 12 peças. Calcule a probabilidade de um cliente comprar uma caixa contendo: (a) nenhuma peça defeituosa; (b) uma peça defeituosa. 2. Um produtor de sementes vende pacotes com 20 sementes cada. Os pacotes que apresentarem mais de uma semente sem germinar são indenizados. A probabilidade de uma semente germinar é 0,98. (a) Qual é a probabilidade de que um pacote não seja indenizado? (b) Se o produtor vende 1.000 pacotes, em quantos se espera indenização? 3. Estatísticas de tráfego revelam que 25% dos veículos interceptados numa auto-estrada não passam no teste de segurança. De 10 veículos interceptados, determine a probabilidade de 2 ou mais não passarem. 4. Numa criação de coelhos, 40% são machos. Qual a probabilidade de que nasçam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos? 5. O fabricante de drives de disco utilizados em uma das mais conhecidas marcas de microcomputadores espera que 2% dos drives de disco apresentem defeitos durante o período de garantia do microcomputador. Numa amostra de 10 drives de disco, qual é a probabilidade de que: a) Nenhum irá apresentar defeito durante o período de garantia? b) Exatamente um irá apresentar defeito durante o período de garantia? c) Pelo menos dois irão apresentar defeito durante o período de garantia? d) Quais seriam as respostas para a letra (a) e (b) se fosse esperado que 1% dos drives de disco apresentasse defeito? 1.2 DISTRIBUIÇÃO NORMAL A distribuição normal desempenha papel importantíssimo na Teoria Estatística. Deduzida por De Moivre em 1753 como forma limite da Binominal, foi posteriormente redescoberta em 1774 por Laplace, e em 1809 por Gauss. Por essa razão é conhecida ainda pelo nome de Distribuição de Gauss, de Laplace, ou ainda Laplace-Gauss. A Distribuição Normal é a mais importante distribuição de variável aleatória contínua e é básica para o desenvolvimento da inferência estatística. Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição normal. A distribuição normal é caracterizada por uma função, cujo gráfico descreve uma curva em forma de sino. Esta distribuição depende de dois parâmetros: • µ (média) – este parâmetro especifica a posição central da distribuição de probabilidades. • σ (desvio padrão) – este parâmetro especifica a variabilidade da distribuição de probabilidades. Existem infinitas distribuições normais, cada uma com usa própria média e desvio padrão. A distribuição normal com media zero e desvio padrão de 1 é chamada de distribuição normal padrão ou padronizada. A escala horizontal do gráfico da distribuição normal padrão 3 Página 12 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO corresponde aos escores z (uma medida de posição que indica o numero de desvios-padrão de um valor a partir da media). Pode-se transformar um valor x em um escore z, usando a seguinte fórmula: z= onde: x−µ σ x = valores arbitrários (intervalos) µ = média da distribuição normal σ = desvio-padrão da distribuição normal - ∞ +∞ Após usar a fórmula dada acima para transformar um valor x num escore z, pode-se usar a Tabela Normal Padrão. A tabela enumera a área acumulada sob a curva normal padrão à esquerda de z para escores z de –3,49 a 3,49. Área na tabela - A distribuição normal possui as seguintes características: Variável aleatória contínua. Tem a forma de um sino. É simétrica em relação a média. Prolonga-se de - ∞ a + ∞. A área sob a curva normal é considerada de tamanho 1 (100%). Exemplos. 1. Determina a área que corresponde ao escore z de 1,15. 2. Determina a área acumulada que corresponde ao escore z de 1,15. 4 Página 13 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 3. Calcule a área acumulada que corresponde ao escore z de -0,24. 4. Esboce a curva normal padrão e sombreie a área apropriada sob a curva: a) para obter a área a esquerda de z = 1,23. b) para obter a área a direita de z = 1,23. c) para obter a área entre dois escores z, -0,75 e 1,23. 5. Determine a área sob a curva padrão à direita de z = 1,06. 6. Se um escore z for zero, qual das afirmações a seguir será verdadeira. Explique seu raciocínio. (a) a média é zero. (b) o valor x correspondente é igual a zero. (c) o valor x correspondente é igual à média. 7. Analise os gráficos e obtenha a probabilidade de z ocorrer na região indicada. 8. Determine a probabilidade indicada usando a distribuição normal padrão: a) P (z < 1,45) b) P (z > -1,95) c) P ( 0 < z < 2,05) d) P (z < -2,58 ou z > 2,58) e) P ( -0,95 < z < 1,44) Exemplos para transformar um escore z em um valor x. 1. As velocidades de veículos ao longo de um trecho de uma via expressa tem uma media de 56km/h e um desvio padrão de 8km/h. Obtenha as velocidades x correspondentes aos escores z = 1,96; -2,33 e 0. Interprete os seus resultados. 2. As notas dos candidatos ao concurso público do INSS estão normalmente distribuídas com uma média de 75 pontos e um desvio padrão de 6,5. Para poder entrar no serviço público, o candidato precisa figurar entre os 5% melhores. Qual é a menor pontuação possível para a aprovação de um candidato? 3. Em uma amostra selecionada ao acaso de 1169 homens com idade entre 40 e 49 anos, foi constatado um nível médio total de colesterol de 211 miligramas por decilitros, com desvio padrão de 39,2 miligramas por decilitros. Suponha que os níveis totais de colesterol sejam normalmente distribuídos. Obtenha o mais alto nível total de colesterol que um homem com idade entre 40 e 49 anos pode ter e ainda assim ficar entre o 1% mais baixo. 5 Página 14 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO EXERCÍCIOS 1. Um levantamento indica que pessoas usam seus computadores em media durante 2,4 anos antes de adquirir uma nova máquina. O desvio padrão é de 0,5 anos. Selecionando ao acaso alguém que tenha computador, obtenha a probabilidade de que ele o use por menos de dois anos antes de comprar outro. 2. A taxa de hemoglobina no sangue de pessoas que possuem boa saúde segue uma distribuição normal com média 12 e desvio padrão 1. Qual a probabilidade de se encontrar uma pessoa normal com taxa de hemoglobina: (a) superior a 15? (b) Inferior a 10? (c) Entre 10 e 13 (d) Num grupo de 500 pessoas, em quantas devemos esperar as características acima? 3. Os depósitos mensais na caderneta de poupança têm distribuição normal com média igual a $ 500 e desvio padrão $ 150. Se um depositante realizar um depósito, pede-se calcular a probabilidade de que esse depósito seja igual ou menor que $ 650. 4. A análise estatística de um investimento mostrou que seu resultado líquido é uma variável aleatória X com valor esperado $ 10 000 e desvio padrão $ 4 000. Sabendo que a variável X tem distribuição normal, pede-se calcular a probabilidade de que o resultado X seja menor que $ 5000. 5. As vendas mensais dos últimos 50 meses apresentam uma média igual a $ 500 mil com desvio padrão igual a $ 80 mil. Se a empresa estabeleceu uma meta de vendas para o próximo mês de $ 550 mil, pede-se calcular, considerando que os dados históricos se repetem no futuro próximo: a) A probabilidade de ficar abaixo da meta. b) A probabilidade de superar a meta. c) A probabilidade de que as vendas se situem entre 80 % e 110 % da média. 6. Uma população X tem distribuição normal com média igual a 20 e desvio padrão igual a 5. Retirando aleatoriamente um elemento dessa população, pede-se calcular a probabilidade desse elemento ser igual ou menor que 22. 7. A distribuição dos salários anuais dos auxiliares de escritório de uma grande empresa tem distribuição normal com média igual a R$12.500,00 e desvio padrão igual a R$2.800,00. Calcular: a) A proporção dos auxiliares de escritório que ganha mais que R$14.500,00. b) A proporção dos auxiliares de escritório que ganha menos que R$11.000,00 c) A proporção dos auxiliares de escritório que ganha entre R$10.000,00 e R$14.000,00. 8. Suponha que um consultor esteja investigando o tempo que os trabalhadores de uma fábrica de automóveis levam para montar determinada peça depois de terem sido treinados para realizar a tarefa por um método de aprendizagem individual. O consultor determina que o tempo em segundos para montar a peça para os trabalhadores treinados por esse método é distribuído de maneira normal com média igual a 75 segundos e desvio padrão igual a 6. Pede-se: a) A probabilidade de um trabalhador montar uma peça em 81 segundos? b) Quantos segundos devem transcorrer antes que 10% dos trabalhadores da fabrica montam uma peça? 9. Um conjunto de notas finais de provas da disciplina de Estatística II foi considerado como sendo normalmente distribuído com uma média aritmética de 73 e um desvio padrão de 8. 6 Página 15 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO a) b) c) d) Qual é a probabilidade de se obter no máximo uma nota 91 nesta prova? Que porcentagem de alunos tirou entre 65 e 89? Que porcentagem de alunos tirou entre 81 e 89? Qual é a nota final do exame se somente 5% dos alunos que fizeram a prova tiram nota mais alta? 10. Uma fabrica de carros sabe que os motores de sua fabricação têm duração normal com 150.000 km e desvio padrão de 5000 km. Se a fabrica substitui o motor que apresenta duração inferior a garantia, qual deve ser esta garantia para que a porcentagem de motores substituídos seja inferior a 0,2%? 11. As alturas dos alunos de uma determinada escola são normalmente distribuídas com média 1,60m e desvio padrão 0,30. Encontre a probabilidade de uma aluna escolhida ao acaso medir: a) Entre 1,50 e 1,80 m. b) Mais que 1,60 m. c) Menos que 1,48m. d) Entre 1,54 e 1,58m. e) Mais que 1,55m. f) Menos que 1,55m ou mais que 1,75m. 12. Suponha-se que a renda anual de uma determinada cidade tenha uma média de R$ 5.000,00 com desvio padrão de R$ 1.500,00. Admitindo-se uma distribuição normal, que podemos dizer de uma renda de R$ 7.000,00? EXEMPLO DE DISTRIBUIÇÃO NORMAL COMO APROXIMAÇÃO DA DISTRIBUIÇÃO BINOMIAL Se n.p ≥ 5 e n.q ≥ 5, então a variável aleatória binomial x tem distribuição aproximadamente normal, com média µ = np e desvio padrão σ = npq 1. Uma maquina produz parafusos, dos quais 10% são defeituosos. Determinar a probabilidade de, em uma amostra tomada ao acaso de 400 parafusos produzidos por essa maquina, serem defeituosos: (a) no máximo 30; (b) entre 30 e 50 (c) 55 ou mais. 2. Numa cidade haverá um plebiscito em que 1.250.000 eleitores decidirão entre aceitar (SIM) ou rejeitar (NÃO) certa política. Suponha que um partidário da aceitação dessa política afirme que 80% dos votos serão SIM. Admitindo essa previsão como verdadeira, qual é a probabilidade de, em uma amostra de 900 eleitores, menos de 684 serem partidários do SIM? 3. Cerca de 4,4% dos acidentes fatais com automóveis são causados por pneus defeituosos (com base em dados do Conselho Nacional de Segurança). Se um estudo de segurança em uma rodovia começa com a escolha aleatória de 750 casos de acidentes fatais com veículos motorizados, estime a probabilidade de exatamente 35 deles terem sido causados por pneus defeituosos. 7 Página 16 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Tabela Z – Áreas sob a curval Normal z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 0,0 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,4990 0,4993 0,4995 0,4997 0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,4992 0,4994 0,4996 0,4997 0,05 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 0,06 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,07 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,08 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2517 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4997 0,09 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 8 Página 17 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Cursos de Administração e Ciências Contábeis ESTATÍSTICA II Professora: Carina Inês Panke da Silva [email protected] Página 18 / 51 1 Página 19 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO II - ESTIMATIVAS 2.1 Estimativas pontuais e intervalares As estatísticas amostrais são utilizadas como estimadores de parâmetros populacionais. Por exemplo, uma média aritmética da amostra é usada como estimativa de ponto da média populacional. Existem dois tipos principais de estimativas: estimativas de ponto e estimativas de intervalo. A estimativa pontual é um valor (ou ponto) único usado para aproximar um parâmetro populacional. A média amostral x é a melhor estimativa pontual da média populacional µ . Mas, a estatística de uma amostra, tal como x , varia de amostra para amostra, uma vez que depende dos itens selecionados na amostra, e esta variação deve ser levada em consideração ao se fornecer estimativas para a população. Pensando nessa variação é que foi desenvolvido a estimativa intervalar. A estimativa intervalar é um intervalo de valores que tem probabilidade de conter o verdadeiro valor da população. Ou seja, o intervalo que é construído terá uma confiança ou probabilidade especificada de estar estimando corretamente o verdadeiro valor do parâmetro da população. 2.2 Intervalos de confiança Um intervalo de confiança está associado a um grau de confiança que é uma medida da nossa certeza de que o intervalo contém o parâmetro populacional. A definição grau de confiança utiliza α (alfa) para descrever uma probabilidade que corresponde a uma área. São escolhas comuns para o grau de confiança (ou nível de confiança, ou coeficiente de confiança): 90%, 95% e 99%, veja a tabela. Grau de confiança 90% 95% 99% α 0,10 0,05 0,01 Valor Crítico z 1,645 1,96 2,575 Um valor crítico é um número na fronteira que separa os valores das estatísticas amostrais prováveis de ocorrerem, dos valores que têm pouca chance de ocorrer. 9 Página 20 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Região crítica Região crítica Valor crítico Valor crítico Para calcular limites de confiabilidade, utilizamos a seguinte equação x = µ ± Z(σ/√̅n) No nosso caso, inverte-se o x com µ, para se saber se é o que se espera. Exemplo: 1. Um fabricante de papel para impressora possui um processo de produção que opera de maneira contínua, através de um turno completo de produção. É esperado que o papel tenha um comprimento de 11 polegadas, e o desvio padrão conhecido sejam 0,02 polegadas. A intervalos periódicos, são selecionadas amostras para determinar se o comprimento médio do papel ainda se matém igual a 11 polegadas ou se algo de errado aconteceu no processo de produção para que tenha modificado o comprimento do papel produzido. Uma amostra aleatória de 100 folhas foi selecionada e verificou-se que o comprimento médio do papel era de 10,998 polegadas. Caso seja desejada uma estimativa do intervalo de confiança de 95% do comprimento médio do papel na população, teremos x ± Z(σ/√̅n) = 10,998 ± (1,96)(0,02/√̅100) = 10,998 ± 0,00392 10,99408 ≤ µ ≤ 11,00192 Como 11 está entre o intervalo encontrado, o fabricante não tem com o que se preocupar. Caso se queira um intervalo de confiança maior, por exemplo 99%, aí o que teremos? 2. A variabilidade do tempo de atendimento em um caixa bancário é conhecida σ = 0,10min. e tem distribuição normal. Uma amostragem de 40 pessoas indicou tempo médio de atendimento de x = 1,5 min. Construir um intervalo de confiança de 95% para o tempo médio de atendimento. 10 Página 21 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO EXERCÍCIOS 1. O gerente do controle aéreo do aeroporto de São Paulo está interessado em conhecer o tempo que os aviões 737 necessitam para aterrissar, medindo este tempo entre o instante que o piloto inicia a operação de descida e o instante que o avião abandona a pista de aterrissagem. Se a média de uma amostra aleatória de 33 aviões é igual a 21 minutos com desvio padrão igual a 4,5 minutos, pede-se estimar o valor da média da população considerando dois valores de intervalo de confiança: 90% e 95%. 2. Numa amostra aleatória de 32 notas de despesa numa semana em dezembro, um auditor constatou uma despesa média de R$220,00, com desvio padrão de R$20,00. a) Qual a estimativa pontual da quantia média? b) Construa um intervalo de 99% de confiança para a quantia média. 3. De uma população com distribuição normal e desvio-padrão igual a 5 foi retirada uma amostra aleatória de tamanho 20 e sua média calculada foi 24. Estime o valor da média da população com índice de confiança igual a 90%. 4. Uma amostra consiste em 75 aparelhos de TV adquiridos há vários anos. Os tempos de substituição destes aparelhos têm média de 8,2 anos e desvio-padrão de 1,1 ano. Construa um intervalo de 90% de confiança para o tempo médio de substituição de todos os aparelhos de TVs. 5. Suponha que o proprietário de uma loja de materiais de construção é revendedor de tintas e queira calcular a verdadeira quantidade de tinta contida nas latas de um galão de 1 l, compradas de um fabricante nacionalmente conhecido. Sabe-se, pelas especificações contidas no galão, que o desvio padrão da quantidade de tinta é igual a 0,02 l. Uma amostra aleatória de 50 latas é selecionada, e a quantidade média de tinta por lata de 1 galão é igual a 0,995 l. a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira média da população da quantidade de tinta contida em uma lata de 1 galão. b) Com base nos seus resultados, você acha que o proprietário da loja tem o direito de reclamar ao fabricante? Por que? c) A população de quantidade de tinta por lata tem que ser distribuída normalmente neste caso? Explique. d) Explique por que um valor observado de 0,98 l para cada lata não seria incomum, apesar de estar fora do intervalo de confiança que você calculou? e) Suponha que você utilizasse uma estimativa do intervalo de confiança de 95%, quais seriam suas respostas para (a) e (b)? 6. O gerente de controle de qualidade de um fábrica de lâmpadas de filamento precisa calcular a vida útil média de uma remessa de lâmpadas. Sabe-se que o desvio padrão do processo é de 100 horas. Uma amostra aleatória de 50 lâmpadas indicou uma vida útil média da amostra igual a 350 horas. a) Desenvolva uma estimativa do intervalo de confiança de 99% da verdadeira média útil das lâmpadas nesta remessa. b) Você, conhecendo estes resultados, compraria uma lâmpada deste fabricante? Explique. c) Suponha que o desvio padrão do processo mudasse para 80 horas. Qual seria sua resposta para (a)? 7. Um comerciante ficou muito curioso para descobrir qual a real quantidade de refrigerante que é colocada em garrafas de 2 litros. Foi informado ao comerciante que o desvio 11 Página 22 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO padrão para garrafas de 2 litros é 0,05 litro. Uma amostra aleatória, de 100 garrafas de 2 litros, indica uma média da amostra de 1,99 litro. a) Desenvolva a estimativa do intervalo de confiança de 95% da verdadeira média da quantidade de refrigerante de cada garrafa. b) A população de quantidade de refrigerante tem que ser distribuída normalmente neste caso? Explique. c) Explique por que um valor observado de 2,02 litros não seria incomum. d) Suponha que a média da amostra mudasse para 1,97 litro. Quais seriam suas respostas para (a) e (b)? 2.3 Determinação do tamanho da amostra Exemplos: 1) Qual o tamanho da amostra necessário pra estimar a média populacional de uma característica dimensional de um processo com 95% de confiança cujo desvio-padrão populacional é σ = 2,45 cm e precisão de 0,5 cm? 2) Você pretende fazer uma pesquisa para atualizar os dados sobre média salarial dos funcionários de uma indústria de cigarros. Estudos anteriores sugerem um desvio-padrão de R$330,00. Sabendo que a empresa tem 3400 funcionários quantas pessoas você deve pesquisar para estimar a média salarial de todos os funcionários, quando a) o erro máximo tolerável for 50 reais e o nível de confiança 99%? b) o erro máximo tolerável for 50 reais e o nível de confiança 95%? c) o erro máximo tolerável for 20 reais e o nível de confiança 95%? 3) Para planejar o manuseio adequado do lixo doméstico, uma cidade deve estimar o peso médio do lixo descartado pelas residências em uma semana. Determine o tamanho da amostra necessário para estimar essa média, para que tenhamos 96% de confiança em que a média amostral esteja a menos de 0,9 kg da verdadeira média populacional. Para o desvio-padrão populacional use o valor 5,65 kg, que é o desvio padrão duma cidade vizinha de mesmo porte. 2.4 Estimativas para a média populacional: pequenas amostras Em muitas situações da vida real, o desvio padrão populacional é desconhecido. Além disso, em função de fatores como tempo e custo, frequentemente não é prático colher amostras de tamanho superior a 30. Assim, como construir intervalos de confiança para a média populacional nessas condições? Se a variável aleatória é normalmente distribuída (ou aproximadamente normalmente distribuída), a distribuição amostral para x é uma distribuição t (Student). A distribuição t é uma família de curvas, cada uma delas determinada por um parâmetro chamado grau de liberdade. Os graus de liberdade são os números de escolhas livres deixados após uma amostra estatística, tal como a média de x ter sido calculada. Quando se usa uma distribuição t para estimar uma média populacional, o número de graus de liberdade é igual ao tamanho da amostra menos um. Grau de Liberdades = n – 1 12 Página 23 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Quando o número de graus de liberdade cresce, a distribuição tende para a distribuição normal. Após 30 graus de liberdade distribuição t está muito próxima da distribuição normal padrão z. Condições para utilização da Distribuição t de Student 1. O tamanho da amostra deve ser pequeno, n ≤ 30 ; 2. σ é desconhecido; 3. A população original tem distribuição essencialmente normal. 2.5 Obtendo os valores críticos de t 1. Determinar o valor crítico t para 95% de confiança quando o tamanho da amostra for 15. 2. Determinar o valor crítico de t para 90% de confiança quando o tamanho da amostra for 22. 2.6 Intervalos de confiança e a distribuição t O intervalo de confiança para uma média amostral quando se usa desvio padrão amostral é muito semelhante ao intervalo quando se usa desvio padrão da população. Exemplos: 1. Você seleciona ao acaso 16 restaurantes e mede a temperatura do café vendido em cada um. A temperatura média amostral é de 72ºC, com um desvio padrão amostral de 12ºC. Obtenha o intervalo de confiança de 95% para a temperatura média. Suponha que as temperaturas estejam normalmente distribuídas. 2. Você seleciona ao acaso 20 casas hipotecárias e determina a atual taxa de juro que cada uma cobra. A taxa média amostral é de 6,93% com desvio padrão de 0,42% Obtenha o intervalo de confiança de 99% para a população da taxa media de juro para as hipotecas. Suponha que as taxas de juros tenham distribuição aproximadamente normal. EXERCÍCIOS 1. Nosso interesse é estimar a média de consumo em quilômetros por litro de um novo modelo de carro da montadora líder do mercado de carros populares. Sabendo que a população tem distribuição normal e o consumo em quilômetros por litros de uma amostra aleatória de 16 carros do novo modelo de carro é igual a 14,8 com desvio padrão igual a 2, pede-se estimar o valor da média da população com intervalo de confiança igual a 95%. 2. Um analista de um departamento de pessoal seleciona aleatoriamente os registros de 16 empregados horistas e calcula a taxa média de salário, R$ 7,50. Supõe-se que os salários na firma sejam distribuídos normalmente. Se o desvio-padrão dos salários é conhecido, e igual a R$1,00, estimar a taxa média de salário na firma usando um intervalo de confiança de 90%. 3. O diâmetro médio de uma amostra de 12 bastões cilíndricos incluídos em um carregamento é de 2,350 mm com um desvio padrão de 0,050 mm. A distribuição dos diâmetros de todos os bastões incluídos no carregamento é aproximadamente normal. Determinar o intervalo de confiança de 99% para estimar o diâmetro médio de todos os bastões incluídos no carregamento. 13 Página 24 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 2.7 Estimação da proporção numa população Exemplos: 1. Determine um intervalo de confiança de 98% para a verdadeira proporção populacional, se x = 50 e n = 200. 2) Qual o tamanho da amostra necessário para estimar a verdadeira porcentagem populacional a menos de 4% usando um intervalo de confiança de 90%. É razoável suspeitar que o verdadeiro valor seja 0,30 ou menos. 3) Qual o tamanho da amostra necessário para obter um intervalo de 95% de confiança para a proporção populacional, se o erro tolerável é 0,08? EXERCÍCIOS 1. Em recente pesquisa levada a efeito junto a 200 habitantes de uma grande cidade, 30 se mostraram favoráveis ao restabelecimento da pena de morte. a) Construa um intervalo de 99% de confiança para a verdadeira proporção dos habitantes daquela cidade favoráveis à pena capital. b) Que se pode dizer quanto ao tamanho do erro máximo para esse intervalo de confiança? 2. Uma biblioteca pública deseja estimar a percentagem de livros de seu acervo publicados até 2000. Qual deve ser o tamanho da amostra aleatória para se ter 90% de confiança de ficar a menos de 5 % da verdadeira proporção? 3. Uma amostra aleatória de 40 homens trabalhando num grande projeto de construção revelou que 6 não estavam usando capacetes protetores. Construa um intervalo de 99% de confiança para a verdadeira proporção dos que estão usando capacetes neste projeto. 4. Uma amostra de 50 bicicletas de um estoque de 400 bicicletas acusou 7 com pneus vazios. Construa um intervalo de 99% de confiança para a população das bicicletas com pneus vazios. 5. Selecionado aleatoriamente e pesquisados 500 universitários, verificou-se que 135 deles têm computador pessoal. a) Determine a estimativa pontual da verdadeira proporção de todos os universitários que têm computador pessoal. b) Determine um intervalo de 95% de confiança para a verdadeira proporção de todos os universitários que têm computador pessoal. 6. Se uma faculdade tem 1200 alunos, qual tamanho de amostra necessário para estimar a proporção de alunos que são a favor da pena de morte? Use um erro amostral de 2% e índice de confiança de 95%. 7. Um estudo de saúde envolve 1000 mortes selecionadas aleatoriamente, dentre as quais 331 causadas por doenças cardíacas. a) Com os dados amostrais, construa um intervalo de confiança de 99% para a proporção de todas as mortes causadas por doenças cardíacas. 14 Página 25 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO b) Utilizando os dados amostrais como piloto, determine o tamanho da amostra necessário para estimar a proporção de todas as mortes causadas por doenças cardíacas. Admita um nível de confiança de 98%, em que o erro da estimativa não supere 1%. 8. Uma papelaria gostaria de calcular o valor médio do preço dos cartões de cumprimentos existente em seu estoque. Uma amostra aleatória de 20 cartões indica um valor médio de $1,67 e um desvio padrão de $0,32. Se o número de cartões no estoque da loja fosse igual a 300: a) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor médio de todos os cartões no estoque da loja. b) Desenvolva uma estimativa, com intervalo de confiança de 95%, do valor médio da população de todos os cartões que estão no estoque. c) Compare os resultados obtidos em (a) e (b). d) Quais seriam a respostas para (b) e (c) se a loja tivesse 500 cartões no estoque? 9. Uma concessionária de automóveis gostaria de calcular a proporção de consumidores que ainda possuem o carro que compraram 5 anos atrás. Uma amostra aleatória de 200 consumidores, selecionados a partir dos registros da concessionária de automóveis, indica que 82 consumidores ainda possuem os carros que compraram a 5 anos. Suponha que a população consiste em 4.000 proprietários: a) Desenvolva uma estimativa, com intervalo de confiança de 95%, da verdadeira proporção de clientes que ainda possuem os carros que adquiriram cinco anos atrás. b) E se a população fosse de 6.000 proprietários? 10.O gerente de um banco em uma cidade pequena gostaria de determinar a proporção de seus correntistas que recebem salários semanais. Uma amostra aleatória de 100 correntistas é selecionada, e 30 afirmam que são pagas semanalmente. Se o banco possui 1.000 correntistas: a) Desenvolva uma estimativa, com intervalo de confiança de 90%, para a verdadeira proporção de correntistas que recebem salários semanais. b) Determine o tamanho da amostra necessário para se calcular a vida útil média, em uma margem de ± 0,05, com 90% de confiança. c) Quais seriam as respostas para (a) e (b), se o banco tivesse 2.000 depositantes? 11.Observe os dados do problema do refrigerante (exercício 7 da 1ª lista de exercícios de Estimativas). Se a população consiste em 2.000 garrafas: a) Desenvolva uma estimativa, com intervalo de confiança de 95% da quantidade média de refrigerante em cada garrafa do total da população. b) Determine o tamanho da amostra necessário para se calcular a quantidade média da população, em uma margem de ±0,01, com 95% de confiança. c) Quais seriam suas respostas para (a) e (b) se a população consistisse em 1.000 garrafas? 12.Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias dos empregados de uma grande empresa. A gerência da empresa deseja ter 95% de confiança de que a média da amostra está correta, e de ± 0,05 da média real das despesas médias familiares. Um estudo-piloto indica que o desvio padrão pode ser calculado como sendo igual a $400. Que tamanho da amostra seria necessário se a companhia tivesse 3.000 empregados? 15 Página 26 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Tabela de Distribuição t de Student GL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 75% 15% 30% 1,9626 1,3862 1,2498 1,1896 1,1558 1,1342 1,1192 1,1081 1,0997 1,0931 1,0877 1,0832 1,0795 1,0763 1,0735 1,0711 1,0690 1,0672 1,0655 1,0640 1,0627 1,0614 1,0603 1,0593 1,0584 1,0575 1,0567 1,0560 1,0553 1,0547 80% 10% 20% 3,0777 1,8856 1,6377 1,5332 1,4759 1,4398 1,4149 1,3968 1,3830 1,3722 1,3634 1,3562 1,3502 1,3450 1,3406 1,3368 1,3334 1,3304 1,3277 1,3253 1,3232 1,3212 1,3195 1,3178 1,3163 1,3150 1,3137 1,3125 1,3114 1,3104 I.C. 90% 95% 96% 98% 99% Bilateral 5% 2,5% 2% 1% 0,5% Unilateral 10% 5% 4% 2% 1% 6,3137 12,7062 15,8945 31,8210 63,6559 2,9200 4,3027 4,8487 6,9645 9,9250 2,3534 3,1824 3,4819 4,5407 5,8408 2,1318 2,7765 2,9985 3,7469 4,6041 2,0150 2,5706 2,7565 3,3649 4,0321 1,9432 2,4469 2,6122 3,1427 3,7074 1,8946 2,3646 2,5168 2,9979 3,4995 1,8595 2,3060 2,4490 2,8965 3,3554 1,8331 2,2622 2,3984 2,8214 3,2498 1,8125 2,2281 2,3593 2,7638 3,1693 1,7959 2,2010 2,3281 2,7181 3,1058 1,7823 2,1788 2,3027 2,6810 3,0545 1,7709 2,1604 2,2816 2,6503 3,0123 1,7613 2,1448 2,2638 2,6245 2,9768 1,7531 2,1315 2,2485 2,6025 2,9467 1,7459 2,1199 2,2354 2,5835 2,9208 1,7396 2,1098 2,2238 2,5669 2,8982 1,7341 2,1009 2,2137 2,5524 2,8784 1,7291 2,0930 2,2047 2,5395 2,8609 1,7247 2,0860 2,1967 2,5280 2,8453 1,7207 2,0796 2,1894 2,5176 2,8314 1,7171 2,0739 2,1829 2,5083 2,8188 1,7139 2,0687 2,1770 2,4999 2,8073 1,7109 2,0639 2,1715 2,4922 2,7970 1,7081 2,0595 2,1666 2,4851 2,7874 1,7056 2,0555 2,1620 2,4786 2,7787 1,7033 2,0518 2,1578 2,4727 2,7707 1,7011 2,0484 2,1539 2,4671 2,7633 1,6991 2,0452 2,1503 2,4620 2,7564 1,6973 2,0423 2,1470 2,4573 2,7500 16 Página 27 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 17 TESTE DE HIPÓTESES Muitas vezes o pesquisador tem alguma idéia ou conjectura, sobre o comportamento de uma variável. Neste caso, o planejamento de pesquisa deve ser de tal forma que permita, com os dados amostrais, testar a veracidade de suas idéias sobre a população em estudo. Considera-se que a população seja o mundo real e as idéias sejam hipóteses de pesquisa, que poderão ser testadas por técnicas estatísticas denominadas de testes de hipóteses ou testes de significância. Neste sentido, Teste de Hipótese consiste em analisar as diferenças entre os resultados obtidos, e verificar se a hipótese levantada condiz com a realidade. Em outras palavras, o objetivo do teste estatístico de hipótese é fornecer ferramentas que nos permitam validar ou recusar uma hipótese através dos resultados da amostra. Na intenção de confirmar ou rejeitar uma hipótese, temos nominá-la (nula ou alternativa). Para escrever as hipóteses nula e alternativa, transforme a formulação verbal da alegação sobre um parâmetro populacional em uma formulação matemática. Exemplos: 1. Escreva a formulação matemática da alegação. Estabeleça as hipóteses nula e alternativa e identifique qual delas representa a alegação. (a) Uma fabrica de bateria para automóveis alega que a vida média de um determinado modelo é de 74 meses. (b) Uma estação de rádio alega que sua proporção de audiência local é maior do que 39%. • Tipos de erros Não importando qual das hipóteses representa a alegação, você começará sempre um teste de hipótese assumindo que a condição de igualdade na hipótese nula é verdadeira. Assim, quando realizar um teste de hipótese, você deve tomar uma das duas decisões: rejeitar a hipótese nula ou não rejeitar a hipótese nula. Uma vez que sua decisão baseia-se em informação incompleta (uma amostra em vez de toda a população), há sempre a possibilidade de se tomar a decisão errada. Então, quando se realiza um teste de hipótese, podem-se cometer dois tipos de erro: Erro tipo I ou Erro tipo II. Veja a Tabela. Realidade H 0 verdadeira H 0 falsa Decisão Aceitar H 0 Decisão correta Erro tipo II Rejeitar H 0 Erro tipo I Decisão Correta Observe que o erro tipo I só poderá acontecer se for rejeitado H 0 e o erro tipo II quando for aceito H 0 . Página 28 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 18 Exemplo: O limite do Departamento de Agricultura para a contaminação por salmonela em frangos é de 20%. Uma granja alega que seus frangos estão dentro do limite. Você realiza um teste de hipótese para determinar se a alegação da granja é verdadeira. Quando ocorrerão os erros do tipo I e II? Qual deles é o mais grave? • Estatística de teste: é uma estatística amostral, ou um valor baseado nos dados amostrais. Utiliza-se uma estatística de teste para tomar uma decisão sobre a rejeição da hipótese nula. Dado por x −µ zt = σ n • Região crítica: é o conjunto de todos os valores da estatística de teste que levam à rejeição da hipótese nula. • Nível de significância: é probabilidade de rejeitar a hipótese nula quando ela é verdadeira. Denota por α . • Valor crítico: é o valor, ou valores, que separa(m) a região crítica dos valores da estatística de teste que não levam à rejeição da hipótese nula. Dependem da natureza da hipótese nula, da distribuição amostral, e do nível de significância α . INTERPRETANDO UMA DECISÃO Exemplo 1. Você realiza um teste de hipótese para a alegação a seguir: Uma universidade alega que a proporção de seus estudantes graduados em 4 anos é de 82%. ( H 0 contém a afirmação original) a) Interpretar a decisão quando for rejeitada a hipótese nula . Há evidências suficientes para garantir a rejeição da hipótese de que a proporção dos estudantes da Universidade graduados em 4 anos é de 82%. b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita). Não há evidência suficiente para garantir a rejeição da afirmação de que a proporção dos estudantes da Universidade graduados em 4 anos é de 82%. Exemplo 2. Você realiza um teste de hipótese para a alegação a seguir: Uma universidade alega que a proporção de seus estudantes graduados em 4 anos é superior a 82%. ( H 0 NÃO contém a afirmação original) a) Interpretar a decisão quando for rejeitada a hipótese nula. Os dados amostrais apóiam a afirmação de que a proporção dos estudantes da Universidade graduados em 4 anos é superior 82%. b) Interpretar a decisão quando NÃO for rejeitada a hipótese nula (aceita). Não há evidência amostral para apoiar a afirmação de que a proporção dos estudantes da Universidade graduados em 4 anos é superior 82%. Quando se aceita ou rejeita uma hipótese, estamos sempre falando da hipótese nula, mesmo que esta não tenha a alegação. Página 29 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 19 Teste de hipótese quando O desvio-padrão populacional σ é conhecido Usamos a distribuição normal (Tabela z) para comparar com a estatística de teste zt : zt = x −µ σ n O desvio-padrão populacional σ é DESCONHECIDO (n pequeno) Usamos a distribuição t de Student (Tabela t) com Grau de Liberdade n − 1 para comparar com a estatística de teste tt : tt = x −µ s n Exemplo 1. Os dois registros dos últimos anos de um colégio atestam para os calouros admitidos uma nota média de 115 com desvio-padrão de 20 pontos (teste vocacional). Para testar a hipótese de que a média de uma nova turma é a mesma, tirou-se, ao acaso, uma amostra de 20 notas obtendo-se média de 118 no teste. Com um nível de significância α = 5% , faça o teste. Exemplo 2. Um empresário desconfia que o tempo médio de espera para atendimento de seus clientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou quanto tempo demoravam a serem atendidas. O resultado dessa pesquisa aparece a seguir: x = 21,8 min. e s = 1, 40 min. Teste as hipóteses usando α = 0,05 3.1. Teste de hipótese sobre uma proporção Segue os mesmos procedimentos para testes com médias, sendo que a estatística de teste é dada por zt = pˆ − p p (1 − p ) n Exemplo 1. Em um teste de gosto de consumidores, 100 bebedores regulares de Pepsi receberam amostras cegas de Coca e Pepsi; 48 deles preferiram a Coca. Ao nível de significância Página 30 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 20 de 0,05, teste a afirmação de que a Coca é preferida por 50% dos bebedores de Pepsi que participam de tais testes. Exemplo 2: Um jornal afirma que aproximadamente 25% dos adultos em sua área de circulação são analfabetos segundo os padrões governamentais. Teste essa afirmação contra a alternativa de que a verdadeira percentagem não é 25% e use um nível de significância de 5%. Uma amostra de 740 pessoas indica que apenas 20 % seriam consideradas analfabetas segundo os mesmos padrões. Atividades 1. A Farmácia X vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas no mínimo. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas. a) Teste a alegação da companhia, contra a alternativa que a duração é inferior a 400 horas, ao nível de 0,01, se o desvio padrão amostral é de 60 horas. b) Repita a questão anterior sabendo que o desvio padrão populacional é 90 horas. 2. Um fabricante de automóveis alega que seus carros tamanho-família, quando equipados com um tipo de pára-choques absorvente, podem suportar um choque de frente a uma velocidade de 10 mph, com um custo de conserto de no máximo R$ 100, Uma amostra de seis carros, examinada por um escritório independente de pesquisa, revelou um custo médio de reparo de R$ 150 por carro. O desvio padrão amostral foi de R$ 30. Admita que a distribuição dos custos de conserto seja aproximadamente normal. Há indício suficiente para rejeitar a alegação da firma, ao nível de 0,01? 3. Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender apólices de seguro de vida, se verificar que a quantia média segurada por família é inferior a R$10.000,00. Tomou-se uma amostra aleatória de 50 famílias, que acusaram seguro médio de R$9.600,00, com desvio padrão de R$1.000,00. a) Com base na evidência amostral, a alegação deve ser aceita ou rejeitada, ao nível de 0,05? b) A conclusão a que se chegou, utilizando a evidência amostral, pode estar errada? Qual seria o tipo de erro? Por quê? 4. Uma cervejaria distribui um tipo de cerveja sem álcool em garrafas que indicam o conteúdo de 940 ml. Um Instituto de pesquisa seleciona 50 dessas garrafas, mede seu conteúdo e obtém uma média amostral de 934 ml, com desvio-padrão de 22 ml. Ao nível de significância de 0,01, teste a afirmação do Instituto de que a companhia está ludibriando os consumidores. 5. O gerente de controle de qualidade de certa empresa considera que a fabricação de secretárias eletrônicas como “fora de controle” quando a taxa geral de defeitos excede 4%. O teste de uma amostra de 150 secretárias eletrônicas acusou 9 defeituosas, o que corresponde a uma porcentagem de 6% de defeitos. O gerente de produção alega tratar-se apenas de uma diferença casual, e que a produção realmente está sob controle, não sendo necessária qualquer medida corretiva. Teste a afirmação do gerente de produção, ao nível de 0,05 de significância. Página 31 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 21 6. As condições de mortalidade de uma região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 0,6. Testar essa hipótese ao nível de 2%, se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos. (R = rejeita-se H 0 ) 7. A compra de uma lavanderia operada por moedas está sendo levada em conta por um empresário. O atual proprietário declara que, nos últimos 5 anos, a receita era de $675 diários, com um desvio padrão de $75. Uma amostra de 30 dias selecionados revela uma receita diária média de $650. a) Há evidências de que a declaração do atual proprietário não seja válida, para um nível de significância de 0,01? b) Qual seria a resposta em (a) se o desvio padrão fosse de $100? 8. Suponha que o diretor de produção de uma fábrica de tecidos precise determinar se uma nova máquina está produzindo determinado tipo de tecido de acordo com as especificações do fabricante, que indicam que o tecido deve ter resistência de rompimento de pelo menos 70 libras e um desvio padrão de 3,5 libras. Uma amostra de 36 peças revela uma média da amostra igual a 69,7 libras. (Use nível de significância de 0,01) a) Há evidências de que a máquina não está atendendo às especificações, em termos da resistência de rompimento? b) Qual seria a resposta em (a) se a média da amostra fosse 69 libras? 9. O diretor pessoal de uma grande companhia de seguros está interessado em reduzir a taxa de rotatividade de funcionários no setor de processamento de dados no primeiro ano de emprego. Registros do passado indicam que 25% dos novos contratados nesta área não estão mais empregados no final de um ano. Novos e extensos métodos de treinamento são implementados para uma amostra de 150 funcionários do processamento de dados. Ao final do período de um ano, 29 desses 150 indivíduos não estão mais empregados. No nível de significância de 0,01, há evidências de que a proporção de funcionários de processamento de dados que tenham passado pelo novo treinamento e não estejam mais empregados seja diferente de 25%? 3.2. Teste para a diferença entre duas médias Caso 1: Desvios-padrão populacionais σ 1 e σ 2 conhecidos zt = x1 − x2 σ 12 n1 + σ 22 n2 Caso 2: Desvio padrão populacionais σ 1 e σ 2 desconhecidos ( n ≤ 30 ) Estatística calculada: tt = x1 − x2 2 1 2 2 s s + n1 n2 Escolher o menor grau de liberdade GL = n1 − 1 ou GL = n2 − 1 Página 32 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Hipóteses: H 0 : µ1 = µ 2 H1 : µ1 ≠ µ 2 ou H 0 : µ1 ≤ µ2 ou H1 : µ1 > µ2 22 H 0 : µ1 ≥ µ2 H1 : µ1 < µ 2 3.3. Teste para a diferença entre duas proporções populacionais p1 e p2 Estatística calculada: zt = pˆ1 − pˆ 2 p⋅q p⋅q + n1 n2 sendo p= x1 + x2 n1 + n2 e q = 1− p Exemplo: Numa pesquisa sobre possuidores de videocassete, encontrou-se 120 nas 200 casas pesquisadas do bairro X e 240 nas 500 pesquisas do bairro Y. Há diferença entre a proporção dos possuidores de videocassete nos dois bairros? Use α = 10% EXERCÍCIOS 1. Duas pesquisas independentes sobre salários em duas áreas metropolitanas muito separadas revelaram a seguinte informação sobre o salário médio de operadores de equipamento pesado: A B x 6,50/h 7,00/h s 1,50/h 1,00/h n 25 25 Pode-se concluir, ao nível de 0,05, que os salários médios sejam diferentes? 2. Uma empresa de pesquisa de opinião seleciona, aleatoriamente, 300 eleitores de Santa Catarina e 400 do Rio Grande do Sul, e pergunta a cada um deles votará ou não num determinado candidato nas próximas eleições, 75 eleitores de SC e 120 do RS responderam afirmativo. Há diferença entre as proporções de eleitores favoráveis ao candidato nesses dois estados? Use α= 5% 3. Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância, os homens e as mulheres apreciam igualmente a revista? 4. Página 33 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 23 Mais atividades: 1. A compra de uma lavanderia operada por moedas está sendo levada em conta por um empresário. O atual proprietário declara que, nos últimos 5 anos, a receita era de $675 diários, com um desvio padrão de $75. Uma amostra de 30 dias selecionados revela uma receita diária média de $650. a) Teste a hipótese de que a declaração do atual proprietário não seja válida, para um nível de significância de 0,01. b) Qual seria a resposta em (a) se o desvio padrão fosse de $100? 2. Suponha que o diretor de produção de uma fábrica de tecidos precise determinar se uma nova máquina está produzindo determinado tipo de tecido de acordo com as especificações do fabricante, que indicam que o tecido deve ter resistência de rompimento de pelo menos 70 libras e um desvio padrão de 3,5 libras. Uma amostra de 36 peças revela uma média da amostra igual a 69,7 libras. (Use nível de significância de 0,01) a) Há evidências de que a máquina não está atendendo às especificações, em termos da resistência de rompimento? b) Qual seria a resposta em (a) se a média da amostra fosse 69 libras? 3. O gerente do departamento de crédito de uma companhia de petróleo gostaria de determinar se a renda mensal média de possuidores de cartões de crédito é igual a $75. Um auditor seleciona uma amostra aleatória de 50 contas e descobre que a média é $83,40 com um desvio padrão da amostra de $23,65. Utilizando o nível de significância de 0,05, o auditor deveria concluir que há evidências de que a renda média seja diferente de $75? 4. Um fabricante de televisores declarou, no rótulo de garantia, que, no passado, não mais de 10% de seus aparelhos de televisão precisou de reparo durante os 2 primeiros anos de funcionamento. Para testar a validade dessa declaração, uma agência de testes do governo seleciona uma amostra de 100 aparelhos e descobre que 14 aparelhos necessitaram de algum reparo nos primeiro 2 anos de funcionamento. Utilizando um nível de significância de 0,01, a declaração do fabricante é válida? 5. O diretor pessoal de uma grande companhia de seguros está interessado em reduzir a taxa de rotatividade de funcionários no setor de processamento de dados no primeiro ano de emprego. Registros do passado indicam que 25% dos novos contratados nesta área não estão mais empregados no final de um ano. Novos e extensos métodos de treinamento são implementados para uma amostra de 150 funcionários do processamento de dados. Ao final do período de um ano, 29 desses 150 indivíduos não estão mais empregados. No nível de significância de 0,01, há evidências de que a proporção de funcionários de processamento de dados que tenham passado pelo novo treinamento e não estejam mais empregados seja diferente de 25%? Página 34 / 51 24 Página 35 / 51 25 Página 36 / 51 26 Página 37 / 51 27 Página 38 / 51 28 Página 39 / 51 29 Exercícios: Calcule a correlação existente entre as variáveis apresentadas: 1) Preços e Quantidades vendidas do mesmo produto verificados em vários locais de vendas: Preços (x) Quant. Vend(y) 12 41 13 22 14,5 15 15 10 12,6 44 X² Y² X.Y ∑ 2) Dados os valores x (5, 10,20, 8, 4, 6, 12 e 15) e y (27, 46,73, 40, 30, 28, 46 e 59), nesta ordem respectivamente, e supondo que x expresse os valores de aquisição de plano de saúde numa determinada empresa e y a produtividade de seus empregados, determine a correlação entre os dados. 3) Uma amostra aleatória de 10 alunos foi retirada de uma sala de 98 alunos. Deste foi verificado as notas de matemática e estatística: 8,0 7,0 10,0 6,0 7,0 9,0 3,0 8,0 2,0 Matemática 5,0 Estatística 6,0 9,0 8,0 10,0 5,0 7,0 8,0 4,0 6,0 2,0 Existe correlação entre as duas disciplinas? Qual? 4) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura Temperatura (°C) 10 15 20 25 30 Comprimento 1.003 1.005 1.010 1.011 1.014 (mm) Determine: a) O coeficiente de correlação; b) A reta ajustada a essa correlação; c) O valor estimado do comprimento da barra para a temperatura de 18°C d) O valor estimado do comprimento da barra para a temperatura de 35°C 5) Calcular a propaganda necessária para se alcançar uma venda prevista R$ 3.200,00 para 2007, sabendo-se que existe forte correlação direta entre as vendas e propaganda. Anos Vendas (x) 2002 1.500 2003 1.900 2004 2.300 2005 2.450 2006 2.700 Propag (y) 75 118 155 215 230 x.y x² Página 40 / 51 30 SÉRIES TEMPORAIS Conjunto de medidas de uma mesma grandeza, relativos a vários períodos consecutivos. A análise de dados das Séries temporais tem dois objetivos: descrever os padrões da série no passado e predizer valores futuros. PIB → trimestralmente IPC e taxa de desemprego → mensalmente Índice da Bovespa ou da Dow Jones → diário Muitas séries apresentam tendências definidas 1. Componentes de dados de séries temporais Podem ser encaradas em três componentes: - a componente tendencional; - a componente cíclica; - a componente irregular. Componente sazonal: não há quando considerados dados anuais, mas de grande importância para séries de dados trimestrais, mensais, semanais. 2. Determinação da tendência pelo cálculo de médias móveis Exemplo: considerando o PIB real de 1980 a 2000, qual a tendência móvel para 1998. Ano 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 PIB real a preços de 2000 (em milhões de reais) 678,03 661,32 669,32 665,30 713,29 767,66 816,71 840,99 863,90 904,12 837,49 846,11 841,51 882,95 934,63 974,10 1.000,02 1.032,75 1.035,00 1.043,20 1.089,69 Média móvel - 5 anos (em milhões de reais) 677,51 695,44 726,52 760,79 800,51 838,68 852,64 858,52 858,63 862,44 868,54 895,86 926,64 964,89 995,30 1.017,01 1.040,13 - Razão 0,988358 0,956657 0,981795 1,009033 1,020242 1,002757 1,013199 1,053111 0,975382 0,981073 0,968882 0,985593 1,008622 1,009538 1,004744 1,015477 0,995063 - Página 41 / 51 31 PIB A PREÇOS REAIS BASE 2000 Azul: PIB Real Vermelho: Média móvel 3. Determinação da tendência por meio de regressão Considere a série abaixo de valores de rendas anuais de pizza em uma pequena cidade: 50, 66, 81, 90, 98, 106, 115, 130, 146, 162, 177, 186, 194, 202, 211, 226, 242, 258, 273, 282, 290, 298, 307, 322, 338 Considerando a progressão dos anos x e as vendas y, podemos calcular: Coeficiente angular = 11,862 Coeficiente linear = 51,662, então y = 51,662 + 11,862x Página 42 / 51 32 Ano 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Vendas efetivas 50,00 66,00 81,00 90,00 98,00 106,00 115,00 130,00 146,00 162,00 177,00 186,00 194,00 202,00 211,00 226,00 242,00 258,00 273,00 282,00 290,00 298,00 307,00 322,00 338,00 Valor da tendência Resíduo 51,66 -1,66 63,52 2,48 75,39 5,61 87,25 2,75 99,11 -1,11 110,97 -4,97 122,83 -7,83 134,70 -4,70 146,56 -0,56 158,42 3,58 170,28 6,72 182,14 3,86 194,01 -0,01 205,87 -3,87 217,73 -6,73 229,59 -3,59 241,45 0,55 253,32 4,68 265,18 7,82 277,04 4,96 288,90 1,10 300,76 -2,76 312,63 -5,63 324,49 -2,49 336,35 1,65 Vendas de Pizzas Vendas de Pizzas com a regressão Página 43 / 51 33 Reíduo – diferença entre o valor de tendência e vendas efetivas Página 44 / 51 34 EXERCÍCIOS 1. Em certa empresa as importações de matéria prima (em milhões de toneladas), no período de 2000 a 2006, apresenta o comportamento demonstrado na tabela abaixo: Ano 2000 2001 Importações 130 120 2002 105 2003 2004 2005 100 85 80 2006 75 (a) Qual a estimativa do decréscimo anual dessas importações? Para estimar o decréscimo anual encontre a reta de regressão. (b) Para que ano espera-se que essas importações reduzam-se para 30.000.000 de toneladas? (c) Calcule a dispersão anual 2. Em uma dada região da fronteira, acredita-se que o gado alimentado em um determinado pasto tem um ganho maior que o usual. Estudos de laboratório detectaram uma substância no pasto e deseja-se verificar se ela pode ser utilizada para melhorar o ganho de peso dos bovinos. Foram escolhidos 15 bois de mesma raça e idade, e cada animal recebeu uma determinada concentração da substância X (em mg/l). O ganho de peso após 30 dias, denotado Y, foi anotado e os dados foram os seguintes (em kg): X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 Y 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 22,5 24,7 23,1 a) Calcule o coeficiente de correlação linear entre as variáveis. b) Determine o modelo de regressão linear que representa o efeito da concentração de certa substância no pasto e o ganho de peso de bovinos. c) Construa o gráfico de dispersão. d) Interprete os coeficientes a e b encontrados no item (b). Página 45 / 51 35 NÚMEROS-ÍNDICES Um jornal, por ocasião de um pleito eleitoral, publicou uma tabela com os resultados da apuração na região: CIDADES CANDIDATO CANDIDATO VOTOS VOTOS TOTAL X Y BRANCOS NULOS A 39.544 30.279 980 11.549 82.352 B 18.872 19.897 787 6.210 45.766 C 8.139 4.903 177 1.324 14.543 D 16.263 8.659 464 2.997 28.383 E 746 899 45 216 1.996 F 3.149 3.120 93 517 6.879 Números Relativos: CIDADES VOTOS BRANCOS (%) 1,19 1,72 1,22 1,63 2,36 1,35 A B C D E F Números relativos X Números absolutos 1. NÚMEROS ÍNDICES ANOS MATRÍCULA NÚMERO-ÍNDICE 1989 1.050 100,0 1990 1.150 109,5 1991 1.200 114,3 1992 1.400 133,3 1993 1.560 148,6 1994 1.700 161,9 Número-índice ou, simplesmente, índice é a relação entre dois estados de uma variável ou de um grupo de variáveis, suscetível de variar no tempo ou no espaço (ou de grupo de indivíduos para grupo de indivíduos). O índice representa, portanto, o nível de um fenômeno em relação ao nível que ele tinha num dado período (ou numa dada região) tomado como base, e é geralmente expresso em porcentagem. Os índices mais utilizados relacionam, em geral, variações de preço, de quantidade ou de valor (preço x quantidade) ao longo do tempo. Mas não somente na economia, como também nas ciências físicas, químicas, naturais e sociais (Psicologia – quociente de inteligência – QI). 2. RELATIVOS DE PREÇOS Quando queremos analisar a variação no preço (ou na quantidade e no valor) Página 46 / 51 36 p0: preço na época base pt: preço na época atual p0,t: relativo de preço q0: quantidade na época base qt: quantidade na época atual p0,t: relativo de quantidade v0: valor na época base vt: valor na época atual v0,t: relativo de valor Exemplo: Sabendo que o preço de determinado produto era de R$ 50 em 2004 e de R$ 60 em 2005, determine o relativo de preço em 2005, tomando como base o ano de 2004. (É comum a notação 2004 = 100 para indicar que o ano de 2004 é tomado como base.) 3. ELOS DE RELATIVOS Quando cada um deles é calculado tomando como base o ano anterior, são os relativos de base móvel. Fazemos uso destes para acompanhar crescimento de período a período Assim, se um bem apresentou, um período de 2001 a 2004, respectivamente os preços de R$ 240, R$ 300, R$ 360 e R$ 540, os elos relativos são: 4. RELATIVOS EM CADEIA É o índice de base fixa: todos relativos são calculados tomando como base uma determinada época. Com os dados do caso anterior teremos: Página 47 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO 5. ÍNDICES AGREGATIVOS Até agora os índices estudados servem somente para acompanhar preço de um bem só. Porém a variação nos preços exige um conjunto de bens (agregado): índice agregativo. 5.1 Índice agregativo simples Índice médio dos relativos BENS A (m) B (kg) C (l) n=3 RELATIVOS DE PREÇOS 2004 2005 100 150 100 125 100 160 ∑ = 300 ∑ = 435 Ip = 435/3 = 145% 5.2 Índice agregativo ponderado Coeficientes de ponderação, atribuindo, a cada item, a importância que lhe cabe. Várias fórmulas: de Laspeyres, de Paasche, de Fischer etc. Muito utilizados nos índices de investigação econômica. 5.2.1 Fórmula de Laspeyres ou método da época-base Página 48 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Exemplo: Considera a tabela: Bens A B C 2003 p 20 40 15 2004 q 4 3 8 p 28 56 30 q 3 3 12 5.3 Índices de preços Embora, sem respostas imediatas, para construir um índice preço devemos considerar os seguintes pontos: a) Qual o objetivo do índice? Determinar o que ele está medindo e a quem se refere. Seleção dos produtos que comporão o índice. b) Que produtos devem ser incluídos no seu cálculo? Os mais importantes e representativos. c) Quais os preços a serem incluídos no seu cálculo? Identificar o setor (atacado, varejo, ...), decidir a cotação e a forma de coleta dos preços. d) Qual o peso a ser atribuído a cada bem em particular? Depende da finalidade ou da utilidade do índice. Deve refletir a importância do bem. e) Qual a fórmula adequada? Em geral, quando se trata de índices preços, é usada a fórmula de Laspeyers, que possibilita revisões periódicas. 5.3.1 Índice de custos de vida O índice de custo de vida ou índice de preços ao consumidor é um número-índice que procura medir a variação de preços de um conjunto de bens e serviços necessários à vida do consumidor final padrão (família padrão). É evidente que devem ser considerados os preços dos bens consumidos em alimentação, vestuário, mobiliário, habitação, lazer, saúde, higiene etc., além, é claro, dos gatos com água, luz, transportes, educação e outros. 5.3.2 5.3.3 5.3.4 5.3.5 – IPC – Índice da Cesta Básica – IGP – IPC da FIPE 6. DEFLACIONAMENTO DE DADOS Aumento de preços implica baixas no poder aquisitivo. Salários nominais X Salários reais = Poder aquisitivo Onde: SR – Salários Reais St – Salários atuais IP – Índice de preço das épocas correspondentes ou deflator Página 49 / 51 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Exemplo: O salário de um professor, em dezembro de 2005, era de R$ 1.071 e o IP de dezembro de 2005, com base em novembro, era de 101,24%, o valor aquisitivo desse professor é dado por: Outro exemplo: O faturamento de uma empresa no período de 2001 a 2004 é dado pela tabela abaixo. Vamos determinar o seu faturamento atual, relativamente ao período de 2000. ANOS 2001 2002 2003 2004 FATURAMENTO (R$) 180.000 220.000 430.000 480.000 IP (2000 = 100) 140,8 291,1 362,5 410,3 FATURAMENTO A PREÇOS DE 2000 (R$) Obs.: Qualquer ano pode ser tomado por base, basta recalcular o IP (base fixa) Exercícios: 1) Dada a tabela: Quantidade de bens (2001-2004) Bens Auto-veículos (mil unid. Cimento (milhões de t) Aço (milhões de t) Petróleo bruto (milhões de m³) 2001 1.128,00 24,90 13,90 9,60 Anos 2002 1.165,20 27,20 15,20 10,60 2003 780,90 26,10 13,10 12,40 2004 859,30 25,40 12,90 15,10 a. Calcule os relativos para o bem auto-veículos, tomando 2001 = 100; b. Forme a tabela dos elos de relativos para o cimento; c. Forme a tabela dos relativos em cadeia para o aço, tomando 2002 = 100 d. Calcule os relativos para o petróleo bruto, tomando 2002 = 100 e. Represente a evolução dos índices das questões a e c, usando o gráfico em linha 2) O salário médio de determinada classe operária, em 2004, foi de R$ 1.280,00. O IP, nesse mesmo ano, era igual a 257,57 e o de 2001 era igual a 187,20, referidos ao período-base de 1992. Tomando o ano de 2001 como base, determine o salário real dessa classe operária em 2004. 3) O IP, em dado período, aumenta de 15%. Qual deve ser o aumento dos salários dos empregados de uma empresa, para que tenham um aumento real de 5%? Página 50 / 51 Exercícios complementares de correlação e regressão: 1) Prevendo necessidades gerenciais. Gestores são parte importante da base de recursos humanos de qualquer organização. Dessa forma, uma organização deveria estar tão preocupada com a previsão das necessidades futuras da gestão como está em relação a suas próprias necessidades – digamos, recursos naturais usados no processo de produção. Um procedimento comum de previsão é estruturar a relação entre vendas e o número de gestores necessários, uma vez que a demanda por gestores é o resultado de aumentos e diminuições na demanda por produtos e serviços que uma firma oferece a seus consumidores. Para desenvolver essa relação, os dados mostrados na tabela abaixo são coletados dos registros de uma firma. Unidades Gestores vendidas (y) (x) 5 10 4 11 8 10 7 10 9 9 15 10 20 11 21 17 25 19 24 21 30 22 31 25 36 30 38 30 40 31 41 31 51 32 40 30 48 32 47 32 a) Existe correlação entre as duas variáveis? Qual? Sim. r = 0,96 b) Determine a reta de ajustamento, se existir. y = 0,59x + 5,22 c) Qual a previsão do número de gestores necessários se a firma alcançar 50 unidades vendidas? y = 34,72 2) De acordo com a tabela abaixo: Página 51 / 51 3) a) Verifique a correlação existente entre a distância em km da Sede do Corpo de Bombeiros e o estrago provocado pelo incêndio em milhares de reais. R = 0,96 Forte correlação direta b) Qual a previsão de gastos em reparação dos estragos se o incêndio ocorrer a 7 km de distância da sede do Corpo de Bombeiros? y = 4,92x + 10,28 y= 44,72 c) Qual a previsão de gastos em reparação dos estragos se o incêndio ocorrer a 10 km de distância da sede do Corpo de Bombeiros? y = 59,48 d) Qual seria a distância da sede do Corpo de Bombeiros se os estragos com incêndio somaram a importância de R$ 30,4 mil reais? x = 4,09 Distância Estrago da Estação do dos Incêndio Bombeiros (y) (x) 3,4 26,2 1,8 17,8 4,6 31,3 2,3 23,1 3,1 27,5 5,5 36,0 0,7 14,1 3,0 22,3 2,6 19,6 4,3 31,3 2,1 24,0 1,1 17,3 6,1 43,2 4,8 36,4 3,8 26,1