Relatório Final da disciplina de Probabilidades e Estatística Economia Gestão Informática e Gestão Docentes: Paulo Infante (responsável) Inês Sousa Dias Ano Lectivo 2007/2008 Índice • Relatório Crítico de Leccionação • Programa detalhado e informação da disciplina • Sumários • Material de apoio às aulas • Provas de avaliação • Resultados de avaliação • Inquérito anónimo realizado aos alunos Relatório Crítico de Leccionação Estatística Aplicada à Gestão I Gestão Ano Lectivo 2007/2008 Relatório Crítico de Leccionação A unidade curricular de Estatística Aplicada à Gestão I é ministrada ao Curso de Licenciatura em Gestão. Trata-se de uma unidade curricular semestral, nível básico, sendo leccionada no 3º Semestre. Funcionou, ainda, para alguns alunos do Curso de Licenciatura em Informática e Gestão como substituição da disciplina de Probabilidades e Estatística que integra o respectivo plano de estudos. Neste ano lectivo o programa foi inteiramente cumprido e podemos dizer que os objectivos inicialmente propostos foram amplamente atingidos. Todo o material de apoio foi colocado à disposição dos alunos na plataforma Moodle. Para além de diversas informações também se disponibilizavam os sumários das aulas. Esta é a primeira unidade curricular da área de Estatística do curso de Gestão e tem como suporte de base, em termos teóricos e metodológicos, alguns conceitos de Estatística Descritiva e de Introdução às Probabilidades leccionados no Ensino Secundário. Em alguns pontos foi possível fazer apenas uma revisão de conhecimentos, mas noutros a matéria foi dada como se fosse a primeira vez. Tal permitiu uma consolidação de conhecimentos em pontos que julgamos muito importantes numa primeira fase da análise de dados e permitiu também consolidar interpretações e desenvolver o espírito crítico. No que concerne à sua carga horária semanal, esta unidade curricular tem 4 horas teórico-práticas, correspondendo-lhe 5,5 ECTS. Com esta carga horária não é possível uma exploração muito específica das potencialidades de tratamento estatístico com a utilização de um pacote de software. Refira-se, com base em alguma experiência que temos do ensino deste tipo de matérias, que esta é uma unidade curricular difícil para os alunos, os quais revelam grandes dificuldades na compreensão de alguns conceitos. Tal é também em vários casos explicado pela sua fraca formação de base em matemática e pela falta de sentido crítico. Numa unidade curricular deste tipo fica clara a deficiência de muitos alunos em saber pensar, o que do nosso ponto de vista se tem vindo a acentuar nos últimos anos. Como referimos, o programa desta unidade curricular inclui também a utilização efectiva de software estatístico optando-se pelo pacote SPSS e por um pouco da folha de cálculo Excel. A propósito, gostaríamos de salientar que as aulas este ano foram dadas numa sala com melhores condições do que as de anos anteriores. Apesar disso, o elevado número de alunos por cada turma condiciona um pouco o normal desenvolvimento das aulas em que se faz uso do computador. Tentámos implementar na unidade curricular as ideias subjacentes no Processo de Bolonha, nomeadamente, num maior trabalho realizado pelo aluno e um maior acompanhamento da matéria leccionada, bem como numa maior taxa de assistência às aulas. Procurámos, sempre que possível, quer com trabalhos realizados em casa, quer com exercícios sugeridos na sala de aula, que fossem os alunos a dinamizar as aulas práticas. Fomentou-se as dúvidas carteira a carteira e a resolução do exercício individualmente pelo aluno. Durante todo o semestre houve a preocupação de manter as turmas ao mesmo nível, resolvendo-se os mesmos exercícios em cada aula, de forma a ter turmas homogéneas e a que alguns alunos pudessem circular entre turmas diferentes por dificuldades de horário, apesar dos docentes serem diferentes. Os alunos podiam optar por Avaliação Contínua ou por Avaliação por Exame Final. No sistema de Avaliação Contínua foram realizadas três provas de avaliação sendo que a nota mínima para transitar entre frequências foi fixada em 7 valores. Por outro lado, exigiu-se a presença em 70% das aulas aos alunos neste regime. Relativamente ao regime de Avaliação por Exame Final, este consistiu na realização de um exame na época normal e dum exame em época de recurso. Apesar de termos disponibilizado um horário para, de uma forma complementar e menos formal, esclarecer dúvidas e aprofundar matérias, a verdade é que a grande maioria dos alunos apareceram apenas nos dias que antecederam cada prova de avaliação. Contudo, registámos algum recurso ao e-mail para esclarecimento de dúvidas, o que facilitou o nosso contacto com os alunos mesmo fora da data de realização das frequências e exames. Mas, também por esta via, o maior número de questões surgiram junto à data de realização das provas de avaliação. O trabalho desenvolvido pelos alunos fora das aulas revelou-se novamente um aspecto muito importante e fundamental não só para obter aprovação à unidade curricular, mas também para a obter com uma nota razoável. E pensamos ter sido uma das razões principais pela discrepância entre a taxa de aprovações verificada nos dois sistemas de Avaliação à semelhança do que tinha acontecido no ano anterior. O número de alunos que assistiram às aulas manteve-se aproximadamente constante ao longo do semestre e consideravelmente superior ao número de alunos que consideramos avaliáveis. Note-se que não notámos grandes quebras sazonais de assistência, que acontecem em períodos de maior número de provas de avaliação. Pensamos que tal é revelador de termos conseguido motivar os alunos para a necessidade de assistência às aulas e termos incutido o interesse pela unidade curricular. Tal revela também a empatia entre alunos e docentes. Num inquérito anónimo realizado aos alunos, mais de 95% dos alunos que responderam ao inquérito (n=43) avaliaram globalmente os docentes com notas de Bom ou Muito Bom. Antes de apresentarmos os resultados finais gostaríamos de salientar que mais de 75% dos alunos pontuaram com notas de Bom ou Muito Bom a correspondência entre conhecimentos avaliados e matéria leccionada. Relativamente aos resultados finais, se tivermos como referência o número de inscritos na unidade curricular (n=109 EAGI +9 PE), a percentagem de aprovações foi igual a 39,3%. Caso tenhamos como referência o número de alunos que compareceram a toda a avaliação contínua e/ou a algum dos exames, o que nós designamos por alunos avaliáveis (n=61), a percentagem de aprovações foi igual a 75,4%. Pensamos que uma boa coordenação entre os docentes é essencial para uma troca sistemática de informações acerca das aulas, para a rápida resolução de algumas questões que surjam durante o semestre e para o bom acompanhamento dos alunos. No inquérito de avaliação do docente e disciplina mais de 90% dos alunos pontua com notas de Bom e Muito Bom a coordenação entre os docentes. Tal mostra ser possível que unidades curriculares com aulas teórico-práticas sejam leccionadas por mais do que um docente sem se registarem hiatos de leccionação. Programa detalhado e informação da unidade curricular • ECONOMIA (3º semestre), GESTÃO (3º semestre; funciona também para os inscritos em Estatística I), INFORMÁTICA E GESTÃO (3º semestre). • Carga horária: 3 T + 3 P • 6 ECTS • Docentes: Paulo Infante (Responsável) – [email protected] Inês Sousa Dias – [email protected] • Todas as informações relativas à disciplina podem ser consultadas através do link: http://www.ensino.uevora.pt/pe_eg OBJECTIVOS Esta disciplina fornece um conjunto de conceitos e métodos que visam, por um lado, permitir que os alunos sejam capazes, através da sua correcta aplicação, de interpretar e analisar dados amostrais e, por outro lado, inferir conclusões tendo presente o carácter probabilístico que lhes está associado. Para além do domínio de noções fundamentais da teoria das Probabilidades, incluindo as distribuições de probabilidade mais utilizadas, os alunos deverão ser capazes de, consoante a natureza dos dados e a situação experimental, aplicar as técnicas apropriadas à análise dos dados e interpretar os resultados de uma forma crítica. Os alunos deverão ainda ser capazes de utilizar o software estatístico SPSS. ATENDIMENTO AOS ALUNOS • Paulo Infante Terça-feira: 15h-16h • / Qinta-feira: 9h30m -10h30m Inês Sousa Dias Terça-feira: 10h30m -12h30m ¾ Os docentes apresentam disponibilidade total para responder a qualquer dúvida por e-mail. AVALIAÇÃO De acordo com uma Directiva do Conselho de Departamento de Matemática, todas as disciplinas leccionadas o limite mínimo de sessões presenciais para o aluno obter aprovação numa disciplina de licenciatura leccionada pelo Departamento de Matemática è de 70%. 1. Avaliação Contínua a. O regime de avaliação contínua consiste na realização de 3 Frequências com a duração de 2 horas cada. b. A primeira Frequência a realizar em 10 de Novembro de 2007. c. A segunda Frequência a realizar em 7 de Dezembro de 2007. d. A terceira Frequência a realizar em 12 de Janeiro de 2008. e. A matéria para avaliação será definida nas aulas uma semana antes da data prevista para a realização das frequências. f. Em cada frequência o aluno(a) terá que ter uma nota superior ou igual a 7 valores. Caso a nota seja inferior a 7 valores em alguma frequência, o aluno(a) opta automaticamente pelo regime de avaliação por Exame Final e caso a nota seja inferior a 7 valores na terceira Frequência o aluno reprova. g. A nota final (NF) será a média aritmética das notas obtidas nas 3 frequências. h. Para obter aprovação à unidade curricular a nota final (NF) deverá ser igual ou superior a 9.5 valores e a nota de cada frequência igual ou superior a 7 valores. i. A apreciação do desempenho do aluno durante as aulas poderá, se daí resultar benefício para o aluno, alterar a nota final. j. Caso o aluno(a) não realize uma das frequências opta automaticamente pelo regime de avaliação por Exame Final. 2. Exame Final a. O regime de avaliação por Exame Final, em época normal, consiste na realização de uma chamada com a duração de 3 horas. b. O exame de época normal realizar-se-á no dia 16 de Janeiro de 2008 e em época de recurso no dia 29 de Janeiro de 2008. c. A nota final será a da prova de exame e deverá ser igual ou superior a 9.5 valores para obter aprovação à disciplina. d. A matéria para avaliação será toda aquela leccionada durante o semestre. e. O Exame de Época Especial, com a duração de 3 horas, realizar-se-á em 17 de Setembro de 2008. OBSERVAÇÕES: ¾ As Frequências e os Exames são provas sem consulta, podendo os alunos utilizar um formulário de apoio e tabelas estatísticas fornecidos para o efeito. ¾ Os alunos podem utilizar máquina de calcular (pessoal e intransmissível). PROGRAMA Cap I – Introdução Cap. 2 – Estatística Descritiva 2.1. Distribuições de frequência 2.2. Medidas de Localização 2.3. Medidas de Dispersão 2.4. Medidas de Assimetria e Achatamento 2.5. Medidas de Concentração Cap. 3 – Introdução às Probabilidades e Probabilidades Condicionais 3.1. Conceitos de Probabilidade 3.2. Experiências aleatórias e acontecimentos 3.3. Definição axiomática de probabilidade 3.4. Probabilidade condicional e independência 3.5. Teorema da probabilidade total 3.6. Teorema de Bayes Cap. 4 – Variáveis Aleatórias Unidimensionais e Bidimensionais 4.1. Variáveis aleatórias discretas 4.1.1. Função massa de probabilidade 4.1.2. Função distribuição 4.2. Variáveis aleatórias contínuas 4.2.1. Função densidade de probabilidade 4.2.2. Função distribuição 4.3. Esperança matemática 4.4. Variância e desvio padrão 4.5. Momentos 4.6. Distribuições conjuntas e marginais 4.7. Distribuições condicionais 4.8. Independência entre variáveis aleatórias 4.9. Covariância e coeficiente de correlação Cap. 5 – Principais Distribuições de Probabilidade 5.1. Distribuição de Bernoulli 5.2. Distribuição Binomial 5.3. Distribuição de Poisson 5.4. Distribuição Geométrica 5.5. Distribuição Uniforme 5.6. Distribuição Exponencial 5.7. Distribuição Normal 5.8. Distribuição qui-quadrado, t-student e F de Fisher-Snedecor. 5.9. Lei dos grandes números 5.10. Teorema do limite central Cap. 6 – Introdução à Amostragem 6.1. Noção de estatística 6.2. Distribuições amostrais 6.2.1. Distribuição amostral de médias 6.2.2. Distribuição amostral de variâncias e de razão de variâncias 6.2.3. Distribuição amostral de diferença de médias 6.2.4. Distribuição amostral de proporções 6.2.5. Distribuição amostral de diferença de proporções Cap. 7 – Estimação Pontual e Intervalos de Confiança 7.1. Noção de estimador e de estimativa 7.2. Estimação pontual 7.2.1. Propriedades dos estimadores pontuais 7.2.2. Método dos momentos 7.2.3. Método da máxima verosimilhança 7.3. Estimação por intervalos 7.3.1. Intervalo de confiança da média 7.3.2. Intervalo de confiança da variância e da razão de variâncias 7.3.3. Intervalo de confiança da diferença de médias 7.3.4. Intervalo de confiança de proporções 7.3.5. Intervalo de confiança de diferença de proporções Cap. 8 – Testes de Hipóteses 8.1. Hipótese nula e hipótese alternativa 8.2. Região de aceitação e de rejeição 8.3. Erros tipo I e tipo II 8.4. Nível de significância 8.5. Testes bilaterais e unilaterais 8.6. Potência de um teste 8.7. Testes de médias 8.8. Testes de variâncias e comparação de variâncias 8.9. Testes de diferença de médias 8.10. Testes de proporções 8.11. Testes de diferença de proporções Cap. 9 – Testes Não Paramétricos 9.1. Testes de ajustamento e de independência 9.1.1. Teste do qui-quadrado como teste de ajustamento 9.1.2. Teste de Kolmogorov-Smirnov 9.1.3. Tabelas de contingência 9.2. Outros testes não paramétrico Cap. 10 – Correlação e Regressão Linear e Não-Linear Simples 10.1. Noção de correlação e de regressão 10.2. Diagrama de dispersão 10.3. Regressão linear e não linear 10.4. Método dos mínimos quadrados 10.5. Coeficiente de determinação e coeficiente de correlação 10.6. Testes de hipóteses dos coeficientes de regressão 10.7. Predição de novas observações OSERVAÇÕES: ¾ Para as aulas práticas haverá folhas de exercícios visando uma diversidade de exemplos de aplicação, sendo os alunos aconselhados a resolver, para além destes, outros exercícios de livros apresentados na Bibliografia. ¾ Parte do estudo da Estatística Descritiva e Introdução às Probabilidades foi iniciado no decurso do Ensino Secundário, pelo que se pressupõe o conhecimento destes conteúdos pelos alunos, sendo feita uma revisão de conhecimentos em alguns dos pontos já anteriormente abordados no ensino secundário. BIBLIOGRAFIA Murteira, B. J. F.; Silva Ribeiro, C.; Andrade e Silva, J.; Pimenta, C. (2001) – Introdução à Estatística, McGraw-Hill. OUTRA BIBLIOGRAFIA Berenson, M. L.; Levine, D. M.; Krehbiel, T. C. (2001) – Basic Business Statistics: Concepts and Applications, 5th Ed., Prentice Hall. Carlson, W. L.; Thorne, B. (1996) – Applied Statistical Methods: For Business, Economics, and the Social Sciences, Prentice Hall. D’Hainault, L. (1990) – Conceitos e Métodos da Estatística, Uma Variável a uma Dimensão, Vol I, Fundação Calouste Gulbenkian. D’Hainault, L. (1992) – Conceitos e Métodos da Estatística, Duas ou Três Variáveis a Duas ou Três Dimensões, Vol II, Fundação Calouste Gulbenkian. Galvão de Mello, F. (2000) – Probabilidades e Estatística, Conceitos e Métodos Fundamentais, Vol I, 2ª Ed., Escolar Editora. Galvão de Mello, F. (1997) – Probabilidades e Estatística, Conceitos e Métodos Fundamentais, Vol II, Escolar Editora. Guimarães, R.C.; Cabral, J. A. S. (1998) – Estatística, 2º Ed., McGraw-Hill. Hines, W. W.; Montgomery, D. C. (1990) – Probability and Statistics in Engineering and Management Science, 3rd Ed., John Wiley. Maroco, J. (2003) – Análise Estatística - Com Utilização do SPSS, Edições Sílabo. Martins, M. E. G. (2000) – Introdução às Probabilidades e à Estatística, SPE. Mendenhall, W.; Scheaffer, R. L.; Wackerly, D. D. (2001) – Mathematical Statistics with Applications, 6th Ed., Duxbury Press. Mood, A. M.; Graybill, F. A.; Boes, D. C. (1974) – Introduction to the Theory of Statistics, 3rd Ed. McGraw-Hill International Editions. Murteira, B. (1990) – Probabilidades e Estatística, Vol I e II, 2ª Ed., McGraw-Hill. Newbold, P.; Carlson, W. L.; Thorne, B. (2002) – Statistics for Business and Economics, Pearson Higher Education. Pestana, D. D.; Velosa, S. F. (2002) – Introdução à Probabilidade e à Estatística, Fundação Calouste Gulbenkian. Pereira, A. (2003) – SPSS - Guia Prático de Utilzação, 4ª Ed., Edições Sílabo. Pinto, J. C. C.; Curto, J. J. D. (2000) – Estatística para Economia e Gestão, Edições Sílabo. Ross, S. M. (2000) – Introduction to Probability and Statistics for Engineers and Scientists, Academic Press. Sumários Aulas Teórico-Práticas Aula número 1 do dia 18/09/2007 (turma - C e D): por Paulo Infante Sumário: Apresentação genérica do programa e da Bibliografia. Considerações gerais sobre o modo de funcionamento das aulas. Definição do método de avaliação da disciplina. Marcação das datas dos testes e do horário de atendimento dos alunos. Considerações genéricas sobre as Probabilidades e a Estatística. Conceito de população e de amostra. Tipos de dados estatísticos. Variáveis discretas e contínuas. Noção de frequência absoluta, frequência relativa e de frequências acumuladas. Tábua de distribuição de frequências. Aula número 1 do dia 18/09/2007 (turma - A e B): por Inês Dias Sumário: Apresentação genérica do programa e da bibliografia. Considerações sobre o modo de funcionamento das aulas. definição do método de avaliação da disciplina. Marcação das datas dos testes e do horário de atendimento aos alunos. Considerações gerais sobre probabilidade e estatística. Conceito de população e amostra. Dados estatísticos; variáveis discretas e contínuas. Noções de frequência absoluta e relativa simples e acumulada. Tabua de frequências. Aula número 2 do dia 20/09/2007 (turma - C e D): por Paulo Infante Sumário: Tábua de distribuição de frequências com dados discretos. Exemplo de aplicação. Interpretação dos valores das frequências. Diagrama de barras e diagrama integral. Medidas de localização: média, moda e mediana. Quantil de ordem p: quartis, decis e percentis. Exemplos de aplicação com interpretação dos valores obtifdos. Exercício com variáveis discretas. Amplitude inter-quartis. Barreiras Internas e Barreiras Externas. Noção de outlier. Caixa-de bigodes. Exemplo de aplicação. Aula número 2 do dia 20/09/2007 (turma - A e B): por Inês Dias Sumário: Medidas de localização: média , mediana e moda; Quantil de ordem p: quartis, decis e percentis. Amplitude inter-quartis, barreiras internas e externas. Noção de outlier. Caixa de Bigodes. Exercicio de aplicação. Aula número 3 do dia 25/09/2007 (turma - A e B): por Inês Dias Sumário: Resolução de um exercicio exercicio com esboço de caixa de bigodes. Medidas de dispersão: amplitude amostral, amplitude inter-quartil, variância, desvio padrão e coeficiente de variação. Noçao de dispersão absoluta e dispersão relativa. Medidas de assimetria; Noção de assimetria; comparação entre média, mediana e moda; grau de assimetria de Pearson e Coeficiente de assimetria de Bowley. Medidas de achatamento; Noção de achatamento; Coeficiente percentil de curtose. Diagrama de Caule-e-folhas. Exemplos e exercicios de aplicação. Aula número 3 do dia 25/09/2007 (turma - C e D): por Paulo Infante Sumário: Exercício com esboço e interpretação de caixas-de-bigodes. Medidas de dispersão: noção de dispersão, amplitude, amplitude inter-quartis, variância e desvio padrão. Noção de dispersão absoluta e de dispersão relativa: coeficiente de variação. Exemplo exercício de aplicação. Medidas de Assimetria: noção de assimetria; comparação entre media, mediana e moda; grau de assimetria de Pearson; coeficiente de assimetria de Bowley. Medidas de achatamento: noção de achatamento, coeficiente percentil de curtose. Aula número 4 do dia 27/09/2007 (turma - A e B): por Inês Dias Sumário: Introdução ao SPSS. Análise descritiva de dados usando o SPSS (Medidas de localização, dispersa, assimetria e achatamento, graficos de barras e caixa com bigodes). Interpretação de outputs. Agrupamento em classes. Aula número 4 do dia 27/09/2007 (turma - C e D): por Paulo Infante Sumário: Introdução ao SPSS. Análise descritiva de dados usando o SPSS. Interpretação critica de outputs. Agrupamento em classes. Representações gráficas. Aula número 5 do dia 02/10/2007 (turma - A e B): por Inês Dias Sumário: Momentos ordinários e momentos centrais. Coeficiente de assimetria de Fisher e coeficiente de curtose. Agrupamento de dados e formação de classes. Histograma, poligono de frequências e polígono integral. Calculo de medidas de localização e dispersão para dados agrupados. Exemplos e exercicios de aplicação. Aula número 5 do dia 02/10/2007 (turma - C e D): por Paulo Infante Sumário: Momentos ordinários e momentos centrais. Coeficiente de assimetria de Fisher e coeficiente de curtose. Agrupamento de dados e formação de classes: algumas considerações e exemplos. Histograma, poligono de frequências e polígono integral. Calculo de medidas de localização e dispersão para dados agrupados. Exemplos e exercicios de aplicação com interpretação de resultados. Aula número 6 do dia 04/10/2007 (turma - C e D): por Paulo Infante Sumário: Noção de concentração. Curva de Lorentz e índice de Gini. Interpretação. Exemplos e exercícios de aplicação. Histograma no caso em que as classes têm diferentes amplitudes. Exercício de aplicação. Aula número 6 do dia 04/10/2007 (turma - A e B): por Inês Dias Sumário: Medidas de concentração: Curva de Lorenz; Indice de Gini. Interpretação. Dados Contínuos; classes de diferente amplitude. Exemplos e exercícios de aplicação. Aula número 7 do dia 09/10/2007 (turma - A e B): por Inês Dias Sumário: Correcção de um exercício de estatística descritiva. Noção de experiência aleatória, espaço amostra, acontecimento elementar e acontecimento. Algebra d e acontecimentos. Noção de acontecimentos disjuntos ou incompatíveis. Definições de probabilidades: Clássica (Laplace), frequencista e subjectiva. Exemplos. Axiomática de Kolmogorov. Algumas propriedades da probabilidade. Regra da adição. Noção de probabilidade condicional. Regra das probabilidades compostas. Conceito de independencia de acontecimentos. Exemplos de aplicação. Exercício. Aula número 7 do dia 09/10/2007 (turma - C e D): por Paulo Infante Sumário: Noção de experiência aleatória, espaço amostra, acontecimento elementar e acontecimento. Algebra de acontecimentos. Noção de acontecimentos disjuntos ou incompatíveis. Definições de probabilidades: Clássica (Laplace), frequencista e subjectiva. Exemplos. Axiomática de Kolmogorov. Algumas propriedades da probabilidade. Regra da adição. Noção de probabilidade condicional. Fórmula das probabilidades compostas. Conceito de independencia de acontecimentos. Exemplos de aplicação. Exercícios. Aula número 8 do dia 11/10/2007 (turma - A e B): por Inês Dias Sumário: Resolução do exercício para casa. Regra da multiplicação. Independência vs incompatibilidade. Exemplos e exercícios de aplicação. Teorema da Probabilidade Total. Teorema de Bayes. Exemplos e exercícios de aplicação. Aula número 8 do dia 11/10/2007 (turma - C e D): por Paulo Infante Sumário: Continuação de um exercício da aula anterior. Independência vs incompatibilidade. Exemplos e exercícios de aplicação. Teorema da Probabilidade Total. Exemplos de aplicação. Teorema de Bayes. Exemplos de aplicação. Exercício. Aula número 9 do dia 16/10/2007 (turma - A e B): por Inês Dias Sumário: Exercicios de aplicação do teorema da probabilidade total e do teorema de Bayes. Conceito de variável aleatória. Exemplos. Variáveis aleatórias discretas. Função de probabilidade. Função distribuição. Representação gráfica. Propriedades da função distribuição de uma variável aleatória discreta. Conceito de Esperança Matemática. Propriedades da Esperança Matemática. Conceito de variância de uma variável aleatória. Propriedades da variância. Desvio padrão. Exemplo. Exercicio de aplicação. Aula número 9 do dia 16/10/2007 (turma - C e D): por Paulo Infante Sumário: Exercicios de aplicação do teorema da probabilidade total e do teorema de Bayes. Conceito de variável aleatória. Exemplos. Variáveis aleatórias discretas. Função massa de probabilidade. Função distribuição. Representação gráfica. Propriedades da função distribuição. Conceito de Esperança Matemática. Propriedades da Esperança Matemática. Conceito de variância de uma variável aleatória. Propriedades da variância. Desvio padrão. Exercicio de aplicação. Aula número 10 do dia 18/10/2007 (turma - C e D): por Paulo Infante Sumário: Exercício sobre variáveis aleatórias discretas. Variáveis aleatórias contínuas: função densidade de probabilidade, função de distribuição e propriedades, esperança matemática e variância. Exercício de aplicação. Aula número 10 do dia 18/10/2007 (turma - A e B): por Inês Dias Sumário: Resolução de exercícios sobrea variáveis aleatórias discretas. Variáveis aleatórias Contínuas: função densidade de probabilidade, função de distribuição, esperança matemática e variância. Exemplo. Aula número 11 do dia 23/10/2007 (turma - A e B): por Inês Dias Sumário: Resolução de exercicios de variáveis aleatórias contínuas. Coeficiente de variação. Momentos. Coeficiente de assimetria e de achatamento. Variáveis aleatórias bidimensionais discretas: funçãode probabilidade conjunta e função distribuição.Distribuições marginais. Independência entre variáveis aleatórias. Distribuições condicionadas. Exemplo de aplicação. Variáveis aleatórias bidimensionais contínuas: função densidade de probabilidade conjunta e função distribuição. Funções densidade marginais. Aula número 11 do dia 23/10/2007 (turma - C e D): por Paulo Infante Sumário: Resolução de exercicios de variáveis aleatórias contínuas. Coeficiente de variação. Momentos. Coeficiente de assimetria e de achatamento. Variáveis aleatórias bidimensionais discretas: função de probabilidade conjunta e função distribuição. Distribuições marginais. Independência entre variáveis aleatórias. Distribuições condicionais. Exemplo de aplicação. Variáveis aleatórias bidimensionais contínuas: função densidade de probabilidade conjunta. Funções densidade marginais. Aula número 12 do dia 25/10/2007 (turma - C e D): por Paulo Infante Sumário: Resolução de exercícios com variáveis aleatórias bidimensionais discretas. Conceito de covariância e de correlação. Coeficiente de correlação linear. Exemplo de aplicação no caso de variáveis bidimensionais discretas. Distribuição Uniforme. Exemplos e exercícios de aplicação. Aula número 12 do dia 25/10/2007 (turma - A e B): por Inês Dias Sumário: Exercícios com variáveis aleatórias bidimensionais discretas. Conceito de covariância e de correlação. Coeficiente de correlação linear. Exemplo variáveis bidimensionais discretas. Distribuição Uniforme. Exemplos. Exercícios. Aula número 13 do dia 30/10/2007 (turma - C e D): por Paulo Infante Sumário: Distribuição de Bernoulli. Exemplos. Distribuição Binomial. Exemplos. Referência à distribuição Hipergeométrica. Distribuição Geométrica. Exemplos. Exercícios de aplicação. Aula número 13 do dia 30/10/2007 (turma - A e B): por Inês Dias Sumário: Distribuição de Bernoulli e distribuição Binomial. Exemplos. Referência à distribuição Hipergeométrica. Distribuição Geométrica. Exemplos. Exercícios. Aula número 14 do dia 06/11/2007 (turma - A e B): por Inês Dias Sumário: Distribuição de Poisson. Exemplos. Distribuição Exponencial. Exemplos. Exercícios de Aplicação. Aula número 14 do dia 06/11/2007 (turma - C e D): por Paulo Infante Sumário: Distribuição de Poisson. Aproximação da distribuição Binomial pela distribuição de Poisson. Exemplos e exercícios de aplicação. Distribuição exponencial. Falta de memória da distribuição exponencial. Exemplos e exercícios de aplicação. Aula número 15 do dia 08/11/2007 (turma - C e D): por Paulo Infante Sumário: Algumas considerações sobre a matéria da primeira frequência. Exercícios. Aula número 15 do dia 08/11/2007 (turma - A e B): por Inês Dias Sumário: Distribuição exponencial (cont). Exercício. Aula de dúvidas. Resolução de exercícios Aula número 16 do dia 13/11/2007 (turma - C e D): por Paulo Infante Sumário: Distribuição Normal. Variável aleatória normal reduzida. Leitura e utilização da tabela da distribuição normal. Quantis da distribuição normal. Exemplos e exercícios de aplicação. Aula número 16 do dia 13/11/2007 (turma - A e B): por Inês Dias Sumário: Distribuição Normal. Distribuição normal padrão. Interpretação da tabela da distribuição normal. Quantis da distribuição normal. Exemplos e exercícios de aplicação. Aula número 17 do dia 15/11/2007 (turma - A e B): por Inês Dias Sumário: Soma de variáveis aleatórias normais independentes. Teorema do Limite central. Distribuição amostral de média. Aproximação da distribuição binomial pela distribuição normal. Aproximação da distribuição Poisson pela distribuição normal. Correcção de continuidade. Exemplos e exercícios de aplicação. Aula número 17 do dia 15/11/2007 (turma - C e D): por Paulo Infante Sumário: Soma de variáveis aleatórias normais independentes. Teorema do Limite Central. Exemplos de aplicação. Distribuição amostral de médias. Aproximação da Binomial pela Normal. Aproximação da Poisson pela Normal. Exemplos e exercícios de aplicação. Aula número 18 do dia 20/11/2007 (turma - A e B): por Inês Dias Sumário: Noção de estatística, estimador e estimativa. Propriedades dos estimadores. Exemplos e exercícios de aplicação. Aula número 18 do dia 22/11/2007 (turma - C e D): por Paulo Infante Sumário: Noção de estatística, estimador e estimativa. Propriedades dos estimadores: estimadores não enviesados, eficientes e consistentes. Erro quadrático médio. Exemplos e exercícios de aplicação. Aula número 19 do dia 22/11/2007 (turma - A e B): por Inês Dias Sumário: Método dos momentos e método da máxima verosimilhança. Exemplos e exercícios de aplicação. Aula número 19 do dia 26/11/2007 (turma - C e D): por Paulo Infante Sumário: Método dos momentos e método da máxima verosimilhança. Exemplos e exercícios de aplicação. Aula número 20 do dia 27/11/2007 (turma - A e B): por Inês Dias Sumário: Exercicio de aplicação. Aula número 20 do dia 27/11/2007 (turma - C e D): por Paulo Infante Sumário: Resolução de exercícios sobre estimação pontual. Aula número 21 do dia 29/11/2007 (turma - A e B): por Inês Dias Sumário: Estimação intervalar: precisão vs confiança. Intervalo de confiança para a média quando o desvio padrão é conhecido. Conceito de erro padrão da estimativa. Exemplos. Distribuição t-student. Quantis de probabilidade. Intervalo de confiança para a média quando o desvio padrão é desconhecido. Exemplo. Exercícios de aplicação. Aula número 21 do dia 29/11/2007 (turma - C e D): por Paulo Infante Sumário: Estimação intervalar: precisão vs confiança. Intervalo de confiança para a média quando o desvio padrão é conhecido. Conceito de erro padrão da estimativa. Exemplos e exercícios de aplicação. Distribuição t-student. Quantis de probabilidade. Intervalo de confiança para a média quando o desvio padrão é desconhecido. Exemplo de aplicação. Aula número 22 do dia 04/12/2007 (turma - C e D): por Paulo Infante Sumário: Exercícios sobre intervalos de confiança para a média com desvio padrão desconhecido. Distribuição amostral da proporção. Intervalos de confiança para proporções. Erro máximo da amostra. Exemplos e exercícios de aplicação. Aula número 22 do dia 04/12/2007 (turma - A e B): por Inês Dias Sumário: Estimação Intervalar (cont.) Intervalos de confiança para a média. Exercícios de aplicação. Distribuição amostral para a proporção. Intervalos de confiança para a proporção. Noção de ero máximo de estimativa. Exemplo. Exercícios de aplicação. Aula número 23 do dia 06/12/2007 (turma - A e B): por Inês Dias Sumário: Revisões Revisões da matéria dada. Considerações sobre a 2ª frequância. Aula número 23 do dia 06/12/2007 (turma - C e D): por Paulo Infante Sumário: Exercícios de revisão e algumas considerações sobre a matéria dada. Aula número 24 do dia 11/12/2007 (turma - A e B): por Inês Dias Sumário: Estimação Intervalar (cont.) Distribuição amostral da variância. Distribuição do Qui-quadrado. Exemplo. Intervalos de confiança para a variância. Distribuição t-Student. Distribuição amostral do máximo e do mínimo da amostra. Exemplo. Distribuição amostral para a diferença de médias e intervalos de confiança para a diferença de médias com variâncias conhecidas e desconhecidas mas iguais. Exemplos. Aula número 24 do dia 11/12/2007 (turma - C e D): por Paulo Infante Sumário: Distribuição amostral da variância. Distribuição do Qui-quadrado. Exemplo. Intervalos de confiança para a variância. Distribuição t-Student. Distribuição amostral do máximo e do mínimo da amostra. Exemplo. Distribuição amostral para a diferença de médias. Intervalos de confiança para a diferença de médias com variâncias conhecidas e desconhecidas mas iguais. Exemplos de aplicação. Aula número 25 do dia 13/12/2007 (turma - A e B): por Inês Dias Sumário: Estimação Intervalar. Testes de Hipóteses. Resolução de um exercício de aplicação de IC para a diferença de médias. Distribuição amostral para a razão de variâncias. Distribuição F-Snedecor e suas propriedades; consulta da tabela. Exemplo. Tetes de hipótese: Erros do Tipo I e do Tipo II; hipótese nula e hipótese alternativa. Passos a seguir para efectuar um teste de hipóteses. Exemplo. Noção de p-value. Exercício de aplicação. Aula número 25 do dia 13/12/2007 (turma - C e D): por Paulo Infante Sumário: Distribuição F de Snedecor. Quantis de probabilidade e leitura da tabela. Distribuição amostral da razão de variâncias. Introdução aos tetes de hipóteses: hipótese nula e hipótese alternativa; erro de 1ª espécie e erro de 2ª espécie; teste unilateral e teste bilateral; nível de significância e região crítica; valor de prova. Exemplos de aplicação. Testes de hipótese para a média com desvio padrão conhecido. Exemplos e exercícios de aplicação. Aula número 26 do dia 18/12/2007 (turma - A e B): por Inês Dias Sumário: Testes de Hipóteses. Potência do teste. Dualidade entre testes de hipótese e Intervalos de confiança. Exemplos. Resolução de exercícios. Aula número 26 do dia 18/12/2007 (turma - C e D): por Paulo Infante Sumário: Testes de Hipoteses. Conceito de potncia de um teste. Dualidade entre testes de hipóteses e intervalos de confiança. Exemplos de aplicação. Aula número 27 do dia 20/12/2007 (turma - C e D): por Paulo Infante Sumário: Testes de hipótese para a média, igualdade de variâncias, diferença de médias para amostras independentes e diferença de médias para amostras emparelhadas usando o SPSS. Intervalos de confiança para a média e diferença de médias usando o SPSS. Interpretação crítica de outputs. Aula número 27 do dia 20/12/2007 (turma - A e B): por Inês Dias Sumário: Laboratório de informática. Resolução de exercícios sobre intervalos de confiança e testes de hipóteses com o auxilio do SPSS. Interpretação de outputs. Aula número 28 do dia 03/01/2008 (turma - C e D): por Paulo Infante Sumário: Teste t para amostras emparelhadas. Exemplos e exercícios de palicação usando o SPSS e o Excel. Teste t para amostras independentes e teste de razão de variâncias. Resolução de exercícios usando o Excel. Teste de comparação de proporções e intervalos de confiança para a diferença de proporções. Aula número 28 do dia 03/01/2008 (turma - A e B): por Inês Dias Sumário: Intervalos de Confiança e Testes de Hipóteses Amostras emparelhadas: intervalos de confiança e testes de hipóteses para a mostras emparelhadas. Exemplo. Resolução de exercícios com o auxílio do SPSS e do EXEL. Análise de outputs. Aula número 29 do dia 08/01/2008 (turma - A e B): por Inês Dias Sumário: Intervalos de Confiança e Testes de Hipóteses Resolução de exercícios com interpretação de outputs do SPSS e do EXEL. Aula número 29 do dia 08/01/2008 (turma - C e D): por Paulo Infante Sumário: Resolução de exercícios com interpretação de outputs do SPSS e do EXEL. Aula número 30 do dia 10/01/2008 (turma - A e B): por Inês Dias Sumário: Revisões Revisões para a 3ª frequência. Aula número 30 do dia 10/01/2008 (turma - Todas): por Paulo Infante Sumário: Exercícios de revisão e algumas considerações críticas sobre a matéria dada. Material de apoio às aulas Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA 1. Admita que se realizou um inquérito a um grupo de compradores de 30 carros novos para determinar quantas reparações ou substituições de peças foram feitas durante o primeiro ano de utilização dos carros, tendo-se obtido os seguintes resultados: 1 4 1 2 2 3 3 2 1 2 3 2 3 1 0 1 2 7 4 3 5 1 2 4 2 1 3 1 0 1 a) Apresente os dados numa tabela de distribuição de frequências. b) Represente graficamente as frequências absolutas e relativas. c) Calcule e interprete a média, a mediana, a moda e o desvio-padrão. d) Determine a função de distribuição empírica e represente-a graficamente. e) Determine os quartis da distribuição e diga qual o seu significado. f) Represente os dados numa caixa-de-bigodes e interprete. g) Estude a distribuição quanto à assimetria e ao achatamento. h) Refaça as alíneas anteriores recorrendo ao SPSS. 2. Admita que o volume de vendas anuais, numa dada unidade monetária, de 20 empresas do sector do papel e de 25 empresas do sector de Marketing foi o seguinte: 20 40 40 45 45 45 50 50 50 50 55 55 60 60 60 60 70 80 85 100 10 30 40 45 45 45 50 50 50 50 50 55 55 55 60 60 60 60 70 75 75 80 85 100 20 Realize uma análise descritiva aos dados. Retire as conclusões que entender convenientes. 3. Os seguintes dados representam as contribuições fiscais, numa dada unidade monetária e durante um ano, de 40 pessoas escolhidas aleatoriamente: 2392 5928 780 2132 1976 1404 676 4472 3728 208 2236 4404 5132 1196 1716 1092 832 3959 3172 728 2132 1040 2028 4108 988 3926 468 2132 624 1710 4040 3174 3208 2948 1248 2704 150 200 988 624 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2006/2007 EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA a) Obtenha a tábua de distribuição de frequências. b) Calcule a média, a mediana e a moda. Comente. c) Calcule o P5 e P95 (percentis 5% e 95%) e interprete os valores obtidos. d) Classifique a distribuição quanto à assimetria e à curtose. e) Represente, para esta distribuição a caixa de bigodes. f) Refaça as alíneas anteriores recorrendo ao SPSS. g) Complete as afirmações: I. ___ % dos contribuintes pagaram um valor superior a 1000 €. II. 75% dos contribuintes pagaram um valor inferior a ____ €. 4. Considere que agrupou os gastos energéticos, em milhares de euros, de 60 empresas de uma dada actividade, tendo obtido a seguinte distribuição de frequências: Classes [0, 2) fi 0,10 [2, 4) 0,20 [4, 6) 0,25 [6, 8) 0,20 [8, 10) 0,15 c) Sabendo que o coeficiente de variação é igual a 50.9% [10, 12] 0,10 e que o quarto momento central é igual a 42.7, a) Esboce o histograma e o polígono de frequências absolutas b) Calcule a mediana e o nono decil. Interprete os seus valores. comente a proposição: “A distribuição é platicúrtica”. d) Admita que um seu colega, depois de calcular o terceiro momento central, tirou a seguinte conclusão: “A maior parte das empresas tem um consumo energético inferior à média.”. Suporte a veracidade ou a falsidade desta conclusão. e) Diga, sem efectuar cálculos, se as seguintes proposições são verdadeiras ou falsas: i) A moda é igual a 5000 euros. ii) 75% da empresas têm um gasto energético superior a 10000 euros. f) O gasto energético de 55% das empresas com menor consumo representa ___% do total do gasto energético das empresas desta actividade. g) Esboce a curva de Lorenz e calcule o índice de Gini. Comente. EAG I - EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA____________________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2006/2007 EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA 5. Admita que um grupo de 50 analistas financeiros efectuou uma previsão do ganho por acção, em euros, de uma empresa no próximo ano, sendo os resultados apresentados em 7 classes de igual amplitude, na tabela seguinte: Classes Pontos médios (x’i) 5 Número de analistas Ni Fi 4 0,08 8 [8, 10) [10, 12) 8 27 13 17 37 5 0,74 1,00 a) Complete a tabela. b) Calcule a mediana e interprete o seu valor. c) Diga, sem efectuar cálculos, se as seguintes questões são verdadeiras ou falsas: i) O percentil 74 é igual a 13 euros. ii) 84% dos analistas previram um ganho por acção superior a 8 euros. d) Complete a seguinte afirmação: ___ % dos analistas previram um ganho por acção inferior a 12,40 euros. 6. Admita que, relativamente às comissões com vendas imobiliárias (em milhares de euros) de um conjunto de mediadores, se obteve o seguinte output do SPSS: Statistics Volume de vendas N Valid Missing Mean Mode Std. Deviation Range Minimum Maximum Percentiles 10 25 50 75 90 72 0 51,1111 47,00 19,93974 94,00 11,00 105,00 25,0000 38,0000 47,5000 62,0000 80,0000 a) Interprete os valores das estatísticas do output. b) Esboce a caixa de bigodes, sabendo que a segundo maior mediador recebeu um total de 92 mil euros. c) Justifique afirmação: a falsidade “O da terceiro seguinte momento centrado é nulo.”. EAG I - EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA____________________________________________________ 3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2006/2007 EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA 7. Admita que os montantes duma amostra de 1000 depósitos a prazo, em milhares de euros, de um certo grupo bancário, se distribuem de acordo com o seguinte histograma: 200 175 150 125 100 75 35 50 10 25 0 1 2 5 10 25 M ilhare s de Euros a) Construa a tabela de distribuição de frequências. b) Comente, sem efectuar cálculos, a proposição: “A moda da distribuição encontrase no intervalo (1500, 2500).”. c) Calcule o índice de Gini. Comente. d) Complete a seguinte afirmação: “67,5% dos depósitos a prazo correspondem a ___% do montante total depositado.”. 8. Com base numa amostra constituída por rendimentos anuais colectáveis de 1000 famílias residentes numa determinada cidade, obteve-se a seguinte distribuição de frequências: Rendimentos Frequências Colectáveis (em euros) absolutas a) Represente o histograma e esboce o [0; 7500[ b) Comente, 6 polígono integral. sem fazer cálculos, a [7500; 15000[ 102 proposição: “Mais de metade das [15000; 22500[ 134 famílias [22500; 37500[ 293 colectável superior a 20000 €.”. [37500; 75000[ 364 [75000; 150000[ 101 têm um rendimento c) Calcule a mediana, a moda e o terceiro quartil e interprete-os. d) Complete as seguintes afirmações: I. 90 % das famílias têm um rendimento colectável inferior a...............euros. II. .......% das famílias têm um rendimento colectável superior a 40 000 euros. EAG I - EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA____________________________________________________ 4 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE PROBABILIDADES 9. Suponha que numa determina população, 10% dos indivíduos são leitores da revista A, 30% são leitores da revista B e 5% são leitores de ambas. Determine a probabilidade de uma pessoa escolhida ao acaso: a) Ser leitor de alguma das revistas. b) Ser leitor apenas da revista A. c) Não ser leitor da revista B. d) Não ser leitor de nenhuma das revistas. e) Ser leitor da revista A sabendo que também é leitor da revista B. 10.Uma caixa contém 2 bolas vermelhas e 3 azuis. Extraem-se, ao acaso, duas bolas com reposição. Qual a probabilidade de: a) Ser vermelha a primeira bola escolhida? b) Ser vermelha a segunda bola escolhida? c) Ambas as bolas serem vermelhas? d) Ser vermelha a primeira e azul a segunda? e) Refaça as alíneas anteriores, admitindo que se extraem as bolas sem reposição. 11.De um baralho de 40, extraem-se, sucessivamente e sem reposição cartas. Calcule a probabilidade de: a) A primeira carta extraída ser um ás ou um rei. b) As duas primeiras cartas extraídas serem ouros. c) As três primeiras cartas extraídas serem do mesmo naipe. d) Seja A o acontecimento que consiste em sair uma carta de copas e B o acontecimento que consiste em sair uma figura (rei, dama, valete). Comente a proposição: “Os acontecimentos A e B são independentes.”. 12.Sejam A e B acontecimentos tais que P[A] = .2, P[B] = p e P[A∪B] = .6. Calcule p considerando A e B: a) Mutuamente exclusivos. b) Independentes. 13. Uma empresa produtora de electrodomésticos verificou que as causas de reclamações que recebeu durante um certo período de tempo se distribuíam da seguinte forma: Período de garantia Fora da garantia Causa das Reclamações Aparência Avaria eléctrica Avaria mecânica 90 65 160 60 110 15 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE PROBABILIDADES a) Determine a probabilidade de uma dada reclamação ter como origem a aparência se foi feita fora do período de garantia. b) Se uma dada reclamação foi feita por avaria eléctrica, qual a probabilidade ter sido durante o período de garantia? c) Comente a proposição: “ A reclamação por avaria mecânica é independente do período em que a reclamação foi feita.” 14.Sejam A e B dois acontecimentos quaisquer. Mostre que P(A∩B) ≤ P(A) ≤ P(A∪B) ≤ P(A)+P(B). 15.Considere um sistema com 3 componentes em paralelo, cujas probabilidades de avaria para um período de 1000 horas de funcionamento são iguais a 0.05, 0.02 e 0.01. Calcule a probabilidade do sistema estar a funcionar ao fim de 1000 horas de funcionamento. E no caso dos componentes estarem em série? 16.Num teste de resposta múltipla com 20 perguntas, cada uma com 3 respostas possíveis, calcule a probabilidade de acertar todas as perguntas admitindo que responde ao acaso. Qual a probabilidade de ter 10 valores se todas as perguntas valem o mesmo e não se penalizam resposta erradas? 17.Aos armazéns de uma empresa chegam dois lotes de 1000 produtos cada, um de uma fábrica A e outro de uma fábrica B. Admita que o fornecimento da fábrica A tem 10% de produtos defeituosos e o da B 20%. Supondo que se misturou ao acaso os produtos dos 2 lotes e que, extraindo um produto, também ao acaso, se verificou que era defeituoso, determine a probabilidade do produto ter sido produzido pela fábrica A. 18.Suponha que existem 3 tipos de vírus duma dada doença, sendo 0,3; 0,5 e 0,2 as probabilidades de um indivíduo ser atacado por cada um deles. Para a vacina disponível as probabilidades de imunização são 0,8; 0,9 e 0,95 respectivamente. a) Qual a probabilidade de um indivíduo vacinado contrair a doença? b) Se um indivíduo vacinado resistiu ao ataque, qual a probabilidade de ter sido atacado por um vírus do 2º tipo? 19.O Governo de um determinado país pretende avaliar o crescimento do produto interno bruto (PIB). Para tal, resolve pedir previsões da evolução de diversos componentes, em três vertentes distintas, a um economista. Neste caso, 40% das EAG I - EXERCÍCIOS DE PROBABILIDADES_________________________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE PROBABILIDADES estimativas são referentes às receitas (vertente em que a probabilidade do economista estimar correctamente é igual a 0,80), 35% das estimativas são referentes às despesas (vertente em que a probabilidade do economista estimar correctamente é igual a 0,20) e 25% das estimativas são referentes às importações e exportações (vertente em que a probabilidade do economista estimar correctamente é igual a 0,40). a) Determine a probabilidade de, escolhida ao acaso uma estimativa referente às receitas, esta esteja estimada incorrectamente. b) Relativamente a um dada estimativa verificou-se que estava correcta. Calcule a probabilidade de ser relativa às importações e exportações. 20.Uma companhia de seguros refere que 30% dos seus clientes são de alto risco, 45% dos seus clientes são de médio risco e os restantes clientes são de baixo risco. Em cada caso, a probabilidade de terem acidentes no ano coberto pelo seguro é igual a 0.25, 0.16 e 0.08, respectivamente. a) Determine a probabilidade de escolher ao acaso um cliente que não seja de alto risco. b) Determine a probabilidade de um condutor ser de alto risco, sabendo que não teve acidentes no ano coberto pelo seguro. EAG I - EXERCÍCIOS DE PROBABILIDADES_________________________________________________________ 3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS DISCRETAS 21.Num sorteio foram emitidos 10000 bilhetes. Sorteia-se um prémio de 50000 euros, dez prémios de 5000 euros e cem prémios de 50 euros. a) Determine a função de probabilidade da variável aleatória X (valor do prémio possível para o possuidor de um bilhete de lotaria). b) Obtenha a função de distribuição de X e represente-a graficamente. c) Calcule a esperança do ganho. 22.Uma máquina de jogos tem dois discos que funcionam independentemente um do outro. Cada disco tem 10 figuras: 4 maçãs, 3 bananas, 2 peras e 1 laranja. Uma pessoa paga 80 cêntimos e acciona a máquina. Se aparecerem 2 maçãs, ganha 40 cêntimos. Se aparecerem 2 bananas ganha 80 cêntimos. Se aparecerem 2 peras ganha 140 cêntimos e ganha 180 cêntimos se aparecerem 2 laranjas. Calcule a esperança de ganho numa única jogada. 23.Considere a v. a. X (número de unidades vendidas por semana de um dado produto), com a seguinte distribuição: x 1 2 3 4 F(x) 0,1 0,4 0,9 1 a) Calcule a probabilidade de vender no máximo duas unidades do produto. b) Obtenha a função de probabilidade p(x) e represente-a graficamente. c) Calcule o número esperado e o desvio padrão de unidades vendidas por semana. d) Determine o salário médio semanal do vendedor sabendo que recebe de base 150€ e um extra de 200€ por cada unidade vendida. 24.Segundo o Censos de 2001, a proporção de residentes por família clássica em Portugal era: Nº residentes Proporção de famílias clássicas 1 2 3 4 0,173 0,284 0,252 0,200 5 ou mais 0,095 Seja X a variável aleatória descrita na distribuição de probabilidades acima. a) Qual a probabilidade de um alojamento escolhido ao acaso ter uma família com no máximo dois residentes? b) E de ter pelo menos 4 residentes? c) Obtenha a função distribuição de X e com base nesta calcule P(2≤X≤4). d) Qual o nº esperado de residentes por família? e) Calcule o desvio padrão da variável X. f) Determine a mediana e a moda de X. g) Classifique a distribuição quanto à assimetria e ao achatamento. Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS 25.Uma cadeia de hipermercados vende, por semana, uma quantidade de carne (expressa em toneladas) que admitimos ser uma variável aleatória X com função densidade de probabilidade dada por: ⎧⎪ x ⎪ + k, 0 ≤ x ≤ 3 f ( x) = ⎪⎨ 6 ⎪⎪ ⎪⎩0, caso contrario a) Obtenha a função distribuição, o valor médio e a mediana de X. b) Calcule a probabilidade da cadeia de hipermercados vender numa semana pelo menos duas toneladas? E de vender entre 1 e 2 toneladas? c) Determine a quantidade de carne que deve ser recebida semanalmente para que em 80% das semanas não haja falta do produto. d) Calcule a variância das vendas semanais de carne da cadeia de hipermercados. e) Classifique a distribuição quanto à assimetria e achatamento. 26.Suponha que o consumo diário (em litros) de leite, em famílias de um determinado concelho, é uma variável aleatória com função distribuição f ( x) = k x, 0 ≤ x ≤ 1 2 a) Determine o consumo médio e o consumo mediano de leite, de uma determinada família, durante um dia. b) Calcule o desvio padrão do consumo mensal de uma dada família desse concelho. c) Obtenha a função distribuição de X e, com base nesta, calcule a probabilidade de num dia uma dada família consumir entre 0,5 e 0,75 litros. 27. Suponha que as necessidades, nos meses de primavera e verão, de gás natural de um determinado país podem ser descritas por uma variável aleatória contínua com função densidade de probabilidade dada por: f ( x) = 3x 2 , 0≤ x≤2 8 Admita que você é o director da empresa fornecedora do país, GasPor, e que o ministro desse país propôs que nos meses cujo fornecimento não cobrisse as necessidades a sua empresa fosse penalizada em 100000€ enquanto no caso contrário a sua empresa beneficiaria de um prémio de 50000€. Não sendo possível assegurar mais que 1.5 unidades por mês no abastecimento de gás ao país, acha que seria vantajoso para a sua empresa aceitar a proposta do ministro? Justifique. EAG I - EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS ____________________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS 28.Considere que o tempo gasto por um trabalhador de uma determinada empresa para chegar ao emprego (em horas) é descrito por uma variável aleatória com a função de distribuição: ⎧0, x ≤ 0 ⎪k ⎪ F(x) = ⎨ ( 4x − x 2 ) , 0<x<2 ⎪2 ⎪⎩1, x ≥ 2 a) Calcule a probabilidade de um trabalhador demorar menos de 30 minutos a chegar ao emprego. b) Determine o tempo médio e o tempo mediano gasto por cada trabalhador para chegar ao emprego. 29.Admita que numa dada loja de componentes para computadores, as vendas diárias de processadores das marcas X e Y têm a seguinte função de probabilidade conjunta: X\Y 0 1 2 0 1/12 1/6 1/12 1 1/6 2 1/12 1/6 1/6 1/12 a) Calcule a probabilidade de num dado dia se vender o mesmo número de processadores das duas marcas. b) Determine o número médio de processadores vendidos diariamente da marca X e o desvio padrão do número de processadores vendidos semanalmente (5 dias) da marca Y. c) Pode afirmar que as variáveis são independentes? Justifique. 30.Uma companhia produz artigos, cada um dos quais pode ter 0, 1 ou 2 defeitos, com probabilidades iguais a 0.7, 0.2 e 0.1, respectivamente. Se um artigo tem dois defeitos os inspectores retiram-no e substituem-no por um perfeito antes da distribuição. Seja X o número original de defeitos num artigo produzido e Y o número de defeitos no correspondente artigo distribuído. a) Determine a função de probabilidade conjunta. b) Determine a função de probabilidade de Y. c) Se um artigo distribuído revela ser perfeito, qual a probabilidade de ser fruto de uma substituição? EAG I - EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS ____________________________________________________ 3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS 31.Numa empresa de aluguer de aviões a procura diária de aviões de passageiros, X, e a procura diária de aviões de transporte rápido de correio, Y, constitui um variável aleatória bidimensional (X, Y) cuja função de probabilidade conjunta é dada por: X 0 1 2 3 Y 0 1 2 0 0,1 0 0,2 0,05 0,1 0,1 0,5 0,25 0,35 p + 0,2 P a) Complete a tabela, determinando o valor de p. b) Existe alguma relação entre a procura diária de aviões de passageiros e a procura diária de aviões de transporte? Justifique. c) Determine o valor médio e o desvio padrão da procura média diária de aviões de transporte rápido de correio. d) Calcule Var (3X+1). 32.Um aluno da Universidade de Évora para se deslocar para as aulas utiliza 2 meios de transporte, cuja duração conjunta é uma variável aleatória bidimensional (X, Y) com densidade ⎧k (6 − x − y ) ; 0<x<2, 2<y<4 f ( x, y ) = ⎨ . ⎩0 ; restantes valores a) Determine a constante k. b) Calcule o tempo médio de duração do segundo transporte ( Y ). c) Calcule o tempo mediano de duração do primeiro transporte ( X ). d) As variáveis X e Y são independentes? Justifique. EAG I - EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS ____________________________________________________ 4 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADES 32. O conteúdo de leite de certa marca é uma variável aleatória com distribuição uniforme entre 0,90 e 1,05 litros. Calcule a probabilidade de um pacote de leite ter menos de 1 litro. 33. Um autocarro chega a uma paragem em intervalos de 15 minutos, a partir das 7h00m. Se um passageiro chegar à paragem segundo uma distribuição uniforme entre as 7h00m e as 7h30m, calcule a probabilidade de esperar: a) Menos de 15 minutos; b) Pelo menos 12 minutos; c) Entre 1 a 5 minutos. 34.Um comboio chega a uma estação segundo uma distribuição uniforme entre as 10h00m e as 10h15m. Um passageiro chegou à estação às 10h00m. a) Calcule a probabilidade de esperar mais de 10 minutos pelo comboio. b) São 10h05m e o comboio ainda não chegou. Calcule a probabilidade do passageiro esperar pelo menos mais 5 minutos. 35.Suponha que um aparelho de detecção de fogos utiliza quatro células sensíveis à temperatura, actuando independentemente umas das outras e podendo uma ou mais activar o alarme. Cada célula possui uma probabilidade de activar o alarme igual a 0,9 quando a temperatura for igual ou superior a 100º C. Seja X = {número de células que activam o alarme quando a temperatura atinge os 100º C}. a) Calcule a probabilidade de pelo menos uma das células não funcionar quando a temperatura atinge os 100º. b) Calcule a probabilidade de que o alarme funcione quando a temperatura atinge os 100º. 36.Um corrector de seguros vende apólices a 5 homens, todos da mesma idade e em boas condições de saúde. De acordo com as tábuas actuariais, a probabilidade de um homem dessa idade estar vivo daqui a 30 anos é igual a 2/3. Determine a probabilidade de que daqui a 30 anos: a) Todos estejam vivos. b) Pelo menos 3 estejam vivos. c) Somente 2 estejam vivos. 37.Admita que, entre um determinado fornecedor e um determinado cliente, foi acordada uma proporção de produtos defeituosos igual a 5%. Admita, ainda, que aquando da entrega de um lote de grandes dimensões, o cliente decide inspeccionar 25 unidades, aceitando a garantia do fornecedor se, no máximo, uma das 25 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE unidades inspeccionadas for defeituosa. Sabendo que a verdadeira proporção de unidades defeituosas é igual a 15%: a) Calcule a probabilidade do cliente aceitar a garantia do fornecedor. b) Calcule a probabilidade anterior no caso do lote ter 60 unidades das quais 9 são defeituosas. c) Calcule a probabilidade do cliente encontrar a primeira unidade defeituosa depois de inspeccionadas 3 unidades. d) Em média, ao fim de quantas unidades inspeccionadas espera o cliente encontrar a primeira defeituosa? 38.Admita que o número de camiões TIR que, por hora, atravessam a ponte Vasco da Gama segue uma distribuição de Poisson com variância igual a 8. Calcule a probabilidade de numa hora atravessarem a ponte: a) Exactamente 4 camiões TIR. b) Pelo menos 3 camiões TIR. 39.Suponha que, na produção de um determinado tipo de unidades de tecido (calças, por exemplo), o número médio de defeitos por unidade é igual a 6. a) Calcule a probabilidade de uma dessas unidades ter pelo menos dois defeitos. b) Calcule a probabilidade de uma dessas unidades ter no máximo um defeito. c) Calcule a probabilidade de em 5 unidades haver pelo menos três delas com mais de 2 defeitos. d) Admita que se considera que a qualidade melhorou caso o número de defeitos numa unidade seja inferior a 2. I.Calcule a probabilidade de, através de uma unidade inspeccionada, concluir que não houve melhoria. II.Calcule a probabilidade de necessitar inspeccionar mais de 4 unidades para poder concluir que a qualidade melhorou. III.Calcule o número médio de unidades de tecido a inspeccionar até poder concluir que a qualidade melhorou. 40.Seja X o número de avarias que ocorrem por hora em certo dispositivo, com distribuição de Poisson, tal que P(X = 1) = P(X = 2). a) Calcule a probabilidade de ocorrerem quanto muito 4 avarias em ½ hora. b) Qual a probabilidade de termos de aguardar mais de ¼ hora até ocorrer a 1ª avaria. EAG I - EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE ____________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE 41.O número de pessoas que chega a uma repartição de finanças em cada meia hora é descrito por um processo de Poisson de média 6. Determine a probabilidade de nos próximos 5 minutos chegarem 2 clientes. 42.O número de navios petroleiros que chegam a determinada refinaria por dia tem distribuição de Poisson com média igual a 2. Admita, ainda, que as actuais instalações do porto podem atender, no máximo, 3 navios por dia, devendo os eventuais excedentes seguir para outro porto. a) Num dia, qual a probabilidade de haver navios que tenham de ser enviados para outro porto? b) Qual o número esperado de navios que são atendidos diariamente? c) Qual o número esperado de navios que terão que se dirigir diariamente a outros portos? 43.Num sítio de Internet de consulta de artigos científicos, a consulta de cada artigo por hora é uma variável aleatória com distribuição de Poisson de média igual a 20. a) Calcule a probabilidade de um determinado artigo ser consultado no máximo 2 vezes em 15 minutos? b) De entre 12 artigos consultados em 15 minutos, determine a probabilidade de pelo menos 3 terem no máximo 2 consultas. 44.O tempo de funcionamento (em horas) de um certo equipamento é uma v.a com distribuição exponencial. Sabendo que o tempo médio de funcionamento é igual a 2 horas: a) Calcule a probabilidade da primeira avaria ocorrer depois de pelo menos 1 hora de funcionamento. b) Comente a proposição: “A probabilidade de um equipamento que está a funcionar há 3 horas sem avarias continuar a funcionar durante mais 7 horas é inferior à probabilidade de um equipamento novo funcionar sem avarias pelo menos 7 horas.”. 45.Suponha que um dispositivo electrónico tem um tempo de vida X (em unidades de 1000 horas), descrito por uma v.a. exponencial de média igual a 1 unidade. Admita, ainda, que o custo de fabrico de um desses dispositivos é igual a 200 € e que o fabricante o vende por 500€, mas garante o reembolso total se a duração do dispositivo for menor ou igual a 900 horas. Determine o lucro que o fabricante espera obter por dispositivo. EAG I - EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE ____________________________________________ 3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE 46.Uma determinada empresa tem produção constante de 100 toneladas por mês. Sabese que a procura é uma v. a. Normal com média igual a 80 toneladas e desvio padrão igual a 10 toneladas. a) Determine a probabilidade de ocorrer procura excedentária. b) Para reduzir a probabilidade de ocorrer procura excedentária para 0,0027, a empresa deve aumentar a sua produção mensal em quantas toneladas. 47.As notas da primeira frequência de uma dada unidade curricular têm distribuição aproximadamente normal com média igual a 11 e desvio padrão igual a 2,5. Calcule a nota correspondente ao último decil. 48.O tempo (em horas) que um gestor demora a avaliar um determinado projecto é uma variável aleatória com distribuição normal com média igual a 10 horas e desvio padrão igual a 2 horas. a) Determine a probabilidade do gestor demorar entre 9 e 11 horas a avaliar um determinado projecto. b) Se ao gestor fosse pedida uma previsão do tempo necessário para avaliar um dado projecto, de modo a que a probabilidade do estudo não estar concluído nesse tempo apenas fosse igual a 0,025, que valor indicaria? c) O gestor recebe uma compensação monetária sempre que termina a avaliação de um projecto em menos de 8 horas. Admitindo que o gestor recebeu 7 projectos distintos para avaliar, calcule a probabilidade de ser compensado em pelo menos 2 projectos. 49.Suponha que a procura semanal de uma determinada marca de óleo lubrificante, numa dada estação de serviço, segue uma distribuição normal com valor médio igual a 50 litros e desvio padrão igual a 3 litros. a) Calcule a probabilidade de numa determinada semana se consumirem entre 45 litros e 65 litros. b) Comente, sem efectuar cálculos: “Se o stock no início de cada semana for inferior a 50 litros, então em mais de metade das semanas haverá ruptura de stock.”. c) Qual deverá ser o stock de óleo no início de uma determinada semana, de modo a que a probabilidade de haver ruptura de stock, nessa semana, seja igual a 0.015? 50.Seja X a variável aleatória que representa o comprimento de barras de ferro. Sabe-se que X tem distribuição Normal de valor médio igual a 10 e variância igual a 4. EAG I - EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE ____________________________________________ 4 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE Suponha que uma barra é considerada não defeituosa se {8 ≤ X ≤ 12} e defeituosa em caso contrário. a) Qual a probabilidade de uma barra, escolhida ao acaso, do fabrico diário, seja não defeituosa? b) Qual a probabilidade de que em dez barras escolhidas aleatoriamente do fabrico diário, pelo menos duas sejam defeituosas? 51.Uma determinada empresa tem produção mensal igual a 100 toneladas. Sabendo que a procura mensal é uma variável aleatória normal com média 80 toneladas e desvio padrão 10 toneladas, calcule a probabilidade de num semestre haver procura excedentária no máximo em dois meses. 52.Admita que os responsáveis de uma determina empresa produtora de açúcar, face a uma diminuição registada nas vendas do produto, encararam a hipótese de fechar uma das suas sucursais. De acordo com estudos efectuados, para não encerrar a dita sucursal, a empresa necessita que a procura semanal (7 dias) seja superior a 65.000 kg. Sabendo que a procura diária de açúcar se distribui normalmente, com média 10.000 kg e desvio-padrão 1.000 kg, determine a probabilidade da sucursal encerrar. 53.Numa multinacional, o responsável pela comercialização de um produto alimentar, não sazonal e de procura rígida, apurou que as vendas semanais tinham média igual a 8 toneladas e desvio padrão igual a 1 tonelada. Qual a probabilidade de ao fim de 60 semanas as vendas totalizarem pelo menos 470 toneladas? 54.Suponha que o peso dos indivíduos de uma determinada população segue uma distribuição normal de média 60 kg e desvio-padrão 10 kg e que tal população utiliza um elevador público de tara máxima 300 kg para 4 pessoas. a) Calcule a probabilidade do peso das 4 pessoas exceder a tara máxima. b) Calcule a probabilidade do peso médio de 4 pessoas: i) Exceder 60 kg. ii) Estar compreendido entre 40 kg e 60 kg. 55.Suponha que o gasto médio em telefone, num conjunto numeroso de empresas do mesmo ramo de actividade, foi de 2400€/ano com um desvio-padrão de 400€. Considerando 64 quaisquer dessas empresas, qual a probabilidade do gasto médio anual de cada empresa ter sido superior a 2500€? EAG I - EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADE ____________________________________________ 5 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 56.O número de defeitos de isolamento por cada 100m de cabo eléctrico tem distribuição de Poisson com média igual a 4. Determine a probabilidade de em 5 cabos de 1000m não encontrar nenhum com mais de 50 defeitos. 57.O tempo de realização de uma tarefa é uma variável aleatória com distribuição normal de desvio padrão igual a 40 minutos. Para estimar o tempo médio μ consideraram-se 64 realizações da tarefa. a) Calcule a probabilidade da média da amostra exceder μ em mais de 5 minutos. b) Calcule a probabilidade da média da amostra se afastar no máximo 2 minutos de μ. 58.Admitindo que um em cada oito alunos de uma dada Universidade tem carro, calcule a probabilidade de mais de 15% de alunos terem carro numa amostra de 800. 59.Num processo eleitoral, um determinado candidato obteve 45% dos votos. Determine a probabilidade de, numa secção de voto ter havido uma maioria absoluta de votos a favor desse candidato, sabendo que o número de votantes foi: a) 200. b) 1000. 60.Considere uma amostra X1,X2,...,Xn proveniente de uma população X com distribuição Uniforme entre 0 e θ real positivo. Verifique que o estimador T = 2 X do parâmetro θ é não enviesado. 61.A variável aleatória X, que representa o número de avarias de um dispositivo durante um período de tempo, tem distribuição de Poisson com parâmetro λ desconhecido. Para este parâmetro foram sugeridos três estimadores: X + Xn ; λˆ3 = X min λˆ1 = X ; λˆ2 = 1 2 Qual dos estimadores escolheria? Justifique a sua resposta. 62.Para o parâmetro θ de uma certa população foram indicados dois estimadores: θˆ 1 e θˆ 2 . Diga qual preferiria, sabendo que k é uma constante e: n +1 E ⎡⎢θˆ 1 ⎤⎥ = θ ⎣ ⎦ n n +1 E ⎡⎢θˆ 2 ⎤⎥ = θ ⎣ ⎦ n k Var ⎡⎢θˆ 1 ⎤⎥ = ⎣ ⎦ n k Var ⎡⎢θˆ 2 ⎤⎥ = ⎣ ⎦ n +3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 63.Seja X1, X2, ...,Xn, uma amostra aleatória de uma distribuição com função densidade dada por ⎧⎪θx θ−1 ;0 < x < 1, θ > 0 f ( x ) = ⎪⎨ ⎪⎪0; caso contrário ⎩ a) Determine, pelo método dos momentos, o estimador de θ. b) Determine, pelo método de máxima verosimilhança, o estimador de θ. 64.Determine, pelo método da máxima verosimilhança, um estimador para a variância de uma população normal. 65.Seja X uma variável aleatória com a seguinte função de probabilidade: ⎧ 1 ⎪ ⎪ - α, x = 0, 2, 4 ⎪ ⎪ 3 ⎪ 1 ⎪ f ( x | θ ) = ⎨α, x = 1, 3, 5 , com 0 ≤ α ≤ ⎪ 3 ⎪ ⎪ 0, outros valores de x ⎪ ⎪ ⎪ ⎪ ⎩ a) Determine, pelo método dos momentos, um estimador para o parâmetro α. b) Verifique se o estimador encontrado é centrado e consistente. X1 + X n − 4 . 6 d) Considerando a amostra (1, 0, 5, 2, 3, 1, 0, 3, 4, 4, 5, 2), determine uma c) Será melhor o estimador encontrado na alínea a) ou o estimador αˆ = estimativa para o parâmetro α pelo método da máxima verosimilhança. 66.Numa multinacional, o responsável pela comercialização de um produto alimentar, não sazonal e de procura rígida, apurou que as vendas semanais tinham distribuição (aproximadamente) normal com média μ toneladas e desvio padrão 1 tonelada e que ao fim da 30ª semana as vendas totalizaram 235 toneladas. a) Obtenha um intervalo, com 90% de confiança, para a média μ das vendas semanais. b) Qual deve ser a dimensão da amostra para reduzir o erro de estimativa para 200 kg, mantendo o nível de confiança? 67.Numa fábrica de computadores a administração pretende uma estimativa para o tempo médio de vida de um determinado tipo de disco rígido. Para tal, foi seleccionada uma amostra constituída por 15 discos rígidos. Com base nesta amostra obteve-se um tempo médio de vida igual a 27 350 horas. Admitindo que o tempo de vida segue uma distribuição normal com desvio padrão igual a 3000 horas: a) Calcule a probabilidade do menor tempo de vida registado ter sido superior a 20000 horas. EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA b) Obtenha um intervalo de confiança a 99% para o tempo médio de vida dos discos rígidos. c) Caso pretendesse diminuir para metade a amplitude do intervalo anterior, quantos discos rígidos deveria observar? Neste caso, diga qual o erro da estimativa. 68.Com o objectivo de prever a produção de trigo duma certa região dividiu-se a mesma em pequenos talhões, procedendo-se em seguida ao registo, ao acaso, da produção de alguns desses talhões. Admita que a quantidade de trigo produzida por talhão tem distribuição normal com desvio padrão igual a 60 Kg. a) Determine o número mínimo de talhões que o experimentador deverá analisar se desejar garantir, com uma confiança de pelo menos 95%, que a média da amostra difira no máximo 30 Kg do verdadeiro valor da produção média por talhão. b) Qual o número mínimo de talhões que será necessário analisar se o nível de confiança exigido for de 99%? c) Acha que a hipótese de normalidade é essencial na resolução das alíneas a) e b)? Justifique a resposta. 69.Um fabricante produz peças cujos diâmetros têm distribuição normal. Uma amostra aleatória de 20 peças conduziu aos resultados seguintes: 20 ∑x i = 1999, 60 e i =1 20 ∑ ( x − x) 2 i = 111,91 i =1 a) Obtenha um I. C. a 95% para o diâmetro médio das peças. b) Obtenha um I. C. a 95% para a variância do diâmetro das peças. 70.Recolheu-se uma amostra aleatória de 16 tempos de entrega de SMS, de uma dada operadora, TM, durante o período de Natal, tendo-se obtido uma média igual a 28 segundos e uma variância igual a 36 segundos. a) Obtenha intervalos de confiança a 95% e a 99% para a média e para a variância do tempo de entrega de SMS durante o período de Natal. b) Sabendo que, durante o mês de Outubro, numa amostra de 24 SMS se obteve um valor médio do tempo de entrega igual a 19 segundos e um desvio padrão igual a 9 segundos, diga se há evidência estatística, ao nível de significância de 5%, que lhe permita concluir que os tempos de entrega no Natal são superiores aos tempos de entrega em Outubro. Admita os pressupostos que entender necessários. EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 71.Considere uma amostra aleatória obtida numa grande cidade, constituída por 2000 indivíduos. Das entrevistas efectuadas constatou-se que 165 pessoas responderam não ter emprego. a) Obtenha um intervalo de confiança a 95% para a proporção de indivíduos desempregados na referida cidade. b) Caso pretenda reduzir para metade a amplitude do intervalo relativo à alínea anterior, mantendo o mesmo grau de confiança, qual a dimensão da amostra adequada? Justifique a resposta. 72.Um determinado Município pretende efectuar uma sondagem junto da população que vive num bairro mais afastado a fim de determinar a proporção de pessoas que diariamente utilizam os transportes públicos. a) Determine o número de munícipes a inquirir de modo a obter um erro de estimativa máximo igual a 2% para um nível de confiança de 95%. b) Os meios financeiros disponíveis apenas permitiram inquirir 1000 pessoas, das quais 150 afirmaram utilizar os transportes públicos regularmente. Obtenha um intervalo de confiança a 95% para a proporção de munícipes que utilizam regularmente os transportes públicos. Diga qual o erro de estimativa associado e comente o resultado obtido. 73.Num determinado período pré eleitoral foi realizada uma sondagem com o objectivo de analisar a popularidade de dois candidatos A e B num determinado distrito. Para tal, foram inquiridas 780 pessoas residentes nesse distrito manifestando-se 55% dos inquiridos a favor do candidato A. Obtenha intervalos de confiança a 90%, 95% e 99% para a percentagem de pessoas do distrito que são a favor do candidato A. Comente as diferenças obtidas para os três intervalos. 74.A Reitoria de uma dada Universidade dispõe-se a oferecer aos seus 7000 alunos a possibilidade de estes frequentarem aulas à noite se a procura para este horário for suficientemente alta. Determine a dimensão apropriada da amostra de alunos a inquirir para obter uma estimativa, para a proporção de alunos com interesse por aquele horário, com erro máximo de 5% e uma confiança de 95%. 75.Numas eleições Presidenciais de determinado país foi realizada uma sondagem à boca das urnas num dado concelho. Nessa sondagem foram inquiridas 210 pessoas, 78 das quais disseram ter votado no candidato CS. a) Haverá evidência estatística para concluir, ao nível de 5%, que o candidato CS obterá nesse Concelho mais de 30% dos votos? EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 4 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA b) As sondagens apresentadas por um canal de televisão, apresentavam o vencedor com uma votação de 51,5%, com uma confiança de 95% e um erro máximo de 2,23%. Calcule a dimensão da amostra utilizada por esse canal de televisão. 76.As vendas diárias de dois estabelecimentos A e B de certa cadeia são aleatórias. Suponha que eram conhecidos os seguintes parâmetros: μ A = 6250 €; σ A = 900 € ; μB = 7000 €; σ A = 750 € Nestas condições, qual a probabilidade de, em 2 meses de actividade (60 dias), a média diária de vendas no estabelecimento A se revelar superior à do estabelecimento B. 77.Uma determinada empresa B dividiu-se em duas sub-empresas, a B1 e a B2, tendo colocado à disposição dos subscritores acções, de cada uma dessas novas empresas, com cotações médias de 5,3 e 6,2 euros e desvio padrão de 3,1 e 2,1 euros, respectivamente. Assumindo que as populações são normais, calcule a probabilidade de em 16 dias, a diferença entre as cotações das acções médias amostrais ser superior a 1 euro. 78.O gerente de um banco está interessado em analisar a diferença entre os valores esperados dos saldos das contas à ordem de duas das suas agências. Para tal, de cada uma delas recolheu uma amostra aleatória de saldos, tendo-se registado os seguintes resultados: A Dimensão da amostra 17 Média amostral 240 euros Desvio padrão amostral 13,50 euros B 13 225 euros 12,05 euros Agência Admitindo a normalidade dos dados, obtenha um intervalo de confiança a 90% e outro a 95% para os saldos médio da agência A e da agência B e para a diferença entre os saldos médios das contas à ordem das duas agências. Admita os pressupostos necessários. 79.Para comparar a eficiência de dois métodos de ensino, uma turma de 24 alunos foi dividida aleatoriamente em dois grupos, sendo aplicado um método diferente a cada grupo. Os resultados no fim do semestre, numa escala de 0 a 100, foram os seguintes: Grupos I II Tamanho Amostra 13 11 Média 74,5 71,8 Variância 82,6 112,6 EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 5 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA Assumindo que as populações são normais com variâncias iguais, obtenha um intervalo de confiança a 95% para a diferença entre os valores esperados das duas populações. Comente. 80.Um comerciante recebeu uma remessa de ovos com a garantia de serem da classe A, isto é, ovos cujo peso segue uma distribuição normal de média igual a 55gr e desvio padrão igual a 4gr. Como o fornecedor só lhe concede pouco tempo para reclamar, resolve pesar 9 ovos e escolhe para nível de significância 5%. a) Calcule a probabilidade do peso do maior ovo ser inferior a 60 gr, considerando que os ovos são da classe A. b) Admitindo que o peso médio dos 9 ovos é igual a 53 gr, qual a decisão que ele deve tomar? Calcule o valor p do teste e interprete-o. c) Calcule a probabilidade do erro de 2ª espécie, caso o verdadeiro peso médio dos ovos seja igual a 52gr. d) Pretendendo um erro de 2ª espécie β inferior a 10%, mantendo α = 5%, qual deverá ser o número de ovos que o comerciante deve pesar? 81.Suponha que a média dos volumes de leite de 16 embalagens retiradas aleatoriamente da linha de produção é igual a 997ml. Admitindo que o desvio padrão da população, considerada normal, é igual a 5ml: a) Calcule a probabilidade da embalagem com menor volume de leite na amostra ter quando muito 990 ml, considerando que a média da população é igual a 1 litro. b) Há evidência estatística, ao nível de 5%, de que o volume médio dos pacotes de leite difere de 1 litro? c) Admitindo que a média da população é igual a 995ml, calcule a probabilidade de aceitar a hipótese testada na alínea anterior. 82.Admita que, numa determinada produção, o peso de sacos de café é normalmente distribuído com desvio padrão 10 gramas. Admita, ainda, que a máquina de enchimento está regulada para sacos de 500 gramas. Nestas condições, para aferir o funcionamento da máquina analisou-se uma amostra de 9 sacos aleatoriamente retirados da produção e definiu-se que se rejeitava a hipótese de bom funcionamento da máquina se X > 510 gramas. a) Calcule a probabilidade de cometer um erro de 1ª espécie. b) Se o verdadeiro peso médio dos sacos for igual a 505 gramas, calcule a probabilidade de aceitar a hipótese de bom funcionamento. c) Sabendo que o verdadeiro peso médio dos sacos é igual a 505 gramas, qual deverá ser o tamanho da amostra a retirar da produção se pretender cometer um erro de 2ª espécie inferior a 15%, mantendo o mesmo erro de 1ª espécie? EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 6 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 83.Os empregados de uma determinada empresa deveriam trabalhar, em média, 8h diárias. De forma a investigar se os empregados estão a trabalhar mais do que as horas previstas, o sindicato registou o número de horas que 150 trabalhadores (escolhidos ao acaso) trabalharam num determinado dia, tendo obtido os seguintes resultados: 150 ∑ xi = 1498 i =1 2 150 ∑ ( x − x) i = 600 i =1 a) Teste ao nível de significância de 5%, se a empresa deverá ser punida por exigir que os seus empregados trabalhem mais do que deviam. b) Qual o tipo de erro que pode cometer relativamente à decisão que tomou? 84.Numa determinada empresa pensa-se importar um grande lote de instrumentos de precisão, para os quais o fabricante garante um peso médio igual a 100 gr. Sendo o peso uma característica importante para a qualidade do produto, resolveu-se testar a veracidade da afirmação do fabricante. Para tal, o departamento técnico da empresa importadora obteve uma amostra de 15 instrumentos, através da qual se obtiveram os seguintes valores: 15 ∑ xi = 1407 e i =1 15 ∑(x − x ) 2 i = 1674 i =1 Admitindo a normalidade dos pesos, qual a sua opinião, ao nível de significância de 1%, relativamente à afirmação do fabricante. 85.O administrador de um Hospital pretende estimar as contas em aberto (ainda não cobradas), referentes a tratamentos e internamentos. Admita que o montante de cada dívida segue uma distribuição normal e que a experiência de anos anteriores permite considerar um valor para o desvio padrão igual a 50 euros. Para levar a cabo o seu objectivo, o administrador seleccionou aleatoriamente 25 dessas contas e avaliou o seu valor, tendo obtido um total em dívida igual a 1850 euros. a) Determine um intervalo de confiança a 95% para o montante médio de cada conta não saldada. b) Poderá afirmar estatisticamente, ao nível de 1%, que o valor médio de cada conta não saldada é inferior a 100 euros? Que erro pode estar a cometer com a sua decisão? c) Admitindo que o verdadeiro valor médio de cada conta não saldada é igual a 85 euros, calcule a probabilidade de cometer um erro de 2ª espécie. EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 7 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA d) Um valor do desvio padrão amostral, obtido com base nas 25 contas, igual a 60 euros, poderá pôr em causa, ao nível de 10%, o valor de σ considerado anteriormente? 86.Um determinado fornecedor de acesso à Internet tem um pacote que indica uma velocidade de download de 2MB. Vinte e cinco dos seus clientes mediram as suas velocidades de download num período que pode ser considerado de menor tráfego, registando-se uma velocidade média igual a 1.5Mb e um desvio padrão igual a 1 Mb. Haverá evidência, ao nível de 1%, para podermos concluir que a velocidade de download é inferior à indicada por esse fornecedor? Admita os pressupostos que entender necessários. 87.Admita que a direcção comercial de uma determinada empresa pretende lançar um novo serviço de telecomunicações. De acordo com critérios empresariais, o serviço só deverá ser lançado no mercado se houver mais de 80% de potenciais compradores. Assim, para averiguar o eventual lançamento do serviço, a empresa decidiu efectuar um inquérito a 400 grandes clientes, tendo 340 sido favoráveis à aquisição do novo serviço. a) Para um nível significância de 5%, que se pode concluir quanto ao lançamento do serviço? E para um nível de significância de 1%? b) Determine o valor p do teste e interprete-o. 88.Um canal de televisão deseja saber qual tinha sido a percentagem de pessoas que viram determinado programa. Para tal, realizou uma sondagem tendo sido inquiridas 220 pessoas, das quais 132 disseram ter visto o referido programa. Poder-se-á afirmar, ao nível de 5%, que mais de metade das pessoas viram o programa? Calcule valor p do teste interprete-o. 89.As pilhas Duramais e Duramuito custam o mesmo preço. De forma a testar se ambas têm a mesma duração, recolheram-se duas amostras de 100 pilhas de cada marca, tendo-se obtido os seguintes resultados: Marca Dimensão da amostra Média Desviopadrão Duramais 100 1180 120 Duramuito 100 1160 40 Que pode concluir a um nível de significância de 5%? E a 1%? EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 8 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 90.Suponha que as produções médias de tecido (em gramas) de dois teares de uma fábrica se podem considerar normais. Admita, ainda, que numa experiência efectuada com o objectivo de comparar esses dois teares, em termos das suas produções médias, se obtiveram os seguintes resultados: 8 Tear 1: ∑x i = 80,8 gr i =1 2 i = 816, 664 gr 2 i =1 9 Tear 2: 8 ∑x ∑y i = 96,3 gr i =1 9 ∑y 2 i = 1030,959 gr 2 i =1 a) Ao nível de significância de 5%, teste a igualdade de variância dos teares. b) Compare, ao nível de significância de 1%, as produções médias dos dois teares. Admita os pressupostos necessários. 91.Uma repartição de finanças tem dois funcionários a receber declarações de IRS, o Sr. Vagaroso e o Sr. Caracol. Na semana passada foi destacado um novo Director para esta repartição. Este, para ter uma ideia do tipo de atendimento ao público realizado pelos seus funcionários, resolveu consultar o livro amarelo das reclamações, onde verificou que grande parte das queixas apresentadas eram respeitantes ao atendimento demasiado moroso do Sr. Vagaroso, especialmente quando comparado com o tempo de atendimento do Sr. Caracol. Para testar a veracidade destas afirmações, o director resolveu recolher uma amostra sobre o tempo de atendimento, em minutos, despendido por cada um destes funcionários com cada utente. Os resultados amostrais obtidos foram os seguintes: Funcionário ni xi s i' Sr. Caracol 16 22 20 Sr. Vagaroso 21 29 12 a) Teste a hipótese de igualdade das variâncias populacionais (considere α = 1%). b) Supondo que os tempos de atendimento de cada um dos funcionários seguem uma distribuição normal, construa um intervalo de confiança a 99% para a diferença entre os tempos médios de atendimento dos dois funcionários. Comente os resultados a que chegou. c) Supondo que os tempos de atendimento de cada um dos funcionários seguem uma distribuição normal, decida se o director deve ou não concordar com as queixas dos utentes, ao nível de significância de 5%. d) Teste a hipótese da variância do tempo de atendimento do Sr. Caracol ser igual a 350, ao nível de significância de 1%. EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 9 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 92.Suponha que uma determinada empresa de cigarros enviou para um laboratório amostras de tabaco tratado por dois processo diferentes, tendo sido obtidos os seguintes resultados para cinco medições do conteúdo de nicotina, por mg: Processo A 24 27 26 21 24 Processo B 27 28 23 31 26 a) Admitindo que os conteúdos de nicotina, por mg, seguem distribuições normais com desvios padrões iguais a 2 para o processo A e a 2.5 para o processo B, que pode concluir ao nível de 5%? E ao nível de 1%? b) Resolva a alínea anterior admitindo que não conhece os desvios padrão. 93.Suponha que pretende fazer um estudo em que se pretende comparar a remuneração média de homens e mulheres numa certa categoria profissional. Admitindo que a remuneração tem distribuição normal com desvio padrão igual a 30 unidades monetárias, determine a dimensão comum das duas amostras (homens e mulheres) para que, com uma confiança de 95%, seja possível determinar a diferença média das remunerações com um erro de estimativa que não exceda 10 unidades monetárias. 94.Um analista financeiro pretende comparar as rendibilidades de dois activos financeiros X e Y. Admitindo que as rendibilidades seguem uma distribuição normal com desvios padrões iguais a 0.7 e 0.5 respectivamente, que poderá concluir, ao nível de 5%, se numa amostra de dimensão 50 a rendibilidade média de X foi igual a 0.8 e a de Y igual a 0.6? 95.Em face do problema da falta de água, foi efectuada uma forte campanha para incentivar a redução do consumo de água, visando que o consumo médio mensal seja inferior a 20 m3. No mês seguinte seleccionaram-se, ao acaso, 25 contadores de um determinado bairro, obtendo-se um consumo médio igual a 19 m3 e um desvio padrão igual a 2 m3. a) Adoptando um nível de significância de 5%, poderá afirmar que a campanha atingiu os objectivos nesse bairro? b) Num outro bairro, foram seleccionados 27 contadores, obtendo-se um consumo médio igual a 18 m3 e um desvio padrão igual a 3 m3. Com base num intervalo de confiança apropriado, poderá afirmar, ao nível de 1%, que o consumo médio de água é significativamente diferente nos dois bairros? Admita os pressupostos necessários e indique que tipo de erro pode estar a cometer na sua decisão. EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 10 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 96.Admita que uma amostra aleatória de 400 domicílios de uma determinada cidade revelou que 8% destes são casas de aluguer, enquanto que, numa outra cidade, uma amostra de 270 domicílios revelou que 37 eram casas de aluguer. Poderá afirmar estatisticamente, ao nível de 5%, que há maior percentagem de casas de aluguer em alguma das duas cidades? Justifique. 97. O Gestor de uma grande empresa decidiu comparar 50 empregados contratados por meio de um centro de recrutamento com 75 empregados contratados por outras vias. O resultado mostrou que 50% dos contratados pelo centro falharam a progressão para o nível médio de administração com 5 anos de empresa, enquanto a percentagem correspondente do outro grupo foi de 60%. Com base num intervalo de confiança a 99%, que conclusão pode retirar em relação à eficácia dos métodos de contratação? 98.Comente a seguintes proposições: a) “Supondo que o intervalo de confiança a 99% para a diferença de médias é dado por (0.02, 0.15), então podemos concluir que as médias populacionais diferem ao nível de 5%.”. b) “Num teste de hipóteses unilateral direito para a média, com desvio padrão conhecido, com um valor igual a 2,1 para a estatística de teste, o valor de prova deste teste leva à rejeição da hipótese nula para um nível de significância superior a 1%. ”. c) “O erro de 2ª espécie de um teste de hipóteses aumenta à medida que o verdadeiro valor do parâmetro a testar se aproxima do valor considerado na hipótese nula.”. 99.Suponha que um investigador estudou o nível de actividade antes e depois de almoço em 6 indivíduos, tendo obtido (numa determinada unidade de medida) os seguintes resultados: Antes de almoço 51 48 52 48 53 54 48 Depois de almoço 48 47 50 48 45 50 50 Poderá concluir, estatisticamente ao nível de 5%, que o nível de actividade depois de almoço diminui? 100. Para se estudar a influência do final da semana no desempenho laboral de economistas e gestores, pediu-se a um conjunto de 12 gestores e economistas que realizassem um determinado estudo de impacto económico no início da semana e um EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 11 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA estudo semelhante no final da semana. O desempenho foi medido através de métodos adequados e apresentado numa escala de (0-20), tendo-se obtido os seguintes resultados: Inicio 12 Fim 8 18 19 14 10 13 13 20 16 Desempenho 7 11 10 12 11 14 15 16 17 11 12 6 15 10 Com base num teste não paramétrico adequado poderá afirmar que as classificações obtidas no teste em diferentes alturas da semana são significativamente diferentes ao nível de 5%? 101. Na ficha técnica de uma sondagem recentemente divulgada pode ler-se: “Este estudo da Eurosondagem para a Renascença, Expresso e SIC foi feito através de 1.028 entrevistas telefónicas validadas a eleitores do Continente, entre 29 de Novembro e 5 de Dezembro de 2006. A distribuição foi feita proporcionalmente por idades e regiões. O erro máximo da amostra é de 3%, para um grau de probabilidade de 95%.”. Comente sobre o método de amostragem utilizado e explicite como se obtém o valor de 3% para o erro máximo da amostra. EAG I - EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA___________________________________________________ 12 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DE EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA 1. c) x = 2, 23 ; x% = 2, 00 ; ˆ x = 1, 00 ; s = 1,52 e) Q1=1,00 ; Q2=2,00; Q3=3,00 f) BII=0; BIS=6; BEI=0; BES=9. Bigodes em 0 e 5. O valor 7 é outlier moderado. g) g=0.81>0 ou g1=1,04>0 - Assim. Positiva. K=0,333>0,263 ou g2=-1,82 - Platicúritca. h) Statistics Frequency 2 9 8 6 3 1 1 0 1 2 3 4 5 7 Percent 6,7 30,0 26,7 20,0 10,0 3,3 3,3 Cumulative Percent 6,7 36,7 63,3 83,3 93,3 96,7 100,0 Repsubs N Valid Missing Mean Median Mode Std. Deviation Percentiles 30 0 2,23 2,00 1 1,524 1,00 1,00 2,00 3,00 4,00 10 25 50 75 90 2. Statistics N Valid Missing Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Minimum Maximum Percentiles 10 25 50 75 90 Sector do papel 20 10 56,00 52,50 50a 17,667 ,707 ,512 1,419 ,992 20 100 40,00 45,00 52,50 60,00 84,50 a. Multiple modes exist. The smallest value is shown Sector do Marketing 25 5 55,00 55,00 50 19,579 -,018 ,464 ,865 ,902 10 100 26,00 45,00 55,00 65,00 82,00 Sector do Marketing Sector do papel 0 20 40 60 80 100 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2006/2007 SOLUÇÕES DOS EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA 3. Por exemplo, agrupando em classes de amplitude 1000 temos: contclasses ni Valid (0,1000] (1000, 2000] (2000, 3000] (3000, 4000] (4000, 5000] (5000, 6000] Total 12 8 8 6 4 2 40 Percenfit 30,0 20,0 20,0 15,0 10,0 5,0 100,0 Cumulative Percent 30,0 50,0 70,0 85,0 95,0 100,0 NI 12 20 28 34 38 40 b) x = 2200 ; x% = 2000 ; ˆ x = 750 c) P5=166,67; P95=5000 d) Assimétrica positiva; platicúrtica. e) f) Statistics __Contribuições fiscais N Mean Median Mode Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Percentiles Valid Missing 5 10 25 50 75 90 95 40 0 2165,0750 2002,0000 2132,00 ,634 ,374 Contribuições fiscais -,487 ,733 200,4000 483,6000 871,0000 2002,0000 3199,5000 4374,4000 5099,0000 0 1000 2000 3000 4000 5000 6000 g) I. 70%; II. 3199.50. 4. b) x% = 5, 6; P90 = 10, 0 c) x = 5, 8 ; proposição verdadeira, pois g2=-2,44<0. d) Verdadeiro, pois mediana<média. e) i) Verdadeiro, pois é o ponto médio da classe modal e neste caso as classes adjacentes têm a mesma frequência. EAG I – SOLUÇÕES DOS EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA_________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2006/2007 SOLUÇÕES DOS EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA ii) Falso, pois 75% tem consumo inferior a 8000€. f) 33,6% g) G=0,28 5. a) Número de analistas 4 Ni Fi [4,6) Pontos médios (x’i) 5 4 0,08 [6, 8) 7 4 8 0,16 [8, 10) 9 11 19 0,38 [10, 12) 11 8 27 0,54 [12, 14) 13 10 37 0,74 [14, 16] 15 8 45 0,90 [16, 18] 17 5 50 1,00 Classes b) 11,5 c) i) Falso, P74=14. ii) Verdadeiro. d) 58%. 6. b) Bigodes em 11 e 92000. O valor 105 é um outlier moderado. c) Falso, pois a distribuição é assimétrica positiva. 7. a) Por exemplo, as frequências absolutas são ni = 175, 200, 300, 175, 150. b) Falso, pois a classe anterior tem maior frequência que a classe posterior. c) G=0.58. d) 26,7%. 8. b) Verdadeiro, pois a classe mediana é a classe [22500, 37500). x% = 35708,19 ; ˆ x = 24675,17; c) Q3=59649,73 d) i) 75742,57 ii) 44,1% EAG I – SOLUÇÕES DOS EXERCÍCIOS DE ESTATÍSTICA DESCRITIVA_________________________________________ 3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DE EXERCÍCIOS DE PROBABILIDADES 9. a) 0,35 b) 0,05 c) 0,70 d) 0,65 e) 0,17 10. a) 2/5 b) 2/5 c) 4/25 d) 6/25 e) 2/5, 2/5, 1/10, 3/10 11. a) 0,20 b) 0,06 c) 0,05 d) Verdadeiro 12. a) 0,4 b) 0,5 13. Uma empresa produtora de electrodomésticos verificou que as causas de reclamações que recebeu durante um certo período de tempo se distribuíam da seguinte forma: Período de garantia Fora da garantia a) 3/37. Causa das Reclamações Aparência Avaria eléctrica Avaria mecânica 90 65 160 60 110 15 b) 90/150 c) Falso 14. 15. Paralelo: 0,99999; 16. (1/3)20 ; 0,054 Série: 0,92 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DE EXERCÍCIOS DE PROBABILIDADES 17.1/3 18. a) 0,12 b) 0,51 19. a) 0,20 b) 0,20 20. a) 0,70 b) 0,27 EAG I – SOLUÇÕES DE EXERCÍCIOS DE PROBABILIDADES_______________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DE EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS 21. c) E(X)=10,5€ 22. E(X)=-0,59€. 23.Considere a v. a. X (número de unidades vendidas por semana de um dado produto), com a seguinte distribuição: x 1 2 3 4 F(x) 0,1 0,4 0,9 1 a) 0,4 b) μ=2,6 e σ=0,8 b) 670€. 24. a) 0,457 b) 0,295 c) F(4)-F(2)+p(2)=0,736 d) E(X)=2,77 ⎧ 0; x < 0 ⎪ ⎪ ⎪ 2 ⎪ x ⎪x 25. a) F( x ) = ⎨ + ;0 ≤ x ≤ 3 ⎪ 12 12 ⎪ ⎪ ⎪ 1; x>3 ⎪ ⎪ ⎩ E[X] = 15/8; μ% = 2 b) P ( X ≥ 2) = 1/ 2; P (1 ≤ X ≤ 2) = 1/ 3 c) 2,63 d) Var[X] = 39/64 c) γ1= 0,48; γ2=-0,82. 26. a) E(X)=2/3; μ% = b) σ = 2 2 2 6 ⎧0; x < 0 ⎪ ⎪ ⎪ 2 c) F( x ) = ⎪ ⎨x ; 0 ≤ x ≤ 1 ⎪ ⎪ ⎪ ⎪ ⎩1; x > 1 P(0,5≤X≤0,75)=F(0,75)-F(0,5)=0,3125 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS 27. E(ganho)=-36718.75€ 28. a) 7/16 b) E(X)= 2/3; μ% = 0,59 29. a) P(X=Y)=1/6 b) E(X)=1; 1,83 c) As variáveis não são independentes. 30. a) X\Y 0 1 2 0 0,7 0 0,1 1 0 0,2 0 b) Y p(y) 0 0,8 1 0,2 c) P(X=2 | Y=0) = 0,125 31. a) p= 0,1 b) Sim, porque as variáveis não são independentes. c) E[Y] = 1,1; Var[Y] = 0,49 d) Var(3X+1)= 7,99 32. a) 1/8 b) E[Y] = 17/6 c) Mediana X = 0,764 d) Não, porque f(x,y) ≠ f(x)f(y) EAG I – SOLUÇÕES DOS EXERCÍCIOS DE VARIÁVEIS ALEATÓRIAS_________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DE EXERCÍCIOS DE DISTRIBUIÇÕES DE PROBABILIDADES 32. 2/3 33. a) 1 b) 1/5 c) 4/15 34. a) 1/3 b) 1/2 35. a) 0,3439 b) 0,9999 36. a) 0,1317 b) 0,7901 c) 0,1646 37. a) 0,0931 b) 0,0446 c) 0,1084 d) 6,67 38. a) 0,0573 b) 0,9862 39. a) 0,9826 b) 0,0174 c) 0,9978 d) i) 0,9826 ii) 0,9322 iii) 57,47 40. a) 0,9963 b) 0,6065 41. 0,1839 42. a) 0,1429 b) 1,78 c) 0,22 43. a) 0,1247 b) 0,1811 44. a) 0,6065 b) Falso. 45. 3,28€ 46. a) 0,0228 b) Deve aumentar 7,8 toneladas 47. 14,2 48. a) 0,383 b) 13h55m Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DE EXERCÍCIOS DE DISTRIBUIÇÃO DE PROBABILIDADES c) 0,31 49. a) 0,95 b) Verdadeira c) 56,51 50. a) 0,6826 b) 0,8759 51. 0,9998 52. 0,0294 53. 0,9015 ⎛ ⎞ > 300 ⎟ =0,0013 i =1 ⎠ b) i) P ( X > 60 ) =0,5 4 ∑X ⎝ 54. a) P ⎜ ( i ) ii) P 40 ≤ X ≤ 60 =0,5 55. 0,0228 EAG I – SOLUÇÕES DE EXERCÍCIOS DE DISTRIBUIÇÃO DE PROBABILIDADES___________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 56. 0,7799 57 a) 0,1587 b) 0,3108 58. 0,0143 59. a) 0,0681 b) 0,0007 61. λ̂1 é estimador não enviesado e o mais eficiente dos 3. 62. θ̂2 é mais eficiente que θ̂1 X 1− X a) θ = b) θ =− n n ∑ ln ( x ) i i =1 64.Tem-se: L(σ n 2 −2 − 1 n ∑ ( xi −μ ) 2 ) = ( 2πσ ) .e 1 1 ln L ( σ ) = − ⎡⎣ n ( ln 2π + ln σ ) ⎤⎦ − ∑(x 2 2σ 2 2 σ2 i =1 n 2 2 2 n ( xi − μ ) ∑ d ln L n i =1 =− 2 + dσ 2 2σ 2σ 4 Consequentemente, i =1 i − μ) 2 2 σ2 = 2 1 n Xi − X ) ( ∑ n i =1 65.Seja X uma variável aleatória com a seguinte função de probabilidade: ⎧ 1 ⎪ ⎪ - α, x = 0, 2, 4 ⎪ ⎪ 3 ⎪ 1 ⎪ f ( x | θ ) = ⎨α, x = 1, 3, 5 , com 0 ≤ α ≤ ⎪ 3 ⎪ ⎪ 0, outros valores de x ⎪ ⎪ ⎪ ⎪ ⎩ a) α1 = X −2 3 c) O melhor estimador é α1 , pois é mais eficiente do que α 2 . d) α1 = 1/ 6 . Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 66. a) IC90% (μ) =(7,53; 8,13). b) n =68. 67. a) P ( X min > 20000 | μ = 27350) = 0,9929 . b) IC99% (μ) =(25354,6; 29345,4). c) n=60. Erro da estimativa=997,7. 68. a) n ≥ 16. b) n ≥ 27. c) Sim, porque em ambas a dimensão da amostra é inferior a 30. 69. a) IC95% (μ) = (98,84; 101,12). b) IC95% (σ 2 ) = (3,40; 12,56). 70. a) IC95% (μ) = (24,8; 31,2) ; IC99% (μ) = (23,6; 32,4) IC95% (σ 2 ) = (19,6; 86,3) ; IC99% (σ 2 ) = (16,5; 117,4) ⎧⎪ H 0 : μ1 − μ2 = 0 b) ⎪ ⎨ ⎪⎪ ⎩ H1 : μ1 − μ2 > 0 Como T= 3.51 rejeita-se H0 ao nível de 5%. 71. a) IC95% ( p ) = (0,070; 0,095) b) Para reduzir a amplitude para 0,01: p̂ for conhecido e igual a 0,0825, n ≥ 11632 Se p̂ não for conhecido toma-se p̂ =0,5, vindo n ≥ 38416 Se 72. a) n ≥ 2401. b) IC95% ( p ) =(0,128; 0,172). 73. EAG I – SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA________________________________________ 2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA IC90% ( p ) = (0,521;0,579) IC95% ( p ) = (0,515;0,585) IC99% ( p ) = (0,504;0,596) 74. n ≥ 385. 75. ⎧ ⎪H 0 : p = 0.3 a) ⎪ ⎨ ⎪ ⎪ ⎩H1 : p > 0.3 Como Z=2,21, rejeita-se H0 ao nível de 5%. b) n=1931 ou n=1932. 76. P ( X 1 − X 2 > 0) = 0 . 77. P ( X 1 − X 2 > 1) = 0, 4774 . 78. IC90% (μ1 − μ2 ) = (6,92; 23, 08) IC95% (μ1 − μ2 ) = (5, 27; 24, 73) 79. IC95% (μ1 − μ2 ) = (-5,64; 11,04) 80. a) P ( X max < 60 | μ = 55) = 0,3663 ⎧ ⎪ H 0 : μ = 55 b) ⎪ ⎨ ⎪ ⎪ ⎩ H1 : μ ≠ 55 Como Z=-1,5, não se rejeita H0 ao nível de 5%. Valor p= 0,1336. c) β= 0,3859 d) n≥19 80*. ⎧ ⎪ H : μ = 55 b) ⎪⎨ 0 ⎪ ⎪ ⎩ H1 : μ < 55 Como Z=-1,5, não se rejeita H0 ao nível de 5%. Valor p= 0,0668 c) β= 0,2709 EAG I – SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA________________________________________ 3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA d) n≥16 81. a) P ( X min ≤ 990 | μ = 1000) = 0,3086 ⎧ H : μ = 1000 ⎪ b) ⎪⎨ 0 ⎪ ⎪ ⎩ H1 : μ ≠ 1000 Como Z= -2,4 rejeita-se H0 ao nível de 5. c) 0,0207 82. a) α=0,0013 b) β=0,9332 c) n ≥ 66. 83. ⎧ ⎪H : μ = 8 a) ⎪⎨ 0 ⎪ ⎪ ⎩ H1 : μ > 8 Como T=12,13 rejeita-se H0 ao nível de 5%. b) Erro do tipo I. 84. ⎧⎪⎪ H 0 : μ = 100 ⎨ ⎪⎪⎩ H1 : μ ≠ 100 Como T= -2,20 não se rejeita H0 ao nível de 1%. 85. a) IC95% (μ) = (54, 4;93, 6) ⎧⎪ H : μ = 100 b) ⎪⎨ 0 ⎪⎪⎩ H1 : μ < 100 Como Z= -2,60 rejeita-se H0 ao nível de 1%. Erro do tipo I. c) β=0,7967 ⎧⎪H 0 : σ 2 = 2500 d) ⎪ ⎨ 2 ⎪⎪H1 : σ ≠ 2500 ⎩ EAG I – SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA________________________________________ 4 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA Como Χ 2 = 34.56 , não se rejeita H0 ao nível de 10%. 86. ⎪⎧⎪ H 0 : μ = 2 ⎨ ⎪⎪⎩ H1 : μ < 2 Como T= -2,50 rejeita-se H0 ao nível de 1%. 87. ⎧⎪H : p = 0.8 a) ⎪⎨ 0 ⎪⎪⎩H1 : p > 0.8 Como Z = 2.5 , rejeita-se H0 ao nível de 5% e ao nível de 1%. b) p = 0,0062. 88. ⎪⎧⎪ H 0 : p = 0,5 ⎨ ⎪⎪⎩ H1 : p > 0,5 Como Z= 2,97 rejeita-se H0 ao nível de 5%. p=0,0015 89. ⎧⎪⎪ H 0 : μ1 − μ2 = 0 ⎨ ⎪⎪⎩ H1 : μ1 − μ2 ≠ 0 Como Z= 1,58 não se rejeita H0 ao nível de 5% e, consequentemente, ao nível de 1%. 90. ⎧⎪H : σ 2 = σ22 a) ⎪⎨ 0 12 2 ⎪⎪H1 : σ1 ≠ σ2 ⎩ Como F=1,20 não se rejeita H0 ao nível de 5%. ⎧ ⎪ H 0 : μ1 − μ2 = 0 b) ⎪ ⎨ ⎪ ⎪ ⎩ H1 : μ1 − μ2 ≠ 0 Como T=-4,49 rejeita-se H0 ao nível de 1%. 91. EAG I – SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA________________________________________ 5 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA ⎧⎪H 0 : σ12 = σ22 a) ⎪ ⎨ 2 2 ⎪⎪H1 : σ1 ≠ σ2 ⎩ Como F=2,78 não se rejeita H0 ao nível de 1% b) IC99% (μ1 − μ2 ) = (-21,42; 7,42) ⎧ ⎪ H 0 : μ1 − μ2 = 0 c) ⎪ ⎨ ⎪⎪⎩ H1 : μ1 − μ2 < 0 Como T= -1,32 não se rejeita H0 ao nível de 5%. ⎧ ⎪ H 0 : σ12 = 350 ⎪ d) ⎨ 2 ⎪ ⎪ ⎩ H1 : σ1 ≠ 350 Como χ2= 17,14 não se rejeita H0 ao nível de 1%. 92. ⎧⎪ H : μ − μ2 = 0 a) ⎪⎨ 0 1 ⎪⎪⎩ H1 : μ1 − μ2 ≠ 0 Como Z= -1,82 não se rejeita H0 ao nível de 5% e, consequentemente, ao nível de 1%. b) Como T= -1,57 não se rejeita H0 ao nível de 5% e, consequentemente, ao nível de 1%. 93. n1=n2≥70. 94. ⎧⎪⎪ H 0 : μ1 − μ2 = 0 ⎨ ⎪⎪⎩ H1 : μ1 − μ2 ≠ 0 Como Z= 1,64 não se rejeita H0 ao nível de 5%. 95. ⎧ ⎪ H 0 : μ = 20 a) ⎪ ⎨ ⎪ ⎪ ⎩ H1 : μ < 20 Como T= -2,50 rejeita-se H0 ao nível de 5%. b) ⎧⎪⎪ H 0 : μ1 − μ2 = 0 ⎨ ⎪⎪⎩ H1 : μ1 − μ2 ≠ 0 EAG I – SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA________________________________________ 6 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA Como T= 1,40 não se rejeita H0 ao nível de 1%. 96. ⎪⎪⎨⎧ H 0 : p1 − p2 = 0 ⎪⎪⎩ H1 : p1 − p2 ≠ 0 Como Z= -2,29 rejeita-se H0 ao nível de 5%. 97. IC99% ( p2 − p1 ) =(-0,13; 0,33) 98. a) Verdadeira b) Falsa c) Verdadeira 99. ⎧⎪⎪ H 0 : μ1 − μ2 = 0 ⎨ ⎪⎪⎩ H1 : μ1 − μ2 > 0 Como T=1,89 não se rejeita H0 ao nível de 5%. 100. ⎧⎪⎪ H 0 : μ1 − μ2 = 0 ⎨ ⎪⎪⎩ H1 : μ1 − μ2 ≠ 0 Como T=1,36 não se rejeita H0 ao nível de 5%. 101. 1,96 0,5× 0,5 (=3,06%) 1028 Nota: No caso dos testes de hipóteses deve dizer-se sempre o que significa, em cada contexto, rejeitar ou não rejeitar a hipótese testada. EAG I – SOLUÇÕES DOS EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA________________________________________ 7 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 AULA DE SPSS 1. Abordagem inicial ao SPSS Conhecimento básico dos Menus • File, Edit: Menus idênticos aos existentes em qualquer software. Servem para abrir, guardar, imprimir, etc, ficheiros. • View: Muda a fonte em que se escrevem os dados, permite visualizar o rótulo das variáveis. • Data: Funções relacionadas com a alteração estrutural do ficheiro de dados. Menu onde se inserem e definem as variáveis a utilizar • Transform: É usado para calcular novos valores e variáveis e recodificar variáveis, nomeadamente, é utilizado para a construção de classes. • Analyse: Menu que contém as ferramentas de análise, desde as ferramentas da estatística descritiva, como a construção de distribuições de frequências e a regressão, até à análise dos dados através de análise de variância, séries temporais, análise de sobrevivência, testes não paramétricos, dados categorizados, etc, etc • Graphs: Construção de todo o tipo de gráficos. 2. Introdução dos dados • Introduzir dados: File →New→data o Tipo de variáveis: numéricas, de caracteres, etc. - Data → Define variable o Definição do nome da variável (Só pode ter no máximo 8 caracteres e começar por uma letra) → Variable Name o Tipo: String, Numeric.. →Type o Formato: Nominal, Ordinal, Scale. →Measurement Licenciatura em GESTÃO ____________________________________________________________________1 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 AULA DE SPSS o Rótulos: Nome do rótulo → Labels→ Value Label (Exemplo 0 – Mascluino 1 – Feminino) o Gravar ficheiro o Abrir Ficheiro • De um ficheiro Excel É necessário que o Excel tenha os dados num formato que seja possível o SPSS ler: o nome das variáveis só pode ter, no máximo, oito caracteres. → File → Open →ficheiro do tipo *.xls • De um ficheiro SPSS → File → Open →nome.sav 3. Estatística Descritiva • Caracterizar a variável na folha Variable View • Analyze → Descriptive Statistic → Frequencies - Escolha das variáveis - Quadro de frequências - Analisar as opções: Statistics, Graphs. • Representações gráficas - Gráficos de barras - Box-Plot - Histogramas Licenciatura em GESTÃO ____________________________________________________________________2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 AULA DE SPSS NOTA: A medida de Assimetria usada pelo SPSS: n ∑ n i (x i − x ) 3 m3 n2 g1 = = (n −1)(n − 2)s '3 (n −1)(n − 2) s '3 i Erro padrão de g1: 6n (n −1) (n − 2)(n + 1)(n + 3) distribuição simétrica→ g1=0 distribuição assimétrica positiva → g1>0 distribuição assimétrica negativa → g1<0 A medida de Achatamento usada pelo SPSS é: n (n + 1) m4 (n −1) − 3× g2 = 4 − − − 1 2 3 ' n n n s ( )( )( ) (n − 2)(n − 3) 2 distribuição mesocúrtica → g2 = 0 distribuição platicúrtica → g2 < 0 distribuição leptocúrtica → g2 > 0 Licenciatura em GESTÃO ____________________________________________________________________3 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 AULA DE SPSS Se pretendermos construir classes: Transform/Recode/Into Different Variables... Seleccionar variável ContFisc como Numeric Variable Para Output Variable definir Name: CFClas Label: CFClas Clique em Old and New Values New Value Old→New 0 Through 1000 1 Add 1000 Through 2000 2 Add 2000 Through 3000 3 Add 3000 Through 4000 4 Add 4000 Through 5000 5 Add 5000 Through 6000 6 Add Old Value Range: Continue Change Ver outputs no exercício 4 Licenciatura em GESTÃO ____________________________________________________________________4 Aula 2 de SPSS (Intervalos de Confiança e Testes de Hipóteses) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Lisboa 13.6 16.8 15.0 16.5 12.2 12.5 18.5 12.8 18.0 16.7 Porto 13.4 8.0 15.7 16.0 15.0 12.3 12.5 11.4 13.6 Resultado 13.6 16.8 15.0 16.5 12.2 12.5 18.5 12.8 18.0 16.7 13.4 8.0 15.7 16.0 15.0 12.3 12.5 11.4 13.6 Cidades 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 Inicio 12 18 14 13 20 7 11 10 15 17 12 15 Fim 8 19 10 13 16 12 11 14 16 11 6 10 Antes 51 48 52 48 53 54 48 Depois 48 47 50 48 45 50 50 Os dados Lisboa e Porto (Resultado e Cidade) correspondem a classificação de desempenho de empregados de determinada empresa nas sucursais de Lisboa a Porto. Os dados (Início, Fim) e (Antes, Depois) correspondem aos exercícios 100 e 99, respectivamente, da folha de exercícios de EAG1. Group Statistics Classificação dos empregados Cidades Lisboa Porto N Mean 15.260 13.100 10 9 Std. Deviation 2.3533 2.4754 Std. Error Mean .7442 .8251 One-Sample Test Test Value = 0 t Classificação dos empregados da socursal de Lisboa df 20.505 9 Sig. (2-tailed) Mean Difference .000 15.2600 95% Confidence Interval of the Difference Lower Upper 13.577 16.943 Dos outputs anteriores podemos, por exemplo, retirar a seguinte informação: • IC95%(µL) = (13.577; 16.943) • ⎧ H 0 : µ L = 13 ⎨ ⎩ H 1 : µ L > 13 E.T. T= X − µ0 S n ∩t (n − 1) Rc: [1.833; +∞ [ T0 = (15.26-13) /0.7442 = 3.037 ∈ Rc → Rejeitar H0 a 5% Para efectuar o teste acima, caso “Test Value = 13” bastaria olhar para o valor p do teste e dividir por 2, pois neste caso temos um teste unilateral. Note-se que para obter o IC95%(µL), teríamos de adicionar o valor colocado em “Test Value”, tal como se pode observar facilmente no output seguinte: One-Sample Test Test Value = 13 t Classificação dos empregados da socursal de Lisboa • df 3.037 Sig. (2-tailed) Mean Difference .014 2.2600 9 95% Confidence Interval of the Difference Lower Upper .577 3.943 ⎧ H 0 : µ L = 13 ⎨ ⎩ H 1 : µ L > 13 E.T. T= X − µ0 S n ∩t (n − 1) T0= 3.037 p =0.014/2 = 0.007 → Rejeitar H0 aos níveis usuais de significância. Amostras Independentes Compare-se as classificações de Lisboa e Porto considerando nível de significância de 10% Independent Samples Test Levene's Test for Equality of Variances F Classificação dos empregados Equal variances assumed Equal variances not assumed .140 Sig. .713 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 90% Confidence Interval of the Difference Lower Upper 1.949 17 .068 2.1600 1.1080 .2325 4.0875 1.944 16.565 .069 2.1600 1.1112 .2241 4.0959 Teste T: duas amostras com variâncias iguais Teste F: duas amostras para variâncias Variável 1 Variável 2 15.26 13.1 5.538222 6.1275 10 9 9 8 0.903831 0.437754 0.309638 Média Variância Observações gl F P(F<=f) uni-caudal F crítico uni-caudal • E.T. Variável 1 Variável 2 15.26 13.1 5.538222222 6.1275 10 9 5.815529412 0 17 1.94941174 0.03397036 1.739606432 0.06794072 2.109818524 ⎧H 0 : µ L = µ P ⎧H 0 : µ L − µ P = 0 ⇔⎨ ⎨ ⎩H1 : µ L ≠ µ P ⎩H1 : µ L − µ P ≠ 0 T= (X 1 − X 2 ) − (µ1 − µ 2 )0 (n1 − 1)S12 + (n2 − 1)S 2 n1 + n 2 − 2 • Média Variância Observações Variância agrupada Hipótese de diferença de média gl Stat t P(T<=t) uni-caudal t crítico uni-caudal P(T<=t) bi-caudal t crítico bi-caudal ∩t 1 1 + n1 n 2 ⎧H 0 : µ L − µ P = 0 ⎧H 0 : µ L = µ P ⇔⎨ ⎨ ⎩H1 : µ L − µ P > 0 ⎩H1 : µ L > µ P Se pretendermos testar ⎧H 0 : µ L − µ P = 1 ⎧H : µ = µ P + 1 • ⎨ 0 L ⇔⎨ ⎩H 1 : µ L − µ P > 1 ⎩H 1 : µ L > µ P + 1 (n1 + n2 − 2) ; T0= 1.949 T0= 1.949 p = 0.068 < 0.1→ Rejeitar H0 a 10% p = 0.068 /2 = 0.034 < 0.1→ Rejeitar H0 a 10% Rc: [1.333; +∞ [ T0 = 2.16 − 1 = 1.047 ∉ Rc → Não Rejeitar H0 a 10% 1.108 O pressuposto de variâncias homogéneas facilmente é verificado. Por exemplo, através do output obtido pelo EXEL podemos efectuar o teste paramétrico: ⎧ σ L2 : =1 H ⎪ 0 ⎧⎪ H 0 : σ L2 = σ P2 σ P2 ⎪ ⇔⎨ ⎨ 2 ⎪⎩ H 1 : σ L2 > σ P2 ⎪H : σ L > 1 ⎪ 1 σ2 P ⎩ onde F0 = 0.904 e p = 0.438→ Não Rejeitar H0 aos níveis usuais de significância. Já através do output do SPSS podemos chegar a conclusões semelhantes através dos resultados do teste não paramétrico de Levene. Amostras Emparelhadas Paired Samples Statistics Pair 1 Inicio Fim Mean 13.67 12.17 N 12 12 Std. Deviation 3.627 3.664 Std. Error Mean 1.047 1.058 Paired Samples Test Paired Differences Pair 1 Inicio - Fim Mean 1.500 Std. Deviation 3.826 Std. Error Mean 1.104 95% Confidence Interval of the Difference Lower Upper -.931 3.931 t 1.358 df 11 Sig. (2-tailed) .202 Teste T: duas amostras emparelhadas para médias Variável 1 Variável 2 13.6666667 12.1666667 13.1515152 13.4242424 12 12 0.4492825 Média Variância Observações Correlação de Pearson Hipótese de diferença de média gl Stat t P(T<=t) uni-caudal t crítico uni-caudal P(T<=t) bi-caudal t crítico bi-caudal • 0 11 1.35820488 0.10080121 1.79588369 0.20160241 2.20098627 ⎧H 0 : µ I − µ F = 0 ⎧H 0 : µ I = µ F ⇔⎨ ⎨ ⎩H 1 : µ I − µ F ≠ 0 ⎩H 1 : µ I ≠ µ F E.T. T= D − µ0 SD n ∩t (n − 1) onde T0 = 1.358 e p = 0.202→ Não Rejeitar H0 aos níveis usuais de significância. 1. Para avaliar o desempenho de duas agências de um dado banco na subscrição de Planos Poupança, observaram-se os valores subscritos na agência A durante 6 semanas obtendo-se uma média igual a 120 e um desvio padrão igual a 20 unidades monetárias; observaram-se também os valores subscritos na agência B durante 8 semanas obtendo-se uma média igual a 99 e um desvio padrão igual a 25 unidades monetárias. a) Admitindo que os valores subscritos em Planos Poupança seguem distribuições normais, verifique que pode assumir a igualdade das variâncias das populações e obtenha e interprete um intervalo de confiança a 95% para a diferença média dos valores subscritos em Planos Poupança nas duas agências. b) Com base no output do SPSS, comente a seguinte proposição: “Existe evidência estatística na amostra, ao nível de 5%, de que o valor médio subscrito em Planos Poupança na agência A é superior a 100 unidades monetárias por semana.”. One-Sample Test Test Value = 100 AgênciaA t 2,453 df 5 Sig. (2-tailed) ,058 Mean Difference 20,000 95% Confidence Interval of the Difference Lower Upper -,96 40,96 2. O serviço de transportes públicos de uma grande cidade tem vindo a ser alvo de fortes críticas desde que alterou os itinerários da sua rede de transportes. Em particular, os utentes de um determinado percurso afirmam que com o novo sistema os trajectos entre casa e trabalho têm uma duração média superior a 10 minutos aos registados com o antigo sistema. O serviço de transportes resolveu estudar a situação e seleccionou aleatoriamente 12 autocarros, registando os tempos que demoraram a fazer um determinado percurso, antes e depois da implementação do novo sistema: Antes 20 17 23 30 20 35 38 22 21 26 18 16 Depois 32 34 43 44 33 35 36 45 42 48 34 32 A partir destes dados obteve-se o seguinte output do SPSS: Paired Samples Test Paired Differences Mean Pair 1 Antes - Depois ? Std. Deviation 8,00 Std. Error Mean 2,31 95% Confidence Interval of the Difference Lower Upper -19,41 -9,26 t ? df 11 Sig. (2-tailed) ,00007 Admitindo que os tempos de percurso seguem uma distribuição aproximadamente normal, acha que a amostra apresenta evidência estatística que suporte a veracidade da afirmação dos utentes ao nível de 5%? Obtenha os dois valores que faltam no output. 3. Admita que pretende comprar uma máquina e que tem duas propostas alternativas. Para avaliar o desempenho das duas máquinas alternativas A e B observaram-se, num período experimental de 12 dias, os índices de produtividade obtidos com cada uma. Como a máquina A tem um custo ligeiramente superior, apenas se avançará para a sua compra no caso da diferença de produtividade entre as duas máquinas ser superior a 2 unidades no referido índice. Realizada uma análise de dados que se entendeu conveniente, obteve-se o seguinte output: Group Statistics Prod Máquinas Máquina A Máquina B N 12 12 Mean 126,6667 104,0833 Std. Deviation 16,67515 26,19666 Std. Error Mean 4,81370 7,56233 Independent Samples Test Levene's Test for Equality of Variances F Prod Equal variances assumed Equal variances not assumed 1,780 Sig. ,196 t-test for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 90% Confidence Interval of the Difference Lower Upper 2,519 22 ,020 22,58333 8,96440 7,19016 37,97650 2,519 18,657 ,021 22,58333 8,96440 7,06809 38,09858 Refira o que pode concluir a partir do output apresentado. Ao nível de 5%, que máquina aconselharia a administração a comprar? 4. Realizou-se uma análise estatística aos ganhos por hora de trabalho, numa determinada unidade monetária, a partir de uma amostra aleatória de 8 indivíduos com uma determinada profissão liberal A e de uma amostra aleatória de 6 indivíduos com uma profissão liberal B, tendo-se obtido os seguintes outputs: Teste F: duas amostras para variâncias Variável 1 Média 61.5000 Variância 878.8571 Observações 8 gl 7 F 1.0055 P(F<=f) uni-caudal 0.5162 Variável 2 36.6813 874.0556 6 5 Teste T: duas amostras com variâncias iguais Média Variância Observações Variância agrupada Hipótese de diferença de média gl Stat t P(T<=t) uni-caudal t crítico uni-caudal P(T<=t) bi-caudal Variável 1 Variável 2 61.5000 36.68133 878.8571 874.0556 8 6 876.8565 0 12 1.5519 0.0733 1.7823 0.1466 Admitindo a normalidade das remunerações, poderemos concluir, ao nível de 10%, que o ganho médio por hora na profissão A é superior ao ganho médio por hora na Profissão B? E superior a 2 unidades? Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 FORMULÁRIO DE APOIO I xp = li + np − N i−1 × Ri ni s2 = ⎧⎪ x[np ] + x[np ]+1 ⎪⎪ , np ∈ ` xp = ⎪⎨ 2 ⎪⎪ ⎪⎪⎩ x[np ]+1 , np ∉ ` 1 n 2 ni ( xi − x ) ∑ n i=1 [Q1 − 3IQ, Q3 + 3IQ ] IQ = Q3 − Q1 k m3 = m − 3m m + 2 (m ) ' 3 ' 2 ' 3 1 ' 1 ∑ n (x − x ) r i mr = m4 = m4' − 4m3' m1' + 6m2' (m ) − 3(m ) ' 2 1 ' 4 1 i i =1 n k ∑n x r i i mr' = γ1 = i =1 n i pi = γ2 = j =1 k qi = j ∑ ni xi j =1 k ∑n x g= Q3 − Q1 Q3 − Q1 2 ( P90 − P10 ) x − xˆ s k −1 ∑q i G = 1− i i j =1 (Q3 − x)− ( x − Q1 ) m4 −3 s4 i ∑ nj ∑n m3 s3 i =1 k −1 ∑p P ( Ai | B ) = n P ( B ) = ∑ P ( B | Ai )P ( Ai ) n ∑ P ( A ) P (B | A ) k i , i = 1, 2, ..., n k k =1 i =1 j =1 P ( Ai )× P ( B | Ai ) P ( A − B ) = P ( A ∩ B ) = P ( A) − P ( A ∩ B ) i =1 P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) P ( A ∩ B ) = P ( A).P ( B | A) = P ( B ) P ( A | B ) x F ( x) = ∑ P ( X = k ) ; F ( x) = ∫ f (u )du k ≤x μ = E(X ' m P (a < X ≤ b) = F (b) − F (a) −∞ m ) = ∑ ( x) P ( X = x) m x +∞ ; μ = ∫ x m f ( x)dx ' m −∞ m m μm = E ⎢⎡( X − E ( X )) ⎥⎤ = ∑ ( x − E ( X )) P ( X = x ) ; μm = ⎣ ⎦ x m −∞ ∫ f ( x, y )dy −∞ y x ∫ ( x − E ( X )) +∞ p ( x ) = P ( X = x ) = ∑ P ( X = x, Y = y ) ; f X ( x ) = p ( y ) = P ( Y = y ) = ∑ P ( X = x, Y = y ) ; f Y ( y ) = +∞ +∞ ∫ f ( x, y )dx −∞ σ XY = C ov( X , Y ) = E ⎡⎣( X − E ( X ) )(Y − E (Y ) ) ⎤⎦ = E ( XY ) − E ( X ) E (Y ) E ( XY ) = ∑∑ xi y j P ( X = xi , Y = y j ) ; E ( XY ) = xi yj +∞ +∞ ∫ ∫ xyf ( x, y)dxdy −∞ −∞ f ( x)dx Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 FORMULÁRIO DE APOIO I Var ( X ± Y ) = Var ( X ) + Var (Y ) ± 2C ov( X , Y ) ⎛ n⎞ n− k P ( X = k ) = ⎜⎜ ⎟⎟⎟ p k (1− p ) , k = 0, 1, ..., n ; E ( X ) = np ; Var ( X ) = np(1- p) ⎜⎝k ⎠⎟ k −1 P ( X = k ) = (1− p ) P( X = k) = p, k = 1, 2, ... ; E ( X ) = 1 1- p ; Var ( X ) = 2 p p e−λλ k , k = 0, 1, ... λ > 0 ; E ( X ) = Var ( X ) = λ k! (b - a) x−a a +b 1 f ( x) = a < x < b ; F ( x) = , a < x < b ; E( X ) = ; Var ( X ) = b−a b−a 2 12 2 f (t ) = λe−λt , t ≥ 0 λ >0 ; F (t ) = 1− e−λt , t ≥ 0 λ >0 ; E (T ) = ∑X i i ( & N nμ , σ n ∩ ) ; 1 λ ; Var (T ) = X − np X −λ & N (0,1) ; & N (0,1) ∩ ∩ np (1 − p ) λ EAG I – FORMULÁRIO DE APOIO I____________________________________________________ 2 1 λ2 Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão II - 2007/2008 SEGUNDA FREQUÊNCIA – 7 de Dezembro de 2007 ⎛ n⎞ n−k P ( X = k ) = ⎜⎜ ⎟⎟⎟ p k (1− p ) , k = 0, 1, ..., n ; E ( X ) = np ; Var ( X ) = np (1- p) ⎜⎝k ⎟⎠ k −1 P ( X = k ) = (1− p ) P( X = k) = p, k = 1, 2, ... ; E ( X ) = 1 1- p ; Var ( X ) = 2 p p e−λλ k , k = 0, 1, ... λ > 0 ; E ( X ) = Var ( X ) = λ k! (b - a) x−a a +b 1 f ( x) = a < x < b ; F ( x) = , a < x < b ; E( X ) = ; Var ( X ) = b−a b−a 2 12 2 f (t ) = λe−λt , t ≥ 0 λ >0 ; F (t ) = 1− e−λt , t ≥ 0 λ >0 ; E (T ) = ∑X i ( N nμ , σ n ∩ i ) ; 1 λ ; Var (T ) = 1 λ2 X − np X −λ ⎛ σ ⎞ N (0,1) ; N (0,1) ; X ∩ N ⎜ μ, ∩ ∩ ⎟ n⎠ λ np (1 − p ) ⎝ () () EQM ( θˆ ) = Var ( θˆ ) + ⎡ Env ( θˆ ) ⎤ ⎣ ⎦ Env θˆ = E θˆ − θ { 2 lim E θ = θ ; lim Var θ = 0 n →∞ () n →∞ () n n k =1 k =1 L ( θ ) = ∏ f ( x k ) ou L ( θ ) = ∏ P ( X = x k ) 2 ⎧⎪ ⎡ d ⎡ d2 ⎤ ⎤ ⎫⎪ I ( θ ) = E ⎨ ⎢ ln f ( x | θ ) ⎥ ⎬ = −E ⎢ 2 ln f ( x | θ ) ⎥ ⎦ ⎪⎭ ⎣ dθ ⎦ ⎪⎩ ⎣ dθ +∞ ⎧ ' r r ' r ⎪μ r = E ( X ) = ∑ ( x k ) P ( X = x k ) ; μ r = ∫ x f (x)dx xk −∞ ⎪⎪ μ'r = m'r com ⎨ n r ( xi ) ⎪ ∑ ⎪ m 'r = i=1 ⎪⎩ n ⎛ ⎛ σ σ ⎞ X −μ s s ⎞ ; ⎜x − t ∩ t n −1 ; ⎜ x − z α × ,x+t , x+z α × ⎟ ⎟ α × α × n −1, 1− n −1, 1− S 1− 1− n n⎠ n n⎠ ⎝ 2 2 ⎝ 2 2 n UNIVERSIDADE DE ÉVORA - Departamento de Matemática ESTATÍSTICA APLICADA À GESTÃO I - 2007/08 FORMULÁRIO DE INFERÊNCIA ESTATÍSTICA DISTRIBUIÇÕES AMOSTRAIS INTERVALOS DE CONFIANÇA ⎛ σ ⎞ X ∩ N ⎜ μ, ⎟ n⎠ ⎝ ⎛ σ σ ⎞ , x+z α × ⎜ x − z1− α × ⎟ 1− n n⎠ 2 2 ⎝ Z= X − μ0 σ n X −μ ∩ t n −1 S n ⎛ s s ⎞ ,x+t ⎜ x − t n −1, 1− α × ⎟ α × n −1, 1− n n⎠ 2 2 ⎝ T= X − μ0 S n ( n − 1) S2 ∩ χ2 σ2 n −1 ESTATÍSTICA DE TESTE ⎛ ⎞ ⎜ 2 n −1 2 n −1 ⎟ ,s 2 ⎟ ⎜ s χ2 χα ⎟ α ⎜ 1− ,n −1 ,n −1 2 2 ⎝ ⎠ ⎛ p (1 − p ) ⎞ N ⎜ p, ⎟ p̂ ∩ ⎜ ⎟ n ⎝ ⎠ ⎛ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎞ ⎜ pˆ − z α × ⎟ , pˆ + z α × 1− 1− ⎜ ⎟ n n 2 2 ⎝ ⎠ S12 σ22 × ∩ Fn1 −1,n2 −1 S22 σ12 ⎛ s22 ⎞ s22 F , ⎜ 2 n −1,n −1, α 2 Fn −1,n −1, 1− α ⎟ 2 ⎠ ⎝ s1 1 2 2 s1 1 2 ⎛ σ2 σ2 ⎞ X1 − X 2 ∩ N ⎜ μ1 − μ 2 , 1 + 2 ⎟ ⎜ n1 n 2 ⎟⎠ ⎝ ⎛ σ2 σ2 σ2 σ2 ⎞ ⎜ x1 − x 2 − z α × 1 + 2 , x1 − x 2 + z α × 1 + 2 ⎟ ⎜ 1− 1− n1 n 2 n1 n 2 ⎟⎠ 2 2 ⎝ Χ 2 Z= n − 1) S2 ( = σ02 p̂ − p0 p0 (1 − p0 ) n F= (X 1 S12 S22 − X 2 ) − ( μ1 − μ 2 )0 σ12 σ22 + n1 n 2 UNIVERSIDADE DE ÉVORA - Departamento de Matemática ESTATÍSTICA APLICADA À GESTÃO I - 2007/08 FORMULÁRIO DE INFERÊNCIA ESTATÍSTICA DISTRIBUIÇÕES AMOSTRAIS (X 1 − X 2 ) − ( μ1 − μ 2 ) 1 1 Ŝ + n1 n 2 ∩ t n1 + n2 −2 ( n1 − 1) S12 + ( n 2 − 1) S22 com Sˆ = n1 + n 2 − 2 ( D) − (μ 1 − μ2 ) Sd n com Sd = ∩ t n −1 2 1 n Di − D ) ( ∑ n − 1 i =1 ⎛ p (1 − p1 ) p 2 (1 − p 2 ) ⎞ N ⎜ p1 − p 2 , 1 ⎟ pˆ 1 − pˆ 2 ∩ + ⎜ ⎟ n n 1 2 ⎝ ⎠ INTERVALOS DE CONFIANÇA ESTATÍSTICA DE TESTE ⎛ 1 1 1 1 ⎞ ˆ + , x1 − x 2 + t + ⎟ ⎜ x1 − x 2 − t n + n −2, 1− α × sˆ α ×s n1 + n 2 − 2, 1− 1 2 n1 n 2 n1 n 2 ⎠ 2 2 ⎝ com sˆ = T= (X − X 2 ) − ( μ1 − μ 2 )0 1 Ŝ ( n1 − 1) s12 + ( n 2 − 1) s22 1 1 + n1 n 2 n1 + n 2 − 2 ⎛ sd sd ⎞ , d+t ⎜ d − t n −1, 1− α × ⎟ α × n −1, 1− n n⎠ 2 2 ⎝ com s d = T= 2 1 n di − d ) ( ∑ n − 1 i =1 ⎛ pˆ (1 − pˆ 1 ) pˆ 2 (1 − pˆ 2 ) pˆ (1 − pˆ 1 ) pˆ 2 (1 − pˆ 2 ) ⎞ ⎜ pˆ 1 − pˆ 2 − z α × 1 ⎟ , pˆ 1 − pˆ 2 + z α × 1 + + 1− 1− ⎜ ⎟ n n n n 1 2 1 2 2 2 ⎝ ⎠ Z= D − ( μ1 − μ 2 )0 Sd n ( pˆ 1 − pˆ 2 ) − ( p1 − p 2 )0 pˆ 1 (1 − pˆ 1 ) pˆ 2 (1 − pˆ 2 ) + n1 Estimação Pontual () () EQM ( θˆ ) = Var ( θˆ ) + ⎡ Env ( θˆ ) ⎤ ⎣ ⎦ +∞ ⎧ ' r r ' r ⎪μ r = E ( X ) = ∑ ( x k ) P ( X = x k ) ; μ r = ∫ x f (x)dx xk −∞ 2 ⎪⎪ ; μ'r = m'r com ⎨ n r x ( ) ⎪ ∑ i ⎪ m 'r = i=1 lim E θ = θ ; lim Var θ = 0 n →∞ n →∞ ⎪⎩ n { () () n n k =1 k =1 L ( θ ) = ∏ f ( x k ) ou L ( θ ) = ∏ P ( X = x k ) Env θˆ = E θˆ − θ ; dL ( θ | x ) d ln L ( θ | x ) = 0 ou =0 dθ dθ n2 Provas de avaliação Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2006/2007 PRIMEIRA FREQUÊNCIA – 4 de Novembro de 2006 1. Considere a distribuição do número de empresas por Concelho no ano 2000 em Portugal (Censos 2001): Número de empresas [0, 500) Número de Concelhos 34 [500, 1000) 74 [1000, 2000) 74 b) Comente, sem efectuar cálculos, a [2000, 5000) 66 proposição: “ A moda da distribuição [5000, 10000) 36 pertence ao intervalo (750, 1000).” [10000, 20000) 17 [20000, 150000] 7 a) Calcule a mediana e interprete o seu valor. c) Classifique a distribuição quanto à assimetria. d) Complete as seguintes afirmações: i) ____% dos Concelhos têm pelo menos 1000 empresas. iii) Aos 7,8% dos Concelhos com maior número de empresas pertencem ____% do total das empresas do país. e) Calcule o índice de Gini. Comente. 2. Admita que as aplicações em 25 depósitos a prazo (em centos de euros) num dado Banco foram os seguintes: 5 25 40 60 60 65 70 75 75 75 75 80 80 85 85 85 88 90 92 92 92 95 105 125 80 a) Esboce a caixa-de-bigodes. Comente. b) Da análise, através do SPSS, de uma amostra de aplicações em acções resultou o seguinte output: Statistics acções N Mean Median Mode Std. Deviation Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Minimum Maximum Percentiles Valid Missing 25 50 75 25 283 55,00 55,00 55 19,843 -,030 ,464 ,662 ,902 10 100 45,00 55,00 67,50 O seu colega do lado concluiu que os clientes preferem investir em aplicações de menor risco (depósitos a prazo). Tendo a informação adicional de que o segundo momento central da distribuição dos valores dos depósitos a prazo é igual a 26.6, concluiu também que há uma maior dispersão dos valores aplicados em acções. Concorda com estas conclusões? 3. Num sorteio foram emitidos 10000 bilhetes. Sorteia-se um prémio de 5000 euros, dez prémios de 500 euros e cem prémios de 50 euros. Calcule o valor de cada bilhete de modo a que o jogo seja equilibrado. 4. Considere a v. a. X (número de unidades vendidas diariamente de um dado produto), tem a seguinte distribuição: x 0 1 2 3 4 F(x) 0,3 0,5 0,7 0,9 1 Obtenha a função de probabilidade de X e diga quantas unidades de produto deverá haver em stock de modo a que num dado dia a probabilidade de satisfazer todos os clientes seja superior a 75%. 5. Sabe-se que, num dado país, 45% dos utilizadores de Internet em casa são clientes de uma empresa A, 35% são clientes de um empresa B e 20% são clientes das restantes empresas fornecedoras do serviço. Num estudo de mercado, 25% dos clientes da empresa A afirmam estar satisfeitos com o serviço, o mesmo acontecendo com metade dos clientes da empresa B e com 85% dos clientes das restantes empresas. Seleccionada aleatoriamente uma pessoa que utiliza a Internet em casa: a) Calcule a probabilidade de não ser cliente da empresa A e estar satisfeito com o serviço. b) Determine a probabilidade de ser cliente da empresa A sabendo que se trata de um cliente insatisfeito. 6. Mostre que se A (i) B então A (i) B . Apoio: xp = li + np − N i−1 × Ri ni s2 = ⎧⎪ x[np ] + x[np ]+1 ⎪⎪ , np ∈ ` xp = ⎪⎨ 2 ⎪⎪ ⎪⎪⎩ x[np ]+1 , np ∉ ` 1 n 2 ni ( xi − x ) ∑ n i=1 [Q1 − 3IQ, Q3 + 3IQ ] IQ = Q3 − Q1 k m3 = m − 3m m + 2 (m ) ' 3 ' 2 ' 1 ' 3 1 ∑ n (x − x ) r i m4 = m4' − 4m3' m1' + 6m2' (m ) − 3(m ) ' 2 1 ' 4 1 mr = i i =1 n k ∑n x r i i mr' = i =1 n γ1 = i pi = ∑ nj j =1 k ∑n j j =1 m3 s3 γ2 = qi = j =1 k ∑n x g= Q3 − Q1 x − xˆ s Q3 − Q1 2 ( P90 − P10 ) k −1 i ∑ ni xi (Q3 − x)−( x − Q1 ) m4 −3 s4 ∑q i G = 1− i i j =1 n P ( B ) = ∑ P ( B | Ai )P ( Ai ) i =1 P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) i =1 k −1 ∑p i i =1 P ( Ai | B ) = P ( Ai )× P ( B | Ai ) n ∑ P ( A ) P (B | A ) k , i = 1, 2, ..., n k k =1 P ( A − B ) = P ( A ∩ B ) = P ( A) − P ( A ∩ B ) P ( A ∩ B ) = P ( A).P ( B | A) = P ( B ) P ( A | B ) Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 SEGUNDA FREQUÊNCIA – 7 de Dezembro de 2007 1. De acordo com o Barómetro de Telecomunicações da Marktest, no trimestre móvel de Outubro de 2007, 1 304 000 residentes em Portugal com 15 e mais anos afirmam já ter mudado de operador de rede móvel, um valor que corresponde a 17.2% dos possuidores de telemóvel nesta faixa etária. Admita que está a fazer um inquérito sobre telecomunicações. Calcule a probabilidade de necessitar inquirir pelo menos 4 pessoas até encontrar uma que tenha mudado de operador. 2. Num gabinete de análise financeira, os projectos desenvolvidos têm custos de execução com distribuição normal de média 700 € e desvio padrão 100€. O projecto é considerado eficiente se o seu custo de execução não exceder a média em mais de um desvio padrão. a) Calcule a probabilidade de um projecto, escolhido aleatoriamente, ser considerado eficiente. b) Em 10 projectos desenvolvidos pelo gabinete, determine a probabilidade de pelo menos 2 serem considerados eficientes. c) Obtenha o afastamento, relativamente à média, que o custo de um projecto deverá ter para estar entre os 10% de projectos mais eficientes. 3. Seja X uma variável aleatória com a seguinte função de probabilidade: X 0 1 2 3 4 p(x) 1- 4 α α α α α Obtenha o estimador do parâmetro α pelo método dos momentos e diga, justificando, se acha preferível o estimador α1 = X1 + X n ao estimador obtido pelo método dos momentos. 20 4. Numa pizzaria o número de pedidos para entregas ao domicílio é uma variável aleatória com distribuição de Poisson de parâmetro λ. a) Obtenha o estimador de máxima verosimilhança de λ. b) Sabendo que em 10 horas foram recebidos 40 pedidos, determine uma estimativa de máxima verosimilhança para a probabilidade da pizzaria receber no máximo dois pedidos num quarto de hora. 5. Diga, justificando, se são verdadeiras ou falsas as seguintes proposições: a) Se a dimensão da amostra se mantiver fixa, a precisão de um intervalo de confiança diminui quando aumenta o nível de confiança. b) Um estimador consistente é sempre um estimador centrado. 6. Numa multinacional, o responsável pela comercialização de um produto alimentar, não sazonal e de procura rígida, apurou que as vendas semanais tinham distribuição (aproximadamente) normal com média µ toneladas e desvio padrão 1 tonelada. Com base nas vendas de 25 semanas obteve uma média igual a 20500 quilos e um intervalo de confiança das vendas médias semanais (19882, 21118). a) Determine o nível de confiança do intervalo obtido? b) Qual deve ser a dimensão da amostra para reduzir o erro de estimativa para 250 kg, considerando o nível de confiança 95%? 7. Com o objectivo de determinar a concentração de monóxido de carbono perto de uma das vias mais movimentadas da cidade de Évora, foram recolhidas 8 amostras de ar para um período de 3 meses, tendo-se obtido as concentrações: 102; 95; 104; 99; 88; 91; 102; 103. Obtenha um intervalo de confiança a 95% para a concentração média de monóxido de carbono perto daquela via. FORMULÁRIO DE APOIO n n−k P ( X = k ) = p k (1− p ) , k = 0, 1, ..., n ; E ( X ) = np ; Var ( X ) = np (1- p ) k k −1 P ( X = k ) = (1− p ) P( X = k) = p, k = 1, 2, ... ; E ( X ) = 1 1- p ; Var ( X ) = 2 p p e−λλ k , k = 0, 1, ... λ > 0 ; E ( X ) = Var ( X ) = λ k! 2 (b - a) 1 x−a a +b f ( x) = a < x < b ; F ( x) = , a < x < b ; E( X ) = ; Var ( X ) = b−a b−a 2 12 f (t ) = λe−λt , t ≥ 0 λ >0 ; F (t ) = 1− e−λt , t ≥ 0 λ >0 ; E (T ) = ∑X i ( N nµ , σ n ∩ i ) ; 1 λ ; Var (T ) = 1 λ2 X − np X −λ σ N (0,1) ; N (0,1) ; X ∩ N µ, ∩ ∩ λ n np (1 − p ) () () EQM ( θˆ ) = Var ( θˆ ) + Env ( θˆ ) Env θˆ = E θˆ − θ { () 2 () lim E θ = θ ; lim Var θ = 0 n →∞ n →∞ n n k =1 k =1 L ( θ ) = ∏ f ( x k ) ou L ( θ ) = ∏ P ( X = x k ) 2 d d2 I ( θ ) = E ln f ( x | θ ) = − E 2 ln f ( x | θ ) dθ dθ +∞ ' r r ' r µ r = E ( X ) = ∑ ( x k ) P ( X = x k ) ; µ r = ∫ x f (x)dx xk −∞ ' ' µ r = m r com n r ( xi ) ∑ m 'r = i=1 n X −µ σ σ s s ∩ t n −1 ; x − z α × ; x − t , x+z α × ,x+t α × α × S n −1, 1− n −1, 1− 1− 1− n n n n 2 2 2 2 n Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 TERCEIRA FREQUÊNCIA – 12 de Janeiro de 2008 1. Um dado equipamento de enchimento automático está regulado para encher garrafas de meio litro de um dado refrigerante. Do comportamento do processo ao longo do tempo, podemos admitir uma distribuição normal com desvio padrão conhecido e igual a 4 mililitros. a) Suponha que retirou da linha de enchimento uma amostra aleatória de quatro garrafas tendo obtido uma média igual a 495 ml. Pode afirmar, estatisticamente ao nível de 5%, que o equipamento está a encher embalagens com peso médio superior ao especificado? b) Relativamente à alínea anterior, indique o tipo de erro que pode ter cometido. Diga, ainda, para que níveis de significância mantém a conclusão retirada anteriormente. c) Caso a quantidade média vertida em cada garrafa seja igual a 496 ml, calcule e interprete a probabilidade de cometer um erro do tipo II para amostras de 4 garrafas e mantendo o nível de significância usado na alínea a). 2. No contexto do exercício 2), admita que para reduzir a variabilidade foram realizados ajustamentos ao processo e que numa amostra aleatória de 9 garrafas, retiradas após esses ajustamentos, se obteve um desvio padrão igual a 2 ml. Haverá evidência estatística suficiente para poder concluir, ao nível de 10%, que os ajustamentos realizados atingiram o objectivo pretendido? 3. Comente a seguinte proposição: “Se o intervalo de confiança a 99% para a diferença de proporções fôr (0.07, 0.15), então existe evidência estatística suficiente na amostra para concluir que as proporções diferem ao nível de 5%.”. 4. Com base em informação recolhida no mês passado, sabe-se que numa dada região 30% de das pessoas fumava mais de um maço por dia. Após a introdução da nova lei, realizou-se um inquérito a 800 pessoas, tendo 150 afirmado que fuma mais de um maço diariamente. a) Haverá evidência estatística suficiente, ao nível de 1%, para concluirmos que houve uma redução do consumo de cigarros? b) Admita que pretende uma estimativa intervalar da proporção de pessoas que fuma menos de um maço diariamente, com uma confiança de 95% e um erro máximo de 2%. Quantas pessoas deveriam ser inquiridas? 5. Um componente industrial foi fabricado por 2 métodos diferentes: método A e método B. Sabe-se que os tempos de fabrico (em minutos) se comportam de forma aproximadamente normal. Realizou-se uma análise estatística a partir dos tempos de fabrico de 12 componentes pelo método A e outros 12 pelo método B, tendo-se obtido os seguintes outputs do EXCEL e do SPSS: Teste F: duas amostras para variâncias Média Variância Observações gl F P(F<=f) uni-caudal F crítico uni-caudal Método A Método B 8,5000 7,9250 0,3473 0,1766 12 12 11 11 1,9665 0,1387 2,8179 Independent Samples Test Levene's Test for Equality of Variances F Tempos Equal variances assumed Equal variances not assumed t-test for Equality of Means Sig. 2,704 t ,114 df Sig. (2-tailed) Mean Difference Std. Error Difference 99% Confidence Interval of the Difference Lower Upper 2,752 22 ,012 ,57500 ,20894 -,01395 1,16395 2,752 19,889 ,012 ,57500 ,20894 -,01985 1,16985 a) Haverá evidência estatística, ao nível de 5%, para concluir que o tempo de execução pelo método A é superior a 8 minutos? b) Obtenha um intervalo de confiança ao nível de 95% para a diferença dos tempos médios de execução da tarefa pelos dois métodos e com base neste diga se pode concluir que um dos métodos é mais vantajoso. Confirme a sua conclusão através de um teste de hipóteses adequado. 6. Dez indivíduos participaram num tratamento para perder peso, registando-se o peso dos indivíduos antes e depois do tratamento. Com base nos valores obtidos realizou-se uma análise estatística e obtiveram-se, entre outros, os seguintes outputs: Teste T: duas amostras com variâncias iguais Antes 79,7000 91,3444 10 85,5667 10 18 1,6921 0,0539 1,7341 0,1079 2,1009 Média Variância Observações Variância agrupada Hipótese de diferença de média gl Stat t P(T<=t) uni-caudal t crítico uni-caudal P(T<=t) bi-caudal t crítico bi-caudal Depois 62,7000 79,7889 10 Paired Samples Correlations N Pair 1 Antes & Depois 10 Correlation ,762 Sig. ,010 Paired Samples Test Paired Differences Pair 1 Antes - Depois Mean 17,00000 Std. Deviation 6,41179 Std. Error Mean 2,02759 95% Confidence Interval of the Difference Lower Upper 12,41328 21,58672 t 8,384 df 9 Sig. (2-tailed) ,000 Há evidência de que em média este tratamento faz reduzir o peso em mais de 10 quilos? Diga que pressupostos admitiu para responder a esta questão. Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXAME DE ÉPOCA NORMAL – 17 de Janeiro de 2008 1. Considere a distribuição das receitas, em centos de euros, relativas às comissões ganhas no último mês pelos vendedores de uma dada empresa: Comissões (X 100€) Número de Vendedores [0, 10) 6 [10, 20) 9 [20, 30) 14 [30, 40) 32 [40, 50) 14 [50, 100) 5 a) Complete as seguintes afirmações: i) “25 % dos vendedores ganharam uma comissão inferior a ______ euros.”. ii) “___ % dos vendedores ganharam uma comissão superior a 4000 euros. b) Classifique a distribuição quanto à assimetria. c) Faça um esboço aproximado da caixa de bigodes, sabendo que houve um vendedor que não recebeu comissão e que as comissões da última classe foram: 52, 58, 65, 82, 96. 2. Numa determinada empresa sabe-se que 50% dos empregados utilizam um meio de transporte público para chegar ao local de trabalho e destes 35% são do sexo feminino; 40% dos empregados utilizam viatura particular, sendo 20% do sexo feminino; os restantes empregados vão a pé para o local de trabalho, sendo 80% do sexo masculino. Do conjunto dos empregados do sexo feminino, determine a proporção dos que vão a pé para o local de trabalho. 3. Diga, justificando, se a seguinte proposição é verdadeira ou falsa: “Dos alunos de Gestão inscritos em EAG I (110), uma proporção deles, p>0, são mulheres. A probabilidade de encontrarmos 2 homens, ao seleccionarmos ao acaso um grupo de 4 alunos, é igual a 4p.”. 4. Suponha que a percentagem de álcool num certo composto é uma variável aleatória com função 2 densidade f ( x) = kx , 0 < x < 1 . Admita que o preço de custo do composto é igual a 8€ e que este é vendido a 15€, caso a percentagem de álcool esteja entre 0,2 e 0,6, sendo vendido a 10€, no caso contrário. Determine o valor esperado do lucro obtido na venda de 50 unidades. 5. Sabe-se que, durante os períodos de testes, o número de alunos que acorrem ao atendimento se distribui de acordo com um Processo de Poisson com média 6 por hora. Calcule a probabilidade de no último quarto de hora de atendimento chegar no máximo um aluno. 6. O tempo que um aluno demora a responder a uma pergunta de uma Frequência de uma unidade curricular de Estatística é uma variável aleatória com distribuição exponencial. Determine o estimador de máxima verosimilhança para o parâmetro λ da distribuição e uma sua estimativa, sabendo que o tempo de resposta a 40 perguntas totalizou 480 minutos. 7. Considere uma amostra X1,X2,...,Xn proveniente de uma população X com distribuição Uniforme entre 0 e θ real positivo. Verifique que o estimador θˆ = 2X do parâmetro θ é consistente. 8. No século XVIII, Buffon lançou uma moeda 4040 vezes, obtendo 2048 vezes uma face. Baseandose na frequência relativa dessa face, ele concluiu que a moeda seria equilibrada. a) Poder-se-á afirmar que há evidência a favor da conclusão de Buffon ao nível de significância de 1%? b) Determine a potência do teste realizado na alínea anterior, caso a probabilidade de sair essa face seja igual a 0.6. 9. Um componente industrial foi fabricado por 2 métodos diferentes: método A e método B. Sabe-se que os tempos de fabrico (em minutos) se comportam de forma aproximadamente normal. Realizou-se uma análise estatística a partir dos tempos de fabrico de 12 componentes pelo método A e outros 12 pelo método B, tendo-se obtido os seguintes outputs do EXCEL e do SPSS: Teste F: duas amostras para variâncias Método A Método B 8,5000 7,9250 0,3473 0,1766 12 12 11 11 1,9665 0,1387 2,8179 Média Variância Observações gl F P(F<=f) uni-caudal F crítico uni-caudal Independent Samples Test Levene's Test for Equality of Variances F Tempos Equal variances assumed Equal variances not assumed t-test for Equality of Means Sig. 2,704 t ,114 df Sig. (2-tailed) Mean Difference Std. Error Difference 99% Confidence Interval of the Difference Lower Upper 2,752 22 ,012 ,57500 ,20894 -,01395 1,16395 2,752 19,889 ,012 ,57500 ,20894 -,01985 1,16985 a) Obtenha e interprete um intervalo de confiança ao nível de 95% para o tempo médio de execução da tarefa pelo método A. b) Com base no intervalo de confiança ao nível de 99% para a diferença dos tempos médios de execução da tarefa pelos dois métodos, justifique porque não pode concluir ao nível de 5% que um dos métodos é mais vantajoso. Caso considere toda a informação apresentada, para que níveis de significância é possível tirar a conclusão que o método B é mais rápido em média que o método A? 10. Foi enviado um questionário a 12 firmas seleccionadas ao acaso de um certo sector industrial. De entre os resultados das 10 que responderam, os outputs seguintes reflectem a análise aos referentes ao montante dispendido com acções de formação profissional do pessoal em 2002 e em 2007. Admita a normalidade das amostras. Paired Samples Test Paired Differences Pair 1 a) 2002 - 2007 Justifique o Mean -3.600 facto de Std. Deviation 7.427 se ter Std. Error Mean 2.349 feito uma 95% Confidence Interval of the Difference Lower Upper -8.913 1.713 análise estatística t -1.533 df 9 Sig. (2-tailed) .160 considerando amostras emparelhadas. b) Poderemos afirmar estatisticamente, ao nível de 1%, que houve um aumento superior a 1 unidade monetária no montante médio dispendido em formação profissional por cada empresa entre 2002 e 2007? FORMULÁRIO DE APOIO xp = li + np − N i−1 × Ri ni s2 = 1 n 2 ni ( xi − x ) ∑ n i=1 [Q1 − 3IQ, Q3 + 3IQ ] IQ = Q3 − Q1 k x[np ] + x[np ]+1 , np ∈ xp = 2 x[np ]+1 , np ∉ m3 = m − 3m m + 2 (m ) ' 3 ' 2 ' 3 1 ' 1 ' 3 ' 1 ' 2 r i mr = m4 = m − 4m m + 6m (m ) − 3(m ) ' 4 ∑ n (x − x ) ' 2 1 ' 4 1 i i =1 n k ∑n x r i i mr' = i =1 n γ1 = i pi = ∑ nj j =1 k ∑n m3 s3 γ2 = j =1 k qi = ∑n x j Q3 − Q1 ∑q i G = 1− i i j =1 g= Q3 − Q1 2 ( P90 − P10 ) x − xˆ s k −1 i ∑ ni xi (Q3 − x) −( x − Q1 ) m4 −3 s4 i =1 k −1 ∑p P ( Ai | B ) = i j =1 n ∑ P ( A ) P (B | A ) k i =1 P ( B ) = ∑ P ( B | Ai )P ( Ai ) P ( Ai )× P ( B | Ai ) n , i = 1, 2, ..., n k k =1 P ( A − B ) = P ( A ∩ B ) = P ( A) − P ( A ∩ B ) i =1 P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) P ( A ∩ B ) = P ( A).P ( B | A) = P ( B ) P ( A | B ) x F ( x) = ∑ P ( X = k ) ; F ( x) = ∫ f (u )du k ≤x P (a < X ≤ b) = F (b) − F (a ) −∞ n n −k P ( X = k ) = p k (1− p ) , k = 0, 1, ..., n ; E ( X ) = np ; Var ( X ) = np (1- p ) k k −1 P ( X = k ) = (1− p ) p, k = 1, 2, ... ; E ( X ) = 1 1- p ; Var ( X ) = 2 p p e−λλ k P(X = k) = , k = 0, 1, ... λ > 0 ; E ( X ) = Var ( X ) = λ k! (b - a ) 1 x−a a +b f ( x) = a < x < b ; F ( x) = , a < x < b ; E( X ) = ; Var ( X ) = b−a b−a 2 12 2 f (t ) = λe−λt , t ≥ 0 λ >0 ; F (t ) = 1− e−λt , t ≥ 0 λ >0 ; E (T ) = ∑X i i ( N nµ , σ n ∩ ) ; 1 λ ; Var (T ) = 1 λ2 X − np X −λ σ N (0,1) ; N (0,1) ; X ∩ N µ, ∩ ∩ λ np (1 − p ) n Universidade de Évora - Departamento de Matemática Estatística Aplicada à Gestão I - 2007/2008 EXAME DE RECURSO – 29 de Janeiro de 2008 1. No quadro seguinte apresenta-se o resultado de um estudo efectuado aos lucros, em milhões de euros, de 40 empresas do mesmo ramo num determinado ano. Lucros (Milhões de euros) Número de Empresas [-10, -5) 3 [-5, 0) 8 [0, 5) 12 [5, 10) 13 [10, 15) 4 a) Complete as seguintes afirmações: i) “25 % das empresa tiveram lucros superiores a ______ euros.”. ii) “___ % das empresa tiveram lucros negativos.” b) Classifique a distribuição quanto à assimetria. c) Faça um esboço aproximado da caixa de bigodes, sabendo que os lucros da primeira classe foram -8, -7 e -6 e os lucros da última classe foram 10, 12, 12.5 e 14.5, todos em milhões de euros. 2. Nas eleições de um determinado país concorrem os partidos R e D, aos quais as sondagens atribuem 53% e 47%, respectivamente. De entre os apoiantes do partido R concordam com a pena de morte 60% enquanto essa percentagem é apenas 30% nos apoiantes do partido D. Seleccionado ao acaso um eleitor que concorda com a pena de morte, calcule a probabilidade de votar no partido R. 3. Admita que o preço de custo de um dado composto é igual a 8€ e que este é vendido a 15€, caso a percentagem de álcool esteja entre 0,2 e 0,6 (o que ocorre com probabilidade igual a 0,6), sendo vendido a 10€, no caso contrário. Determine o valor esperado do lucro obtido na venda de 50 unidades. 4. O tempo (em horas) que um gestor demora a avaliar um determinado projecto é uma variável aleatória com distribuição normal de média igual a 10 horas e desvio padrão igual a 2 horas. O gestor recebe uma compensação monetária sempre que termina a avaliação de um projecto em menos de 7 horas. Admitindo que o gestor recebeu 5 projectos distintos para avaliar, calcule a probabilidade de ser compensado em pelo menos 1 projecto. 5. Uma máquina electrónica de venda de chocolates e bebidas pode sofrer avarias. Suponha que o número de avarias numa semana é uma v.a. com distribuição de Poisson de parâmetro 1.5. Calcule a probabilidade de, num mês, haver cinco avarias, sabendo que de facto ocorreram avarias nesse mês. 6. Seja X uma variável aleatória com a seguinte função de probabilidade: X 0 1 2 p(x) a θ θ X + Xn a) Compare o estimador encontrado pelo método dos momentos com θˆ1 = 1 . 6 b) Considerando a amostra (1, 0, 0, 2, 0, 1, 0, 1, 2, 2), determine uma estimativa para o parâmetro θ pelo método da máxima verosimilhança. 7. Diga, justificando, se a seguinte proposição é verdadeira ou falsa: “Supondo que o intervalo de confiança a 95% para a razão de variâncias é dado por (0.87, 1.95), então não rejeitamos a hipótese da igualdade das variâncias populacionais ao nível de 1%.”. 8. Com base em informação recolhida no mês passado, sabe-se que numa dada região 30% de das pessoas fumava mais de um maço por dia. Após a introdução da nova lei, realizou-se um inquérito a 800 pessoas, tendo 150 afirmado que fuma mais de um maço diariamente. a) Obtenha e interprete um intervalo de confiança de nível 98% para a proporção de pessoas naquela região que actualmente fuma mais de um maço por dia. b) Admita que pretende uma estimativa intervalar da proporção de pessoas que fuma menos de um maço diariamente, mantendo a confiança do intervalo da alínea anterior, mas com um erro máximo de 3%. Quantas pessoas deveriam ser inquiridas? 9. Um componente industrial foi fabricado por 2 métodos diferentes: método A e método B. Sabe-se que os tempos de fabrico (em minutos) se comportam de forma aproximadamente normal. Realizou-se uma análise estatística a partir dos tempos de fabrico de 12 componentes pelo método A e outros 12 pelo método B, tendo-se obtido os seguintes outputs do EXCEL e do SPSS: Independent Samples Test Levene's Test for Equality of Variances F Tempos Equal variances assumed Equal variances not assumed t-test for Equality of Means Sig. 2,704 t ,114 df Sig. (2-tailed) Mean Difference Std. Error Difference 99% Confidence Interval of the Difference Lower Upper 2,752 22 ,012 ,57500 ,20894 -,01395 1,16395 2,752 19,889 ,012 ,57500 ,20894 -,01985 1,16985 Haverá evidência estatística ao nível de 5% para conclui que o método B é mais rápido em média que o método A em 30 segundos? 10. Suponha que uma grande repartição de finanças foi seleccionada para uma experiência piloto na qual se pretendem testar novos procedimentos. Para tal, mediu-se o tempo despendido (em minutos) no processamento de uma determinada operação, antes e depois de terem sido introduzidos novos procedimentos. A partir de cronometragens seleccionadas aleatoriamente obtiveram-se os resultados seguintes: Paired Samples Test Paired Differences Pair 1 Antes - Depois Mean -1,07500 Std. Deviation 1,50119 Std. Error Mean ,53075 99% Confidence Interval of the Difference Lower Upper -2,93235 ,78235 t -2,025 df 7 Sig. (2-tailed) ,082 Haverá evidência estatística, ao nível de 5%, de que o tempo de processamento diminuiu com a introdução dos novos procedimentos? FORMULÁRIO DE APOIO xp = li + np − N i−1 × Ri ni x[np ] + x[np ]+1 , np ∈ xp = 2 x[np ]+1 , np ∉ s2 = 1 n 2 ni ( xi − x ) ∑ n i=1 [Q1 − 3IQ, Q3 + 3IQ ] IQ = Q3 − Q1 k m3 = m − 3m m + 2 (m ) ' 3 ' 2 ' 1 ' 3 1 ∑ n (x − x ) r i m4 = m4' − 4m3' m1' + 6m2' (m ) − 3(m ) ' 2 1 ' 4 1 mr = i i =1 n k ∑n x r i i mr' = i =1 n γ1 = i pi = ∑ nj j =1 k ∑n m3 s3 γ2 = i i j =1 k qi = ∑n x j Q3 − Q1 ∑q i G = 1− i i j =1 g= Q3 − Q1 2 ( P90 − P10 ) x − xˆ s k −1 i ∑n x (Q3 − x) −( x − Q1 ) m4 −3 s4 i =1 k −1 ∑p P ( Ai | B ) = i j =1 n ∑ P ( A ) P (B | A ) k i =1 P ( B ) = ∑ P ( B | Ai )P ( Ai ) P ( Ai )× P ( B | Ai ) n , i = 1, 2, ..., n k k =1 P ( A − B ) = P ( A ∩ B ) = P ( A) − P ( A ∩ B ) i =1 P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) P ( A ∩ B ) = P ( A).P ( B | A) = P ( B ) P ( A | B ) x F ( x) = ∑ P ( X = k ) ; F ( x) = ∫ f (u )du k ≤x P (a < X ≤ b) = F (b) − F (a ) −∞ n n −k P ( X = k ) = p k (1− p ) , k = 0, 1, ..., n ; E ( X ) = np ; Var ( X ) = np (1- p ) k k −1 P ( X = k ) = (1− p ) P(X = k) = p, k = 1, 2, ... ; E ( X ) = 1 1- p ; Var ( X ) = 2 p p e−λλ k , k = 0, 1, ... λ > 0 ; E ( X ) = Var ( X ) = λ k! (b - a ) 1 x−a a +b f ( x) = a < x < b ; F ( x) = , a < x < b ; E( X ) = ; Var ( X ) = b−a b−a 2 12 2 f (t ) = λe−λt , t ≥ 0 λ >0 ; F (t ) = 1− e−λt , t ≥ 0 λ >0 ; E (T ) = ∑X i i ( N nµ , σ n ∩ ) ; 1 λ ; Var (T ) = 1 λ2 X − np X −λ σ N (0,1) ; N (0,1) ; X ∩ N µ, ∩ ∩ λ np (1 − p ) n Inquérito anónimo realizado aos alunos Estatística Aplicada à Gestão I - 2007/2008 Proposta de avaliação dos docentes e da unidade curricular Caro(a) aluno (a), Com o objectivo de procurar melhorar a leccionação desta unidade curricular nos próximos anos, muito lhe agradecíamos se pudesse partilhar a sua opinião sobre o seu conteúdo e a docência. Nos pontos que a seguir se seguem, avalie, por favor, a Unidade Curricular e os Docentes, assinalando com uma cruz a sua opção. Use as seguintes categorias de resposta: A – Muito Bom; B – Bom; C – Suficiente; D – Insuficiente; E – Muito insuficiente Avaliação da Unidade Curricular 1. Adequação do número de horas lectivas ____________ A B C D E 2. Acesso à bibliografia recomendada ______________________ A B C D E 3. Correspondência entre conhecimentos avaliados e matéria leccionada _ A B C D E 4. Adequação dos recursos utilizados para a leccionação desta disciplina A B C D E 5. Interesse dos conteúdos leccionados _____________________________ A B C D E 6. Considera a sua assiduidade às aulas nesta unidade curricular __________A B C D E 7. Coordenação entre os Docentes __________________________________A B C D E 8. Em média quantas horas de estudo pensa ter dedicado a esta u.c. por semana ___ Avaliação do Docente (Paulo Infante) 9. Preparação, organização e utilização do tempo de aula _______ A B C D E 10. Clareza com que o Docente expõe a matéria __ A B C D E 11. Empenho e o entusiasmo mostrados no ensino _ A B C D E 12. Aptidão para incentivar e para estimular o interesse dos Alunos A B C D E A B C D E 13. Disponibilidade para esclarecer dúvidas __________ 14. Respeito, tolerância e honestidade para com os Alunos A B C D E 15. Assiduidade e pontualidade _________ A B C D E 16. Transparência, lealdade e igualdade na avaliação dos Alunos _ A B C D E A B C D E 17. Classificação global do Docente _____ Avaliação do Docente (Inês Sousa Dias) 18. Preparação, organização e utilização do tempo de aula _______ A B C D E 19. Clareza com que o Docente expõe a matéria __ A B C D E 20. Empenho e o entusiasmo mostrados no ensino _ A B C D E 21. Aptidão para incentivar e para estimular o interesse dos Alunos A B C D E 22. Disponibilidade para esclarecer dúvidas __________ A B C D E 23. Respeito, tolerância e honestidade para com os Alunos A B C D E 24. Assiduidade e pontualidade _________ A B C D E 25. Transparência, lealdade e igualdade na avaliação dos Alunos _ A B C D E A B C D E 26. Classificação global do Docente _____ CRÍTICAS / COMENTÁRIOS / SUGESTÕES _____ ____ ____ ____ ___________