Análise de Dados PROGRAMA • Ano lectivo: 2007/2008 • Ano/semestre: 3.º ano/1.º semestre • Horas semanais: 5 horas (2T/3P) • Docente: Alexandre Pereira [email protected] I. OBJECTIVOS A disciplina de Análise de Dados tem como objectivo a aprendizagem de métodos estatísticos de análise e tratamento da informação relativa a determinadas características que permitam inferir sobre o comportamento das populações de onde foi recolhida essa informação. São abordadas as principais técnicas de análise multivariada de dados que permitem a classificação e o agrupamento da informação, nomeadamente: a análise de variância, a análise de regressão múltipla, a análise discriminante, a análise factorial e a análise de clusters. Com esta disciplina o aluno deve igualmente ser capaz de utilizar os conhecimentos adquiridos na exploração de outras matérias de natureza académica e profissional. II. METODOLOGIA Aulas teóricas (2 h/sem.) para desenvolvimento e exposição das técnicas a utilizar nas aulas práticas (3 h/sem). Estas últimas uma vez que os conceitos estejam assimilados, serão acompanhadas por uso de software apropriado. III. CONTEÚDOS PROGRAMÁTICOS 1. Introdução à análise de dados. Estatística univariada versus multivariada. 1.1. Caracterização do objecto de análise. 1.2. Quadros e gráficos. 1.3. Medidas de análise descritiva. 1.4. Testes de hipóteses. III. CONTEÚDOS PROGRAMÁTICOS 2. Técnicas de previsão. 2.1. Introdução. 2.2. Modelo de regressão linear simples. 2.2.1. Objectivos. 2.2.2. Estimação dos parâmetros da regressão. Método dos mínimos quadrados. 2.3. Modelo de regressão linear múltipla. 2.3.1. Objectivos. Notação matricial. 2.3.2. Estimação dos parâmetros da regressão. Método dos mínimos quadrados. 2.3.3. Significância da regressão. 2.3.4. Coeficiente de determinação. 2.3.5. Análise de resíduos. 2.3.6. Significância dos coeficientes da regressão individualmente. 2.3.7. Previsão usando o modelo de regressão linear. 2.4. Aplicações em folha de cálculo. III. CONTEÚDOS PROGRAMÁTICOS 3. Análise de variância. 3.1. Introdução. 3.2. Análise de variância simples (um factor). 3.2.1. Modelo de efeitos fixos. 3.2.2. Modelo de efeitos aleatórios. 3.3. Análise de variância dupla (dois factores) com réplicas. 3.3.1. Objectivos. 3.3.2. Modelo de efeitos fixos. 3.3.3. Modelo de efeitos aleatórios. 3.3.4. Modelo misto. 3.4. Aplicações em folha de cálculo. III. CONTEÚDOS PROGRAMÁTICOS 4. Análise factorial de componentes principais. 4.1. Conceitos básicos. 4.2. O modelo de análise factorial. 4.3. Estatísticas associadas à análise factorial. 4.4. Condução da análise factorial. 4.4.1. Formulação do problema. 4.4.2. Construção da matriz de correlação. 4.4.3. Método de análise factorial. 4.4.4. Número de factores. 4.4.5. Rotação de factores. 4.4.6. Interpretação dos factores. 4.4.7. Valor dos factores (scores). 4.4.8. Ajustamento do modelo. 4.5. Aplicações comuns da análise factorial. III. CONTEÚDOS PROGRAMÁTICOS 5. Análise de clusters. 5.1. Conceitos básicos. 5.2. Estatísticas associadas à análise de clusters. 5.3. Condução da análise de clusters. 5.3.1. Formulação do problema. 5.3.2. Selecção de uma medida de distância ou similitude. 5.3.3. Selecção de um procedimento de agrupamento. 5.3.4. Decidir o número de clusters. 5.3.5. Interpretação dos clusters. 5.4. Aplicações da análise de clusters. III. CONTEÚDOS PROGRAMÁTICOS 6. Análise discriminante. 6.1. Conceitos básicos. 6.2. Estatísticas associadas à análise discriminante. 6.3. Condução da análise discriminante. 6.3.1. Formulação do problema. 6.3.2. Estimação do problema. 6.3.3. Determinação da significância. 6.3.4. Interpretação. 6.3.5. Validação. 6.4. Aplicações da análise discriminante. IV. BIBLIOGRAFIA Recomendada Green, Judith; d’Oliveira, Manuela – Testes estatísticos em Psicologia, Lisboa: Editorial Estampa, 1991. Howitt, Dennis; Cramer, Duncan – A guide to computing statistics with SPSS for Windows, Hertfordshire: Prentice Hall, 1997. Malhotra, Naresh K. – Marketing research: an applied orientation, New Jersey: Prentice Hall, 1996. Norusis, Marija – SPSS 10.0 guide to data analysis, New Jersey: Prentice Hall, 2000. Pereira, Alexandre – SPSS – Guia prático de utilização, análise de dados para Ciências Sociais e Psicologia, Lisboa: Sílabo, 1999. Pestana, Maria H.; Gageiro, João N. – Análise de dados para as Ciências Sociais: a complementaridade do SPSS, Lisboa: Sílabo, 1998. Reis, Elizabeth – Estatística multivariada aplicada, Lisboa: Sílabo, 1997. Reis, Elizabeth; Moreira, Raúl – Pesquisa de mercados, Lisboa: Sílabo, 1993. IV. BIBLIOGRAFIA Complementar Chatfield, C. e A. J. Collins – Introduction to multivariate analysis, New York: Chapman and Hall, 1980. Kleinbaum, D.G. et al. – Applied regression analysis and other multivariate methods, 2ª ed., New York: Chapman and Hall, 1991. McClave, T.J. et al. – Statistics for business and economics, 7ª ed., New Jersey: Prentice Hall, 1998. Morgan, George; Griego, Orlando – Easy use and interpretation of SPSS for Windows, New Jersey: Colorado St. Univ., 1998. Morrison, D. F. – Multivariate statistical methods, 3ª ed., New York: McGraw-Hill, 1990. V. AVALIAÇÃO DE CONHECIMENTOS A nota da disciplina resulta da melhor classificação obtida nas seguintes modalidades: 1. Trabalho prático (30%) + testes (20%) + exame final (50%) 2. Exame final (100%) O trabalho prático é facultativo, pelo que, caso os alunos optem por não o realizar, a nota de exame final será ponderada a 100%. A classificação obtida no trabalho prático será ponderada nas épocas normal, recurso e especial no caso de ser superior à classificação obtida no exame final.