Programa de Pós-Graduação em Relações Internacionais Disciplina: Introdução à análise quantitativa de texto para Relações Internacionais Docente responsável: Iñaki Sagarzazu ([email protected]) Monitor: Fernando Mourón Dias de aula: AGOSTO: 04, 06, 08, 11, 13 e 15 Horário: das 09h às 13h Local: Laboratório de Informática do IRI – 2º andar Créditos: 04 OBJETIVO No século XXI, as informações políticas em formato de texto (leis, discursos, notícias e propagandas eleitorais) tem se tornado de fácil accesso para seu análise. Nesse sentido, cientistas sociais procuraram formas para utilizar e analisar esses documentos numa tentativa de entender e explicar o comportamento político de forma objetiva. O objetivo desse curso é introduzir e aplicar métodos que, sistematicamente, extraem informações de textos e as transformam em dados para sua posterior análise. Primeiramente começaremos com a análise de conteúdo tradicional, como a codificação manual de textos, para em seguida apresentar os mais recentes avanços na análise quantitativa de texto. As aulas terão uma abordagem tanto teórica como prática, introduzindo uma ampla fundamentação teórica, bem como técnicas úteis para levar na prática esse novo tipo de metodologia. Por último, os alunos serão incentivados a trazer suas bases de dados, com o objetivo de discutir seus projetos de pesquisa e, em última instância, aprimorar sua metodologia de estudo. AVALIAÇÃO A avaliação será feita de seguinte maneira: no último dia de aula, os alunos deverão apresentar em seminário seu projeto de pesquisa e como acreditam que a metodologia abordada pode ser utilizada (4 pontos). Depois de finalizado o curso, os alunos deverão mandar um projeto de pesquisa, em format ABNT, tendo como base a metodologia apresenta durante o curso e as recomendações propostas no seminário (6 pontos). ESTRUTURA O curso estará dividido em duas partes. A primeira semana apresentaremos o funcionamento da análise quantitativa de texto, por que é diferente de outras metodologias e como pode ser utilizada por alunos da área de Relações Internacionais. Durante a segunda semana, depois de apresentar exemplos da vida real, os alunos serão incentivados a trabalhar com suas próprias bases e, finalmente, discutir como essa nova abordagem pode aprimorar seus projetos de pesquisa. CRONOGRAMA: 4 de agosto Aula 1: Introdução - Transformação de texto em dado Obrigatórios: Neuendorf (2002, Chapter 1,3-4); Krippendorff (2004, Chapter 1,4-7); Monroe and Schrodt (2008); Klüver (2009) Recomendados:Neuendorf (2002, Chapter 2); Krippendorff (2004, Chapter 2); Porter (1980) 6 de agosto Aula 2: Inferência dos textos - Reliability e Validity Obrigatórios: Krippendorff (2004, Chapters 3, 10); Krippendorff (2004, Chapter 11,13); Neuendorf (2002, Chapters 6-7); Recomendados: Labbé, Labbé and Hubert (2004) Mikhaylov, Laver and Benoit (2008); Banerjee et al. (1999) 8 de agosto Aula 3: Análise quantitativa de texto clássica Obrigatórios: Klingemann et al. (2006, Chapter 1, Appendix I & II) Recomendados: Benoit and Laver (2007) Laboratório: Introdução ao software Wordstat e análise de frequência de palavras 11 de agosto Aula 4: Abordagens por meio de dicionários Obrigatórios: Laver, Benoit and Garry (2003); Hart and Childers (2005) Recomendados: Benoit and Laver (2003) Laboratório: Codificação de textos 13 de agosto Aula 5: Outras Tecnicas de Classificação de textos Obrigatórios: Monroe, Colaresi and Quinn (2008); Slapin and Proksch (2008) Quinn et al. (2010); Grimmer (2010) Evangelopoulos, Zhang and Prybutok (2012) Simon and Xenos (2004) Recomendados: Proksch and Slapin (2010); Ho and Quinn (2008) Grimmer and King (2011); Schonhardt-Bailey (2005, 2008) Sagarzazu (N.d.) Laboratório: Análise de texto por meio de dicionários 14 de agosto Aula 6: Conclusões e apresentação de projetos Obrigatórios: Hopkins and King (2010); Lowe (2003) Recomendados: Lowe and Benoit (2011) Lab Session: Apresentação de projetos REFERÊNCIAS Banerjee, M., M. Capozzoli, L. McSweeney D. Sinha. 1999. “Beyond Kappa: A Review of Interrater Agreement Measures.” The Canadian Journal of Statistics/La Revue Canadienne de Statistique 27(1):3–23. Benoit, Kenneth Michael Laver. 2003. “Estimating Irish party policy positions using computer wordscoring.” Irish Political Studies 18(1):97–107. Benoit, Kenneth Michael Laver. 2007. “Estimating Party Policy Positions: Comparing Expert Surveys and Hand Coded Content Analysis.” Electoral Studies 26(1):90–107. Evangelopoulos, Nicholas, Xiani Zhang Victor Prybutok. 2012. “Latent Semantic Analysis: fice methodological recommendations.” European Journal of Information Systems 21:70–86. Grimmer, Justin. 2010. “A Bayesian Hierarchical Topic Model for Political Texts: Measuring Expressed Agendas in Senate Press Releases.” Political Analysis 18(1):1–35. Grimmer, Justin Gary King. 2011. “Quantitative Discovery from Qualitative Information: A GeneralPurpose Document Clustering Methodology.” PNAS . Hart, Roderick P. Jay P. Childers. 2005. “The Evolution of Candidate Bush : A Rhetoric.” American Behavioral Scientist 49(2):180–197. Ho, Daniel E. Kevin M. Quinn. 2008. “Measuring Explicit Political Positions of Media.” Quarterly Journal of Political Science 3:353–377. Hopkins, Daniel Gary King. 2010. “A Method of Automated Nonparametric Content Analysis for Social Science.” American Journal of Political Science 54(1):229–247. Working Paper 20080078, Weatherhead Center for International Affairs, Harvard University, September 16, 2007. Klingemann, Hans-Dieter, Andrea Volkens, Judith Bara, Ian Budge Michael McDonald. 2006. Mapping Policy Preferences II: Estimates for Parties, Electors, and Governments in Eastern Europe, European Union and OECD 1990-2003. Oxford: Oxford University Press. Klüver, Heike. 2009. “Measuring interest group influence using quantitative text analysis.” European Union Politics 10(4):535–549. Krippendorff, Klaus. 2004. Content Analysis: An Introduction to Its Methodology. 2nd ed. Thousand Oaks: Sage. Labbé, Cyril, Dominique Labbé Pierre Hubert. 2004. “Automatic Segmentation of Texts and Corpora.” Journal of Quantitative Linguistics 11(3):193–213. Laver, Michael, Kenneth Benoit John Garry. 2003. “Extracting policy positions from political texts using word as data.” American Political Science Review 97(2):311–331. Lowe, Will. 2003. Software for Content Analysis – A Review. Technical Report for the Identity Project: Weatherhead Center for International Affairs, Harvard University. Lowe, Will Ken Benoit. 2011. Estimating Uncertainty in Quantitative Text Analysis. In Annual Conference of the Midwest Political Science Association, 31 March–April 3 2011, Chicago. Mikhaylov, Slava, Michael Laver Kenneth Benoit. 2008. Coder Reliability and Misclassification in Comparative Manifesto Project Codings. Paper presented at the 66th National Conference of the Midwest Political Science Association: Chicago, 3-6 April 2008. Monroe, Burt L., Michael P. Colaresi Kevin M. Quinn. 2008. “Fightin’ Words: Lexical Feature Selection and Evaluation for Identifying the Content of Political Conflict.” Political Analysis 16(4):372–403. Monroe, Burt L. Philip A. Schrodt. 2008. “Introduction to the Special Issue: The Statistical Analysis of Political Text.” Political Analysis 16(4):351–355. Neuendorf, Kimberly A. 2002. The Content Analysis Guidebook. Thousand Oaks: Sage. Porter, Martin F. 1980. “An Algorithm for Suffix Stripping.” Program 14(3):130–137. Proksch, Sven-Oliver Jonathan B. Slapin. 2010. “Position Taking in European Parliament Speeches.” British Journal of Political Science 40(3):587–611. Quinn, Kevin M., Burt Monroe, Michael Colaresi, Michael Crespin Drago Radev. 2010. “How to analyze political attention with minimal assuptions and costs.” American Journal of Political Science 54(1):209–228. Sagarzazu, Iñaki. N.d. “Weak party institutionalization and the dynamics of political dialogue.” Nuffield College Working Papers in Politics, 2011-03. Schonhardt-Bailey, Cheryl. 2005. “Measuring ideas more effectively: An analysis of Bush and Kerry’s national security speeches.” PS: Political Science & Politics 38(4):701–711. Schonhardt-Bailey, Cheryl. 2008. “The Congressional Debate on Partial-Birth Abortion: Constitutional Gravitas and Moral Passion.” British Journal of Political Science 38(3):383–410. Simon, Adam Michael Xenos. 2004. “Dimensional Reduction of Word-Frequency Data as a Substitute for Intersubjective Content Analysis.” Political Analysis 12(1):63–75. Slapin, Jonathan Sven-Oliver Proksch. 2008. “A Scaling Model for Estimating Time Series Policy Positions from Texts.” American Journal of Political Science 52(8):705–722.