Programa de Pós-Graduação em Relações Internacionais
Disciplina: Introdução à análise quantitativa de texto para Relações Internacionais
Docente responsável: Iñaki Sagarzazu ([email protected])
Monitor: Fernando Mourón
Dias de aula: AGOSTO: 04, 06, 08, 11, 13 e 15
Horário: das 09h às 13h
Local: Laboratório de Informática do IRI – 2º andar
Créditos: 04
OBJETIVO
No século XXI, as informações políticas em formato de texto (leis, discursos, notícias e
propagandas eleitorais) tem se tornado de fácil accesso para seu análise. Nesse sentido,
cientistas sociais procuraram formas para utilizar e analisar esses documentos numa tentativa de
entender e explicar o comportamento político de forma objetiva. O objetivo desse curso é
introduzir e aplicar métodos que, sistematicamente, extraem informações de textos e as
transformam em dados para sua posterior análise. Primeiramente começaremos com a análise de
conteúdo tradicional, como a codificação manual de textos, para em seguida apresentar os mais
recentes avanços na análise quantitativa de texto. As aulas terão uma abordagem tanto teórica
como prática, introduzindo uma ampla fundamentação teórica, bem como técnicas úteis para levar
na prática esse novo tipo de metodologia. Por último, os alunos serão incentivados a trazer suas
bases de dados, com o objetivo de discutir seus projetos de pesquisa e, em última instância,
aprimorar sua metodologia de estudo.
AVALIAÇÃO
A avaliação será feita de seguinte maneira: no último dia de aula, os alunos deverão apresentar
em seminário seu projeto de pesquisa e como acreditam que a metodologia abordada pode ser
utilizada (4 pontos). Depois de finalizado o curso, os alunos deverão mandar um projeto de
pesquisa, em format ABNT, tendo como base a metodologia apresenta durante o curso e as
recomendações propostas no seminário (6 pontos).
ESTRUTURA
O curso estará dividido em duas partes. A primeira semana apresentaremos o funcionamento da
análise quantitativa de texto, por que é diferente de outras metodologias e como pode ser utilizada
por alunos da área de Relações Internacionais. Durante a segunda semana, depois de apresentar
exemplos da vida real, os alunos serão incentivados a trabalhar com suas próprias bases e,
finalmente, discutir como essa nova abordagem pode aprimorar seus projetos de pesquisa.
CRONOGRAMA:
4 de agosto
Aula 1: Introdução - Transformação de texto em dado
Obrigatórios: Neuendorf (2002, Chapter 1,3-4); Krippendorff (2004, Chapter 1,4-7); Monroe and
Schrodt (2008); Klüver (2009)
Recomendados:Neuendorf (2002, Chapter 2); Krippendorff (2004, Chapter 2); Porter (1980)
6 de agosto
Aula 2: Inferência dos textos - Reliability e Validity
Obrigatórios: Krippendorff (2004, Chapters 3, 10); Krippendorff (2004, Chapter 11,13); Neuendorf
(2002, Chapters 6-7);
Recomendados: Labbé, Labbé and Hubert (2004) Mikhaylov, Laver and Benoit (2008);
Banerjee et al. (1999)
8 de agosto
Aula 3: Análise quantitativa de texto clássica
Obrigatórios: Klingemann et al. (2006, Chapter 1, Appendix I & II)
Recomendados: Benoit and Laver (2007)
Laboratório: Introdução ao software Wordstat e análise de frequência de palavras
11 de agosto
Aula 4: Abordagens por meio de dicionários
Obrigatórios: Laver, Benoit and Garry (2003); Hart and Childers (2005)
Recomendados: Benoit and Laver (2003)
Laboratório: Codificação de textos
13 de agosto
Aula 5: Outras Tecnicas de Classificação de textos
Obrigatórios: Monroe, Colaresi and Quinn (2008); Slapin and Proksch (2008) Quinn et al. (2010);
Grimmer (2010) Evangelopoulos, Zhang and Prybutok (2012) Simon and Xenos (2004)
Recomendados: Proksch and Slapin (2010); Ho and Quinn (2008) Grimmer and King (2011);
Schonhardt-Bailey (2005, 2008) Sagarzazu (N.d.)
Laboratório: Análise de texto por meio de dicionários
14 de agosto
Aula 6: Conclusões e apresentação de projetos
Obrigatórios: Hopkins and King (2010); Lowe (2003)
Recomendados: Lowe and Benoit (2011)
Lab Session: Apresentação de projetos
REFERÊNCIAS
Banerjee, M., M. Capozzoli, L. McSweeney D. Sinha. 1999. “Beyond Kappa: A Review of
Interrater Agreement Measures.” The Canadian Journal of Statistics/La Revue Canadienne de
Statistique 27(1):3–23.
Benoit, Kenneth Michael Laver. 2003. “Estimating Irish party policy positions using computer
wordscoring.” Irish Political Studies 18(1):97–107.
Benoit, Kenneth Michael Laver. 2007. “Estimating Party Policy Positions: Comparing Expert
Surveys and Hand Coded Content Analysis.” Electoral Studies 26(1):90–107.
Evangelopoulos, Nicholas, Xiani Zhang Victor Prybutok. 2012. “Latent Semantic Analysis: fice
methodological recommendations.” European Journal of Information Systems 21:70–86.
Grimmer, Justin. 2010. “A Bayesian Hierarchical Topic Model for Political Texts: Measuring
Expressed Agendas in Senate Press Releases.” Political Analysis 18(1):1–35.
Grimmer, Justin Gary King. 2011. “Quantitative Discovery from Qualitative Information: A GeneralPurpose Document Clustering Methodology.” PNAS .
Hart, Roderick P. Jay P. Childers. 2005. “The Evolution of Candidate Bush : A Rhetoric.” American
Behavioral Scientist 49(2):180–197.
Ho, Daniel E. Kevin M. Quinn. 2008. “Measuring Explicit Political Positions of Media.” Quarterly
Journal of Political Science 3:353–377.
Hopkins, Daniel Gary King. 2010. “A Method of Automated Nonparametric Content Analysis for
Social Science.” American Journal of Political Science 54(1):229–247. Working Paper 20080078, Weatherhead Center for International Affairs, Harvard University, September 16, 2007.
Klingemann, Hans-Dieter, Andrea Volkens, Judith Bara, Ian Budge Michael McDonald. 2006.
Mapping Policy Preferences II: Estimates for Parties, Electors, and Governments in Eastern
Europe, European Union and OECD 1990-2003. Oxford: Oxford University Press.
Klüver, Heike. 2009. “Measuring interest group influence using quantitative text analysis.”
European Union Politics 10(4):535–549.
Krippendorff, Klaus. 2004. Content Analysis: An Introduction to Its Methodology. 2nd ed. Thousand
Oaks: Sage.
Labbé, Cyril, Dominique Labbé Pierre Hubert. 2004. “Automatic Segmentation of Texts and
Corpora.” Journal of Quantitative Linguistics 11(3):193–213.
Laver, Michael, Kenneth Benoit John Garry. 2003. “Extracting policy positions from political texts
using word as data.” American Political Science Review 97(2):311–331.
Lowe, Will. 2003. Software for Content Analysis – A Review. Technical Report for the Identity
Project: Weatherhead Center for International Affairs, Harvard University.
Lowe, Will Ken Benoit. 2011. Estimating Uncertainty in Quantitative Text Analysis. In Annual
Conference of the Midwest Political Science Association, 31 March–April 3 2011, Chicago.
Mikhaylov, Slava, Michael Laver Kenneth Benoit. 2008. Coder Reliability and Misclassification in
Comparative Manifesto Project Codings. Paper presented at the 66th National Conference of
the Midwest Political Science Association: Chicago, 3-6 April 2008.
Monroe, Burt L., Michael P. Colaresi Kevin M. Quinn. 2008. “Fightin’ Words: Lexical Feature
Selection and Evaluation for Identifying the Content of Political Conflict.” Political Analysis
16(4):372–403.
Monroe, Burt L. Philip A. Schrodt. 2008. “Introduction to the Special Issue: The Statistical Analysis
of Political Text.” Political Analysis 16(4):351–355.
Neuendorf, Kimberly A. 2002. The Content Analysis Guidebook. Thousand Oaks: Sage.
Porter, Martin F. 1980. “An Algorithm for Suffix Stripping.” Program 14(3):130–137.
Proksch, Sven-Oliver Jonathan B. Slapin. 2010. “Position Taking in European Parliament
Speeches.” British Journal of Political Science 40(3):587–611.
Quinn, Kevin M., Burt Monroe, Michael Colaresi, Michael Crespin Drago Radev. 2010. “How to
analyze political attention with minimal assuptions and costs.” American Journal of Political
Science 54(1):209–228.
Sagarzazu, Iñaki. N.d. “Weak party institutionalization and the dynamics of political dialogue.”
Nuffield College Working Papers in Politics, 2011-03.
Schonhardt-Bailey, Cheryl. 2005. “Measuring ideas more effectively: An analysis of Bush and
Kerry’s national security speeches.” PS: Political Science & Politics 38(4):701–711.
Schonhardt-Bailey, Cheryl. 2008. “The Congressional Debate on Partial-Birth Abortion:
Constitutional Gravitas and Moral Passion.” British Journal of Political Science 38(3):383–410.
Simon, Adam Michael Xenos. 2004. “Dimensional Reduction of Word-Frequency Data as a
Substitute for Intersubjective Content Analysis.” Political Analysis 12(1):63–75.
Slapin, Jonathan Sven-Oliver Proksch. 2008. “A Scaling Model for Estimating Time Series Policy
Positions from Texts.” American Journal of Political Science 52(8):705–722.
Download

Introdução à análise quantitativa de texto para