Luís António Pissarra de Matos Agonia Pereira Tese de Doutoramento em Ciências da Educação Especialidade de Tecnologias, Redes e Multimédia na Educação e Formação Contribuições para a Formulação de uma Metodologia de Ensino e Avaliação baseada na Análise Estatística de Textos em Português Julho, 2013 Tese apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em Ciências da Educação, Especialidade de Tecnologias, Rede e Multimédia na Educação e Formação, realizada sob a orientação científica dos Professor Doutor João Nogueira Professor Doutor Valter Martins Vairinhos ii Aos meus pais iii AGRADECIMENTOS Ao meu Orientador, Professor Doutor João Nogueira, Professor desta Faculdade, pela orientação prestada e empenho com que supervisionou o desenvolvimento deste trabalho. Ao meu Coorientador, Professor Doutor Valter Martins Vairinhos, expresso o meu profundo reconhecimento por toda a sua dedicação, empenho e motivação. Os seus conselhos e encorajamentos foram uma constante: a sua orientação foi fundamental para a concretização deste trabalho. Ao Ministério da Educação, ter aceite e autorizado o pedido de consulta e acesso aos diferentes arquivos das Escolas Secundárias Nacionais, às Provas de Exames Nacionais realizadas por estudantes do Ensino Secundário, com a respetiva garantia do anonimato de todos os envolvidos. Aos Senhores Diretores José António Sousa, Pedro Folgado e Manuela Dias, respetivamente das Escolas Secundárias D. Dinis, Lisboa; Damião de Gois, Alenquer; e Portela, Sacavém, por terem permitido a consulta e fotocópia das Provas dos Exames Nacionais efetuados pelos seus estudantes, em arquivo, respeitando o anonimato de todos os envolvidos, tanto dos Professores corretores como dos estudantes. À Professora Doutora Florinda Matos pela cedência dos textos de resposta a questões de gestão - que se revelaram extremamente úteis. Aos meus colegas e amigos o interesse com que sempre me acompanharam, nomeadamente às irmãs Hermínia Ribeiro, pelo primeiro contato estabelecido com a Escola Secundária da Portela, Sacavém, e Isabel Ribeiro, pela inestimável colaboração que prestou na correção de Provas de Exame Nacionais de Português assim como no primeiro contacto estabelecido com a Escola Secundária Damião de Gois, Alenquer. À Rute Antunes pela paciência e por todo o trabalho que teve na transcrição dos textos. Finalmente, à minha família a satisfação com que acompanharam o meu entusiasmo pelo trabalho desta Tese. iv CONTRIBUIÇÕES PARA A FORMULAÇÃO DE UMA METODOLOGIA DE ENSINO E AVALIAÇÃO BASEADA NA ANÁLISE ESTATÍSTICA DE TEXTOS EM PORTUGUÊS por LUÍS ANTÓNIO PISSARRA DE MATOS AGONIA PEREIRA v RESUMO PALAVRAS-CHAVE: Língua Portuguesa; Avaliação automática; Análise da Semântica Latente; Biplots. Esta investigação procurou identificar e avaliar problemas associados ao desenvolvimento de instrumentos de ensino / aprendizagem, a serem utilizados por professores e estudantes, com base na análise estatística de textos, com especial relevo dado à monitorização, quer pelos professores quer pelos estudantes, dos processos de aquisição de conhecimentos e de conteúdos pedagógicos nos quais o português ocupa papel central. Apesar de existirem importantes projetos de investigação ligados à língua portuguesa, por exemplo a investigação ligada à atividade do Instituto de Linguística Teórica e Computacional, ILTEC e do NLX-Group (Natural Language and Speech Group Da Faculdade de Ciências, Universidade de Lisboa) constata-se que na área do objeto de estudo desta investigação, poucos trabalhos têm sido publicados. No início desta investigação demos particular atenção aos trabalhos do grupo de Landauer e sua equipa, na Universidade do Colorado, EUA, que, tendo por base a metodologia da Análise da Semântica Latente (ASL), visam a avaliação automática de conhecimentos a partir de textos escritos em resposta a questões abertas. Apesar da ASL ser uma metodologia interessante, constatámos que a sua base computacional (a decomposição em valores e vetores singulares das matrizes de frequências de palavras em textos) coincide com a dos biplots de Gabriel e Galindo, pelo que usámos os biplots como instrumentos de visualização ao construir um sistema protótipo que, de uma forma simples e flexível, permite, em contexto de sala de aula, e tendo por base um processo de avaliação contínua, a avaliação dos estudantes por parte do Professor. Como principais resultados desta investigação, citam-se o desenvolvimento de um protótipo experimental que incorpora um sistema de mineração de textos de resposta a questões abertas em apoio da atividade dos professores na respetiva atividade letiva, o treino e teste de sistemas automáticos de classificação de textos (SAAT) assentes no conceito de ASL, dotados de uma interface gráfica assente nos biplots de Galindo e ainda os resultados das análises dos dados reais recolhidos (textos de manuais usados no ensino e textos de respostas a questões abertas incluídas em exames nacionais e em testes de avaliação contínua num politécnico) – realizadas pelo protótipo – que permitiram concluir, experimentalmente, pela razoabilidade de criar instrumentos de software com as características desejadas, embora separando os problemas de classificação automática com questões incluídas em exames sumativos finais das questões ligadas à formação contínua. vi ABSTRACT KEYWORDS: Portuguese Language; automatic assessment; Latent Semantic Analysis; Biplots. This research aims to identify and evaluate problems associated with the development of teaching and learning instruments, to be used by teachers and students, based on statistical analysis of texts, with special emphasis on monitoring, both by teachers and students, the acquisition of knowledge and pedagogical content, in which the Portuguese occupies the central role. Although there are important research projects related to the Portuguese language, for example the research linked to the activity of the Institute of Theoretical and Computational Linguistics, ILTEC, and NXL-Group (Natural Language and Speech Group four Faculdade de Ciências, Lisbon University, we observed that on the object of study of this research, few works have been published. At the beginning of this research we have given particular attention to research work of Landauer and its associates at the University of Colorado, USA that based on the methodology of Latent Semantic Analysis (LSA), the automatic assessment of knowledge. Despite LSA being an interesting methodology, we found that LSA and the concept of biplot from Gabriel and Galindo are based on the same computational techniques: singular value decomposition of frequency matrices. That is the reason why we used biplots as visualization instrument in the construction of a system that, in a simple and flexible way, allows teachers, in the context of the classroom and of a continuous assessment process, to evaluate students. As the main results of this investigation, we mention the development of an experimental prototype system that incorporates text mining of texts resulting from response to open questions, in support to teaching activities, the training and test of systems for automatic text classification based on the concept of LSA, equipped with a graphical user interface based on Galindo biplots and, also, the results of the analysis of real data collected (text of books used in teaching and text answers to open questions included in national examinations and texts resulting from continuous assessment in a polytechnic) - performed by the prototype - which allowed us to conclude, experimentally, for the reasonableness of creating software instruments with the intended characteristics, though separating sharply the problems of automatic classification of high stakes tests from issues related to continuous assessment. vii ÍNDICE Introdução.............................................................................................................................. 1 Capítulo I: Enquadramento Teórico / Estado de Arte. .......................................................... 6 1.1. Introdução. ..................................................................................................... 6 1.2. Importância, Formas de Avaliação e Monitorização de Conhecimentos. ..... 8 1.3. Teoria Clássica da Avaliação e o TRI. O Modelo de RASCH. ................... 13 1.4. Avaliação Automática de Conhecimentos. .................................................. 16 1.4.1. Introdução. ................................................................................................... 16 1.4.2. Avaliação Baseada em Itens de Resposta Aberta. ....................................... 17 1.4.3. Sistemas de Avaliação Automática de Textos (SAAT’s). ........................... 19 1.4.4. Classificação baseada na Análise Semântica Latente.................................. 24 1.4.4.1. Introdução. .................................................................................................... 24 1.4.4.2. A Análise da Semântica Latente como Modelo de Aquisição do Significado das Palavras pelas Crianças. ........................................................................ 25 1.4.4.3. ASL como Instrumento de Avaliação Automática. ...................................... 29 1.4.5. Validade e Fiabilidade dos Programas de Avaliação Automática de Textos. ..................................................................................................................... 37 1.4.6. Experiência Acumulada com a Avaliação Automática. Tendências. .......... 43 1.5. EDM - Educational Data Mining................................................................. 49 Capítulo II: Metodologia da Investigação. .......................................................................... 55 2.1. Introdução. ................................................................................................... 55 2.2. Formulação do Modelo. ............................................................................... 56 2.2.1. Estrutura. .......................................................................................................... 56 2.2.2. Obtenção da Representação Vetorial dos Textos (Tabelas Léxicas). .............. 61 2.2.3. Construção e Interpretação de Espaços Semânticos. Biplots. ......................... 65 2.2.4. Métodos de Avaliação de Conhecimentos baseados em ASL/Bipolts. ........... 74 viii 2.2.4.1. Método 1. ..................................................................................................... 75 2.2.4.2. Método 2. ..................................................................................................... 78 2.3. Estruturação da Amostra. ............................................................................ 80 2.4. Plano de Recolha de Dados. ........................................................................ 81 2.5. Metodologia Estatística de Tratamento de Dados. ...................................... 83 Capítulo III: Recolha e Análise de Dados. .......................................................................... 85 3.1. Introdução. ................................................................................................... 85 3.2. Recolha e Registo de Dados. ....................................................................... 87 3.3. Estrutura da Base de Dados Textual (BDT). ............................................... 88 3.4. Criação de Instrumentos de Análise Estatística de Textos. ......................... 91 3.5. Resumo Estatístico das Amostras. ............................................................... 93 3.5.1. Dados EX-MIN – Exames do Ministério. ................................................... 93 3.5.2. Dados GESTÃO. ....................................................................................... 101 3.5.3. Dados DISCIPLINA. ................................................................................. 103 3.6. Comparação de Textos. Análise Descritiva. .............................................. 104 3.7. Comparação de Textos usando Biplots. .................................................... 110 3.8. Categorização Automática de Textos em Apoio da Avaliação Formativa. 117 3.8.1. Introdução. ................................................................................................. 117 3.8.2. Lógica do Uso das Análises e Cluster. ...................................................... 118 3.8.3. Experimentação com os Dados GEST....................................................... 119 3.8.4. Experimentação com os Dados do EX-MIN. ............................................ 122 3.9. Avaliação Automática de textos usando o Método LSA/Biplots. ............. 124 3.9.1. Introdução. ................................................................................................. 124 3.9.2. Construção do Espaço Semântico (ES). .................................................... 126 3.9.3. Dados EX-MIN. Experiência nº 1. ............................................................ 130 3.9.4. Dados EX-MIN. Experiência nº 2. ............................................................ 136 ix 3.9.5. Dados de GESTÃO. Experiência nº 1. ...................................................... 144 3.9.6. Estudo Comparativo das Classificações dos Professores. ......................... 153 Conclusão .......................................................................................................................... 160 Referências Bibliográficas ................................................................................................ 164 Índice das Figuras.............................................................................................................. 174 Índice das Tabelas ............................................................................................................. 179 ANEXO A ......................................................................................................................... 181 x LISTA DE ABREVIATURAS AA Aprendizagem Auto-regulada ACCESS; Sistema de Gestão de Base de Dados da Microsoft, inserido no Microsoft Access pacote Microsoft Office Professional AES Automatic Essay Scoring ALGLIB Numerical Analysis library (http://www.alglib.net/) APA American Psychological Association ASL Análise da Semântica Latente BDT Base de Dados Textual BETSY Bayesian Essay Teste Scoring System CRI Constructed Response Item ECD Evidence Centered Design EDM Educational Data Mining ES Espaço(s) Semântico(s) ETS Educational Testing Service EXCEL; Programa de Folha de Cálculo da Microsoft, incluído no pacote Microsoft Excel Microsoft Office GMAC Graduate Management Admission Council GMAT Graduate Management Admission Test GRE Graduate Record Examination IEA Intelligente Essay Assessor xi ILTEC Instituto de Linguística Teórica e Computacional IRT Item Response Theory LAD Language Acquisition Device LSA Latent Semantic Analysis MDE Mineração de Dados Educacionais MDS Multi Dimensional Scaling NLX-Group Natural Language and Speech Group NLP Natural Language Processing OCR Optical Character Recognition PAET Programa de Análise Estatística de Textos PEG Project Essay Granding SAAT Sistema Automático de Avaliação de Textos SDL Software Development Lohninger SPSS Statistical Package for the Social Sciences SVD Singular Value Decomposition TCT Teoria Clássica dos Testes TOEFL Test Of English as a Foreign Language TRI Teoria da Resposta ao Item WAD Word Acquisition Device xii Introdução Neste trabalho investiga-se a possibilidade da utilização das técnicas de análise estatística de textos (text-mining) em tarefas relacionadas com a avaliação, a monitorização do processo de aquisição de conhecimentos e no apoio ao trabalho do professor e do estudante. O tema que mais nos motiva é, de um modo geral, a problemática da avaliação e o da construção de instrumentos de apoio ao professor nas suas tarefas de avaliação. De um modo mais específico, a motivação imediata desta tese teve a ver com a problemática da avaliação de respostas a questões abertas – sob a forma de textos elaborados pelos estudantes e as questões de feedback a estudantes em sistema de auto ensino. Trata-se de analisar e, eventualmente, construir instrumentos capazes de lidar com grandes quantidades de texto envolvidas nos manuais de estudo e nas respostas dos estudantes a questões que exigem como resposta destes a elaboração de textos. É um facto sobejamente conhecido por todos os professores que, de um modo geral, estes são deixados a si próprios – isto é, não têm, em geral, qualquer apoio metodológico ou outro – quando têm de elaborar testes de avaliação de conhecimentos e competências nos diversos momentos do ciclo letivo anual e, depois de aplicados esses testes, avaliar as respostas e publicar os resultados dessa avaliação. É o que sucede com particular incidência, naquelas disciplinas em que o texto escrito em linguagem natural tem importância preponderante e em que a correção e classificação das respostas a questões abertas consomem um volume enorme de trabalho sem que isso garanta a homogeneidade de critério e ausência de ambiguidade na avaliação dessas respostas. Numa altura em que quase todos os envolvidos no processo de ensino – aprendizagem têm acesso a processamento eletrónico de textos, em que as plataformas de ensino, nomeadamente em software Open Source como o Moodle, proliferam a todos os níveis e em que vão estando disponíveis poderosas metodologias de tratamento estatístico de textos, justifica-se investigar a possibilidade de identificar, avaliar ou mesmo construir alguns instrumentos que apoiem os professores nas tarefas de avaliação de respostas a questões abertas e na preparação de testes em que os textos tenham papel predominante. 1 Esses mesmos instrumentos estatísticos podem ter um papel fundamental no processo de monitorização pelo Professor da aquisição de conhecimentos pelos estudantes como dos próprios estudantes envolvidos em processos autónomos de aprendizagem, possibilitando o fornecimento, em tempo oportuno, de feedback baseado em informação objetiva que os motive e permita o autocontrolo e a auto-motivação para aprender mais e melhor. Nesta perspetiva, procura-se neste trabalho avaliar – do ponto de vista do seu potencial para apoio do trabalho dos professores e estudantes – certas técnicas e metodologias gerais de análise estatística de textos – como a Classificação Automática, o Multi Dimensional Scaling (MDS) e técnicas mais especializadas como a Latent Semantic Analisis (LSA). Esta avaliação assenta na elaboração de protótipos que permitam a sua utilização experimental. Que instrumentos podem ser desenvolvidos e com que metodologias para que, sem envolver mais do que os recursos habituais da parte dos intervenientes (informação textual, processador de texto, folha de cálculo, entre outros), estes possam utilizá-los no seu dia-adia? A abordagem básica é a de procurar dotar os intervenientes (professores e estudantes) de instrumentos que gerem informação útil ao processo de ensino – aprendizagem, mais do que de programas de avaliação automática de conhecimentos, sendo os objetivos gerais desta tese os seguintes: 1. Identificar e avaliar técnicas de análise estatística de textos que possam ser usados na construção de instrumentos de apoio a professores e estudantes como instrumentos de monitorização dos processos de aquisição de conhecimentos e avaliação; 2. Avaliar a possibilidade de usar a técnica de LSA em tarefas de apoio à avaliação de conhecimentos com base em textos de resposta a questões abertas; 3. Elaboração de um protótipo que permita experimentar técnicas de análise estatística de textos na perspetiva do apoio ao professor e a estudantes identificando problemas a ter em conta em futuros desenvolvimentos. 2 As questões para as quais procurámos respostas ao longo desta investigação são as seguintes: Questão I – Qual o estado da investigação relativo à avaliação automática de conhecimentos com base na análise de textos de resposta a questões abertas? Questão II – Quais os problemas que se põem quando se procura construir instrumentos baseados em análise estatística de textos e outras técnicas de mineração de textos que permitam apoiar os professores no seu esforço para reduzir os subjetivismos na análise dessas respostas dos estudantes, permitindo, sem aumento brutal da sobrecarga de trabalho, generalizar o uso de questões de resposta aberta? Questão III – Que impacto podem as técnicas de mineração de textos ter no modo de abordar o processo ensino-aprendizagem e qual a possibilidade, a curto prazo, de construir sistemas baratos de apoio a professores e estudantes usando essas tecnologias? Este trabalho é uma tentativa de dar resposta a cada uma destas questões. Especificamente: No Capítulo I procura-se responder à Questão I. Neste capítulo visa-se fazer o ponto de situação relativa à investigação da questão da avaliação automática de conhecimentos com base na análise de textos de resposta a questões abertas. Surpreendentemente, constata-se que em Portugal não se deteta na literatura ou nos organismos oficiais iniciativas nesta direção, quando a investigação parece apontar para o facto de, neste momento, ser difícil avaliar as diferenças entre os comportamentos estatísticos das classificações atribuídos pelos sistemas automáticos mais importantes e as atribuídas por professores. Sendo essa questão considerada resolvida, nos Estados Unidos, o próximo passo parece ser o de realizar importantes avaliações sumativas a nível nacional usando sistemas que têm vindo a ser aperfeiçoados ao longo dos últimos 20 anos, sob a liderança de organizações como o Educational Testing Service (ETS). Nos Capítulos I e II procura-se dar resposta à Questão II. Especificamente, no Capítulo II procura-se estabelecer a metodologia a usar na construção de um modelo que procure responder a esta questão, dando-se especial atenção 3 às características de um sistema para realizar avaliações – sobretudo formativas – que possa apoiar a avaliação de textos produzidos por estudantes em resposta a questões abertas, usando principalmente a técnica da Análise da Semântica Latente (ASL) – designação de agora em diante usada para designar a LSA. Tendo-se reconhecido que subjacente a esta metodologia está a mesma técnica computacional em que se baseiam representações gráficas de dados multivariados – a Singular Value Decomposition (SVD) – a estrutura do modelo a desenvolver explora este facto e prevê, explicitamente, a produção de gráficos (biplots, árvores de classificação) que possam ser usados na comparação dos textos produzidos pelos diversos estudantes de uma turma com melhoria dos critérios de homogeneidade e redução de subjetividade do Professor. É ainda neste capítulo – central de toda a tese – que se apresenta o procedimento usado na estruturação de uma amostra que permite validar com dados reais as principais metodologias. Como condição fundamental para a possível utilização prática das técnicas e instrumentos como os que neste trabalho se preconizam, assume-se que os estudantes usam, na produção dos respetivos textos, meios informáticos (computadores e processadores de texto). A tecnologia do reconhecimento ótico de caracteres, OCR, não atingiu ainda o grau de perfeição que permita encarar a utilização de textos manuscritos dos estudantes neste tipo de processamentos. Infelizmente residiu aqui uma das principais dificuldades deste projeto: o facto de o Ministério da Educação não guardar de um modo centralizado as provas classificadas e o facto de todos os textos usados serem textos manuscritos que tiveram previamente de ser digitalizados sem qualquer apoio económico para a realização dessa tarefa. Ainda no contexto da resposta à Questão II, no Capítulo III descreve-se a estrutura de uma base de dados a usar para registar os textos das respostas dos estudantes a questões de resposta aberta, descrevendo-se os instrumentos usados na recolha e o programa usado para o efeito. São ainda apresentados os resultados das análises realizadas e a respetiva interpretação. Uma das conclusões a que se chegou foi a de que, embora existam correlações significativas entre as classificações atribuídas pelos professores e as atribuídas pelo sistema implementado, essas correlações não atingem os níveis relatados em estudos publicados, por exemplo, pelo ETS. Atribui-se isto - para lá do facto de os dados usados não serem suficientemente volumosos para esse efeito – ao não ter sido possível dotar o 4 protótipo construído de todos os componentes necessários à cobertura de questões linguísticas. Nos Capítulos II e III procura-se responder à Questão III, tendo-se concluído, tanto através do estudo da literatura como através da experimentação possibilitada pelo protótipo de sistema por nós construído, que as técnicas de mineração de textos (data mining), em particular, e de exploração de dados, em geral (através do conceito Educational Data Mining (EDM)) vão ter, como suspeitávamos, um impacto enorme na completa revisão, em curso, do atual paradigma do processo ensino – aprendizagem. Em particular, dado o uso combinado de sensores para aspetos físicos (biometria) com a exploração estatística sistemática dos dados da interação estudantes-sistemas, combinados com técnicas psicométricas (Teoria da Resposta ao Item (TRI), em particular), estão criadas as condições que vão permitir, a breve prazo, criar sistemas baseados no conceito designado por Evidence Centered Design (ECD). O protótipo por nós criado (e o próprio processo de criação) para apoiar as investigações descritas – cujo manual do utilizador constitui o Anexo A desta tese – permitiu-nos uma perceção prática do tipo de problemas a resolver em futuras investigações. 5 Capítulo I: Enquadramento Teórico / Estado de Arte. 1.1. Introdução. Neste capítulo procura-se sintetizar o significado e evolução histórica de alguns dos conceitos fundamentais relacionados com a nossa própria investigação – nomeadamente a avaliação de conhecimentos no âmbito da atividade letiva do professor e do estudante, procurando-se caracterizar o contexto das atuais potencialidades criadas pela revolução em curso da ciência dos dados e das disciplinas com ela relacionadas: data mining, text mining, analytics, de agora em diante designadas em português por mineração de dados, mineração de textos e analítica. Sendo um dos objetivos deste trabalho investigar a possibilidade de criar instrumentos informáticos que facilitem o trabalho dos professores e dos estudantes, principais atores envolvidos no processo de ensino-aprendizagem, procura-se neste capítulo caraterizar algumas dessas possibilidades enquadrando-as nos contextos históricos e teóricos adequados. Face à disponibilidade objetiva de instrumentos informáticos (hardware e software) a atividade de avaliação, a que dedicamos a maior parte do presente capítulo, está a sofrer profundas transformações alimentadas por novos instrumentos teóricos e metodológicos. Estas transformações implicam a reconceptualização de alguns problemas de ensino-aprendizagem – face a novas possibilidades de análise de dados como as fornecidas pela mineração de textos e de novos instrumentos metodológicos como sejam sistemas de mineração de dados e aprendizagem automática (learning machines). A título de exemplo, a Teoria da Resposta ao Item (TRI) modelo teórico em que assenta a elaboração de testes com caraterísticas psicométricas controladas (fiabilidade, validade e grau de dificuldade) é atualmente objeto de intensa atividade de investigação desencadeada pelos desafios resultantes das possibilidades criados por essas novas tecnologias (Rauch & Marting, 2010). O conceito de EDM (Mineração de Dados Educacionais) é a manifestação no domínio das Ciências da Educação de uma nova realidade resultante da disponibilidade de grandes massas de dados em todos os domínios (em particular na atividade da Educação), 6 que desafiam as capacidades de armazenamento e análise dos computadores disponíveis e dos métodos e metodologias existentes. Até à década de 70 do século passado, a informação era restrita a certas pessoas, em determinados lugares e num formato específico. A questão era então a escassez de informação e a dificuldade do respetivo acesso. Hoje a informação está acessível a qualquer pessoa que tenha um computador com acesso à Internet. Face ao colossal volume de informação disponível (Manyika, Chui, Brown, Bughin, Dobbs, Roxburgh, & Byers, 2011) torna-se absolutamente essencial usar tecnologia que consiga obter informação correta, isto é, contextualizada, no espaço de tempo certo. Ranadivé e Maney (2011) conseguem descrever perfeitamente esta ideia no seu livro “The Two-Second Advantage”, mostrando que uma vantagem de apenas dois segundos pode fazer toda a diferença no mundo atual em que vivemos, graças aos avanços da ciência nos campos da pesquisa neurológica e das Tecnologias da Informação. Uma das palavras-chave do atual estado do mundo – big data, ver por exemplo Executive Office of the President (2010) – tem a ver com a superabundância de dados existentes e com a tendência exponencial para o seu aumento: organizações (nomeadamente as ligadas ao ensino), empresas, famílias e indivíduos acumulam, em suportes magnéticos, tanto os dados das observações científicas como os dados do seu trabalho normal e das suas vidas, num movimento que tende a refletir nos computadores o estado do mundo e das sociedades em cada instante (Manyika et al., 2011). Este facto tem como consequência que não só praticamente todas as atividades humanas estejam dependentes de dados existentes em suporte magnético como, do ponto de vista da investigação científica, uma parte cada vez maior dessa investigação passa a ser realizada sobre a representação do mundo já existente nos computadores e em contínua atualização ao ritmo da vida. Veja-se o exemplo do Google Earth1. Como consequência, têm assumido importância crescente as atividades ligadas à exploração científica desses dados em benefício de quase todas as disciplinas, desde as Ciências Humanas, à Física e à Biologia. Em particular, nas Ciências da Educação, é de origem recente o conceito de Mineração de Dados Educacionais - Exploração de Grandes Massas de Dados em Ciências 1 Google Earth realiza a cartografia do planeta, juntando imagens obtidas de várias fonte sobre um globo 3D. 7 da Educação (Romero, Ventura, Pechenizkiy, & Baker, 2011). Trata-se de utilizar também, no domínio das Ciências da Educação, conceitos que têm feito o seu caminho, com resultados assinaláveis, noutras áreas no sentido de desenvolver técnicas que permitam explorar a estrutura específica dos dados existentes sobre suportes magnéticos nos diversos domínios e vertentes das Ciências da Educação. Quais as consequências desse facto nas técnicas de ensino, no processo de ensinoaprendizagem, no funcionamento das escolas, na estruturação dos programas e seus conteúdos, nas relações entre professores e estudantes, nos métodos de avaliação? Não se trata apenas de superabundância de dados, mas também do facto do acesso aos mesmos ser altamente facilitado através da Internet – no sentido de que está, supostamente, disponível para todos e imediatamente acessível. Professores e estudantes têm acesso, em princípio, à mesma informação, ao mesmo tempo, no mesmo local e nas mesmas condições. Quais as consequências deste facto para as relações professorestudante no processo de aprendizagem e para a problemática da avaliação de conhecimentos? Quando se diz “acessível” não estamos apenas a dar conta da possibilidade de consultar, estudar, ler esses dados, mas da possibilidade de os processar usando software sob o controlo do utilizador. Entre outras consequências, o que é ensinado e o modo como é ensinado pode ficar sob um escrutínio potencialmente muito mais rigoroso e intenso por parte da sociedade – instituições, pais, estudantes, escola, tribunais; o professor deixa de ser a fonte principal do conhecimento e os seus atos e decisões avaliados objetivamente. Os intervenientes no processo de ensino-aprendizagem continuam a ser os mesmos: sociedade, escola, professor, estudante; contudo a realidade descrita tem profundas consequências no desempenho dos respetivos papéis e seu conteúdo. 1.2. Importância, Formas de Avaliação e Monitorização de Conhecimentos. A importância da avaliação e certificação de conhecimentos e competências bem como os seus objetivos e condições de realização garante que a respetiva validade e fiabilidade constituíam já uma preocupação importante da China de há 3000 anos, como se pode ver em Wainer, H., 1990. Este autor citando a obra do historiador chinês Ssu-yu Têng 8 (1943), afirma que já em 1115 a. C. existia na China um sistema de exames a que se submetia os funcionários públicos antes de serem graduados. Na obra de Têng (1943) pode, inclusivamente, ler-se que a primeira referência na Europa ao Exame Imperial deve-se ao missionário português Gaspar da Cruz (Tratado em que se contam muito por extenso as Cousas da China com suas particularidades e assim do Reino de Ormuz, 1569). Este Exame Imperial veio influenciar decisivamente o sistema de avaliação dos funcionários públicos ingleses. Se é verdade que os estudantes têm, com a tecnologia atual, potencialmente, acesso às mesmas fontes, conteúdos e instrumentos de análise que os professores, tal não significa que a aquisição de conhecimentos e competências por parte dos estudantes seja, por esse facto, um dado adquirido. Pelo contrário, a necessidade de avaliação de conhecimentos e certificação de competências têm uma importância crescente nas sociedades complexas em que as questões de qualidade – impostas pela legislação e pela necessidade de fiabilidade e segurança têm importância cada vez maior. Por definição, o ensino é um processo que tenta promover o desenvolvimento dos estudantes, sendo a aprendizagem dos estudantes o objetivo dos professores e das escolas. A sociedade tende a atribuir a tarefa de avaliar o desempenho, o desenvolvimento escolar e o potencial dos estudantes em grande parte às escolas e aos professores, responsabilizandoos pela aprendizagem daqueles. As escolas acabam por ser sistemas humanos influenciados quer pelas pessoas que nelas trabalham, de forma interdependente, como pela comunidade e sociedade onde estão integradas. A sociedade não pode correr o risco de atribuir responsabilidades a incompetentes nem de confiar a pessoas impreparadas o desempenho de funções técnicas e sociais importantes. Diversos estudos concluíram que o comportamento dos professores tem uma importante influência sobre a vontade que os estudantes demonstram em cooperar e persistir nas tarefas de aprendizagem (Dolezal, Welsh, Pressley, & Vincent, 2003; Pintrich & Schunk, 2002). O papel do professor na orientação e no sucesso dos estudantes é muito importante. O modo como o estudante é motivado na sala de aula para que atinja o comportamento e a aprendizagem desejada são fatores que não podem ser descuidados. Ou seja, a atribuição de boas notas, elogios e privilégios nas aulas são exemplos de incentivos 9 e recompensas que os professores podem utilizar de modo a criarem, nos estudantes, hábitos de estudo e fomentarem comportamentos desejados. Da mesma forma, as más notas, os castigos e a perda de privilégios são usados como forma de desencorajar ações e comportamentos indesejados. O professor aplica a teoria do reforço, com recurso à utilização de reforços positivos e negativos. O professor deverá ser competente e eficaz na forma como identifica os comportamentos desejados e os reforços que são adequados e utiliza estes reforços de forma a fortalecer e encorajar os comportamentos desejados. Do mesmo modo, o Professor, no decurso do ano letivo necessita de controlar o processo de aquisição de conhecimentos e competências dos seus estudantes no sentido de realizar as correções necessárias e fornecer aos estudantes elementos de feedback que permitem a autocorreção ou funcionem como elementos de motivação. É consensualmente aceite que os índices da motivação nos estudantes são alteráveis, sendo um dos papeis mais importantes que o professor tem no contexto do ensino-aprendizagem, devendo estar atento àqueles procurando potenciá-los. Efetivamente, as escolhas dos professores, em relação às estratégias de motivação adotadas influenciam a manutenção do envolvimento dos estudantes na aprendizagem. Há bastante tempo atrás, John Dewey (1916), observou que as crianças aprendiam quando participavam em contextos sociais. Também Jerome Bruner (1996) e Vygotsky (1978, 1994) defenderam que as pessoas estabelecem significados a partir das relações e da participação em cada cultura. De facto, a vida numa sala de aula pode, de alguma forma, espelhar a vida fora da escola. Assim, também os grupos e as comunidades de aprendizagem são representativas das necessidades individuais e de grupo tornando-se um importante aspeto do ensino, devendo os professores atender e corresponder às múltiplas caraterísticas dos estudantes para a sua criação e estabelecimento, uma vez que se sabe que estas comunidades também podem limitar a iniciativa de um indivíduo e / ou promover normas que limitem a criatividade e a aprendizagem. Cabe ao professor atribuir tarefas aos estudantes que sejam para eles interessantes, de modo a que estes continuem nas suas tarefas de aprendizagem, havendo, contudo, estudantes mais persistentes que outros. Também é aceite que as aprendizagens são mais significativas em ambientes que se caraterizam pelo respeito mútuo. Os próprios estudantes envolvidos em processos de ensino-aprendizagem, com ou sem professores, necessitam com frequência de aferir o respetivo progresso antes de 10 avançarem para temas mais complexos e dependentes de conhecimento anterior. Efetivamente, a utilização da Mineração de Dados Educacionais (EDM) tem contribuído muito para o desenvolvimento das Ciências da Educação, nomeadamente na análise das trajetórias dos estudantes à medida que se desenvolvem ao longo de um período de tempo. Os estudos têm incidido sobre períodos de tempo pequenos. Amershi e Conati (2009) estudaram as relações entre comportamentos em Ambientes de Aprendizagem (A. A.) exploratória e os resultados da aprendizagem. Arroyo e Woolf (2005) examinaram as relações entre um conjunto de comportamentos AA e as motivações num sistema inteligente de tutoria. No entanto, existem estudos nos quais os períodos de tempo em questão são maiores, como o de Arnold (2010), que teve a duração de um semestre. Este assunto está intimamente ligado à AA, na qual um estudante procura, por um lado, otimizar a forma de chegar ao seu objetivo e, por outro, otimizar a forma como essa forma é construída. With Hadwin e Winne (Winne & Hadwin, 1998; Winne, 2001, 2011) propuseram um modelo de 4 fases sobre A. A. Se é certo que a Avaliação sempre tem levantado, e continua a levantar, muitas reservas por parte de muitos educadores – ver, por exemplo, Miller, Linn, e Gronlund (2009) – torna-se evidente do exame da bibliografia consultada, mesmo a mais recente, que a avaliação não só não pode ser dispensada como tende a tornar-se cada vez mais presente e decisiva. No contexto atrás descrito, o papel do Professor não fica enfraquecido, sendo ainda mais importante e difícil – uma vez que não se trata agora, apenas, de transmitir conhecimentos cabendo-lhe ensinar algo muito mais importante: o significado das coisas e da informação a que todos têm acesso, as atitudes perante o conhecimento; a semântica, mais do que o conhecimento formal. Cabe-lhe também um papel ainda mais fundamental e difícil na avaliação dos conhecimentos adquiridos e da certificação de competências num contexto em que os processos de avaliação são objeto de sistemática contestação por parte de grupos sociais importantes. A avaliação dos estudantes consome grande parte do tempo dos professores. Shaefer (1991) refere que os professores passavam até 10% do seu tempo com assuntos relacionados com a classificação e a avaliação, e Stiggins (2004) refere que este tempo pode representar cerca de um terço. 11 Assim, é neste quadro, que cabe ao Professor realizar a “medição”. Ou seja, fazer a recolha e síntese da informação sobre os seus estudantes e as suas salas de aula. É um processo contínuo. A recolha desta informação pode ser efetuada de maneira formal, através de testes, relatórios, apresentações, entre outros; e de forma informal, por observação, conversação, etc. Pode fazer parte deste processo informações sobre a sala de aula assim como a forma de ensinar do professor. Outro dos papéis importantes que o Professor tem a seu cargo é a “avaliação”. Realizar juízos, dar classificações – atribuição de um valor à informação obtida – e decidir sobre o mérito. As avaliações separam-se em avaliações formativas e sumativas. As formativas são recolhidas antes ou durante a formação destinando-se a informar os professores sobre os conhecimentos e as competências prévias dos estudantes. Estas informações permitem aos professores fazer juízos sobre como agrupar os estudantes, como planificar unidades e aulas assim como estratégias educativas. As sumativas constituem a intenção da utilização da informação sobre os estudantes ou currículos após a realização de uma série de atividades educativas. Têm como objetivo resumir o desempenho de um estudante, ou grupo de estudantes, ou professor mediante um conjunto de objetivos de aprendizagem. Realizam-se juízos sobre os resultados, servindo estes para a determinação das notas e para explicar as mesmas aos estudantes e encarregados de educação. Tipo de avaliação Formativa Sumativa Tabela 1.2.1. Quando é obtida Tipo de informação obtida Como é utilizada a informação Antes ou durante a formação Informação sobre os conhecimentos prévios dos estudantes e / ou dos processos formativos Ajudar na tomada de decisões do professor Após a formação Informação sobre o desempenho do estudante e /ou do professor Ajudar na elaboração de juízos sobre os resultados obtidos pelos estudantes ou professores Avaliação formativa e sumativa (Arends, 2008). 12 A informação que os professores e outros profissionais utilizam, para a tomada de decisões deve ser de elevada qualidade (fiável e válida). Os resultados obtidos num teste são fiáveis ou precisos quando são consistentes. No entanto, existem fatores que podem introduzir erros (inconsistência e pouca fiabilidade) nomeadamente as expectativas dos estudantes face às classificações a serem-lhe atribuídas, erros de classificação dos professores e a disposição do estudante no momento do teste. Outra caraterística que um teste deve ter é a de ser justo, ou seja, deve oferecer a todos os estudantes a mesma oportunidade de terem uma boa nota, sem descriminação pela raça, etnia ou género. 1.3. Teoria Clássica da Avaliação e o TRI. O Modelo de RASCH. Os sistemas atuais de avaliação assentam, essencialmente, em conceitos psicométricos e resultam de uma longa evolução que tem início em 1908 com a escala de Binet e Símon, baseada em 30 problemas ordenados por dificuldade crescente, aplicável a crianças entre os 3 e os 11 anos, escala esta que visava expressar a idade mental ou nível mental. Na evolução das teorias quantitativas de avaliação assumem especial relevância a Teoria Clássica dos Testes (TCT) e a Teoria da Resposta ao Item (TRI) – Baker (1992), Keeves (1988), Arias (1996), Longford (1995), Muñiz (1996) e Rauch e Harting (2010). Considerando uma população de P pessoas sobre as quais são observados os valores Xi (i= 1, 2, …, P) de uma variável aleatória – as pontuações obtidas num certo teste, por exemplo – nesta teoria assume-se ainda que, para lá da pontuação observada Xi, existe uma pontuação verdadeira Vi que não pode ser observada (diretamente), donde resulta que Xi = Vi + Ei, Isto é, o valor observado Xi é o valor verdadeiro Vi mais o erro de observação Ei = Xi - Vi, assumindo-se que o valor médio do erro é nulo assim como são nulas as correlações dos erros entre si e dos erros com os valores verdadeiros: isto é, não há relação (linear) entre os erros entre si nem entre os erros e os valores verdadeiros. Este modelo, como mostraram autores como Keeves (1988) e Linden (1997), sofre de consideráveis limitações tanto do ponto de vista da adequabilidade à realidade de alguns 13 dos seus pressupostos (validade) como do ponto de vista da qualidade dos resultados obtidos. Sobre estas dificuldades pode consultar-se Arias (1996) e Muñiz (1996). Uma das dificuldades na utilização da TCT reside na não consideração de um aspeto crucial do processo de medição aplicável a fenómenos psicológicos: o da interação entre o respondente e a pergunta, mais especificamente entre o grau de competência do respondente e o grau de dificuldade de um item. Basicamente, a TRI – que abrange variantes expressas por vários modelos – assume a existência de certas variáveis latentes (não observáveis diretamente) ou traços latentes (competências) que permitem predizer ou explicar o comportamento do estudante ao responder a um item. Uma vez que estas variáveis ou traços latentes, por exemplo, a inteligência do estudante, não são observáveis diretamente, tudo o que se pode fazer é tentar estimar o seu valor através de variáveis observáveis ou manifestas que são função – dependem – desses traços latentes não observáveis (Baker, 1992; Linden, 1997). Estes traços latentes – admitindo que são variáveis quantitativas – podem ser unidimensionais ou multidimensionais/multivariadas. Isto é, são modeladas por vetores = (1, 2, …, k) em que k é o número de dimensões da variável latente ou traço latente. Para cada traço latente - i –assume-se que existe uma relação crescente (função caraterística) entre o valor desse traço e a probabilidade que o respondente obtenha êxito ao responder ao item. Sobre este tema podem ver-se os citados Arias (1996), Baker (1992), Muñiz (1996) e Linden (1997). Em Baker (1992) e em Linden (1997) pode ver-se que uma variante específica da TRI é o modelo de RASCH. Se n for a aptidão ou competência – valor do traço a ser medido da pessoa número n – e se i for a dificuldade do item (dicotómico) i, então a probabilidade de que esse respondente acerte ao responder a este item é dado pela expressão e ( n i ) P X ni 1 . 1 e ( n i ) Em síntese: quanto maior o afastamento entre a competência de um estudante e a dificuldade de um item (aqui expressa por n - i), menor é a probabilidade de que um estudante com essa competência acerte na resposta a esse item. E o inverso. Em particular, se n = i, a probabilidade de êxito é ½; por outras palavras, o resultado é incerto: por vezes os respondentes que respondem a itens ao seu nível de competência acertam na resposta, mas pode suceder, com igual probabilidade, o contrário. Se a competência do 14 respondente é maior que a dificuldade do item, então a probabilidade de acertar é superior a 0.5. Reciprocamente, se a competência do respondente for inferior à dificuldade do item, a probabilidade de acertar é inferior a 0.5. Os valores n e i não podem ser observados diretamente, pelo que têm de ser estimados a partir de observações resultantes da aplicação de testes. Os valores de n aparecem refletidos nas percentagens observadas de acerto em testes com certa dificuldade e os valores de n aparecem refletidos – para estudantes de certa competência fixa – na percentagem de acerto na resposta ao teste. O modelo de RASCH está em aplicação crescente tanto em testes constituídos por questões (itens) de resposta múltipla como em testes formados por itens de resposta expressa em escalas ordinais, como por exemplo escalas de Likert. O modelo TRI tem sido um dos fatores explicativos do uso generalizado dos testes de resposta múltipla (binária ou não) dada a simplificação que os dados provenientes deste tipo de itens introduzem nos métodos de estimação e a simplificação da teoria estatística de estimação permitida por este tipo de testes. A outra razão está na facilidade com que as respostas a testes desse tipo são classificadas e, portanto, no baixo custo da classificação, tanto para a organização como para o professor. Acresce ainda que a aplicação de itens desse tipo tem permitido a construção de bases de dados com os resultados da respetiva aplicação a grandes conjuntos de respondentes – possibilitando a estimação das chamadas curvas caraterísticas e de outros parâmetros que estão na base da construção automática de testes cujas caraterísticas psicométricas são perspetivadas e otimizadas antes do momento da aplicação (Wainer, 1990). O aspeto negativo deste estado de coisas tem sido a anterior tendência para não usar ou usar pouco questões de resposta aberta (em que os estudantes elaboram a resposta) mais adequados do que os testes de resposta múltipla na avaliação de certos conhecimentos e competências e latentes. Recentemente têm-se intensificado – ver, por exemplo, Liu, Lee, e Linn (2011) - os esforços visando a utilização de itens de resposta aberta nos testes de avaliação. Embora desde há muito tempo se tenha reconhecido que os itens de resposta aberta – obrigando a que os respondentes elaborem a resposta na sua língua natural, por exemplo – têm grandes vantagens não só do ponto de vista da aquisição de conhecimentos como pelo que revelam 15 no momento da avaliação, diversas dificuldades têm impedido a sua utilização mais frequente em testes de avaliação de conhecimentos. Uma das razões prende-se com o tempo que a respetiva classificação exige dos professores. A outra está ligada à dificuldade em evitar a intervenção de fatores subjetivos e outros enviesamentos nas tarefas de avaliação. Existe, atualmente, uma investigação muito ativa nas questões de adaptação da TRI aos problemas postos pela investigação das respostas a questões abertas (Rauch & Hartig, 2010; Liu, Lee, & Linn, 2011; Oliveri & Davier, 2011; Newman & Vermunt, 2011). Este estado de coisas tem constituído motivação importante no sentido de explicar tentativas de desenvolvimento de sistemas automáticos de classificação em particular de itens de resposta aberta, tema que é o objeto nos números seguintes. 1.4. Avaliação Automática de Conhecimentos. 1.4.1. Introdução. A necessidade de desenvolver sistemas automáticos de avaliação de conhecimentos confunde-se, praticamente, com a necessidade de avaliar automaticamente conhecimentos expressos por respostas a questões abertas (itens em que os respondentes respondem elaborando a resposta e não selecionando apenas a resposta como nos testes de itens de resposta múltipla). Em particular, a questões em que a resposta tem a forma de um texto. Embora existam sistemas automáticos de avaliação de conhecimentos – por exemplo, para matemática – que se baseiam em grafos, símbolos matemáticos ou equações – ver, por exemplo, Williamson, Benmett, Bernstein, Foltz, Landauer, Rusin, Way, e Sweeney, (2010) – a situação de longe mais comum é aquela em que a resposta é um texto: ensaio ou texto mais curto. Esta tendência tem-se acentuado à medida em que avança a investigação sobre o processamento automático da língua natural, as técnicas de inteligência artificial e sobretudo as técnicas de análise estatística de textos e de mineração de textos. Surpreendentemente, como se verá em 1.4.3., os sistemas disponíveis no mercado têm-se mantido – embora com aperfeiçoamento constante – relativamente estáveis. No que se segue, a sigla SAAT serve para designar sistema Automático de Avaliação de Textos, equivalente ao conceito em inglês Automatic Essay Scoring (AES). 16 1.4.2. Avaliação Baseada em Itens de Resposta Aberta. Uma das vantagens dos itens de resposta múltipla está – o que vai contra a intuição imediata - na possibilidade de reduzir tanto quanto for necessário ou desejável os inconvenientes da resposta ao acaso. Por exemplo, se um item de resposta múltipla tiver 4 alternativas de resposta, a probabilidade de que um estudante acerte na resposta correta, escolhendo a resposta ao acaso (“adivinhar” a resposta certa), é de ¼= 0.25. É claro que para k alternativas de resposta, essa probabilidade é de 1 k . Em particular, para k= 2, esta probabilidade é enorme (0.5). Para um teste que tenha n itens com k alternativas de resposta cada uma, a probabilidade de que um respondente acerte em a desses itens respondendo ao acaso (a= 0, 1, 2, …, n) é dada pela distribuição binomial. Isto é: se A designar o número de acertos respondendo ao acaso a um teste de n itens cada um com k= alternativas, a probabilidade de que A tenha o valor a é n na P ( A a) p a 1 p , em que p= 1 . k a Assim, por exemplo, se um teste tem n= 20 itens cada um com k= 4 alternativas de resposta, a probabilidade de que um respondente acerte em 10 desses itens escolhendo as respostas ao acaso é: 20 P ( A 10) 0.2510 0.7510 0.0099 0.99% 10 Em resumo: é extremamente difícil alguém acertar em 10 itens num teste com 20 itens de 4 alternativas, escolhendo as respostas ao acaso. Admitindo que para “ter positiva” é necessário obter 10 ou mais itens certos, essa probabilidade num teste desse tipo, escolhendo a resposta ao acaso, seria 20 20 P ( A 10) 0.25 a 0.7510 a 0.0139 1.39% . a 10 a Isto significa que se pode dificultar tanto quanto desejável ou conveniente os efeitos do chamado “guessing” (adivinhar a resposta) aumentando o número de itens e/ou o número de alternativas de cada item. Está aqui uma das grandes vantagens deste tipo de itens. Outras vantagens que explicam a sua enorme popularidade está no facto de ser possível criar bases de dados de itens, aplicados em testes anteriores a grandes populações e sobre as quais é admissível 17 criar sistemas automáticos de elaboração e calibração de testes. Ver, por exemplo, Wainer (1990) em que é apresentado a estado da arte nesta matéria em 1990. O uso deste tipo de itens, associado ao TRI (ver atrás) torna possível gerar, por processos puramente automáticos adaptados ao nível de competência do indivíduo (Computer Assisted Testing), testes com itens calibrados cujas características psicométricas (validade e fiabilidade) sejam pré-estabelecidas ou estimadas com relativa precisão. A juntar a estas possibilidades há a considerar as vantagens teóricas e computacionais que ficam relativamente facilitadas quando se usam itens de resposta múltipla (Wainer, 1990; Liu, Lee, & Linn, 2011). Entre outras vantagens citam-se a facilidade com que os testes são classificados, a ausência de ambiguidade na atribuição da classificação e a consequente economia e facilidade de organização logística. Apesar de todas estas vantagens têm-se levantado contra este tipo de item as vozes de investigadores na área da educação. Ribeiro (1989) aponta como principais desvantagens deste tipo de item o facto de a respetiva construção consumir muito tempo, ser difícil a identificação de alternativas falsas plausíveis e não servirem para avaliar aptidões de expressão verbal, organização de ideias ou outras em que o respondente organize a resposta (Rauch & Hartig, 2010). Dum modo geral, este tipo de item não pode ser usado em situações em que o que se pretende avaliar é a capacidade de desempenhar papéis ou a deteção de certos comportamentos ou traços profundos que só se revelam pela realização (performance) de certas tarefas. A resposta natural a estas dificuldades é usar itens em que o respondente elabora a resposta (Construct Response Item (CR), na designação anglo-saxónica). Em particular, usar itens em que o respondente escreve um texto para responder à questão formulada. Numerosos estudos têm mostrado que a elaboração das respostas a este tipo de questões (Rauch & Hastig, 2010) é em si mesmo instrumento importante de aquisição de conhecimentos. Do ponto de vista da avaliação e classificação, a elaboração da resposta faz intervir e portanto manifestar-se, certos tipos de traços latentes inacessíveis aos itens de resposta múltipla. Põem, contudo, numerosos problemas, o principal dos quais é o custo da respetiva classificação, dificuldades logísticas, técnicas e problemas de validade e fiabilidade. 18 Quando é necessário atribuir classificações a um grande número de respondentes em exames nacionais, por exemplo, torna-se necessário recrutar, formar, treinar os professores a quem vai ser atribuída a responsabilidade pelas classificações e depois monitorizar as classificações atribuídas para garantir que a coerência/fiabilidade se mantêm. Trata-se de um processo muito caro e sujeito a inúmeras dificuldades técnicas, as principais das quais são garantir que há uniformidade de critérios, ausência de subjetivismos e de ambiguidades tanto na atribuição de resultados como na elaboração dos testes (Ribeiro, 1989; Rauch & Hastig, 2010). Em síntese, em termos psicométricos e para lá das questões económicas, põe-se problemas sérios de validade e fiabilidade que tem de ser considerados. Logo que a tecnologia dos computadores (software sobretudo) o possibilitou – por volta de meados da década de 60-70 do século passado – começaram, de modo natural, a aparecer os primeiros sistemas de avaliação e classificação baseados na avaliação automática dos textos de resposta a questões abertas (Shermis & Burstein, 2003). 1.4.3. Sistemas de Avaliação Automática de Textos (SAAT’s). Em Shermis e Burstein (2003) define-se avaliação automática de textos (Automatic Essay Scoring (AES)) como a capacidade de avaliar e classificar prosa escrita usando a tecnologia dos computadores. O primeiro sistema deste tipo surge em 1966 e desde então têm aparecido novos sistemas cujas características principais podem ser apreciadas através das referências a seguir mencionadas. Em Rudner e Gagne (2001), Yang, Buckendahl, Juszkiewicz, e Bhola (2012), Shermis e Burstein (2003), Dikli (2006), He, Hui, e Quan (2009), Vojac, Kline, Cope, McCarthy, e Kalantzis (2011) e ETS (2013) são apresentadas sucessivas revisões acerca do estado da arte relativa à evolução dos sistemas AES e da investigação em diversos domínios (estatística, linguística, processamento da linguagem natural e text mining) que tornou possível o seu desenvolvimento. Surpreendentemente, a lista de SAAT’s, iniciada com o sistema PEG (Project Essay Granding) introduzido em 1966 por Ellis Page – Page (1994) – tem-se mantido relativamente estável. É possível constatar através das referências citadas que os sistemas mais salientes em 2008, para lá do já citado PEG, são o Intelligent Essay Assessor (IEA) 19 introduzido em 1997 por Landauer e Foltz (ver à frente), o E-Rater desenvolvido no ETS (Educational Testing Service) por Jill Burstein, o sistema Intellimetrics, desenvolvido em 1998 e o sistema BETSY (Bayesian Essay Test Scoring SystemTM) desenvolvido em 2002. Consultando Vojac et al., (2011), dez anos depois, vemos que a lista de SAAT’s mais usados continuaria a incluir os citados PEG, IEA, E-Rater, Intellimetrics, bem como novos sistemas muitas vezes desenvolvidos em estreita ligação ou como extensões dos primeiros mas privilegiando agora a interação com o estudante a o respetivo feedback, fazendo uso de resultados da investigação na área do processamento automático da linguagem natural, Natural Language Processing (NLP) e da Internet. Entre os novos sistemas referem-se, citando a referência mencionada, os sistemas Criterion, Write to Learn, My Access, SA Grades, entre outros. Muitos destes sistemas estão disponíveis na Internet e são de livre acesso se bem que a respetiva tecnologia nem sempre seja totalmente acessível (Vojac et al., 2011). Um dos sistemas que mais tem contribuído para a aceitação cautelosa mas progressiva da utilização destes programas como instrumentos de avaliação de conhecimentos é o sistema PEG descrito em Page (1994). A ideia básica deste primeiro sistema, relevante ainda nos dias de hoje, consiste em tentar medir certas qualidades intrínsecas (não observáveis diretamente) designadas “trins”- tais como a dicção, fluência, pontuação e outras. Estas variáveis estão muito correlacionadas com outras – essas sim observáveis diretamente – designadas “proxies”. Por exemplo, a fluência (um “trin”) está correlacionada com a “proxi” número de palavras do texto e a dicção correlacionada com a “proxi” variância do comprimento das palavras (Page, 1994). Se n textos produzidos pelos estudantes forem classificados por um juiz humano que atribui ao texto número i a classificação yi (i= 1, 2, …, n) então, assumindo que se consideraram no modelo as k “proxies” P1, P2, …, Pk, a classificação yi relaciona-se com os “proxies” através de um modelo linear expresso por uma regressão múltipla: yi = ai + i1 P1 + i2 P2 + … + ik Pk + ei (i= 1, …, n) em que ij são coeficientes a estimar durante a fase de “treino” (estimação do modelo) usando os resultados de testes previamente classificados por professores, em que os “proxies” desempenham o papel de variáveis independentes e as classificações yi (i= 1, …, n) são variáveis dependentes. 20 Em geral, n varia de 100 a 400, usando-se mais do que um professor para realizar a classificação dos testes da amostra usada na estimação (ou aprendizagem) do modelo, podendo o número de “trins” e “proxies” ser da ordem das dezenas (Page, 1994). Como é habitual com os modelos de regressão múltipla, a qualidade global do ajustamento é medida pelo R2 (coeficiente de determinação). Os valores observados de R2 foram, desde as primeiras experiências, bastante elevados e encorajantes – acima de 0.75 (Page, 1994; Shermis & Burstein, 2003). Embora o sistema PEG tenha sido desenvolvido em torno das ideias acima descritas, é difícil não ver nos “trins” aquilo a que hoje se designaria por variáveis latentes (traços subjacentes aos textos produzidos ao responder às questões e inacessíveis à observação direta) e nas variáveis designadas “proxies” aquilo que se designaria, atualmente, por variáveis manifestas ou indicadores das primeiras. Isto significa que, implicitamente, subjacente à descrição do sistema PEG - poderia ver-se um modelo de equações estruturais como o sugerido na figura 1.4.3.1. Figura 1.4.3.1. Modelo estrutural sugerido (elaboração própria) pela estrutura do sistema PEG. O modelo estrutural – a tracejado – está indefinido. Na figura 1.4.3.1. (elaboração própria) o modelo observacional (relações lineares entre as variáveis T1, …, T9, “trins” ou variáveis latentes), Pi,j (i= 1, …, 9), (j= 1, …, n9) são as variáveis indicadoras de cada uma das “trins” sugerindo o sentido das setas que os “proxies” são manifestações observáveis dos “trins”. O modelo estrutural (relações entre os “trins”) está indefinido e por isso representado por tracejados. 21 O sistema IEA (Intelligent Essay Assessor) – Landauer, McNamara, Dennis, e Kintsch (2007) - baseia-se na técnica LSA – Latent Semantic Analysis – que assenta na deteção de proximidades entre o significado das palavras usadas num certo conjunto de textos, baseada na técnica computacional da decomposição de matrizes em valores e vetores singulares (SVD). Uma vez que esta técnica é objeto da nossa especial atenção, reservamos para o número 1.4.4. um desenvolvimento mais detalhado deste tema. De acordo com Shermis e Burstein (2003) e Attali e Bustein (2004) o E-rater é um sistema de classificação automática de textos desenvolvido como instrumento de apoio a usar na avaliação das respostas a questões abertas. As classificações são expressas numa escala 0-6. O sistema foi desenvolvido no ETS – Educational Testing Service americano em cujo site podem ser consultados numerosos artigos técnicos, estudos e relatórios relativos à experiência obtida com o sistema e investigação geral sobre este tema. Ver site do ETS – Educational Testing Service, http://www.ets.org/, consultado em 1/5/2013. Concetualmente (Shermis & Burstein, 2003) o sistema E-rater que é baseado no processamento automático da linguagem natural – procura identificar nos textos caraterísticas (features) que expressem qualidades profundas da escrita do respondente. Para isso dispõe de três módulos especializados (sintaxe, discurso, tópicos) cada um dos quais deteta no texto em análise os atributos da respetiva categoria. No final, os valores destes atributos são combinados numa classificação global. IntelliMetrics é um produto da firma Vantage, desenvolvido em 1997 e que tem sido usado nos estados Unidos para avaliar respostas a questões abertas contidas em exames nacionais – nomeadamente no GMAT (Graduate Management Admission Test), (Rudner, Garcia, & Welch, 2006; Lam, Dullon, & Chang, 2010). Pode também ser consultado no site da firma Vantage (http://www.vantagelearning.com/, consultado em 14 Abril 2013) onde se pode ler uma discrição do respetivo funcionamento. Trata-se do primeiro sistema de avaliação automática de conhecimentos baseado em conceitos de inteligência artificial, conhecendo-se relativamente pouco acerca dos aspetos técnicos específicos do respetivo funcionamento. Em Rudner, Garcia, e Welch (2010) é apresentada a avaliação a que esse sistema foi submetido no contexto de um concurso que culminou com a admissão do IntelliMetrics como instrumento de avaliação automática de conhecimentos do exame GMAT da associação Graduate Management Admission 22 Council (GMAC). Através dessa avaliação pode verificar-se que esse sistema tem um comportamento praticamente indistinguível do dos classificadores humanos e praticamente a mesma precisão. Com efeito, verificou-se que os coeficientes de correlação média entre as classificações atribuídas pelo sistema e as classificações atribuídas pelos classificadores humanos eram frequentemente acima de 0.98 (Rudner, Garcia, & Welch, 2006). Uma outra vantagem deste sistema é a de poder realizar a classificação de textos escritos em diversas línguas incluindo, além do Inglês, o Francês, Espanhol, Português, Arábico e Japonês (Dikli, 2006). O sistema BETSY foi desenvolvido por Laurence M. Rudner - Departamento de Medição, Estatística e Avaliação da Universidade de Maryland. Em Rudner e Liang (2002) e em Dikli (2006) podem ver-se resumos das abordagens seguidas para desenvolver este sistema, bem como as principais caraterísticas do sistema BETSY, atualmente usado essencialmente em investigação e acessível de modo totalmente grátis na internet (www.edres.org/betsy, consultado em 14 Abril 2013). O interesse deste sistema assenta na metodologia usada no seu desenvolvimento – o teorema de Bayes e redes bayesianas. Dado o texto de resposta a um item, o objetivo é classificar este texto numa das categorias (classes) de um conjunto {C1, C2, …, Ck} categorias. Por exemplo {C1, C2, C3} = {Apropriado, Parcial, Inadequado} ou {C1, C2, C3} = {A, P, I}. Não havendo qualquer informação à priori acerca do comportamento dos estudantes, pode-se assumir que as probabilidade à priori de que o texto em causa pertença a cada uma dessas categorias sejam iguais a 1/3= P(A) = P(P) = P(I) no caso do exemplo ou, no caso de um conjunto de k classes, a 1/k= P(C1) = P(C2) = … = P(Ck). Conhecendo os resultados de n testes anteriormente classificados, a distribuição à priori de probabilidade poderia ser – por exemplo - P(Cj ) #(Cj ) n em que #(Cj) é o número de textos classificados na classe j (j= 1, 2, …, k). Se sobre o texto da resposta em causa foram observados A caraterísticas – por exemplo, as palavras distintas W1, W2, …, Wi, …, WA – podem definir-se as probabilidades P (Wi | Cj) (i= 1, …, A ; j= 1, …, k), isto é, a probabilidade de que a palavra Wi ocorra no texto em estudo, assumindo que o texto é da classe j (i= 1, … k). No caso do exemplo anterior com 3 categorias, P (Wi | Não satisfaz), seria a probabilidade de observar a presença da palavra Wi num texto da categoria “Não satisfaz”. 23 Mais uma vez, os valores P (Wi | Cj) (j= 1, …, k) podem ser estimados usando os resultados de testes anteriormente classificados. Sabendo que a palavra Wi ocorreu no texto j já classificado, usando o teorema de Bayes, é possível passar das probabilidades “à priori” P (A), P (P), P (I), no caso do exemplo anterior ou, no caso geral – P (Cj), j= 1, …, k – para as probabilidades à posteriori: P (C j |Wi ) P (Wi | C j ) P (C j ) e1 P (Wi | C e ) P (C e ) k (j= 1, 2, …, k). Deste modo, para o texto específico em consideração, ter-se-iam k probabilidades à posteriori condicionadas à observação (ou não) da palavra i no texto em causa. Isto é, para o texto t, essas probabilidades seriam: P (C1 | Wi), P (C2 | Wi), …, P (Ck | Wi). A regra de classificação de Bayes consiste em classificar o texto t na classe de maior probabilidade (à posteriori). Por exemplo, usando a escala de três posições antes definidas, {C1, C2, C3} = {A, P, I}, ter-se-ia para o texto em causa t as probabilidades à priori P (A | Wi), P (P | Wi), …, P (I | Wi). Se as probabilidades à priori fossem {0.4, 0.4, 0.2} e, realizados os cálculos, as probabilidades à posteriori fossem {0.6, 0.3, 0.1} então o texto em análise deveria ser classificado na classe A visto que é ela que tem a maior probabilidade “à posteriori”. A simplicidade deste método e a consequente facilidade da sua implementação – bem como a qualidade dos resultados com ele obtidos (Rudner & Liang, 2002; Dikli, 2006) explica o êxito do sistema BETSY que, hoje em dia é essencialmente usado como instrumento de investigação. 1.4.4. Classificação baseada na Análise Semântica Latente. 1.4.4.1. Introdução. Como se viu atrás, o sistema de avaliação e classificação automática IEA (Intelligent Essay Assessor) usa a metodologia LSA designada neste trabalho por ASL. A ASL assenta computacionalmente na decomposição em valores e vetores singulares (Eckart & Young, 1936; Landauer, McNamara, Dennis, & Kintsch, 2007) de matrizes com frequências de ocorrência de palavras em conjuntos de textos e, do ponto de 24 vista psicológico, em considerar que essa decomposição é um bom modelo para representar o processo de aquisição do significado de novas palavras por parte das crianças. Ver Capítulo II pormenores da nossa própria implementação deste sistema e no Capítulo III resultados obtidos com dados reais. De acordo com Chomsky (1968) todos os seres humanos nascem com um conjunto inato de capacidades que lhes permitem, sem grande esforço, interpretar as estruturas das frases, limitando assim, de modo drástico, o número de significados possíveis de novas palavras que seria necessário considerar para aprender o respetivo significado. Se bem que esta teoria da existência de algo que se poderia designar por um dispositivo ou órgão inato de aquisição de palavras Word Acquisition Device (WAD), (Bloom, 2000; Chomsky, 1968) - ou Language Acquisition Device (LAD) tenha em muitas ocasiões sido posta em causa, acaba, recentemente, de receber uma importante confirmação experimental nos trabalhos do grupo Blue Brain Project (Hill, Wang, Riachi, Schurmann & Markram, 2012) em que é apresentada evidência física da existência de certas estruturas neuronais inatas que condicionam de modo importante o processo de aquisição da linguagem (e de outros processos) e portanto apoiam implicitamente as teorias de Chomsky. No que se segue referimo-nos aos trabalhos de Landauer e do seu grupo que levaram à criação da ASL partindo precisamente de pesquisas que visavam criar um modelo para o processo de aquisição de significado de novas palavras pelas crianças. 1.4.4.2. A Análise da Semântica Latente como Modelo de Aquisição do Significado das Palavras pelas Crianças. No site http://lsa.colorado.edu/, consultado em 12 Abril 2012, no Departamento de Psicologia, Instituto de Ciências Cognitivas da Universidade de Colorado podem encontrar-se e obter-se livremente as principais contribuições para a literatura da ASL, nomeadamente Landauer e Dumais (1997) e Landauer, Foltz, e Laham (1998). Em Landauer, McNamara, Dennis, e Kintsch (2007) é apresentado um panorama atualizado destas metodologias. O referido site permite ainda o acesso (utilização “on-line”) ao software IEA da firma Pearson e a realização de experiências de classificação e comparação de textos com esse software, bem como acesso aos sites e publicações dos restantes membros do grupo de investigação associadas a Landauer e à metodologia ASL. 25 Em Landauer e Dumais (1997) são lançados os fundamentos psicológicos e computacionais da ALS a partir da procura de uma “solução” para o chamado “Problema de Platão” – que é afinal o problema de aquisição do significado das palavras por parte das pessoas – as crianças em particular. Em Landauer e Dumais (1997) e também Bloom (2000) nota-se a aparente extrema facilidade com que as crianças adquirem o significado de novas palavras. Se cerca dos 17 anos um jovem pode já ter adquirido o significado de cerca de 60 000 termos, isso implica uma taxa diária média de 10 termos por dia. Este ritmo não pode ser justificado pela teoria da aprendizagem clássica que explica a obtenção de novos significados pela associação de palavras a conceitos já aprendidos e com expressão física através da criação de novas ligações neuronais – processo demasiado lento face à evidência experimental da velocidade real de aquisição de novos temas. Em Landauer e Dumais (1997) procura-se mostrar que a semelhança semântica é o resultado das ocorrências conjuntas (coocorrências) das palavras nos textos e das experiências a que as pessoas são expostas. Esta semelhança semântica (psicológica) resultante das coocorrências citadas, pode ser representada como distância (ou proximidade) num espaço métrico de dimensão (k) adequada. Isto é, a verosimilhança de coocorrência de duas palavras num mesmo texto escolhido ao acaso é tanto maior quanto mais relacionados estiverem os significados dessas palavras. Esta semelhança, de caráter psicológico, poderia ser captada pela noção de métrica de um espaço de dimensão adequada – em que esta dimensão deveria agora ser estabelecida por métodos computacionais e estatísticos. Mais especificamente, se considerarmos todas as coocorrências de palavras num conjunto de textos (contando essas coocorrências) e interpretando semelhança psicológica como semelhança de significados, pode pôr-se a questão de obter uma representação dessa informação num espaço métrico de dimensão adequada. Este modo de formular o problema que se pode encontrar em Landauer e Dumais (1997) conduz naturalmente a um problema de MDS (Multidimensional Scaling) que pode ser ilustrado do seguinte modo. Consideremos um texto hipotético contendo apenas as palavras W1, W2, W3, W4, W5, W6. O “texto” é: W1 W2 W3 W4 W1 W5 W6 W2 W3 W2 W1 W2 W5 W6 W3 W2 W4 W5 W6 W4. W4 26 As 20 coocorrências dessas palavras no “texto” anterior são: (W1 W2), (W2 W3), (W3 W4), (W4 W1), (W1 W5), (W5 W6), (W6 W2), (W2 W3), (W3 W2), (W2 W4), (W4 W1), (W1 W2), (W2 W5), (W4 W6), (W6 W5), (W3 W2), (W2 W4), (W4 W5), (W5 W6), (W6 W4). Não considerando a ordem das ocorrências (isto é, considerando que Wi Wj é o mesmo que Wj Wi) obtém-se a seguinte tabela de frequências: Coocorrências de Palavras Frequências Absolutas Frequências Relativas W1 W2 2 0.10 W2 W3 4 0.20 W3 W4 1 0.05 W1 W4 2 0.10 W1 W5 1 0.05 W5 W6 3 0.15 W3 W6 2 0.10 W2 W4 2 0.10 W2 W5 1 0.05 W4 W5 1 0.05 W4 W6 1 0.05 20 Tabela 1.4.4.2.1. Coocorrências das “palavras” wi, wj num texto. As frequências relativas observadas podem ser interpretadas como semelhança ou proximidades entre as coocorrências dos significados das palavras. Observe-se que aqui consideram-se coocorrências não as ocorrências simultâneas de duas palavras num texto mas a sua ocorrência de uma seguida da outra. Representando estas proximidades de ocorrência dos significados das palavras por uma tabela simétrica, obtém-se a tabela 1.4.4.2.2. seguinte: 27 W1 W2 W3 W4 W5 W6 W1 1 0.10 X 0.10 0.05 W2 2 1 0.20 0.10 0.05 W3 X 4 X 0.05 X 0.10 W4 2 2 1 1 0.05 0.05 W5 1 1 X 1 1 0.15 W6 X X 2 1 3 1 X X Tabela 1.4.4.2.2. Na tabela a parte triangular inferior contém as frequências absolutas e a superior as frequências relativas; o símbolo X significa ausência de informação. Aplicando a esta tabela um programa de Multidimensional Scaling2 verifica-se, usando, por exemplo, o algoritmo ALSCAL do SPSS – ver SPSS (2007) – que a dimensão do espaço métrico que melhor representa estas coocorrências com o menor stress possível é o espaço de dimensão k= 1, como se vê na figura 1.4.4.2.1. Figura 1.4.4.2.1. Representação geométrica das proximidades de palavras do texto, obtida com o SPSS. Neste caso, a dimensão de espaço é k= 1. 2 O MDS (Multidimensional Scaling) procura a escala (unidimensional ou multidimensional) que melhor aproxima as perceções de proximidade de conceitos. 28 Como se ilustra no exemplo anterior, obtém-se uma representação geométrica correspondente às proximidades das palavras no texto sem que tenha sido necessário relacionar o significado das palavras com o significado de outros conceitos preexistentes, exteriores aos dados, como exige a teoria da aprendizagem dos significados. No exemplo anterior, o resultado final da “aprendizagem” baseada na coocorrência de palavras seria a associação dos significados das palavras w1, w2, w4 entre si e a associação dos significados das palavras w3, w5, w6. Por outro lado, a quase totalidade da informação poderia ficar representada num espaço de dimensão 1 (uma linha em cujos extremos estariam os dois grupos). Isto é, neste caso, a experiência empírica observada poderia ser expressa falando dos dois grupos de palavras e da sua oposição. Em síntese, a aprendizagem ou a formação do significado das palavras baseada nas coocorrências – como aqui se ilustra – não apela ao esquema típico de aprendizagem “com professor” em que para cada nova palavra que ocorresse seria necessário que um professor associasse ou apontasse o significado de conceitos já aprendidos com os quais o significado da nova palavra ficaria associado. Esse esquema não poderia explicar a extraordinária rapidez de aquisição do significado de novas palavras pelas crianças porque exigiria comparações muito lentas entre o significado potencial da nova palavra e o de um grande número de significados alternativos de conceitos pré-existentes (Landauer & Dumais, 1997). 1.4.4.3. ASL como Instrumento de Avaliação Automática. O modelo ASL, desenvolvido pelo grupo de Landauer (Landauer & Dumais, 1997) assenta na decomposição em valores e vetores singulares das matrizes de frequências de ocorrência de palavras em textos, assumindo que esse processo modela ou simula de modo adequado a aquisição de novos significados por parte das crianças. Dado um conjunto de documentos designados D1, D2, …, Di, …, Dp e de termos W1, W2, …, Wj, …, Wn, a tabela F contém as frequências de ocorrência dos termos ou palavras nos documentos. Isto é, se F = [fij], i= 1, …, p; j= 1, …, n representar essa tabela, então cada palavra (uma linha dessa tabela) fica representado por um vetor de frequências de ocorrência do termo nos documentos e cada documento (coluna) fica representado por um vetor de dimensão n formado pelas frequências de ocorrência das palavras nesse texto. O valor fij representa portanto a frequência do termos i no documento j. Nesta representação que remonta a Salton, Wong, e Yang (1975) e a trabalhos relativos à indexação automática de documentos, não há qualquer referência à ordem pela 29 qual os termos ocorrem nos diversos textos, sendo esta matriz analisável por diferentes algoritmos conforme o problema a resolver. Designa-se por modelo vetorial porque cada documento fica representado por um vetor com um número de dimensões igual ao número de palavras que ocorrem no corpus D1, D2, …, Di, …, Dp, sendo os valores das componentes do vetor as frequências (ou valores que resultam da transformação das frequências) de ocorrência dessas palavras no texto. Do mesmo modo, cada palavra fica representada pelo vetor de frequências (ou valores que resultam da transformação das frequências) da ocorrência dessa palavra em todos os documentos do corpus e com um número de dimensões igual ao número de documentos (p). Como pode ver-se em Landauer e Dumais (1997) e em Landauer, Foltz, e Laham (1998), a ASL é definida (em tradução livre) como “uma teoria e uma metodologia que permite extrair e representar o significado das palavras a partir do contexto das respetivas coocorrências num grande corpus de texto”. Isto significa que se vê na ASL uma teoria ou modelo psicológico adequado à representação do mecanismo através do qual as pessoas (as crianças em particular) constroem o significado das novas palavras, situando-as num espaço métrico de dimensão adequada e “deduzindo” desta representação – quando têm de se expressar – proximidades psicológicas que têm correspondência em representações geométricas (espaço métrico de certa dimensão). Para lá da componente psicológica, o modelo comporta uma componente computacional que faz uso do método dos mínimos quadrados para detetar as proximidades geométricas entre palavras, entre textos e entre palavras e textos implícitas na matriz de frequências. Com efeito, se F (n, p) representar a tabela de contingência que contém no cruzamento da linha i (i= 1, …, n) com a coluna j (j= 1, …, p) o número de vezes que a palavra i ocorre no texto j, esta tabela expressa, no fundo, uma série de restrições (impostas pelas coocorrências de palavras sobre os diversos textos) do tipo daquelas que foram exemplificadas no número anterior. Estas dependências não são imediatamente evidentes a partir da inspeção visual da tabela de frequências. Por exemplo, é difícil intuir diretamente, por inspeção visual, a cadeia de dependências que resultam para os significados das palavras W1, W2, W3, W4, W5, W6 no exemplo do número anterior. 30 Contudo, se construirmos com os elementos da tabela 1.4.4.2.2. um grafo cujos vértices são as palavras, existindo um arco entre duas palavras quando a frequência das coocorrências é maior que zero, a estrutura subjacente à tabela 1.4.4.2.2. e portanto às ocorrências que lhe deram origem pode ser apresentada na figura 1.4.4.3.1. Figura 1.4.4.3.1. Grafo correspondente à tabela 1.4.4.2.2. depois de ter eliminado os arcos correspondentes à frequências mais baixas. Na figura 1.4.4.3.1. foram eliminados os arcos com baixa frequência (correspondentes a coocorrências mais fracas). Vê-se que a estrutura é, grosso modo, linear, correspondente à fornecida pelo processo automático do MDS constante na figura 1.4.4.2.1. O método computacional eleito por Landauer e Dumais (1998) e Landauer, Foltz, e Laham (1998) para simular os processos mentais que têm lugar no processo de aprendizagem humana do significado das palavras é a chamada decomposição em valores e vetores singulares (Singular Value Decomposition - SVD), tendo em conta que a SVD se baseia no método dos mínimos quadrados para obter uma representação métrica dos dados (Eckart & Young, 1936; Landauer, Foltz, & Laham, 1998). Historicamente, este método computacional precede no tempo em muito o seu uso para o fim específico que lhe é atribuído na formulação da ASL uma vez que aparece já em Eckart e Young (1936). De acordo com Eckart e Young (1936), dada a matriz F de frequências de ocorrência de palavras num conjunto de textos T1, T2, …, T de um certo corpus, a decomposição F = U D VT da matriz F num produto de três matrizes U, D, V é a solução (única) do seguinte problema de otimização: buscar as matrizes U, D, V tais que o quadrado da distância (no sentido dos mínimos quadrados) entre F e o produto U D VT seja o mínimo possível. Isto é, se U, D, V forem matrizes variáveis, pretende-se encontrar aquelas matrizes específicas tais que ||F - U D VT||2 tem o menor valor possível. 31 Mostra-se em Eckart e Young (1936) que U é uma matriz de dimensões n d; D é uma matriz diagonal de dimensões d d; V é uma matriz de dimensões t d em que t é o número de textos e d é a dimensão do espaço de representação. As linhas de U correspondem às palavras mas agora representadas numa dimensão d que é menor ou igual ao número de documentos (p). Por sua vez, a matriz V que representa agora nas suas linhas os documentos mas na dimensão d, não já na dimensão n original. Por sua vez, D tem os elementos da diagonal ordenados por ordem decrescente, representando estes valores as importâncias decrescentes das dimensões finais do nosso espaço de representação (1, 2, …, d). O valor de d é, em geral, inferior ao valor mínimo (n, p). Isto é, se F for uma matriz com n palavras (linhas) e p colunas (textos) então, d em geral é min (n, p). Estes conceitos podem ser ilustrados no seguinte exemplo numérico. F= d1 d2 d3 d4 W1 1 0 0 3 W2 0 1 0 0 W3 0 1 1 0 W4 0 0 0 1 W5 0 0 0 1 W6 0 1 0 0 W7 1 0 0 0 W8 0 0 1 0 W9 0 1 0 0 W10 2 0 1 0 Tabela 1.4.4.3.1. Frequências de ocorrência das “palavras” w1 … w10 nos textos d1 … d4. Neste exemplo as palavras W1, W2, …, W10 foram detetadas sobre os documentos (textos) D1, D2, …, D4 com as frequências indicadas. Neste caso, n= 10, p= 4. Isto significa que é possível representar tanto as palavras (linhas) como as colunas (textos) num espaço de dimensão, quando muito d= min (10,4)= 4. Isto é, nunca será necessário mais do que 4 dimensões para expressar o significado quer das palavras quer dos textos que estão representados na matriz F. 32 Isto significa que há um espaço métrico de dimensão d= min (10, 4) = 4 no qual tanto as palavras como os textos podem ser representados, tendo em conta os pesos dados pelos valores da diagonal de D. Ver no Capítulo II os pormenores no modo de obter esta representação. Se apenas considerarmos as suas duas primeiras coordenadas, vemos na figura 1.4.4.3.2. as posições relativas ocupadas pelas 10 palavras anteriores e pelos 4 textos. Esta representação contém apenas uma percentagem 2.873 2.124 2.873 2.124 2 1.12 62% da informação (ou variabilidade total) contida na tabela F (Landauer, Foltz, & Laham, 1998). Realizando a decomposição, verifica-se que: F = U D VT F= D= t1 t2 t3 t4 W1 1 0 0 3 W2 0 1 0 W3 0 1 W4 0 W5 U= -0.447 -0.023 -0.289 0.097 0 -0.070 -0.325 0.289 0.348 1 0 -0.184 -0.245 0.577 -0.307 0 0 1 -0.184 -0.245 -0.289 -0.307 0 0 0 1 -0.184 -0.245 -0.289 -0.307 W6 0 1 0 0 -0.070 -0.325 0.289 0.348 W7 1 0 0 0 -0.447 -0.023 -0.289 0.097 W8 0 0 1 0 -0.114 0.080 0.289 -0.656 W9 0 1 0 0 -0.254 -0.570 0.000 0.041 W10 2 0 1 0 -0.641 0.525 0.289 0.153 T V= T1 T2 T3 T4 1 -0.758 0.473 0.000 0.449 2.873 0.000 0.000 0.000 0.000 2.124 0.000 0.000 2 -0.201 -0.690 0.577 0.387 0.000 0.000 2.000 0.000 3 -0.327 0.169 0.577 -0.729 0.000 0.000 0.000 1.112 4 -0.528 -0.521 -0.577 -0.342 Tabela 1.4.4.3.2. Componentes da SVD da matriz F. 33 Figura 1.4.4.3.2. Proximidades entre as palavras e os textos da tabela F através da análise SVD. A azul as palavras, a vermelho (linhas) os textos. Nessa figura estão ainda posicionadas linhas que representam os textos ou documentos T1, T2, T3, T4 usados no exemplo. Conforme se verá de modo mais pormenorizado no Capítulo II, os ângulos entre as posições das palavras (mais precisamente os cossenos destes ângulos) são tanto mais pequenos (cossenos tanto maiores) quanto mais associados estão ao significado das palavras. O mesmo sucede para os significados dos documentos entre si e dos documentos com as palavras. Assim, por exemplo, na figura 1.4.4.3.2. os textos T1 e T3 fazem um ângulo relativamente pequeno (cosseno elevado) entre si – o que significa que os respetivos significados estão relacionados. Já o ângulo entre os textos T1 e T4 é próximo de 90º o que significa que os respetivos significados não têm relação (são muito afastados). Os textos T1 e T2 produzem um ângulo acima de 90º - cosseno negativo, o que sugere que os seus significados tendem a opor-se. Com efeito, é isso que sucede na tabela de frequências: quando uma palavra ocorre num dos textos, não corre no outro. Nesse gráfico nota-se a sobreposição das palavras {w2, w6, w9} no símbolo w0 do canto inferior direito e as palavras {w4 e w5} no ponto central da parte inferior. Isto resulta de na tabela de frequências essas palavras serem representadas por vetores iguais. Isto é: {w2, w6, w9} têm o mesmo significado – o mesmo sucedendo com {w4 e w5} sendo este fator captado no gráfico dando a mesma posição a esses termos sinónimos (do ponto de 34 vista de T1, T2, T3, T4). Note-se que a sobreposição no plano de mais do que um objeto pode resultar não da igualdade de coordenadas mas do facto de objetos de coordenadas diferentes se projetarem no mesmo ponto. Não é esse o caso presente. Nesse gráfico notase ainda o pequeno ângulo formado pela palavra w7 e o texto T3 que chama a atenção para o facto de o significado da palavra w7 ter uma grande contribuição para o significado do texto T3. Nesta linha de raciocínio, atente-se ainda que o grupo de sinónimos {w2, w6, w9} fazem um ângulo quase nulo com T2, o que chama a atenção para o facto de que o significado do texto T2 está muito ligado ao significado do grupo {w2, w6, w9}. É de notar, ainda, que as palavras w3, w8, w7 estão praticamente alinhadas segundo uma linha reta, o que sugere que há uma relação linear entre os significados destas palavras no conjunto de textos do corpus. Verifica-se assim que a análise do resultado da ASL deste corpus põe em evidência pelo menos três relações (lineares) entre as palavras, sugerindo assim que não são necessárias 10 dimensões para representar o significado nem das palavras nem dos textos. O mero facto de se ter constatado que {w2, w6, w9} são sinónimos, elimina duas dimensões (no lugar de w2, w6, w9 poderíamos considerar um novo termo que simbolizasse o significado como de {w2, w6, w9}. O mesmo sucede com {w4, w5}. No conjunto seriam eliminadas três dimensões. A relação linear {w3, w7, w8} permitiria eliminar mais uma dimensão (grau de liberdade de variação) reduzindo a dimensão inicial de 10 para 6 necessária à representação dos textos. Em síntese: o número máximo de dimensões do espaço métrico necessário para “falar” das relações entre as palavras seria, como se viu, não 10 mas apenas 4, quando muito. No caso de se considerar um “corpus” formado por centenas de textos com milhares de palavras, o espaço métrico necessário para uma representação fiável do significado das palavras é de algumas centenas (Landauer, Foltz, & Laham, 1998). Numa série de experiências de simulação para comparar o comportamento do ser humano e o da metodologia ASL, citada em Landauer, Foltz, e Laham (1998) concluiu-se que a qualidade dos resultados obtidos depende de modo crítico do número d de dimensões retida para o espaço de representação. Em certas situações em que a dimensão do espaço original era de p= 1000, os melhores resultados obtinham-se com cerca de d= 300 dimensões, diminuindo essa qualidade drasticamente até valores muito baixos quando o 35 número de dimensões se afastava muito (para baixo ou para cima) desse valor aparentemente ótimo. Em experiências por nós próprios realizadas (ver Capítulo III) esta sensibilidade da taxa de erros da ASL em função da dimensionalidade retida para o espaço de representação é amplamente confirmada, sendo pois um elemento importante a reter, se bem que fique em aberto a questão de determinar o valor exato desta dimensão ótima ou da existência de alguma expressão matemática para o efeito. As nossas próprias experiências parecem sugerir que essa dimensionalidade ótima está ligada a uma variância acumulada de cerca de 85% e a dimensão que garante 85% da informação é cerca de ½ p. Isto é, no caso de p= 300, por exemplo, a dimensionalidade ótima sugerida pela experiência é de cerca de d= 150, correspondente a cerca de 80% de variância acumulada. Dada a aparente semelhança com que o método ASL permite representar em espaços métricos o significado das palavras que ocorrem em grandes corpus e o correspondente processo mental usado pelos seres humanos para adquirirem e representarem no seu cérebro o significado das novas palavras, desde logo se tornou claro para os autores citados que a ASL poderia ser usada para avaliação de conhecimentos através da análise de textos produzidos pelos estudantes ao responderem a questões abertas sobre certos temas (Landauer & Dumais, 1997; Landauer, Foltz, & Laham, 1998). Conhecer um certo tema – ou melhor, obter conhecimento válido (em correspondência com a realidade) sobre um certo tema e expressá-lo através de palavras com certo significado – implica possuir na mente uma série de palavras ligadas a esse domínio e seus significados, bem como as proximidades psicológicas inerentes a esses significados. Se o estudante responde com um texto a uma certa pergunta, é natural que as ocorrências de palavras no texto produzido traduzam as proximidades (ou ausência delas) dos significados psicológicos das palavras na sua mente; proximidades estas que podem ser captadas pela representação geométrica construída pela ASL através da decomposição em vetores e valores singulares da matriz de frequências. Cinco métodos alternativos para proceder a esta avaliação são sugeridos informalmente em Landauer e Foltz (1997), alguns dos quais serão considerados na parte experimental deste trabalho a apresentar no Capítulo III. 36 O significado prático dos resultados obtidos por ASL pode ser apreciado de modo experimental através da consulta do original índice remissivo do manual em Landauer et al., 2007. O referido índice remissivo foi construído usando a metodologia ASL para analisar os textos das páginas do livro em questão e as palavras consideradas no índice remissivo. Nesta análise, cada página é um texto e as palavras consideradas estão no índice remissivo. Deste modo, quando nesse índice remissivo se procura, por exemplo, a palavra “semantics” o que esperaríamos encontrar num índice remissivo clássico seria a indicação das páginas do livro onde poderíamos encontrar, localizar essa palavra. No referido manual, para a palavra “semantics”, por exemplo, encontramos a referência “p.355, 0.70, UEMs, familiarity”, o que significa que na representação geométrica gerada pela ASL, a palavra “semantics” faz um ângulo de cosseno 0.7 com a página 355. Portanto, o significado de “semantics” tem um grau de associação bastante elevado com o significado da página 355. Contudo, a palavra “semantics” não aparece nessa página. As expressões cuja semântica mais se relaciona com o significado da página 355 são “UEMs” e familiarity. Ver o índice da obra referida para outras regras de associação palavras/páginas a considerar como exercício de entendimento do significado prático desta técnica. 1.4.5. Validade e Fiabilidade dos Programas de Avaliação Automática de Textos. Os dois principais critérios de qualidade em investigação na Educação e Psicologia são a validade e a fiabilidade (APA, 2003). Do ponto de vista da classificação automática de textos convém precisar o significado desses dois conceitos quando a atribuição de classificações/pontuações e a avaliação de caraterísticas humanas é realizada por uma máquina: o programa de avaliação automática (SAAT). A fiabilidade tem a ver, grosso modo, com a consistência dos resultados: em que medida são coerentes os resultados obtidos em sucessivas aplicações do processo de classificação automática e que fatores condicionam as eventuais inconsistências (Keeves, 1988). A validade tem a ver com os riscos ou consequências das decisões a tomar com base nas classificações ou pontuações atribuídas pelo processo de classificação automática de textos. 37 O que se segue baseia-se largamente em Shermis e Burstein (2003), em Cizek e Page (2003) e Keith (2003). Fontes importantes sobre este tema no contexto dos SAAT’s são Bridgeman, Trapant, e Attalli (2012) e Bejar (2011), bem como a normalização da APA (2003). De acordo com esta última referência, a Fiabilidade tem a ver com a consistência das medições quando o procedimento de testagem é repetido numa população de indivíduos ou grupos. Inerente a todo o processo de medição está sempre associado um erro de medição, de caráter aleatório. Quando as pontuações/classificações são atribuídas por juízes humanos, seria desejável que uma pessoa ou grupo de pessoas, tendo respondido mais do que uma vez ao mesmo teste, obtivesse sempre a mesma pontuação – o que corresponderia a uma fiabilidade muito elevada. Contudo, esta perspetiva é irrealista uma vez que, para lá da variabilidade inerente ao comportamento dos seres humanos respondentes, as pontuações atribuídas em ocasiões diferentes pelo mesmo juiz humano ou por um conjunto de vários juízes humanos têm variações imputáveis aos erros cometidos por esses juízes. De acordo com Cizek e Page (2003), expressando um ponto de vista hoje comummente aceite e vertido nas normas APA – ver APA (2003) – a fiabilidade tem a ver com a consistência, a confiança e a reprodutibilidade das pontuações/classificações atribuídas por um certo procedimento de medição, sendo, por isso, uma caraterística do processo de medição e não uma caraterística do teste. Isto é, o mesmo teste aplicado a pessoas diferentes gera pontuações/classificações diferentes. Mais especificamente (Cizek & Page, 2003) a fiabilidade observada é uma propriedade dos dados gerados pelo processo de classificação; a fiabilidade é uma propriedade da população formada pela totalidade desses valores, sendo pois um valor constante e inacessível. Um valor populacional que tem de ser estimado a partir dos dados observados. Uma vez que a fiabilidade está relacionada com o erro de observação 2 e também com a concordância ou consistência das medições, é natural que na respetiva estimação se considere o valor 2 e também o coeficiente de correlação entre dois conjuntos de pontuações/classificações. Sejam: X = (x1, x2, …, xn) e X’= (x’1, x’2, …, x’n) as classificações obtidas por duas aplicações sucessivas do mesmo teste às mesmas pessoas, usando o mesmo processo de medição. 38 Assim, por exemplo, se os resultados/pontuações/classificações obtidos em dois momentos diferentes pelos mesmos 10 examinandos – numa escala de 0 a 5 – forem (5, 4, 4, 3, 5, 2, 1, 4, 4, 5) e (2, 4, 5, 4, 4, 3, 1, 5, 4, 5) a fiabilidade vista na perspetiva da coerência medida pelo coeficiente de correlação observado seria rXX’= 0.91, que é apenas a estimativa do valor inacessível (populacional) de XX’. Esta medição da fiabilidade, através do coeficiente de correlação, tem contudo alguns defeitos, um dos quais ilustrado pelo exemplo seguinte, inspirado em Cizek e Page (2003). Se, voltando à ilustração anterior, os resultados obtidos tivessem sido X= (5, 4, 4, 3, 5, 2, 1, 4, 4, 5) e X’= (4, 3, 3, 2, 4, 1, 0, 3, 3, 4) o coeficiente de correlação observado seria agora rxx’= 1. Apesar deste valor (coerência perfeita entre as duas medições), há certamente uma questão de fiabilidade uma vez que não há concordância ou consistência entre os dois conjuntos de resultados. Isto mostra que o coeficiente de correlação não é totalmente adequado como estimador da fiabilidade – o que tem levado a considerar, em complemento, o chamado coeficiente de concordância que mede, para cada examinando, o grau de coincidência entre as pontuações atribuídas. Esta concordância pode ser exata (quando as pontuações atribuídas coincidem) ou adjacente quando, não coincidindo, não diferem, contudo, por mais do que uma unidade na escala que está a ser usada. Quando em vez de juízes humanos se consideram programas de classificação automática de textos (SAAT’s), há que adaptar os conceitos anteriores à nova realidade resultante de um juiz humano ter sido substituído por uma máquina (o software de classificação). Se um programa de classificação automática for aplicado sucessivamente aos mesmos estudantes, o erro, se o houver, não pode ser imputado ao programa uma vez que este funciona sempre do mesmo modo, realizando sempre os mesmos cálculos. Agora (Cizek & Page, 2003) o erro aleatório depende apenas das seguintes componentes: a) Caraterísticas pessoais dos examinandos (competência, por exemplo); b) Caraterísticas da linguagem e modo de apresentação do teste; c) Condições de aplicação do teste. 39 Em Cizek e Page (2003) pode ver-se uma análise pormenorizada das manifestações destes erros e dos procedimentos estatísticos a aplicar para analisar as componentes destas contribuições bem como das respetivas interações, tanto na perspetiva clássica como na perspetiva do TRI. Embora não faça sentido proceder a análises de fiabilidade com dados gerados por duas aplicações do mesmo programa, faz no entanto sentido avaliar os efeitos no erro (fiabilidade) ao aplicar aos mesmos estudantes em épocas diferentes versões diferentes do mesmo programa ou versões do SAAT produzidas por grupos diferentes de especialistas ou classificar as mesmas respostas por programas diferentes. Em Cizek e Page (2003) e também Powers, Burnstein, Chodorov, Fowles, e Kukich (2001) são descritas as experiências de validação e cálculos de fiabilidade em relação ao programa E-rater do ETS. O conceito clássico de validade em Ciências da Educação aparece extensamente tratado em Keeves (1998). Em particular, Zeller (1998) define um processo de medição válido como aquele que mede o que pretende medir. Isto é, a validade de um processo de medição tem a ver com o grau com que um indicador empírico mede o que se propõe medir, entendendo-se por medição o processo de ligar um conceito abstrato a indicadores empíricos. Nesta perspetiva não é o indicador em si mesmo que está a ser validado mas sim os objetivos para os quais o indicador está a ser usado. A validade pode ser vista em três perspetivas (Zeller, 1998): Validade de conteúdo. Em que medida a validade de um indicador corresponde ao conceito teórico que se propõe medir. Ou seja: em que medida um indicador expressa ou reflete a variável latente que pretende representar? Por exemplo, o comprimento de um texto (número de palavras num texto) não é um indicador válido da respetiva qualidade literária. Validade referida a critérios. Em que medida as pontuações atribuídas por um processo automático de classificação se correlacionam com as pontuações atribuídas por juízes humanos? Este tipo de validade pode ser medida, por exemplo, através do coeficiente de correlação entre o critério (neste caso as pontuações atribuídas por um juiz humano) e as classificações atribuídas pelo classificador automático. Validade de constructo. Tem a ver com as relações entre os indicadores observados e construções teóricas derivadas a partir de certas hipóteses. Por exemplo, se se admitir que a hipótese teórica de que a língua tem influência sobre os resultados de uma 40 classificação automática de textos produzidos por falantes de diversas línguas, então numa análise fatorial dos dados obtidos deveria aparecer a evidência de um fator que refletisse essa hipótese: por exemplo, um fator altamente correlacionado com a língua. Em Bejar (2011) define-se classificação automática (automated scoring) como sendo a “atribuição de uma pontuação (nota, classificação, graduação) - usando um algoritmo - a uma resposta construída por um respondente, em resposta a instruções contidas num teste”. A validade dos resultados de um processo deste tipo é uma propriedade das inferências produzidas a partir destes resultados. Isto é, a validade destas pontuações tem a ver ou deve ser medida pelas consequências do uso a dar às referidas pontuações. Por outras palavras, ao risco associado ao seu uso em processos de decisão como, por exemplo, consequências para as pessoas testadas e para a sociedade (APA, 2003). Em Keith (2003) pode ver-se um tratamento bastante extenso e completo das questões de validade inerentes à utilização dos resultados dos processos automáticos de classificação de testes. Um dos critérios “naturais” usados nos processos de validação dos sistemas SAAT são as classificações atribuídas aos mesmos textos por juízes humanos. Implícito neste procedimento está pois a assunção de que as classificações atribuídas por juízes humanos conduzem a inferências válidas (Keith, 2003). Mais explicitamente, isto significa que a correlação entre as pontuações produzidas pelos SAAT’s e produzidas por juízes humanos conduz a inferências válidas sobre a capacidade da escrita, por exemplo. É claro que quando se usa mais do que um juiz humano, a validade do processo automático medido deste modo depende por sua vez das correlações entre as classificações atribuídas pelos juízes humanos, o que significa (Keith, 2003) que o aumento das correlações entre juízes humanos tem consequências na validade do processo automático. Keith (2003) apresenta ainda resultados da validação medida em função desta correlação para diversos sistemas em 2003 (PEG, Intellimetrics e E-rater) observando-se frequentemente correlações entre os resultados obtidos por esses programas e os juízes humanos da ordem ou acima de 0.8. Em Attali e Burstein (2004), Chodorow e Burnstein (2004), Rudner, Garcia, e Welch (2006), Bejar (2011) e Bridgeman, Trapant, e Attalli (2012) são apresentados estudos de validade que, basicamente, confirmam as perspetivas apresentadas em Shermis 41 e Burstein (2003), confirmando assim a validade (referida a este critério) crescente dos programas de classificação automática de textos. Em particular, Chodorow e Burnstein (2004) apresentam evidências convincentes relativas à aplicação do E-rater do ETS na classificação do teste TOEFL (Test of English as a Foreign Language), notando a sensibilidade dos resultados da classificação automática às linguagens nativas (Espanhol, Árabe e Japonês), comportamento que é semelhante ao observado com juízes humanos. Em Attali e Burstein (2004), num estudo de validação de uma nova versão do Erater (K2.0) conclui-se, entre outras coisas, que o comprimento do texto (em número de palavras) é uma variável que contribui significativamente para as classificações holísticas obtidas. Uma das conclusões mais importantes do estudo citado é o valor 0.93 entre os resultados obtidos com juízes humanos e os obtidos com o programa E-rater. Existem óbvias relações entre qualidade e validade. Em Bejar (2011) analisam-se estas relações sendo identificados os fatores a considerar nos processos de garantia e controlo de qualidade dos SAAT’s de modo a melhorar a validade dos resultados a obter com esses sistemas. A título de exemplo cita-se a necessidade de uma interface homem-máquina adequada, que garanta que os examinandos expressam as suas respostas sem estarem sujeitos a constrangimentos desnecessários. Em Bridgeman, Trapant, e Attalli (2012) num estudo do ETS abrangendo textos produzidos no contexto da aplicação do TOEFL, GMAT (Graduate Management Admission Test), GRE (Graduate Record Examination) e avaliados tanto por juízes humanos como pelo software E-rater, abrangendo centenas de milhares de testes e milhares de estudantes, confirmam-se os elevados valores de fiabilidade e validade obtidos pelos programas de classificação automática de textos. Especificamente, no estudo envolvendo dados gerados pelo teste TOEFL, usando testes com a duração de 30 minutos, pontuados tanto pelo software E-rater como por dois juízes humanos e envolvendo 132347 textos (num máximo de 300 palavras) conclui-se que as correlações entre dois juízes humanos (HH) variam entre 0.61 e 0.70; as correlações entre as classificações atribuídas pelo sistema automático, o E-rater e um juiz humano oscilam entre 0.64 e 0.78 quando se considerou o efeito da língua de origem das pessoas testadas. 42 De um modo geral, a conclusão do estudo é a de que, confirmando estudos anteriores, embora a língua de origem não produza efeitos muito marcados entre os resultados atribuídos pelos seres humanos e pelo programa de classificação, notou-se que para certos grupos linguísticos as ordenações resultantes das classificações (e portanto com impacto na vida das pessoas) seriam diferentes conforme as classificações fossem produzidas pela máquina ou pelos juízes humanos. Este impacto tende a desaparecer quando o resultado final resulta de uma combinação das duas classificações: humana e automática. De acordo com a informação recolhida na literatura que é possível consultar no site do ETS - Educatiuonal Testing Service (2013) e apesar dos estudos que consistentemente apontam para elevados índices de fiabilidade e validade na utilização dos SAAT’s, continua a ser política daquela instituição, nos exames de alta responsabilidade (highstakes) usar a classificação simultânea por um programa e por um juiz humano. Quando há discrepâncias significativas entre as duas classificações isso implica a adoção de um procedimento especial que em geral consiste em classificar o teste por um segundo juiz humano. 1.4.6. Experiência Acumulada com a Avaliação Automática. Tendências. Neste número procura-se sintetizar a experiência colhida com a utilização de software para avaliação automática, identificar e caraterizar algumas tendências que se julga detetar. Aspetos Metodológicos. De um modo geral, em todos os sistemas considerados (PEG, IEA, Intellimetrics, E-rater, Betsy) nota-se que apesar das óbvias diferenças na tecnologia usada (regressão múltipla, inteligência artificial, redes bayesianas, análise da semântica latente) todos os sistemas são implementados de acordo com a metodologia conhecida como modelo estatístico de aprendizagem (Learning Machine). Definido o algoritmo teórico para atribuir pontuações aos textos elaborados pelos estudantes (redação ou “essays”) torna-se necessário uma fase de aprendizagem inicial em que são estimados os parâmetros do modelo, usando para o efeito informação anterior. Esta informação tem a seguinte origem: textos anteriormente classificados por juízes humanos (em todos os casos), textos do domínio do conhecimento que se pretende 43 avaliar, escritos por espertos (professores, autores de livros e manuais) no caso da ASL e ainda outra informação – nomeadamente informação linguística. No caso de textos anteriormente classificados por juízes humanos, esta informação de treino é designada por “amostra de treino (AT)”. Uma vez “treinado” o algoritmo com estes dados de treino (estimados os respetivos parâmetros), obtém-se uma versão provisória do sistema capaz de realizar classificações automáticas de novos textos. Contudo, isso nunca é feito sem validar o sistema sobre a chamada “amostra de teste (T)”. Trata-se também de testes que anteriormente foram classificados por juízes humanos e que agora vão ser também classificados – automaticamente – pelo sistema já “treinado” que resultou da primeira fase. Ver figura 1.4.6.1. No esquema a seguir apresentado – comum aos sistemas estudados – a amostra inicial de textos classificados, com n= q+p textos é dividida em duas partes (A + B), ficando a primeira (A) com q testes e a segunda (B) com p. Por exemplo, uma possibilidade é q= p = n/2. Os n= q+p textos da amostra inicial foram previamente classificados por juízes humanos que lhes atribuíram as classificações H= (h1, h2, …, hq, hq+1, …, hp+q). Suponhamos que o modelo matemático usado para atribuir automaticamente uma classificação a um texto genérico T é dado por uma expressão matemática f (texto, ) que envolve o texto e certos atributos observados do texto (número de palavras, número de pontos, as palavras do texto, …) e um conjunto de parâmetros ou pesos = (1, 2, …, k) cujos valores são desconhecidos e necessitam de ser estimados (ou aprendidos) a partir dos q textos pré-classificados. Só para fixar ideias, admita-se que = (1, 2, 3) – com k= 3 – são as distâncias de um texto a classificar aos textos classificados mais próximos (num certo sentido a definir) e que a fórmula f (texto, = (1, 2, 3)) é s = 1 d1 + 2 d2 + 3 d3 com 1 + 2 + 3= 1. Isto é, os parâmetros a estimar, neste caso, seriam os pesos (de soma 1) pelos quais seria necessário multiplicar as distâncias observadas aos textos mais próximos para obter 44 um valor aproximado da classificação atribuída pelo juiz humano ao texto T tendo em conta a atribuição h1, h2, h3 aos três testes mais próximos. Usando a informação da amostra de treino (A) os valores ˆ (ˆ1 , ˆ2 , ˆ3 ) são estimados a partir dos valores h1, …, hp atribuídos pelos juízes humanos a testes anteriormente classificados. O resultado é um classificador “treinado” mas que seria imprudente usar de modo operacional sobre novos textos a classificar. H Texto 1 h1 Modelo Teórico Amostra Texto 2 h2 s= f (texto, ) de … … = parâmetros do modelo Treino Texto i hi ˆ = parâmetros “aprendidos” … … Texto q hq Texto q+1 hq+1 s1 … … … = classificação atribuída Texto q+j hq+j sj pelo sistema ao texto … q+j pré-classificado (A= (B= Amostra de … (estimados) teste, testes sj=f (textos q+j, ˆ ) por juíz humano classificados ERRO j=hq+j - sj pelo juiz humano) Texto q+p hq+p sp (C= Novos textos a classificar, não classificados pelo ser humano Sistema operacional, Texto s com características psicométricas conhecidas s= f (texto, ˆ ) Figura 1.4.6.1. Esquema de treino de um sistema de classificação automática de textos. 45 Figura 1.4.6.2. Pretende-se, neste caso, explicar a classificação h a atribuir (mediante o modelo) ao texto T em função das k= 3 distâncias (d1, d2, d3) desse texto aos 3 vizinhos mais próximos T1, T2, T3 aos quais os classificadores humanos atribuíram previamente as classificações h1, h2, h3. Usa-se então a 2ª parte da amostra de treino (B) – a amostra de teste – para obter estimativas do erro de classificação do classificador treinado e estimar caraterísticas psicométricas (fiabilidade e validade) do classificador. Se Tq+j for o texto número j da amostra de teste (B), a que um juiz humano atribuiu a classificação hq+j (j= 1, …, p) então podemos comparar os valores hq+1, hq+2, …, hq+p com as pontuações atribuídas automaticamente pelo sistema já treinado (ver figura 1.4.6.1.): s1, s2, …, sj, …, sp, obtendo-se os erros e j hq j s j j= 1, …, p. Estes erros permitem desde logo obter uma estimativa da taxa de erro de classificação do sistema treinado e estimar também a validade referida ao critério: “comparação com a classificação do juiz humano”, usando para isso o coeficiente de correlação entre as classificações atribuídas automaticamente e as obtidas do classificador humano (rhs). 46 Quando o erro de classificação e este índice de validade forem aceitáveis, poderá então encarar-se a possibilidade do uso operacional do classificador sobre textos novos cuja classificação se desconhece. Veja no Capítulo III resultados obtidos com o nosso sistema ao ser aplicado a dados reais. Esta metodologia tem óbvias limitações na sua aplicação ao contexto do apoio às atividades de um professor isolado, dada a necessidade de classificar previamente uma fração significativa dos testes. Valores usuais apontam para mínimos de 300 ou mais testes. Poderia pensar-se que se trata de um modelo que só tem interesse para grandes instituições como por exemplo os Ministérios de Educação dos países ou projetos em que estejam envolvidos milhares de testes. Contudo, os dados experimentais do Capítulo III resultantes da aplicação a textos produzidos no âmbito de uma avaliação contínua mostram resultados animadores neste sentido. Questões Psicométricas Como se viu em números anteriores tanto a fiabilidade como a validade dos sistemas automáticos de classificação de textos atingem, de acordo com a literatura disponível, valores muito elevados. Se H significar o juiz humano e S significar um sistema automático de classificação, as correlações HS superam frequentemente os valores HH. A literatura aponta frequentemente – ver, por exemplo, Burnstein (2003) ou Rudner, Garcia, e Welch (2006) – valores HS da ordem de 0.9 ou mais. Persistem contudo alguns problemas que recomendam uma atitude prudente quanto à utilização generalizada e sem restrições destes sistemas – principalmente em exames sumativos nacionais, com grandes implementações para a vida das pessoas. De um modo geral pode dizer-se que, do ponto de vista experimental e de acordo com os estudos publicados pelo ETS (Educational Testing Service) em particular, é atualmente difícil distinguir as classificações produzidas pelos sistemas automáticos e pelos juízes humanos quando apenas estão envolvidos os chamados traços superficiais (por oposição aos traços profundos subjacentes aos textos). Utilização Operacional dos Sistemas de Avaliação Automática de Textos (SAAT) Antes de mais deve-se pôr em evidência que toda a investigação experimental e utilização operacional dos SAAT’s incidem sobre textos produzidos por examinandos 47 utilizando meios informáticos, excluindo-se textos manuscritos posteriormente transcritos ou lidos por sistemas de leitura ótica de caracteres manuscritos. Apesar de toda a investigação experimental e operacional apontar tendencialmente para a indistinção – segundo critérios da fiabilidade e validade – entre as pontuações atribuídas por sistemas SAAT e juízes humanos, constata-se que, um organismo como o ETS (http://www.ets.org/research/contact.html (consultado em 26-04-2013) não admite ainda a utilização exclusiva destes sistemas em provas a nível nacional. As razões podem ver-se em Williamson, Xi, e Breyer (2012) e Zhang (2013). Este organismo distingue assim entre testes de alto risco (high-stakes tests) e testes de baixa responsabilidade (low-stakes tests). Os testes de alto risco são os que estão associados a consequências muito importantes para a vida dos examinandos e das sociedades, como por exemplo exames nacionais em que o risco de uma atribuição errada ou enviesada de classificação pode ter consequências desastrosas para a vida das pessoas e funcionamento da sociedade. Para este tipo de teste admitem-se várias soluções mas nunca a utilização exclusiva dos SAAT’s (Williamson, et al., 2010; Williamson, Xi, & Breyer, 2012; Zhang, 2013). Para os testes de baixo risco, como por exemplo os testes de diagnóstico ou os testes para controlo da avaliação contínua admite-se a utilização dos SAAT’s. As referências Williamson, Xi, e Breyer (2012) e Zhang (2013) são especialmente reveladoras da situação presente e das tendências que se estão a manifestar. Se por um lado se reconhecem inegáveis vantagens dos SAAT’s, já constatadas experimental e operacionalmente (como objetividade, consistência, reprodutibilidade, explicação dos resultados), por outro lado, na avaliação dos traços latentes subjacentes aos textos (aspetos de estilo, conteúdo, pensamento crítico) os avaliadores humanos têm vantagem sobre os SAAT’s, se bem que sejam por vezes altamente inconsistentes, sujeitos ao efeito halo subjetivos, influenciáveis. Destas considerações resultam implicações práticas relativas à utilização dos SAAT’s em testes de alto risco. Para estes testes, o ETS usa simultaneamente os SAAT’s e o juiz humano, segundo duas alternativas (Williamson, Xi, & Breyer, 2012; Zhang, 2013). 48 1ª Alternativa A classificação final baseia-se numa combinação da classificação S atribuída pelo SAAT e da classificação H atribuída pelo juiz humano. Quando a diferença entre as duas classificações excede um certo limiar e – isto é, quando |S - H| > c – então é chamado um novo juiz humano. A classificação final é: c = w1 × S + w2 × H em que w1 + w2 = 1. Por exemplo, w1 = w2 = ½. 2ª Alternativa A classificação final é atribuída por um classificador humano (H). A pontuação (S) do SAAT é usada apenas para controlo de qualidade. Ver Zhang (2013) e Williamson, Xi, e Breyer (2012) para outras alternativas. Tendências A literatura recente – ver, por exemplo, Zhang (2013) – coincide na ideia de que num futuro próximo se assistirá ao uso generalizado dos SAAT’s para a classificação dos testes sejam eles de alto risco ou de baixo risco (sumativos ou formativos). A situação atual (uso dos dois sistemas) tem mais a ver com questões psicológicas, sociais e políticas do que com questões de validade. No modelo do “bag of words” em que se baseia a ASL, estudos citados em Landauer, McNamara, Dennis, e Kintsch (2007) atribuem 80% do significado dos textos ao significado das próprias palavras e apenas 20% à ordem das mesmas e a outros aspetos como a estrutura das frases. Contudo, estudos mais recentes relacionados com os trabalhos de Kintsch (2001) e Dennis (2005), citados na referida obra, mostram que o modelo ASL pode ser generalizado de modo a abranger esses aspetos. 1.5. EDM - Educational Data Mining. O conceito de Educational Data Mining (EDM) que no que se segue traduziremos por Mineração de Dados Educacionais (MDE) é a manifestação nas Ciências de Educação de um fenómeno global ligado à acumulação, em bases de dados digitais e outros repositórios menos organizados, de enormes quantidades de dados. 49 Estes dados têm naturezas muito diversas – desde dados científicos resultantes da observação organizada e planeada da natureza até dados resultantes do funcionamento normal das organizações de qualquer natureza. Os dados representam factos expressos por números, textos, imagens e sons. De acordo com estudos recentes – ver, por exemplo, Manyika, et al. (2011) – esta acumulação longe de abrandar tende a acelerar, tornando muito difícil, mesmo face às capacidades atuais de análise, proceder à extração atempada de informação útil à tomada de decisão. Este facto tem contribuído não só para uma alteração significativa da investigação científica – parte da qual incide hoje sobre os dados acumulados em bases de dados – e para a criação de possibilidades novas como a investigação em Ciências da Educação (Romero, et al., 2011). Num artigo gerado na área da crítica literária (Moretti, 2005) constata-se que, face à taxa de produção literária – em particular em romances de língua inglesa – é praticamente impossível a um especialista dessa área ler até aquele relativamente pequeno número de livros (face ao volume da produção) que lhe permitiria manter-se minimamente atualizado. Mesmo que dedicasse todo o tempo disponível a ler novas obras ocorridas num só ano, esse especialista necessitaria de centenas de anos de trabalho para ler só os trabalhos desse ano. Daí a constatação natural (Moretti, 2005) de que só é possível exercer a atividade de crítico literário da área em questão com apoio de programas de gestão de dados textuais e de programas de análises estatísticas destes textos. Segundo Moretti (2005), o apoio necessário não é apenas o inerente às contagens e cálculo de estatísticas básicas (quem, quando, onde, quantos textos, de que temas, etc…) mas passa também pelas sínteses automáticas dos conteúdos, feitas com a rapidez compatível com as imposições da atividade. Isto é, implica a “leitura automática” de milhares de textos em curtos períodos de tempo de modo a permitir sintetizar o respetivo conteúdo, classificar esses textos em categorias homogéneas relevantes para a atividade de crítico e que permitam, eventualmente, escolher ao acaso um pequeno número de textos que o crítico literário possa ler “pessoalmente”. 50 De um modo geral Data Mining (mineração de dados) (Fayyad, Piatetsky, Shapiro, Smyth, & Uthurusamy, 1996) consiste na aplicação de algoritmos (sumarização, classificação, regressão e outros) para a extração de padrões a partir dos dados (factos). Este processo de mineração de dados integra o processo de extração de conhecimento a partir da base de dados e que consiste, segundo o mesmo autor, na descoberta de informação útil em base de dados. O que fica para lá da mineração de dados (data mining) são as tarefas de interpretação, em domínios de atividade específica, dos padrões ou regularidades descobertas pela aplicação das técnicas computacionais e estatísticas. A mineração de dados (text mining) é um caso particular destas atividades quando os dados são textos (sequências de caracteres). Ver, por exemplo, Feldman e Sanger (2007). O conceito de “big data” – Manyika, et al. (2011) – significa pois o reconhecimento do problema do crescimento exponencial da informação digital e da quase impossibilidade, com os meios existentes (software e hardware) de extrair dessa montanha de dados informação útil e adequada à tomada de decisão. O conceito de “big data” tem implícito o reconhecimento de que se torna necessário desenvolver com urgência novos algoritmos, meios de análise e teoria que permitam extrair dessas montanhas de dados, conhecimento válido para a tomada de decisão em tempo útil e modelos de predição de eventos futuros assentes nesse conhecimento empírico – o que corresponde ao conceito mais recente de “analítica” (analitics) abrangendo a conceção, validação e operacionalização de modelos de predição combinando estatística, informática e modelos matemáticos (investigação operacional) e outras ciências do domínio ou domínios envolvidos nos dados, tendo por objetivo produzir predições empíricas (baseadas nos dados) e métodos que permitam avaliar a qualidade dessas predições (Shmueli & Koppins, 2011). É no contexto atrás sintetizado que surge o conceito de EDM, por volta de 1995. Ver Baker, Ryan, e Yacef (2009) que procuram fazer o estado da arte deste tema em 2009. Basicamente EDM é a mineração dos dados resultantes da atividade do ensino, o que justifica a tradução por Mineração de Dados Educacionais (MDE). Estes dados podem ter origem na sala de aula (com a observação da aula, resultados de testes formativos, por exemplo), na interação de estudantes com software educativo como as plataformas de e51 leaning (Moodle, por exemplo), nos resultados de testes sumativos a nível nacional ou local, nos dados gerados pela atividade de gestão de sistemas de ensino, entre outras fontes. Como se observa através destes exemplos, os dados referidos não são recolhidos com o fim de apoiar a investigação nas ciências da educação. Resultam simplesmente do funcionamento normal dos sistemas existentes, na prossecução dos respetivos objetivos. Contudo – à semelhança do que está a ocorrer em quase todas as áreas de atividade científica ou não – o facto é que estes dados permitem não só extrair conhecimento útil à gestão como – é este o facto novo – realizar investigação empírica sobre os sistemas de ensino e alicerçar em dados objetivos novos modos de encarar o ensino, redefinir o papel dos professores e os modos de avaliação – esbatidas, muitas vezes, estas distinções (Rupp, Nugent, & Nelson, 2012). Embora possa parecer questionável o estabelecimento de uma especialização da atividade de mineração de dados ligada exclusivamente aos dados da educação – com o argumento de que estes têm características específicas como a natureza hierárquica e ausência de independência – o facto é que o EDM tem-se desenvolvido rapidamente e tem servido para agregar investigadores e a investigação, antes dispersa, nesta área. Os resultados desta atividade de investigação estão acessíveis em repositórios digitais como os do site do Journal of Educational Data Mining – http://www.educationaldatamining.org/JEDM/index.php consultado em 14 de Maio de 2013 – e também os artigos publicados nos proceeding dos sucessivos congressos anuais. Ver o site http://www.educationaldatamining.org/ consultado em 12 de Maio de 2013. Passada uma fase inicial em que se tratou principalmente de aplicar as técnicas tradicionais de data mining a dados do domínio das ciências da educação, assiste-se agora ao aparecimento de investigação em que são explorados aspetos e problemáticas específicas deste domínio. A título de exemplo cita-se Antunes (2010). Uma área que está a receber atenção crescente tem a ver com os aspetos motivacionais no âmbito da aprendizagem e cujo tratamento pode ser objeto de abordagens por vezes surpreendentes e só possíveis no ambiente de superabundância de dados atual. Como por exemplo, em D’Mello e Graesses (2010) em que é relatada uma experiência destinada a investigar aspetos emocionais e afetivos da interação dos estudantes com uma plataforma de ensino eletrónica. Em vez do estudo das expressões faciais dos estudantes ao 52 interatuarem com as diversas partes do curso, os investigadores referidos obtêm resultados interessantes estudando os registos da postura do corpo expressa pela distribuição da pressão exercida pelo corpo do estudante sobre o assento e as costas da cadeira usada, mediante sensores de pressão especiais e o registo simultâneo dos ecrãs correspondentes do curso. Foi assim possível relacionar atitudes de entusiasmo e aborrecimento, por exemplo, com as partes relevantes do curso, com óbvias consequências para a melhoria do mesmo. A superabundância de sensores de baixo custo, permitindo o registo das mais diversas variáveis e guardar os dados destas medições em bases de dados, bem como a disponibilidade crescente de metodologia estatística que permite o tratamento dos dados gerados de forma a autorizar inferências válidas sobre o comportamento dos estudantes, está na base de um desenvolvimento muito interessante – e sob certos aspetos surpreendente – na área do MDE. Trata-se do conceito de Evidence Centered Design (ECD) que poderíamos traduzir por Conceção de Sistemas de Avaliação Centrados na Evidência, atendendo ao contexto em que foi criado e desenvolvido, no ETS (Mislevy, 1992; Mislevy, Almond, & Lukas, 2003; Rupp, Nugent, & Nelson, 2012). O conceito ECD – mantendo a sua designação original em inglês – aparece já, implicitamente, em Mislevy (1992) no âmbito de um estudo realizado pelo ETS relacionado com a questão da comparação de resultados (classificações) obtidos por grupos diferentes, avaliados por métodos distintos de avaliação e medição. Segundo Mislevy, Almond, e Lukas (2003), o ECD pode ser descrito como uma abordagem empírica (assente nos dados) à questão da conceção e implementação de sistemas de avaliação (assessment). Os referidos autores constatam que o que há de comum entre todos os sistemas de avaliação em educação é “o desejo de raciocinar a partir de coisas particulares que os estudantes dizem ou fazem para realizar inferências acerca dos seus conhecimentos e competências”. É o que sucede num contexto limitado, por exemplo, no âmbito do TRI em que se procura inferir o comportamento dos itens e dos estudantes observando casos particulares de respostas a itens integrados em testes já aplicados (Bergner, Dröschler, Kortmeyers, Rayyan, Seaton, & Pritchard, 2012). Estes esquemas clássicos de avaliação têm sido considerados, cada vez mais, inadequados para avaliar a evolução dos estudantes – principalmente face a avanços na psicologia e ciências da educação. Este facto é tanto mais evidente face ao avanço 53 tecnológico, nomeadamente quanto à possibilidade de observar aspetos inacessíveis aos testes clássicos e de tratar os dados resultantes da interação dos estudantes com sistemas de e-learning e da monitorização do processo de aquisição de conhecimentos usando técnicas que combinem modelos de decisão, psicometria, biometria e mineração de textos e outros dados. 54 Capítulo II: Metodologia da Investigação. 2.1. Introdução. Como se disse na Introdução à Tese, a principal questão que este trabalho procura investigar tem a ver com a identificação e avaliação dos problemas associados ao desenvolvimento de instrumentos de ensino / aprendizagem, a serem usados por professores e estudantes, baseados em análises estatísticas de textos. De entre esses problemas, ocupam papel central as questões ligadas à monitorização, tanto por professores como por estudantes, dos processos de aquisição de conhecimentos naquelas matérias em que a língua nativa – o português em particular – detém a maior importância. Em particular, as questões ligadas às situações em que os estudantes expressam em português as respostas a questões abertas. Se bem que durante a elaboração deste trabalho tenham sido identificados importantes projetos de investigação ligados à língua portuguesa – veja-se, por exemplo, a investigação associada à atividade do Instituto de Linguística Teórica e Computacional, ILTEC (http://www.iltec.pt/ consultado em 22 de Maio de 2013), os trabalhos do grupo NLX - Natural Language and Speech Group da Faculdade de Ciências da Universidade de Lisboa (http://nlx.di.fc.ul.pt – consultado em 22 de Maio de 2013) ou os trabalhos de outros investigadores como Cláudia Antunes, ligada ao Instituto Superior Técnico (http://web.ist.utl.pt/claudia.antunes/ consultado em 22 de Maio de 2013) – constata-se que na área que nos ocupa (a da aquisição e avaliação de conhecimentos usando o português como instrumento) relativamente poucos trabalhos têm sido publicados Dentro desta vasta área concentrámo-nos no problema da análise dos textos produzidos por estudantes em resposta a questões abertas, questão que está na interseção de muitos dos problemas antes identificados. A preocupação inicial foi a de entender a razão pela qual a Análise da Semântica Latente (ASL) aparece na literatura técnica desta área como modelo natural de aquisição da linguagem. Para isso começou por se estudar o artigo Landauer e Dumais (1997), relativo ao chamado “Problema de Platão” que designa a aparente contradição entre a rapidez com que as crianças obtêm novos termos face à relativa pouca quantidade de informação que recebem durante esse processo. 55 Feito isto, procurou-se em seguida reproduzir, no domínio do Português, experiências relatadas na literatura para outras línguas e que dão conta da possibilidade de, usando a metodologia da ASL, construir sistemas de avaliação automática de conhecimentos com base nessa metodologia. Neste sentido considera-se muito útil o acesso às facilidades do sítio da Universidade do Colorado (http://lsa.colorado.edu/) em que elementos do grupo de investigação ligado a Landauer têm publicado os resultados dessa investigação, sendo ainda possível utilizar “on-line” um sistema Intelligent Essay Assessor (IES) que permite avaliar textos submetidos por utilizadores. Contudo, sendo o nosso objetivo o de estabelecer a possibilidade de construir sistemas utilizáveis, de modo rotineiro, por professores e estudantes portugueses com recursos muito limitados, decidimos construir um protótipo – descrito no que se segue – que permitisse, com total flexibilidade, responder às questões formuladas. No que se segue ao longo deste capítulo, descreve-se, sucessivamente, em 2.2. o modelo que serviu de base à implementação do protótipo usado na experimentação, em 2.3. as decisões tomadas relativas à estruturação de uma amostra que permita validar o modelo e realizar as experiências que permitiram responder às questões colocadas e, em 2.4., definir a metodologia para recolher os dados. Finalmente, em 2.5. descreve-se a metodologia geral a usar para analisar os dados nas diversas experiências a realizar com uma implementação desse modelo. 2.2. Formulação do Modelo. 2.2.1. Estrutura. Neste número descreve-se o modelo usado como instrumento desta investigação e com base no qual foi concebido o software Programa de Análise Estatística de Textos (PAET) descrito em 3.4. e objeto do Manual do Utilizador que constitui o Anexo A deste trabalho. A figura 2.2.1.1. descreve a estrutura do sistema que permite, usando os textos dos professores e manuais escolares, produzir os chamados espaços semânticos, instrumento fundamental da Análise da Semântica Latente descrito em 2.2.2. 56 A figura 2.2.1.2. descreve a estrutura do sistema experimental a desenvolver na avaliação de conhecimentos de uma certa matéria com base em textos produzidos pelos estudantes ao responderem a questões de resposta aberta e nos espaços semânticos construídos a partir dos textos dos manuais usados no ensino desse tema. Figura 2.2.1.1. Armazenamento da informação de base e construção de espaços semânticos a partir de textos produzidos pelos professores e manuais escolares relativos ao ensino de certas matérias. 57 Figura 2.2.1.2. Estrutura do sistema de avaliação de conhecimentos com base em textos de resposta a questões abertas. Os significados dos símbolos da figura 2.2.1.1. são as seguintes: PGBD – Programa de Gestão da Base de Dados BDT – Base de Dados Textual PIU – Programa de Interface com o Utilizador ES – Espaços Semânticos PLSA – Programa de Construção do Espaço Semântico Latente (ASL) PRVT – Programa de Representação Vetorial dos Textos PSVD – Programa de Decomposição em Valores e Vetores Singulares 58 Os textos relevantes para uma análise são os seguintes: Manuais e outros documentos recomendados para a aprendizagem da matéria em avaliação. Exemplo: Manuais escolares usados no ensino do Português e obras de autores portugueses usados num certo nível de ensino. Textos – apontamentos produzidos pelos professores de uma certa matéria. Textos com as respostas dos estudantes aos itens de resposta aberta, contidos nos testes de exames globais ou formativos. Exemplo: Resposta dos estudantes do 12º ano a itens de resposta aberta dos exames nacionais. Textos com respostas dos estudantes a itens de resposta aberta classificados pelos professores usando os métodos tradicionais. Estes textos encontram-se em suportes de papel ou digitais – por exemplo, em textos produzidos com processadores de texto, em plataformas de ensino ou em formato .pdf, em sítios da Internet, entre outros. Exclui-se a utilização de programas de reconhecimento de carateres, Optical Character Recognition (OCR), pelo que todos os textos manuscritos têm de ser previamente digitalizados antes da sua introdução no sistema ou então deixados de fora, face ao custo dessa operação. Todos os textos relevantes são carregados numa BDT – Base de Dados Textual – através de um Programa de Gestão de Base de Dados (PGBD). Para a estrutura da base de dados veja o número 3.3. Uma vez na BDT, todos estes textos ficam disponíveis para os diversos tipos de análise e produção de espaços semânticos especializados. As análises podem consistir, simplesmente, em contagens dos termos que integram os textos, em cálculos de índices úteis a diversos usos ou então na criação de representações vetoriais dos textos e palavras (RVT) que sirvam de base à construção de Espaços Semânticos (ES) (Landauer, McNamara, Dennis, & Kintsch, 2007) em que assenta o funcionamento de sistemas de classificação dos textos. A escolha dos textos específicos a serem usados numa certa análise bem como daqueles que vão integrar um dado espaço semântico a ser usado na avaliação de conhecimentos de certa matéria é realizado através do Programa de Interface com o Utilizador – o programa PIU. 59 Escolhidos estes textos, o programa PLSA começa por identificar todas as palavras existentes em todos os textos escolhidos para análise (usando um algoritmo de identificação de “tokens”) elimina as palavras instrumentais ou funcionais (consultando a tabela PI) e, eventualmente, identificando / extraindo as raízes das palavras através de um programa de lematização (Rocha & Coelho, 2009; Orengo & Huyck, 2001, & Alvares 2005). O resultado é uma tabela de frequências que, para cada “forma” – raiz das palavras retida para análise – dá a frequência de ocorrência dessa forma em cada um dos textos. Esta tabela de frequências constitui a chamada representação vetorial dos textos (RVT), a usar no seguimento da análise. Trata-se de uma tabela de contingência contendo as frequências de ocorrência das palavras ou formas nos textos do corpus. Esta tabela – de contingência – é em seguida sujeita a várias transformações, antes de ser submetida à decomposição em vetores e valores singulares através do programa PSVD (Eckart & Young, 1936; Landauer, et al., 2007). O resultado da decomposição em valores e vetores singulares (depois de outras transformações) constitui o chamado Espaço Semântico (Landauer, et al., 2007). A cadeia de transformações (acima resumidas) que permite passar de um certo conjunto de textos para o espaço semântico necessário às operações de treino dos avaliadores de conhecimentos envolve operações computacionalmente demoradas mas cujos tempos de execução estão a tornar-se cada vez mais reduzidos face à potência crescente dos computadores pessoais, os únicos que importa considerar neste projeto. O tempo de processamento depende, entre outras variáveis, do número de textos e da respetiva extensão expressa em número de palavras, que têm de ser identificadas através da operação de tokenização, uma das mais demoradas de todo o processo. Deste modo, convém guardar o resultado desta fase numa base de dados auxiliar de Espaços Semânticos (ES) – o que permite, no início de uma sessão, retomar o trabalho já realizado, sem ter de recalcular, de cada vez, o espaço semântico que interessa. A figura 2.2.1.2. descreve, por sua vez, o processo que, partindo da BDT (Base de Dados Textual) e ES (Espaços Semânticos) permite obter classificações ou avaliações dos conhecimentos, acerca da matéria em avaliação, expressos nos textos das respostas dos estudantes a itens de resposta aberta contidas nos diversos testes. A partir destes espaços semânticos podem realizar-se, sobre as respostas aos itens usados nos testes, vários estudos 60 úteis à atividade do professor, como por exemplo comparações estatísticas dos textos produzidos pelos vários estudantes, agrupamentos de textos semelhantes, classificações dos testes, identificação de grupos de palavras usadas por grupos de estudantes e outros. Se bem que estas comparações possam ser realizadas diretamente sobre as tabelas de contingência, considera-se que é mais útil realizá-las sobre os “espaços semânticos” uma vez que as operações de SVD permitem, como se disse, captar semelhanças semânticas que escapam completamente à tabela de frequências, ainda que presentes nessas tabelas de modo implícito. É isto o essencial da abordagem designada por ASL. Um Programa de Interface com o Utilizador (PIU) permite que este não só identifique quais são os testes e os itens que vão ser objeto de avaliação como alguns parâmetros relevantes para essa avaliação, como sejam o Método a usar (Método 1, Método 2, …, Método k). De entre os parâmetros relevantes para uma experiência, destaca-se o número de dimensões d a usar nos cálculos subjacentes à classificação (Landauer & Dumais,1997; Landauer, Laham, & Foltz, 2003; Landauer, et al., 2007). Os resultados da aplicação desses métodos expressam-se em estatísticas e em gráficos que dependem do método a usar. No número 2.5. – metodologia – podem ser vistos os pormenores de dois desses métodos implementados neste trabalho. 2.2.2. Obtenção da Representação Vetorial dos Textos (Tabelas Léxicas). Dado um conjunto de textos a analisar estatisticamente (corpus), um passo preliminar consiste em obter a respetiva representação vetorial (Salton, Wong, & Yang, 1975; Lebart, Salen, & Berry, 1998; Osuna, 2006) sob a forma de uma tabela de contingência ou tabela léxica que cruza “formas” (palavras ou coocorrências de palavras) e textos ou documentos, tendo no cruzamento da forma i com o texto ou documento j a frequência fij com que a forma i ocorre no texto Dj. Ver tabela 2.2.2.1. 61 Formas D1 D2 … Dj … Dp … F1 F2 … fij Fi … Fn Tabela 2.2.2.1. Representação vetorial de um corpus formado pelos documentos D1, D2, … Dp e pelo vocabulário formado pelas formas F1, F2, …, Fn (Osuna, 2006). A obtenção da tabela de contingência ou tabela léxica – elemento essencial da análise estatística de textos – pressupõe a realização das seguintes tarefas prévias: 1. Identificar e definir as unidades de texto a considerar na análise - em geral palavras, isto é, sequências de símbolos delimitados à esquerda e à direita por espaços em branco. Mas podem ser outras formas; por exemplo, duas ou mais palavras consecutivas (coocorrência de palavras). 2. Eliminar todas os delimitadores que não sejam os espaços em branco: “?”, “!”, “:”, “,”, “.”, “…” … 3. Eliminar as palavras funcionais ou instrumentais (PI) – preposições, pronomes, artigos, pronomes e outras, conforme o contexto do estudo. 4. Lematização. Isto é, substituição de palavras por palavras normalizadas, obtidas por extração das raízes comuns a um conjunto de formas, reduzindo assim o número de palavras do vocabulário e aumentando a frequência das formas retidas. A lematização (Rocha & Coelho, 2009; Orengo & Huyck, 2001; Alvares, 2005) implica usar uma “peça” de software específico: o lematizador. Existem lematizadores gerais sendo o ideal usar um lematizador específico para o português. Neste trabalho usa-se o lematizador descrito em Porter (1980) sendo escassa a literatura portuguesa acerca deste tema. Ver os trabalhos do grupo da Faculdade de Ciências de Lisboa NLX (http:// nlx.di.fc.ul.pt/ consultado em 22 de Maio de 2013). 62 A fim de se poder seguir com maior facilidade os conceitos descritos neste número, e nos números seguintes, considere-se o seguinte exemplo simples, baseado em algumas respostas abertas à questão: “O que é a Análise da Semântica Latente (ASL)?” Exemplo 2.2.2.1. (O que é a ASL?) Considere-se as seguintes respostas (R1 … R5) de cinco estudantes à questão anterior. R1 – O conceito de ASL pode ser visto como a aplicação da SVD a uma tabela de contingência resultante da representação vetorial de um conjunto de textos. R2 – A ASL pode ver-se como uma metodologia capaz de representar geometricamente o significado de um conjunto de textos. R3 – O essencial do conceito de ASL está no facto de que a técnica ou metodologia em que se baseia permite expressar geometricamente – através de ângulos e distâncias – as proximidades psicológicas entre significados dos termos. R4 – Em termos psicológicos pode dizer-se que a ASL é um modelo das representações mentais do significado dos termos envolvidos num conjunto de textos. R5 – Se a ASL dá conta das associações e proximidades psicológicas existentes na mente das pessoas entre os significados dos termos e dos textos, então é difícil resistir à tentação de usar essa metodologia como instrumento de avaliação de conhecimentos. No fim de contas, o conhecimento que alguém porventura possua acerca de uma certa matéria deve poder ser expresso em termos de palavras – representando conceitos e sua relações. Considerando um espaço semântico – obtido sem lematização – formado apenas pelos primeiros três textos (R1, R2, R3), a tabela de contingência correspondente é a seguinte (matriz X): 63 ID Palavras R1 R2 R3 1 angulos 0 0 1 2 aplicacao 1 0 0 3 atraves 0 0 1 4 baseia 0 0 1 5 capaz 0 1 0 6 como 1 1 0 7 conceito 0 0 1 8 conjunto 1 1 0 9 contingencia 1 0 0 10 distancias 0 0 1 11 entre 0 0 1 12 essencial 0 0 1 13 expressar 0 0 1 14 facto 0 0 1 15 geometricamente 0 1 1 16 metodolofia 0 0 1 17 metodologia 0 1 0 18 permite 0 0 1 19 pode 1 1 0 20 proximidades 0 0 1 21 psicologicas 0 0 1 22 representaçao 1 0 0 23 representar 0 1 0 24 resultante 1 0 0 25 significado 0 1 0 26 significados 0 0 1 27 tabela 1 0 0 28 tecnica 0 0 1 29 termos 0 0 1 30 textos 1 1 0 31 vectorial 1 0 0 32 ver-se 0 1 0 33 vista 1 0 0 Tabela 2.2.2.2. Tabela de frequência correspondente aos textos do exemplo 2.2.2.1. 64 Esta tabela, adiante designada por X, constitui a representação vetorial – tabela de contingência Palavras X Textos – que vai ser submetida às operações de decomposição em vetores e valores singulares, a seguir descritas. 2.2.3. Construção e Interpretação de Espaços Semânticos. Biplots. A representação vetorial X das palavras versus textos – veja número anterior – é o ponto de partida para a construção do espaço semântico correspondente (Landauer, Laham, & Foltz, 2003; Landauer, et al., 2007). O espaço semântico resulta da decomposição em valores e vetores singulares da matriz X que contém as frequências das palavras (formas) nos textos do corpus, depois de eliminadas as palavras funcionais e do processo de lematização, não obrigatório. Observe-se que cada linha da matriz X é um vetor (de frequências) correspondente a uma palavra (ou forma), num espaço com tantas dimensões quantos os textos do corpus. Isto é, X é uma matriz X (n, p) de n linhas por p colunas. Por exemplo, no caso descrito no número anterior, a palavra “conjunto” fica representada pelo vetor [1, 1, 0] significando que ocorre uma vez tanto no texto da resposta R1 como no texto da resposta R2. Isto é, cada palavra fica representada num espaço vetorial de dimensão p= número de textos do corpus. Neste caso, p= 3. De modo semelhante, cada texto, por exemplo, o texto da resposta R3 fica representado por um vetor de frequências de ocorrência das diversas palavras, espaço este que tem tantas dimensões quanto as palavras (depois da lematização) que ocorrem no conjunto dos textos. No caso, cada texto (R1, R2, R3) fica representado por um vetor de 33 componentes ou dimensões. Dada a matriz da representação vetorial dos textos X com n linhas por p colunas, contendo no cruzamento de uma palavra com um texto o número de vezes com que essa palavra ocorre nesse texto – a operação de decomposição em valores e vetores singulares expressa X como o produto de 3 matrizes: X U D V ( n, p ) T ( n, r ) ( r , r ) ( r , p ) Estas matrizes componentes U, D, VT obtêm-se pelo método dos mínimos quadrados (Landauer, et al, 2007). As dimensões destas matrizes são, respetivamente, 65 U (n × r) V (p × r) e D (r × r) Em que n é o número de palavras, p é o número de textos e r é a chamada característica de X: o número de linhas ou colunas linearmente independentes – um número que, quando muito, é igual ao mínimo de n e p. No caso da situação de exemplo descrito no número anterior, r= p= 3. A matriz U tem tantas linhas quantas as palavras e um número de colunas = r. A matriz V tem tantas linhas quantos os textos no corpus e um número de colunas igual a r. A matriz D (simétrica e com valores apenas na diagonal) tem um número de linhas e colunas igual a r, contendo na diagonal os chamados valores singulares s1, s2, …, sp. Isto é: s1 D= s2 ... sr Mostra-se – ver, por exemplo, Gabriel (1971) – que os quadrados destes valores correspondem às variâncias dos fatores (ortogonais) subjacentes à matriz de dados. Isto é, a 2 2 2 soma de s1 s2 ... s p = variância (ou informação) da matriz de dados. Isto significa que U e V representam, respetivamente, através dos vetores nas respetivas linhas, as palavras e os textos por vetores com a mesma dimensão: r ≤ min (n, p). Por exemplo, na situação do exemplo anterior, se r fosse igual a 2, então tanto as palavras como os textos ficariam representados por vetores de dimensão = 2 e, portanto, poderiam ser representados simultaneamente por pontos de um plano. Se r= 3 (é o caso) então tanto as palavras como os textos ficam representados por pontos de um espaço de 3 dimensões que se apresenta na figura 2.2.3.1. 66 Figura 2.2.3.1. Os vetores representam os textos R1, R2, R3 e os pontos ○ representam os cinco locais em que se sobrepõem as 33 palavras. Neste caso, r= min (n, p) = min (33, 3)= 3. Considerando as projeções sobre o plano formado pelos eixos E1 e E2, obtém-se a figura 2.2.3.2. Figura 2.2.3.2. Os textos R1, R2, R3 estão representados por vetores e as 33 palavras estão projetadas no plano E1, E2. Face à sobreposição de palavras com as mesmas coordenadas, o resultado é pouco legível. As figuras 2.2.3.1. e 2.2.3.2. são exemplos de biplots associados à SVD da matriz de dados original X. 67 As coordenadas para estas representações obtêm-se diretamente dos vetores que resultam da decomposição em valores e vetores singulares, de acordo com as metodologias – definidas por Gabriel (1971) e Galindo (1985) – para a construção de biplots. Os biplots de Gabriel (1971) obtêm-se usando para as coordenadas das palavras as linhas da matriz A = U D e para as coordenadas dos textos (colunas) as linhas da matriz B = U D1- em que é um número entre 0 e 1. Observe-se que a decomposição em valores e vetores singulares pode ser apresentada como X = U D VT = U D D1- VT = U D (V D1-) T = A B T em que A = U D e B = V D1-. As n linhas de A e as p linhas de B contêm vetores que representam, respetivamente, as palavras e os textos num espaço comum de dimensão r ≤ min (n, p). O papel de D - e, portanto, dos valores singulares da diagonal respetiva – é o de definir as escalas dos eixos do gráfico (plano 3-dimensional) em que vão ficar representados tanto palavras como textos. Estas representações geométricas em que tanto palavras como textos (linhas e colunas) de X aparecem na mesma representação gráfica (gráfico de dispersão) em posições perfeitamente definidas, podem generalizar-se a quaisquer dimensões 1, 2, 3, …, r – embora apenas possam ser visíveis para r 3. Exemplo 2.2.3.1. (O que é a ASL? - continuação) No caso da matriz X com a representação vetorial correspondente aos três textos R1, R2, R3 tem-se (usando o software referido em Vairinhos, e Galindo (2004)) a seguinte decomposição: 68 A= 1 -0.324 -0.843 -0.843 -0.429 -0.753 -1.167 -0.753 -0.324 -0.843 -1.272 -0.843 -0.843 -0.843 -0.843 -1.272 -1.272 -0.843 -0.843 -0.753 -0.843 -0.843 -0.324 -0.429 -0.324 -0.429 -0.843 -0.324 -0.843 -0.843 -0.753 -0.429 -0.324 -0.324 2 -0.720 0.514 0.514 -0.466 1.186 -0.207 -1.186 -0.720 0.514 0.048 0.514 0.514 0.514 0.514 0.048 0.048 0.514 0.514 -1.186 0.514 0.514 -0.720 -0.466 -0.720 -0.466 0.514 -0.720 0.514 0.514 -1.186 -0.466 -0.720 -0.720 3 -0.614 -0.158 -0.158 0.774 0.160 -0.772 0.160 -0.614 -0.158 0.615 -0.158 -0.158 -0.158 -0.158 0.615 0.615 -0.158 -0.158 0.160 -0.158 -0.158 -0.614 0.774 -0.614 0.774 -0.158 -0.614 -0.158 -0.158 0.160 0.774 -0.614 -0.614 B= 1 -0.144 -0.195 -3.763 2 -2.683 -1.736 1.913 3 -1.648 2.078 -0.425 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 1 2 3 Empilhando as matrizes A e B numa matriz C – figura 2.2.3.3. – as coordenadas que permitem a representação gráfica das palavras ocupam as n primeiras linhas da matriz C e as coordenadas que permitem a representação gráfica dos textos ocupam as posições n+1, …, n+p da matriz C. 69 Figura 2.2.3.3. A matriz C que se obtém empilhando as matrizes A e B contém os marcadores de palavras e textos no espaço de dimensão r. Verifica-se pela metodologia indicada anteriormente que, escolhendo duas ou três colunas da matriz C - veja figura 2.2.3.3. - podem obter-se representações gráficas B A em que aparecem simultaneamente as palavras e os textos que foram usados para construir a matriz X. Dado que estas representações mostram simultaneamente os dois tipos de informação (linhas e colunas) designam-se biplots (Gabriel, 1971). Contudo, como se vê, este conceito pode generalizar-se a qualquer dimensão acima de 2, embora os gráficos correspondentes não possam visualizar-se. Fica também claro das considerações anteriores que toda a metodologia computacional correspondente à ASL (Análise da Semântica Latente) que seja baseada na SVD, fica captada pela metodologia dos biplots, definida em 1971 por Gabriel e, muito especialmente pelos biplots de Galindo (Galindo, 1985). Em geral, na expressão da decomposição usada em Gabriel (1971). X = U D VT = U D D1- VT = U D (V D1-) T = A B T 70 1 2 faz-se , pondo assim, em pé de igualdade os pesos das representações das palavras e 1 2 dos textos. Para , palavras e textos ficam representados em referenciais com escalas distintas. Galindo (1987) mostra que quando se definem as matrizes A e B através de A = U D e B = V D então as linhas da matriz C - veja figura 2.2.3.3. - contêm os chamados B A marcadores (no sistema de coordenadas dos vetores – variáveis latentes e textos) ficando tanto uns como outros representados com a máxima qualidade possível e sendo agora a representação uma genuína representação conjunta (num gráfico cujos eixos têm as mesmas escalas) de palavras (linhas) e textos (colunas). Mostra-se também em Galindo (1985) que, ao contrário dos biplots de Gabriel (1971), em que X = U D VT = A B T, com A = U D, B = V D1- (0 ≤ ≤ 1) nos biplots de Galindo isto não sucede, tendo-se Y = (U D) (V D)T= U D2 VT em que a matriz D2 contém, agora, os valores próprios (variâncias dos eixos fatoriais). É claro que Y ≠ X e, portanto, esta definição de biplot não permite recuperar a matriz de dados inicial. Mostra-se, em Galindo (1985), que essas representações têm as seguintes propriedades: 1. O cosseno do ângulo entre duas colunas (textos) de X nessa representação significa o coeficiente de correlação entre as colunas correspondentes. Em síntese: o cosseno do ângulo entre dois textos é o coeficiente de correlação entre os vetores representativos dos textos. Isto significa que se dois textos fazem no gráfico um ângulo muito pequeno, os respetivos significados estão muito próximos. 2. Nessa representação, a distância entre os pontos representativos de duas linhas é a distância de Mahalanobis. Isto significa que se duas linhas (palavras) de X estão representadas como pontos próximos no biplot, então correspondem a 71 linhas semelhantes (palavras) e reciprocamente, linhas muito distintas estarão nessa representação, muito afastadas. 3. Uma vez que nesta representação palavras e textos estão representados num sistema referencial (formado pelos eixos fatoriais dotados de escalas idênticas para linhas/palavras e colunas/textos) então tem sentido definir ângulos (e cossenos dos ângulos) entre palavras e textos. O cosseno deste ângulo implica que o significado de uma palavra contribui tanto mais para o significado de um texto quanto menor o ângulo entre a palavra e o texto. Ou seja: o significado de uma palavra está tanto mais associado ao significado de um texto – contribui tanto mais para o significado do texto – quanto menor for o ângulo entre a palavra e o texto no gráfico. Esta interpretação não é admissível nos biplots de Gabriel. Mostra-se em Bellegarda (2007) que os cossenos dos ângulos envolvidos entre as representações das palavras e textos podem ser calculados como a seguir indicado. Seja C (veja figura 2.2.3.3.), se considerarmos a linha genérica ai (i= 1 … n) B A da matriz A e a linha genérica bj (i= 1 … p) da matriz B, tem-se: ai = ui D (palavras i) bj = v j D (texto j) em que ui e vj são as linhas genéricas das matrizes U e V, respetivamente (resultantes da SVD). O cosseno do ângulo entre os dois vetores representantes de uma palavra de um texto é Cos ( ai , b j ) ai , b j ai b Tj ai a iT b j b Tj ai , ai b j , b j u u i D 2 v Tj i D 2 v Tj v j D 2 v Tj . O cosseno do ângulo entre duas palavras é: Cos ( a i , a k ) u D i u i D 2 u kT 2 u iT u k D 2 u kT . 72 O cosseno do ângulo entre dois textos é: Cos (b j , be ) v v j D 2 v eT j D 2 v Tj v e D 2 v eT . Na terminologia de Laudauer, Foltz, e Laham (1998) e Landauer, et al. (2007) a matriz C representa então o “espaço semântico” associado a um certo conjunto de B A textos (corpus). Como pode verificar-se, do ponto de vista computacional, quando a ASL se baseia na SVD da matriz X, todos os conceitos da ASL podem, com vantagem, ser interpretados em termos dos biplots de Galindo. A representação conjunta de palavras e textos no mesmo gráfico tem vantagens consideráveis do ponto de vista da interpretação intuitiva do que está em causa, uma vez que as proximidades angulares entre os dois tipos de conceitos em análise (palavras e textos) permite interpretar intuitivamente o significado dos textos em função do significado das palavras que lhe ficam próximas (no sentido angular); as relações entre palavras (semelhanças) em função das proximidades angulares e distâncias entre elas; as proximidades angulares entre textos representando proximidades entre os respetivos significados. Esta interpretação gráfica intuitiva da operação de decomposição da matriz de frequências, mantêm-se mesmo que a utilização de grande número de dimensões – por exemplo 300 dimensões - não permita visualizar os gráficos dos biplots correspondentes. Contudo, o conceito de ângulo, correlação e toda a interpretação anteriormente apresentada continua a fazer sentido. É claro que, de acordo com Landauer (1997) o essencial da ASL está na análise psicológica do processo de aquisição do significado de novas palavras por parte das crianças que, conforme resultados experimentais e de simulação desses autores, parece ser bem modelado pelo mecanismo em que se baseia a operação de SVD, tendo-se concluído que as proximidades mentais entre os significados das palavras ficam bem representados por distâncias geométricas obtidos através da SVD – e que no presente trabalho se mostra que são bem captados através do conceito de biplot, como se pode ver experimentalmente no Capítulo III. 73 2.2.4. Métodos de Avaliação de Conhecimentos baseados em ASL/Bipolts. De acordo com Landauer, Foltz, e Laham (1998, 2003) o processo de aquisição de novos conceitos por parte das crianças parece ser satisfatoriamente modelado usando os princípios subjacentes à construção das decomposições em valores e vetores próprios de matrizes retangulares que traduzem a representação vetorial dos textos (Salton, Wong, & Yang, 1975). Esta conclusão foi obtida experimentalmente a partir de simulações realizadas usando esse modelo. Daqui decorre, naturalmente, a tentativa de usar essa metodologia computacional para avaliar conhecimentos acerca de uma certa matéria que tenham sido adquiridos através da língua natural e expressos através de relações entre os significados de palavras relevantes, obtidos durante a aprendizagem. Isto é, se uma pessoa/estudante obteve conhecimento de algo de relevante acerca de certa matéria, esse conhecimento – expresso na mente do sujeito através de proximidades semânticas aprendidas pelos métodos anteriormente descritos, deve revelar-se ou manifestar-se no que escreve, na escolha das palavras e suas associações em textos de resposta a questões abertas sobre o tema em avaliação. A construção da resposta a uma questão aberta implica que o respondente se esforce por identificar, escolher, as palavras cujos significados estão associados, na sua mente, ao tema em apreço. Estas associações – corretas ou não – têm a ver com a qualidade do conhecimento adquirido durante a aprendizagem. Em síntese (Landauer, & Dumais, 1997; Landauer, Foltz, & Laham, 1998, 2003) as semelhanças psicológicas entre os significados das palavras associados ao conhecimento de uma certa matéria tendem a manifestar-se nos textos redigidos pelos estudantes através de proximidades entre as palavras cujos significados são o suporte desse conhecimento. Isto significa que o conhecimento adquirido pelo estudante acerca de uma certa matéria pode, em princípio, ser avaliado examinando as proximidades das palavras usadas nos textos de resposta (redação/essays) a questões de resposta aberta usando, na análise dos textos produzidos, exatamente o mesmo modelo computacional que parece estar envolvido na respetiva aquisição e organização mental – o SVD, nas perspetiva de Landauer. Como se viu atrás, os resultados de uma análise SVD podem ser expressos de modo gráfico (biplots) em duas, três ou mais dimensões, se bem que com uma certa perda quantificável de informação. 74 Landauer, Foltz, e Laham (1998) identificam cinco métodos para atribuir classificações holísticas a textos de resposta a questões abertas, com base no espaço semântico construído com os textos usados para a aprendizagem da matéria em causa. Neste trabalho analisam-se dois métodos principais, relacionados (mas não idênticos) com o Método 1 (Landauer, Foltz, & Laham, 1998, p. 30) e com o Método 5 (Landauer, Foltz, & Laham, 1998, p. 30) e que passamos a descrever em seguida. Nos números 3.5. e 3.6. deste trabalho serão apresentados os resultados experimentais acerca da respetiva utilização. 2.2.4.1. Método 1. Os passos a usar para implementar este método são os seguintes: 1.º Construir um Espaço Semântico (ES) com base nos textos usados para a aprendizagem dos estudantes e outros textos escritos por peritos da matéria a ensinar. 2.º Professores classificam uma certa percentagem das respostas dos estudantes, constituindo os testes assim classificados uma amostra de aprendizagem do classificador a construir. 3.º A amostra classificada pelo método tradicional – referida em 2 – é posicionada no espaço semântico usando um processo de cálculo descrito em Bellegarda (2007). 4.º Os textos não classificados são, por sua vez, posicionados no ES e classificados em função da respetiva semelhança – medida pelos cossenos dos ângulos – em relação aos textos já classificados. 75 O processo é exemplificado usando a tabela, produzida pelo software experimental desenvolvido: Figura 2.2.4.1.1. Ilustração do Método 1. Os cossenos dos ângulos entre textos a classificar (lado esquerdo) e a da amostra de treino (topo) estão no corpo da tabela. Referindo-nos à figura anterior, e às figuras 2.2.1.1. e 2.2.1.2., suponhamos que já foi construído o ES com base nos textos usados na aprendizagem dos estudantes e que estão por classificar os textos 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27 produzidos pelos estudantes. Pelo método tradicional – professor – são classificados os textos 11, 12, 14, 15, 17, 18 aos quais foram atribuídas, por esses professores, respetivamente, as classificações 39, 20, 36, 17, 43, 25. Em função desta informação e do ES pretende-se atribuir classificações aos textos (coluna do lado esquerdo) 20, 21, 23, 24, 26, 27. No passo número 3, os textos classificados pelo professor são posicionados no ES, usando a metodologia definida, por exemplo, em Bellegarda (2007). Consideremos, por exemplo, o texto número 23. Esse texto faz com os textos já classificados – 11, 12, 14, 15, 17, 18 – ângulos cujos cossenos são, respetivamente, 0.94 (com 11), 0.58 (com 12), 0.92 (com 14), 0.78 (com 15), 0.85 (com 17) e 0.52 (com 18). A classificação 39 foi, neste caso, obtida como sendo igual à classificação do texto com o qual o texto 23 tem o menor ângulo (maior cosseno), maior semelhança. Isto é: 39. Outras alternativas são possíveis, como por exemplo, a média dos k textos classificados mais próximos do texto a classificar (k= 1, 2, 3). Ver a figura 1.4.6.2 do Capítulo I. As classificações dos restantes textos são obtidas de modo semelhante. 76 A fim de ter uma ideia da validade do método, neste caso também os testes 20, 21, 23, 24, 26, 27 foram classificados pelo Professor e, no final, foi calculado o coeficiente de correlação entre as classificações do professor e as atribuídas automaticamente pelo algoritmo descrito, tendo-se obtido, neste caso específico, o valor 0.908, também, apresentado na figura 2.2.4.1.1. O significado geométrico do processo descrito pode ver-se no esquema da figura 2.2.4.1.2. a seguir apresentada. Figura 2.2.4.1.2. Biplot 3D correspondente ao Método 1. Na figura, T1, T2, …, T15 são textos e W1, W2, …, W27 são palavras do ES. O símbolo “?” corresponde a um texto cuja classificação é desconhecida. A figura 2.2.4.1.2. é apenas um esquema explicativo para veicular o significado geométrico do que está em causa. Corresponde a um biplot em 3 dimensões (assumindo neste caso – o que é geralmente muito irrealista – que essas 3 dimensões captam a totalidade da informação). As setas pintadas a verde correspondem a textos classificados com valores 12, 14, 15, …, etc. Uma vez que o texto cuja classificação se pretende atribuir forma um ângulo de cosseno máximo com o texto classificado com 15, então, se o critério for este, a classificação seria 15. 77 Contudo, se a regra a implementar fosse a de atribuir como classificação a média dos k= 3 textos classificados mais próximos (com maiores cossenos), o resultado a atribuir ao texto identificado por “?” seria (14 + 15 + 12) / 3 14. Numa situação real, as dimensões envolvidas são da ordem das dezenas, pelo que um gráfico cartesiano para biplots com dimensão n-D, com n > 3 não são visualizáveis (Landauer et al., 1993). Contudo, pode-se construir um chamado biplot cilíndrico (Vairinhos & Galindo, 2012) em que, usando um gráfico de coordenadas paralelas correspondente aos eixos fatoriais subjacentes à SVD é possível visualizar um biplot em espaços de dimensão muito elevada se bem que não tão intuitivos quanto os gráficos cartesianos habituais. Nesse biplot, tanto textos como palavras são representados por trajetórias. 2.2.4.2. Método 2. Neste Método 2 – à semelhança do que sucede com o Método 5, mencionado em Landauer, Foltz, e Laham (1998) – apenas se usam os textos dos estudantes e o texto da resposta do professor à questão posta. A ideia básica é modelar a preferência do professor pela resposta do estudante usando como critério o cosseno do ângulo entre a resposta do estudante e a resposta do professor: quanto maior esse cosseno (menor o ângulo) maior a “consonância” / preferência entre a resposta do estudante e a resposta do professor. Como variante deste método também se pode medir a distância da resposta estudante-professor e usar essa distância como critério de preferência do professor pela resposta do estudante. Considera-se que este método pode ter interesse para apoiar o professor nos processos de avaliação formativa, objetivando comparações entre textos, estudante/professor. O que faz com que este método possa, eventualmente, ser usado na monitorização da absorção de conhecimentos transmitidos pelo professor em aulas presenciais mas não em avaliação global que tem carácter absoluto por pretender comparar os conhecimentos do estudante com um referencial absoluto (o espaço semântico formado a partir dos textos de ensino). A vantagem consiste em poder ser facilmente operacionalizável, uma vez que exige como únicos inputs peças de informação obrigatoriamente presentes as respostas dos 78 estudantes e a resposta do professor às questões que ele próprio formulou, não implicando a classificação prévia de parte dos textos. Posto isto, o método de classificação consiste nos passos seguintes: Método 2. 1. Construir um espaço semântico (só de estudantes) usando a matriz X que é a representação vetorial das palavras e textos dos estudantes. 2. Sobre o espaço semântico obtido em 1 posicionar a resposta do professor, ou os textos de resposta do professor ou vários professores, usando a metodologia definida em Bellegarda (2007). 3. Obter os cossenos dos ângulos entre os textos dos professores e os textos de cada uma das respostas dos estudantes e calcular a nota do texto a classificar em função destes valores. A ideia subjacente é a de que, quanto menor o ângulo entre o texto de uma estudante e o texto do professor, maior a preferência do professor pelo texto do estudante. 4. Ordenar estas classificações. Na figura 2.2.4.2.1. está explicada a interpretação geométrica deste método. Ver também figura 3.7.5., no Capítulo III. 79 Figura 2.2.4.2.1. Os textos dos estudantes são representados pelos vetores (marcadores) t1, t2, …, t10. O texto da resposta do professor está representado pelo vetor Tp. A classificação do estudante t5 é função do cosseno do ângulo entre esse texto e o vetor Tp. 2.3. Estruturação da Amostra. A principal questão de inferência subjacente a este estudo tem a ver com a questão da validade do uso dos métodos de classificação automática. Seguindo a literatura sobre o tema (Landauer, Foltz, & Laham, 1998, 2003; Landauer, et al., 2007; Islam & Hoque, 2010; Yang, Buckendahl, Juszkiewicz, & Bhola, 2012) como se viu na Introdução, a generalidade dos autores sugere como critério de validade dos métodos de avaliação automática de conhecimentos baseados em testes de resposta aberta o coeficiente de correlação entre as classificações atribuídas por professores e as classificações atribuídas pelos sistemas automáticos de classificação. Também se relaciona esse coeficiente de correlação R (sys, Prof) com o coeficiente de correlação entre as classificações atribuídas por professores diferentes R (Prof, Prof). Para que um sistema seja considerado aceitável o coeficiente de correlação R (sys, Prof) deve ser elevado e significativamente diferente de zero; além disso, R (sys, Prof) deve ser da ordem de grandeza ou superior a R(Prof, Prof). 80 Isto significa que ao estruturar a amostra, o fator anterior (validade) e portanto a significância do coeficiente de correlação deve ser a principal consideração em causa; mais do que generalizar a toda a população alvo (neste caso, estudantes que usem a língua portuguesa como instrumento de aprendizagem da matéria a avaliar), a principal preocupação é garantir que os coeficientes de correlação obtidos são significativos e o mais elevado que for possível. Tendo em conta as considerações anteriores e os recursos com que esta investigação contou – apenas os recursos do investigador – foi considerado que uma amostra de cerca de 600 respostas a questões abertas constantes dos exames nacionais de Português de três escolas escolhidas ao acaso poderiam gerar a evidência suficiente para a maior parte dos estudos a realizar. Para os testes em apreço teriam de ser obtidos os enunciados dos exames, os critérios de classificação dos testes, as respostas dos estudantes a cada uma das alíneas de resposta aberta e classificações atribuídas pelos professores contratados para avaliarem as respostas e ainda os manuais de ensino usados no estudo dos estudantes para se prepararem para esses exames específicos. Além deste dados deveriam ainda essas respostas serem avaliadas por outros professores – contratados agora pelo investigador – usando os mesmos critérios e critérios de avaliação holística – por forma a conhecer em que medida o critério de avaliação (holístico versus critério clássico) e o professor influenciavam os resultados. 2.4. Plano de Recolha de Dados. Tendo em conta as limitações já referidas em 2.3. e tendo ainda em conta que a principal questão de inferência (generalização) a partir dos dados se prende com a significância do coeficiente de correlação entre os resultados de uma classificação automática e as classificações a atribuir aos mesmos testes por professores humanos, o plano estabelecido foi o seguinte: 1. Escolher ao calhas três escolas secundárias a que a autorização do Ministério da Educação nos permitiu aceder e registar, em suporte magnético, os textos manuscritos dos testes disponíveis nessas escolas, garantindo pelo menos 600 respostas a questões de resposta aberta. Os dados assim obtidos são designados no 81 que se segue por EXMIN e incluem não só as respostas dos estudantes como os textos usados por esses estudantes no ano letivo a que se reportam esses exames. 2. Transcrição dos textos manuscritos em papel para um suporte magnético garantindo a não utilização do corretor ortográfico, por forma a que o texto a estudar pelo software a desenvolver corresponda ao que foi produzido pelos estudantes, sendo o mesmo com que os professores a contratar para realizar as correções têm de lidar. Terminada a transcrição, os textos gerados pelo processador de texto – em geral o WORD da Microsoft – são carregados, usando o software a desenvolver no âmbito do projeto, na BDT – ver figura 2.2.1.1. – ficando disponíveis para os testes do software e para estudos de validação. 3. Nessa BDT são carregados não só os textos das respostas dos estudantes como os textos dos manuais usados no ensino dos estudantes cujas respostas são usadas no estudo. 4. Além dos textos, é carregada na BDT informação auxiliar que permita identificar os textos, seu autor e o contexto em que as respostas foram produzidas, de modo a permitir relacionar os resultados e das análises dos textos com outras variáveis. Desta informação auxiliar fazem parte as classificações atribuídas às respostas pelos professores contratados pelo Ministério da Educação e também as classificações atribuídas a essas mesmas respostas por professores a contratar pelo investigador para o mesmo efeito. 5. Por contacto pessoal junto de um professor de gestão de um instituto politécnico foi possível aceder às respostas manuscritas – no contexto de uma avaliação formativa – de cerca de duzentos estudantes na resposta a uma questão relativa ao conceito de Qualidade Total, bem como ao texto usado no estudo dessa matéria. Esses dados, de carácter puramente observacional, são também carregados na BDT, servindo essencialmente para verificar os aspetos operacionais do programa a implementar na concretização do sistema descrito em 3.2. No que se segue, estes dados são designados por GESTÃO. 6. Por contacto pessoal junto do orientador desta tese foi também possível aceder aos textos das respostas de 17 estudantes do ensino superior relativas aos fatores de disciplina / indisciplina em sala de aula. 82 Trata-se também de dados observacionais úteis para validar certos aspetos funcionais do sistema a implementar. Estes dados são também carregados na BDT e serão designados no que se segue por DISCIPLINA. Em síntese, à exceção dos dados EXMIN, que permitem, em princípio, aplicar inferência estatística ao coeficiente de correlação (sys, Prof), todos os dados restantes têm carácter observacional que, se bem que não permitam justificar teoricamente generalizações para lá dos dados, permitem contudo sujeitar o programa a implementar a uma gama variada de situações que permitam testar o seu funcionamento e ilustrar a respetiva funcionalidade em condições reais. 2.5. Metodologia Estatística de Tratamento de Dados. Recolhidos e registados esses dados numa Base de Dados Textual (BDT) as metodologias a usar para o seu tratamento estatístico são as seguintes: 1. Estatística descritiva univariada das principais variáveis, a saber: Distribuição da amostra por disciplina, classificação do professor, comprimento do texto, disciplina, curso. Distribuição dos resultados obtidos nos testes classificados por professores ao nível de cada uma das questões de resposta aberta. Distribuição das classificações atribuídas pelos professores contratados para reapreciarem as provas previamente classificadas ao nível das questões de respostas abertas. 2. Estudos bivariados: Relacionar, usando tabelas de contingência, coeficientes de correlação ou gráficos de dispersão e os resultados obtidos pelo sistema com as classificações atribuídas por professores diferentes, calculando a significância dos coeficientes de correlação. 3. Utilização dos biplots de Galindo para expressar graficamente os Espaços Semânticos usados no estudo das diversas metodologias de classificação e para estudar as relações entre textos e palavras usadas na representação vetorial dos textos. Face à elevada dimensionalidade dos espaços de representação (sempre 83 superior a 3 o que torna impossível a visualização completa da informação) estes biplots são usados como auxiliares da intuição geométrica tanto na compreensão dos métodos como na interpretação dos resultados. 4. Utilização de métodos de análise classificatória (análise de “clusters”) usando as coordenadas dos textos resultantes da decomposição SVD para detetar agrupamentos homogéneos de textos de resposta dos estudantes e que traduzam resultados das comparações desses textos dois a dois. 84 Capítulo III: Recolha e Análise de Dados. 3.1. Introdução. Como se viu no Capítulo I – Metodologia – este estudo pode ser classificado como um estudo fundamentalmente observacional destinado a recolher evidências acerca da possibilidade de usar técnicas de análise estatística de textos em tarefas de ensino – aprendizagem num contexto escolar. Não sendo um estudo experimental em que o investigador tem total controlo sobre as condições de observação (quando, quem, como e em que condições) procurou-se, isso sim, obter dados reais característicos dos ambientes – alvo das metodologias eventualmente saídas deste estudo – dando cumprimento às indicações em 2.3. Foi, pois, decidido que seriam obtidos textos de resposta de estudantes portugueses do 12º ano a questões abertas integrantes dos exames nacionais de algumas disciplinas – como Filosofia, Português, História – em que os conhecimentos adquiridos são expressos em português. Inicialmente foi também equacionada a possibilidade de utilização de textos de resposta a questões abertas constantes de plataformas eletrónicas de ensino. A grande vantagem dessa abordagem seria o facto de os textos produzidos pelos estudantes e professores se encontrarem já digitalizados, reduzindo enormemente o esforço financeiro da investigação, o tempo necessário à preparação dos dados e aumentando a dimensão da amostra. Infelizmente, insuspeitadas dificuldades relacionadas com a legislação sobre privacidade e outras, levaram-nos a abandonar essa hipótese. Concentrámo-nos, pois, na possibilidade de obter textos produzidos por estudantes do ensino secundário ao responderem às provas dos exames oficiais de um ano suficientemente afastado da atualidade para reduzir as reticências ao respetivo acesso. Obtida uma carta de apresentação do Ministério de Educação, escolheram-se três escolas ao acaso e obteve-se o acesso a fotocópias de n= 200 respostas a dois grupos de questões constantes dos exames nacionais de Português, História, Filosofia, entre outras, de 2008 dos estudantes das escolas em causa – num total de cerca de 600 textos gerados 85 pelas respostas dos estudantes (ver em 3.5. a caracterização das amostras) – no que se segue designados por dados EXMIN. Também se obtiveram os dados observacionais das duas outras fontes citadas em 2.3.: dados de resposta a uma questão de gestão de uma turma de um curso de Gestão num instituto politécnico (dados GESTÃO) em resposta a uma questão de qualidade e ainda as respostas de 17 estudantes de um curso superior relativas aos fatores de indisciplina na sala de aula (DISCIPLINA). No site do Ministério de Educação (GAVE) http://bi.gave.min-edu.pt/exames/ exames/eSecundario/524/?listProvas (2008 | 2ª fase) pode consultar-se o enunciado desse exame, bem como as cotações da prova. Os itens com resposta aberta eram os relativos ao Grupo I partes A e B e Grupo III com cotações, respetivamente, Grupo I A – 70 pontos Grupo I B – 30 pontos Grupo III – 50 pontos. A cotação total do teste – abrangendo também questões de resposta múltipla e associação era de 200 pontos. No número 3.5. pode ver-se um resumo estatístico da amostra de textos obtida. Para lá dos textos das respostas dos estudantes aos exames finais do Ministério de Educação, registaram-se ainda os resultados atribuídos por professores contratados pelo Ministério da Educação para classificar os testes. Desde já se observa que o tipo de classificação especificada pelo Ministério da Educação nas regras de cotação, entra com fatores como a organização, a correção linguística, a estruturação temática e está relativamente afastada do tipo de observação holística que se recomenda para este tipo de metodologia (Landauer, Foltz, & Laham, 2003). Integravam também este conjunto de dados a analisar os textos dos manuais de ensino, nomeadamente, textos de guias de ensino e interpretação dos textos literários envolvidos nos exames: os Lusíadas de Luís Vaz de Camões, o Memorial do Convento de José Saramago, poesia de Fernando Pessoa. Usou-se para esta tarefa os manuais bastante difundidos entre os estudantes do ano letivo em causa. 86 Além destes elementos de informação, considerou-se ainda necessário pedir a colaboração de uma Professora de Português do Ensino Secundário, a quem foi pedido que classificasse 60 textos de Português usando um critério holístico, mais consentâneo com o recomendado para este tipo de estudos. No número 3.9.6. é apresentado um estudo comparativo das classificações atribuídas pelos professores do Ministério da Educação e pela Professora por nós contratada. 3.2. Recolha e Registo de Dados. Sendo certo que todos os dados – pelas razões referidas – estavam em suporte de papel e eram constituídos – com exceção dos textos dos manuais de ensino – por textos manuscritos, a sua preparação para registo e posterior gravação em suporte digital revelouse uma tarefa extremamente morosa e cara, uma vez que implicou a transcrição a partir dos textos fotocopiados e a posterior verificação para garantir uma fiabilidade total na transcrição, tendo sido necessário montar durante meses um pequeno serviço de apoio. Foi decidido não aplicar o corretor ortográfico nem corrigir erros gramaticais, por mais evidentes que fossem; procurou-se, isso sim, garantir que o texto a analisar fosse idêntico ao texto produzido pelo autor. Inicialmente, por uma questão de facilidade e rapidez da tarefa de transcrição, foram produzidos ficheiros de texto usando um processador de texto. Numa segunda fase, os textos produzidos pelo processador de texto foram carregados, juntamente com os elementos de informação adicionais, numa base de dados desenvolvida para este projeto. Veja número seguinte. Na figura 3.2.1. apresenta-se um exemplar desse tipo de ficheiro de texto. 87 Figura 3.2.1. Texto relativo ao estudante identificado pelo número convencional 0385, relativo ao Exame da Português do 12º ano, Curso Científico-Humanísticos, depois de transcritos a partir do original manuscrito. 3.3. Estrutura da Base de Dados Textual (BDT). Uma vez transcritos e verificados os textos das respostas para suporte digital, esses dados foram seguidamente carregados numa base de dados textual (BDT) de acordo com o especificado na figura 2.2.1.2. Essa base de dados foi desenvolvida tendo em conta apenas as necessidades desta investigação, do desenvolvimento de um protótipo com funcionalidade pensada e 88 otimizada para permitir a realização das experiências necessárias ao estudo. A criação de um sistema para uso operacional exige desenvolvimentos específicos aqui não abordados. A tabela principal em que foi armazenada a informação da amostra tem a estrutura caracterizada pelos seguintes campos (ver manual do PAET, em Anexo A): IDTEXTO – Número sequencial identificador do texto. TEMA – Indica a que tema se refere o texto (Português, Filosofia, História, etc.) TITULO – Nome do exame a que se referia ou título do manual. AUTOR – Número convencional do respondente (estudante que fez o exame ou autor do manual). DATA – Data do exame ou data da edição do manual. TIPTEXT – Tipo de texto A – Reposta do Estudante P – Texto produzido por um Professor AP – Manual de Aprendizagem PARTE – Grupo I, Grupo II, etc. SPARTE – Subparte – A, B, C, etc. TEXTO – Texto do estudante, do professor ou do manual. CLASPROF – Classificação do professor (quando conhecida). A BDT foi desenvolvida em Microsoft ACESS 2003, tendo-se usado campos do tipo MEMO para armazenar os textos completos das respostas dos estudantes e textos de ensino. Com esta estrutura é possível guardar na mesma tabela as respostas dos estudantes, os textos produzidos pelos professores para fins didáticos, as respostas dos professores às questões colocadas, os manuais de ensino e, inclusivamente, textos dos escritores e outros autores, quando disponíveis. 89 Dado o volume de informação e a sua variedade, considerou-se útil separar, em tabelas diferentes embora com a mesma estrutura, a informação relativa às respostas dos estudantes, dos manuais, e dos textos produzidos pelos professores. Na figura 3.3.1. apresenta-se o ecrã principal de consulta e registo de dados do programa protótipo desenvolvido para apoio da investigação. Ver em Anexo A o manual de utilização. Figura 3.3.1. Consulta de um texto de resposta de um estudante. No lado esquerdo os elementos que permitem identificar o texto. Do lado direito o texto. Além desta tabela constante na BDT, foi também criada a seguinte tabela – veja figura 3.3.2. – relativa às palavras a excluir (palavras funcionais) ao extrair as palavras dos textos. Figura 3.3.2. Palavras funcionais, separadores e outros símbolos a excluir da análise. 90 Na figura 3.3.3. apresenta-se um exemplo com algumas dessas palavras funcionais, separadores e outros símbolos a excluir da análise lexicográfica. Figura 3.3.3. Exemplo de palavras funcionais, separadores e outros símbolos. No apoio à execução destas tarefas considera-se muito útil a informação do site http://www.iltec.pt/ do ILTEC – Instituto de Linguística Teórica e Computacional (consultado em 4 Dez 2012), bem como o site http://www.portaldalinguaportuguesa.org/ (Portal da Língua Portuguesa). Estes dois sites do ILTEC oferecem recursos – nomeadamente artigos científicos – de grande interesse para apoio de investigação futura nesta área. 3.4. Criação de Instrumentos de Análise Estatística de Textos. Embora exista software de uso geral que permite realizar algumas das tarefas implícitas no esquema das figuras 2.2.1.1. e 2.2.1.2. relativas ao modelo a implementar, o facto é que desde logo se considerou necessário desenvolver software integrado que 91 permitisse realizar, em ambiente interativo, com comodidade, as tarefas de análise textual seguintes: 1 – Gestor da base de dados BDT. 2 – Toquenizador. Programa que permite, dado um texto, identificar todas as sequências de caracteres separadas por espaços em branco (ou outros símbolos separadores). 3 – Lematizador. Programa que permite extrair a raiz comum de um conjunto de palavras. 4 – Programa para construção da representação vetorial dos textos. Programa que permite transformar um texto numa matriz de contingência contendo no cruzamento de uma linha correspondente a uma palavra (ou forma) com uma coluna correspondente a um texto, a frequência com que essa palavra ocorre nesse texto. 5 – Programa de decomposição SVD – Singular Value Decomposition. Programa que decompõem uma matriz X contendo a representação vetorial de um texto ou conjunto de textos num produto de três matrizes UVT em que U e V são matrizes contendo nas suas linhas – respetivamente – representações vetoriais, de dimensão reduzida, das palavras e dos textos e uma matriz quadrada, diagonal, contendo os valores singulares da decomposição, por ordem decrescente. 6 – Programa para construção do Espaço Semântico - ES. Programa que usando os resultados da decomposição SVD gera uma matriz cujas linhas são marcadores das palavras e dos textos num espaço comum de baixa dimensão. Ver Capítulo I – Metodologia. Os marcadores usados neste trabalho correspondem ao biplot de Galindo (Galindo, 1985) e têm a expressão U para as palavras (isto é, cada palavra retida para análise (Wi, i= 1…n) é representada pelo marcador bi= ui , i= 1…n, em que U e resultam da SVD e em que os textos são representados pelas linhas de V, sendo cada texto representado pelo marcador bj= vj , i= 1…p. 92 Tanto aj como bj são representados por vetores de um espaço de baixa dimensão r, sendo r= característica de X min (n, p) em que n é o número de palavras identificadas e retidas depois das operações de toquenização e lematização e p o número de textos. 7 – Programa de Biplots. Programa para realizar a representação gráfica dos espaços semânticos tanto em coordenadas retangulares (cartesianas) como paralelas. Com exceção dos programas de lematização e SVD, todo o restante software teve de ser desenvolvido de raiz ou adaptado no âmbito do projeto. O programa SVD resultou de uma adaptação às necessidades deste trabalho de um programa de Sergey Bochkanov (projeto ALGLIB®). Ver http://www.alglib.net (consultado em 01 de Julho de 2010) Quanto ao programa de lematização foi usado o lematizador “universal” de Porter. Ver http://tartarus.org/~martin/PorterStemmer/ (consultado em 20 de Novembro de 2010) Na implementação do programa foram ainda usados alguns procedimentos da biblioteca Software Development Lohninger (SDL) que pode ser consultado em http://www.lohninger.com/ (consultado em 01 de Julho de 2011). A preocupação neste projeto foi a de criar um laboratório experimental que permitisse testar algumas ideias relativas ao uso da análise estatística de testes usando textos de resposta a questões abertas, não tendo havido grandes preocupações de otimização. Em particular, considera-se importante, em futuros trabalhos, desenvolver uma lematização mais adequada aos problemas do português. 3.5. Resumo Estatístico das Amostras. 3.5.1. Dados EX-MIN – Exames do Ministério. Recorde-se que se trata de respostas ao exame de Português de 2008 (2ª Época) e que este exame comportava três grupos dos quais o Grupo I abrangia duas questões (A e B) relativas ao Memorial do Convento de José Saramago e um Grupo III também com uma questão de resposta aberta relativa a outros autores. Ver um exemplar no site do Ministério de Educação (GAVE) http://bi.gave.min-edu.pt/exames/exames/eSecundario/524/ 93 ?listProvas (2008 | 2ª fase). A cotação total do teste era de 200 pontos dos quais 70 afetados ao Grupo I A), 30 relativos ao Grupo I B) e 50 pontos relativos ao Grupo III. No que se segue, o significado das variáveis usadas nos quadros e gráficos é o seguinte: Variante – É a variante do enunciado do exame de português, conforme a origem dos estudantes. Alínea – A) ou B) do Grupo I. Grupo – Grupos G1, G2, G3. ClassProf – Classificação atribuída pelo professor contratado pelo Ministério. NCaract – Número de caracteres do texto da resposta do estudante. Considerando a totalidade da amostra, a respetiva estrutura consta da tabela 3.5.1.1. GRUPO A) B) Total G1 --- 183 180 363 G2 198 --- --- 198 Total 198 183 180 561 Tabela 3.5.1.1. Distribuição da amostra. Dispõe-se, assim, de um total de 561 textos distribuídos por três agrupamentos praticamente da mesma dimensão. Considerando agora apenas os textos da resposta ao grupo G1, alínea A), a tabela 3.5.1.2. resume os valores das classificações do professor e do número de palavras no texto para os textos de resposta à A). Nº Textos Mínimos Máximo Média DP ClassProf 183 0 70 34.47 183 NCaract 183 25 4603 1767.38 699.7 Tabela 3.5.1.2. Resumo das classificações do professor e do comprimentos dos textos de resposta à A). 94 As tabelas 3.5.1.3. e 3.5.1.4. apresentam os valores correspondentes para B) e para o grupo G3. Nº Textos Mínimos Máximo Média DP ClassProf 180 0 30 14.39 8.3 NCaract 180 19 1404 712.78 166.5 Tabela 3.5.1.3. Resumo das classificações do professor e do comprimentos dos textos de resposta à B). Nº Textos Mínimos Máximo Média DP ClassProf 198 0 48 25.7 11.2 NCaract 199 119 2795 1445.0 357.9 Tabela 3.5.1.4. Resumo das classificações do professor e do comprimento dos textos de resposta ao Grupo III. A distribuição das variáveis ClassProf e NPalTexto nesses três agrupamentos aparecem, respetivamente, nas figuras 3.5.1.1. a 3.5.1.6. 95 Figura 3.5.1.1. Distribuição das classificações do professor na A). Figura 3.5.1.2. Distribuição das classificações nos textos de resposta à B). 96 Figura 3.5.1.3. Distribuição das classificações do professor nos textos de resposta ao G3. Figura 3.5.1.4. Distribuição do número de palavras no texto para as respostas à A). 97 Figura 3.5.1.5. Distribuição do número de palavras no texto para as respostas à B). Figura 3.5.1.6. Distribuição das classificações do professor nos textos de resposta ao G3. 98 A fim de detetar alguma eventual relação ou influência entre as classificações atribuídas pelos professores e o comprimento do texto expresso pelo número de caracteres, número dos textos, seguidamente apresenta-se, para as respostas a cada alínea (A, B) do Grupo I e para o Grupo II, a correlação entre ClassProf e NCaract, bem como gráficos de dispersão, que mostram que no caso A) e Grupo III há efetivamente uma relação significativa entre o resultado da classificação e o comprimento da resposta. Isto deve querer dizer, simplesmente, que os estudantes que têm maior conhecimento da matéria tendem a escrever mais do que os outros. Para as respostas à A), obteve-se: Correlação (ClasProf, NCaract) = 0.464 (Significativo) (Significância = 0.000) Para as respostas à B), obteve-se: Correlação (ClasProf, NCaract) = 0.115 (Não Significativo) (Significância = 0.124) Para as respostas ao Grupo III, obteve-se: Correlação (ClasProf, NCaract) = 0.377 (Significativo) (Significância = 0.009) As figuras 3.5.1.7., 3.5.1.8. e 3.5.1.9. apresentam os gráficos de dispersão das variáveis (ClassProf, NPalTexto). 99 Figura 3.5.1.7. Gráfico de dispersão ClassProf, NPalTexto para A). Deteta-se uma certa tendência crescente. Figura 3.5.1.8. Gráfico de dispersão ClassProf, NPalTexto para B). Não há relação percetível. 100 Figura 3.5.1.9. Gráfico de dispersão ClassProf, NPalTexto para o Grupo III. Tendência crescente. 3.5.2. Dados GESTÃO. Estes dados correspondem a respostas de estudantes universitários da cadeira Gestão de um Instituto Politécnico em que era pedida a caracterização do conceito de Qualidade Total sendo o número total de respostas disponíveis (número de textos válidos)= 187. A tabela 3.5.2.1. resume as variáveis Classificação do Professor e Número de palavras no texto (comprimento). Nº Textos Mínimos Máximo Média DP ClassProf 187 0 100 42.8 22 NCaract 217 0 2059 584 391 Tabela 3.5.2.1. Caracterização das variáveis classificação do professor e número de palavras dos textos de resposta. As figuras 3.5.2.1. e 3.5.2.2. apresentam os histogramas das variáveis ClassProf e NPalTexto. 101 Figura 3.5.2.1. Histograma da classificações dos professores. Figura 3.5.2.2. Histograma dos comprimentos dos textos em número de caracteres. 102 Para estes dados a correlação – significativa – entre as classificações do professor e o número de palavras nos textos (comprimento) é 0.549 (significância= 0.000). Na figura 3.5.2.3. está o gráfico de dispersão respetivo. Figura 3.5.2.3. Gráfico de dispersão das classificações do professor em função do número de caracteres dos textos. Tendência crescente. Fazem-se aqui as mesmas considerações feitas a propósito dos dados EX-MIN. Possivelmente, os estudantes que mais sabem suster a necessidade de escrever mais e, fazem-no. 3.5.3. Dados DISCIPLINA. Trata-se de 17 textos – não classificados pelo professor – cujo histograma relativo ao número de palavras se apresenta na figura 3.5.3.1. 103 Figura 3.5.3.1. Histograma da distribuição do número de caracteres do texto (comprimento). Verifica-se que o número médio de caracteres oscila entre 505 e 2415, sendo a média 1365 (DP= 609). 3.6. Comparação de Textos. Análise Descritiva. Do ponto de vista do apoio aos professores no exercício das respetivas atividades letivas – nomeadamente no desempenho de tarefas ligadas à avaliação contínua baseada em respostas a questões abertas – têm muita importância as tarefas de comparação dos textos produzidos pelos estudantes, Por exemplo, a comparação dos textos produzidos por dois estudantes ao responderem à mesma questão ou a comparação de dois textos produzidos pelo mesmo estudante em instantes diferentes. A primeira situação surge frequentemente quando se pretende classificar respostas a testes de avaliação formativa. A segunda questão quando se pretende avaliar objetivamente a evolução de um indivíduo ou conjunto de indivíduos. Existirão diferenças no vocabulário usado pelos dois estudantes? Em que consistem essas diferenças e são elas relevantes para comparar os conhecimentos e comportamentos dos mesmos? Existe alguma evolução na linguagem usada pelo mesmo estudante ou por uma certa turma? Em que consiste essa evolução? 104 No que se segue, apresentam-se exemplos que documentam o uso dos instrumentos de análise de textos desenvolvidos e integrados no programa designado coletivamente por PAET (Programa de Avaliação Estatística de Textos). Ver o Anexo A o respetivo manual. Neste número ilustra-se a sua utilização na comparação de textos. No exemplo a seguir analisado usam-se, a título ilustrativo, dois textos de resposta a uma questão relativa ao conceito de qualidade total dos estudantes de um curso de gestão – dados GESTÃO. Ver descrição dos dados em 3.2. (Recolha e Registo de Dados). Como se viu, o número de respostas à questão colocada é cerca de 200. A comparação destes textos dois a dois implicaria realizar 200150= 30.000 comparações. Se cada comparação implicasse 0.5 minuto (muito pouco tempo) isso significaria cerca de 11 dias (24 horas) de trabalho contínuo. Na prática, os professores leem um teste de cada vez e procuram – socorrendo-se da memória, da capacidade de raciocínio e da experiência – ser coerentes ao atribuir uma classificação com base nessa leitura e nas leituras das respostas já realizadas – sendo quase inevitável um processo de aprendizagem do professor que leva a que os últimos testes estejam a ser classificados com critérios “ligeiramente” diferentes dos iniciais. Acredita-se que um professor competente e sério é inultrapassável na capacidade de realizar estas comparações tendo em conta toda a informação relevante de que dispõe (as respostas, os conhecimentos, a experiência, o conhecimento dos estudantes e do contexto de ensino) levando em conta questões inacessíveis a sistemas automáticos (qualidade da linguagem, estilo, etc.). Contudo, limitações bem conhecidas da Psicologia – impossibilidade prática de raciocinar sem erro quando o número de conceitos na memória de trabalho excede um certo limiar (cerca de 7) bem como a limitação da própria capacidade dessa mesma memória de trabalho. No exemplo que a seguir se expõe para ilustrar estas questões apresenta-se também como os instrumentos desenvolvidos em apoio desta tese (ver programa PAET – programa de Análise Estatística de Textos, em Anexo) permitem realizar eficazmente este tipo de comparações, usando recursos ao alcance da generalidade dos professores. Na figura 3.6.1. apresentam-se os dois textos das respostas de dois estudantes do curso de Gestão a que nos referimos em 3.2. a propósito dos dados. 105 Pedia-se aos estudantes, no contexto de uma avaliação formativa que, sem apoio de qualquer documento de consulta, caracterizassem o conceito de gestão baseada na Qualidade Total apresentada nas aulas. Resposta do Estudante nº. 1 F A gestão pela qualidade total é uma gestão que dá muita importância á qualidade, i esta pesa muito mais que a quantidade. É a sua principal preocupação. g Esta gestão aposta na exclusividade e na diferenciação, fazendo u seus dois valores. vender estes r a Resposta do Estudante nº. 2 4 . A gestão pela qualidade total é a de certa forma a gestão apropriada para que o produto final exceda as expectativas e a qualidade. De acordo com a cadeia reativa de Demming a relação positiva entre a qualidade e a rentabilidade, onde indica que para haver rentabilidade tem que existir 5 também qualidade. Figura 3.6.1. Textos das respostas de dois estudantes à questão da caracterização do conceito de qualidade total. Usando a funcionalidade do programa PAET (ver Anexo A o respetivo manual de utilização), na tabela 3.6.1. são apresentadas as listas de palavras e respetivas frequências de ocorrência em cada um dos textos (já depois de eliminados os símbolos de pontuação, artigos e demais palavras funcionais) depois de eliminados os símbolos de pontuação, artigos e demais palavras funcionais que constem de uma tabela semelhante à da figura 3.3.3. 106 NºEstudante 134 129 129 129 134 129 134 134 134 129 134 134 134 134 129 129 134 129 134 129 134 134 129 134 134 134 134 129 134 129 134 129 134 129 129 134 129 134 129 129 134 129 129 129 134 134 Palavra qualidade gestão esta muito para qualidade rentabilidad gestão acordo aposta apropriada cadeia certa demming diferencia dois entre estes exceda exclusividad existir expectativa fazendo final forma haver indica mais onde pela pela pesa positiva preocupa principal produto quantidade reativa seus total total valores vender importância relação também Frequência 4 3 2 2 2 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Tabela 3.6.1. Frequências de ocorrência das palavras nos textos das duas respostas constantes da figura 3.6.1. Observe-se que a mera realização desta operação envolvendo apenas dois pequenos textos é tão demorada que está fora de questão realizá-la “à mão” de modo sistemático. Da consulta da tabela 3.6.1. constata-se que as palavras mais usadas são “qualidade” (quatro vezes pelo estudante 134 e duas vezes pelo estudante 129). 107 Observa-se, pois, que o número de palavras dos dois textos é praticamente o mesmo (26 palavras para a resposta do estudante 129 e 34 para a resposta do estudante 134). Lendo os textos, constata-se que as respostas são bastante semelhantes notando-se, embora, na resposta 129, eventualmente, uma maior capacidade de síntese. Observando a tabela da tabela 3.6.1., é reforçada a ideia (em princípio) de que as respostas são “bastante semelhantes”. Contudo, a comparação pode ser melhorada colocando as frequências das palavras usadas nos textos ao lado umas das outras e tentando ver se há coincidências e diferenças – mais uma operação que é praticamente impossível de realizar na prática por ser extremamente demorada. Ver tabela 3.6.2. Nas colunas t_129 e t_143 estão as frequências de ocorrência, nesses textos da totalidade das palavras usadas no conjunto de todos os textos observados. Por exemplo, para a palavra (com identificador w6) “demming” vê-se que essa palavra ocorre no texto do estudante 143 mas não ocorre no texto do estudante 129; a palavra de identificador “gestão” ocorre três vezes no texto do estudante 129 e duas no texto do estudante 143. O grau de intensidade com que as palavras são usadas nos textos (frequências absolutas) traduz certamente “algo” da importância ou adesão dos seus autores ao conceito que essa palavra simboliza. Mas como “valorar” estas frequências do ponto de vista da atribuição de uma “nota” ao estudante que represente fielmente o seu nível de conhecimento acerca do conceito examinado? A fim de melhorar a comparação, o software desenvolvido apresenta ainda (colunas T129_Usa e T143_Usa da tabela 3.6.2.) por cada palavra, “0”, quanto ela não ocorre e “1” quando ocorre – o que permite “esquecer” a frequência para apenas nos concentrarmos no uso ou não da palavra. Somando estas colunas vê-se facilmente que o número de palavras diferentes ou distintas usadas pelos dois respondentes é muito semelhante (21 e 25 respetivamente) havendo apenas quatro coincidências (palavras: “gestão”, “pela”, “qualidade”, “total”) das quais apenas três (gestão, qualidade, total) são relevantes do ponto de vista do tema. Mais uma vez se reforça, com esta análise, por um lado a impossibilidade prática da sua realização manual e por outro lado a perceção, neste caso, de que as duas respostas são “bastante semelhantes”. 108 SbGraf w1 w2 w3 w4 w5 w6 w7 w8 w9 w10 w11 w12 w13 w14 w15 w16 w17 w18 w19 w20 w21 w22 w23 w24 w25 w26 w27 w28 w29 w30 w31 w32 w33 w34 w35 w36 w37 w38 w39 w40 w41 w42 Palavra acordo aposta apropriada cadeia certa demming diferencia dois entre esta estes exceda exclusividad existir expectativa fazendo final forma gestão haver importância indica mais muito onde para pela pesa positiva preocupa principal produto qualidade quantidade reativa relação rentabilidad seus também total valores vender Total t_129 t_143 0 1 0 0 0 0 1 1 0 2 1 0 1 0 0 1 0 0 3 0 1 0 1 2 0 0 1 1 0 1 1 0 2 1 0 0 0 1 0 1 1 1 1 0 1 1 1 1 0 0 1 0 0 1 0 1 1 0 1 1 2 1 0 1 0 0 1 2 1 0 1 0 0 1 4 0 1 1 2 0 1 1 0 0 26 31 T129_Usa t143_Usa 0 1 1 0 0 1 0 1 0 1 0 1 1 0 1 0 0 1 1 0 1 0 0 1 1 0 0 1 0 1 1 0 0 1 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 1 0 1 1 1 1 0 0 1 1 0 1 0 0 1 1 1 1 0 0 1 0 1 0 1 1 0 0 1 1 1 1 0 1 0 21 25 0 Comuns 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 4 Tabela 3.6.2. As palavras dos textos das respostas dos estudantes 129 e 143 dispostas de forma a facilitar as comparações. Isto significaria que as duas respostas deveriam ou ter “notas” semelhantes ou mesmo iguais. 109 Verificou-se, contudo, que a “nota” atribuída ao texto do estudante 129 foi 50% (numa escala de 0 a 100) e que a “nota” atribuída ao texto do estudante 143 foi 25% na mesma escala. Usando o programa PAET já atrás, referido, as 30.000 comparações e resumos estatísticos relativos às 200 respostas levam cerca de 10 segundos. Isto é, não só se torna possível realizar essas tarefas como elas são realizadas com um critério invariável e com elevada fiabilidade – tornando admissíveis a multiplicação dos testes com questões em que o estudante elabora a resposta e por esse mesmo facto a transformação de uma avaliação num ato formativo. 3.7. Comparação de Textos usando Biplots. No contexto das avaliações surge muitas vezes a necessidade de comparar os textos de resposta dos estudantes a uma questão específica. Contudo, por falta de tempo, só muito esporadicamente se realizam essas comparações. Mais precisamente, pode interessar, antes de atribuir uma classificação, agrupar os estudantes do ponto de vista da resposta dada a uma certa questão. Feita a classificação, pode interessar ver se as atribuições de “notas” resultantes do processo habitual são coerentes com os grupos naturais de textos de resposta a essa questão específica. De resto, a criação de grupos de textos com respostas consideradas semelhantes pode permitir ao professor – independentemente do critério de classificação que venha a seguir – organizar melhor o seu trabalho antes da leitura que procede a atribuição da classificação. Para ilustrar as ideias aqui expressas considere-se as seguintes 10 respostas à A) do Grupo I dos dados EXMIN atrás considerados. Esses 10 textos – implicitamente os 10 estudantes que os produziram – têm os identificadores a seguir indicados C= {11, 14, 17, 20, 23, 26, 29, 32, 35, 38}. Isto é, desejamos comparar os 10 estudantes atrás indicados do ponto de vista das respostas dadas – dos textos que produziram – à alínea A) do exame de Português. Usando o programa elaborado para apoio desta tese (PAET – ver manual em Anexo A) um biplot construído com base nesses 10 textos aparece na figura 3.7.1. 110 14 10.0 5.0 bárbara maria texto 32 20 nunca raios quando rodas 23 29 parte 0.0 viagem homens descreve sobre causa memória estrada amarradosinterrogação mostra vinte dois onde três seja porqu estar devia lembrança outra divide-se serviria tristeza chover presentes vora estilisticos daqueles maior acções obra rachavam montemor terceira terceiro realidade representa queriam arrependime aquela tristes ultimo partirem-se quantidade algumas atoleiro mulheres lamaçal longe lama transformar visitado vítimas voltado tornou pavimento começado ajudado alguem alegres cenário caso casa cair facilmente exagero felizes ficou fragilizada inteira tinha ocupa oito contrariados consolado episódio estarem deviam estado devida desta hipérbole mento merc novo nove descontenta como gravetos bodas serem partes imprevistos partiram excerto recurso aliteração lógicas fazem primeiro pois alegre espanto tais primeira estava nasceu turbou-se vespera todos trabalhador início estes desde porque adjectivação parados autor corresponde feliz nascimento sintetiza mesma segundofeito seus anos véspera passados explicação nome voltouexemplo pode algo estribeira feita constrói-se estilístico pensamento convento acontecido razões angústia refere-se reforçar quer utiliza atormento voto pedreiros palavras casassem breve caldo faziam fala mandado mãos tendo conteúdo construir admirada acerca cumpre-se decidir dizer obrigada sabia situação sentiu repetição alegria felicidade tornaram pela condições solo antes rechonchud recomeço racharam reflecte reinava apresentado utiliza-se usando partir-se qualifica chove lembrado tornou-se visíveis pantanoso podia começavam cada metáfora fornece forma terem teve observa pelo conhecida acorrentado afirmou-se adjectivo enquanto destes dedinho encarar divide estão melhora houve grupo sentimento significa realizadas realizar apenas amor partidos relação retrata quem lamentar lembra transformou pantanosos passagem passou privada casamento atribulada alguém coloca coisa felicidades mostrado lembrou limoeiro mostrar liberdade justifica lugares motivo frágeis frica iria ordenou pesadelo ordens ordem enumeração enumera-se enumeras estranha diálogo diversas entre ergueu disso mandasse imposição negações miseráveis indignação grandiosa incómoda humana moles mole retratada revelou depararam cumprir dividir-se dividido dupla solos desanimo chuva cestilo asar agora aqueles conclusão desenvolvim recursos crimes introdução tinham sonhado melhor segunda visto quinze ledice seriam pensa talvez partiam-se atenções tratados virando turbou volta primeiros presente presos ponto crespuscular campos centro cometido explicado explica existe tipo perturbação pensar olhos agumerado ensonados gostaria nfase nota rodeia sonho poder eixos cavalgava espectáculo comitiva obrigados primavera outros estilísticos afinal regozijo parado vários nada mais grilhetas final paragrafo ideia sendo saber parágrafo ajuntamento reconhecia razão partir reino assinalava aquele aqui transporta veículo usar traz veio problemas chuvas existir madeira naquele junto tiveram tornava todo podíamos cordas durante agradavel avistar bando ainda fenómeno estavam dirigiam facto festa informa-se momento negação forçados inicia termina teriam acabava acordar acorda enfraquecia estabelece episódios sacassem sintetizar sacrifício sintetizo desagravo partiram-se perante fogem soltam vésperas rápida real anáfora repentina represent resposta relata aproximação algum justificam mudança longo torbou-se dificuldades dificultou dias estranheza fundamenta mesmos ilustram minha noite textuais continuarão conjunto encontradas demonstra elementos enfatizar destino esses duas obras significado sofrimento seguintes surgiram sequer serve saída desconhecim ltimo oficial ento sentido depara-se atoleiros vossa saiba lastimoso pardo espanhaalteza chegava acontecimen deveria povo beira foram alinhados exploração linhas frioestaeram mesmo construção trabalhar qual referente atadosmafra seguinte contra caminho tudo linha suas 26 17 devido imprevisto tempo frase vontade péssimo este 38 princesa para -5.0 35 -10.0 -5.0 0.0 Figura 3.7.1. Biplot dos 10 textos produzidos por 10 estudantes identificados por C= {11, 14, 17, 20, 23, 26, 29, 32, 35, 38}. Na figura 3.7.1. as setas a vermelho simbolizam os estudantes, representados pelos respetivos textos, identificados pelos números do conjunto C= {11, 14, 17, 20, 23, 26, 29, 32, 35, 38}. As palavras a azul representam palavras usadas nesses textos. Através do mero exame visual desse gráfico, podem-se imediatamente detetar proximidades e afastamentos entre os textos produzidos por esses 10 estudantes. Repare-se que estes tipos de comparação de respostas dos estudantes são muito difíceis de realizar na 111 prática até para um pequeno número de textos como é o caso deste exemplo. O grande número de palavras envolvidas (505 palavras) dificulta a operação. Seria necessário realizar 1010 2 = 50 comparações, cada comparação envolvendo 500 palavras – sem falar nos cálculos necessários para expressar o resultado da comparação em termos objetivos. Neste biplot (HJ – biplot de Galindo) os ângulos – os cossenos dos ângulos – entre os textos representam correlações entre esses textos. Quanto menor é o ângulo maior o cosseno e portanto maior a proximidade entre os significados dos dois textos. No caso da figura 3.7.1. detetam-se, pela mera inspeção visual, “grupos naturais” de textos: os grupos formados pelos estudantes/textos {11, 35} – ver canto inferior esquerdo – os textos/estudantes {20, 32} – ou um grupo um pouco menos homogéneo {20, 32, 19, 29}. Nota-se, também, que a estrutura do biplot é muito condicionada pelo afastamento dos textos/estudantes 11 e 14. Esta observação visual poderia sugerir que examinássemos os textos dos estudantes que aparecem muito próximos no biplot. Por exemplo, conviria examinar os textos {20 e 32} que aparecem quase sobrepostos no biplot em causa. Será essa proximidade um produto apenas do acaso? Aqui o professor pode ter informação extra que explique essa proximidade sugerida ou apontada pelo exame do biplot. No caso presente, os textos em causa são os que aparecem, respetivamente, nas figuras 3.7.2. e 3.7.3. 112 Texto do Estudante 20 1. Três dos imprevistos da viagem que a princesa e a sua comitiva fazem, de Montemor a Évora são: a chuva e o frio, exemplo: "voltou a chover, tornaram os atoleiros, partiram-se eixos, rachavam-se como gravetos os raios das rodas"; as rodas que se partiram por causa da chuva, exemplo ".partiram-se eixos, rachavam-se como gravetos os raios das rodas"; e por fim os homens que a princesa viu atados uns aos outros, exemplo; "viu parado um pardo ajuntamento de homens, alinhados na beira do caminho e atados uns aos outros por cordas .". 2. O excerto "turbou-se de tão lastimoso espectáculo de grilhetas, em vésperas das suas bodas, quando tudo devia ser ledice e regozijo" quer dizer que tudo devia estar a ser alegre e feliz para a princesa, mas que não estava. A princesa não estava bem nem feliz porque ia ser obrigada a casar e nem ela pode decidir algo sobre o seu casamento. 3. Um dos recursos estilísticos presentes no último parágrafo é a aliteração, ou seja a repetição de palavras, por exemplo: "constrói-se um convento porque nasceu Maria Bárbara, cumpre-se o voto porque Maria Bárbara nasceu, e Maria Bárbara não viu .". O autor utiliza este recurso estilístico para reforçar a sua ideia. 4. A primeira parte é o primeiro parágrafo, descreve a viagem da princesa e da sua comitiva de Montemor a Évora. A segunda parte corresponde ao segundo parágrafo que descreve o tempo que estava e a angústia da princesa. A terceira parte corresponde ao terceiro parágrafo que fala sobre Maria Bárbara e o Convento de Mafra mandado construir em nome do seu nascimento e que ela nunca viu. Figura 3.7.2. Texto do estudante 20 ao responder à A). Texto do Estudante 32 1. Três dos imprevistos da viagem que a princesa e a sua comitiva fazem são a chuva "Voltou a chover", os raios das rodas que se rachavam "partiram-se os eixos, rachavam-se como gravetos os raios das rodas", "partiram-se os eixos", e os homens parados no caminho " viu parado um pardo ajuntamento de homens, alinhados na beira do caminho e atados uns aos outros por cordas, seriam talvez uns quinze. 2. O autor quando nos diz que a princesa: "turbou-se de tão lastimoso espectáculo de grilhetas, em véspera das suas bodas, quando tudo devia ser ledice e regozijo" refere-se ao espanto e atormento que esta sentiu ao ver aqueles homens em tal situação, pois o seu casamento estava para breve e tendo ela razões para estar alegre, estava admirada com tais homens, pois não sabia o que faziam ali parados e amarrados uns aos outros. 3. Um dos recursos de estilo presentes no último parágrafo é a aliteração "as suas mãos o caldo dos pedreiros". A aliteração é a repetição de um mesmo som. 4. O texto divide-se em três partes lógicas. A primeira parte é "De Montemor a Évora (.) melhor se me casassem na primavera", a segunda parte "cavalgava à estribeira (.) como estará ela agora, passados todos estes anos" e a terceira parte "A princesa já não pensa nos homens (.) se a outra lembrança não serviria a memória". Uma frase que sintetiza o conteúdo da primeira parte poderá ser: o espanto de Maria Bárbara ao ver tais homens amarrados, durante a sua viagem para Espanha; da segunda parte poderá ser: A explicação do oficial a Maria Bárbara, acerca dos homens amarrados, e da terceira parte: A interrogação de Maria Bárbara do porquê de nunca ter ido a Mafra e de nunca ter visto o convento. Figura 3.7.3. Texto do estudante 32 ao responder à A). A funcionalidade incluída no PAET permite calcular os cossenos dos ângulos mútuos entre um qualquer conjunto de objetos. Em particular: textos/textos; textos/palavras; palavras/palavras. Isto é, possibilita-se assim o exame das proximidades entre textos; proximidades de palavras a textos ou proximidades de palavras entre si. 113 Na figura 3.7.4. mostram-se parcialmente os cossenos dos ângulos entre todas as palavras envolvidas nos 10 textos que nos servem de exemplo e esses textos; neste caso, apenas são mostrados cossenos com valor acima de 0.4, sendo possível fixar qualquer limiar. Figura 3.7.4. Cossenos (de valor superior a 0.4) entre os textos do conjunto {11, 14, 17, 20, 23, 26, 29, 32, 35 e 38} e as palavras usadas nesses textos. Além das proximidades (expressas pelos ângulos e respetivos cossenos) podem também ver-se as palavras associadas a cada um dos grupos de estudantes/textos e que explicam essas associações. Por exemplo, ao grupo dos textos {17, 20, 23, 26, 29, 32} estão associadas palavras como {parte, viagem, convento, chuva, viagem, parágrafo, …}. Ao texto 38 está muito associada a palavras “princesa”. Deve observar-se que os pontos que representam palavras e textos são projeções no plano em causa (2 dimensões) de objetos que estão em espaços de dimensão muito maior. Pode pois acontecer que certas associações textos/textos ou textos/palavras tenham de ser melhor esclarecidas calculando os ângulos (ou cossenos dos ângulos que tenham em conta a dimensão desses espaços, como foi feito na figura 3.7.4.). Pode também suceder que no plano se projetem, como sobrepostos, objetos que no espaço de dimensão > 3 estão muito afastados. Na figura 3.7.4. observam-se, por exemplo, apenas os cossenos – calculados usando a dimensionalidade associada a 85% da informação (dimensão d= 5) – e não apenas 114 as 2 dimensões da figura 3.7.3. Esta figura representa apenas cerca de 60% de toda a informação. A título de exemplo, nota-se na figura anterior que os textos dos estudantes 11 e 35 (que aparecem muito próximos na figura 3.7.1.) fazem ângulos pequenos (cossenos elevados) com as apalavras “acontecimento” (cosseno 0.69 e 0.74) e “ajuntamento” (cossenos 0.56 e 0.53). Uma busca sistemática – a realizar pelo programa PAET – pode sugerir explicações para as associações de textos descobertas. Uma possibilidade a explorar no âmbito de uma avaliação formativa é tentar perceber em que medida é que uma atribuição de “notas” aos textos é compatível com o que conhecemos a respeito dos estudantes – ou em que medida uma classificação atribuída automaticamente é compatível com uma classificação tradicional. Pode ter interesse, por exemplo, projetar todos os textos/estudantes sobre uma direção que represente o texto do melhor estudante ou uma direção que represente os textos dos melhores estudantes – comparando em seguida a relação de ordem assim obtida com a relação de ordem definida pela classificação. Essa possibilidade está ilustrada na figura 3.7.5., obtida com os mesmos dados mas com um programa diferente para estudar biplots (Vairinhos, 2003). Ver também Método 2, em 2.2.4.2. Figura 3.7.5. Projeção da totalidade dos estudantes na direção do estudante 23, com a nota máxima entre os 10 estudantes do conjunto C= {11, 14, 17, 20, 23, 26, 29, 32, 35, 38}. 115 Observando a figura 3.7.5. verifica-se que considerando essas projeções, se obtém uma relação de ordem entre os testes que é: t14 < t29 < t26 < t11 < t38 < t35 < t17 < t23 < t32 < t20. Em síntese, vê-se que o biplot pode sugerir uma relação de ordem entre os textos resultantes destas comparações. Usando não apenas os 10 textos considerados nas ilustrações anteriores mas a totalidade dos 60 textos de resposta à A), a figura 3.7.6. dá o biplot correspondente. 67 103 viagem 190 47 130 parte 5.0 como 91 124 17 para 14 9 172 rodas 169 raios imprevistos 88 166 casamento eixos rachavam 157 112 94 0.0 160 58 76 133 cesário caeiro pode poeta voltou gravetos cidade sensações todosmais 145 chuva partiram-se atoleiros linhas frase terceira onde estes comitiva 115 alberto durante pela sente 85 frio vários chover verde preso tristeza 20 73 fazem acontecimen causa 35 ainda assim pelas segunda 50 estilo 175 alegre sintetiza 23 outra descrição qual sofrimento sonhado corresponde presos tornaram amor recursos isto presentemuito ruas desde sintetizar 121 sonho devido sentir transmitir reparava lógica pena seja 178163 sendo quer acção lembrança sentimentos partes encontra forma tarde serviria pessoas afirmou-se mento descontenta estar sentia inverno 38 expressão serve paragrafo muitas razão construída conteúdo esta obra descrita coisas numa observa mostra melhor solo grande serviu galhos pensa tiveram secos representa entender entanto respectivo infanta bucólico deambula campo transcreve pormenores heterónimo sentidos derivado fazer grupo demasiado depressa significa elucidar vezes bons longa percorrer intuito naquele tais nove comparação dado mãos trabalhador mesmo dentro pessoa síntese acorrentado ficar presentes longo face enfase memória autor tédio acontecera condições aquela recurso lugar ironia causou adormeceu passam nfase revela estão finos quais valor antes mole sequer estilísticos estavam tornou-se facto várias primeira problemas estradas queria represent acontecer mortes acerca tipos conveniênci sacrifícios pantanosos espírito dividido passado desses angústia referido reflexões chuvas tocara compreende rapidamente leitores sonhos mostrar passar seus encontram motivo dores duas fernando natureza gente apenas metáfora tristezas grilhetas ficasse dois surgindo remete trinta feliz observar dividir noite ultimo leva fazendo bonito passaram nimo provavelme enumeração escolheu remetia anterior reflexão desejo moles triste trajecto esses quase fala excerto partissem apesar usar lugares descrito rvores atribulada certa alma flores casas afirmativo alcolizado espécie carroças verdadeiram visualizaçõe versos olhava olha reparando remonta repara deambuland deambulava vivia vive discritas transcritos transmitia expressivo excertos exprimir liberdade locais partidos pretende andava anda tenta sujeito monotomia complicado complicada concluir utilizando utilizar explicita havendo redor demasiada melancolism constraste pormenor assume descrever sentimentali sociedade 136 montemor estampado empreendim empregue fome alcançado alcançar finalmente fazia-se torna-se tornem xviii durarem cara alguêm facultaram fala-se ostentação tamanho técnicos tardes surgiu tanto dizendo caíssem acontecem acordada transfigura levarem leveza leve lido passarão obscura nosso fundamental própria entrando entidade subitamente surgimento metafórica visualizar digna abulia pedreiros pequena perdeu harmoniosa principalmen aprisioname anteriores animais aquilo desenvolve desejando desejos melancólico deviam século pesadelo posição pesada haverem assemelhar termina retorno deparar mente conseguimos continuidade seguir sentimos horrendo casar parados passados longe rápida despertar juntamente encontrar chuver certamente ajudaram factores especialmen tornaram-os dizer cair fraze surgem utilizou levada comparar explicitam demonstrar rvore poema descreve solos chão dúvidas adjectivação transmite próprio utiliza expressa construído sonhar estragando cheia comemorar clero egoísta feita faziam paixão dando característic caia viagens operários pudesse enumerar torbulenta tormento vaidoso fragilidade gostava gentes gozar privilégios megalomana distintas condicionou acabava tudo trágicos utiliza-a existissem engrandecer arrefecia aproveitar tira construido constituída satisfazer poder pode-se informação infante controvérsia sempre avizinhava aumentar deparou-se servia importava impôs bastasse baltazar encontradas fosse formou quis espanto tornando dá-se caldo acordara transformar gostaria entristecer ente apresentado insatisfação desolada existem contribuiram sentida inicia esteve encontro certo breve esclarecimen negação achava precisament povo poca chocada estabelece começara dúvida agradavel ouve naquela caminhos vespera veículo facilmente fenómeno ficado levaria partirem nutria frica racharem episódios reconhecia tomaram crítica mandaram destes dirigiam transporta limoeiro promenores enfraquecia anos anoitecer recorreram reino terceiro melancolia modo tragédias traz madeira arrepio assinalava delimitada contentes sacassem sacrificios sacrifício podíamos podem ponte informa-se desagravo avistar sintetizo justificados imaginação bando estam chova cima esquecer za-se adversidade adversas pareciam presenciar racham racha enumeras m-se voltado dividir-se acha varios exemplificad executada levou passa obrigada gelado prefeito prefeita racharam-se anafórica apoiado sucedem-se realçando superar cresceram criminosos vitímas desse aceita turbo-se exerto enfrenta antidese arbusto tivesse reflecte degradação desinterece correr reação testa contrariadad conscienciali identificado inesperada inesperado iniciada depõe irónica justificado julga 70 climatéricas ajudou felicidade pantanosa dá-nos narrador movimento vista oposição preocupada esmagado enxugou spartiram-se logicas patente antítese toca confusa tristesa deixando conversa roda desanimada lágrimas sofrem cheio foram pardo vontade levavam partiram partícula racharam ento enterravam escolhida torna decorrer mulher dificultou disse passa-se ensonada terem desenrolar desilusão mistérios intensiva luta consciência homem ausência azáfama sintetisa estaria choveu emocionou enamorado embotas esse aliteração pantano mostrar-nos caduco caída vê-lo festivo onze mande divertimento dificultando acontecido acesso apoio relacionadas tocá-lo meio compreendid comprovar ultima loucura enquadrand reformado resumida deixa consequênci pleonasmo termo revoltados lamacento inundado lama indignação chove cavaleiro começavam tornava carruagem nesse acompanha partir-se partido relata recomeço disso exemplos logo perfeito desespero melhora contrário sabia sete-sóis quebra espectáculo esperança afectar alguém adviram parecendo tanta divido caldos vesperas expressões ocorreu oitava escravizado enumera altura tomada dias conclusão utilização exploração maleável resume terem-se mesmos confronto tristes tratava teríamos testo consegue intrigada atendendo desconhecim impressiona ilusão finda palavras nascença partira,-se ordem ofício escravos toma volrou novamente reitera dialogo comparadas pensamento delírio conhecia seguiam podemos inicio desconhecid sentiu estilisticos encarar chuvoso coloca fornece dupla cada ajuntament adjectivo visíveis visitou felicidades falar ordens qualifica surpresa cumprir mostrado negações nestes divide transformou passa-nos relacionado reinava utiliza-se usando existiram peripécias pequeno passou privada construiram lembrado possa retratada mensagem conhecida introdução imaginável imposição sonharam estupefacta estradas/ca estranheza estragos estariam celebração coagidos chega coche forçado e/ou agradar agrupa aliás parágrafos pagar quebrando questão quarta espetáculo tornavam danificando narração adormecer actos acto obviamente presença rachamento provocar provocou repugnante resistiram repentina reside tornado-o torbou-se vora dificuldade exprime levados ligação pecados passaria obrigatoriam note-se gostou gerais enfatizar amolece aplicar recordar reaparecime sucumbiram sucedido realizar definição miragem minhos maus determinada condenados composta trata traços explicado explique exige intempéries intempérie instante pertenceria perceber penso enquanto aproximação realidade redundantes redundância refere-se referência reforçar regozija reforço demonstra mesmas deveriam considerada construiu considero secção seguia saída reacção assola testemunhar testemunha textuais termos descobrir continuarão contudo semelhantes sejam lamentando pois humanitárias inesperadas atitude avarias separação justificam imediato ilustram imagina implícito chiva física pantanósos admirada alguma vinte ficou outrem quinhentos divisão do-se bonita calmo participação entre local passos referências ressentiu desfaleceu desiludida ltima razões assemelhan assinalar terreno contra constante lamentou-se lamacentas incidentes indica atormento atritos encontrarem encontrou eles efectuar casado afirma-se finalidade pantanoso parar questionava questões danificaram negativos caía carácter carros afasta afecto véspra festa faltou falei opinião funciona prresente tenciona maneado manda-se mudança dividia dificil acontecesse acontece exagero pavimento postriori rainha entrar anciedade ambiguo montermor mavioso devidir ditas tubou-se utilizada referir-se resto realçou considerand saramago saliento porém hipérbole haveria contrói-se contro lamúrias sobre ir-se centro fizeram frágeis agumerado função enumera-se ergueu decidir volta nota grandiosa primeiros realizadas realçar miseráveis turbou existe maior perturbação rápido terrenos tipo consiste rodeia atenções revelou retrata desanimo sentimento lamentar incómoda humana justifica estômago chovia encomendad chateia-se chegada chocar formas torpor parado paradeiro caramelos buraco verifica-se fála-nos ficava data diz-nos aconchegar visitado facilidade partiam-se noivos nico furado racharem-se prestes envoliente enunciado episódio entraves amarrados amavam soube realça crespuscular mecânicos marcante mínima dito compara acabou transcrita utilizado principal engloba anteriormen resta deslocou dever contacto construía conhece covento sair tratava-se tratasse magnífico interesse assistir depararam constantem conheciam lastimoso politico auxiliada irónico atribulado baseou significado soltam evidênciado estusiasmo evidencia chegando emana começaram começado começo almofadas aliviar esquecido agrupament alagados alguem fase filha palpável outras quantidade queriam repouso nascesse voltasse braço acordado partirem-se opolência ocorreram obrigação ocupa oficio novo fundamentai friorenta preparativos prometida rachar esclarecida escuro então realçado decorre critíca manifesta mulheres marisa marido vítimas dirigia-se dificultar condisente absoluto extravagant pergunta-se perfilados perigo fragilizada procurar recostou-se respostas reinado devida conforme conceitos coto turbulência trata-se explicou lembrar inteira pôs-se arrependime demonstrad merc contratempo constatamos constatação contrariados contrastava contrastant consolado contente consta podia pôde piso histórico deprimente segurança lamaçal irreal incomodava horrorizado avistados atoleiro sintetizante barbaram sóis evidenciar tornou alguns afirma além alínea fala-nos tornara mostram negativa acima visão ordenando provocados espanha mundo dificuldades comotiva transcritas apareciment existia pelo aproximado ter-se descritos interrogação desconhece derivadas avistamento situações servir aliviou fogem ajudado alegrai palavra quatro caracterizad visível provocaram espantada epoca temos dificultava diversas transcrito execução início pouco pretender conflito acabando tranquilidad conhecer havia tido contribuiu inúmeros homenagem evidente encontrados chama causasse aliviando força mostra-se aguçado família figura ficaram dar-nos difícil oportunidad obediência obedece frases gosto prontament primeiras propósito preferia prestar postas amar surgiam todas mandado materiais condolências transtornad transtorno explicação pedras gravar precalço apercebe referente realização realça-se realeza teresa metereológic complicaçõe completa conta herdeiro haver retirar conseguido coração infeliz desagradáv deparou irregular irritação imaginá-lo encontra-se buracos alegria alíneas obrigados objectivo relatado crimes 127 118 devia passo refere pelos estrofe emprevista circunstanci fariam paragrafos paragem tornaram-se dadas curto caracterisad vestido viso oito numca fundamenta espaço respectivam repartido relatar suspanto tornado maravilhosa diferentes diversão exclamar listagem passar-se noutra preencher teremos deve acaba teriam constroi portanto péssima informar lamento iremos inclinando identificar indicação averiguar sintetize casassem algum obstáculos tambem curiosidade nada passagem gancho respeito dedo transporte explica regresso deveria sentir-se 109 estrutura chegasse cometido algo panos questiona quinhetos respectiva naturalment pede enunciar apresentada comprovada ultrapassar grotesco arbustos referem-se reforça degradado deparado constrangid construi lembra interroga podiam textual sabendo seis homenagea deparava-se sobressaltad isso impressão base bálsamo sofriam sonha efeito alinhamento divisai acordar visitar maneira desprazeiros dirigindo-se digno acções lógicas inquietação privilégio tocar deformava perturbada pensando retirando tivera delirio deparam-se conseguir pobres infelizes assustadora depois memorial avistar-se simples joão barbara sonhára estamos ajudar quebraram danos virando surgiram acorda ensonados tratados mesma repetição preocupa tenha muita umas três lembra-se seguintes sabiam houve horror sete adecadência agitação qualquer partir previsivél remete-nos decidiram matéria ramos aqui deixarem contentores depara-se encontramo estado forçadament observação nsia vivo irem inantigível imaginar caso casar-se partiam desenvolvim segue lástima adormecera nome enfim perante construir bastava essa suas dessa transmitindo pergunta aprisionados apareceu retira plena serem situada começa elementos direito livre tocado comprovado crepusculare justificasse caracteriza acordou verificar pensar prisioneiros deparar-se avista espera algumas daquela recorda dedinho passava texto menos sintetizado nenhuma véspera olhou trabalho apaixonado minha pensava alegres verdade expressivida turbou-se infelicidade contexto seria estragara encontre encadeação centra fossem mostrava acreditar alinha veio vislumbrava visitara orienta reparado reparara tamanha talvéz cujo crua música dirige passarei nomeadame noivas nível próprios ambiente relação relacionados respeita sucede-se realizasse tenhamos realizou monumento concluo leste percebemos permenor possíveis princípio aproxima resume-se contemplado consequent leitor mencionado contraditório se-lhe deparava importância juntar somado casa ocorridos destino aconteceu seguinte revela-nos forçados mandou vossa alteza sentiu-se causava favorável feiro querer advérbio observada ordenado prende relativament talvez cuja dividi boda exemplificar franciscano aperceber realizada trouxesse intensifica permite resulta saiba seguidament tratavam teve descobrisse sentido sentia-se indiferença avistado bastante 139 faltar apresenta deles dele conheciment iriam lado iria felizes quinze primavera prometido rechonchud diálogo estarem outro nesta tendo pedra dela mostra-nos daqueles depara estilístico agradável vida resposta ajuntamento deste embora cavalgava mostrando realmente momento existir pensativa impossível junto cenário olhos meteorológic chegava cena promessa personifica vésperas trabalhos visto divide-se percurso 41 caminho casasse neste angustiada nele nascido esteconstrução fica erguido sido vira encontrava doze dimensão apresentar conjunto ponto estranho faziaideia estribeira fria toda aquando primeiro regozijo fora ordenou desta relacionada cordas seriam achou afirmação ledice impalpável viver alinhados mandasse bodas anáfora 79 segundo final imagem névoa porqu campos imprevisto estrada exemplo cumpre-se também beira 53 trabalhar situação parágrafo oficial eram tinham honra estava aquele voto ltimo teria sabe lembrou após 61 possível todo feito outros tinha 29 afinal atados péssimo tocou real coisa 184 quando quem nascimento obras saber agora estranha aqueles 11 82 100 148 constrói-se porque 32 homens 151 tempo 106 nasceu 154 26 nunca convento -5.0 64 44 mafra 142 187 56 -10.0 bárbara maria -30.0 97 -20.0 -10.0 0.0 Figura 3.7.6. Biplot construído com os 60 textos de resposta à A) dos dados EX-MIN (prova 639/2ª fase, 2008). 116 Por exemplo, vê-se que os textos/estudantes {29, 67, 58, 47, 100, 187} são muito semelhantes e que essa semelhança é explicada pela influência de palavras como {maria, barbara, convento, mafra, nunca, nascem, tempo}. Na figura 3.7.7. apresentam-se os cossenos dos ângulos entre palavras e textos, calculados usando a dimensionalidade (d= 30) correspondentes a cerca de 90% da informação total. Figura 3.7.7. Cossenos (de valor superior a 0.4) entre as palavras e os 62 textos de resposta à A) calculados com uma dimensão d= 30 correspondente a 89% da informação total. Na figura anterior constata-se, por exemplo, que a palavra “alegria” tem um significado muito associado aos textos 11, 17, 20, 23 entre outros. 3.8. Categorização Automática de Textos em Apoio da Avaliação Formativa. 3.8.1. Introdução. No contexto de um processo de avaliação contínua, a avaliação formativa tem um papel extremamente importante e neste número estuda-se a possibilidade de usar os métodos de classificação automática (análise de clusters) como auxiliar do trabalho do professor. Isto não significa usar esta metodologia para atribuir automaticamente classificações e avaliar os estudantes mas usar apenas essa metodologia nas tarefas para as quais foi concebido: obter grupos homogéneos de objetos – no caso presente: textos das respostas dos estudantes a questões abertas. 117 3.8.2. Lógica do Uso das Análises e Cluster. A lógica que justifica o que se segue é a seguinte: textos de estudantes com baixo nível de conhecimento, acerca de certa matéria, devem ter características semelhantes e testes de estudantes com alto nível de conhecimento devem também ter características semelhantes. Deste modo é de esperar que quando se comparam todos os textos de um conjunto de k textos, os textos semelhantes devem agrupar-se em grupos homogéneos, Logo, os métodos de análise de clusters devem em princípio ter utilidade do ponto de vista de identificar, por exemplo, grupos de testes semelhantes antes de proceder à respetiva classificação. As análises deste tipo implicam sempre o cálculo de um índice de semelhança (ou dissemelhança ou distância entre os objetos a comparar (textos das respostas no caso presente) e um critério de agregação que permita ir juntando, mediante certas regras, os objetos, conforme a sua semelhança (ou distância), construindo-se assim uma árvore ou dendograma. Uma vez que existem diversos índices de agregação e de dissemelhança, as combinações dos índices de dissemelhança com os critérios de agregação conduz facilmente a dezenas de árvores e portanto à dificuldade de decidir qual o par (índice, critério) é “ótimo” para a problemática em questão. Uma abordagem possível é uma experimentação que procure, no contexto em causa, obter o melhor par (índice, critério). No caso presente, a metodologia de análise de clusters vai ser aplicada ao resultado da decomposição da matriz de frequências (tabelas de contingência) e portanto a uma representação geométrica dos textos em que cada texto é representado por um vetor cuja dimensão corresponde a uma percentagem significativa da informação (variabilidade total). Ver Capítulo II. Para esses dados (que representam os textos num espaço métrico) um par (Índice de Semelhança, Critério de Agregação) muito usado é (Distância Euclidiana, Índice de Ward). No nosso caso, a percentagem adotada é cerca de 85% que, experimentalmente, se comprovou, com os dados característicos deste tipo de estudo corresponder a uma dimensão da ordem de ½ da dimensão inicial. Isto é, se a matriz dos dados com as frequências tiver p= 100 textos, então d p/2 = 45 garante a consideração de grande parte da informação dos dados: entre 85% a 90%. 118 3.8.3. Experimentação com os Dados GEST. Considerando a totalidade dos 187 textos de resposta à questão relativa ao conceito de Qualidade Total – foram eliminados os textos em que o estudante, embora tendo entregue a folha de resposta, o texto aparece em branco – e usando o programa PAET (ver Anexo A) que foi dotado de um método de análise de clusters. O resultado aparece na figura 3.8.3.1. em que se pode observar a árvore completa: Figura 3.8.3.1. Dendograma dos textos GESTÃO. Escala de dissemelhança na parte superior da janela do lado direito. Na figura 3.8.3.1. pode observar-se que a árvore correspondente aos 187 textos do conjunto de dados GESTÃO aparece cortada ao nível de dissemelhança (distância) 28.5 de forma a considerar apenas 5 classes. Nessa figura cada uma das 5 classes de textos (clusters), existentes a esse nível, aparece pintada de uma cor diferente (vermelho, verde, amarelo, azul e magenta) de forma a permitir uma fácil inspeção visual. No lado esquerdo da figura aparece, para cada uma das classes indicadas, não só o identificador do texto como a classificação atribuída pelo professor da disciplina a essas respostas. Isto é, no lado esquerdo, cada texto aparece associado a dois valores: a classificação que lhe foi atribuída pelo professor e o identificador (número) da classe a que pertence na árvore do lado direito. A questão que se põe é a de saber se estas classes ou “categorias” obtidas automaticamente “têm algo a ver” com as classificações atribuídas pelo professor, 119 seguindo o chamado critério “holístico” – resultante da impressão global que a leitura da resposta provoca no professor e que o levou à classificação indicada. No que se segue, apresentam-se os resultados da análise estatística desses resultados, obtida com o software SPSS (versão 17) – SPSS, 2007. Na tabela 3.8.3.1. aparece a tabela de contingência que cruza as classificações atribuídas pelo professor com as classes obtidas automaticamente pela metodologia de análise de clusters, tendo no cruzamento das linhas com as colunas o número de textos classificados nessa célula. Verifica-se que o professor concentrou as respetivas classificações nos valores 40%, 50% e 60% aparecendo 16 textos com classificação zero e 3 com a classificação máxima de 100%. ClProf * Classe Crosstabulation Count Classe 1 ClProf Total 0 2 10 15 20 25 30 40 50 60 70 75 80 90 100 2 10 0 4 1 1 6 4 6 9 1 0 0 0 0 0 42 3 5 1 3 0 1 8 0 6 6 4 0 0 0 1 1 36 4 1 0 0 0 0 0 0 3 27 6 0 2 2 1 1 43 5 0 0 1 0 1 2 0 4 17 8 1 5 1 0 1 41 Total 0 0 1 0 2 2 0 6 6 5 0 3 0 0 0 25 16 1 9 1 5 18 4 25 65 24 1 10 3 2 3 187 Tabela 3.8.3.1. Tabela de contingência cruzando as classificações do professor com as classes do processo de análise de clusters (distancia euclidiana, critério de WARD). A tabela 3.8.3.2. dá o resultado do teste do 2 para decidir se existe alguma relação ou dependência entre os resultados atribuídos pelo professor e as classes obtidas pelo procedimento de análise de clusters. Verifica-se claramente uma associação entre linhas e colunas, o que contraria a ideia de que essa classificação possa ser um mero resultado do 120 azar, conforme é mostrado através de três testes que produzem o mesmo resultado (Quiquadrado, Razão de verosimilhança e Associação Linear-Linear). Em todos os casos é rejeitada a hipótese nula de ausência de relação, concluindo-se então que há evidência compatível com a ideia de que as duas classificações estão relacionadas. Chi-Square Tests Value 112,116a Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association df Asymp. Sig. (2-sided) 56 0 121,096 56 0 33,437 1 0 N of Valid Cases 187 a. 64 cells (85,3%) have expected count less than 5. The minimum expected count is 13. Tabela 3.8.3.2 Resultado do teste do qui-quadrado, obtido com o SPSS. A tabela 3.8.3.3. mostra, dentro de cada classe resultante da análise de clusters (1, 2, 3, 4, 5), os valores de diversas estatísticas básicas relativas às classificações dos textos atribuídos pelo professor. Verifica-se que, apesar da variabilidade, as classes aparecem associadas a médias bem definidas. As classes 3 e 4 não se distinguem bem. Report ClProf Classe 1 2 3 4 5 Total Mean 26,07 33,94 54,19 53,54 46,6 42,82 N 42 36 43 41 25 187 Std. Deviation 19,46 24,683 15,273 16,854 17,483 22,068 Minimum Maximum 0 60 0 100 0 100 10 100 10 75 0 100 Range 60 100 100 90 65 100 Tabela 3.8.3.3. Estatísticas da classificação dos professores correspondentes às classes obtidas por análise de clusters (obtida com o software SPSS). Em síntese, esta experiência mostrou claramente que existe uma relação bem definida entre as classificações do professor e o resultado da análise de clusters, apoiando a 121 sugestão de que faz sentido que o professor use o resultado de uma análise deste tipo “antes” de atribuir as classificações finais. Fica por definir o critério de escolha do nível de corte da árvore (28.5, neste exemplo). Isto é, não se está a sugerir que de modo acrítico e automático o professor atribua uma nota única a todos os textos de uma classe mas que proceda a vários cortes (quanto mais baixo no índice de dissemelhança – eixo horizontal na figura 3.8.3.1.) antes de examinar os testes segundo os seus próprios critérios. 3.8.4. Experimentação com os Dados do EX-MIN. Considerando agora as respostas à A) do grupo I do conjunto de respostas às questões relativas ao MEMORIAL DO CONVENTO de JOSÉ SARAMAGO do exame de Português, 2008, prova 639/2ª fase, repetindo a sequência de análises cluster usada em 3.8.3. para os dados de GESTÃO, obtêm-se os seguintes resultados usando o mesmo software: PAET e SPSS vs 17 (ver Anexo A). Na figura 3.8.4.1. aparece o dendograma relativo às respostas dos estudantes, cortadas ao nível 27 de modo a evidenciar cinco classes de textos semelhantes (ao nível do corte). Figura 3.8.4.1. Resultado da análise de clusters dos textos da resposta à questão GI A) dos exames nacionais de Português 2008. 122 Observe-se que as distâncias envolvidas variam entre 10 e 50 – escala horizontal da parte superior direita da tabela anterior. A tabela 3.8.4.1. mostra o resultado do cruzamento das classificações atribuídas pelos professores contratados pelo ministério com as classes ou grupos gerados automaticamente pela análise de clusters. Esta árvore – dendograma – foi obtida calculando as distâncias ou dissemelhança entre textos, usando a distância euclidiana. Para agregar grupos de textos usou-se o critério de Ward. Para outras combinações (distância, critério) as árvores poderiam ser diferentes. ClProf * Classe Crosstabulation Count Classe ClProf Total 19 20 21 24 26 28 30 33 34 35 36 37 38 39 40 41 43 44 45 46 48 49 50 51 53 54 56 57 59 60 61 64 1 2 1 1 0 0 0 1 0 1 0 0 0 0 1 1 0 1 2 0 0 0 3 0 0 1 0 0 0 0 0 0 0 1 14 0 0 0 1 0 0 1 0 1 2 0 1 0 0 0 0 2 3 2 0 2 1 0 0 1 1 0 1 0 0 1 0 20 3 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 3 5 0 0 0 0 0 0 0 0 0 0 0 2 1 0 1 0 1 0 0 0 0 1 2 0 0 0 1 0 0 0 0 0 9 6 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 1 0 0 1 1 0 0 1 0 0 0 9 7 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 3 8 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Total 1 1 1 1 1 1 1 2 1 3 1 3 2 1 2 1 6 4 3 1 6 3 2 1 2 2 2 1 1 1 1 1 60 Tabela 3.8.4.1. Tabela de contingência cruzando as classificações atribuídas pelos professores e as classes obtidas por análise de clusters. 123 Constata-se agora que, face à distribuição das contagens do número de textos pelas células (classificação, classe), ao contrário do exemplo 3.8.3.1., não se detetam quaisquer regularidades que indiciem evidência de dependência. Este resultado tem possivelmente a ver com o modo como essas classificações são atribuídas (de acordo com regras rígidas) e, sobretudo, pela pequena dimensão da amostra (n= 60) que, face ao número de classes = 8 e ao número de classificações distintas, torna esta experiência inconclusiva. No contexto de uma avaliação formativa, contudo, considera-se que o exame dos conteúdos dos agrupamentos (clusters) poderia ser um input importante para a organização do trabalho de classificação do professor, dada a semelhança dos textos dentro de cada grupo. Isto é, antes de classificar, o professor poderia agrupar os testes segundo o critério sugerido pela árvore antes de proceder à classificação. Nesse caso, ao atribuir um texto a um estudante, sabe que está a fazê-lo no contexto de um grupo de estudantes considerado homogéneo. Antes de optar por uma classificação final proceder rotineiramente a um estudo estatístico como o sugerido aqui. 3.9. Avaliação Automática de textos usando o Método LSA/Biplots. 3.9.1. Introdução. No que se segue usa-se a abreviatura LSA/Biplot para designar a representação dos textos baseada na decomposição em valores e vetores singulares da matriz X de frequências de um conjunto de n palavras sobre um conjunto de p textos. Já se viu no Capítulo II que a visualização desta decomposição em espaços até à dimensão d= 3 se designa habitualmente por biplot mas podemos imaginar biplots de qualquer dimensão d= 3, …, p, ainda que estes não se possam visualizar com os sistemas cartesianos habituais. As respetivas visualizações e conteúdos são possíveis usando biplots cilíndricos (Vairinhos & Galindo, 2012). Neste número apresentam-se os resultados de diversas análises a que se submeteram os dados disponíveis, procurando-se validar não só o funcionamento do programa desenvolvido, como pôr em evidência os problemas que a implementação prática de um sistema de análise estatística de textos ao serviço da atividade de professores e estudantes levantar. Apresentam-se, pois, em particular, os resultados da aplicação aos dois conjuntos de dados (EX-MIN, GESTÃO). Os resultados gerados pelo programa desenvolvido 124 (PAET) para este projeto, comparando esses resultados com os das classificações dos professores, na perspetiva do esquema de validação deste sistema recomendado na literatura. O programa PAET contém uma implementação do esquema de classificação automática baseado na decomposição da matriz de frequências em valores e vetores próprios, sugerida no Capítulo II. Como se refere nesse capítulo a propósito da classificação automática baseada no método da ASL / Biplots – ver figura 2.2.3.3. – os dados são organizados do seguinte modo – ver figura 3.9.1.1. ES Espaço Semântico AT Amostra de Treino T Amostra de Teste Figura 3.9.1.1. Organização dos dados para treinar um classificador automático. Isto é, os dados envolvidos na análise são divididos em três partes: os textos usados para construir o Espaço Semântico (ES), os textos para construir a Amostra de Treino (AT) e os textos (T), que constituem a amostra de treino. O ES resulta da decomposição em valores e vetores singulares da matriz de frequências, relativa ao primeiro conjunto de textos. Nas experiências descritas no que se segue - em 3.9.2. e 3.9.3. - este primeiro conjunto é formado por 90 textos extraídos de manuais de ensino usados para explicar a obra de José Saramago “Memorial do Convento” aos estudantes do Ensino Secundário, no ano letivo 2007/2008. Os segundo (AT) e terceiro (T) conjuntos são textos classificados por professores e usados, respetivamente, para treinar e testar o classificador, permitindo estimar a respetiva validade. Nas experiências descritas em 3.9.2. e 3.9.3., os textos a usar para este efeito são os 61 textos de resposta á questão GI A) dos exames oficiais de Português de 2008 (prova 125 639/2ª fase). Estes 61 textos são divididos em duas partes através da fixação do valor do parâmetro % da amostra de treino. Por exemplo, no programa PAET assume-se como valor por defeito, para este parâmetro, 50% o que corresponde a usar 31 testes para treinar o classificador e 30 testes para o respetivo teste. Nas experiências descritas em 3.9.3. e 3.9.4., o Espaço Semântico é o mesmo (90 textos usados no ensino do Memorial do Convento de José Saramago aos estudantes do secundário). Contudo, em cada uma dessas experiências usam-se as respostas às questões GI A) e B) que são posicionadas sobre o mesmo espaço semântico. Finalmente, no número 3.9.6. comparam-se as classificações atribuídas pelos professores contratados pelo Ministério com as classificações atribuídas por um professor do Ensino Secundário que aceitou participar nesta investigação, classificando esses mesmo 61 textos. Em síntese, nas análises de dados abaixo descritas vão estar envolvidos: 90 textos relativos ao ES, 30 textos relativos à AT e 30 textos relativos à amostra T. Embora o número total de textos disponíveis seja cerca de 600 (ver 3.7.) o facto é que esses textos estão divididos pelas provas de várias disciplinas para as quais não foi possível obter recursos que permitissem a digitalização dos manuais de ensino e textos de resposta correspondentes e consequente construção dos respetivos espaços semânticos. 3.9.2. Construção do Espaço Semântico (ES). Como se disse, o ES construído é relativo ao romance Memorial do Convento de José Saramago e é formado pelas coordenadas das palavras identificadas em 90 textos extraídos de manuais de ensino da obra deste escritor, destinada ao ensino secundário no ano dos exames referidos. Na figura 3.9.2.1. está uma imagem construída pelo programa PAET no final da operação de extração de palavras destes 90 textos e respetivas contagens. Por exemplo, a palavra “santo” aparece 1 vez no texto 42, 3 vezes no texto cujo identificador é 688, 2 vezes no texto identificado por 701 – aparecendo ainda em outros 8 dos 90 textos usados. A matriz X (n, p) resultantes destas contagens tinha como dimensão finais n= 5678, p= 90. Isto é, o ES em questão abrangia 5678 palavras detetadas nos 90 textos envolvidos. 126 Figura 3.9.2.1. Uso do PAET para contagem de palavras dos 90 textos do ES usados para construir o ES. Realizada a operação de decomposição em valores e vetores singulares da matriz de frequências correspondente a este ES, verifica-se que 45 das p= 90 dimensões iniciais acumulam 85.4% de toda a variância/variabilidade/informação contida nos dados. Isto significa que, em vez da dimensão inicial p= 90 podemos, neste caso, representar textos e palavras num espaço de dimensão d= 45, preservando quase toda a informação dos dados, obtendo-se uma notável compreensão dos mesmos (redução da dimensionalidade em cerca de 50%, com perda apenas de cerca de 15% da variabilidade). Constata-se também que as duas primeiras dimensões (plano 1, 2) representam 27% da informação total. A figura 3.9.2.2. apresenta a imagem deste ES captada por um biplot construído apenas com os dois primeiros eixos. 127 40 698 30 operário 709 20 construção baltasar convento 10 712 capítulo patrão blimunda 725 padre mafra tempo passarola disse 663 713 674 silêncio bartolomeu 723 dizer casa dois homem 662 máquina dentro 683 696 682 homens 678 lourenço maria 716 689 mundo coisa 38 39 assim memorial sabia cresceu fazia romance 715 677 obra 705 fosse 710 coisas scarlatti francisco 684 além nunca 737 719 700 690 teve voar facto havia depois casas rainha coração agora cimento prisão 672 680 humilde texto personagen 722 também voadora 711 45 702 41 história alto anos dimensão 661 conheciment pedro trabalho 667 grande primeira morte medo 724 música sempre chão 688 segundo deus 691 pedra 664 narrativa olhou nascimento casal narrador espaço construído novo modo profissão poder739 trabalhos irmãos agressão templo exercer desconhecia vinícios tijolo dou-te dizia prato edifício mesa morais poesia chegar delação vontades bárbara 699 40 726 sendo monte mulher viagem sete-sóis 666 729 717 janela sonho momento 695 saramago 670 703 686 676 passado duas verdade joão razão título estão venha igreja região vinte infante trinta junto enquanto promessa 707 687 olhos noite basílica exemplo franciscanos discurso infanta feita parte final sebastião conta histórica pedreira livro aqui asas sofrimento notar 731 deste trabalhador ficção vontade portanto encontro mentira vela trabalhar primeiro vezes seguinte real vida domenico eventualme doença decisão 671 preocupa causa sequer olhava regresso dava pensamento 735 679 desse adiante passou narrado eram fictício notícia diversas descreve-se marca tomamos 669 assistimos holanda milagre profundo suspeição liberdade escrita frente paço sabemos voador comer obras pássaro leitura morreram podes compreende foram constru bela começou partida gritou lazer 697 etapas 692 sair largo pobre lugar resolução construir terno martírios cortar tentou marmita olhando reflectia indique rosto notou agitou-se povoado ouvidos existia manufactura mansão mansa sabereis sabe rude sincera tijolos convençam gamela garrafa objectos cidade atenção misteriosam imprescindív assombrado perguntado impressão dobraria dobrá-lo enxerga instante missão dou-o ouviu valia bocas prosseguia quebrado quartel declaração estruturas esperança esquadria esquecido dar-te-ei dar-me maneira maldição rodas destinado nascia vidro tomo tomado fracturas futuro 665 extraordinár fadiga facão porém abandonare adquiriu crescia cresce emocionado empilhava misturava brotavam caldeirão produtos emoção pedidos parede perdão dureza uísque queria gritos preta leia banco esperar vemos soube zuarte sorria vazia sorte suor solitário sentindo casebre imensa viverão viu-se torturas fazer admirava adorares cuspido comia presente cadernos quiser mostrou-lhe morava erguendo erguia poema podia apartament suspeitava apavorado apontando aprendeu sofreria sofrera solidão sofreu cercado cerveja fizera fez-lhe fez-se fato compreens satisfação andarilhos macacão entregue levando loucura amiga lucro escravidão escutava arrastarem súbito súbita subia fitou seguiram seguirão constatar levantara veria vias começaram povo braço pistas 733 693 lado acontece excesso outubro roma vila então encontramo passagem perdeu 681 685 caso estava relação pinheiro mandar riqueza visão 673 milagres hoje falsas busca degradação el-rei amor filho filha seguindo construtores palmos temos palácio devido esquerda neste setecentos contar falar auto-de-f universo casamento sagração talvez participa família jogo sedução terreiro explica diferença professor inicia chuva transporte príncipe assistir 738 668 primeiros caballeros alquímico ambiente pobreza vento irmão jerez segredo alague palavra inaugurar mãos pero diferentes neve históricos procissão atravessa autor quatro estabelece estamos permite revelar tranglomang extrema acontecimen 694 gusmão baptizado sopre solou seja caracteriza presença lemos leitor caia arder falte abre elementos escolha fogueira fora começa terra tens alentejo voto toledo função enfim desaparecim somos sete visita torna-se contacto justamente miniatura edificar parece dirige plano sujeitos velho visitas acompanha cunhado altar realidade mateus terras corrupio oposição tenho teja agricultores ocorre incêndio benediction beirinha breve estragos marinheiros contrabalan convida frustração gancho gastos científicos relacionamo inauguração envolviment inquietação informados reiteração aumentar informar informal miséria início boeiro dá-se permitem descida toma conta-se funerais fala-se concretiza tarde pontaria sádico obrigados religião empoleirado discretamen haveremos assiste-se metros barcos provar espingardea damo-nos epidemia 708 expropria suicídio apara tourada faz-se febre conclusão crianças cura religiosidade conseguidos participar amarela reparar quinta poderes venderem sobrinho jornada entretenime aniversário entretém andava réplica forma clima capítulos dela esmagament vergas igrejas cólera constrói recomeçam palavras temporais esteve existe saber violência género ausência datas vime fala juntos heróis ferros podemos entrar arte forte filhos respondeu corte integra evasão nuvem atribui dizem auto barroco quase vamos implica 704 44 727 feito tarda guerra caminho pretende leia-se meio nação nascer alteridade entos libertação mulheres escreve códigos constrangim teresa corresponde marques nomes temática personagem sido tipo contrário pessoa desmanchar sabem simples sonhos sinal nesta direcção serve tinha objecto cravo origem passando injustiça helena gravidez queira de-f sugerida silva 675 destes vista seis nela aconteceu adeus consegue partilhar bairro pobres ficcional ficar falta acedemos abre-os sala iuris entusiasmo verdadeiros suspeita certamente figuras fizemos chegam flor libertar-se liberta andar deixa seguir espanha espaços construíram materialidad material oprimidos onze marta olhar referências dito dias tipológica postos intemporal encontros perguntou históricas próprios maneta romances aonde nele contam kaufrnan cristina 42 734 730 historiográfi ultrapassar ultrapassa união reuniões sujeitas veio imaterialidad casos seixo torno fazendo fazem festa metaficção quinhentos ambientes lembrar alzira livre logo pode arrábidos vendo classificação itálico jesus espelho seguintes secretas secretos segredos coloca respeito reconstru textos nota porventura possa tema oito nomeadame digamos dogmas braços estivesse estatuto sete-luas difícil tinham conduzindo conduz afinal vaidade quadros decorreram pessoas descer transfigura 720 43 ente quer transgress encontrar perceber partes gosto perca lição propósito aparecendo aparecer aparece senhora catorze serão tornou acompanhar precisas saiu carga prepotência quisesse balão mortos arames cerdeira imagem figura companheiro capacidade repente letra local luas escolhido esferas constante capazes verificar coincidência textual materializa teria alcunha ontem mármores ocorrência ocasionou tempos temas referimos incipit bênção excerto pesos rossio nome dimensões diferente noutras diga fronteiras fuga frei histórico inicialmente divulgados inaugural donde boca biografia data expressa marcas piedosa revelam-se denunciar nascidos virtuoso torna falam costumes condutor açougue chegou polariza pólos ultrapassam engrandece historiador unificadora passagens discursiva processos disfarçam intenções duvidosas passados histórias intenção passam procura procurar auto-de entanto grávida passar glória barba daqui eterno permanece majestade magia sugerem vejo seres vivo transforma totalidade crescimento concordou invenção popular crescer saiam criam acto participasse emprenhou confissão alteram primazia calar-se pedras músico escândalo planos surpreenden verdadeiras aspectos aproxima souberam surgindo sobrevoa situação chegava cedesse fama comprimento completas absolvidos completa acharam isotopia acaba custa achar ação irão antagónicos antagonista conhece eleva livros anjos entra degredo movendo-se podíamos põem verdades soldado sóis focalização chamariz físicos clero representan libertadora levaram análise versa segurando vidas recolhidas reconhece reconstitui testa materializad materializar mbar corrigir cortam ombros terem opera alcança aliar indirecta pancada exactidão exceder evoca desferindo vozes digo tiveram coroa tempera ajuda tenaz regressava disseram registo integrados instituído panos benedictione batendo brancas beiral belos pública estrada exorcizadas existir perpetradas pescoço pêro peso rugas rubro ruína naturalidade natureza números didáctica noviços diante voltas ninho nicos traduz tirar conventual continuado ganhando galeria garras gente frases julgaríamos agarrarem postura afirmar polida praça distancia-se reescrever referencial autoridade referencia trazê-los bacharel trazidas atraída doutor trazia reis aulas dista doze vale encorreado enferrujam perguntava inscrevem doctorum proferido inferimos infantes oxal bigorna puxou quam decretalistas esquecem estudante esqueleto esquerdo decretais dedicado estando exploração permitiu desmanchou despreocup desmandos descaem desce simbolicame simbólico viéssemos carregada sessenta destrança diremos voaram detalhe voarás nesse carne nessa transcendên toneladas tornaram tradição tome contente frades factos condicionalis obrigando pontificum sacrificial justifica nuvens cheia cinco principalmen aventuras universi avisos transportara encontrarão transmudad envelhecime consciência entender-se ecclesiastici privilegiada parece-me envelhecer minimizou universum memórias lamacento redentora licenciado problema encontra redondos turísticos duzentos pergunta guardava privilegia entender transpor pensado paredes pegares usamos pareces merece ustria brilhar usboa tratar mero golpe peles mofo laje libri provar-lhe queima esperávamo espessura daqueles espelhos defeito 732 dando dada 706 nasce eternidade mandado malho sumptuosida aparece-nos retratado varanda antítese revolta velhas velhos supor vejam vêem sujo sobra sirva imortalizado senhores senhoras visitantes imolados imaterial imolado serem trabalham tornei ferro adjectivação criticamente cronológica precisam sagrado criando inverno precisa tapado josefa lados literatura literário literária remete conseguiram enumeraçõe gratuitamen mobilizada passemos primavera conselhos questiona princesa grandes metálico pretexto amarelo eclipses lavrada cabeça largura metade buscar angola lamela quinze meteu altura quilos cabia guias reler balões morreu mostrar morrer mortes pocas apresentand apontar aponta arca solidariedad semelhante imagético categoria humanos imagens fictícios chega ficcionais ficam fica comungamo acabarem sapiência abre-lhe citámos achado iríamos abrem civilis representad reportorium elucidação entrevista andorinha conhecer canseira canonici elevam radical entram canoso longas lendo elvas escondido esforço escrito sublinham arrobas artes fornecidos humildes fornecer forçado forja centímetros celebração cerimónia chamar cegos cento claramente classe anacronismo levantar capela lugares levar raspa anda deixara veteram víamos ignorância sebastiana cobrem-se resistência rebuscada realista reside espécie ideia colectanea começar séculos coetera respectivam recentiorum recolha ressequido resposta recorrência testemunhal teriam opiniões tenha alheio omitiu aliena ocorridos refugiarem indiferente reflexão referir excêntricos expectativa explica-lhe evitar mário pertencem pertencia desejo nomear títulos tiver freiras temporal agustina ajoelhai tecto integralment informações referenciam integrando indexar-se dominado dissemos integrar inferno pano batalha publicado debaixo exibem-se eventos exército marginalizad manuais marcha perto simplesment simbologia determinada novembro serventia natural direita ngulo nove nico contexto conversa fundamento geralmente genológica gabriela conduzido possui posto autenticidad autonomia referência impossível dramática autónomo conjunto profético imposto dizendo ausente vagueia haveria ausenta recurso assistiu trono ouro atesta dores autos o-se traz intemporalid insiste bessa-luís queimaram pudesses prova esqueceu esquece europa eurico permitindo permitir pior denuncia revisitar revela rnítico destacam visionária casados neidade seriam serviu neles vieira 740 728 textualizand tornar-se 718 contemplam contempora contamina feed-back feitiçaria fechada feitas fábrica afastamento obscurantis acusações acusada criarão confia cria transgressiv consciente religiosas enganado memória produtiva emprego engenho emergir prodígio recriam querem guardar produto hão-de hesitar querer há-de alma modificado conivência partiram modelo partido pedinte pensa passa projecção profunda daquelas dans monumento narrativas narrativo narrados nasceu nasça narra exterior veracidade superação sucessão aparecem vendados aspecto retrato veículo surge vazio sobressair situa humanidade sentimentos sentimento imaginário sentou-se sentar-se fictícias sente viveu viva cronológicas compêndios acompanh acentuam absoluto invento criador cunha caracterizad literariedade caracterizan questionam lembrança presbítero quiserem lembra alunos lirismo cadeia logro lírica metaforicam entusiastica confundem metatexto grandeza aniquila conheci mundivivênci movem podem suspeitarmo apresentada chegada semana chamas fizeram chama faremos clássicos concebe cumpre cláudio irónica italiano representam representar leva-nos liberta-o levarem ludíbrio llansol levam lutar leva esmagado escrever esconde subiu fingimento fingidas finge segunda scar constituem constitui capelão ampliar específico secretament código constroem realeza ideias combina colher recolher testamento orfeu materna mato oração masculina massa matar cortado corta opressora operários oprimido oprimida alerta corrupção tentativa omnisciência omnisciente ontológica tendo-lhe alastrado alcançar alegrias aliadas tentar terão opõe reflexivo desenvolver notável nobres nora tivesse corredores correndo corre ocupado ocorrido odivelas ocorreu telheiro positivo pôs-se oitenta individualme indulgência incidências individualiz referir-se indicativo indicador reflecte panela regaço ditas brechas bastardos batia estou explicaremo evidenteme explicar exaltar perpassa desejáveis roubados desgraça sinédoque singular devagarinho sexualidade diamantes dezassete nombre devíeis noutra digam vultos voou típicas típicos típico tocar contraste convivem contínua contribui frequência frequenta ganhar frotas fugir potencialme afirmativas potencial científico possível ciência referencialid inaugurando distanciame insatisfação dominantes informa-me distanciada insuperável divinização domingos inflamado paciência inferiores tristezas reinante infelizes audição atirou-o trazem atitude ouvido refere distrai astros inicial troça disto ouvir trio benévolo bonito bento base qualidades punhado puxou-o punho declaro-vos declarou estavam estreme estrelas estarei esteira esteja estar execução exemplar marginaliza manifesta margem perna romarigães despachem descodifica sabedoria descobre descreve saberias sabe-se ricardo rodeio simbolizado simbolizam simultânea símbolo sonatas sintaxe dificuldade destrui-la negócios sete-sois negativa negativo naturais destinos vocação dinheiro violento sermão servido nascido vinham serra vimes dever ndia voei transcreve tornando tolstoi contudo fundidos gerando gabar fundo gerou frade faço fácil sacramentai pragmáticas condenada cristã-nova objectivos objectivar conferida condição sacraliza conferir lacunas porqu nuno porta junte tecer cima obrigações observar problematiza universellem encontrarem impossibilida recuperando encontrados enlouquecer rectângulos importante autobiografi paralelismo entendê-las conotações perguntada discursivas enfrentam preencher passaram paralepse consagra envolvem trezentos paroquial recursos rectificar procriam originais hebraica redentor original assados enorme profecia unidade assente importa imposta enviado profano mistura travado tropeça heresia pegava global tríade do-se duplo mina dura dons laia barroca própria protagoniza proustiana propõe-se propomos queimado prolepses proveito quarto queda deduz-se espiritualida esperanças espiritual estalava esposas esperou espiar monarca mónica moniz exprimindo expressas exprime permanecer mandando pitoresco marcado maiores desprovidos desrespeita romanesco supliciados anti-poder riquezas validando derruba desafia antigos apagar reviver rituais deriva xavier valido rezas rmos sobejavam sobe impertinente homenagem honestamen dessacraliza casamentos seiscentos ficcionista honorífico sensação destaque caridade destacar segurar destaca vidente desses dessa voado nasci totalit fraco fernando feminina falo preconceitos comentários cristianizado acrescentar confidencia criticam-se abençoado saíram-lhe cresceram afastar-se acreditam populares cinquenta práticas invalida cintura prazer saiba cristo enciclopédia rememorado transgressor premonições memoráveis pressupõem interiorizada miticamente literalmente lembremos consclencia intercessão lembrar-se pretendem rememora linguagem interesse interpreta editorial patriarcas pressupor enterrada conseguir emoldura caminhos empenho interditos emendar conflitual patriarca inusitada ecovisão pequeno entidade emenda conflitos renegar habitual questão enuncia carícias h~tória graças partilha interior relatos passes moços meses calcou limites metro lareira pense relato liteira graça parto amar unda cabe linha mito lido baltasarlblim baixo monumentos mostram morrido mora escaparam escapa equipa poderemos poderiam planta aparecerem aproveitado aproveitava aparências verdadeira sustentam subtileza variadas retratos sozinho archote sujeito ventre venho sopas vê-la sobrevoar situamos sólidas imaginação imaginando sentimental sequências sequência fidelidade imaginar sentença sentidos separam humano viveram séquito fidalgo casual hóstia cauda sentir vivem selar viver céus torreão faltando ficamos favores ficarem festas falso comprometid comunicante absolutamen acomodasse abstinência cronológico crucificado invulgares conceitos salientes acabasse cruzadas inventor abolidas acolhido comum acedeu aceitas acabar acolhe salvar acima acaso jejum jogos cruza salto acho jeito competência comparaçõe complement comparando compositor comparada completar criadora custódia compor comida santas custo antagonismo conheceram localizações conhecedor representa confundida localização entretanto anonimato considera prescritas anónima quiseres ambígua reparou leitores campo reparo lendas anes deitando-lhe degredada move-se mundos esclarecida esclarece esboçam eruditos ermitão eróticos erguer escura erros subordinada aristocracia subsequent arrastados suspeitas artísticos arrancar spirituel apertou aquilino arame ardeu solicitando sofrendo cerimonioso humilhados semânticas humildade chamam cérebro certeza ilustre flores forno fortes far-se clarividência clarividente abrindo clarão claro satisfaz entregam-se consignados capacidades amoralidade levantemos levantadas reprimida elemento libertada amoroso consiste levantou ludovice anterior candeia captam libertar lermos macau liberte ramo lume deitou-lhes deixavam verosimilhan verosímeis vértice subir verei iluminismo financeiros iluminados fingi-las fingindo firmes i.o filipe fogo cobertura cobrindo reservados realização realmente rebela-se resgatar deliberadam deles espada identificando idades colectivo colectiva resolutivas resultou resistia retirou construtora construída construtor responder ressaltam responde recolheu resto testemunho organização ordens ordres ordre materiais matriz orador opta terminaram terminou ternária terreno termo terre terzi mecânica medicina marvila medem cortesão cortadores cortarem cortejo alenxandre opressão algarves alheias tenham opinião teoria normalment notações notação normas correspond tendo-lhes tendo-nos temíveis alargar alegria ofícios alegre onírico onofre alcino teme olhai olha indignação pálpebras refugiada reflexiva palazzo reflectir pálida regio pálio exactament excentricida explicações excêntrica evocados perspicácia maritaggio desenvolveu desencontra desenvolve desengana desenhado desenho desejos deserto rostos nomeados nocturnos dignidade nomeia note-se nobre nível dilui tivéssemos correntemen cordas cópia freiráticos possibilidade agrilholados temporalida tempestade ocorrendo ociosidade agraciado teimosas alagados te-deum ocorrem agradou ajuda-o teimais teia distribuiremo inconsciente diversament independent influenciado informação influências panfletário ditemática doméstico regressar pagam-se refere-se incluímos regressa incógnito indústria dolorosa referido dividido dividida padeiro painéis regista ditados diverso pagens dívidas pagam página regras incluir ditado regra indica pagai reina brechtiana brasileira brasílica brandão brancos brás bassílica bebedice beckford benéfica bastaria bebendo benções bastava bendito beleza beira bate proximidade psicológica publicada psalmo ptima ptica estrangeiros estivéssemo estereotipad estranhasse estrangeiro estraçalhad esterilidade estranharía estilhaçada estivessem estivermos debandada estranhou estranhar estilístico estimado estranha estilo exceptuand exercícios explicativa exemplos exercitar exibição eventual exerceu existem evento exibe maniqueísmo manutenção persistentes pertinente pesquisas perturbar mão-de mariana manter marido manos desculpabiliz desigualdad designado descrição deslindar roupinha desejava saberás rústicos descrito descrita designa désigne rosário roubar desliza rufino ruins rosa ruas rufa sintáctica símbolos necessidade sexualmente significações devastadora significação devotament difamações necessária devaneios dezasseis noviciado devoções dezanove voltadas devagar deve-se sexuais nicanor novena devota diárias noutro devoto voltou nudez névoa ntimo deve dieu tipicamente tiranos tirania tocarei tocava típica tocou contraditória controladora conversação contingência contextualiz convencia-o convidamos conventos conversas conversar continuar convictas contrata convoca convite funcionamen fundamentai frequentem fundadores frequentam fulminante generaliza gasparini geradora gerações frederico funções gennaio garantir fuligem gemem geraldo gaiolas frásica ganha fugido fugiu frio fria juntando-se obviamente julgamento juntamente portogallo aforismos polifónico portaria possuir praças postas juntar posso prado teclas agita tecla ciel historicamen insubordinan inteiramente encontrou-o reincidentes reinterpreta documentos atravessado informar¬se intelectuais atravessava inacessíveis atormentad associando ostentadas distinguem enegrecida intellectuel diviniza-se professora misterioso distinções enfeitadas inteligente dizem-me associado assombro perguntar atribulada imprópria miserável trocaram refeitório reinariam impresso atinge-se iniciarem utilização dourados domínio ouvirmos inserindo ausentes doutores reescrita domingo atendida perigoso enxugou inserem dizemos distintos inserida assume trémulo inquieto enfadar autoras infalível vaidoso inscrito atribuía profere autores mística trazido divisão asturia insinua valério tri-unit atenta atreve ousais doutra dízimo dorme aturar trazer diz-se infeliz missa divino vales triste endo atrás ouso trois vais azul atar bolsos bocal bernardes biblioteca bisonhos barrocos bere bien purificam-se qualificáveis quantidade prosseguir quadrados provérbios pudessem purgatório qualidade quaresma prosódico pungente quarenta púlpito pulso pura declamações esqueçamos esquecendo declara-se decorativa estribeiro estanque estações dedinho estadia estarão estaria estufa dedos estás dedo explicitamen europeizant europeu expõe expo permite-nos maravilhoso maravilhas marcação permitam marcolino mandou pessoal pisado manh pífaro pires pinto pista pias revelação desmistifican ridicularizam denunciando dependência ridicularizad desaparecid descoberta desconheça despejando desprendeu ridiculariza desconfian revisitação despertam despedida ricamente descalços descendo romanos despejar depende rodeada rigorosa ribamar descaro rocaille valores robert sabeis rias simbolizando sonhando sonhado síntese sonata sonhar sonhe setecentista destinamos desvirtuado vocabulário vilipendiada implicação destrinçar negativas carmesim visionário dinheiros sermões detalhes servidor nascida vigiando serviria nergies nesses destino destrói virgem negros vieram vindas vindos desvia vim-te virada vimos servir viram virem vinda vindo carta carro série virar vira vier tornam-se topografia textualizar toponímia transepto torná-los trajectos tomou topada traços tomás trama topos contumazes contemplou contempor contam-se contenção contando contada contém contem contas conte futuro"como fragmentári funerária fradaria futuras gesto frágil fecundíssimo falar¬lhes felizmente feiticeiros fachada extremo facultar falando feições fechar feitos faça lacrimejante sacramentos pormenoriza objectividad sacramento pormenores obrigam-no criatividade confere-lhe sacralisado sacrifícios porquanto obrigação abandona cosmético confessor kaufman tardavam obedecer comendo chevalier cotovelos acordado obscenos objectiva cravistas advérbio sacrifício cozinhas justificar labirinto sadismo comédia costuras afectivo ladeada sacrifica cósmica cravísta cravista justiçar observa pompas cosmos confere choram acordo advém acusar lacaios obrara pontos costas sacros juvino judeu saciar saem ponte cheio sacro prata laço coto crer durante harmonizand unilinearmen transposição alienando-se 701 enormement consagrados mergulhasse reduplicação enquadrame gostaríamos privilegiados principaleme passamanes passarinhos rectaguarda discordância recuperação percebermo modificando encomende dramaturgo transgridem transitavam transportou parodísticas paralelística perfeitamen unicamente encieirados duplamente transportar predomínio assembleia disfrutando privacidade consagrava dynamisme tratamento conjonction transitórias disponíveis procurando profanação mimetismo melancolia dynamique camaristas engenhosa gigantesca harmoniza transgredir rectângulo molinismo harmónica orientador passadista disciplinas prodigioso entardecia universal edificador mergulhar enganada hipotipose procurado penitência península misturam misturada modestas edificação brilhantes mendigos assassina implumes dormiram recrutada perfection procura-o pensando minorcas caminhar harmonia hipocrisia hipérbato pregados redacção guardado paráfrase peregrina pedreiros melhoras emprega heranças parecem parideira pregador recusada discípula perderão procurou pegarem principal modelos ultrajada relapsas reduzida confirma mereceu injunção herdeiro parentes discípulo perecível presume pedimos milhares unilinear edifícios bruxedo diríamos implorar lágrimas hereges parodiar passaria grávidas entende minas milhões tratado engloba giravam glorioso principe pensam usarem mínimo dúvidas gostam perdura pereira méritos durailte tribuna mereça aspirou assedia queixos ensaiar paraíso auxiliar unir-se prefira confins medita relatar queres enredo gravita gritado assiste produit trouxe ubaldo léguas dúvida edifica libreto queluz recuar guardi ensino pensar meios duvida aliviou camas gritam usado moita duque parou aliviar brilha impõe perda milho relata légua dupla prega impor giusti parar guas caldo meia lama d'une hinos trarei alista assis avião urna trata herói urdir recri grito aves usar d'un baptizada baptismo baptista barrete profundidad provavelme profundame proporciona proporções propostas prolepse promete protege espírito esperando deficiência defendida esperava danação dá-nos daniel dama napolitano narratário nascesse nápoles nascem montes monjas naquilo narrar narre extensiva externa extenua planétaires revolucionári desacertada demoradam demasiadas desregrame demorando derradeira sucessivas sugerimos desacertar supremas retratados retratadas densidade desacordo suplicante retratada zumbaias varandim reunindo suprema de'molto vejamos sujardes varrasco derrisão apalpais zacarias veículos retórico retórica rítmico varões veludo supõe vastas risada sumir vasta variar vazão rezar varas ritual vede sono vaso sobredourad sobressai somando sombras somas smith sítio imorredoira ficou imediações impiedades impede-nos serenissimi sentava-se impalpável sensações visualismo visualizar vivessem sentimos imortais casando sensível católico impede sentam horácio visíveis sérgio visuais carvão seixas fichas viveza visitar vitória viúvas honra horas imita senta serás vivos visto vivia touradas trabalhe toscos feridos falsa precedentes adolescente acumulação administra conciliar-se inverterem acontecera inventando inventadas inverosímil investidura admissível adquirindo adivinham tamborilar invenções admirável adiantado adormeça adiantada precisava sagradas invocada concluira inventou cristóvão abóbada precipita sagrada cinzento precária precisos conclua críticos tambor inverso curioso admite círculo preces aberto sagrar saindo tampo crítica curso criado sairão curtas prazo curva curar curta consentimen confrontamo encarregado metatextuali lançando-se intromissões cardinalícias preparativos pretendemo interiorment interpretada metatextuai encarnação preocupava mobilização habilidades interessara entortar-se conseguem cardinalícia cardinalício intersecção embainhar lembrados lembrando mestre-de caricatural encarnada angéliques questionar miuçalhas lembre-se alterarem metáforas pautámos pecadores pretensão introdutor lavatórios laudatório partilhem conforme confronto relaxadas lembrarei confronte limitarem inúmeros intrínseca remetem renitente partições confunde metáfora quiseram passíveis lisboetas liteireiros literários interessa inúmeras pecadora entoando eduardo animado preparar mestres remédio amantes cabeças cardeais conflito lembrou lançada camisas previsto introdut laterais camões quixote lisboeta pediam lascado mestre bulletin caladas quitério encaixa livraria lombos intrigas pensou alojam altares ambas alusão amada amanh cargas pataca gozam pátrias intuito largas ligado hábito pátios língua livres loggia passo linhas paula latina aluno burro caída pátria lógica pavor pedia caiba caixa limita ecoa altos pátio lindo lóios peça pede leito lidos rabo grau gozo peca lello caiu r0is alti bala bálsamo definitivame definindo defunto mostrassem mouvement moradores morremos mosteiro morgadio musicais mortalha motetos motetes mordido morrem musical mortal morto morre escândalos escaparem escadaria escarlate escapar escala poderoso plenitude podendo poderosi poderia plantas plebeia pluvial poetas plural poço arquitectural aparenteme arquitectóni aproveitand aproximava subterfúgio arquitectos substituída subversão aproveitar substituir aqueduto synthétise symbolise aspereza arbitrária armónico ascender suspiram aplicadas apontado aplica-se talhados aquando symbole apelam arquivo spagna apelido apoiou armou sustos aspira armas tadeu surre talho apelo talha arde sobreviver situadas situado sociais situam chegassem seleccionar imaginado sentenças chagados fielmente catadura catacego vivências chamava semente chamou chapéu senão houve vivant césar sena sept torreões favorecendo favorecidos festteggio fantástico famintos faltasse fanático fausto comportame saramaguian composições cumplicidade compositore irreversibilid completame absurdamen comparação crornatismo culminanted salteadores comunicada acelerarem comparado sangravam completem acentua-se salienta-se companhia irreverente irreversível conceição académico academia compaixão cumpre-se abraçados compridas acabámos crueldade sarcástico comilança irrompem saltarelos cumprida salvarem abundam acabarão compara santiago conceito acabada salientar irregular concede abrange cruzado cuidado salvá-la complet citação italiana cruzam satírica santos acesso abside clamar irmões irónico abrigo cisma acabe isabel jorge sarar sátira isidro jean cycle cruz considerámo ansiosament considerado considerada canonicame elucidativas entrelaçand efemérides localidades conservou elucidativo anticlerical reposteiro repenicar anti-épico represent anónimos entrarem liberação cantarina elevação luxurioso repenica cantores canónica l'homme canários levados cantora elíptica cantam letras efeitos levava elogio andou cantar l'ordre loucos leva-a amito levou canto lucília amen cansa longe maça anno louco lixam l'être cara deificação deitando deitados deitar mudança multidão múltipla movida m-se escovam-se escrevemos escultores esegui'nel escritores escondida escrituras escreveu esforçam esconder escuros escudos escuras escrevo escritos esforça erudito escola ermo subitamente articulados subitament subjectiva sublinhar arrasta-o artífices artistas aresta suave status verde solavancos solicitá-las sodomia sofrem humildement florescência fondamental cerimoniosa fornicardes cerirnónias chamamos formativas ilustrativos fornicando celebrarsi formaram humores filtragem centram focinhos forçados cegueira formada formálio centrais cerejas forrada firmino fluente forças celeste humor centro centra ilusão fomos fontes fluido filtrar celas físico física fitas fixo classes saúde claras claros rapidamente consoladam libertinagem andamento analfabetos levantaram levantar-se constantes repudiadas levantando anacrónica reprimidos levanta-se analepses andamos analepse anástrofe constata luminosa capelães andando madeira rapação reprime reptizar louvado capelas andada eis-me capital l'union egipto eleitos maest capaz capar amos rasto má-f luís egas deixemos deixou deixam delas espaciais verificando vermelhas vergonha vestidos vertente viagens vestem ver-se veriam finalmente ibidem ibérica ilha seguem-se secretários secretário cocheiros secções coches cobrar cobria coche cobro reais receberam resgatados constituída realizado recebem realismo rebelam receber reagem recebe realça delicados esparvados específicas espanhóis espanhol espalhar espécies vicente idem ideais comecemos colaborador secundário coloniais colóquio coincidir colagem colónia colegas retemperad rechonchud constrói-se respeitar reclama resolve retalho résulte retira recomendou responsável restrição restaura restos reconstruído reconstituíd reconstruir recorrente tetraneto orientação ordenado ordenou tesouro teses matematicist materialism mastros mbito oralidade oral território mecânicas mecânico mediador medida corrupções corriqueiro correu oportunidad opostas tentativas teológico teorizar terceira alcance tensões aliança alienam alheios oliveira alem terço olho reforma medíocre marreco normativa notaram norma corregedor correlação correntio correia ocupando posições tendendo positivos temático temores alcorão oferta alain oiça regeneração reflectiu-se pandeiretas reflectir-se indiscretas indivíduos individual regimes indirecto palhav experiências experiência exaltavam excelente evolução exagerar examina evocada exaltava personalidad personifica persuasiva desempenha desgarradas desempenh desenvolta desenrolar desertava desfecho roubadas rota nitidamente dignidades diligências notícias diálogo voyaient voyage vulgar vulgo toca coordenar contrasta possibilitou científicas potências potugaise agravada ocasional técnicos ciências agitada ajudam tem-se técnico distinguiu-se independênc inferioridade diversificada incremento incontornáv dominação insurreição dissipadas dissipação panorama distorções dogmática instruçáes indústrias dividiram instituída diversos assumiu inclusive incúrias ouvindo registos distrair inimigo ditions divina beneficiada bragança bordeaux bentham beliches breves bastos publicação publicados provocou próximos estrangeirad estreitament estrangeira debandava estilização estiveram debilidade debatido estáticos estática estejam estética decidir exclusivame exclamativo explicitação exercício exclusiva manipulando persecutória perseguindo perseguiçõe pertinentes pescoceira perseguir péssima pesado designação desmaios roubava roque romba rumo sintagmática simpósios simétrico simo significativas necessitado dictionnaire dificuldades significativo severament diplomatas serralheiro diegética serviços neuburg diegético devendo dinastia violando deverão director directas servem diderot directo diário signo ndole violas neto determinado newtonismo voluntários detrimento determinar volumes voltaire noutros deu-lhe nicolau navios naus tradicionalist tradições traduzida tínhamos tolentino tradutor trágica tipos tinta tico controlando continuam convidado contíguos controle francamente genericamen fundamental funcionalme frequentou genologia fundação francesa francês genial galés fugas frase facilmente judicativame ciliciosament afrancesado julgamentos tecladament pragmática afirmado tarimbas posterior policiava cidadão agentes obtidos tecendo juntava afirma júdice afiada julgue tecido juízos importantes informativos distantemen proclamado ingenuidade mistificação ornamentos reelaborada improvisada ostentação relacionado atavam-nos atentament atrevessem utilitaristas relacionem assinalável impressões infundados doutrinária docemente proclamou minudente assaltando divulgador conjuntivo encontrou envolviam consabida oscilavam relacionar travessão domínios azinheira envolvido utilizados oscilação injustiças encontre atenções azinhaga profecias austríaco instalado utreque hébreux paradas inscritas divulgar disputa instalou utilizar inteiros inglesa infringe azeitão trineto atraso oscar trevas donne inglês oscila ateus tropa aussi bach baía bocage biográfica bertrand bigamia bisneto quadrilheiros protagonista propunha provérbio puseram prosaico provém queimo quatre prosa espontaneid estagnação dedicar-se dedilhada esquecer dédouble estúdios decurso declarar estuda etapa monárquica expressivos europeias expoente expresso europeia marcadamen marcando permitida mâle pilha depreciativo deparavam desrespeito valorativos xabregas desprezo descalça revistas ribatejo desafio deram wolff valor rgão xito rins xvii soberaname sonhadora sintéticos simas homossexua homogéneo imperfeito vírgula viria destacaram implicações destaca-se destinatário cartografia vigentes carreira dessas se-ihes carlas nelas traçam tomos tora contemplado contactos gheerbrant futura fusão facultando falassem facções facetas faleceu femelle facção falas feio 46 activamente aerostáticos aerostáticas poranalepse cristianismo precursoras justificaram praticament advertência configuram comentário numerosas sacerdócio abandonar confiança acusaram sacrificam pontuação populistas chegavam inutilidade activação judaísmo tamancos condillac afastado políticos começos concreta crescem acredita afectiva tardaria abdique addition afastar criativo cingem poético criticar aderiu talmud cria-se crimes abade sábios 736 pratas populi adaro adam saga corto dispendiosas eclesiásticas editora/nom empregando dispendiosís intencionalm interioridade empenhado conscienciali lapidaridade enciclopedis governação prejudicada ensombrada modalidade engenharia recusava-se prenunciava procuraram ministrados misturavam confiscados aventurado entende-se moderniza empirismo trouxeram rematando engenhoso heterodieg gulbenkian procurasse lavradores hipotáctico intensifica interessou enunciado pensativas duram-lhe transgride enraizado interesses percussão militância releva-se partidária gramática produção lanzarote transição almedina relatados budescos meninos premiere prestígio ministro uníssono membro relapsos bruxaria calouste graciosa prémios ensinam editions gravura edições câmara haendel perfeito perdem penetra querido graveto modos pregão alismo brusca meros gostos lidade goleg quero l'âme paris recta u-se dual mill bailado barregudo progrediam defeituosos damascos defendido deficiente dança dado montesquieu monumental narratologia narração nalguns equivalentes equipament episódio extenuada sumptuárias apareciment apropriar-se superlativos suplemento democracia superstição retrospectiv vastíssimo demiúrgica sucessivos denegriam revolução derrame variantes retóricos variando superar variada ventura zarolho sugerir vedras veicula variam venda verbal ritmo velas sons solucionada sistemático situa-nos sensibilidade sensualismo sentimentali fidelíssimos c'est-à-dire fidalguice vitoriosa católicas hospital fidalgos castiços castelo imitar casou vivaldi c'est tornozelos tornou-se fazenda ficaram faziam precisament administrativ actualmente criteriosame acompanhad involuntaria laffont/jupi absolutista compatifica preciosas concluído criadores compare cronistas conciliar abertura salda-se inventos criticada abolição journée açúcar abertos adoece abono cunho jaime jorra croit saía carcereiros racionalismo amadurecem ambos emaranhado interrogaçõe miudamente cadenciados intervenção enumeração metendo-se confrontado interjectivos intervenient pretendiam interpretam introduzido intolerância latinizantes pedagógico introduzi-lo campanha empurrava pentateuco alternando metafísica participou amazónia conhecida ambíguas littérature conseguiu repare-se educação limitações pretendia conselho lâmpadas relembro literárias questões pretenso lembram patéticos lendária ambíguo pretérito encarna r6sseau quintais lisboam leituras ligadas intervir anexim ligados presos locke quilo quis qu'il l'on balança mostrou-se mostraram moralístico moralistas municipal morrendo mortuário motivo mota esboços esbeltos erecção escasso escape plásticas pôde apesar aproximação surpreendid subordinativ substitua-as substâncias suscitando subordinati verdadeiro apelidados apreciada suspensas aquecidos aplicados symboles apostasia apêndice aprende apostar arbítrio tábuas tafetás spera aparte apoio arma semelhantes semânticos seminário flash-back chamada charneira chamado humaine cavada hume flatos ceci favorecidas favoráveis faltem fanico farsa comporta-se saltássemos completeme d?alembert abundância abundantís concedido comunista complexa completos compagne comunica achacado sapateia acabam comuns comova acabou joanina jesuíta ironia abriu culto cito captar considerava antecipadam antecipação l'escampett anteriores radicalizou eliminação lexicoteca canonistas l'éxistence lustrado cancelos cânones letrados raminho entrava repetia lubrido l'heure raízes antiga lenha elísio luzes raiva effet luzir anti deitava-se deícticos deístas movidas muda escolásticas escorreitos escondiam escravizar escravos escolher esgotar escreva escritor escuto subjectiviza suavíssimo vereador súbitos stuart soldados solfas sofia sofre filosoficame cepticismos fortalecida iluminando iluministas iluminista formação cerâmica filosófico formosos filosofia célebres ilimitada filósofos firmada cenários ilustram firmeza fogem forem filinto filipes foco cena fois clubes consolidação andamentos constitucion constantem anacronias raramente consolidar requebros anastácio andaimes constam libertino repúdio madre amplo rastos dele deixando deleite espelha-se específicos espácio verificação verificável verificada verificou ideológicas igualdade ignaro ii.o sectores seguem coelho resistências recebendo constituind reacção receita residir específica idênticos comandadas colaboração começasse coexistem colocasse colóquios colecção colhendo colocado consulte-os restituição resultados recobrada restituiu resulta reçoit reconhecime recreativos recorte tradicional desta criar sobretudo sentido ordem tendo aliás três seria humana carácter mente senhor conhecido apenas força perspectiva disso significado geral importância relações reino espera xviii religiosos projecto evidente instância simultaneam conjugação pequena entrada lopes mecanismos violentamen dicionário gerais condenados instauração próprias sinais passada pena destas concluir poca formas deixar oficial reflexo posição evidencia instituições integração nova objectivo ciclos príncipes haver revista soberano crítico invés embora alteração cardeal acção cumprimento abordagem concepção característic alfa reflectem publicações naturalment ntima instituição estrutura essência estudo descendent ribeiro determina carlos tomar factor crist procediment recusa dade horizonte total comerciais primeiras religioso patente interna quinto leis moral plena suceder familiares sarl efectivo cerca versão residentes espanhola identidade ideologia marquês notáveis portugueses excelência influência referidos papa pais público existência perseguição novas volta frequente frança junho inovação impostos bibl quadro essencialme declara permanência valorização reveste-se romano virtude particularme metrópole religiosa emente ensaios definição definida defesa nacionais episódios risco solo castelhanos horizontes actos consequênci semelhança cedo fases complexidad cultural culturais culpa abril canónico levada movimento movimenta ilustrado madrid maximizado ordenaçoen tese mbitos alheia medievais martins alcandorara alemanha tendo-se alberto alianza aliada regimentais reformista reforçado marítimo nobiliárquico normativas norteou corpo correntes portuguesas tendenciais temporária alagaria divergências incidência regenera incidiram regência regalista regional países régios estranhas estima expansionist excepcional explicando exaltação excepção maniqueísta pertinência pese sinónimo nomeação dialogante nisso vora nihil continuidade coordenador contradição cooperação contraposi converteu geográfico garantias garantia geração garante frica ainda povoamento potenciado portugaise ocasionais agitação técnicas ocasião portos aires perigosidade documentais inquisitoriais disseminada inquisitiriale documental insustentáv distinguiria assumir-se assumiram integraram inquisición periódicas inflectindo distintivos atribulado inquirição inquisidor iniciativas induzindo inquision instigada períodos inserção iniciativa iniciada inicisiva atitudes pacífica trento insere papal troco benignidade beneficiou basearam bennasar bartolom bernard bispos bens provinciais províncias públicos estruturais decadente estatais decisiva explicitados existentes explosões europeus manifestame manifestada persecutório marabout março pierre desconhecer desmentidas desobediênc similares direitos diplomáticas significativa diplomática diplomas viragem directriz vimento negres ndice vols trajectória tomaria tica contestação conturbada contestada funcionais franca observância obrigatoried conduziram polarizados ponderada conduziria conferiria obstando conduziu obrigado pontifícia cidadãos judiarias pontífice políticas cristaõs cristaos affonso pombal kamen cristão costa juifs problemática processualm conjunturais paralelamen historiadore universidad ultrapassad impor-se-ia envolveram processuais autonomias disposições globalidade assinale-se autos--de-f conjungam dramáticos assessores meridional assacando insistentes enveredou oscilações conjugada inglaterra ingerência relançada laicização legislação gonçalves privilégios autónoma prioritária princípios conquista redutoras averiguar prefigura paradoxo imprensa henrique assinalar informes universit reduzido mentora assaltos paralelo disporia avultam minoria tributos historio usura henry inova proveniente protecção queixas provas prover estabelecer espiríto dariam monográfico monopolista monarquia expulsaram etnias etnia magis malha retomaria demarcar desactiva wiznitzer validade variável antigo révah veiga sónia xiii sobressaem sobrepôs somente siqueira imperialismo virtualidades destaque-se implantação impeditivo senhoriais visitações carvalho se-iam viriam cariz tornavam traçado fossem febril face concorrencia precediment admissíveis acrescente acréscimo crescente confiando adquiriria inviabiliza preceitos pontuam concílio judaico aberta crime confiscatória primeiramen intrinsecame entendiment metodológic lançar-se-ia participação emergência económicas económicos governativo prevalecent largamente eclesiáticas remediá-lo guimarães eclesiático buscariam confissões relutância membros relevação particular pequenos relativas hachette hamilton passava internas lavradio almeida gráficas limpeza lamego relativo editora buscou gozava rendas pedido almas grave bula alvo progressivo progressiva progresso definidores defensora defensiva definitivo defensor definiu definir moreira equilíbrio pluchon poderei subvertendo sucedem-se supervisora arquiduque apresentar souberem tallandier aparente velada sentenciado hostilidade humanista vivamente católica cessam cesure fiéis tortura torres absolutismo cumulativam acidentado acentue-se irrecusável salientem acentuar salvador isenções joaquim janeiro sangue saraiva saldou jornal cisão civis caracterizam caracterizou caracterizari anticlericalis conhecerão consequent reportáveis conheceria pretensões congénere conhecem racionaliza emanação efectuada radicação entronca câmputo ameaça campos radicais edward londres longa múltiplos socioideológi socioreligios sociopolítico formalizados centralizado formalizaria fortemente flutuações centraliza fortunato central cego foro fariam compreendid clássica abriria consistência republicano consignado repressivos repressiva canónicos lnquisition entrega maciça ltimos eficaz ltimo ltima luso luta esgotar-se subdesenvol vexada financeiras financeiro finalizar ibérico ilhas fins secretismo cobrança seara constituição constituíam ratificação amplitude rastrear demarcada delito especificidad espagnole espafiola vicacionado viciação vice-rei identificação ideológica ideários segregação coercivo recessão receitas recente combatida responsávei responsabili restabelecid restauração restritivas consuma reconquista melhor idade termos medidas número ponto momentos matéria serviço papel próprio estudos apresenta coimbra instrumento santa razões alexandre oficiais brasil herculano criação resultado régio inquisitorial marcada percurso sejam circunstânci testemunha desenvolvim assumindo nica posteriorme tarefa porto maio actividades relativament moderna principais clara formal secular orgânica meados cortes medieval regimentos regimento regime corrente instituto brasileiro ruptura sinceridade dinâmica siécle potencialida azevedo institucionali inquisidores inquisitores dominância assumida estrutural romana conducente político crise processual mendonça discrimina peninsular impostas baião nacional extinção reynos ritmos zação sistema acusação cúria cargos partir burguesia pressões confisco governo alta erário pleno ascensional arnold causas comunidade acentuação complexo santidade civil lúcio forçada capitalismo verificado igual sector colonial restrições português igualmente manuel maior alienação conversão reinado população repressão antónio económico efeito média integracionis controlo atlântico estado expressão pioneira factores judaica económica suspensão especial país social processo período longo paulo cultura régia estabelecim relevância comércio sociedade fase portuguesa ento política direito edit através santo século tribunal ofício cristãos judeus novos 721 714 0 lisboa portugal inquisição -10 -40 -30 -20 -10 0 10 Figura 3.9.2.2. Biplot correspondente aos dois primeiros eixos do espaço semântico relativo a 90 textos e 5678 palavras envolvidos no ensino do Memorial do Convento de José Saramago, representando 27% da informação total. Examinando esta primeira versão do ES constata-se que o texto número 471 – que é o de maior número de palavras do conjunto dos 90 – comporta-se como um “outlier” uma vez que condiciona só por si toda a geometria do ES. Também se vê que este texto aparece associado essencialmente à palavra “inquisição”. Examinando esta palavra – que ocorre em 18 outros textos – a sua frequência no texto 741 é 24. Isto sugeriu que se construísse o ES eliminando o texto 741. Verificou-se também que o texto 698 estava excessivamente 128 dependente da palavra “operário” pelo que o ES foi refeito sem esses dois textos, retendose então o ES que está representado, usando os dois primeiros eixos, pelo biplot da figura 3.9.2.3. seguinte. Examinando essa figura, verifica-se um maior “equilíbrio” no sentido de que a respetiva estrutura não está excessivamente dependente de um só texto ou palavra. 09 capítulo 10.0 baltasar padre mafra blimunda bartolomeu máquina lourenço construção pedro conheciment 711 partida monte voar viagem trabalhos junto casal 684 688 nascimento pedreira sete-sóis vela holanda tomamos regresso descreve-se infanta assistimos acompanha doença 690 bárbara promessa encontro sebastião decisão final venha 713 infante 689 roma scarlatti depois basílica primeiros parte feita trabalhar 716678 voador vemos deus desaparec francisco mandar disse estabelec seguindo príncipe arder altar milagres 686 676 alentejo toma terras espingard envolvime agricultor capítulo edificar ocorre sádico beirinha faz-se conta-s esmagam religiosida conseguid discretam empoleira relaciona sagração entreteni marinheir contraba paço recomeça benedicti informad aniversá haverem frustraçã assiste-s científico damo-no obrigado vendere aumenta expropr participa revelaçã entretém epidemi sujeitos estrago informa janela sobrinh amarel corrupi criança funerai incêndi podere pontari constró jornada mateus tourada convida descida miséria repara suicídio fala-se réplica vergas boeiro gastos provar região quinta tenho apara dá-se febre cura teja conclusã cólera barcos reiteraçã pedra degradaçã inquietaç esquerda procissão miniatur sabe reais música baptizad visitas primeiro trangloma inauguraç inaugura começa cunhado alague chuva sopre dirige neve falte caia solou vento igrejas terreiro contacto extrema visita toledo pobreza pero breve segundo passagem setecento caballero chegar fogueira torna-se revelar jerez família domenico sonho caracteriz transport ambiente tentativa filha fosse somos alto jogo 710 sabemos ento milagre notícia professor corpo diferença casamento voadora concretiz participa oposição pinheiro outubro franciscanos abre irmão primeira atravess escolha estão encontramo origem palácio fazer riqueza marques nesta 687 projecto segredo alquímico 679 inicia palavra auto-de-f medo perdeu busca lemos filho responde 715 719 680691causa diversas nuvem gancho 681 voara excesso pergu suspeição construir ferro simbo vime união liber ouvi podere tendo voo bené materia conjuga majesta imperti pergun univers acomo honest prepar totalida espera indulgê interce lembra cresce segue sentou respo honor patria pudes conse eleme esfera frequ noite torno braço cham estra balõe efect repa spirit viver cons favo trope antig traze esta fida repa retir firm dist esp voa cerc frot gab sóis vali cus por jun ouv troç ver voe ard pereg acolh corr saib séqu tens aconte entard ter nom harm queira bairro transgr código simboli toca clam hou rein dizdeclam guerra desmanc represe secreta sentim fondam subitam estran profun testam aproxi colabo comun contem estives refugia secret tipicam abre-o concili conjon constr obriga tempe difama númer condu consti domin engan institu intelle juntos leia-s lembr miste venda autodeific synth lembr pertu comb dezan libert plenit queim quise reme cape escar escon essên estaç exerc lumin prepa sequ abób carde criad l'hom pass serm unida inqu iuris perc retór terná aspi ensa impe veícu cele colh intri prod teria unir dore etap flor orad pon résu tri-u vier luas l'un sen junt vim fing fug luta mo pan viva fas ord sac sob trar vind físi l'êt lou ndi gri die cie fecha suspeit símb setece conivê enfa pát dissem pod encontr dogm feita 692 estav mun seja mari ambí soube coete defe astr tri casad resseq enfren veja mecâ acomp vision acaba torna clar quer aula lado univer tempe faltan violenta igualm conscl ocasio duvido sinédo violê dedi esca sop ram recol l'ord decreta desman envelhe apresen antagón particip recentio reporto respect ecclesia julgaría comple encorre enferru precon revelam compa continu cristian deitand enlouq envelh miticam parece regres sebast unifica agrilho aprove cobrem colecta desfer diversa divulga eternid parale perma resistê absolv canoni carreg concep concor declar esclare escolh escond excent fingim lamace pontifi primav provar rechon simbo acusaç andori atorm compa conse destra diviniz estuda fragm ganha insupe licenci pergun preten abenç afirma deitou doctor esque estilha ilumin qualid sobeja anti-p capaz cumpr decre despe destac guard impalp inaugu ontoló precis recon sobre tornar acadé achar açoug constr deficiê desca diviniz sequê suger bacha canse comp conte inflam metá panca prima repos surgin alcun baten calarcanon cedes cober deixa destr escrit feitiça inferi pegar repre veter trazid acusa branc cientí eclips exced exem oprim parec piedo polar unive usam virtuo acord bigor cond deixa estim femin grávi hebra inven inver iríam mere meta noutr ombr prega prodí sacri sepa sublin tivera bálsa cano cobri corta enxu força incóg lágrim nuve profa sabe sonh triste víam asse balão espe esta expr lame puxo segu tapa voar aleg aper atiro brilh cand dout estre mete olha rene viole arch ajud aliad cheg corta malh nasc puxo saia tema usbo acei acha beir cego criam desc exal incip loca logo oper pega põem praç quam rasp resis ruga sent sobr torn traz volta chei civil este golp lend mba ninh pan pele pleb pólo pôsrega rubr sólid tena vêem vers alivi calc hós lare libe mof nico ruín test tota dito dor elei forj logr pun sus tect vitó arc fort ntim plen sujo vive cald can mis oxa sela toc vale bat d'u libr lum sen frá fre sal cot fog sabed simbol trabalh part cintu viésse apare amar cor agarra mascu abreapag entende alastr hum esperáv absurd preci barb mord aviso reti név fra ansiosa vêpedre dav bas tom homog leitu amora amor confu pre viola excên retrat esca pin impo desenc famin desgar dorm symb sep fazi rea trev que inquisi sente aqua lei cur traç princip intoler anacr execu conc medi com sobre explica aond contr lisbo huma dificul natu inim certame absolut encont entrega humild imposs transfo inaugu interior mergu obscur privileg sacram atrave cardina cilicios ensom escând espiritu inform miudam passam persec sintagm comple conven demas despre entend equiva escolá esquec imedia perseg saltead abstin ambos conseg inaces improv meten mouve partici partilh recusa retem termin advert aparê atavam cardin conde confer cristãdemor dynam enegr estran excep interse involu localid reserv roman camar carcer c'est-à chama config desejá desen espelh invest levant mand ostent penta planét procu queim resga secret semân sentav solava subita aband angél apelid correg cortad deban desac desco empu encar esper harmó mora respo subve volunt abraç acred adian cosm escon espan exten felizm lavrad levan objec operá pesco presc procu deitav barre carm consa facilm facult instru inutili isotop l'éxist mend perfe ricam sagra secre symb torno bapti coche desco deser estrib guard interd morr opres preci refug saltar verifi zumb arras canta cham comu contí esfor espe liteire nasce perm procr provo pung regre sacra soma varia austr alaga aman bude colhe come dédo douto ecov euro mort move ontem prem profe próxi rede somb supre vivên xabre afina cegu comé dese ensin escra estát exam extre idênt irreg mad maio mult paté perig prec resu talha apre bran canc cent cruz desc distin envia eróti girav italia letra relap rode serm varia cósm caríc certe cham com dési enca escu fulig hébr pano reag roub voya addi alco alien asse barr dura forra gem inve jour nerg pain perd quin serv tece vinh ajud aloj ama apo belo chap clas efei entr erud fem fran joan junt pag pare pass recu satír sofr aze carg cing coch cord dire esta estu laca liga preg rece repe rode soci volt atra cau cris dan dec diga digo este fech grit leva ord rost sáb salv talm toca trág ved velu aca alhe cur ded estu jeju me páli risa tare vira visi vivo am coc dei divi don hor jog ser tec torr orfe ada avi boc est juíz larg lixa ma opõ pra ard cab céu cim cyc fug ga l'âm luz pap tem au faç far mâ mi pis po ca ce c'e eff sít cro va vir ce ro sa fo l'o rin falte sexualm castelh suces doura litei ba diversi d'u clarivid derr ilust perd domé introd tro valora va acomp foram quadri transg disting crucifi canon bie tor melh poe salda aram deva deprec viag finalm assalt tens boc 720 conve obra perso escri historic heran ibér homen ne agrac apên inusit dele ascen man ne sozin sereni defeit corre enge diss espá ofíc vaz be vis rom distant desp exag ridicula esbe tribu varõ crim sona corte tama freque fidalg fida irmã vision marav chega retór cultu sac sup bele nav cul tec cu rgã criar severa bre ved olive urd aliena exist alie aparece fecundí maniqu metafo perman aprese arquite casame compo desculp distribu enorme insubor amadu favorec fundam recome sobred aproxim desapa emara entusia estere estran floresc influen judicat manut respon sensib apropr aventu cadenc cerimo confun consci consol desreg enume expect homos julgam lapidar preocu propor saltáss teclada analfa aprove consag devota disfrut duplam encom fundad habilid oportu ornam prenun procur propós subord substit superl transit unicam esteril alenxa atreve confis conhe desres escân escap explici fornica implic indifer minist mistur monár nitidam pande resistê signifi subjec abund comen compa exper gigant ilustra impre indign latiniz marita matér ociosi pedag pragm psicol receb repud transg anticle carica come determ ditem docem doutri escor excelê feed-b fornic mestr napol neces pudes remat reprim suavís subor pecad admir assom celeb densi desen dizem edific esegu explic festte freirá hipotá introd metró penitê penín pensa persu porto prete purga sonha verda assoc chega comil conju contin debili devan duram esper estiliz estra ferna hipoc limita mistu mora morg pagam percu pesqu produ quare regre reque result suplic supre suspe armó confe dama desce episó gaspa gerad impre levar mortu oscila partiç profu refer reina retra salva vives abun acha comp cravi dedil defic empr escon exce igual impo inova lâmp libera obsce paren partic passo peca perse prové recus sinal sofre suspi ultraj agra atend bebe beck bené corte criad de'm discíp eleva esqu even form injus justif luxur ocas prod razõe receb redu relem religi roub santi sinté situa te-de tende tetra tínha utiliz algar aniqu ause colon comp corre cron dana dand deita exibi insta lemb mote puse rebe seme solda sujar tarim vagu varra implo afec amb casa conc crav cres critic desig esco exer genn grac marc marr nápo nota pate pedi pode polic princ pros rece sacr sapa serv acre arqu artíf belic cant decl dese deve divid dúvi este evoc exte falta faná gara inscr lanç mas múlt mus para pom prot ram rústi saiu salvá afec agen ape artis bala bend biga conf curio defu deix esfo esté haen italia leva ouvi poss psal quei reac regi sexu spag tard vaid teim abe assi astu casu defe elva ficar insin irmõ man mar orde rosá teso zaro abri ado alhe ane arbí arm bail cap dev dívid edif eisgoz gua libre med onír pátr pen poé reco se-i son súb sug veri virtu aliv bols bru cam can cob cruz dou elog háb imp l'he mae nas ous reg sab sair seix som surg tafe tosc vari veic viúv apa cap duq esc exis fog gan gos hon igna indi mo nov pob pra ptim qua sen stat tram trin vire ant cóp dan fan fize futu ges invé julg lida ofe pát pav pop ras súb tive viva vulg afia ann hin iron laz mu osc reç sol vio peç atr ced flat fus gra len mped risc ritm vul cor ltim olh ou pá pe rab sof vas ve vir laç nic pa pil qu rud so tip viv ata cre fri luz tin toc oiç qu te al an fe fri brasi dolor corriq norm rest rai decorre libertin tarda olh pala dízi zaç semelh secç estreit morr míst cava tábu fau contrad relac sagr desm bisn vind que sim relacio destin exclam apos mér cicl cai pod entoa prom porqu fals pag mane ma indisc própr dad ocorrê contro reuni ilimit pluv revisit fra feit ii.o parec herde obrig arbitr alus desigu procu morr cená técn visív reta discip dispon articul berna objec bata cabe infal vas pas ros entra visu exem segun anda entr ente desmis ausen vilipen mime depe cató sua pos alis lend me camin altar ares condena harmon recuper conhec crescim depend encarre rapidam denunc localiza ridicula transpo 673 comple conver crorna culmin definiti inconsc lacrime marcad metate mostra passag porme posteri protag rectagu adoles arquite compo conting demor descon despac docum encont europe intenci interpr manipu monum natura objecti purifica recupe reinter privaci acumu aerost cerimó consid drama escrev exacta ingenu metate modifi perfeit podíam precur provav sobera suplici transp acentu arquite assem ceptici compa degred elucida encieir entort entrela equipa esparv espon justific mistifi mobili pratica progre quanti salient signific surpre atenta consu design esmag estive harmo influên interp juntam quadr rectân sangra subter tivésse tratam univer passa cerirn conten dezas emba engen escult humild invent invero melan nume orient pertin senho admis aprov braço demiú forma imagi lembr mecâ negóc prínci prodig quest repre sacer sensa verme minud acabá altern biblio comp confo conhe crueld deduz distin enfeit escad hipoti impre intere lavató metáf mode morre músic nome recru relaçõ topog torna transe trezen visua aquec assas atinge atribu chaga cientí defini desca entan implu irrom marc noctu pergu refeit semin sente situam subtil topon trans varan anást anda anón asper camin conta cotov cump deixe delica desej dignid frede gram hipér justif mino miser norm obser prega prete prosó roma tenta troca vergo acab anim aplica apon bison canó catad catac coloc cozin envo estilís judaí mate metá mode nacio ocorr ouvir perde quare respe roupi sagra seria torre tribun utiliza visua afirm aplic atenç benç centr confi cristó edifíc espa ficam humo indiv inven jesus labiri notaç pass pere presu ques refle relat sabe torná traje acab basta brux caná costu deve diegé dizem escu espé facha focin ladea mão mest porta prev rapa recla roma temí tives trava vesti volta later bast cam câno cinze cont cosm esbo glori imor inven nasc orde pens ribam suce zaca abol bulle direi elípt escr evita grav hosp mac med obse oiten refle reso retó roca segu tema veícu quad aces alhe amb cala cere chor deueme esgo esta falan gera horá idad lasc lomb mes nica oraç pens prof quité valo vice absi aco aleg cast diár distr dita esco fale ferid firm flue gaio infri limit sínte tem tiran topa vent vest virg pisa auto carv cost diál dúv frás jesu légu logg mot neg nou nud pág páti pern pos púlp rítm sag tam trou uba valé vermod ade afir and asp atur corr cria egip exp louc mor ono serr sub vírg acto cism clar dire dita dup fom fon fore gen gius ilus isab jud juvi latin par ped rez smi sum top usa vive fluid ach alci bur car cela dur efe imp jaim lóg lon lucí pre rufi sar sát tad ass cla eco exi imi isid lam ritu ruin sur talh típi val be lind pir pur sér ter tot rec ave eg exp go jor na brá fal fita pia az or fix vie quer consta brilha bril olh comec escova prete subi naq lég reg ape ded falar¬ brasí profis bib imorre erm vocabu decor sacrif con levant passar cape funer pon mon segura chega traba bassí caíd louva sarama siéc tambo tam assina criar imper borde reelab profan estran cravo defin refer aber céleb refe leva son indir funcion inferior unilin cumplic pontu intrín uníss senti vigen repar pade santo eventua simbolic afastam alienan comen devaga generic injustiç revoluc unilinea antecip contro disting empre enquad indepe interior religios tradicio afranc andam human imagin intençõ lembra organi permit profun proxim activam antecip confro desvirt encarn exclus interje marav predom tempo critica desem dificuld econó estraç expres incont interve retros suplem aventu desen estagn frequê identid l'escam mostr verific apare contam detrim freque intenç irreve prosse recrea reflec religio serral adivin consti dedica deneg design elimin ficou implic prové public raram tendo distor engan exalta flashpanor qualid recob repen adorm aforis bênçã biogr coexi conse convi defen estive indiví influê littéra partic simpó solda militâ charn come destin devoç discíp educa esfor inicia medi most muni novic polifó potug princ propu torno trave verifi alcan cerâm colóq conc corta dinhe intere invoc lanza muda parid quise reesc tradu carid come enco falas literá mere narra pode reina repe tendo term varia vejam verea afast apalp canto colag conh deíct mem milha ocor preté remé salie secto milh abre espe estú exalt infer inter món prém regim situa torre tradu vigia abdi assu carr cast direc editi enca erec espa insta lisbo mar nalg nobr pene perf revis ribat sere supe terce trém câm cont mer mov nout nove opin varia acor dest devo even feiçõ fest grav grita inte ligad moç pata prec pref que des há-d lubr roub facç form hav resi saú abo am baix idea per pífa ver cés dam filip fort mb mil not plu pro con gol lev nar ndo pul rum tris vin agi bei cru her lóio pio urn viv vol ba du ilh ruf us lut xv reves suspei simé enre espec inclu tinham efemé azinh ango cruz técn atre pôd cida conso voya club sabe país deban sea porana segred comu narra son interro estivés mecâ oralid força poste repr por fa constr pálpe quis partid infe autobio famili porme inúm insatis temá verdad econó ocorre criti enrai deví hum dele resga verif lim arte divi duv irón sedução cumprim el-rei monum comuni clarivid compro caracte compar dessac identific enfim essenc individu lançand rectâng consag contem matem montes redupli regene signific acresc corred descen desres devast discord domina eviden explicit irrever recons sensua vila confide conota constr cristian enciclo filosofi newto parodí sentim velho arrast democ estabe individ mater necess novem perten popula procur substâ anonim d?alem depar julgam perspi preten selecc sistem supers derrad ideoló infund possib preen propõ realiza reside ridicu susten utilitar adqui assum consa corre degre elucid empir ficcion ilumin invenç perten procla radica ressa suscit coord divulg envol esclar escra fidelid intelig metaf rebela reflec serve acusa anti-é conve desgr empe encon escre ideoló lauda ocupa paciê popu públic sarcá sensa anast emen ideolo ilustr ludov paráf rectif corre laiciz ampl arran colec decla enorm evoca fundi inser nasce patria pequ punh tradiç vocaç barro benth criad custó desti dinâm erud evolu exclu exérc filosó filtra indús infeli poss prove teoló cató cond deta euro habit paro páss reali abra atitu conc derr festa filóso fizer graç lacun satis sinai temo verte volum acab divu está freir ganh sinta siste veio atrib auto equi ergu plan prov repú adm afas cent corr cria dide ingle mas nico tent típic farhum pen tard alis esto frad gra inic nar tent term tría aba raíz tom var eta ing levo nob stu ane arm ate tes abr ale elís loc nív wo de leit lai lid op sa u-s dil m lend sacral emen viei respo r6ss teor conce experiê intelec declar subje rouba cresc orden ven notíc panfle tolen assa deís prime boca humilh prince filin passad person prest seisce futuro" fals lustra flor reflect usar mo edua ostent públi aparen invulg europ miuça mad sou cida morte trinta entusias prepotê transfig monum antago arrábid comand consoli dispend francam reconh verosim capacid criterio eclesiá subord sumptu absolu aparec cerimo corren denunc despro dispen editora import literalm potenc preced aristoc destac fidelíss fundam govern interve margin perceb prejud proclam relativa sexual benefi comple constit contum diction empen engen favore increm juntan persist qualific reincid aceler cartog corrup despej destac diplom domin insurre ofício referê testem clima dignid entend fortale impied inverte laffont moder movim resolu verosí absolu campa diligên dissip fulmin restitu result sabem suces trouxe vastís conce conse corrup expre intens opres recorr sober altera amaz ambíg anale comp condu confia gener indús inglat potên precio resolu voto aplica braga cham confe contr dezas dividi expoe medío produ releva relax arte azinh confli deixa desce desfe domí exerc feitice impró nega obed oprim pode poten sintác symb territ cabe contí contr convi deba derra espa form geraç guard meni odive plást posit renite trans vitori advé aspe assu bertr diver episó injun libert lisbo minis mode movi neub pass péss ques refor restit servi técni teimo toura coinc comu confe cons decu dinas dom fazen firma impo incúr opos relap retra sere utreq agita barr cuida de-f facçõ ficar firme inva posit quar sadis alian ciên crist disp ediç engl esca face jane obtid pesa rept suje açúc citaç gost justi nom rela sant dá-n desa futu nasc palh praç ritua secu situa aleg bas coe ditio erár mat prov recu vejo xavi aler cas doimit irão roq sain spe típic vas vult cun dup jorn par plen can cos est und che par sae sof filip má tra be rua cit povoam disfarç objec sim míni desace dess adv institu forma confl terre morad esqueç solucio reprim valida espo anda vide apo inicia sodo figur mei compo solicit molin utiliz rece narr alt brasi dramá qu consen exprim origin favorá aprec frada mag baltasa manif ajoe inscrev estudo poca del espanh determ lemb tom sen transp revolu dizem velho laje busc instaur livre mobiliz acaba diama perpa pêr acha velha visitan rainha ordem benedic consegu materia porvent transgr transpo compor encontr gratuita instrum solidari centíme conven desem desenv actualm sacram gravide inform espess esquec freque narrat sequên modal obriga gheer tonela consid daque liberd nascid popula profer redon sacrifi sapiên vaidad gulbe hetero imate imola levara mand núme turísti aqued enunc paroq pobre direm espec frequ varan antíte arrob geno imola notáv recol símbo sonat activa afirm alme carde força funda impo lavra reflex vend corri diegé eleva entra ermi expre have idade instit largu here calou dias garr quin seria singu códi defin fuga ness polid poss alca ensa fam fren jude quilo supo cabi dera guia pass aca ben doz mor resu sérg tom vind dev júdi nor pau pes rele traç alia diár rela res rmo tira dist gua cris por fác sag foc tic seguint ideia anjo lugar anacr passem ferros descr redent humil marq ala recur robe material auto exten convid coimb princ relação obras humani simples represe compre confron conside deliber funcion gostarí queima cronoló finance preten desenv evasão sete-lu criativ destin entret interes sucess associ bastar compl espec senho enten lingua sete substi horizo pertin repen suger aram escrit exerc lexico propo realiz partil pensa perm deslin desta incluí inicia inúm redac possa noviç pedim dond inser torno frade intro pape terem trata apel cole difíc facu livra pere vers alar auxi conv púb divis acto aten fund incl larg sen erro fich linh alu linh cria ria pautá forma contex nun musi pega levante cust pessoa entend saíram min filtr lido adminis intromi marg mistu dita comprim criticam caracte instituiç portugu referen distanc inteiram particu compa comple consta import sentim confun escapa imped melho obviam recons referim testem questi afasta acade brech conce conjun enterr existê passa profes sentar catorz mergu procu textua aband daque defen meio confr cruza fantá imagi salien setecham coisa estan fielm levan move posiç contu estre geran sema céreb diríam fingiform funçõ hãomadr políti resta abrin comp conv pess recu rigor torna audi chão desa peso deix note reviv tenh dive nout acim acus bon cinc met poe refe gero terã dele forn glob jorg líng traz vaz nico tece teo nor vive jeit tra xito r0 morre morr sala sens ptic colabor pitore h~tó ajud fingin esta transc referi telhe fictíc vim vent falam alfa ciênc destes capacida ausênci problem desenv mármo consciê omnisc talvez necess possibi raciona portug recolhi valoriz admin estran terra activid corres simple introd esteve conte grand espiri public sentid cresc colón conf galer mea fábri livre tron volta voze forç dess rela alm sar end fica reflex farem claram reale reve trabalhador companh margina falsas caracte estrang excêntr geralm ignorâ secund contem proces memó parale cinqu estrut levan prolep moste consi cultu franc bapti brech parti cunh exter glóri maio clero refe círcu ensi intu pert idei osc partir peque anteri 699 fact pressu press estava i.o literá marc saber constrang mulher durante conduzi passand explora remem premon consign memor pragmá proced explica conhec distanc inform lembre romar semân subseq aparec descod discur sessen simult verdad comer grand intere proust remem solicita profun realm entos objec emold segui cheva desta indica religio anale artíst deba esboç restri desta aboli colóq profe serão ante desta enun expli capt class gent aced quix ricar cent lerm and oito ribe deri ilust tols junh ma don jea abr lel determ sonho leitor sign aqui norma incidên plano vontade sofrimen acontec direcção informa medida descob tendo lembra disser situaç capel popul asas carga origin retra daqu dess crític razã ouro curs pau críti luís carn parte nomead vida riquez temos espírito aprese autorid portan image localiz quises existe poder interp andar escre aliás entid conc rossi falta filoso frase have leva mon ficam pedra natur conseg vive auto liberta ponto espanha mecanis consequ contrár compet desenv digam novo propo feito mode períod kaufm domí religi nacio mina cham letra oficia lição praz régi fazem longo prole acedem narrat narra inquisição físico lugar enciclop perman libertad aborda chegam circuns temáti criaçã europ santa eleva polít 675 736 concl conta cultu empr estu antagon mort dist duas podemo sumptu adjectiv aparece comung enumer imortali naturali distanc perpetr pretend transm despre exorciz desma celebra integra repres fornec minim monar rebusc sublinh expres pessoa exacti imagé proble verific inferim didáct privile forne pared subst deixa espéc perm postu prete tradiç citám alcan ause detal prátic recol onze reme desta iróni revo inter long tradu vérti gera ness resid coro evoc sirv elucida realis regis trazêconsci condicio recorrê atraí fictíci assistir infan joão 677 simultan ultrapas contar semelh seguin veracid nascer retrata simbó dedica difere espelh projec procu univer opiniõ adian mostr serve integ seis camp josef carlo eram mer ação ates anacron 685 hesit supera construtore ngu exibem questio cronoló 669 pistas principa integra literarie mundiv contem testemu autenti compên referen textuali referen coisas modific genoló imagin indexa contam conver impos sobres acentu autóno bessa precis ilumin indire consti ocorri quiser tornar clássi literár profé quase absol agust manu esque gabri revisi exter fingid nome recria aqui cump ludíb cláud teve deixa lirism oficia refle cade crític insis llans omit rníti nele líric 718 metat franç assis espec filhos denun espaço dicioná represen surpreen parece contem metros reconh duzen presbí hercu narrat morto serviç dizen neida olhar nota letra post euri situ o-s vamos mãos dentro datas invenç inicialme amor coincidê publicaç empren omnisc preocu mome respei esque leitor public pensa image itálico leva-n crian radic altur marc nova már 695 706 alun mulhere caminh forma intempo represe aproxim costum encon corte polític chego ment emer ustria revis idem scar fora integra entrev portuguê futuro imaterial momen quatro fronteir porém reescre movim proces reuniõ secreta sugerid atribu eviden esper posto event posiç conf reino historia título recons oprimid determ exempl apesar autono casa coloca altera passa país sentido reinad início nomes altera object dela marta anális tinha sécul entrad palavra vinte atravé manu teria antónio verdade históric iluminis privileg alexan editor século passa nela etern novos excer palmos livros significa aspecto gosto 732 partir barroco históri tempo construír memó ficcion permitem dizer portugue referênc transce encontr discurs referen nature apont xviii facto trata dad 694 nele verdadei libertaçã falar plano 701 estatu brasil enquanto apenas devido quinhen ambien reconst sujeita catego notar diant figuras vezes 667 693 ibidem quer historiog metaficç kaufrna adeus socia então 671 acompan tradicion andava quadro literatu instân mentir gera 43 estamos justamen importân libertartrês escreve fazend marca vontades povo ultrapas fizemo entrar vista tipo 668 precisame próprio movend engrand dimens ficciona além biogra reis nome nunca tempora próprio universo intempo tempo igreja correspo pensame ultrapas textua 666 730 trabalho classifica perspec termo tipológi assim sempre deste 731 dimensã ente implica textos sido heróis maria 674lisboa agora integra literár gusmão realidade contam sobretud casos 703 sendo helena fala personag lopes olhos grande cerdeir 42 explica focalizaç atenção data 739702 670 727 alteridad silva romanc própria função diferentes poca alzira seixo visão carácte embora 729 autor teresa históricos maneira dois elementos 708 734 presença lado cristina hoje género 717 modo portugal livro acontece seja 724 44 narrado vida 723 737 acontecime acção permite 697 705personagen 700 real escrita caso poder histórica 735 pode homem mundo 726 leitura homens facto 733 fictício 728 narrativa 67241 ficção verdade 40 46 anos histórico neste espaço ainda 696 discurso título 707 passado 683 740 obratambém passarola 712 725 0.0 convento 682 738 39 722 664 704 presente texto 665 saramago narrador 714 45 661 662 tempo memorial romance 38 -10.0 história 721 -30.0 -20.0 -10.0 663 0.0 Figura 3.9.2.3. Espaço semântico retido para análise, baseado em 88 textos usados no ensino do Memorial do Convento de José Saramago. 129 A tabela de frequências X(n, p) associada a este novo biplot – a usar nas experiências deste capítulo – tem dimensão n= 5015 palavras e p= 88. Com d= 45 dimensões garante-se 82% da informação ou variância de X. Examinando este novo ES vê-se que nele destacam-se os textos 700, 682, associados a palavras como “capítulo”, “Blimunda”; os textos 38, 45, 662, 663, 721 associados a palavras como “história”, “memorial”, “romance”, “tempo”, “Saramago”, “narrador”. A posição central do espaço semântico é ocupada pela palavra “convento” – o que é muito apropriado. Para obter uma percentagem de variância de 85% da informação total são necessárias d= 50 (das 88) dimensões para o espaço de representação do ES. É este ES o usado nas experiências descritas no que se segue, em 3.9.3., 3.9.4. e 3.9.6. 3.9.3. Dados EX-MIN. Experiência nº 1. Nesta primeira experiência usa-se o ES descrito em 3.9.2. (88 textos extraídos de manuais de ensino do Memorial do Convento de José Saramago) e 60 textos de resposta dos estudantes á questão do Grupo I A), conforme descrito em 3.7. A proporção destes 60 textos a usar para treinar o classificador (AT) e para testar o mesmo (T) é um dos dois parâmetros a fixar pelo investigador. O outro parâmetro é o número k dos vizinhos mais próximos, sobre o ES, de um texto que se pretenda classificar automaticamente. O valor deste parâmetro é um geral pequeno. Nas experiências realizadas neste trabalho, k varia entre 1 e 8. O sistema PAET usa as classificações (ClProf) atribuídas pelo Professor (neste caso, professores contratados pelo Ministério) aos textos da amostra de treino (AT) para calcular a nota (ClSys) a atribuir pelo sistema. As classificações automáticas atribuídas pelo sistema a esta amostra de teste (T) são, em seguida, correlacionadas com as classificações atribuídas pelos professores contratados, validando-se assim o classificador. Nas experiências aqui realizadas e na versão atual do programa PAET, ClSys 1 k Cl Pr of i k i 1 130 isto é, o sistema atribui ao texto a classificar uma classificação que é a média das classificações dos testes da amostra de treino (AT) que correspondam aos maiores cossenos (maiores proximidades) entre o texto a classificar e os textos da amostra de treino (AT). Na presente experiência, fixou-se a proporção de textos a usar na AT em 0.75, o que significa 0.75 60 = 45 textos na AT e 0.15 60 = 15 textos na amostra T. Trata-se obviamente de números insuficientes de acordo com a literatura consultada mas que, mesmo assim, são úteis para validar aspetos importantes dos sistema PAET. Projetando sobre o ES os textos da AT e da amostra T (Bellegarda, 2007) o resultado é o posicionamento destes 60 textos adicionais (45 + 15) sobre um ES que, pelo que foi visto no número anterior, usa d= 50 dimensões para garantir uma percentagem acumulada de informação (variância) de cerca de 85% da matriz X de frequências. Esta projeção não altera o ES que serve agora de referencial a esta e a outras experiências. A inspeção visual do biplot representado na figura 3.9.3.1. permite formar uma ideia da situação, usando apenas d= 2 (27% da informação) das 50 dimensões necessárias para garantir 85% da informação. Na figura 3.9.3.1., obtida pelo PAET, as setas a negro correspondem aos textos da AT e as setas pintadas de verde correspondem à amostra de teste T. Usando a funcionalidade do programa PAET – ver Manual no Anexo A – pode examinar-se interactivamente a posição relativa desses textos e “tomar notas” úteis à interpretação do que está em causa – o que não pode ser apreciado numa imagem estática como a anterior. Note-se, contudo, que este biplot representa apenas 22% do total da informação total de X. Ao examinar o biplot deve sempre estar presente a perceção de que as proximidades entre textos (ângulos pequenos) observadas no biplot podem não corresponder à realidade da dimensão d= 50, por exemplo, em que estão representados esses eixos (Vairinhos, 2003). No caso da experiência aqui descrita, para cada um dos 15 textos da amostra T foram calculados os cossenos dos ângulos de cada um desses textos com os 45 da AT. 131 capítulo 10.0 baltasar padre mafra blimunda bartolomeu lourenço máquina construção pedro 711 partida conheciment monte voar viagem trabalhos 684 casal junto 688 nascimento pedreira sete-sóis vela tomamos infanta assistimos descreve-se regresso holanda 690 bárbara acompanha doença encontro promessa final sebastião decisão venha 713 infante 689 roma scarlatti depois primeiros basílica parte feita 716678 trabalhar voador vemos deus desaparecim 686 676 seguindo mandar estabelece francisco milagres príncipe arder disse altar fala-se apara expropria aniversário revelação envolviment entretenime epidemia entretém capítulos toma paço faz-se febre tourada espingardea empoleirado edificar gastos estragos poderes benediction barcos marinheiros esmagament incêndio participar miséria funerais assiste-se descida científicos aumentar beirinha vergas boeiro cólera sujeitos suicídio informados informar informal amarela terras obrigados crianças corrupio jornada convida ocorre frustração réplica quinta discretamen venderem janela mateus conseguidos conta-se constrói pontaria religiosidade reparar sagração conclusão sádico cura teja relacionamo região provar damo-nos dá-se tenho recomeçam sobrinho agricultores alentejo contrabalan haveremos esquerda inquietação miniatura procissão música pedra sabe reais degradação reiteração falte primeiro baptizado chuva sopre inauguração inaugurar neve visitas dirige tranglomang vento caia começa cunhado solou alague extrema toledo igrejas visita terreiro contacto pobreza pero fogueira revelar torna-se chegar segundo passagem breve setecentos caballeros jerez família filha fosse sonho somos caracteriza ambiente transporte domenico alto tentativa ento 710 jogo sabemos diferença casamento milagre professor corpo notícia participa voadora oposição concretiza outubro franciscanos abre pinheiro irmão escolha primeira atravessa riqueza encontramo origem fazer estão palácio 687 marques nesta projecto segredo inicia palavra 679 alquímico filho perdeu medo respondeu auto-de-f busca lemos 715 719 680691causa nuvem diversas 681 gancho excesso voaram pergunta vime ferro suspeição libertar união simbologia construir antigos firmes ouvido ouvir favores totalidade tornou elemento fidalgo seguem-se espiar indulgência efectivo voado voou preparativos poderemos estrada estarei retirou benévolo braços majestade peregrina esperanças chamam patriarcas frequenta viveram gabar voei responder reparou trazem mora sentou-se séquito impertinente balões verei perguntou esferas spirituel cerca conjugação constru acomodasse noite acolhido obrigações lembrar-se cresceram corre frotas ardeu reparo distrai saiba materializa intercessão conseguir junte universellem tropeça valido troça pudesses tendo-lhe porta tens custo sóis honestamen honorífico fondamental flor finge físico fases capelão luas vim-te vinda louco instituído estranhasse etapas difamações dezanove dieu entardecia ensaiar ndia tocarei vieram suspeitarmo synthétise esconde essência estações chamas passaria ordre misterioso estivesse plenitude preparar retórica encontros enganado enfadar secretament secretos houve ciel lutar perca subitamente inquieto pano pátio abre-os acontecera abóbada orador vivant aspirou deificação podes representam résulte 692 queira fechada feitas trarei setecentista serviu morre exercitar sentimentos sequer sermões sente transgressiv tipicamente colaborador auto-de bairro liberta-o impede veículo colher clamar intellectuel luminosa l'union perturbar profundame escarlate produit cardeais celeste conjonction conivência ternária terre obrigam-no número nombre lembre-se lembrarei criador fugido atravessava aproximava desmanchar quiseres unidade unir-se simbolizando símbolos dissemos códigos vendados combina l'homme iuris queima testamento contemplou constroem tempestade constituída teriam juntos juntar tri-unit trois refugiarem remetem reina dogmas comunicada conciliar-se conduzido sacro interiorment leia-se l'être gritou grito pontos sobe dominado dores diz-se intrigas guerra harmonia declamações faltando aparece apagar exemplar fingimento forçados fogo escapa antagónicos ansiosament anti-poder excentricida exceder exaltar revelam-se física enxugou exprime tornaram capazes tornando encontrados insuperável andorinha apertou oxal envelhecime envelhecer violentamen canseira virtuoso canoso violência violento tornei totalit l'ordre tocou cansa escondido sustos chega eleitos ganhando fragmentári frágil eternidade estudante pretendem estilhaçada deixavam estavam estimado estranha deixara estrelas esteira destrança destrinçar destrui-la diga entender-se encorreado enlouquecer nascido existir sebastiana segurar igualmente trabalham canonicame viéssemos iluminados canonici humano tocar mariana malho esperávamo escolhido esqueleto esquerdo espelhos surgindo escrituras esperou chamariz ecclesiastici inflamado inferiores eclipses participasse paralelismo pancada partilha panela absurdamen absolvidos miticamente metálico meteu missa voarás voltas fortes fraco frei apresentand deitando-lhe desferindo deitou-lhes descaem desce plebeia plena primavera primazia procurar respectivam ressequido resistência resistia retira feminina enferrujam enfrentam mordido semelhança sentam sejam selar senta complement comparando completas comparada licenciado compaixão completar calar-se veteram batendo brancas científico tiveram bigorna víamos candeia barba brilhar beiral logo local vêem cheia aulas versa calcou hóstia liberte logro caldo batia libri base masculina pescoço pedreiros pegares piedosa pegava peles esclarecida souberam profano sonhado escura sopas sujo carregada casados duvidosas inaugural amarelo ambígua incógnito doutor incipit parece-me pareces abençoado açougue académico abre-lhe acabasse acordado névoa ntima ocasionou cortam cortado criam corta merece mofo visionário vitória forja vivem aproveitava assente archote astros arca preconceitos precisam polariza pregador prodígio precisa estalava põem despertam destacam reportorium reposteiro represent feitiçaria trazidas querem trazia serviria mundos sequência separam colectanea cobrem-se impalpável bacharel cobertura libertada bálsamo cobrindo balão vejam avisos rugas cintura rubro civilis ruína clarão vê-la salto mecânica mbar mato lume perguntava permanecer perguntada sugerem sublinhar cedesse cegos consclencia constrói-se construído tapado d'une acompanh acharam nuvens aceitas achar ninho nicos nove julgaríamos ontológica oprimido ombros lembrou olhava opera lendo coto metade fugir atormentad atirou-o grávida golpe precária praça pólos desmanchou unificadora simbolizado simbolizam concepção concordou confissão sabedoria coetera saiam qualidades puxou-o puxou quam aliviou cumpre-se contente tempera temas tenaz testa tecto acusações acusada noutras cristianizado lágrimas lados pontificum recentiorum rechonchud universum usamos universi tristezas raspa ramo vale trio regressava sinédoque renegar regaço divulgados diversament divinização doctorum diviniza-se dito condutor condição comida sacrifício saberias iríamos inventor inverno provar-lhe punho conselhos deficiência defeito dedinho lamacento lamela lareira guardava pôs-se usboa reconstruir recolheu sobejavam sobrevoa sobra dorme agarrarem agrilholados afirmativas alcunha alegrias aliadas decretalistas continuado decretais dava sólidas alastrado ajuda-o declaro-vos hebraica 720 fois aparências aonde exceptuand execução ricamente foram escândalo equivalentes eróticos erudito extenuada facilmente facultando extremo faço faltem apelidados demasiadas excêntrica examina devagar devendo risada rins finalmente entregam-se entrava famintos farsa cantarina capelães tomás torres cara tora angéliques instruçáes ostentadas painéis pagens pagam zumbaias depreciativo demorando estufa poço ensombrada entendiment ensinam enviado explicações faziam humildement canonistas tornozelos idênticos violando vinham tocava virada viria mandando marcação espiritualida esquecendo escondiam escondida symbolise suspeitas talhados symbole talha chamava chamou chapéu empurrava encarnada ecovisão encarna efeitos effet ordres orfeu xabregas voyaient gemem francês desencontra estrangeira desenhado desacertar prescritas estribeiro desertava europeia estáticos desenho derruba estuda estaria esteja presos estás dificuldade digam digo retratadas retratados enegrecida nascesse naturais secretários secretário satírica iluminando humanos barregudo brandão humaine ilustram barrete traçam bien l'on madeira maiores maça luzes mâle pentateuco perdura perdem perdão escolásticas espelha-se subitament esperando espanhóis esperava suprema escravos certamente castelhanos c'est-à-dire chamamos chamado certeza céus c'est inquisitorial ambos dynamisme dynamique anacrónica inimigo passamanes participação partilhar patéticos passes pálida absolutamen abstinência abraçados miudamente metendo-se mito voluntários forrada voltou vivo viva galés aproveitado assaltando aprende assedia apostar giravam principaleme desgarradas planétaires desejáveis procurasse desconfian procura-o deitava-se descobre procriam premiere descalça descrita pregão deitar pista retemperad reservados resgatados resposta resultou felizmente femelle fechar encontrarem moralístico morreu mortalha mortal sentava-se semânticos sentença sermão transforma transgressor ciliciosament transgridem imediações completeme romanesco localidades camaristas compagne baptizada verificável baptismo liteireiros budescos austríaco colhendo cancelos rodeada roubava complet viagens lisboam belos boca rodeio ligados cingem trágica rostos vedras levada ligado liteira horas bocal lixam cabe cima aussi caiu bate rota pescoceira perfection perigoso pena pinto somando esforçam profecias sombras escuras escasso escape cardinalícias cardinalícia cardinalício carcereiros carmesim centrais carícias cargas cena conhecido inaugurando amoralidade informar¬se inacessíveis crucificado consabida dormiram dourados amoroso amantes doutores durailte amada amanh talmud teclas amar amos croit panos parede papa obscurantis acompanhad abandonar objectivar acreditam nergies acabe ntimo convencia-o cortadores corregedor cosmético operários conversa conversar opressão cósmica cordas opõe olha mergulhasse mendigos meros vivências visitar fugas atravessado atavam-nos arrasta-o aquando armas atraso arde privilegiados precisava precipita désigne poetas desprendeu despedida repetia quintais trevas sexualmente recusava-se redentor servido recusa servir mouvement movem multidão distinguem distintos directo serás sept impossibilida salteadores improvisada clarividente levantar-se levantando levantadas levanta-se l'éxistence saltarelos cocheiros salda-se imposta classes azeitão coches salvar veludo claras cobria coche avião interesses interditos materna persecutório perseguição quadrilheiros queimado subversão sucessivos queda cegueira cauda ceci conseguem terminaram constantes tardavam cruzado tecendo tarefa teme d'un ontem journée juntava lacaios juízos melhoras fuligem fugiu arame prata valorativos reagem recebe tropa valor sintagmática refugiada sítio dogmática confere-lhe condenada configuram começar sacrificam sagrado concluira comunica confins saía sacramentai sacraliza sábios interiorizada involuntaria investidura inutilidade isotopia medicina italiano inverso joanina jejum jogos permitir advertência alojam contactos dédouble dedos curar adiantada addition adaro adam cristã-nova lavradores letrados leituras cristo leis guardado gritam variantes variando realça recri vais relapsos regressa diversificada doméstico divino confunde começou comédia comer intolerância introduzi-lo intersecção irregular pungente provocou próximos afinal alienam contíguos tensões dans curtas curta cycle terço largo l'âme harmónica solavancos sobreviver sobrevoar sobressai sofrem sociais donne alcorão alheios alheia debandava contrasta decidir alagados ajudam homogéneo hébreux rgão faltasse falsa aparecendo anticlerical aparte antiga anti exclamativo ridicularizad florescência fogem fizera flatos escândalos esbeltos escala extenua faça aniquila apelido anno ouvindo ousais ouso excelência excelente exagerar devaneios deverão entusiastica enumeração episódios entoando favorecendo fanático fausto fanico visionária cantora ibérica capital toscos cantar captar capaz capar ltima marcando marcha insubordinan andamentos encomende andaimes elevação apêndice anexim ornamentos pagam-se oscilavam oscila pagai pais zarolho zação geradora gennaio densidade estilização de'molto evocada deleite pobre devotament determinar devoto fidalguice fidalgos ficaram navios expectativa explica-lhe explicitação experiência explicativa virtude vindos ignaro virem violas virar vira maniqueísmo manutenção maravilhas mandou manter manos escorreitos suspensas esconder suspiram esquecer estadia tábuas tafetás estado emaranhado analfabetos edificador edificação emprega elvas edifica eis-me elogio ordens mística gasparini garantir ganha vulgar vulgo estrangeiros estreitament estereotipad desaparecid preocupava esterilidade prenunciava estivermos desacordo pretensão desenvolta desenrolar estranhar podem estejam deserto estética deixam destinatário desvia retratada retóricos festteggio fernando enormement engenhoso engenho necessária nascem nasça exibição existem existia secções se-ihes seixas ilustrativos limitarem igualdade canónica benéfica bendito breves ciclos bens toca maritaggio luxurioso marreco marido maest luzir percussão percurso superlativos suavíssimo esperança supremas suplicante escrito escolher escudos escrevo esperar escreva sonata espácio súbitos supõe surge súbita casamentos cerimoniosa casando carta influenciado indiferente indignação inovação injustiças instalado ambíguo inscritas insinua indica amen paralelística pandeiretas pedagógico pecadores partições pecadora parentes particular passou pedinte patente palazzo paradas paraíso pátrias pavor pátria pede peça peca pálio abundância abundantís abundam abrigo neto ofícios oferta oiça metaforicam ministrados misturavam metrópole misturada medita frequentam fornicardes fornicando freiráticos vivessem formosos viúvas futura vivaldi fusão visto vivia apresentada apropriar-se aproveitand assombro associado ascender apostasia artífices artistas assiste gigantesca gesto desculpabiliz procurando descer eventual poderosi deitando deitados principe desejo designa descaro desejos podia desregrame desrespeito desprezo responsável resistências repudiadas reprimidos requebros resultado restos fecundíssimo feed-back queixos queluz feio napolitano moralistas morgadio morrendo mortuário morrem nápoles musical exerceu sensibilidade semelhantes semente senão composições compositore libertinagem cadenciados transitavam transitórias implicações atrevessem transgredir compatifica chegava completos chegavam brasileira compara roubadas tínhamos bebedice beckford implorar compare ausenta bebendo coloniais beliches levados bigamia comova rosário bisneto bailado veriam libreto impõe camas bolsos veicula brusca beleza trama romba honra leva-a tiver lidade bocas caiba risco ritmo vede tipos tinta matéria mastros inteiros penitência península pensativas pesquisas pensar pilha proporciona propósito subordinativ subjectiviza escaparem subordinati sonhadora esegui'nel produtiva profunda produtos promete produto sujardes sozinho spagna esforça queimo sonhar sugerir somas status escuto sons admirável caricatural casual amadurecem conscienciali tecladament consagrava duplamente doutrinária duram-lhe conjuntivo tamancos cronistas dúvidas doutra duque tecla obscenos achacado acredita normas abertos obrara nelas nica oportunidad ociosidade corriqueiro conventos cravistas correntes criadores cortesão ocasional correntio crescem cravísta cravista cortejo cópia corto olhai crer mestre-de méritos mestre moita mesa fundamento fundadores frica fria arquitectural aproximação armónico atendida arquivo asturia arbítrio armou atrás atar gozam gostos pragmática policiava precisos poético desmaios despejar unicamente querido trazido quero quilo qu'il severament significativa significativo recusada reduzida sintéticos servidor sexuais servem motetos motetes múltipla muda m-se distribuiremo distantemen disfrutando disso discípulo serenissimi saltássemos aventuras impressões verdadeiro salvarem impresso levarem impostos liberação santiago sapateia rústicos salvá-la saiu balança sairão l'heure cobrar cobro velas rude bach permanência persecutória perseguindo personifica persuasiva perseguir substitua-as quaresma quatre adoece celebrarsi cavada cedo cultura cruza culpa culto tarda tarimbas tardaria nitidamente notaram novas judicativame julgamentos justificar lembram criarão oliveira onírico julgue lenha laço olho monárquica monjas grávidas graciosa graveto grau portogallo pompas pratas prazo receberam ultrajada recebem razões rebelam receber reacção tribuna trineto rastos rabo refere-se relembro religiosa simo ditemática dolorosa sacramentos confiscados conhecer começasse confessor concebe sacrifica sagrada concreta confere comuns sabeis sacros saciar inusitada italiana irmões irmãos invés ironia pudessem purgatório puseram prosaico aliviar alti consoladam te-deum tendendo tetraneto curioso defunto teimais tesouro teia adiantado criticada crimes lazer porquanto possuir populi utilizados vagueia varrasco raminho vaidoso varões recorte variam vazão reçoit raiva urdir vaso relacionado rematando regressar relacionar reinariam sinal situa-nos registos regras regio docemente dizem-me dividido dividida dívidas dízimo confundida comentário comilança introdutor protagonista psicológica provérbio protege psalmo ptima alienação afectivo afectiva aliena afiada defeituosos damascos dedilhada deficiente danação dando controle defesa dança lapidaridade latinizantes lâmpadas lançada guardi recomendou sobredourad sofrendo soldados solfas sofre alenxandre agraciado agravada algarves agradou agentes alheio decorreram contraditória continuam debilidade contrata habilidades haendel hábito declarar homenagem historicamen homossexua hipotáctico hipocrisia heranças hinos 673 faleceu ribamar rezas fomos fontes falar¬lhes falando falas anónimos ridicularizam revisitação focinhos fluente firmino fluido forem fitas fixo equipament escadaria esboços ermo fachada tornam-se torná-los aplicadas apontado animado aplica-se apoiou andou apelo ouvirmos dependência exactament demiúrgica delicados depende deve-se deu-lhe diárias reunindo entortar-se entrelaçand envolviam entrarem envolvido entra expõe expo topografia toponímia torreões humores louvado capelas idades cantam topada loucos topos lucília total marcadamen marcolino chegassem encieirados anástrofe andamos andada elucidativas elíptica orientador página zacarias genial denunciando demoradam deixemos pretendia estilístico presume evitar pluvial dezassete diegético destrói diálogo ficamos encontrou-o entanto entende naturalment nascida nasci naus segurando segunda seguem sarar vilipendiada humildade canónico trabalhe ilimitada virgem vírgula ilusão viram longe ii.o vier manipulando maneta mão-de manh escovam-se escrevemos espontaneid surpreendid escritos tadeu surre talho encarregado embainhar indiscretas individual edifícios infalível emente egipto efeito ecoa egas passagens passarinhos passaram passar ordenou mistificação mimetismo vocabulário frederico frásica frase europeizant estivessem pretenso previsto poderia plantas estarão dignidade repressão respeitar resolve retórico feridos engenhosa enfeitadas exibe sátira localizações comparado tivéssemos imaginado braço vermelhas bernardes biblioteca brilhantes atribulada científicas limitações benções tivesse vestidos cânones brancos hospital caladas vicente choram lombos vestem limites ver-se loggia aturar brilha lógica lindo brás bibl macau perderão perecível pensou pias supliciados esparvados esmagado escultores espalhar espécies subiu esgotar escola subir suave sumir cerimónia cerirnónias chagados cerejas castelo carvão carlas carro inconsciente independent influências inscrito ambas amito parecem pediam pátios pedia parou passo parar acabámos acabarão acaba abolição abside ocorrência ocorrido ocorreu oitenta oração oral metatextuali metatextuai modificando mobilização minudente metáforas modestas misturam minorcas miserável metáfora modelos modos meia formaram visualismo funerária visualizar voltadas formálio visíveis gaiolas visuais viveza articulados assembleia aproveitar assassina aspereza aspira assis geraldo giusti desconheça podíamos precursoras designação descalços pregados desejava descrito pisado prega pires privacidade príncipes prodigioso procurou retalho tratamento travado querer feitos recuperando recuperação significação refeitório serra mostrassem monumental morremos músico nacionais morrido montes naquilo morto disciplinas direita direito exemplos senhora sensações sentenças seminário seria série transposição complexidad comporta-se transportou imorredoira transportar salienta-se caminhos transepto compridas implumes transgride caminhar romanos ausentes vergonha roupinha bisonhos bassílica colocasse trajectos brasílica canários romano bruxedo cabeças bastaria batalha imortais camisas bruxaria bastava cinzento veículos rocaille bulletin horácio tiranos ventura tirania rítmico autos claros cisma rufino impor verde burro caída ruins imita típica ritual clara rosa bela baía intencionalm mecânicas materiais perfeitamen pertinentes perguntar pensam pensa proporções progrediam sonhando profissão escuros profere admissível cepticismos catadura catacego centram cenários católico centra crornatismo ingenuidade dramaturgo crueldade contém infringe dúvida dupla dura técnicas tampo tecido objectividad acentua-se numerosas negócios nomeados obrigação nocturnos normativa observar objectiva notações observa nicanor acesso acolhe nudez negros acho crescimento conversação lembrando operário cotovelos cozinhas costuras cosmos lendária costas correu jorra melancolia mestres meses frio arquitectóni arquitectos atentament aquecidos atinge-se arbitrária atenções aresta glorioso gozo desigualdad prado desmistifican despachem questionar trezentos questões quitério quinto reflectir síntese motivo disponíveis distinções distrair ditados ditado levantaram sangravam impressão aves azul interessou medem jaime perseguiçõe perna quantidade quadrados subterfúgio próprias subtileza quarenta suceder quadro adolescente celas culminanted constantem consulte-os contenção contando cumprida temíveis tema tem-se contas terzi acumulação noutro actos lacrimejante justificaram juntamente lembrados justifica judaísmo labirinto ladeada cria-se onofre juvino judeu olhou gramática gravura pormenoriza praticament portaria ponte rapidamente universidad varandim trocaram tribunal rapação reclama valores valério trouxe ubaldo usado rasto vales relatados reflexiva documentos condenados conheceram comecemos sacerdócio conforme sacrifícios conhecem conhecida sagradas confirma sabe-se conclua sagrar interpretada interpretam inventando inventadas inverosímil irrompem jesus inventou inventos medida jesuíta isabel isidro purificam-se provavelme publicados prosódico púlpito pura aerostáticos aerostáticas alternando altares alusão alista definitivame considerada degredada tendo-nos deduz-se definindo tentativas dade dedo aderiu lavatórios cristóvão léguas légua lama leia posteriorme postas posso rectaguarda rectângulo recrutada utilização vastas recta reinterpreta soberaname relacionem relações situamos regista smith regra dizemos protagoniza afirmado alegre afirma contingência controlando controlo curva daniel laterais lascado latina harmonizand harmoniza solo alheias alcino decorativa continuar hipotipose hipérbato herdeiro falassem falo apareciment aparecem apalpais exclusivame revolucionári ribatejo revistas rezar flash-back força erecção facção antecipadam antecipação exaltavam exaltava devagarinho reveste-se filipes expressivos cantores andamento aponta angola oscilação padeiro denegriam detrimento devoções devota retrospectiv ficou identidade tornou-se torreão lubrido ideais vindo maravilhoso chegada charneira empregando encarnação económicas efemérides eliminação encaixa organização orientação países genericamen voyage xvii estranharía desengana estiveram estranhou estúdios plural pôde desvirtuado dificuldades destino festas enquadrame enredo narratário narre ndole saramaguian segredos saúde seara humana vigiando vigentes cidadão ilha perda suspeita suplemento específicos superar escritor césar injustiça inferioridade influência indivíduos educação indirecto inferno instalou editions infeliz pálpebras participou partidária parideira pataca ocupando militância milhares milhões milho forte vivos assume eventualme estivéssemo estraçalhad desempenh principais podendo pretérito prémios evento destinado reprime residir feições enganada encontre narração nalguns dinheiros sectores tradicionalist traduzida bordeaux tradutor câmara caixa imaginação companhia verificando implicação biográfica bênção verificada literárias lisboeta ligadas roubar beira lóios marvila luta penetra pífaro profanação esforço especial espada sonhe sono caridade carreira castiços independênc incontornáv iniciativas inclusive amplo panorama acabada abertura abrem abdique acabam acordo aberto abono cravo conversas convidado convivem cortarem oralidade ocorrem opinião mereceu mereça moços fundamentai frequência frequentou formal volta assinalável predomínio estagnação designado potugaise deícticos preces prefira pior desliza repenicar repenica travessão quiseram trémulo queres quiser reelaborada serralheiro reescrita siécle mostrou-se mostram municipal mudança movida distinguiu-se discípula directas director sentimos seres santo aventurado imperfeito littérature colóquios vejamos vereador azinhaga colocado salientar colagem levava clubes baixo verbal claro rumo rufa bala intenções intenção mecânico interessa mbito perfeito profundidad cerâmica célebres construída tamborilar terminou cruzam contem tambor técnico conte cruz dual activamente noviciado notação nobres novena lembrança criar criado membro mónica funcionalme atreve goleg polifónico unilinearmen recebendo uníssono unilinear simbolicame religiosas reflectir-se repare-se simétrico referidos reflecte referido distorções comunista coexistem interioridade mediador invocada interior permite-nos permitindo qualidade propunha prosa adormeça cumplicidade temporalida contam-se constituind consolidar conseguiu tinham contada adivinham noutros notou criticam-se l'escampett gravita gritado poranalepse porqu recreativos raramente recobrada variadas variada varas triste urna usar religiosos simpósios reinante remédio regimes situadas comentários confrontado comendo concluído começos conheci saberás interrogaçõe interjectivos intervenient irreversível intervir proximidade prosseguir provérbios publicação pulso alienando-se afastamento afastado tendo-lhes dedicar-se defendido tendo-se definição terceira dama dado lanzarote leva pontuação posterior soldado intrínseca afrancesado aforismos agita controladora debandada há-de alcançar declara havia herói anti-épico exclusiva ridiculariza fizeram eruditos erguer anonimato anónima devastadora deve filosoficame filosófico filtragem filósofos filinto equipa familiares far-se tomos anes paciência democracia deparavam evocados dele evolução etapa devíeis diderot ficcionista fidelidade envolvem experiências explicitamen identificando humilhados ideológicas ideológica ideologia tolentino humor essencialme estabelecer sustentam el-rei enciclopedis económico elucidativo empirismo empenho anastácio indústria elísio ganhar frade wolff evidenteme pretendiam derradeira derrisão estática destinos detalhes dilui festa enraizado encontrou enorme nasceu narrar sedução sarcástico satisfaz vila iluministas ilustrado barrocos bentham vieira hume perceber pequeno superstição suscitando escravizar escreveu individualme insatisfação individualiz emendar inserindo infelizes emenda parodísticas panfletário paráfrase patriarca parodiar pássaro abrange ocupado ordenado mill vocação volumes freiras assumindo assados descendent procuraram princesa proclamou primeiras desgraça europeu planta deístas estou dessacraliza desrespeita resgatar repúdio residentes ressaltam responde enfim monumentos dinâmica dinheiro exército sensualismo sentimentali seleccionar comparaçõe autobiografi imaginando verificação roubados tradições verificou vertente atribuía bocage típicos limita locke lido matematicist intelectuais inteligente ludovice massa pense propõe-se esclarece subjectiva stuart caracterizan consagrados informa-me conotações consagra ampliar inglesa inicial inglês acrescentar newtonismo necessitado acabar abade abriu corredores ocorrendo correlação coordenar converteu crescente correndo criadora correia opta metafísica fundidos arrastados arrancar artes arma preencher desses reduplicação significativas significações serventia montesquieu mostraram discordância sensação comprometid clarividência velho verdadeira colectivo colectiva camões veio autores santos venho levou sair materialism pertencem perspicácia pertencia substâncias admite católicas centro contemplado construtora constitucion infundados construtor temático tarde duvida termo novembro nicolau nobre nível julgamento lendas atitude ateus graças graça rebela-se r6sseau tríade sistemático reflectem sintaxe sistema comunicante confidencia sacralisado conceitos conciliar concede adquirindo cumprimento temores teses acusaram notícias cristianismo laicização lacunas criativo criticar leito laia pormenores populistas realização radicalizou realismo raízes variar regeneração sinais relata dominantes domingos divulgador divulgar divina conhece condillac irreversibilid irreverente invenções inúmeras invento irónico pública punhado proveito provém afastar alismo considerado d?alembert degredo custódia teológico teorizar tentar tentou lançando-se laudatório população possibilitou possível rectângulos reconstruído utilitaristas rectificar u-se alem habitual declara-se declarou 23 falso antagonismo aparecerem aparenteme firmada firmeza flores erário exprimindo facções facetas insurreição aplicados apoio dictionnaire filipe entusiasmo episódio favorecidas favorecidos favoráveis expressas expoente fazenda capacidades canto andando ostentação originais gerações estilo denunciar prestígio dezasseis retratos fidelíssimos figura ficar ficarem entende-se touradas marginaliza esqueçamos symboles esposas eclesiásticas empenhado económica instituição indústrias analepses edições passados parto francamente generaliza voto fradaria xavier vultos prepotência desacertada europeias deixando desfecho plásticas derrame desafio pleno dignidades diligências resolutivas resolução engenharia engloba nasce seiscentos verosimilhan beneficiada verosímeis bragança bertrand barroca vidente ciência cidade cheio bere magia madre má-f percebermo sumptuárias espaciais espanhol soube cerimonioso cartografia chamada casou casas editora/nom amazónia ambíguas injunção eduardo passíveis palhav paris absolutismo absolutista neuburg ofício odivelas moderniza medíocre miuçalhas ministro modelo mínimo futuro"como fortalecida vitoriosa formas futuras apreciada aspecto assumiu prejudicada proclamado poderoso descendo desprovidos destacaram destaca-se dessas restituição resultados reprimida restituiu reptizar feiticeiros trata morte monumento moradores narra diplomatas dinastia exercício secular transfigura baltasarlblim literalmente compositor completa impiedades complexa brasileiro transição cabeça lisboetas libertino importa citação típicas rituais bastos imitar roque típico ruas cito lustrado matar matriz péssima pesado subordinada solucionada produção escapar sujeito spera incremento dramática inglaterra incúrias iniciada do-se duplo acelerarem objecto obedecer negativas negativa negativo obtidos nomeia acabou correntemen contumazes corrupções opressora corrupção oprimida convictas opostas jornal costa molinismo meninos meios fundamental formação arrábidos aristocracia arte governação gostam povoamento precedentes preciosas praças despejando questão unda quis sexualidade referência serviços movimenta movidas mota dispendiosas disfarçam dispendiosís dissipadas dissipação disputa serem campanha comandadas importantes clima imprópria azinheira comum coincidir santas vejo coelho saindo venda intensifica janeiro personalidad persistentes qualificáveis sucessivas quarto constituem técnicos constata cuidado território terreno açúcar juntando-se laffont/jupi justiçar fulminante trinta trouxeram validando receita relativament reflectiu-se releva-se relaxadas sintáctica renitente reforma relatos simas ditions sabem concedido confiança conduz conferida conflitual conflitos conferir sadismo saem inverterem invulgares invalida irão públicos alterarem advérbio advém altos consolidação consentimen considerava testemunho conservou conselho teimosas de-f cunho criteriosame cristãos guardar potencialme potências potencial positivos positivo vastíssimo recorrente utreque usarem utilizar vasta reincidentes soberano relapsas situado dominação dividiram domínios diversos domingo intervenção prova aliança alegria contínua decurso dá-nos reconhecime recuar solicitá-las sodomia sofia agitada alerta contraste contribui debatido hereges 139 revolução forçado antítese foco ermitão expresso fama fácil anjos dias dever diário enunciado entram toneladas idade tomar ideias tomou tome vindas instrumento instituída elevam genologia estudos pobres pocas deram delas determinado diamantes diegética ensaios narratologia nascidos seguintes humildes manifesta mandado espessura esquecem instauração passa garras desempenha desenvolveu ferros benedictione calouste bento traços marquês peso espanhola específica sonatas supor inscrevem anacronias passemos paroquial paula acabarem nesses ordem mobilizada modalidade frequentem frequente frente gheerbrant descreve descrição princípios resulta resto encontrarão moral diremos sequências senhoras seriam sérgio sena transportara transgress transpor buscar cabia tirar comportame imaterial imolados complexo imolado colecção livres rmos material lugares proferido centímetros cardeal informativos doze obrigando números activação achado acaso norma conventual corrigir visitantes fundação fuga aqueduto arrobas polida quilos quinze redentora redondos símbolo disto sapiência liberdade levaram imposto vendo velhas velhos código materializad materializar perpassa permitida pêro conseguiram constam tico actualmente notáveis lembra judeus júdice gratuitamen gravidez porto turísticos varanda reflexão singular reler relato sacramento sacrificial saga almedina considera daqueles definida laje lavrada crist porventura populares possui rainha85 vaidade recolher dizem aliar afirmar largura gulbenkian guias guas solidariedad ajoelhai alcance alain haveria heterodieg heresia rias erros facultar apelam financeiros extensiva deliberadam fichas entretanto torno frades pretendemo difícil entender humanidade escritores partilhem evasão desenvolve principal destinamos completem linguagem horizontes versão linhas linha pegarem pereira específicas iniciarem incluímos inserem incluir pautámos pedimos papel convidamos convite formativas fundo associando 76 97 50 109 17 deslindar desta 67 representad repente tratado sete-luas sete recursos redacção musicais exercícios sentir senhores compreende bastardos lexicoteca colegas autoras livraria auxiliar robert materialidad interessara pertinente pensando queimaram sugerimos propostas cronológico obras noviços nuno cria funcionamen arames atenta gostaríamos coimbra permitam sucessão substituída acto criatividade realizado simplesment divisão confrontamo confronto inúmeros público aluno considerámo contextualiz terem largas possa relação situam donde introdut alargar 61 reviver fingi-las fingindo rigorosa filtrar fantástico torna deles fielmente fictícias enterrada vimes vimos margem chão instituições passadista xito estreme desafia deixou entendê-las existência madrid chamar particularme mistura metro mina forno gerando gerou procurado pitoresco estanque estar restaura morreram morrer sentimental sentar-se semana sensível completame comparação brechtiana horizonte imaginar audição bonito cinco língua lidos inteiramente pessoa pessoal pesos escaparam professora administrativ caracterizad cérebro conjunto academia abandona abrindo obviamente contudo convoca jorge mergulhar meio formada viver global poesia questiona trazer traz sete-sois recurso refere move-se diríamos senhor comprimento colaboração importante levantemos impede-nos transcreve saíram-lhe salientes levantou coisa sala compor ventre catorze cruzadas tecer acima nico nora melhor funções políticos r0is referencialid referimos referir-se distanciame ditas conceição jeito constante testemunha telheiro textualizar notável note-se noutra acusar criticamente portuguesas posições vazio diverso confundem confronte intromissões ptica afastar-se daquelas defendida tenham terão teoria reconstituíd custa hão-de h~tória ajuda falam forças fábrica faremos capacidade espiritual vozes desenvolvim estrangeiro esteve fica endo necessidade sarl ciências mármores inserida galeria voltaire problematiza destes dessa sentimento sentidos ausência colónia livre administra consciência talvez terra correspond crescer meados actividades omnisciência grandes racionalismo valorização trono simples reflexivo relatar conflito publicada alma contexto portugueses introduzido tenha possibilidade recolhidas alfa falsas anteriores excêntricos externa revela ideia oscar ensino trabalhador ignorância marginalizad partiram partido francesa estrangeirad estrutura secundário companheiro maior pequena característic paralepse geralmente estando processo 699 mosteiro claramente cinquenta baptista brechas círculo perto prolepses memória glória levantar clero contempor culturais referir consiste cunha realeza intuito 190 ricardo ribeiro aparecer anterior esboçam factor entos enuncia exploração captam tolstoi i.o marcada marcado anda gente estava pressupõem pressupor deriva determina explicaremo explicar seguir emoldura analepse passando premonições descodifica semânticas chevalier ilustre maio sonhos profecia informação incidências indicativo indicador abolidas abril oito artísticos procediment destaque destacar destaca restrição sessenta mulher serão romarigães verdades literários colóquio classe interesse subsequent profundo cento durante normalment objectivos acedeu lembremos memoráveis aquilino pragmáticas quixote signo distanciada discursivas jean constrangim leitores lermos junho lello grandeza realmente rememorado simultânea rememora religioso comerciais conduzindo conhecedor saber consignados dons proustiana debaixo solicitando riquezas capela ouro original retrato vontade descoberta planos vidas carga carne informações paulo partes aconteceu medidas asas desse direcção luís nomeadame lembrar disseram razão situação tendo daqui curso críticos crítica popular sofrimento falta filosofia andar entidade espírito ficam natural existe escrever frases apresenta poderiam imagem localização rossio pedras 175 autoridade levar moniz quisesse conceito temos portanto interpreta aliás haver 160 fazem longo desenvolver digamos espanha chama oficial moderna minas viveu feito nacional competência auto lição levam período propomos prolepse novo liberta mecanismos consegue kaufman prazer religião consequênci letra ponto régio domínio contrário 675 736 físicos chegam eleva narrativas enciclopédia europa narrados inquisição abordagem libertadora circunstânci lugar permanece acedemos criação político santa conta temática concluir revolta antagonista aparece-nos exactidão didáctica enumeraçõe expressa elucidação emprego pretende estudo evoca detalhe fictícios naturalidade exorcizadas longas inferimos infantes podemos deixa pretexto reside imagético verificar tradição traduz vértice pessoas sumptuosida espécie paredes nesse nessa coroa minimizou fornecidos fornecer assistir 151 127 20 29 47 gerais problema privilegia despreocup destas representa trazê-los mortes imortalizado transmudad citámos ausente integrados sublinham duas cronológicas consciente onze atraída desmandos rebuscada sirva distancia-se dista comungamo perpetradas permitiu substituir celebração cultural adjectivação monarca práticas realista remete condicionalis irónica interna postura recorrência recolha registo alcança 124 685 56 eram seguinte diferente retratado nascer seis espelho anacronismo procura semelhante integrar carlos ação opiniões mero serve mostrar veracidade campo projecção josefa atesta ultrapassam universal simbólico joão 677 contar adiante simultaneam dedicado 669 718 revisitar fingidas exterior filhos tornar-se genológica denuncia manuais esquece frança deixar exibem-se bessa-luís iluminista lirismo lírica superação específico indexar-se indirecta insiste absoluto ocorridos oficiais modificado metatexto gabriela assistiu pistas principalmen autenticidad autónomo cadeia literariedade compêndios imaginário literária llansol rnítico integralment integração ludíbrio profético cronológica acentuam nomear neles ngulo conversão aqui precisas questionam quiserem referencia mundivivênci coisas impossível clássicos cláudio quase construtores contemplam constitui omitiu referenciam reflexo testemunhal textualizand contamina cumpre teve crítico recriam sobressair agustina hesitar dicionário o-se dentro narrativo mãos surpreenden presbítero eurico espaços duzentos parece metros representan 82 26 mortos neidade nota olhar serviço contempora vamos situa letras posto dizendo datas reconhece herculano 103 695 706 marca emprenhou esqueceu preocupa respeito imagens mário inicialmente amor leva-nos pensado criando momento coincidência itálico nova omnisciente leitor radical invenção publicações publicado altura revista fora entrevista encontra idem scar emergir representar chegou integrando corte mente forma aproxima mulheres caminho intemporalid costumes política alunos ustria reuniões evidente secretas espera futuro processos eventos imaterialidad atribui 112 166 fronteiras reescrever movimento quatro sugerida momentos português confia porém postos posição reino apesar país determinada passada evidencia casa exemplo autonomia coloca títulos oprimidos alteram reconstitui historiador entrada dela análise séculos marta início palavras sentido nomes objectivo tinha reinado alteração vinte manuel através 115 35 antónio excerto eterno iluminismo editorial palmos passam século novos nela privilegiada verdadeiras teria alexandre históricas 41148 136 732 partir aspectos livros gosto significado barroco construíram temporal histórias 118 106 38 694 factos encontrar xviii ficcionais natureza apontar tratar transcendên memórias referencial discursiva permitem portuguesa referências dada dizer 184 701 falar estatuto plano brasil nele verdadeiros libertação apenas devido diante figuras enquanto vezes 667 169 79 693 sujeitas ambientes quinhentos categoria notar reconstru 32 ibidem quer metaficção kaufrnan adeus social historiográfi 133 91 671 43 andava então instância tradicional acompanhar mentira geral literatura quadros marcas fazendo escreve vontades libertar-se estamos três importância justamente 668 fizemos entrar vista tipo povo ultrapassa ficcional engrandece 163 dimensões biografia nunca nome precisament movendo-se próprio reis além 674 intemporal próprios temporais tempos universo 666 730 igreja pensamento corresponde ultrapassar textual trabalho tipológica 157 classificação perspectiva termos 731 ente dimensão deste sempre implica assim 172 58 130gusmão textos sido heróis integra maria lisboa literário agora 100 contam realidade sobretudo 703 fala casos sendo helena 94 53 personagem lopes 70 178 42 cerdeira olhos grande 702 727 focalização explica atenção data alteridade 670 romances silva 1173 diferentes própria função 44 181 739 poca seixo alzira visão carácter embora 729 187 autor teresa 88 históricos elementos maneira 708 734 dois presença lado cristina hoje género 717 modo portugal livro seja acontece narrado 724 44 64 723 vida 14 737 acontecimen acção permite 697 escrita caso 705145 700 real poder personagen 735 histórica pode homem mundo 121 726 leitura facto homens 733 fictício 728 narrativa 67241 154 ficção verdade 40 46 anos neste histórico espaço ainda 696 142 discurso título 707 passado 683 740 obratambém passarola 712 725 0.0 682 738 convento 39 722 664 704 presente texto 665 saramago narrador 714 45 661 662 tempo memorial romance 38 -10.0 história 721 663 -20.0 -20.0 -10.0 0.0 Figura 3.9.3.1. Biplot que permite visualizar nas duas primeiras dimensões, as projeções sobre o ES dos textos das amostras AT e T. Em seguida, considerando apenas os k= 1 textos da AT mais próximos de cada um desses 15 textos a classificar (maiores cossenos), foi calculada a média das classificações atribuídas pelos professores a esses k testes da AT. O resultado é a classificação ClSys atribuída ao teste específico da amostra T. A figura 3.9.3.2. apresenta o resultado desses cálculos, realizados pelo programa PAET. 132 Figura 3.9.3.2. Nas duas primeiras colunas, comparação das notas atribuídas pelo sistema PAET (à esquerda) e as notas atribuídas pelos professores. Na figura 3.9.3.2. a linha do topo contém os identificadores de alguns dos 45 textos na amostra de treino e a primeira coluna do lado esquerdo os identificadores dos 15 textos da amostra T. No corpo da tabela figuram os cossenos dos ângulos entre os testes da amostra T e os da AT, num espaço de d= 50 dimensões do ES. Na coluna 5 da tabela da figura anterior é apresentada a correlação – 0.513 – entre as classificações atribuídas pelo sistema (ClSys) e as atribuídas pelos professores. Exportando estes dados para o exterior e estudando-os com o EXCEL e o SPSS obtêm-se os resultados a seguir descritos na tabela 3.9.3.1. A tabela 3.9.3.1. contém os resultados obtidos pelo sistema (ClSys) e os resultados atribuídos pelos professores (ClProf) do Ministério. Recorde-se que os resultados da tabela 3.9.3.1. foram obtidos com uma proporção para a amostra de treino de 75% e com k= 1 (número de vizinhos mais próximos no ES, a usar para calcular ClSys) – o que equivale, neste caso, a escolher o resultado da amostra de treino correspondente ao cosseno máximo. O coeficiente de correlação (ClSys, ClProf) para estes dados foi 0.513 (significância = 0.06), que fica próximo do valor necessário para ser considerado significativo ao nível 0.05. 133 Textos da Amostra T ClSys ClProf 151 33 19 154 56 56 157 48 48 160 48 33 163 56 60 166 45 53 169 44 54 172 38 44 175 37 28 178 37 53 181 38 61 184 26 44 187 43 48 190 33 20 Tabela 3.9.3.1. Resultados obtidos pelo classificador automático da PAET (ClSys) e atribuídos pelos professores (ClProf). O gráfico da figura 3.9.3.3. (obtido com o EXCEL) é o gráfico de dispersão dos dados da tabela 3.9.3.1. tendo sobreposta a recta de regressão a que corresponde R2= 0.263. Figura 3.9.3.3. Regressão das classificações do professor em função das classificações do sistema. 134 Como se constata pela figura 3.9.3.3., a resposta à questão “são as classificações “reais” (dos professores) preditíveis em função das do sistema?” é a de que sim, mas com fraca qualidade, no caso destes dados. Face à exiguidade das amostras usadas (88 no ES, 45 na AT e 15na T) consideramse estes valores, apesar de tudo, animadores, se bem que longe dos valores publicados na literatura e obtidos com sistemas industriais, produto de anos de aperfeiçoamento. A razão pela qual se escolheu os parâmetros (75%, d= 1) aparece justificada na tabela 3.9.3.2. e também na figura 3.9.3.4. que contêm valores alternativos para a correlação r(ClSys, ClProf) obtidos quando se variam os valores dos parâmetros (Percentagem da AT, k) com Percentagem da AT= 50%, 60%, 75% e k= 1, 2, …, 5. Percentagem da Amostra de Treino (AT) k 50% 60% 75% 1 0.14 0.23 0.51 2 0.08 0.21 0.28 3 0.09 0.28 0.34 4 0.23 0.20 0.20 5 0.20 0.20 0.17 Tabela 3.9.3.2. Coeficientes de Correlação (ClSys, ClProf) quando se varia k e a % de textos na amostra de treino. Representando estes dados graficamente obtém-se a figura 3.9.3.4. que permite constatar que o valor máximo desse coeficiente de correlação obtém-se quando (Percent= 75%, k= 1) – sendo esse valor 0.51. Deve notar-se que o valor 75% para a amostra de treino é muito elevado e só tem justificação num contexto como o aqui descrito em que há tão poucas observações disponíveis que, para aumentar a sensibilidade do classificador é imperativo aumentar a informação necessária ao respetivo treino mesmo à custa da amostra de teste o que, por sua vez, prejudica o coeficiente de correlação r(ClSys, ClProf). Num estudo sem essas limitações esta proporção é substancialmente mais baixa, garantindo, mesmo assim, um número (centenas) de textos suficientes para realizar o treino do classificador e os estudos de validade. 135 Figura 3.9.3.4. Gráfico de coeficiente de correlação (ClSys, ClProf) em função de k para vários valores da percentagem da AT. 3.9.4. Dados EX-MIN. Experiência nº 2. Neste número apresentam-se resultados produzidos pelo programa PAET relativos à análise das respostas Grupo I A) e B) simultaneamente. Embora a literatura não recomende a classificação simultânea de mais do que uma questão de cada vez – no decurso da análise serão evidenciados alguns dos problemas resultantes – por outro lado, isso permite, envolvendo muito mais textos de resposta, pôr em evidência e confirmar através de dados reais as propriedades da metodologia ASL e a validade da respetiva implementação no programa PAET. Antes de realizar a experiência de classificação, usando o ES descrito, relativo ao Memorial do Convento, consideremos a figura 3.9.4.1. que apresenta a imagem em duas dimensões (biplot) do resultado da decomposição em valores e vetores singulares dos textos relativos às respostas à A) e também à B) do Grupo I dos dados EX-MIN. Ambas as questões se referiam ao Memorial do Convento de José Saramago mas a A) tinha a ver com a viagem da princesa de Montemor a Évora e a B) tinha a ver com o romance amoroso Baltazar/Blimunda tendo como pano de fundo a construção do Convento de Mafra. 136 viagem linha homens parte 133 65 0.0 33 convento bárbara 39 103 125 parágrafo imprevistos 191texto 23rodas 155 mafra 6470 atados 83 163 179vora raioseixos 14917332 95 187segunda montemor 116 109 137 161 comitiva chover 110 rachavam gravetos 106 38 13991157 151 atoleiros excerto 29ltimo caminho partiram-se 127 ajuntamento devia terceira 169145 tornaram beira recursos estilo frase 58121 50 185 alinhados bodas cordas espectáculo pardo lastimoso 24 vésperas 59 89 115 três alegria sonhado parado 85 10444 97 seguinte presente quinze grilhetas 17 131 véspera chuva oficial voltou linhas ledice nascimento recurso regozijo 76 71 trabalhar feito deveria nasceu 45 péssimo lógicas fazem turbou-se amarrados 98 imprevisto estrada estar referente autor corresponde tristeza divide-se obras grupo partiram alteza tocou terceiro repetição pedra pensa 77 construído conteúdo condições porqu sentir sintetiza triste solo mostra dividido frio lembrança talvez saiba vinte estilísticos agora enumeração voto constrói-se memória lógica fala pensamento pantanoso rechonchud neste mãos gente dedinho daqueles comparação serviria serviu sintetizar estado afinal trabalhos ultimo escravos motivo mento mole ofício impalpável imagem nome explicação paragrafo aliteração mandado diálogo tocado expressivida secos pedreiros anáfora virando segundo rapidamente conclusão névoa presença caldo boda arrepio faltar galhos 181 delírio estranha estilístico afirmou-se represent cumpre-se sentido carruagem cavalgava tornou-se significa finos termo sonhopartes campos ironia soltam trinta descontenta ensonados obrigados imaginação meio honra caía tivesse expressão parados lembrou visão negação nfase gelado fizeram fogem dedo surgiram temos surpresa testa sabe vira causa casassem presos tornou bálsamo desenvolvim acerca sequer trabalhador carroças trabalho serve final finalidade descreve adjectivação acontecido acordou introdução transporte início irem entender espanto mostrar construido opinião oito onze dores diz-nos divisão limoeiro dificuldades elementos dificultou consequênci consciência ausência fora frica surgindo exploração pantanosos partiam-se passagem palavras partissem partiam partido passa mandasse lembra-se aliviou lugares lembra leitores além deviam destino visitado prisioneiros problemas nascido seguintes refere-se reforçar reflecte nimo atribulada gancho braço bons breve deixando dela deixa teria tenha terreno tocara estribeira facilmente factores 12175 2711 143 167 precisament portanto perceber podia remete-nos revela-nos resposta acabava rvores retira relata patente passos alegre apareciment lágrimas angústia anoitecer lama construiu contentes situação encontrados cavaleiro pretende quinhentos racharam causou seguiam tornava seis felicidade arrefecia fazendo ficar depara-se desanimada despertar termina estradas percurso pleonasmo acontecem acompanha curiosidade crepusculare crespuscular correr coto encontramo cenário caminhos síntese chuvoso infanta irónica chuvas cheio sentiu inicia usar descrição desconhecim descrito descrita estamos peripécias adormecera acorrentado adormeceu acorda ensonada vespera enfim esmagado escravizado enxugou erguido esclarecimen espírito narrador mostrar-nos movimento questionava mudança mostra-se questiona narração metereológic mostrando oportunidad quebraram obviamente provocados obstáculos ocorreram metafórica mensagem montermor quebrando ocorridos opolência prresente provocou mostrado provocar quatro miragem mistérios obscura oposição quarta quebra qualifica mínima moles observa mente oitava minhos oficio imaginá-lo imaginável imaginar impressão identificar imediato implícito ilustram imagina ilusão divertimento dirigindo-se dirigia-se diversas diversão dividir dirigiam dividi dividia divisai disse divido divide ditas voltado voltasse volrou melancólico constatação considerand constrangid constantem obediência mecânicos melancolia constante consiste considero construía obedece constroi construi mavioso melhora note-se matéria consta numca marisa noutra nutria maus nota humanitárias homenagem homenagea harmoniosa impossível horrorizado horrendo haverem hipérbole histórico haveria horror impôs listagem dificultando dificuldade elucidar durarem dificultar dúvidas efectuar emana digna do-se efeito difícil digno dupla e/ou visualizar conheciment prontament promenores prometida propósito marcante conhecida conhecia noivos forçados friorenta grotesco fossem formou caduco formas fornece gravar frases cbeleza fraze caia aída surgimento surgiam superar surgem tivera explicitam expressa existiram explicado explica explicou explique participação parecendo pantanósos parágrafos paragrafos partidos partira,-se passa-nos paradeiro pareciam paragem partícula partirem partir-se parar alinhamento almofadas mandaram lembrar magnífico manda-se maleável aliviando levarem lembrado alguêm longa madeira levavam alíneas loucura levados leveza aliviar levada levaria logicas alínea aliás local leve lido determinada deveriam dialogo devidir visíveis visitou visitar viso conseguimos relacionadas redundantes redundância recostou-se maravilhosa relacionado conseguido referem-se referências recorreram reconhecia reformado confronto recordar referência reflexões conforme reforça conseguir recomeço regresso referir-se negações negativos privilégio recorda regozija negativa refere nele confusa privada reinado reforço seguir reinava nesse reitera atribulado gostaria buracos gostava bonito buraco gostou atritos gerais bonita gosto fome gozar degradação deformava degradado deixarem definição subitamente testemunhar sucumbiram spartiram-se testemunha sucedem-se tamanho terem-se terrenos torbou-se técnicos tomaram suspanto teremos sucedido textuais tardes tomada toma surgiu teresa textual tocá-lo tédio soube ter-se tido tocar testo toca exemplificad expressões estupefacta evidênciado facultaram extravagant estusiasmo exemplos evidenciar facilidade evidencia estrutura exclamar evidente existem exagero fala-nos exprime fála-nos estrofe exerto exige pensativa podíamos precalço pequeno posição postriori podiam pôs-se politico postas possa penso ponte revoltados respostas sacassem sacrificios resumida retirando relatado remete repentina repartido ressentiu remetia absoluto sabendo repouso retorno remonta sabiam saliento segue resume secção relatar abulia rvore rodeia saída resta ruas roda sair ordenou ostentação ordem pavimento ordenando passarão pantanosa pensando passar-se passa-se palpável pantano pecados passaria pedras ordens panos pagar pede ouve lamentou-se lamacentas alegres lamentando mandou ambiente lamacento anciedade apareceu apercebe animais amolece ambiguo lamento lamúrias mande vesperas vestido viagens véspra construiram contentores decidiram dar-nos dá-se decidir presentes compreende comprovado empreendim compreendid condolências reaparecime encontradas comprovada racharam-se racharem-se impressiona incomodava tornaram-os preparativos começaram tornaram-se rachamento começavam condicionou comemorar maneira enamorado preocupada emocionou emprevista empregue casar-se comprovar segurança condisente casasse presenciar manifesta preencher questões cometido tornado-o maneado inclinando incidentes primeiras causasse composta começara quinhetos tornavam primeiros conceitos realçado realça-se nascesse nascença racharem torna-se previsivél comotiva caíssem principal embotas prestes começo preferia reacção realçar realizar tornem tornado prefeito prestar realçou torna tornara encarar rápida rápido rachar reação razões seguia nestes coloca caldos ramos realça sejam racha cair quis fundamental assemelhar avistamento fundamentai assemelhan assustadora felicidades atormento atendendo avistar-se assinalava arbustos fenómeno barbaram auxiliada fernando avistados assinalar bastava atenções funciona azáfama fala-se função assistir baseou arbusto avistar fariam furado assola avarias avista festivo ficado bando faltou física base fase falei delimitada desprazeiros deparava-se deparam-se deparar-se desagradáv desenvolve demasiado desinterece depararam desespero depara deprimente desenrolar desfaleceu desiludida depressa desagravo deparado desolada derivadas desilusão deslocou desejos deparar deparou dessa delirio depõe teríamos tenciona estragando estradas/ca estilisticos estômago esquecido estabelece estragos percorrer perdeu pobres podem pôde aconchegar agradável agrupament ajuntament repugnante agumerado alcançado respectiva resistiram agradavel afirma-se alcançar aguçado achou alagados agitação agradar achava agrupa acesso reside acima aceita acha apresentada anteriormen aprisioname aprisionados aproximação justificasse aproximado anteriores justificados aproveitar justificam antidese aplicar continuidade contribuiram contrariadad contratempo controvérsia conversa danificaram danificando continuarão contrastava contrastant criminosos contribuiu contrói-se daquela crimes dá-nos coração cumprir covento danos dadas contro crítica critíca curto infelicidade climatéricas certamente complicaçõe informação sobressaltad comparadas encontrarem circunstanci sintetizado inesperadas sintetizante celebração indignação chateia-se informa-se cena comparar completa sentimos chegasse coagidos indicação irregular informar infelizes irritação chocada sintetisa sintetizo sintetize simples situada sofriam chama choveu chega carros irónico chocar chuver torpor usando chovia centro infeliz servir chão coche chove chova indica irreal chiva cima ir-se fazia-se figura ficava finda desconhecid desconhece desejando descritos descobrir estampado estariam estam pergunta-se perturbação pertenceria perturbada pesadelo perfilados pergunta péssima pesada perigo plena piso acontecesse adecadência adormecer acordada acordado acordara admirada adversas afirma adjectivo adviram afectar afasta actos seriam caracterizad interrogação transmitindo transformar caracterisad insatisfação caracteriza juntamente transformou transtornad enquadrand intempéries característic transfigura transcrito inquietação transmite enfraquecia transmitir turbulência intempérie caramelos transtorno transcritas tratava-se verifica-se transporta utilização sonharam inverno transcrita tratados tristezas interroga inundado tragédias trajecto utilizado intensiva intrigada tratasse trata-se tubou-se enfatizar turbo-se utiliza-se sonhára instante carácter engloba utilizada solos utilizou iremos tristesa tristes veículo traços turbou ultima sonha varios cara vê-lo inicio julga trata traz enterravam entristecer enumeras envoliente entrando enumerar entidade episódios entraves enumera enunciar entanto espantada esclarecida escolheu escolhida espaço especialmen espetáculo espera mostrava mulheres música mundo za-se meteorológic mencionado monumento quer provocaram observação quantidade observada mostram miseráveis operários mortes olhou ocupa merc isentiu-se dentificado dividir-se distintas dirige vivo megalomana constituída consolado próprios novo importava humana dimensão dificultava doze egoísta vítimas vitímas consequent conscienciali conhecer noivas forçadament franciscano fragilidade fragilizada grandiosa frágeis tira existissem partirem-se liberdade lástima alinha leitor leste longe devida vislumbrava visitara visível privilégios conflito nível relacionada relacionados gentes aumentar sucede-se tenhamos tamanha torbulenta tormento talvéz terem exemplificar estranho executada execução percebemos possíveis pensava poema relativament resume-se sacrifícios reparado reparara satisfazer resulta revela revelou retrata ordenado passarei orienta passo angustiada apaixonado aperceber anafórica lamentar lamaçal juntar alegrai sente seguidament encadeação realizasse começado pretender realçando realizadas realizada inantigível realizou incómoda causava prende se-lhe racham festa arrependime avizinhava favorável barbara avistado bastasse atoleiro deparou-se deparava desanimo estragara esquecer respeita apresentar apresenta aquando aproxima apoiado justifica contemplado contraditório contrariados cresceram crua chegava indiferença inesperada inesperado sentir-se encontre centra infante cheia clero feita feiro descobrisse permenor permite acreditar advérbio engrandecer tranquilidad intensifica trouxesse tratavam inúmeros somado trágicos utiliza-a vaidoso enfase inteira valor enumera-se ergueu epoca moldes morar ideia importam diferentes efémera passados referido reflexão tarde sonhos pensarem possiveis possam saber represálias fundamenta respectivo acontecimen quase impostos constatamos melhorar dificeis prometido partilhada bonitas tivessem palavra primordialme preocupa reais barreiras aventura ganham demonstra derrubam pode respeitava apresentado antítese contrato coisa incansavel sentida casam fazia ficasse estação plantas acontecer acordar caracterizam intervenient seria veracidade tratava utiliza questão nascem m--se provavelme metáfora misterioso queremos querer puros imenso dito vivida objectivo próprio normal ntimas importante livres dúvida margem forçado frente frei suposto experiencias exploravam mágico leva deve destes reina necessário seguiram seguiu-a nobres ncia folho face ponto renovação segredos sabemos retirar pássaros apaixonou aparência vindo daquilo premeditado companheiri casando-se raparigas concordo condição casarem fazem-no atitude atingir basta falta demonstram ternuras respectivam reprodução acção ajudarem acariciam achar correspond cúmplices correcta criados significado completarem completame carregada uniram-se chegada sinónimo planeou admiração enforcament sonhar veio interferem enganava trocavam sonhava carícias irmão envolviment enunciado escolhendo xviii morresse opõe-se quentes pudor vivido melhor normalment obediente haviam haver conheciam projecto marcar frustração fria superioras existir expontânea parecida lutadores ligação mandão mágica almas levou libr naturalment conseguirem naturalidade nico regia bôndade gémeas flui tentarem submissa exigente possível relaciona-se romântismo sacrifício sedutores relacionar acabaria século acabar abaixo passava paciente pedidos origem pacata apaixonar amizade via-lhe consumado dedicou-se decorre data primavera semelhantes companheira tornando pretendiam realizados arranjadas família avam-se baltazas falsas bíblia demonstrad desgastar esqueceram aceitou-o ajudá-lo justificado aproxima-os anterior continuaria contratual dado criação dando encontram complement totalmente encontro sofredora completo sete-sois sofredor sexuais sexual carne finalmente faziam ficassem personifica pior aconteceu acontecera afectividade interrupções engravidass transpirava intimidade entregavam espanha escolhido mostrou movida mutúa mostra-nos observar-se provocada menbros quebrou pude-se pureza igualmente imensa ignora voltava vizinho voltar construída protagonista protecção membros máximo medo importância humanidade hoje dormiram dizendo dormiam eclodiu dificil direita vivam conservador conhecido nomes formalidades guardava caido fuga tirou expoente participaram alto-de-f aliavam alta loucuras levaram língua ligava lição determina profundame reconheceu recolheu-a consentiu conhece marca nela nica gradualment aumentando burguesia gostavam ausencia genuíno ausente fizesse fize-se flores fonte defendiam teve testemunho tambem tipo exempleficar executado existente eterna abençoados sebastiane romântico romance secalhar religiosa sedução saiu passassem optimista pegando passeio ouvia pedir aparecer-lhe angustias mandava largaram alegrias mando vice-versa contexto dedicação dar-lhe encomendad preocupava realizavam enamoram sentar-se seguidos cometer razão tornam causas comer reflete assumiram averiguar assumem aqui famílias assunto familia fulcral falar faria demonstran desgostos demostra dependia deram teriam estiveram percorrendo poderíamos percorre poderia responsabili representad reprodutivo ajudaram ajudava ajudam acabe aproveitam aprovações andavam apetecia apoiava jura-lhe contente daquelas contar dade inconfundive coincidência caminha-se chegando comparada completava encontrá-lo separação simbolizam completam sentia-se separaram indiferente significava influencia simbólico sentiram caminha sentidas chamas sofrem servia sétima sítio fechados ficaram feitos filha descansou descobre desejava termos estatuto estaria persignação pertencia pleno afirmação acordo cuprimento ultrapassar encontrou-o verdadeiras ultrapassa enfrenta inquisão interese vamos josefa inveja traí-lo envolveram interferiam interferida entrega então esconder escuro esmola esperança mútuo obrigatoriam observamos meramente obrigatória queimam pudesse obrigava morreu pública morta m-na considerare novamente olhando-se materiais olhando noticias nsia olha honestamen históricos económico drescendo efectiva difere dotes dizia dura vivendo vive nomeadame marcantes ltima mágicos amados amam longos ltimos devoto foge surgir pequena praça salvaguarda sebastiana segredo aberta abrir passam passaram o-se apaixonand apensar destas vindouras decidiam decidem realidade condenados encontra tornando-se combinado compreens princípio procriação comemora castigada concluo casou-se comum previa comia baseia-se bençam fascina baseia bens desnecessár demonstrou desfileiro deixar estética esposa portadora podémos poderes pobreza perder porta acompanhar ajudado ajudar aldeia continuaram contractual cruzam-se continuava criando encontra-se sentimentos complicada separados situações cerimónia casado sincera feiticeira perdidament permonição pertencem planeado pertencer perviu acreditava acordava cortejo inseparáveis intensament enfrentado insistência interajuda iniciou-se vêem-se iniciada instável julgada trágica jovens jovem jejum ustria jesus sério entrar mostraram modo impedida morava meses impostas imediata dirigem-se disseram domingo domindo volta considerada havendo herdado guerra horas vítima marcadas noites noiva caçarola supera surge existiu abensou-os particular papel alguem amava largos conseguira maquina regras nido bruxa definitivame desafiava deixara tendo-o sorte estranheza estranhame espontânes rencontrar retratada acabaram retratado reparar apaixonada juntaram andava amnor andou continuando contacto contada realmente complicidade inconformad quilómetros encontra-lo incansável inaugurar realizado prefeita rapariga coisas empatia maneta sentem calmo assinado ferros deparar-nos despenhara desapareçe desejavam descalça terminado estabelecer percorrido percorreu perdida afirmar aceitou cumprirem convidou cremado sofrimento carnal seres serra jeito fictícia desconhecia perguntar adversidade interligado intreferice intuito interferiu intuição iria velho ve-lo escolhem queriam obrigou direito própria normais partilhavam partilhando locais profundo conseguia tinhm palha amavam-se construir decidido concentimen através bois esquerda jura coral ficarem estão variados unidos sóis eróticos mútua ocorreu herdeiro embora dizer promessa superior amam-se alma luta bruxaria prazeres oposto decorrer decide real mantiveram fundo ajudou contudo pessoal acontecia afecto episódio escolha espiritualida moribundas queimados obrigado provas imposto vivos gusmão dinheiro visto promessas força fugir amavam lugar luas devido desvanecer desvendar virgindade recolhendo reencontro conseguiu procura-o reciproco recolhe recolhia tenham tentar toledo extrema sacramenta sabia repleto repleta peito apaixonam angustia continua principalmen compara incondicional combustível casavam assistia ficando desaparecer desenvolvid desejo desgosto percorridos pobre perda representa acompanhad respeitavam ajudavam acontece conveniênci culminar chamaram certeza filhos persistência plenitude interesses interfere entregam-se entregue queria impediu houvesse hora dever procurou-o recolher nessa terceiros eternament resto passado país amigos vidas começa caso condenado bênção fitícias desafios junto sentimento perfeito verificar verdadeiram trono interferia obrigações voar livro altura amar alto ninguem máquina reino possui preso aspectos demonstrar desaparecid esteve apoio encontrava chegou pessoa entregou-se obrigada imposição consegue tipos passar amaram-se desta virgem procriativos natural pensar possuía seja fazer fins ternura estavaficou acções fidelidade interferência ento morrer idades diferente diferença natureza começou blatazar tempo 18 terras representan acabou lado sociedade sentia jogos maria nunca voou olhar deus tenta suma desses vezes principe autos poca sido sentiam sítios acto verdade olhos viverem prometeu passando deste espontânea construíram estarem contrario vivem recolheu procriar casou deixou pode-se acabando acaba passou conta quiseram fica desaparecim conjunto realização desaparece capacidade enorme intensa mutuamente observar homem herdeiros maior leis apaixonados iriam magia procurar povo sendo mulher m-se montejunto queimado houve noivo de-f vidente feliz dele desse verdadeira ente momentos disso fosse casamentos enquanto interesse marido conheceu existia amorosas leitura porém apesar queimada eterno saramago pais casar realeza momento pura nesta portugal colher ainda auto-de apaixonara encontrou serem especial igual noite auto lisboa condenada respeito viver forma fogueira deles igreja reis viram primeira primeiro sete simbologia partir amado procurou também classe inquisição representam social puro vista conhecem carinho havia facto joão viveram união cumplicidade vontades forte exemplo casaram construção obrigação confiança tendo voadora casamento poder logo foram depois tiveram dias apenas personagen imposta vida casados morte viviam existe sempre prova interior relações sete-sóis sete-luas casa estavam duas tinham rainha contrário procura podemos felizes longo paixão 172 tinha eram encontrar livre 130 dois dentro assim grande memorial nove história ambos bartolomeu auto-de-f vontade durante pessoas casal conheceram 190 obra 160 padre 74 passarola juntos verdadeiro 51 anos 178 amorosa 140 68 15 48128 30 88 154 134 148 92 170 101 184 94 41 79 21 14 35 67 61 16682 36 118 73 112 146 142 136 113 188 100 56 164 53 176 baltazar 20 42 107 124 62 158 119 47 80 122 26 -10.0 86 152 182 amor relação -20.0 baltasar -30.0 -30.0 -20.0 -10.0 0.0 Figura 3.9.4.1. Biplot correspondente aos textos das respostas às questões A) e B), relativas ao Memorial do Convento. A figura 3.9.4.1. foi construída usando a informação de 60 respostas à A) e 60 respostas à B), com as quais foi construída uma matriz de frequências X (n, p) com n= 2497 palavras e p= 120 textos. Procedendo à decomposição em valores e vetores singulares dessa matriz, verifica-se que é necessária uma dimensionalidade d= 60 para captar 90% de toda a informação dos dados. 137 A figura 3.9.4.1. foi construída com as duas primeiras dimensões, correspondendo a uma variância/informação de 41%, o que significa que este biplot é altamente representativo da informação contida nos 120 textos. Considera-se a figura 3.9.4.1. notável e traduzindo muito bem o poder deste tipo de análise. Com efeito, a figura envolve dois grupos de textos (setas a vermelho) que, pela sua quase ortogonalidade, definem a topologia do gráfico. Os textos contidos em cada um desses grupos formam ângulos muito pequenos, significando que são textos cujo significado é semelhante. Se examinarmos agora os textos que fazem parte de cada um dos grupos (ver as elipses sobrepostas aos grupos de textos), verifica-se que o grupo superior (horizontal) agrupa os textos de resposta à A) – relativos à viagem Montemor/Évora – e o grupo vertical, à direita, é relativo aos textos da resposta à B). As palavras mais representativas (escritas a azul no gráfico) abrangem {bárbara, convento, homens, linha, Mafra, Maria, nunca, parágrafo, parte, princesa, texto, viagem}. Os textos mais associados ao grupo vertical são todos textos de respostas á B), tais como {26, 86, 152, …} e palavras como {amor, Baltazar, relação, amorosa, juntos, passarola, verdadeiro} fortemente evocativos do romance Baltazar/Blimunda, como devem. Em síntese, a figura 3.9.4.1. capta, apesar de ser construída apenas com dois eixos (dos 60 necessários para obter 90% da informação), quase na perfeição, o conhecimento prévio de que os textos se dividem em dois grupos correspondentes a temas semelhantes mas distintos, separando esses textos em dois significados bem definidos em perfeita concordância com o significado dos mesmos. Acresce ainda que em cada grupo coexistem textos de qualidade muito diversa (tanto no conteúdo como na natureza e número das palavras usadas). Essa variabilidade é captada pela diversidade dos pequenos ângulos entre textos do mesmo grupo. Mesmo não sabendo, pela análise representada anteriormente, que os dois grupos têm significados diferentes (A e B), o mero exame desta figura informa-nos que subjacente (latente) a estes 120 textos se encontram dois significados que explicam as proximidades entre os textos do mesmo grupo e a presença dos dois grupos que formam um ângulo praticamente de 90%, significando ausência de correlação entre esses grupos. 138 Se repetíssemos esta análise mas escolhendo ao acaso um certo número de textos abrangendo agora respostas a A), B) e Grupo III, obter-se-iam biplots como o ilustrado na figura 3.9.4.2. bárbara maria convento 57 parte homens 0.0 60 100 70 linha mafra 162 96 parágrafo viagem 145 80 106 1477 40 67atados imprevistos 27 133texto 177 47 139 127 87 186 115 148 vora ltimo rodas 103 124 raios 30 168 montemor segunda 174 37 112 180 142 eixos chover 118 rachavam chuva 83 86comitiva 171 atoleiros ajuntamento gravetos 110 beira voltou 130 tornaram nasceu 13615090 34156 159 vésperas recursos terceira bodas pardo partiram-se casamento primeira 24 216320 121 cordas espectáculo lastimoso devia alinhados alegria sonhado partes nascimento oficial 53 parado frio deveria quinze 93 véspera três recurso seguinte constrói-se grilhetas regozijo péssimo ledice linhas imprevisto turbou-se triste tocou estrada construído estranha seriam lógicas 17183 54 tristeza amarrados presentes trabalhar sintetiza 153 estilo condições alteza primavera voto divide-se solo estado lembrou comparação repetição campos chegava dedinho vinte cumpre-se conteúdo anáfora terceiro névoa corresponde saiba cavalgava final apresentado expressivida construção tocado felicidade referente virando estilísticos estilístico boda trabalhos carruagem alegre fora imagem escravos pantanoso teria diálogo rechonchud espanha impalpável irem mole partiram início ensonados ultimo acordar acordou dedo bálsamo festa feita finos visão transporte casassem galhos explicação ordenou tivesse afirmou-se dores descontenta frase gelado estribeira testa pedreiros faltar aliteração aliviou porqu soltam serviria serviu espanto crepusculare ironia caía termo lógica arrepio respectivo infelicidade fogem rapidamente sente secos mandasse mandado enumeração erguido ofício cheio cavaleiro cena acontecimen adormecera adjectivação acontecido acorda avista vespera apareciment tocara fazia atribulada finalidade veio visitado casar elementos casasse tratados trinta descrição descreve curiosidade gancho apresentar apresentada prisioneiros refere-se patente recorda diz-nos doze divisão retira forçados escolheu lágrimas termina braço lama onze dimensão deviam dificultou nfase reflexão pensativa perceber chuvoso reforça dividido carroças trabalhador caracteriza alegres solos depara-se sintetizar deparar-se sintetizado delírio depara esmagado crespuscular conversa coto encontrados mostra-nos pantanosos lembra-se paragrafo parados lembra leitores sabiam bonito quebraram voltado arrefecia percurso aquando lugares mandou limoeiro remete-nos represent remetia introdução segundo partiam-se quinhentos seguintes caldo partiam partido meteorológic narrador enxugou entender nascido negação obrigados surgindo surpresa utilização utilizado utiliza-se utiliza-a utilizou utiliza usando chateia-se chegasse chocada chocar chão celebração cenário turbulência causou trouxesse causasse causava tubou-se turbo-se centra centro turbou ultima degradação deformava degradado gostaria tomaram tomada toma acontecera acorrentado acontecem adormeceu acerca adecadência aconchegar acontecesse adormecer acção acordada acordado acordara admirada adjectivo achava aceita acha verificar avistamento verifica-se avizinhava avistar-se fenómeno avistados avistado vesperas azáfama vestido viagens véspra avarias avistar tristezas tristesa tristes decidiram dar-nos dá-se decidir apareceu aperceber apercebe apoiado expressões facilmente extravagant factores exprime construída conjunto consequent conscienciali construido confronto conforme conhecida construía conhecia construi confusa conflito tornaram-os tornaram-se torbulenta tornado-o tornavam torbou-se torna-se tormento tornava acabava tornem tornara tocá-lo tocar tira autor vislumbrava redundantes redundância felicidades referem-se atribulado ausência visualizar atendendo atormento auxiliada aumentar faziam atenções visitara fazia-se ficasse atoleiro vítimas vitímas visíveis visitou festivo veículo visitar visível ficado ficava feiro finda viso transformou transtornad transfigura tranquilidad casar-se transtorno elucidar transcritas tratava-se transporta transcrita tratavam trajecto trata-se dúvidas emana tratava do-se e/ou traz rodeia roda desejando descritos descrito descrita danificando dá-nos cumprir danos curto fundamenta friorenta furado fria aprisioname aprisionados apaixonado apresenta anteriores estilisticos ambiente amolece antidese contraditório contemplado continuidade contrariadad contrariados exploração contentores continuarão contexto contentes explicitam expressa explicado explica explicou explique constatamos condolências constatação constrangid constantem condicionou constituída condisente consolado consiste constroi consta prometido prontament ostentação promenores ordenando ordenado prometida propósito princípio privilégios privilégio absoluto principal textuais privada textual abulia ordens tivera tido julga ouve grotesco desprazeiros despertar dessa relacionada relacionados climatéricas relacionadas recostou-se assustadora circunstanci passava pavimento recorreram reconhecia recordar passarão favorável passarei passar-se regresso coagidos passa-se pecados regozija passaria relata assistir reinado reinava reitera fariam assola coche varios pede clero agradável agrupament ajuntament agumerado alcançado agradavel durarem afirma-se tragédias aguçado alagados agitação agradar trágicos agrupa alegrai traços divisai dupla perturbação pertenceria perturbada pesadelo péssima pesada pôde revela-nos resume-se revoltados resumida retirando retorno resume revelou retrata desconhecim descobrisse desconhece deprimente sentiu-se sentir-se depressa descobrir derivadas sentida sentiu depõe crimes crítica critíca crua forçadament franciscano fragilidade fragilizada fossem formou formas fornece gentes frases gerais frágeis fraze esclarecimen escravizado angustiada esclarecida estragando estradas/ca identificado imaginá-lo estradas estragara estômago angústia aproxima aproveitar anoitecer anafórica escolhida estragos animais estariam ilustram contribuiram contratempo exemplificar controvérsia construiram estupefacta contrastava contrastant estusiasmo estranho construiu contribuiu executada existissem contrói-se estrutura exclamar existiram execução estrofe contro exerto exige empreendim encadeação enamorado emocionou emprevista empregue embotas presos precisament testemunhar lamentou-se pretende preparativos juntamente justificado justificasse testemunha provocaram lamacentas provocados preocupada preocupa lamentando palavras presenciar preencher lamacento pantanosa pretender primeiras terem-se teríamos barbara barbaram terrenos opolência operários justificam provocou prresente previsivél precalço bastava provocar bastasse palpável pantano prestes oposição terreno preferia teremos rvores lamento lamentar lamúrias lástima buracos prende prefeito lamaçal baseou qualifica prestar juntar justifica buraco breve panos pagar olhou bando testo base ruas grandiosa gostava gostou gravar gosto gozar desenvolve dificultando desinterece desespero desenrolar desiludida dificultava deveriam desolada dificultar deslocou desilusão dialogo nestes digno compreende percebemos comprovado compreendid reaparecime comprovada aproximação passados assemelhar percorrer assemelhan facultaram aproximado realizasse comprovar reformado passa-nos reflexões começado reforçar assinalava pensando completa composta realizadas realizada recomeço realça-se reflecte realizou assinalar pensava pequeno liberdade fala-nos fala-se realçar fála-nos choveu vaidoso chuvas reforço pedras chuver chovia coloca chove faltou lido caracterizad afirmação alinhamento caracterisad divertimento dirigindo-se almofadas caramelos dirigia-se dividir-se aliviando advérbio adversas afirma diversão alguêm dividir adviram afectar dirigiam distintas alíneas alinha dirige dividi aliviar torpor alínea divido divide aliás personifica pleonasmo podíamos poema pôs-se politico plena ponte piso somado sofriam sóis relativament repugnante respectiva resistiram reside delimitada desanimada sobressaltad deparava-se desagradáv deparam-se inesperadas depararam sintetizante deparou-se inesperada inesperado deparava síntese infanta desagravo deparado desanimo deixarem deparou deparar sintetisa sintetizo sintetize situada infante delirio monumento montermor mecânicos matéria marisa espantada estampado espetáculo imaginável estabelece importava imediato implícito imagina espaço estam impôs evidênciado cresceram evidencia evidente exagero encontrarem enfraquecia encontre enfatizar enfase mostrar-nos pantanósos parágrafos paragrafos quebrando mostrava mostra-se mostram paradeiro realçando sacassem sacrificios realçado mostrado paragem mostrar irregular lembrado quatro irritação irónica quebra quarta levados irónico caduco se-lhe levada realça leitor bonita leste cbásica saída aída humanitárias harmoniosa horrorizado horrendo haverem horror volrou za-se nimo comparadas arrependime começaram compara começavam comemorar mandaram cometido comparar começara listagem arbustos conceitos comotiva começo madeira longa loucura arbusto mande logicas local postas spartiram-se sonhos sonharam sonhára soube reparado respostas reparara respeita repentina repartido repouso interrogação inverno interroga inundado intrigada infelizes infeliz megalomana melancólico melancolia melhora moles impressiona impressão engrandecer engloba seguidament racharam-se racharem-se rachamento questionava parecendo racharam partira,-se partidos questões questão questiona quinhetos racharem seguiam pareciam caíssem levarem partícula reacção levavam racham segue leveza rachar rápida secção reação razões seguia levaria ramos caldos racha leve homenagem homenagea hipérbole nomeadame noivas noivos maravilhosa manifesta magnífico maleável perdeu subitamente insatisfação intempéries inquietação informa-se intempérie intensifica informar intensiva instante inicia inicio metereológic metafórica metáfora miseráveis miragem mistérios mínima minhos merc incomodava inclinando incidentes inantigível incómoda enquadrand enumera-se ensonada entristecer enumeras entrando enumerar enumera entraves enunciar movimento partirem-se mudança caminhos partissem nascença narração partirem partir-se música noutra pergunta-se peripécias permenor perfilados pergunta sucumbiram sucedem-se sucede-se sucedido indiferença indignação indicação enterravam envoliente episódios ergueu epoca nascesse negações negativa ocorreram obediência observação ocorridos observada obedece obscura note-se observa numca oitava oficio nota tenhamos técnicos tardes tédio tamanha surgiam suspanto surgem 44 165 18911caminho uniram-se ustria unicos ultrapassa cerimónia chiva acreditava túmulos ceia definitivame defendiam acompanhad acompanhar acariciam aceitou-o acordava aceitou achar verdadeiras veracidade averiguar vice-versa avam-se fernado via-lhe ventos ferros velho filha veria ve-lo trobulentos castigada casou-se trocavam decidiam decidem decidido data decubriram dedicou-se decorrer dedicação decorre dar-lhe daquilo aparecer-lhe apaixonand apaixonou apaixonar aparência apetecia apensar apoiava facilidade conseguirem conservador conheciam conseguira consentiu tornando-se tornando tivessem acabaria bençam tocaria beleza tirou aumentando reencontro fazem-no fechados ficassem ausencia feiticeira vêem-se fechava ausente ficarem atritos fictícia virgindade vindouras vítima vindo casando-se transpirava económico dormiram alçandas dormiam efectuar alto-de-f efémera casarem domingo domindo efectiva eclodiu traí-lo romântico romance significava simbólico desejava danificaram cuprimento cúmplices daquelas culminar dando frustração funciona ganham gémeas fuga estava amavam-se apaixonada aprovações ambiguo ansiando esteve amizade antítese estética amam amnor experiencias continuaram continuando exploravam expontânea consumado contractual continuaria continuava contente contacto expoente contada contar condenados considerand considerare constante condição primordialme promessa profundame promessas procriação procuraria optimista profundo paciente projecto bocados julgada origem pacata josefa ouvia abria abrir o-se gradualment guardava despenhara devidir dificil devoto relaciona-se coincidência reconhecida reconheceu passassem relacionar assumem pássaros pegando pedidos famílias passeio fascina regras reino cidad pedir reina regia ajudado ajudaram drescendo ajudarem casado ajudá-lo ajudava afirmar alcacer trágica casam almas dotes dura poderíamos portadora pertencer pertencia podémos pessoal perviu perto porta pior retratada restou desconhecia desapareçe derrubasse separação sentia-se separaram descansou separados derrubam desafiava descobre dependia derrubar sete-sois descalça sentidas sexuais sétima sexual cruzam-se criando marcantes morar formalidades forçado genuíno frei escolhendo anciedade estiveram escolhem angustias andavam escolhido esconder angustia estaria andava ignora andou construir exempleficar contribuindo estranheza estranhame conturbada executado contratual existente exigente contrato eterna encomendad enamoram empatia premeditado protagonista abençoados romântismo testemunho preocupava abensou-os pretendiam olhando-se terminado provocada burguesia morresse baseia-se oito juntaram largaram tentarem prefeita pudesse ternuras caçarola opõe-se baltazas bruxaria pude-se olhando jura-lhe morava teremo olharia pureza olhava aberta teríam abaixo baseia previa morta irmão largos praça jejum bruxa pudor puros o jeito lha gusmão voltava vizinho vivam xviii desnecessár desfaleceu desgastar desgostos desfileiro dinheiro difere nica assinado completarem complicidade percorrendo complement aproxima-os completava complicada completam combinado compreens realizavam recolheu-a pequena percorrido referir-se realizados pensarem combateu reciproco percorre realçou ligação recolhia familia reflete ltimos ligava falar falsas falei lição libr caracterizam afectividade dirigem-se carregada disseram aliavam alegrias carícias afasta direita carnal ditas planeado possiveis planeou plantas pobre pleno respeitavam reprodutivo reprodução respeitava ressentiu religiosa demonstram deparar-nos demonstran demonstrou demostra sofredora sinónimo sofredor deixara sincera servia serra sério materiais mavioso margem máximo fizesse fize-se flores folho fonte foge flui especialmen esqueceram estabelecer espontânes importam impedida imediata escuro estação estando impediu espirito esmola espada esposa imenso correspond cremado convidou cortejo enforcament encontrou-o encontrá-lo encontra-lo encontro enfrenta semelhantes salvaguarda sacrifício sentar-se queimam seguiram bôndade saliento quebrou quentes sentem bonitas ir-se caido honestamen honestidade herdeiro havendo herdado vivendo haviam vivido vivida nido companheira companheiri comparada maneado arranjadas manda-se comemora mandava loucuras mandão cometer maneta lugar mando comer longos comia língua perda valeu livres sonhava represálias renovação rencontrar remonta reparar interrupções intervenient interferiam interferem interligado interferida intimidade intreferice interferia influencia intuito interferiu inveja menbros moldes impostas imposto engravidass enganava motivo participaram partilhavam caminha-se quilómetros sebastiane sebastiana partilhada raparigas sedutores particular queriam seguidos parecida rapariga caminha secalhar seguiu-a sedução segredo levaram calmo levou históricos nobres noites noiva perdidament marcadas lutadores maquina mágicos perdida mágico mágica postriori submissa inseparáveis intensament insistência interajuda iniciou-se iniciada inquisão interese instável meramente misticidade misterioso meses m-na inconfundive inconformad incansável incansavel inaugurar incentivar entregam-se entregavam enunciado eróticos entrega movida mútua mutúa mútuo m--se ncia noticias ntimas nsia persignação permonição perguntar perigosos indiferente envolviment envolveram natureza negativos nela observamos obediente ocorreu nutria obrigatoriam observar-se obrigatória obrigava obrigou tenta superioras tenciona tendo-o unidos chamaram chegarem chegou acontecia trono gostamos toma-se toledo avançamos fins verdadeiram fidelidade casavam casou decide apaixonam aperbermo face acabaram bestaião principe bênção tinhm vira referentes ficaremos passou ficando virgem vilões agem alto descontraid simbolizam simbolisa fugir amaram-se amam-se amavam amar amava contrario condenado procriativos moribundas preseveran procurou-o prometeu procura-o orienta blatazar procriar primite ter-se ouver bois dificuldade desvanecer desvendar passaram variados assistia peito ajudavam podia resolvam resto sete desaparecim desaparecid derrobar derrotar desafios sentiam deram demasiado demonstra fotografias gerando fitícias imaginar idealização esquerda idealizar escolha idades conveniênci emprego lembrança teriam quantidade prazeres bons lealdade ternura provas palha olhar jura gostaríamos vivem vivos nesta desenvolvid desistem desgosto combustível realização percorridos recolhendo pensavam começam recolheu recolher recolhe realiza alimentam plenitude possuía representan repleta demonstrar espontânea espiritualida imposição imperio corajem coral enfim sacramenta protegerem mostrou sentado parar saiu queimados herdeiros viverem concentimen começou locais posto interferência interfere iriam partilhando sebastico segredos homenagear normais mantiveram máquina subreviver intensa incondicional inclusive entregou-se entregue mutuamente nascer obrigações obrigada obrigado persistência perigoso surgiram 50 certamente certezas cento definição aconteceu acesso vermelhos venda de-f conhecidas conheceu acompanha achou tomo verdadeira auxiliado ferranho auto-de visitada vidente auxilio autos transmitidos egoísta castiga castelo través frequentam fundou apaixonados anterior expressão fácil tivemos tica guerras desportivos desse relatado aumenta refeição cidades clubes vêem peço casamentos tradições divinizam dormir aldeia dizem dobro revela risca significado sentimos sentirmos criarem ganhando função fortuna amorosas amarelos estatua amado amigo construíram consuante expansão estrema estudo consideram condenada condado encarar oponentes primária julgados joão próximo orientar oriente ter-me guimarães dificultada devida diga pedra reconhecem comandar familiares passando colegas totalmente afirmá-lo almoço dividia adulto total pocas portanto portucalens posição podiam popeia sofrimento relatados relatar sequer simplemente descoberta simbologia depender sítios montejunto moralidade matando marido imaginárias imagens existentes costumes correcta criam exista encontrava irreverência quatrocento pratecipara quarenta bancos lembro leitura pretos jantar pura leis zamora voou competitiva realeza começar valoriza afinal possuírem possuir representam religioso inúmeros medíocre focado imitar queimada quiseram calcanhar parceiros seguem seguros honra noivo comercializa lutamos perdão perder conclu injustiças mencionado mistura inabitável entrou multiplicam camisas canecas nomiação noventa noite potencias inigualavel mento errados necessitava ocidente objectos notícia obtam ntimo obvio super-herois tenho tenra tecto tamanho surgiu usufruindo universal universo vagueia utopia chamasse chegado unidade unhas cavalo célula céus defendida defendo deixam actualmente adoptando admirado aconteça admirar tomado tomara aceitar adão a-dia verificam vencedor venerava aventura verifique vencido vê-lo ve-se catalisador categoria troianos decididamen defenderem defendam dar-lhes dedicou decidiu davam apaixonara aparecem aplicar apanha extinguem factos conseguido conhecem conquista consegui aclamava-os tornarem-se belimunda toldar destinguido referenciado autonomia autoridade atingiram austeros fictícios atenta física feitas vinda fique auto viria transfiguram transcrito transmite transfigurar transcende transforma transforme eleição educar elevar trio desejos deseja cumprir-se cumprido cultivado cura-os dadas fundadores glorificação ganha antiguidades antecedente antiguidade continuados contextualiz exploraram explicadas faça conservamo conduzir proporcionar propagador primórdios acabamos ouvia-nos princípios blocos bíblia biblia guarantiu guardar guia deterimento destacaram despoletar reconhecime recordarmos recordá-lo fantástico cientistas recorrem passos assumiu astúcia passe reis viram alcançando alcançados aguardava dizendo africanas ajuda-as dotados trágicas alcança ajudam alcácer agente trágico duram duvida aflitos retratavam restringe resumir riqueza retirar sentimento significa simboliza-se sentirem-se criminalidade croncetos cristãos crítico cuidar criar crias crise crist gigantes fulcral identificação identificamo escravatura idolaterado igualmente escondem estivésse alvejado estima igreja ideias ando exemplificad contribuição exército concordand concluo oportunidad baseava-me provávelme justifiquem abençoado abordando abandono justifique território premios terrena preços ontém prédio cabelo lançar prove rumo ruína puro gostávamos gostos vulgar guiou desgraça desfecho deve-se comunidade assinalável combatem pensamos realçaram combater referirem completo comanda falarmos pensaria colocam assente variada libertou familiar colher regem lições falta tornou-se caracterizav disciplina dispõem carros adquiriu trabalhe distante cara dirão pertectuar pisaram pondo põem sonha reserva relatos resta situação demonstrad socorria-nos desafogada socorrem socorrer delicias dentes delas seta monstros morais matar moral fizeram esquecidas escritores esquecer escreveu escrever evolucionism crescimento evoluções evolução costuma cresçam eventual evoluem corta-se criação eterno creio cria saber lembrando-o ironicament lembramos lembraria praticada praticam leccionar lesões lemos lenda caia havia voltando hão-de houver vogue zorro nesse nessas nicos ltima começamos argumentar argumento valerosos literatura aqui valeram limpa livrar lusa remete interpreta invasores intimos melhorias membros fogos imortalizar específico esperam espécies calcanhares saramago queriamos motivação satisfazer saudáveis motivam salvarão partindo rápido seis partilha séculos segura levitar quibir rasto salve raça historia maravilhoso maldade maiores perdia magia males postriedade postos informação intelegência inspiradora influênciam inspirados inspirar mereceu miséria modela míticas impulso ensinamento ensinar muralhas múltiplos nalguma movidos nadador mundos capinha n8unca naquilo mouro cante novamente novas perpetuado perpetuou perpetuar independênc indica ergue-se naturalidade navegadors navegadore negro objectivo ocorrem notáveis obter superar-se superam tenha-se temática técnico tarefa surgimento surgirem chegada acreditarmo acredito actuais chamadas chama-os chamada chama celestial defensor tomando acusado adoram azafamada victorioso venerado vestem dar-se-ia glorificavam aparece apoiar facilidades conseguiria conseguia conhecer confunde conhece conjunta conforto conforta benefício tornam tipos acabe toca destinga finalmente atribuídos veja ficcionários violento ficamos vimos vídeo transmitindo económicas elucidasse tratasse elemento casaram efeito trata robin desencadea descontraíd desdobram desejo cumplicidade cumprimento dando-lhes daquela dado damos culto fundamental frequência glórias ambicionamo amam-me ambiciona amores ambas contarmos contornos conspiração constatamo considero conservar batalhou ouvimos osso grupo guiaram guiasse destacar-se desvanece detentor assumiram fascinados fantásticas regressar recuando assunto faze-los passo regime faria duadores agradeço ajudasse alcance divinos ajude agir portuguesa pico-lírica pilares revolucionári revolução sentidosentimental descobrimos sete-sóis desaparecer shirt's crises formaram idolatrado idolatram estimulo animada escolar estiver escola ideal ilha estudámos estrelas existiria estudei estres concretame enaltecidos enaltece emente brincadeiras justificados preservada precisarem precisámos morrerem juventude prepósito preferida preferem roubava bosques teresa oposto lançam pública ladrão brasil busa gostariamos gratificante gostármos wrestling voadora vitória desistirmos desistindo dignidade devéras dever desiste nestas pensa complicaçõe fala passagem percebermo comportam percebê-lo realizaram percebido passamos realizam lideram pensou falam ciclo líder falo característic carismáticas alimentados caracteristic carismática diversos aliciado divinas carne alem ditos possivelmen políticos pobreza solidariedad inevitavelme simplicidade sincerament seria sobreviver indivíduos servirem sinto-me depende sermos sociais deixar sítio material maus estão esforcem esforços impede imensa eternizados eternizado eternidade crescidos covento crescido costas exacto exalta corpo crêm crer encontradas encontram encontra-se mostrando sensacionali sacrifícios salientado protegido salgueiro senhor(a mortes bonecos protejer queiram lendária mortos pratica saia houve huma vontades haveria armadas arranjar arrisca lisboa válida lucro souberam resposta reportando religiosos remotos religiso invejados melhores impostos imposta sebastianist seguidores salvár-nos seguirmos querendo saudável sálva-los quize-se século quinto levem quis levar histórico histórica mãos lutador manda maia subjectivo interessante influênciand inquisição ingénuo injustas insultos inorme inspira inglês mergulhare mistificada mereçam messias mitifica miúdos menor moda enquadra munetários muribunda mulheres narrativa move ntal permaneceri permite perfeitos perfil supera independent indispensáv epopeia erguer negativo negócio nautas negar ocorre teja utilizada usar chamava-se ultrapassou chegando certeza cheia acreditaram acreditando chamados causado causas deem adquiria tomam ferozes baixa avós daqueles david conseguimos conseguidas conserva tornarem tornado bens destino referências recusavam refere autêntica viesse transformar edificamos doença riscos desempenho cumprirem dados custo frente amados continuo conte considerava considera ordem procurou padeira julgado pronto bispo boas guardamos guiamos guie determinada despercebid diferente dificeis recuarmos fanatismo relações recorrer coberta aljubarrota casados alterar alma resolve desbravador sete-luas simbolize crockett fraco estarem idealizados identificar escolhidas escadas alváres ilusão idade exemplares estudado conclusão concluíndo provavelme lançando-se preconsenti proveniente precisamos bomdozo barreiras terrestre kentucky morrido mortáis rvore basear voadores vive desenvolvim neto percorreu aproximar vantagem falecerem complicar aspectos valente fadas vale disenrascad afins ponha sonham respectivam respeitam relato infectadas servindo dela servir deixou séries serie sinal essencialme esperavam impossivel escritos esperar evidenciada evidenciar cresce-se crescem evolui encontramo mostra proteger-se mostraram levanta cair lepra sair houvesse heróicos viviam horas ninguem comparaçao linguagem literárias cometeu lutarem madre longe livro sosinhos sosinho iria intuição iram memoráveis específica espera enfrentou enganar participação sebastianism parecer calcut nomes marcados lutadora ingenuidade mentalment mereciam metia enúmeros entra navegaram partiu obrigação oceano perguntava suficientes obcessão obterem nuno super-herói telenovelas tenessee 73 util ultrapass cerebral censura chamar admirável acusá-lo adorado causa defendem defende acabou referencia vejamos atingida atribuir baixar físico travou dúzia dade continua explicita constróiem constrói consiga prosseguire próprias príncipe tive desrespeitar destruindo destrói relacionado civilização audácia vindos cima alcançou traição dizia resulta sentimentos significados depositam sentiram simbiose criminosos fortes gato estavam aproveitam iguais igual estudar condená-lo concurso profissional psicológico procurar prederem opressão abranger optaram procura paixão braços opção jovem jogos basta gostavam dignificando diferencia desolado deveres variadíssimo realizarem regência regalias falado ciclos alta pirâmide pertencem podem-se pode-se poderia poemas policias poeta soldados deixando sentia indivíduo seremos seram marinheiros moralizar imaginações essenciais escritor eternament costumam exaltados encontraram provável cadeira irreal largas caem habilidade vizinha nesses nessa nico comparados valorizados concedida limitações conceito arriscar vamos luas afecto respeito responsabili representar respeitado relevância ressaltam invejam meia impossível imobilizadas esperanças imortalizou seguirem salvá-los seguidas levantar caírem hora maioria subir interesses merece enorme nascem motor perdido povos substituição indestrutível incutir ento envenenado nasceram necessita ocupa n'os superar suposto chega definir acreditam acontece tomar acaso apercebemo aparelhos extraordinár consciência conquistado conquistara conquistas conhecido tivéssemos torná-lo tirar atitudes atraves fictício faz-se fita efemeridade transmitir elevados desejavam daquele fundamentai frica antiga facil acabar grita destruição destaco pátria fase retratado reza cuidado estaríamos identidade contribui bombeiro morre-se justiça cabo preservando morcego preso teoria grécia nião diferença completame referir pena trabalho direito carinho disse carro pobres polícias somente sofrem solução 160 ressurreição resolver resolva dependente símbolos socorre fome fontes fizer imediatamen esquecemos estamos imperium especiais implicar existiam crentes convive encorajam protege senhor vivemos livre apuros representad renascer repleto melhorar meios queimado viveram vive-se lutam inspiração instalados inspiram iremos inteira missionários modificado entrar permitem entidade episódio nasce-se 74pensamento chevalier chegar chova ulisses deixa gosta admiramos adquiriram admiram verificamos aperceberm apareça conheciment consequênci todavia atingem faz-nos doenças elvis rock desempenha desenho funcionam conduta prolongado desses difíceis referido pedem classe divinizados alain descobrimen descobridor criou gheerbrant animado existiu encoberto palavra terceiros precisam prender viva digna devem pensar pensarmos distinguir positivament perspectiva possíveis poderem religiões denominado imaginário essencial coração existia criados criada cosas corre sacrificou protegem haja localidade lutaram inúmeras santos santo seca liam marcam perdem mitológica merecem incêndio capacidades mudam cantar m-se personagem talvéz acho extrema conservam confiança benévolos atenção d'os simbolizar constitui guiar colocado população simbolo dele monteiro imaginados ideais existam sabendo sabemos desiludiram começa comportame pequenas luar convicções correr crescer quer sejamos lute sonho sttau influência queria nação perfeição admiração glorioso acidente feliz autores vistos desejamos principalmen destas agora cuidou garra estatuto amigos primeiro territórios morrem dia-a-dia dignos coisa pequenos referidos afirmado trabalha casa relembradas desaparece descobertas encontra prova voar possui momento fogueira espírito espécie corajosos corações encontrou enfrentado rainha heroísmo heroínas hércules heitor interesse nasce sucesso mente então nele obstáculo técnica cedo adquirem acordo vencer acima fisicamente atitude dolos anteriormen antigamente conta guerreiro dessas ricos sido geração ganhar contrário presente primeiros batalha realizado divinização dito sobretudo marítimo crença jamais leva caído volta comparado quotidiano salvarem seguro marca nove sujeitos ente natural obviamente surge acontecer acções felizes figuras verem aparecer conheceram conquistou próprio tornar fica fazemos ambição jovens optou guerreiros guiar-se fantasia fases alcançar casal descobriram gente formar bartolomeu sabedoria terão grandiosos desenhos neles aspecto disso alexandre carácter adultos poca momentos importantes império sabia lutou segurança salvou maior mítico mitos envelhecer passa suma naturalment temem tema chamas torna destes ficaram problemas difícil divino ideia embora 175 precisa voltasse goza passam comuns infância correm salvação medos nome entretanto mudar individuo tendo 181 centenas acreditarem actualidade vemos felizmente fernando glorificado dúvida afonso dotado rodeiam cultura continuar ajudou marcante sabem possam positivo religião levam henriques hérois sorte intelectual memorial enfrentaram navegados superação 107 defender-se atingir apoio batman feito cristo considerada padre governo deve marcou estar voava valor invencível quero salvo histórias manh tenha acredita viam tróia auto-de-f futuro problema duas desconhecid freire exemplos jesus diferentes colectivo além situações lembrar salvador termos valentia sonhar espiritual querem salvam passado perfeito perigo perigos visto atrás rezam animados concreto olhos junto adversidade diversas disto mares encontrar interior meio querer interessa mito acabando determinado determina passarola marcar concordo realizar valores partir mulher tentando tenham tornou sentir fosse glória amorosa ambos graças gregos comum quase terem morreu possuem representa reais viver modo capaz ndia acto tornar-se tinham presença bravura morre grandioso possível personalidad serve sociedade deles bondade vivo héroi novos 137 48 190 adquire acaba claro gerações existência podendo social morto salva logo objectivos oferecer conseguiu deste fundo reconhecido vasco esqueciment concluindo fama possa simples esforço heroína haver infelizmente capazes talvez verdade ficou batalhas terras existir mortalidade juntos voltar realidade posso relembrados real tarde tambem conseguiram tiveram sabe dificuldades família 55 humanidade nível obras tentar 43 gama guerra cabeça nevoeiro relembrado imaginação especial 71 134 filmes conseguir ajuda preciso livros modelo gloriosos verdadeiros filho considerar divinizado porém 25 64 22 101 médicos inimigo normalment observar 122 dolo general teve andrade humana luís luta novo personagen 169 184 actos consegue fazendo dois fruto forte lado dentro maneira medo queremos normal gomes verdadeiro altura desta eram 104 178 38 32 84 ultrapassar próprios bombeiros aranha entanto obstáculos superior 88 tinha própria colocada direitos serão lutar dizer passar 65 somos esquecido vontade razão surgir túmulo qualidades ponto 61140 94 154 baltazar filhos casos dias penso desenhada português 163 15 146 esquecidos sejam mensagem capacidade televisão através vista ficar existe mortais melhor memória opinião terra papel 119 166 187 35 51 tipo banda 69 simboliza tempo excerto 98 criança lembrados país 157 125 conseguem coisas forma contudo neste tempos 41 esperança necessidade 116 ficam sobrenaturai símbolo enquanto 12 97 31 78 morrer enfrentar 111 58 172 131 mortal imortalizado imortal 68 facto durante fazem151113 alguem 45 91 referência vidas camões inimigos 143 ajudar realmente apesar necessário 128 serem devido aindaobra acreditar proteger aquiles nunca depois divina portugal 28 seres hoje portugueses foram importância 18 protecção morte sobrenatural história terrestres sendo fazer defender deus união celestes sebastião humanos apenas pais herois anos 138 adquirir lusíadas crianças podemos caso 81grande mundo existem relação coragem salvar imortais super amorlongo seguir heroi grandes poder poderes 36 podem 155 deuses figura considerado forças assim cidade força baltasar povo vezes 18846 temos seja 161164 blimunda 19 importante 117 144 feitos 26 12049 homem 158 75 102 132 66 imortalidade 152 149 185 59 176 147 39 52 33 também 56 pessoa 89 exemplo 92141 173 7295 pode 129 126 85 114 179 182 13 23 191 humano 29 108 109 sempre 167 105 42 79 123 82 76 -10.0 pessoas 16 99 62 135 170 vida -20.0 heróis -30.0 -30.0 -20.0 -10.0 0.0 Figura 3.9.4.2. Biplot construído com os dois primeiros eixos da decomposição de uma matriz abrangendo as respostas A), B) e GIII. 139 Esta figura corresponde a uma matriz X (n, p) com n= 3993 palavras, p= 181 formada a partir de 181 textos de resposta correspondentes às A) e B) do Grupo I e Grupo III. A variância correspondente a este biplot (dois primeiros eixos) é 37% do total. Pode constatar-se agora que os três grupos de textos correspondem, respetivamente, aos Grupo III, B) e A). Isso pode ser visto na figura 3.9.4.3. em que é apresentado um biplot de d= 3 dimensões (representando 43% da variância total) e em que se vê, claramente, os três grupos de textos, cada um correspondente aos textos de resposta a uma das questões GI A), B) e GII. Figura 3.9.4.3. Biplot correspondente aos três primeiros eixos da análise envolvente GI A), B) e GII. Esta análise confirmou a reconhecida capacidade das análises LSA/Biplot para descobrirem a estrutura dos significados subjacentes a um certo conjunto de textos considerandos apenas as frequências de ocorrência das palavras nos textos como a validade da respetiva implementação no programa PAET desenvolvido para operar as ideias desta tese. 140 Voltando agora ao ES, construído com os textos usados no ensino do Memorial do Convento de José Saramago, vai-se usar como AT (Amostra de Testes) as 120 respostas A) e B) às duas questões do exame de Português (12º ano), de 2008, relativas a esse tema. A figura 3.9.4.4. apresenta agora não só o ES como as projeções sobre este ES das 120 respostas, metade das quais relativas à AT e as restantes relativas à amostra de treino (T). capítulo 10.0 baltasar padre mafra blimunda bartolomeu máquina lourenço construção pedro 711 partida conheciment monte voar viagem trabalhos 684 casal junto 688 nascimento pedreira sete-sóis vela assistimos holanda descreve-se infanta regresso tomamos doença acompanha 690 bárbara promessa encontro decisão sebastião final venha 713 infante 689 roma scarlatti depois primeiros basílica parte feita 716678 trabalhar voador vemos deus desaparecim estabelece arder disse 686 676 seguindo francisco mandar príncipe milagres altar tenho terras assiste-se haveremos sádico apara participar esmagament recomeçam descida sagração aniversário sobrinho teja obrigados marinheiros científicos provar cólera espingardea poderes jornada vergas discretamen revelação dá-se cura agricultores mateus convida região empoleirado fala-se envolviment epidemia paço ocorre febre conclusão aumentar venderem incêndio amarela pontaria réplica damo-nos alentejo religiosidade conseguidos contrabalan conta-se corrupio crianças funerais constrói reparar expropria entretenime entretém quinta estragos boeiro sujeitos suicídio informados informar informal frustração gastos edificar faz-se benediction tourada barcos toma relacionamo miséria janela beirinha capítulos reais música sabe esquerda pedra inquietação procissão degradação reiteração miniatura solou dirige cunhado neve começa chuva falte inauguração inaugurar vento sopre alague primeiro visitas tranglomang baptizado caia terreiro visita extrema igrejas contacto toledo pobreza 152 pero chegar revelar passagem segundo setecentos breve fogueira caballeros torna-se jerez tentativa filha sonho domenico família caracteriza ambiente somos fosse transporte alto ento sabemos 710 jogo casamento professor corpo notícia milagre diferença participa oposição voadora concretiza pinheiro outubro franciscanos abre irmão atravessa escolha primeira riqueza encontramo origem palácio estão fazer 687 marques nesta projecto inicia segredo palavra 679 alquímico lemos respondeu filho medo auto-de-f perdeu busca nuvem diversas 715 719 680691causa 681 gancho voaram pergunta excesso união vime ferro simbologia libertar construir suspeição tens tendo-lhe tropeça valido troça lembrar-se antigos esperanças universellem voou chamam honestamen responder sóis obrigações pudesses esferas espiar ardeu trazem voei cerca fidalgo mora indulgência poderemos junte verei retirou custo patriarcas materializa majestade corre viveram voado intercessão peregrina saiba distrai honorífico reparou seguem-se noite conjugação frequenta conseguir ouvido ouvir acomodasse acolhido perguntou estrada estarei spirituel cresceram constru reparo frotas gabar favores preparativos firmes tornou braços porta impertinente sentou-se séquito elemento efectivo totalidade benévolo balões atravessava trois testamento tempestade ternária teriam terre tri-unit unidade unir-se chamas harmonia sacro lembre-se lembrarei vieram l'être profundame códigos entardecia aspirou celeste guerra comunicada gritou grito leia-se vim-te vinda résulte pano sobe número obrigam-no colaborador colher clamar ciel essência estações encontros ensaiar orador feitas acontecera deificação conciliar-se conduzido perturbar morre ndia juntos inquieto juntar dominado dogmas dissemos dores diz-se retórica passaria pátio refugiarem queima combina luminosa produit l'union lutar escarlate exercitar enganado enfadar ordre vivant cardeais 692 queira quiseres 21 fechada abóbada interiorment intellectuel estranhasse estivesse tipicamente auto-de vendados plenitude veículo podes pontos instituído representam houve declamações secretament setecentista secretos liberta-o símbolos serviu nombre desmanchar contemplou conjonction constroem conivência constituída remetem criador esconde fases aproximava fondamental flor finge físico abre-os bairro perca suspeitarmo subitamente synthétise impede simbolizando sentimentos l'homme luas louco difamações dezanove fugido reina dieu preparar intrigas transgressiv tocarei trarei sequer sermões sente misterioso iuris etapas capelão atormentad atirou-o usamos usboa vale chega hebraica anti-poder tempera tenaz testa assente astros unificadora universum universi ombros tristezas trio chamariz sacrifício viéssemos aparece veteram víamos lembrou apagar lendo ressequido participasse sólidas nuvens cobrem-se cobertura coetera cobrindo esperávamo encontrados espelhos esperou ontológica trazidas olhava opera trazia voltas carregada casados recentiorum rechonchud recolheu raspa ramo desce guardava confissão sabedoria piedosa grávida saberias mundos rugas golpe ruína antagónicos violentamen ansiosament lamacento virtuoso visionário violência lamela violento lareira respectivam resistência resistia retira sobejavam sobrevoa pancada sobra panela temas tecto colectanea masculina mariana cheia provar-lhe qualidades científico profano puxou-o puxou quam cintura civilis punho clarão esqueleto esquerdo entender-se encorreado archote arca oprimido prodígio voarás cedesse cegos reconstruir feitiçaria deitando-lhe desferindo acusações deitou-lhes descaem deixavam acusada deixara complement completas concepção estilhaçada condutor completar pescoço estimado condição estalava mordido nascido saiam rubro julgaríamos andorinha sonhado incógnito lágrimas lados versa divulgados diversament divinização doctorum diviniza-se dito revelam-se cumpre-se dava sebastiana parece-me paralelismo pareces partilha agarrarem agrilholados afirmativas névoa ntima mecânica mbar mato conselhos merece malho regaço forja lume esclarecida escrituras exemplar faltando doutor escapa escura dorme d'une apresentand envelhecime enferrujam enlouquecer envelhecer aproveitava enfrentam enxugou ocasionou procurar praça oxal vitória vivem querem feminina acompanh abençoado açougue acharam acordado achar perguntava comparando concordou perguntada comparada compaixão pedreiros pegares estavam bigorna pegava aulas esteira peles salto pontificum insuperável souberam inaugural inflamado inferiores amarelo ambígua apertou vejam incipit põem vêem plebeia pólos sopas plena vê-la reportorium reposteiro represent humano hóstia semelhança licenciado sinédoque libertada segurar serviria liberte sejam selar libri alcunha alastrado noutras tapado alegrias aliadas ajuda-o ninho nicos nove desmanchou continuado consclencia destrança fragmentári constrói-se destacam despertam construído contente metálico destrinçar destrui-la metade cortam renegar cortado criam comida fortes diga corta fraco frágil frei coto ecclesiastici escolhido escondido duvidosas eclipses exprime existir primavera precisam primazia precisa precária fingimento forçados física abre-lhe aceitas permanecer bacharel brancas estranha brilhar estrelas tornaram tornando sugerem surgindo polariza sublinhar sustos sujo igualmente iluminados impalpável decretalistas declaro-vos decretais defeito dedinho simbolizado simbolizam sequência separam sentam logo l'ordre logro senta aliviou mofo regressava ganhando meteu fugir eleitos preconceitos pretendem pregador fogo absurdamen absolvidos académico acabasse inventor inverno bálsamo balão barba avisos trabalham estudante tiveram tornei totalit tocar tocou pôs-se deficiência local miticamente cristianizado missa iríamos calar-se calcou caldo eternidade beiral base batendo batia canonicame capazes canonici candeia exaltar canseira canoso cansa excentricida exceder tensões atravessado atraso vais hébreux ricamente terminaram terço espanhóis atavam-nos valorativos variantes variando tropa valor castelhanos chamava chamou chapéu harmónica aonde letrados viagens resposta risada rins participação cocheiros classes coches cobria coche espelha-se esperando esperava assaltando arrasta-o assedia armas ontem trevas olha voluntários zumbaias xabregas voyaient voltou chamamos chamado cena reagem recebe realça adiantada sacramentai sacrificam guardado sacraliza comunica gritam homogéneo lavradores violando vinham virada largo l'âme leis viria retemperad resultou solavancos sobreviver sobrevoar sobressai sofrem sociais obscurantis objectivar teme ciliciosament clarividente pungente provocou profecias próximos colhendo cingem claras cima espiritualida esquecendo esforçam ensombrada entendiment ensinam arde operários opressão opõe certamente c'est-à-dire carmesim cegueira centrais certeza cauda céus c'est ceci recri desencontra desgarradas desejáveis desenhado desconfian deitava-se descobre desertava desenho descalça descrita addition deitar adaro adam completeme confere-lhe configuram moralístico pescoceira sagrado nascesse confunde multidão giravam complet confins sábios saía aparências apelidados angéliques verificável journée leituras juntava inimigo lacaios juízos doméstico dogmática directo donne divino reservados resgatados retratadas retratados curtas curar cycle curta passamanes patéticos passes sexualmente partilhar panos parede pálida papa ntimo teclas quadrilheiros convencia-o queimado corregedor conversa começar marcação conversar mendigos refugiada materna madeira maiores cordas queda maça luzes mâle empurrava encarnada dormiram dourados doutores famintos escuras encarna escasso escape faltem d'un encontrarem aproveitado enegrecida aprende enviado apostar arame ostentadas procurasse procura-o procriam painéis pagens pagam ordres orfeu prata vivências vivo viva cardinalícias cardinalícia cardinalício carcereiros carícias cargas felizmente femelle fechar acompanhad depreciativo desacertar acreditam derruba désigne interiorizada interesses interditos salteadores mouvement condenada compagne perfection saltarelos morreu concluira mortalha movem naturais salda-se perdura roubava pena rostos salvar esteja mortal rota inaugurando 71 amoralidade inquisitorial 720 inacessíveis improvisada ambos planétaires anacrónica instruçáes somando amoroso amantes sombras 42 amada amanh vedras veludo jogos amar amos pinto pista poço diversificada distinguem distintos humanos humaine repetia crucificado debandava dans decidir croit sintagmática levantando levantadas secretários semânticos secretário servido satírica levada servir sítio advertência tardavam alagados afinal alcorão nergies tecendo ajudam alheios tarefa conhecido mergulhasse desprendeu recusava-se mandando constantes cortadores despedida consabida melhoras medicina redentor começou comédia devagar devendo forrada recusa francês comer meros conseguem contrasta digam digo escolásticas dynamisme explicações dynamique escondiam extenuada escondida facultando facilmente escravos extremo durailte faço farsa entregam-se equivalentes aquando entrava principaleme prescritas precipita presos visitar quintais finalmente demasiadas demorando abandonar abraçados intersecção romanesco estrangeira pentateuco austríaco perigoso estáticos rodeada perdem perdão rodeio estaria boca estás bocal aussi informar¬se subitament subversão sucessivos symbolise suspeitas suprema talhados symbole poetas talmud talha humildement horas imediações iluminando idênticos ilustram cruzado levantar-se levanta-se l'éxistence liteireiros ligados ligado liteira sept alienam alheia metendo-se fuligem gemem fugiu fugas galés dificuldade cosmético contactos regressa contíguos cósmica ecovisão faziam escândalo eróticos erudito privilegiados precisava foram fois absolutamen abstinência acabe intolerância inutilidade transforma transgressor persecutório perseguição transgridem barregudo tornozelos baptizada estribeiro baptismo permitir budescos brandão barrete azeitão estuda tocava tomás torres avião cabe tora impossibilida imposta dédouble dedos localidades sentava-se sentença sermão lisboam serás l'on alojam miudamente mito cristã-nova relapsos efeitos effet premiere pregão introduzi-lo involuntaria investidura isotopia irregular italiano inverso traçam trágica estufa belos bien lixam cristo jejum camaristas europeia caiu bate joanina cancelos exceptuand canonistas excêntrica execução cantarina capelães examina cara tínhamos atrás ultrajada utilizados vagueia vaidoso heranças ridicularizad tendendo tetraneto tesouro assombro associado atendida artífices artistas assiste asturia atar unicamente varrasco tribuna varões oliveira onírico variam trineto vazão urdir vaso vede casual habilidades hipotáctico hipocrisia haendel sacros hábito hinos latinizantes anticlerical antiga virem lenha virar anti responsável rgão proporciona propósito profunda promete prosaico cobrar cobro esperança esperar espácio arquitectural armónico ascender arquivo armou trazido ofícios olhai olho oiça zarolho vulgar zação vulgo casamentos cerimoniosa casando carta recomendou receberam recebem razões rebelam receber raminho reacção rastos raiva desculpabiliz adiantado descer descaro sacramentos historicamen confundida homossexua confiscados conhecer concebe grávidas sacrifica sagrada graciosa comuns graveto guardi gozam sabeis saciar gostos grau homenagem aparecendo lapidaridade visionária verdadeiro lâmpadas justificar aniquila lembram lançada virtude vindos anno lazer violas vira resistências resultado restos sobredourad pandeiretas partições sofrendo particular situa-nos soldados solfas sofre obscenos te-deum teimais obrara teia protagonista maritaggio matéria psicológica pudessem purgatório quaresma provérbio puseram marreco mastros protege psalmo marido ptima esquecer encomende esegui'nel esforça estadia escuto entoando arbítrio oportunidad oferta celebrarsi cavada cedo recorte reçoit rabo fidalguice fidalgos ficaram deitando deitados deixam desenvolta desenrolar desejo designa desejos deserto composições compositore gigantesca completos estilização moralistas morgadio pesquisas morrendo confessor mortuário motetos morrem motetes rústicos múltipla nascem saiu musical confere nasça sairão navios gesto muda m-se rude pilha judicativame julgamentos sonhadora apelido sonhar anexim veriam aparte julgue laço distribuiremo distantemen disfrutando docemente ditemática dizem-me discípulo dolorosa dividido disso dividida dívidas dízimo repudiadas reprimidos requebros retratada retóricos curioso paralelística severament pedagógico pecadores passou pecadora parentes patente palazzo paradas sexuais paraíso pátrias pavor pátria peça pede pálio peca tecladament admirável agraciado agravada agradou agentes adoece nelas tecla neto consoladam fornicardes chegava fornicando começasse conventos produtiva chegavam marcando refere-se correntes luxurioso produtos formosos correntio produto coloniais marcha queimo medita maest quatre ciclos cópia luzir emaranhado duplamente escaparem doutrinária emprega escudos exerceu faltasse fanático elvas doutra duque fanico apresentada enormement apropriar-se aproveitand engenhoso episódios apostasia engenho ornamentos procurando ociosidade pragmática pagam-se oscilavam ocasional ordens ousais pratas oscila pagai ouso pais vivessem viúvas vivaldi visto vivia caricatural queixos queluz fecundíssimo feed-back festteggio fernando feio acredita desaparecid desacordo de'molto deleite inteiros 161 estereotipad saltássemos esterilidade atrevessem compatifica estivermos napolitano necessária penitência península pensativas persuasiva comilança salvarem geradora compara roubadas santiago compare sapateia pedinte nápoles concreta salvá-la estejam bigamia monjas comova estética rosário pensar estado romba risco ritmo tinta insubordinan amadurecem andamentos analfabetos indiferente indignação inovação andaimes injustiças poderosi instalado apêndice sozinho ambíguo podem inscritas pompas spagna insinua sonata veicula somas indica pobre amen podia velas sons honra debilidade damascos danação dando cronistas cultura cruza dança culpa culto libertinagem semelhantes significativa significativo sinal sintéticos semente servidor secções levados servem libreto se-ihes seixas leva-a lidade alenxandre nitidamente tarda tamancos tarimbas afectivo tardaria afectiva alheio novas afiada nica maniqueísmo metaforicam fundamento contraditória manutenção frequentam conscienciali desregrame consagrava desrespeito destinatário maravilhas comentário corriqueiro mestre-de freiráticos conjuntivo continuam devaneios cravistas recusada desmaios criadores reduzida desprezo despejar mandou cravísta cravista crescem contrata controle deverão méritos mestre manter manos desvia futura regio fusão mesa crer frica fria favorecendo expectativa explica-lhe explicitação experiência escorreitos explicativa duram-lhe esconder escrito exibição escolher existem escrevo dúvidas extenua escreva elogio existia fausto falsa faça aproximação entusiastica enumeração pretensão principe ouvindo prazo querido quero quilo qu'il florescência fizera flatos achacado densidade abertos abrigo permanência estrangeiros estreitament aventuras perseguindo personifica estranhar percussão percurso brasileira perseguir ausenta bailado bisneto breves brusca bolsos bocas bach tipos influenciado subordinativ substitua-as superlativos subjectiviza subordinati suavíssimo suspensas supremas suplicante suspiram sujardes policiava súbitos sugerir poético tábuas tafetás surge supõe status súbita populi ilustrativos igualdade ibérica ignaro decorreram defeituosos dedilhada declarar defunto sensibilidade limitarem levarem liberação l'heure senão simo ltima alienação algarves notaram normas aliena aliviar fundadores devotament monárquica rematando determinar metrópole regressar gasparini cortesão religiosa gennaio cortejo garantir criarão registos devoto regras ganha moita corto edificador edificação elevação edifica eis-me escândalos esbeltos escala preocupava prenunciava precisos fogem abundância abundantís abundam inusitada persecutória transitavam transitórias transgredir benéfica bendito balança toscos trama tiver toca porquanto portogallo implicações impressões impresso impostos implorar impõe deficiente defesa serenissimi alti relacionado ministrados misturavam misturada relacionar reinariam relembro mística crimes introdutor italiana irmões irmãos invés ironia cadenciados beliches beleza caiba bens possuir criticada bebedice beckford eventual bebendo evocada camas canónica exagerar capaz capar captar exclamativo excelência excelente cantora capital cantar tendo-nos tentativas atentament atinge-se varandim trocaram utilização valores valério trouxe ubaldo usado vales castelo harmonizand harmoniza herdeiro ridicularizam ribamar tem-se terzi próprias esparvados espalhar espécies articulados assembleia assassina atenções assis universidad trezentos tribunal vastas onofre olhou catadura catacego cenários sacrifícios hipotipose hipérbato gravura lembrando lavatórios laterais lendária lascado latina vestidos vicente vestem virgem vírgula viram vier retalho rezas parou solo objectividad numerosas obrigação observar objectiva temíveis observa proporções progrediam publicados prosódico profissão profere púlpito claros espontaneid esmagado esgotar arquitectóni arquitectos entanto aspereza entende aresta aspira operário oitenta voltadas zacarias cerimónia cepticismos cerirnónias chagados centram católico cerejas centra celas carvão carro rapidamente rectaguarda rectângulo recrutada reclama rapação rasto recta desconheça descalços desejava descrito aderiu conheceram sacerdócio compridas conforme conhecem gramática sagradas sabe-se confirma glorioso sagrar giusti rufino ruins gozo pias lembrados léguas légua lama leia justificaram vilipendiada justifica anónimos judaísmo animado labirinto ver-se judeu juvino verde disciplinas direita direito revisitação respeitar reunindo resolve curva soberaname situamos smith técnicas tema nudez conversação protagoniza purificam-se provavelme quantidade quadrados científicas materiais quarenta colocasse cinzento macau quadro choram cisma clara pura encarregado dramaturgo encieirados escuros encontrou-o entortar-se arbitrária entra tratamento orientador procurou travado oração página oral vocabulário carlas quitério ficamos feitos acumulação designação deixemos actos intencionalm interessou condenados complexidad mostrassem comporta-se monumental naturalment perfeitamen salienta-se pertinentes morremos músico roupinha estilístico nacionais morrido perecível nascida montes conclua geraldo motivo morto nasci naus ventura inconsciente lacrimejante independent juntamente indiscretas vermelhas sonhando vergonha individual ladeada infalível poderia pisado andou apelo pires jorra documentos disponíveis distinções dizemos distrair ditados ditado repressão retórico crornatismo crueldade cumprida dade passagens passarinhos significação passaram parecem passar pediam seguem pátios pedia passo sarar sátira parar alcino adolescente aerostáticos aerostáticas admissível negócios nocturnos afirmado negros afirma tecido recuperando desmistifican 673 marcadamen desigualdad recuperação despachem considerada comecemos chegassem constantem melancolia mecânicas prodigioso formaram marcolino refeitório conhecida reflexiva formálio controlo medem reflectir medida correu forem lucília meia escrevemos elucidativas escultores embainhar exemplos fachada escritos escola dupla dura exibe falar¬lhes falando emente faleceu falas equipament entrelaçand engenhosa aproveitar enfeitadas aquecidos envolviam entrarem envolvido ocorrência praticament ocorrido ouvirmos ocorreu ordenou prado visualismo visualizar visíveis visuais viveza querer quinto feridos dependência denunciando demoradam demiúrgica delicados depende abolição acolhe acho interpretada interpretam comparado sangravam estivessem perguntar atribulada ausentes romanos perderão romano pensam rocaille estarão pensa pensou naquilo autos rítmico aturar típica ritual rosa ingenuidade podíamos subterfúgio subtileza anástrofe andamos aplicadas apontado aplica-se suceder inscrito veículos andada plantas ambas infringe apoiou pluvial amito ponte talho imorredoira humildade imaginado imortais hospital idades horácio imita culminanted degredada daniel segurando levantaram senhora segunda seminário síntese alheias alegre nomeados notações nicanor noutro tampo crescimento metatextuali manipulando contingência metatextuai controlando maneta contenção metáforas funerária cotovelos frederico continuar contando dignidade cozinhas metáfora mão-de costuras deve-se mestres cosmos contém regista deu-lhe meses gaiolas costas destrói frásica contas manh frase frio escovam-se expõe expo elíptica dúvida ecoa ermo privacidade príncipes pretendia presume pretenso previsto questionar questões focinhos fluente firmino fomos fontes fluido fitas fixo acentua-se acesso abside perseguiçõe transportar braço topografia tornam-se toponímia brilhantes transgride torreões bisonhos torná-los brasílica bruxedo bruxaria bulletin brancos topada tiranos tirania perna topos brilha burro aves baía brás azul pormenoriza supliciados surpreendid influências portaria subiu subir sumir suave tadeu surre humores ilimitada ilusão ii.o definitivame decorativa deduz-se definindo dedo localizações sensações sentenças limitações seria louvado lombos limites loggia loucos lógica longe série lindo alusão alista normativa reinterpreta modificando mobilização consulte-os dezassete mimetismo modestas modelos diegético diárias modos diálogo cria-se genial regra edifícios egipto efeito egas escadaria esboços precursoras pregados prega acabámos acabarão acaba inventando inventadas inverosímil irrompem inventou inventos isabel isidro transposição transportou tivéssemos bernardes biblioteca transepto benções trajectos cabeças tivesse trabalhe total bibl posso impressão implumes impor serra alternando altares mistificação relacionem relações minudente misturam minorcas miserável relatados cristóvão jaime bassílica bastaria batalha bastava evitar caladas caída bela posteriorme postas jesus jesuíta europeizant exactament caminhos caminhar canários camisas canónico cânones capelas cantam tinham tendo-lhes tendo-se terminou terceira assume atreve variadas variada varas urna usar chegada charneira castiços há-de havia herói ribatejo temporalida propunha prosa específicos especial espada assinalável unilinearmen uníssono unilinear trémulo triste voyage recebendo adivinham comunista gravita gritado antecipadam lembrança antecipação l'escampett aparecem lanzarote apalpais vigiando vigentes vindo revolucionári rezar soldado participou profundidad proximidade prosseguir publicação provérbios coexistem clubes claro pulso esforço opinião volta xvii cerâmica célebres carreira césar recreativos raramente recobrada ficou desempenh desengana pífaro confrontado municipal mostram mudança conheci saberás rumo narre goleg rufa apareciment verificando indivíduos iniciativas verificada vereador angola sonhe verbal discípula dinheiros directas director retrospectiv reveste-se revistas residir panorama pálpebras partidária parideira pataca técnico agita profanação qualidade conversas referidos colocado reflecte colagem marvila referido cidadão empregando encarnação encaixa dual enquadrame encontre enredo organização orientação travessão ocupando oralidade oscilação vivos caridade feições festas filipes activamente designado deícticos interioridade intenções intenção interessa interior perfeito penetra santo companhia estagnação mostrou-se estiveram narratário concluído salientar nalguns movida roubar ndole injustiça independênc andamento incontornáv podendo indirecto inclusive instalou infeliz amplo pior pôde sono distinguiu-se distorções humana repenicar repenica reprime cumplicidade debandada dama dado cruz saramaguian segredos serralheiro 137 situadas saúde países siécle seara leva 68 afastamento afrancesado aforismos adormeça noviciado alcançar afastado nobres novena devagarinho comentários maravilhoso desvirtuado reelaborada frequência reflectir-se frequentou consolidar cravo convidado conseguiu mecânico mediador convivem destinado comendo reescrita colóquios começos mereceu membro regimes mereça destino desliza formal mbito luta falassem escritor facção falo enganada potugaise principais ocorrem padeiro quiseram queres quiser flash-back denegriam abertura abdique acordo aberto abono interrogaçõe interjectivos perda estivéssemo estraçalhad aventurado estranharía biográfica estranhou narração inferioridade poranalepse suplemento pontuação influência polifónico aponta vejamos inferno superar plural imaginação identidade ideais dedicar-se cruzam declara simbolicame simpósios simétrico sectores ligadas levava alienando-se tamborilar notação noutros tambor notou religiosos controladora fundamentai funcionalme dificuldades construída religiosas detrimento contam-se constituind repare-se criar devoções militância cortarem remédio milhares contada milhões mónica contem devota criado forte milho conte económicas expressivos eliminação erecção preces pretérito força abrem intervenient intervir bordeaux permite-nos permitindo tornou-se azinhaga torreão baixo bala suspeita porqu implicação imperfeito ilha defendido definição sentimos literárias lisboeta seres lubrido lóios genericamen reinante moços efemérides educação editions predomínio prémios prefira acabada acabam irreversível intrínseca invocada tradicionalist bênção traduzida estúdios tradutor littérature câmara caixa eventualme evento beira posterior criticam-se exclusivame exaltavam cantores exaltava teológico teorizar tentar tentou atitude ateus utilitaristas u-se ridiculariza termo teses assumindo artes tríade variar habitual anti-épico laudatório lendas vieira ressaltam temores propõe-se arrastados arrancar assados arma volumes wolff católicas centro rectângulos realização radicalizou rebela-se rectificar realismo raízes descendent comunicante comprometid sacralisado conhece concede graças graça lançando-se vila anonimato verdadeira anónima vertente leito responde parodísticas panfletário parodiar temático matematicist massa clarividência pública punhado colectivo colectiva proveito provém essencialme enciclopedis estabelecer encontrou opta vocação reconstruído r6sseau ficcionista fidelidade filinto acusaram desgraça deístas monumentos montesquieu confidencia mostraram conceitos condillac conciliar sair nasceu individualme individualiz julgamento verificação laicização indústria verificou lacunas inicial anes laia discordância dominantes domingos divulgador dinâmica dinheiro divulgar divina residentes resgatar repúdio cumprimento d?alembert custódia significações sarcástico paráfrase patriarca pássaro newtonismo necessitado admite materialism dessacraliza regeneração corredores considerado correlação reflectem coordenar converteu correndo ludovice correia familiares elucidativo empirismo esclarece empenho emendar exército emenda enfim envolvem enraizado enorme equipa procuraram ocorrendo proclamou ocupado paciência ordenado caracterizan filosoficame filosófico filtragem festa filósofos acrescentar democracia deparavam derradeira degredo dele derrisão abade 134 intelectuais inteligente comparaçõe autobiografi pertencem perspicácia pertencia roubados atribuía típicos santos pense narrar insatisfação velho infundados anastácio inserindo ampliar infelizes veio planta inglesa venho inglês imaginando hume sedução significativas sistemático seleccionar serventia sinais satisfaz sintaxe sistema lido novembro adquirindo nicolau afastar tarde nobre alem nível reduplicação consagrados contemplado desrespeita devastadora conotações constitucion consagra metafísica crescente fundidos criadora destinos detalhes freiras desses frade deve dilui el-rei experiências explicitamen escravizar escreveu far-se duvida elísio pretendiam princesa primeiras fizeram abrange abriu perceber pequeno autores bocage estou estática informa-me pormenores substâncias população superstição sustentam suscitando subjectiva populistas stuart identificando humilhados ideológicas iluministas ideológica ideologia ilustrado humor declara-se declarou sensualismo sentimentali sensação levou limita locke notícias alismo construtora construtor ganhar devíeis mill económico eruditos erguer acabar invenções inúmeras invento tolentino tomos possibilitou possível cristianismo criativo diderot relata preencher irreversibilid irreverente irónico barrocos evidenteme tradições bentham etapa camões evocados evolução europeu criticar exclusiva trouxeram validando utreque usarem utilizar unda hereges testemunho território terreno espanhol arte assumiu trinta vastíssimo vasta voto casou sadismo saem vidente restituição restituiu objecto obedecer clima coelho esqueçamos espaciais esposas arrábidos aristocracia aspecto ofício xavier vultos cerimonioso cartografia chamada casas reconhecime receita recuar descendo governação sabem moradores concedido conflitual guardar conflitos comum gostam antagonismo aparecerem justiçar diplomatas resolutivas resultados resolução retratos solucionada soberano solicitá-las sodomia sofia paris teimosas técnicos agitada qualificáveis públicos coincidir quarto ciência citação matar prova cidade cheio cito dramática entende-se opressora oprimida odivelas originais opostas recorrente fidelíssimos feiticeiros figura ficar ficarem filipe deixando desfecho açúcar intensifica monumento compositor completa movimenta complexa conduz confiança conferida movidas péssima conferir pesado nasce saindo estilo mota ruas verosimilhan aparenteme incremento juntando-se laffont/jupi verosímeis instituição indústrias injunção incúrias iniciada jornal dinastia dispendiosas disfarçam dispendiosís dominação dissipadas dissipação dividiram domínios diversos domingo disputa ditions reprimida reptizar cunho passados passíveis sexualidade situado palhav parto negativas negativa negativo neuburg consolidação comandadas consentimen correntemen considerava marginaliza reflectiu-se contumazes referência conservou formação produção medíocre conselho convictas formas meninos reforma lustrado magia dessas madre matriz meios má-f empenhado exercício facções escapar facetas do-se duplo engenharia apreciada episódio engloba 23 povoamento proclamado ostentação potências obtidos 167 praças 110 trata 83 vitoriosa quis denunciar desacertada derrame desafio morte santas típicas rituais narra roque típico insurreição inglaterra amazónia ambíguas analepses aplicados poderoso plásticas andando soube vejo spera venda pleno apoio imitar cuidado dá-nos debatido seiscentos sintáctica serviços libertino secular simas advérbio aliança nomeia alegria advém alerta francamente futuro"como desprovidos destacaram fundamental constituem corrupções destaca-se despejando fortalecida dignidades diligências corrupção contraste gerações contribui renitente contínua constata fradaria futuras costa eclesiásticas favorecidas exprimindo favorecidos económica favoráveis expressas expoente fazenda falso entusiasmo erário prepotência precedentes preciosas prestígio questão flores firmada firmeza acelerarem intervenção personalidad percebermo persistentes bragança brasileiro azinheira subordinada sumptuárias sucessivas symboles sujeito impiedades decurso de-f literalmente lisboetas moderniza fulminante generaliza molinismo releva-se dezasseis modelo editora/nom eduardo edições absolutismo absolutista acabou invalida transfigura baltasarlblim beneficiada cabeça transição bertrand touradas barroca bere positivos positivo importantes imprópria importa serem alterarem altos criteriosame relativament reincidentes dictionnaire miuçalhas relaxadas ministro relapsas mínimo cristãos relatos prejudicada inverterem invulgares janeiro irão bastos potencialme potencial campanha europeias capacidades canto tico vaidade turísticos varanda heterodieg haveria heresia antítese código específica espanhola arrobas centímetros rainha gratuitamen sacramento gravidez sacrificial gulbenkian guias guas saga lavrada largura anjos vindas revolução resulta resto solidariedad paroquial obrigando números proferido marquês esquecem espessura ensaios recolher desempenha desenvolveu descreve descrição narratologia gheerbrant moral lembra judeus júdice laje dizem diremos passemos paula materializad materializar conventual material colecção fama doze encontrarão entram ordem cardeal ferros actualmente activação deram delas comportame sapiência nascidos complexo peso instrumento instauração inscrevem anacronias pobres sonatas vendo instituída velhas velhos pocas 139 155 182 disto daqueles seguintes passa afirmar ajoelhai nesses alcance alain conseguiram frequentem redentora redondos considera mandado frequente reflexão lugares corrigir constam frente dever fácil aqueduto enunciado visitantes quinze quilos achado rmos informativos populares polida supor imaterial imolados humildes imolado idade ideias senhoras sena liberdade levaram símbolo singular notáveis norma aliar determinado manifesta genologia fundação garras fuga elevam expresso ermitão princípios forçado foco acaso benedictione transgress transportara toneladas transpor perpassa permitida buscar tomar tomou tome pêro tirar porto imposto definida sequências seriam sérgio almedina mobilizada modalidade diamantes diegética dias reler diário crist acabarem estudos cabia bento traços porventura possui livres relato calouste terem associando atenta rias propostas específicas realizado gostaríamos largas nuno obras coimbra colegas público entender fichas desenvolve compreende confrontamo completem confronto musicais iniciarem versão apelam donde divisão pautámos partilhem papel situam materialidad considerámo queimaram formativas exercícios arames tratado acto interessara pertinente pensando pegarem pereira 76 97 50 109 17 67 12 149 188 incluímos incluir humanidade representad repente cronológico sete-luas sete pedimos noviços alargar convidamos destinamos recursos desta redacção deslindar frades convite fundo escritores extensiva facultar entretanto principal financeiros deliberadam permitam autoras auxiliar robert sucessão substituída sugerimos inserem horizontes simplesment senhores lexicoteca funcionamen contextualiz difícil cria erros pretendemo inúmeros torno possa linguagem sentir linhas linha aluno relação criatividade introdut livraria evasão bastardos textualizar tenham terão teoria chão rigorosa testemunha vazio chamar hão-de h~tória restaura professora cinco entendê-las enterrada trazer xito catorze cérebro reconstituíd fictícias comprimento confundem conceição confronte global vimes vimos diríamos reviver custa particularme telheiro colaboração referimos referir-se coisa ptica traz viver r0is fielmente deixou acusar completame pessoa saíram-lhe morreram salientes morrer move-se sala gerando compor pessoal pesos gerou instituições pitoresco ventre jorge distanciame diverso ditas daquelas passadista sete-sois administrativ ajuda tecer referencialid constante melhor mergulhar meio margem contudo madrid formada convoca recurso refere forno 61 125 128 escaparam fantástico obviamente procurado caracterizad filtrar abandona desafia acima deles inteiramente comparação estanque audição estar políticos poesia horizonte imaginar cruzadas levantemos senhor levantou semana lidos afastar-se notável note-se noutra nico nora conjunto funções existência questiona fingi-las fingindo abrindo brechtiana bonito estreme torna impede-nos defendida sentimental sentar-se sensível língua metro mina academia intromissões transcreve portuguesas posições importante mistura jeito criticamente tenha valorização trono terra omnisciência vozes mármores publicada espiritual voltaire racionalismo recolhidas desenvolvim grandes conflito correspond colónia ciências endo fica actividades esteve sarl talvez necessidade administra 131 77 consciência destes reflexivo meados dessa faremos falam fábrica ausência estrangeiro inserida simples alfa crescer galeria contexto problematiza forças sentimento sentidos alma introduzido possibilidade portugueses livre relatar capacidade anteriores prolepses clero realeza glória claramente cinquenta referir círculo ensino geralmente mosteiro perto revela cunha paralepse partiram partido marginalizad memória consiste maior oscar característic 85 699 39 30 companheiro estando culturais secundário levantar contempor francesa falsas externa processo estrangeirad pequena brechas ignorância ideia intuito trabalhador estrutura baptista excêntricos ricardo ribeiro artísticos lembremos lermos anterior objectivos profundo classe oito cento realmente mulher conhecedor grandeza saber leitores aparecer verdades restrição solicitando proustiana chevalier profecia entos quixote descodifica conduzindo sonhos junho lello distanciada discursivas dons debaixo passando consignados memoráveis marcada marcado colóquio maio emoldura aquilino pragmáticas 190 18 27 45 15 abolidas deriva interesse estava romarigães incidências indicativo indicador analepse anda semânticas simultânea sessenta seguir signo constrangim rememorado rememora comerciais determina religioso destaque destacar destaca gente durante exploração explicaremo explicar factor enuncia pressupõem procediment pressupor acedeu abril subsequent informação ilustre i.o normalment esboçam premonições tolstoi literários serão jean captam tendo riquezas asas vontade razão lembrar vidas sofrimento partes carne descoberta direcção retrato curso paulo original ouro carga aconteceu planos disseram 48 daqui críticos situação medidas desse luís popular nomeadame informações crítica capela haver temos espírito entidade conceito apresenta quisesse filosofia ficam pedras rossio natural 175 36 62 92 poderiam andar existe escrever falta interpreta autoridade imagem levar aliás moniz frases portanto localização espanha letra propomos prolepse oficial chama desenvolver kaufman feito competência nacional domínio novo mecanismos consequênci 160 86 viveu auto ponto liberta lição levam consegue régio contrário digamos fazem prazer período longo moderna religião minas chegam temática circunstânci enciclopédia narrativas concluir inquisição 176 113 675 736 lugar abordagem narrados santa político libertadora criação físicos acedemos permanece conta eleva europa atraída assistir espécie onze rebuscada realista adjectivação comungamo antagonista aparece-nos vértice revolta citámos trazê-los celebração recorrência recolha fictícios deixa condicionalis pessoas verificar distancia-se dista reside paredes fornecidos fornecer coroa duas emprego integrados naturalidade mortes gerais 151 127 20 29 47 146 podemos inferimos infantes representa cronológicas cultural sirva alcança nesse nessa despreocup desmandos consciente detalhe remete destas exorcizadas elucidação expressa enumeraçõe práticas interna ausente sumptuosida sublinham substituir imortalizado imagético monarca registo pretende problema privilegia pretexto perpetradas transmudad permitiu longas minimizou didáctica irónica tradição estudo traduz postura evoca exactidão 124 685 56 65 89 atesta ultrapassam projecção espelho universal adiante opiniões carlos mostrar nascer veracidade josefa retratado procura integrar anacronismo simultaneam semelhante seguinte serve seis contar mero eram dedicado simbólico diferente ação campo joão 677 textualizand teve assistiu hesitar testemunhal clássicos cláudio específico omitiu sobressair profético esquece oficiais recriam mundivivênci revisitar coisas conversão quase filhos deixar integralment integração compêndios pistas indexar-se indirecta insiste cronológica cumpre 669 33 140 51 718 agustina neles ngulo referenciam referencia manuais ludíbrio reflexo exibem-se exterior aqui principalmen ocorridos quiserem denuncia autenticidad autónomo rnítico superação imaginário nomear genológica contemplam contamina metatexto constitui gabriela frança precisas questionam fingidas acentuam tornar-se impossível iluminista literariedade literária lirismo lírica modificado construtores absoluto cadeia bessa-luís llansol crítico herculano vamos letras espaços olhar reconhece narrativo mortos dizendo datas parece neidade o-se 82 26 representan serviço situa mãos contempora duzentos presbítero dentro surpreenden nota metros dicionário eurico posto omnisciente publicações publicado radical leitor respeito coincidência mário esqueceu inicialmente marca emprenhou 103 695 158 104 706 pensado amor leva-nos nova criando imagens momento preocupa invenção altura itálico ustria encontra mulheres revista chegou intemporalid integrando 107 173 80 98 representar scar forma mente emergir aproxima política idem costumes corte entrevista fora alunos caminho espera movimento confia reuniões quatro atribui 112 166 74 101 secretas futuro reescrever processos porém sugerida imaterialidad momentos fronteiras português reino evidente postos posição eventos historiador casa reconstitui coloca oprimidos passada exemplo país autonomia apesar determinada títulos alteram evidencia tinha objectivo início marta entrada dela palavras 116 análise séculos nomes sentido reinado alteração através vinte 24 59 manuel teria antónio históricas verdadeiras palmos passam novos nela 115 35 191 século alexandre iluminismo editorial privilegiada eterno excerto gosto aspectos partir 41 136 732 significado livros temporal histórias construíram barroco xviii tratar ficcionais natureza dizer discursiva dada referências referencial memórias 118 106 38 encontrar apontar 694 factos permitem transcendên portuguesa verdadeiros plano nele 148 184 185 701 falar estatuto libertação brasil vezes categoria reconstru figuras enquanto 667 169 79 693 ambientes apenas quinhentos sujeitas notar devido diante adeus historiográfi kaufrnan social quer 32 164 metaficção ibidem então quadros acompanhar geral andava instância 133 91 671 43 mentira tradicional literatura três vontades justamente marcas estamos escreve libertar-se fazendo importância ultrapassa entrar povo 668 170 vista tipo fizemos próprio nunca ficcional movendo-se dimensões 163 engrandece biografia nome além precisament reis temporais tempos próprios universo intemporal 143 textual ultrapassar corresponde 666 730 pensamento igreja termos classificação 157 perspectiva tipológica trabalho assim ente 731 dimensão deste sempre implica textos 172 58 95 heróis sido 122 gusmão agora maria 674lisboa integra literário realidade 130 100 contam sobretudo 703 helena casos fala sendo 94 53 personagem lopes olhos cerdeira grande 70 178 73 42 atenção data 702 727 explica focalização alteridade 670 silva romances própria 11187 diferentes função 44 119 poca 181 739 179 seixo alzira visão carácter 729 embora teresa autor históricos 88 dois 708 734 maneira elementos lado presença cristina hoje género 717 portugal modo livro acontece seja narrado 724 44 64 vida 723 14 737 acontecimen acção permite 697 caso 705145 700 real escrita poder personagen histórica 735 pode homem mundo 121 726 leitura homens facto 733 fictício 728 narrativa 67241 154 verdade ficção 40 46 anos histórico neste espaço ainda 696 142 discurso título 707 passado 683 740 obratambém passarola 712 725 0.0 682 738 convento 39 722 664 704 presente texto 665 saramago narrador 714 45 661 662 tempo memorial romance 38 -10.0 história 721 663 -20.0 -10.0 0.0 Figura 3.9.4.4. Espaço semântico relativo ao Memorial do Convento de José Saramago e as projeções dos textos das 120 respostas à A) e à B). 141 Recorde-se que a matriz de frequências analisada – X (n, p) – tem n= 5012 linhas (palavras) e p= 88. Ver 3.9.1. Na figura 3.9.4.5. vê-se a mesma informação mas relativa apenas a uma zona limitada do gráfico anterior, obtida fazendo uso do programa PAET. Nela se podem ver, com maior nitidez, as posições relativas da AT (vetores a negro) e da amostra de teste T (a verde) – para lá das palavras e textos do ES (a azul e vermelho).. 711 conheciment monte partida viagem voar trabalhoscasal junto 684 688 nascimento pedreira vela sete-sóis infanta holanda regresso tomamos assistimos descreve-se acompanha doença bárbara promessa encontro sebastião decisão final venha infante roma 690 689 1.0 scarlatti depois basílica parteprimeiros feita trabalhar voador vemos 678 716 deus desaparecim 676 arder disse estabelece príncipe altar mandar seguindo milagres sujeitos janela tenho alentejo sagração vergas teja tourada toma conclusão agricultores venderem assiste-se aniversário sobrinho terras sádico estragos boeiro pontaria haveremos fala-se expropria recomeçam convida marinheiros paçosabe revelação obrigados ocorre miséria poderes funerais gastos descida amarela conseguidos constrói região corrupio incêndio cólera relacionamo espingardea quinta empoleirado frustração jornada envolviment epidemia apara suicídio faz-se febre crianças discretamen religiosidade mateus esmagament aumentar barcos entretenime entretém damo-nos dá-se cura contrabalan científicos reparar réplica participar beirinha informados informar informal conta-se benediction capítulos provar edificar degradação reiteração esquerda inquietação miniatura procissão reais vento visitas começa chuva dirige primeiro alague tranglomang falte inaugurar solou neve baptizado caia cunhado sopre toledo terreiro inauguração extrema igrejas contacto visita pero pobreza segundo setecentos passagem fogueira torna-se breve revelar jerez caballeros domenicochegar alto filha família somos tentativa ambiente transporte fosse sonho caracteriza sabemos ento 710 casamento jogo notícia corpo professor diferença milagre participa concretiza oposição voadora abre pinheiro franciscanos outubro irmão atravessa escolha primeira origem palácio encontramo riqueza fazer estão marques 687 nesta projecto 691 segredo inicia 679 alquímico palavra 680 auto-de-f perdeu respondeu lemos filho busca medo 715 diversas nuvem 681 ganchopergunta voaram excessoferro suspeição união libertar construir vime conjugação simbologia tens estrada 719 balões totalidade elemento sentou-se majestade porta ouvir materializa mora verei tendo-lhe voado intercessão acomodasse acolhido voei viveram voou cerca chamam valido tropeça fidalgo firmes antigos honestamen honorífico corre ardeu ouvido trazem troça pudesses obrigações poderemos efectivo saiba gabar custo conseguir constru cresceram esperanças espiar estarei frequenta frotas séquito favores impertinente distrai responder lembrar-se junte esferas noite indulgência reparou reparo patriarcas benévolo preparativos tornou sóis seguem-se perguntou peregrina universellem braços causa número lutar juntos spirituel retirou capelão testamento abre-os encontros secretos flor desmanchar queira queima iuris bairro orador ordre preparar vieram atravessava tipicamente terre celeste aproximava aspirou estranhasse dieu intellectuel acontecera synthétise abóbada harmonia gritou grito vivant vinda sacro fondamental interiorment conjonction exercitar l'union reina colher tri-unit passaria ensaiar ciel dogmas l'homme entardecia profundame produit setecentista sermões criador impede clamar representam retórica résulte l'être pátio declamações subitamente contemplou luminosa inquieto perca morre comunicada tempestade unidade difamações vim-te estivesse obrigam-no podes dezanove 692 sobe colaborador houve fugido intrigas diz-se leia-se quiseres escarlate nombre louco guerra chamas códigos ndia 21 sequer fechada pano luas auto-de instituído conciliar-se tocarei etapas pontos ternária unir-se trois misterioso perturbar plenitude físico enfadar cardeais constituída sente fases dores essência estações trarei remetem lembre-se lembrarei juntar serviu simbolizando símbolos deificação preconceitos alcunha alastrado pôs-se vendados veículo vê-la atirou-o conduzido comparada condição saberias teriam transgressiv trio secretament fraco feitas finge fogo deitando-lhe suspeitarmo enganado enfrentam violência constroem refugiarem archote combina cobertura humano conivência esconde estalava querem puxou-o salto fugir destrui-la deixavam enlouquecer apagar sentimentos construído dominado dissemos liberta-o liberte mato barba batia base calcou apertou clarão renegar resistia inflamado pegava insuperável permanecer tecto destacam fingimento violento escondido víamos oprimido totalit chega primavera precisam precisa pretendem viéssemos veteram ontológica opera tempera alegrias tornaram tiveram tornei tornando trabalham praça astros ombros mofo inverno tenaz agarrarem afirmativas voarás testa cegos vejam vêem assente complement comparando universum usamos universi usboa eternidade estudante olhava miticamente pontificum iríamos acusações abre-lhe tapado abençoado aliadas andorinha golpe guardava sobra voltas vivem carregada malho cristianizado vale apresentand aproveitava completar oxal rugas rubro sabedoria ruína exemplar exceder exaltar brancas pescoço plena sejam selar ecclesiastici encontrados eclipses ganhando fortes forja feminina desferindo descaem desce encorreado enferrujam acabasse aceitas amarelo anti-poder ambígua hebraica sobejavam violentamen consclencia existir recentiorum regressava recolheu regaço cortam cortado corta arca cobrem-se coetera cheia cobrindo comida hóstia julgaríamos esperávamo esclarecida esperou trazidas trazia tristezas esteira puxou quam punho ntima nuvens destrança desmanchou deixara deitou-lhes sequência separam sinédoque sujo sólidas conselhos colectanea doctorum dito divinização doutor libertada masculina mbar lamacento lamela lareira esqueleto esquerdo escura parece-me espelhos pareces paralelismo ninho nicos nascido balão batendo aulas brilhar segurar envelhecime entender-se envelhecer civilis científico reportorium respectivam ressequido licenciado libri lados lendo pancada panela bacharel avisos beiral bigorna raspa canonici candeia escapa dava declaro-vos defeito simbolizado simbolizam sopas inferiores continuado contente iluminados resistência lume merece canseira canoso decretalistas decretais metálico meteu metade partilha provar-lhe pegares peles perguntava perguntada mordido precária pregador acordado ajuda-o ansiosament atormentad inventor sustos reconstruir excentricida missa plebeia semelhança sentam senta fragmentári frágil física académico visionário incógnito escolhido estilhaçada estimado sebastiana eleitos destrinçar dorme diversament diviniza-se mecânica escrituras sublinhar reposteiro canonicame deficiência cintura local capazes cansa mundos primazia versa temas tocar concordou açougue chamariz confissão estrelas antagónicos grávida sobrevoa cedesse completas condutor unificadora pólos diga acharam surgindo achar virtuoso incipit faltando noutras revelam-se estavam ocasionou nove piedosa polariza põem duvidosas saiam d'une absolvidos inaugural frei sugerem criam igualmente divulgados calar-se procurar souberam participasse l'ordre concepção tocou agrilholados aliviou estranha acompanh acusada exprime forçados vitória rechonchud coto mariana sacrifício despertam feitiçaria absurdamen casados constrói-se compaixão névoa qualidades bálsamo enxugou prodígio profano aparece cumpre-se sonhado impalpável represent lágrimas lembrou caldo serviria retira ramo logo ldesconfian ogro dedinho pedreiros mouvement mortalha ordres precisava concluira tomás chamava chamou confins olha tardavam tarefa alagados sociais cegueira chamamos explicações aquando confere-lhe confunde complet rostos durailte enegrecida adiantada abraçados symbolise talhados talha angéliques horas harmónica giravam viva extremo regressa recri cosmético conversar cósmica vais começou levantar-se rodeada risada obscurantis brandão planétaires pinto dynamisme dynamique encarnada d'un desprendeu despedida demorando desenho désigne 71 720 amantes amada sentava-se visitar conseguem refugiada arde classes cobria esperando esperava nergies transgridem estaria estás queimado efeitos fuligem devagar intersecção principaleme cycle inacessíveis distinguem dormiram doutores distintos divino medicina escuras pálida baptizada baptismo caiu procura-o curar serás claras retemperad melhoras reagem bien informar¬se convencia-o retratados mergulhasse perdura perfection viagens opressão ontem alojam atravessado atraso inverso alheia sobrevoar sobressai centrais céus aprende sacraliza sábios estrangeira europeia foram ambos vinham certeza mandando madeira aproveitado rodeio trevas poço finalmente introduzi-lo suspeitas famintos constantes luzes colhendo directo largo esteja queda salteadores isotopia intolerância ensombrada apelidados cruzado sítio sombras faziam espanhóis cabe privilegiados dans servido subversão contactos cima resposta resultou mendigos levantadas letrados realça belos imediações iluminando localidades ligado provocou pena inquisitorial persecutório teclas tocava traçam torres configuram tensões vedras assaltando roubava rota bocal interesses alheios guardado gritam xabregas arrasta-o levanta-se sacrificam trágica tropa pista digo felizmente inutilidade desgarradas desacertar desertava descalça terço solavancos violando viria recusava-se humanos levantando lavradores estáticos pungente encarna saltarelos salda-se gemem francês fugas irregular desencontra aonde farsa escondida parede bate budescos joanina erudito sucessivos panos barregudo austríaco azeitão avião patéticos debandava decidir participação próximos dedos ilustram metendo-se meros inimigo perigoso vivo symbole afinal arame poetas sagrado crucificado 42 comer leis morreu movem multidão prata chapéu veludo estribeiro investidura vivências voltou assedia estufa boca forrada amos zumbaias terminaram cardinalícias cardinalícia cardinalício carmesim cargas castelhanos maça conversa cordas cortadores armas cocheiros coches coche ostentadas painéis pagens ricamente exceptuand excêntrica ntimo passamanes perseguição secretário satírica demasiadas deitar somando doméstico dourados esquecendo fugiu italiano descrita sexualmente levada papa recebe barrete sermão servir lacaios retratadas liteireiros partilhar capelães mortal prescritas precipita presos teme tornozelos premiere pregão atavam-nos comunica operários opõe acreditam alcorão ajudam tora cena condenada estuda miudamente mito interditos involuntaria acompanhad alienam voluntários voyaient c'est-à-dire chamado c'est ceci marcação maiores mâle variantes variando croit completeme sacramentai romanesco execução examina pescoceira semânticos encontrarem galés dificuldade digam femelle interiorizada derruba absolutamen abandonar suprema addition acabe talmud adaro adam amoralidade amoroso homogéneo hébreux virada certamente carcereiros carícias extenuada consabida facultando faço redentor recusa cristã-nova cristo comédia orfeu escasso transforma transgressor secretários ecovisão empurrava effet saía fois journée desejáveis descobre desenhado deitava-se abstinência ensinam amar amanh sentença sept faltem corregedor inaugurando começar compagne idênticos humaine diversificada dogmática donne relapsos l'éxistence l'âme espiritualida escolásticas espelha-se escondiam escravos naturais quadrilheiros quintais objectivar passes salvar jejum jogos entregam-se equivalentes entrava aparências curtas curta sintagmática fechar impossibilida clarividente improvisada imposta materna leituras juntava aussi camaristas cancelos escândalo eróticos procriam procurasse subitament contrasta contíguos repetia lisboam canonistas cantarina dédouble reservados ligados l'on cara pentateuco perdem permitir moralístico verificável tecendo sobreviver advertência anacrónica sofrem cauda facilmente valorativos valor apostar compara pagam rins inusitada depreciativo humildement conhecido juízos devendo escrito esforçam nascesse entendiment enviado escape profecias sozinho ciliciosament propósito cingem resgatados liteira lixam instruçáes percurso perdão toca preocupava pretensão possuir verdadeiro assombro atendida oportunidad tecladament tiver tipos confiscados oliveira populi tardaria abertos andamentos habilidades graciosa graveto tínhamos tinta cedo aproximação completos compare romba oferta oiça misturavam bocas afectivo afectiva afiada homossexua gigantesca haendel zarolho vivaldi zação experiência marcando reduzida recorte registos criticada cópia corto arquitectural apropriar-se apostasia armou comentário ouvindo ridicularizad tribuna risco ritmo rude excelência exclamativo exagerar evocada ocasional pilha podem perseguir poético sensibilidade doutrinária sapateia futura fusão formosos deverão desrespeito 161 fernando inteiros fogem feio desejo desenvolta hipotáctico violas conscienciali exibição correntio crimes começasse comova relembro marreco judicativame julgamentos latinizantes lazer julgue escorreitos esquecer escolher escreva nelas estilização estejam queimo querido quero quilo saltássemos edificador edifica determinar abundância abundantís aparte cultura culto sinal sintéticos superlativos sonhadora corriqueiro impressões implicações distantemen docemente dizem-me rematando escuto nitidamente notaram nica balança bailado cadenciados breves brusca esbeltos escala promete dança severament simo significativa substitua-as subjectiviza suavíssimo subordinati súbita responsável lidade lembram laço lenha pandeiretas raminho bigamia bach raiva defeituosos deficiente sons influenciado controle retratada requebros bens prosaico dedilhada ministrados injustiças inscritas pensativas percussão persecutória muda concebe comuns teia onírico monárquica acredita agravada confessor vagueia urdir invés tarda alienação aliena alheio aniquila gostos sofre vulgar vulgo cerimoniosa explica-lhe mandou variam apresentada conhecer confere trama duplamente duram-lhe ganha achacado surge engenho adoece antiga anti homenagem visionária virtude caricatural expectativa marcha recusada reçoit regras crescem aproveitand levarem marido ouso novas transgredir excelente fundamento garantir flatos densidade desmaios amadurecem cruza indiferente casamentos casando fanico criarão ignaro ciclos disso liberação l'heure esconder normas nasça estereotipad ausenta quatre qu'il passou emaranhado se-ihes salvá-la frica fria devaneios entusiastica profunda produtiva produto aparecendo significativo sonhar feed-back igualdade resultado leva-a beleza canónica proporciona dando debilidade declarar servidor súbitos reacção capaz protagonista psicológica metaforicam méritos pedagógico peca deitando pedinte penitência insinua m-se morrem moralistas prazo pragmática pratas toscos velas associado concreta tendendo tarimbas andaimes vivia tesouro compatifica unicamente roubadas estrangeiros ofícios olho adiantado tábuas tafetás analfabetos anexim vindos cavada explicitação maravilhas explicativa cronistas vaso artífices rústicos personifica persuasiva semelhantes semente encomende fidalguice fidalgos ficaram fizera ironia descer engenhoso supremas suplicante suspensas tamancos soldados solfas vira conjuntivo extenua faltasse luzir receberam correntes crer coloniais cobrar ornamentos oscilavam esperar oscila transitavam necessária navios puseram queluz obrara saiu destinatário deleite abundam culpa somas consoladam fausto implorar mastros lapidaridade lâmpadas lançada escrevo estado paralelística nascem rgão esterilidade estética caiba elvas enumeração produtos apêndice damascos curioso servem subordinativ criadores medita levados paradas aventuras beliches rastos defunto repudiadas retóricos ltima metrópole mesa captar pede provérbio pensar chegava veriam teimais precisos atar vazão olhai confundida sacramentos bolsos anticlerical sofrendo cortesão cortejo pagam-se ousais pagai obscenos pobre dúvidas sagrada doutra fornicardes fornicando desregrame despejar designa descaro desejos virar ibérica comilança dívidas transitórias purgatório quaresma queixos elevação sujardes distribuiremo dízimo escudos paraíso pálio bebedice bebendo patente danação sexuais razões rabo capar reprimidos pecadores pecadora pavor península mortuário múltipla motetos motetes morrendo musical ordens morgadio chegavam te-deum alti prenunciava asturia moita monjas tecla alenxandre agraciado agradou aliviar agentes celebrarsi veicula vede assiste atrás composições compositore ultrajada utilizados estreitament estranhar abrigo algarves anno grávidas guardi hábito gozam grau sobredourad vivessem tetraneto portogallo faça varrasco varões ascender artistas sacrifica rosário saciar sabeis sacros eventual misturada mística bisneto pompas senão duque desprezo irmões irmãos deserto desaparecid desacordo suspiram supõe admirável ambíguo amen honra gesto historicamen heranças viúvas visto carta casual porquanto consagrava existem maest existia falsa maniqueísmo manutenção manter manos recomendou regressar refere-se regio cravistas cravísta cravista vaidoso armónico arquivo arbítrio cobro maritaggio pais napolitano nápoles trazido trineto estivermos exerceu atrevessem pudessem ociosidade brasileira perseguindo pesquisas poderosi policiava podia secções seixas santiago eis-me sairão fundadores geradora gasparini gennaio devotament devoto florescência introdutor festteggio desculpabiliz de'molto desenrolar deixam enormement hipocrisia hinos virem indignação indica favorecendo luxurioso fanático relacionado reinariam dolorosa disfrutando ditemática dividido dividida relacionar esperança palazzo estadia neto emprega salvarem edificação elogio frequentam freiráticos desvia italiana episódios entoando principe apelido serenissimi sonata sugerir fecundíssimo impresso impostos impõe discípulo religiosa restos libertinagem libreto matéria justificar esegui'nel parentes esforça espácio recebem receber beckford camas escândalos escaparem procurando defesa situa-nos status spagna contraditória continuam contrata resistências limitarem partições particular rebelam cantora cantar pátrias pátria psalmo ptima decorreram conventos ilustrativos benéfica bendito capital peça protege deitados mestre-de mestre inovação instalado insubordinan permanência vestem verde alternando tornam-se pormenoriza gramática viveza típica cenários compridas utilização usado mobilização intencionalm acumulação abolição anástrofe falas marcadamen recta brancos sagradas diálogo fontes engenhosa hipotipose visualismo visualizar visuais vírgula viram 673 carvão exibe costuras comecemos humildade humores colocasse direito lascado escovam-se negros transgride naquilo estilístico purificam-se segunda efeito frásica frase jorra descrito hipérbato cria-se choram claros juntamente esmagado espontaneid espécies normativa notações brilhantes camisas apontado apelo série subir individual impressão impor lembrando nocturnos bernardes azul subterfúgio cinzento limitações infringe metáforas metáfora mimetismo morremos praticament vergonha total posso veículos comporta-se acolhe falando evitar braço pertinentes dura diegético supliciados surpreendid soberaname carro carlas manipulando recuperação tribunal revisitação minudente podíamos fomos demiúrgica constantem relações relatados rezas elucidativas interpretam seria materiais justifica subiu contingência ilimitada retórico controlando pensa perecível motivo ordenou pretendia monumental técnicas tivesse precursoras pretenso atentament atenções modos tem-se tecido universidad interessou inventos tentativas aerostáticos aerostáticas afirmado afirma gravura cepticismos cerimónia aquecidos conhecem sacerdócio exactament observar mistificação seminário forem aderiu hospital inconsciente castelo faleceu conhecida judaísmo negócios naturalment naus numerosas perseguiçõe poderia seguem genial deve-se designação relacionem mecânicas leia esgotar questões segurando deu-lhe jesuíta jaime equipament envolviam envolvido esboços progrediam príncipes indiscretas correu científicas ii.o distrair medida justificaram lendária baía bruxaria cânones subtileza consulte-os repressão limites publicados ingenuidade controlo lógica morrido músico tema posteriorme previsto operário alegre altares torreões topos ventura atinge-se modestas modelos actos terzi centram centra celas conforme sabe-se romanos romano rosa oitenta misturam abside acho animado glorioso giusti harmonizand harmoniza catadura catacego portaria manetamanh macau fachada mão-de recuperando rectaguarda rectângulo recrutada refeitório regista varandim cozinhas arquitectóni arquitectos articulados conheceram levantaram trezentos transepto rocaille europeizant nudez ocorrência ocorrido ocorreu pires encarregado dramaturgo dupla sagrar ecoa funerária formaram despachem dezassete ficamos fluido dependência desejava acentua-se encontrou-o acesso ambas crornatismo herdeiro visíveis idades lavatórios laterais latina judeu orientador escola travado quantidade quadrados quarenta querer quinto brasílica passar passaram salienta-se edifícios elíptica frederico desconheça entanto entra culminanted curva crescimento documentos disponíveis ditado escultores escuros nasci batalha ausentes bassílica caminhos bulletin jesus escadaria privacidade prodigioso procurou cumprida situamos smith imorredoira resolve lucília labirinto ladeada passagens bela rapidamente biblioteca bibl pátios proporções definitivame degredada deduz-se decorativa definindo influências contenção contém benções capelas protagoniza localizações loggia meses pedia inscrito perna morto mostrassem n acionais oração chegassem vicente ver-se temíveis tivéssemos postas prado pregados vier vermelhas vestidos conclua onofre montes alusão alcino tiranos tirania torná-los trabalhe topada assis ubaldo olhou inverosímil inventou tendo-nos alheias andamos anónimos andada vocabulário voltadas chagados expõe expo vastas assembleia assassina aspereza aspira complexidad comparado roupinha trouxe bisonhos ponte tampo talho tadeu adolescente admissível andou amito horácio zacarias cerirnónias católico falar¬lhes marcolino reclama regra conversação cotovelos cosmos cristóvão valores costas valério vales aproveitar arbitrária aresta noutro ridicularizam trocaram sacrifícios reunindo ruins ritual rufino estivessem exemplos obrigação miserável brás plantas pisado pluvial pias senhora sensações encieirados dúvida egipto sarar sátira egas geraldo formálio desmistifican dignidade diárias inventadas focinhos fluente feridos firmino feitos denunciando demoradam desigualdad delicados depende descalços acabarão crueldade vilipendiada virgem reinterpreta reflexiva léguas légua escrevemos transportar tratamento ribamar estarão atribulada quadro aturar pura questionar objectividad objectiva passarinhos passo embainhar sangravam frio isabel isidro interpretada deixemos entortar-se entrarem profissão dade síntese sonhando sumir solo reflectir implumes disciplinas distinções dizemos medem lama juvino esparvados espalhar parecem escritos parar nomeados nicanor transposição transportou autos bastaria bastava quitério brilha cabeças caminhar bruxedo caída caladas burro entende ermo apoiou daniel suceder suave continuar imortais cisma clara respeitar retalho lindo melancolia meia lacrimejante lembrados parou rapação rasto canónico próprias infalível contando contas imaginado imita louvado lombos dedo ilusão longe metatextuali metatextuai mestres pediam provavelme minorcas pensam pensou perderão perguntar oral presume prega topografia toponímia confirma modificando alista condenados gozo cerejas ouvirmos trajectos rítmico observa gaiolas inventando fitas fixo enfeitadas surre independent direita página púlpito emente destrói irrompem acaba acabámos sentenças considerada ditados nascida entrelaçand profere significação serra aves canários aplicadas aplica-se loucos cantam prosódico perfeitamen mudança temporalida torreão opinião moços interior abrem angola césar maravilhoso criticam-se variadas ocorrem suspeita caridade porqu referido notou efemérides salientar irreversível intrínseca enquadrame acabada enredo principais apalpais herói criar notação pataca profanação situadas feições criado contem lisboeta mereceu cantores permitindo pretérito verbal assume alcançar andamento expressivos convivem confrontado uníssono formal interioridade abdique terceira afastamento antecipadam falassem varas rumo pior dual interjectivos designado referidos reinante humana coexistem directas oscilação específicos narração empregando eliminação destino interrogaçõe erecção aparecem indirecto imperfeito discípula religiosos mediador aponta simbolicame repare-se lubrido lembrança raramente prosseguir deícticos milhares penetra perfeito preces prefira verificada técnico posterior atreve mónica afrancesado aforismos poranalepse invocada abertura aberto alienando-se gravita volta xvii facção saberás exaltavam exaltava filipes adivinham tamborilar tambor amplo antecipação havia soldado independênc castiços constituind reelaborada recreativos recobrada conversas comentários comendo começos companhia conheci noutros tradicionalist retrospectiv nalguns triste rufa noviciado novena pífaro podendo segredos santo sedução encarnação saúde fundamentai genericamen funcionalme devoções destinado devota flash-back denegriam desengana enganada consolidar conseguiu ideais clubes marvila mbito estagnação revolucionári rezar queres detrimento profundidad apareciment dado superar distinguiu-se distorções remédio leva parideira nobres defendido simétrico inferioridade indivíduos contada repenicar repenica reprime influência infeliz contam-se imaginação lóios provérbios milhões milho instalou mostrou-se municipal movida chegada charneira vigentes verificando vereador comunista concluído tornou-se potugaise prémios assinalável activamente tendo-lhes tendo-se acordo agita vivos célebres vejamos roubar urna usar estranharía estranhou estúdios bordeaux interessa abono adormeça afastado há-de gritado goleg voyage vindo terminou carreira cerâmica reescrita convidado variada padeiro unilinearmen reveste-se traduzida unilinear tradutor eventualme estivéssemo estraçalhad exclusivame evento ocupando biográfica plural pôde polifónico económicas encontre dificuldades dinheiros desempenh suplemento vigiando 68 incontornáv inclusive luta regimes cravo cortarem colóquios colagem director levava organização orientação países ndole trémulo revistas ribatejo estiveram pulso sectores encaixa seara educação editions festas intervenient intervir desliza acabam cumplicidade cruzam sentimos construída reflectir-se implicação cidadão mecânico lanzarote esforço espada especial escritor narre narratário quiseram quiser bala caixa frequentou desvirtuado dama serralheiro simpósios siécle sonhe ilha membro l'escampett pálpebras panorama recebendo aventurado azinhaga beira câmara debandada definição declara sono inferno controladora conte residir littérature literárias ligadas mereça participou partidária proximidade publicação propunha prosa dedicar-se militância injustiça iniciativas perda permite-nos predomínio força intenções intenção forte 137 cruz qualidade frequência reflecte claro religiosas baixo mostram oralidade pontuação tinham ficou falo colocado travessão saramaguian sair identidade devagarinho seres bênção vieira velho tarde população graça conhece ocorrendo dinheiro derradeira enfim novembro festa dele enorme essencialme escreveu nasceu clarividência pública primeiras verdadeira típicos comprometid confidencia tentar anonimato anónima assados roubados pertencia ficcionista invento sustentam admite anes conotações rectificar arrancar estou económico fundidos ganhar dessacraliza desrespeita desses descendent familiares identificando humilhados ideologia punhado destinos erguer sintaxe reflectem colectiva dominantes massa laia eruditos propõe-se individualme individualiz construtora construtor criadora ressaltam lido rebela-se autobiografi infelizes resgatar residentes pense pequeno opta vertente concede assumindo veio pormenores centro explicitamen comparaçõe sacralisado pertencem perspicácia seleccionar dilui inteligente filtragem derrisão abrange adquirindo anti-épico termo consagrados reduplicação reconstruído ridiculariza evocados duvida sarcástico devíeis irreverente inúmeras irónico acabar vila clima considerado ideológicas humor relata julgamento laudatório atribuía el-rei elucidativo devastadora detalhes deve sinais significações discordância parodísticas panfletário paráfrase parodiar nobre nível narrar barrocos autores camões declara-se subjectiva realismo patriarca limita inserindo perceber preencher conceitos possível venho acrescentar habitual experiências variar arrastados paciência tríade evidenteme europeu sensação intelectuais fidelidade desgraça caracterizan exército correndo esclarece notícias pássaro empenho emendar emenda satisfaz irreversibilid custódia far-se colectivo lançando-se leito envolvem equipa cumprimento serventia responde lacunas lendas degredo declarou informa-me imaginando realização ilustrado proveito inicial insatisfação mostraram ordenado verificação monumentos temático temores pretendiam verificou comunicante conciliar montesquieu alem tolentino tomos possibilitou ateus populistas alismo volumes teses condillac utilitaristas u-se etapa bocage filosoficame filosófico filósofos filinto acusaram teológico teorizar tentou abriu afastar ampliar anastácio wolff católicas consagra rectângulos cristianismo coordenar converteu criticar arma tradições exclusiva evolução ocupado planta sensualismo enciclopedis santos frade dinâmica diderot invenções fizeram democracia deparavam superstição suscitando 134 encontrou abade constitucion regeneração corredores correlação crescente criativo correia ideológica hume levou escravizar necessitado estática empirismo elísio enraizado d?alembert sentimentali sistemático sistema domingos divulgador divulgar divina matematicist materialism laicização estabelecer newtonismo nicolau procuraram proclamou significativas substâncias stuart ludovice radicalizou r6sseau raízes indústria contemplado repúdio bentham deístas infundados inglesa inglês iluministas locke metafísica provém mill prepotência vidente atitude modelo graças vocação conduz odivelas artes transfigura princesa sujeito esposas freiras passados capacidades movidas mota preciosas prestígio concedido opostas técnicos povoamento potências prejudicada assumiu moderniza agitada território típico positivos expoente vejo vastíssimo compositor confiança complexa trouxeram utreque utilizar roque irão intensifica açúcar aliança governação sofia chamada facções facetas criteriosame aspecto apreciada rituais europeias obtidos bragança personalidad plásticas pesado pleno eclesiásticas económica fortalecida destacaram destaca-se dignidades diligências dinastia fidelíssimos formação firmada ficarem firmeza desfecho derrame absolutismo engenharia absolutista amazónia ambíguas vitoriosa incremento incúrias cartografia casou lustrado madre reconhecime reforma receita comandadas 23 diplomatas ostentação exercício estilo brasileiro péssima santas francamente dessas intervenção deixando sumptuárias solucionada favorecidas favoráveis consolidação considerava conselho reflectiu-se corrupções dominação domínios do-se dispendiosas dispendiosís dissipadas dissipação dividiram diversos disputa releva-se matar palhav neuburg quarto quis janeiro entende-se episódio erário proclamado produção fazenda importantes resultados restituição restituiu libertino medíocre campanha aplicados debatido serviços simas soube spera indústrias imitar meninos públicos decurso inglaterra beneficiada iniciada ministro insurreição movimenta precedentes alterarem comum inverterem filipe advérbio analepses má-f recuar arrábidos poderoso futuro"como fundamental formas fradaria 110 dezasseis ficar flores acelerarem coincidir esqueçamos obedecer eduardo fulminante cuidado consentimen favorecidos conservou ciência matriz espanhol dá-nos sucessivas citação renitente meios mínimo injunção percebermo moradores teimosas touradas molinismo alegria altos terreno miuçalhas andando sodomia testemunho completa usarem sadismo saem desacertada advém gostam recorrente convictas cristãos arte 167 83 persistentes dramática saindo generaliza gerações futuras despejando feiticeiros denunciar descendo engloba hereges solicitá-las constata reincidentes correntemen cheio disfarçam relapsas relativament relaxadas negativas trata qualificáveis objecto passíveis secular aparenteme sintáctica impiedades imprópria cidade domingo juntando-se justiçar espaciais nomeia barroca cabeça apoio situado bere canto escapar contumazes reptizar lisboetas opressora oprimida verosimilhan verosímeis potencialme potencial venda típicas positivo expressas conferida conflitual conflitos conferir unda ofício invulgares symboles antagonismo voto vultos cerimonioso marginaliza exprimindo validando costa aristocracia duplo desprovidos dictionnaire figura invalida acabou constituem falso coelho relatos originais negativa negativo transição editora/nom edições jornal corrupção ditions baltasarlblim bastos entusiasmo aparecerem cunho serem sexualidade subordinada importa cito resolutivas resolução laffont/jupi paris azinheira bertrand contraste contribui reprimida retratos literalmente parto morte alerta guardar soberano xavier magia referência sabem desafio narra questão seiscentos empenhado nasce de-f prova monumento praças vasta ruas cardeal trinta transgress heresia casas colecção espanhola daqueles contínua instituição possui activação almedina alcance alain gulbenkian comportame modalidade tico porto expresso sacramento saga diegética gheerbrant manifesta código levaram 139 182 nesses genologia fundação dever foco ensaios heterodieg constam reflexão específica narratologia frequentem frente determinado descrição enunciado seriam sonatas resulta calouste definida informativos instituída permitida ajoelhai tomar tomou guas anacronias mandado aqueduto peso dias desenvolveu idade revolução fuga ferros considera imposto material lugares livres perpassa moral guias toneladas tome tirar porventura velhas velhos turísticos afirmar aliar gratuitamen centímetros mobilizada sena encontrarão forçado achado supor redentora redondos varanda arrobas sacrificial números obrigando pobres pocas polida senhoras sapiência garras acabarem antítese visitantes conseguiram humildes diremos reler liberdade lavrada largura espessura esquecem transportara transpor quinze quilos passemos elevam entram proferido solidariedad corrigir materializad materializar laje buscar cabia imolados imolado rainha imaterial benedictione instauração inscrevem instrumento pêro complexo gravidez fácil diamantes conventual vaidade 155 crist marquês seguintes delas dizem notáveis norma ermitão princípios sérgio resto paroquial bento paula populares estudos haveria rmos doze deram fama recolher relato frequente descreve sequências singular lembra símbolo traços vendo actualmente anjos vindas 97 diário desenvolve desempenha acaso ideias donde judeus júdice nascidos principal disto passa evasão fundo desta 50 coimbra tratado relaçãoordem realizado pereira compreende cronológico arames difícil financeiros 76 67 188 recursos sentir materialidad bastardos entretanto simplesment situam sucessão linguagem repente musicais pretendemo associando atenta alargar aluno interessara convidamos convite confrontamo completem confronto pertinente fichas gostaríamos horizontes incluímos incluir extensiva redacção 149 exercícios noviços funcionamen formativas destinamos inúmeros introdut deliberadam deslindar considerámo criatividade colegas largas específicas rias apelam sugerimos cria divisão autoras auxiliar substituída contextualiz linha linhas propostas público partilhem pautámos pegarem pedimos iniciarem inserem pensando permitam torno possa obras queimaram sete-luas papel versão facultar robert frades 17 lexicoteca nuno escritores entender erros sete representad livraria ajuda acto confundem semana terem 109 12 senhores referimos humanidade daquelas tenham testemunha chamar acusar teoria global viver textualizar convoca completame confronte comparação rigorosa obviamente mistura políticos sensível formada filtrar fielmente abandona 128 reconstituíd trazer questiona intromissões professora fantástico diríamos diverso estanque note-se brechtiana impede-nos restaura meio r0is procurado defendida cinco lidos mergulhar particularme passadista ptica caracterizad instituições inteiramente morreram move-se telheiro chão portuguesas ventre tecer h~tória posições compor estreme bonito acima terão abrindo afastar-se xito cérebro margem referencialid refere levantemos levantou transcreve pitoresco senhor gerando forno fingi-las fingindo desafia administrativ sentar-se gerou vimes coisa colaboração noutra reviver estar saíram-lhe salientes deixou deles cruzadas sentimental constante referir-se distanciame ditas nico nora jeito entendê-las enterrada sete-sois escaparam imaginar metro mina horizonte hão-de catorze conjunto 125 pessoa funções audição jorge língua conceição torna comprimento vimos madrid existência recurso 61criticamente traz melhor contudo morrer vazio pesos pessoal poesia fictícias academia sala custa notável importante alma tenha fica necessidade simples voltaire terra forças endo introduzido correspond relatar espiritual ciências racionalismo inserida portugueses omnisciência fábrica trono 77 reflexivo mármores sentidos ausência capacidade alfa grandes estrangeiro galeria sarl destes crescer possibilidade actividades vozes falam recolhidas 131 faremos esteve sentimento contexto conflito valorização desenvolvim talvez administra consciência colónia meados livre publicada 39pequena geralmente dessa clero prolepses problematiza característic trabalhador falsas maior companheiro 30 levantar revela estando brechas contempor círculo estrutura 85 referir baptista claramente consiste paralepse processo cunha realeza cinquenta perto 699 oscar francesa ideia partiram partido mosteiro estrangeirad glória externa anteriores secundário intuito ensino culturais ignorância memória marginalizad excêntricos 15 constrangim seguir entos literários interesse abril exploração maio conduzindo analepse colóquio 27 45 classe chevalier junho jean aparecer religioso leitores sessenta sonhos 18 anda grandeza cento saber durante gente profundo serão signo verdades oito passando quixote debaixo mulher pragmáticas pressupõem pressupor tolstoi premonições romarigães abolidas explicaremo marcada marcado explicar factor artísticos aquilino conhecedor semânticas destaque destacar destaca deriva acedeu anterior 190 incidências comerciais ricardo ribeiro emoldura descodifica solicitando indicativo indicador consignados i.o distanciada dons discursivas normalment objectivos determina esboçam enuncia profecia procediment simultânea subsequent rememorado rememora restrição memoráveis lello lembremos lermos informação realmente ilustre captam proustiana vidas carga desse nomeadame partes tendo asas sofrimento descoberta situação luís medidas lembrar razão retrato carne crítica riquezas planos direcção disseram informações capela paulo popular 48 ouro original daqui aconteceu vontade estava críticos curso rossio haver portanto levar poderiam natural quisesse imagem andar 92 escrever frases 175 interpreta localização conceito existe autoridade pedras temos apresenta filosofia falta 36 62 ficam entidade moniz aliás espírito nacional feito domínio religião mecanismos contrário auto viveu consegue consequênci kaufman levam ponto digamos liberta prolepse lição longo período moderna 160 novo minas prazer competência oficial 86 desenvolver fazem espanha propomos letra chama régio europa libertadora narrativas narrados inquisição temática 675 enciclopédia acedemos circunstânci chegam 113 santa criação abordagem político lugar concluir 176 eleva permanece físicos 736 mortes tradição pretexto vértice alcança comungamo celebração atraída condicionalis recorrência registo traduz exactidão evoca duas conta fornecidos fornecer 151 127 despreocup desmandos didáctica destas fictícios adjectivação exorcizadas consciente recolha coroa naturalidade transmudad trazê-los revolta gerais sirva sumptuosida distancia-se dista espécie ausente elucidação detalhe enumeraçõe problema privilegia aparece-nos sublinham imortalizado citámos remete rebuscada inferimos reside realista infantes imagético longas minimizou integrados perpetradas permitiu 146 verificar onze antagonista podemos nessa paredes representa pretende postura assistir deixa substituir práticas pessoas 20 irónica nesse cultural monarca estudo cronológicas 47 emprego veracidade atesta expressa diferente 29685 interna josefa nascer simultaneam dedicado mero 65 semelhante espelho seis eram simbólico carlos 124 56 pistas opiniões universal ação seguinte serve retratado mostrar adiante 89 campo contar ultrapassam anacronismo 718 projecção procura integrar precisas teve 677 669 33 140 deixar iluminista mundivivênci agustina tornar-se assistiu omitiu modificado sobressair testemunhal compêndios oficiais textualizand manuais exterior referenciam recriam conversão aqui revisitar rnítico ocorridos genológica gabriela fingidas denuncia acentuam absoluto hesitar indexar-se exibem-se reflexo clássicos cláudio específico esquece neles questionam profético cumpre superação impossível nomear ngulo quiserem cadeia construtores ludíbrio lirismo lírica autenticidad autónomo bessa-luís contemplam contamina imaginário literariedade llansol metatexto insiste integralment integração filhos constitui frança quase principalmen literária coisas referencia cronológica crítico indirecta 51 surpreenden parece situa vamos duzentos dicionário o-se nota olhar dizendo espaços serviço representan presbítero eurico mãos 82 26158 herculano neidade narrativo datas contempora metros posto reconhece letras mortos preocupa omnisciente dentro amor 103 esqueceu 104 invenção coincidência publicado inicialmente mário criando radical altura itálico leva-nos pensado momento marca 695 706 emprenhou respeito publicações imagens nova leitor mulheres política intemporalid revista emergir representar 98 entrevista integrando chegou 107 80 costumes scar aproxima fora 173 corte caminho alunos ustria encontra idem mente postos momentos reuniões secretas reino sugerida imaterialidad português posição futuro forma movimento confia evidente 112 74 processos reescrever porém 166 101 espera quatro fronteiras eventos atribui casa autonomia historiador títulos evidencia determinada oprimidos alteram reconstitui coloca apesar exemplo país passada alteração reinado entrada dela sentido início tinha séculos palavras análise nomes marta objectivo 11624 59 através vinte 35 manuel 115 privilegiada verdadeiras eterno excerto passam alexandre nela século novos históricas teria antónio 191 editorial palmos iluminismo gosto aspectos 41 732 livros 136 significado partir temporal histórias construíram barroco dizer xviii 10638 natureza transcendên discursiva referências 118 permitem portuguesa encontrar ficcionais factos referencial 694 apontar tratar dada memórias verdadeiros 148184 plano estatuto 701 nele falar 185 brasil libertação 169 categoria 693 enquanto 79apenas vezes figuras ambientes reconstru quinhentos devido sujeitas notar 667 diante ibidem adeus historiográfi kaufrnan metaficção 32 quer 164 social 43 geral instância então 91 671 tradicional 133 andava quadros literatura acompanhar vontades justamente mentira três fazendo marcas estamos escreve libertar-se importância povo fizemos 668 170 entrar tipo ultrapassa vista precisament próprio movendo-se biografia dimensões nunca engrandece nome 163 ficcional reis temporais além tempos universo 674 próprios intemporal 143 corresponde ultrapassar 666 textual igreja pensamento trabalho 730 tipológica classificação perspectiva termos implica assim157 entedimensão sempre 731 95 deste textos 172 58 sido 122 heróis integra agora lisboa literário 130 contam 100 gusmão realidade helena fala 703 sendosobretudo casos 94 personagem 178 lopes cerdeira 70 olhosgrande 42 73 739 focalização data explica 727 atenção 53 702 alteridade romances 670 silva função própria 11 diferentes 119 44 181 poca alzira 179 seixo visão carácter embora 729 autor teresa 88 187 históricos 708 734 elementos dois maneira cristina ladopresença hojegénero portugal717 modo livro acontece seja 44 narrado 724 vida 14 737 64 acção acontecimen permite 697 caso escrita 705 poder 700 145 personagen real histórica 735 pode homem mundo 726 121 leitura facto homens francisco 686 pedra música 152 0.0 joão -1.0 a -2.0 733 fictício 728 narrativa 154 672 verdade ficção 40 41 46 anos neste histórico espaço ainda -3.0 707 discurso título passado 3 também 740 obra 738 722 -6.0 -4.0 -2.0 0.0 2.0 Figura 3.9.4.5. Amplificação de uma zona da figura 3.9.4.4. permitindo ver com maior nitidez as amostras de treino (vetores a negro) e amostra de teste (vetores a verde). 142 A figura 3.9.4.6. apresenta os resultados ao classificar simultaneamente textos das resposta A) e B) e a que corresponde um coeficiente de correlação 0.668 (para uma proporção da AT de 50%) e d= 1 no cálculo dessas classificações. Figura 3.9.4.6. Resultados da classificação (usando o espaço semântico relativo ao Memorial do Convento) de 60 textos de resposta (relativos a A) e a B)). Analisando os dados desta tabela com a folha de cálculo EXCEL, obtém-se a figura 3.9.4.7., em que se “verifica” que uma reta de regressão permitiria predizer com relativa segurança (qualidade R2= 0.445) correspondente ao coeficiente de correlação 0.67, os valores de ClProf (Ministério) em função dos valores atribuídos pelo sistema (ClSys). A figura 3.9.4.7. – obtida com o EXCEL – mostra que esta reta de regressão é significativa e que os coeficientes respetivos são significativos ao nível 0.05. Estes resultados devem ser considerados com prudência visto que, ao examinar novamente essa figura, nota-se a presença de dois grupos imputáveis à diferença de escalas de classificação das respostas A) e B) pelo que a correlação elevada pode estar associada a este efeito e não à efetiva preditibilidade das classificações dos professores em função das classificações dentro dos grupos. Trata-se de um dos efeitos que justifica a recomendação encontrada na literatura no sentido de evitar classificar mais do que um item de cada vez. 143 Figura 3.9.4.7. Significado da reta de regressão da figura 3.9.4.6. 3.9.5. Dados de GESTÃO. Experiência nº 1. Neste número apresentam-se os resultados de uma experiência realizada usando os dados GESTÃO relativos a uma avaliação formativa de estudantes da disciplina de gestão de um Instituto Politécnico. Esta experiência destina-se a investigar a possibilidade de usar as respostas dos próprios estudantes em exames anteriores, as respostas dos professores ou uma mistura dos dois para classificar, depois, novos testes. Este esquema tem importância prática uma vez que se este tipo de instrumento se destina a apoiar o trabalho do professor individual, não se deve assumir mais informação do que aquela a que o professor tem acesso - manuais de ensino, a cultura do professor e os textos produzidos por estudantes com que tenha ensinado. Usando toda a informação relativa a estes dados resultantes dos textos de resposta a uma única questão relativa ao conceito de Qualidade Total, obtém-se uma matriz de frequências X (n, p) em que n= 1937 linhas (palavras) e p= 187 textos. Realizando a decomposição em valores e vetores singulares verifica-se que para obter uma variância de 90% basta chegar à dimensão d= 78. Usando apenas a informação correspondente às duas primeiras dimensões para construir um biplot, a informação correspondente é 48%. Isto significa que essas duas primeiras dimensões absorvem uma percentagem muito considerável da informação total. Na figura 3.9.5.1. apresenta-se esse biplot. 144 clientes gestão empresa 277 5.0 produtos 321 270 326 298 333 264 337 340 300303 processos esforço operações 250 melhoria 299 expectativa 249traduz 286 280 satisfação base filosofia 302 324 289 259 total 287 335 322 organização 292 modo contínua 328poder 283 assim 327 252 concorrente 301288318 produção satisfazer mercado 268 custos344 continu 295 cresc qota confia serviços 269 nível elevad melhora baixa setore ento 319 conseguir sempre ram rentáve desenvo tambe negóc sejam rentabilid basicam objetivo começ invest atingir inovação concorr ficar reduz logo objectivo positiv preferê consiste funcion venda preços 258 293 316 256 330necessidade expetat objetivo mante serã result image tent top satisfaz equilib presta obter rviço produto mere pres excede bens/se diretam interm melhor obrigat produz assegu aprefe fornec requis supera exerce cresc atingi encon bené trata próp esco prov retir dan seg serv cot irã tra alcanç defen empe teor aumentar colabor diminu prime ganha deve lequ devem gost 254 empresas fic comercia deste meio 266 constan siste teor tenha dinheir primas ativid positi novo tent matéria forma apresen agra cres além diss cas nom toc 323 pessoa reconh ultrapa gerar desenv grau dess altera defeito aprese inform presp apres aplica descr evolu perce reacç adop impo reto vend entr abe adq e/o par estipu opera serviços ent melho alcan estabilid reputaç consta vantag aumen vendid coloca resta ablid bené cheg med defi duto pel reg admir seja 307 melhore probabi envolv aind deve opera object organiz rendab prete mod tipo podemos porme consegu aspect ultrapa distin comp nega dura coloc dete sere divi set fato visív conseg traça lucros utili vendas preferê preocu tornan operac resum concre encan maxim vende prom exige eleva crian defe obte com foca gost alar exig part satis gra zer diz ma cri profe satisfei pode resum rentibi fazer melhor entend essenc prejud impac perpe fideliz contr max virtu ocor volta sum aba des gan niv funciona motiva empr diz-no perfe prod fina procura dize forneced preço aume bara agra acim materi essênc trabal negóc levan conti cont entr inci aniza ida lucro/r opera empres grande proced exec verif norm ope prop den alta saíd pd receit defin míni ape oferece 246 superio aumen linearm perman reconh traduzaumen eleme motiva eficác super basea introd desej evolu huma tradu renta adqu ligad marc tere obti mia vid un existe gast vont esfor que despe cami difere cliente empres susten compe conseg acess satisf desta exige levar vend man cofr fren ofer for quantid atualm produ organiza esta excelênci conseg consum reclam vantag contro factor encan plane princ perm apon atua cust ram volta defe deix mil nfa op conform contin expet fazprinci contr mp aumen aperfe desem enqua 290 263 espectativa diminue justo/d reform tempo aumen conseg grande reconh recolh adapt barata eficien invest lucro remun provo minim melh perío provo orga prop cons marg queb apos de-o plan utili diri me lug car cin pod aten produ intere melho ze empr condi cump consumi continu controv estabe supera tendê ating enqu oper traba gera agra visã estu gest am cau par talv lan trad superar tecnol avan obten foc comple interes propor desfaz efectiv continu necess provoc trespa espeta utilizad ambie liquid adqui chega descu contr dispo gerarectif espe logís elevá espa próp decl padr paga real ciclo erro foca clim corr esta níve pon fas trans ca quota minim houv alto facilm ating nov zer exte sobre ger super tax prec interm produzir finance organiz interes lucrativ precisa reconh surpre provide respon autoss rentab trabalh progre acresc estabe origin centra estrat contín optar consu bene conso existe agra direc corre defin eleva esta méto surg chef este mud part trag ado intu nov efic ben nis par ap tira dit demm accion taç filoso ded simulta era cond exter repara cumpri indireta admini aspect desnec cumpr endibil optimiz influen insatis certific conseg espec corres cobra conclu neces arma comp obser vejam acaba comé corre situa bene visto cont ofer podi acab acçõ ctor ger inic stoc aca evit ptic ge linh enfo qualid tard segui pen importa possibi condic empre crescim deten econó partic execu alcan expan cump poss dese man pala rega exte lider triun reco sint soci cap just mo fac pap fon agi sentim baseiavend estive relacio stakeho núm influên reduz esta term irem dire contr reso resp rapidam verifiq inicia ger exceder gestore conseg implem indivídu aumen desenv soburd satisfa aprove caract parâm respei analis contem produ prepa traba adqui proble const prod/ aleat enten fabric máxim optim princ proje resum atend descu preoc relev acen ener previ redu renta acab asse cieda dom dest posiç circu inse efet bas faze cau lógi ltim vim che fora juro bai jun linh pas flux inic da indi tende lufa financei conce esta demming evide satisfa dispo atin atra minimi repercu conside manté minim encan periód econo utiliza devo máqu acess acon enca contí cilida diret maio cheg lacu ofer capa fabr esca cois frac terã torn bas cla cria ero fie fal rend ren pos inspec fican gesto importa conseg utiliza estam explic secto gara ativ fize iria ira loc lot quota suje dur merc 297 processo quantid compet elimina aprove denom progre angar determ marke diminu funcio vende atuali traba comp conqu destin dimen inves produ exact crédi baixo deslo prod rigor base divu funç tare inpu pass fund sup fica exis fác tinh tim amo inspe and esti cut relativam determ concen envolv estrutu plenam proven priorid equip eficie meno orige men taxa presta entan lança reduz apresen entrev audito estipu favorá trans form indire gera espe dáfat lei satisfe tecnol tem torna também 313 decisão conseg inputs/ ponder param constit extend econó evitan prese eame relaç extre toma ava qua difíc falh ind obv ref atr cas próp forma susten contrib comple diferen interpr evide percu relaci digam inves mane cons exclu alcan assíd dura refle amdúv jus var consis procu traz aume desen foca outp nive melhor compet caracte instituc possibi centra fazend improv norma contínu melhor relativa object reflect conclu possib inlfue natur origin passi outpu pesso tinha inter políti próp volu aplic dest visto dep dev zaç aten rigo continu possível determ efeit meio tare situaç certe autorid plen reduç leva respons aproxim multidim relacion operac traduz benefí perten adequ atribu contro comp confe fabric explíc refere utiliza avalia talen circu difus maté activ cam quei torn com cent méd viço nes pos prim ona defen dua qualid produtivida desperd denom conseq diminu máxim feedba perda eme vista funç pon cha igu classifi quali produto/ activid mode trabalho enfa investime desper criaçã vezes vai-s feito tenh físic aqu divis aumenta leva altam sinón verifi men equipa interna aprend contro depend natura efectu aborda conjun entida conso aplica espec requi aplic refer envo agim viáv pas conf tradu princí segundo organ possí afirm nov exemp melhor 255 con melhor repet defin utiliz men alte dire utili ver per vic superi acabar pagáss entrav necess signifi benef preju méto levav técni efeit ganh divid eny grá pag ser cois falên geran importante parte ideia boa estão rea peg interp autor atra fact diminuição departa certific denom directa energé relacio ambie percep repres tornan aperc acoss difere distinç exten univer desta atrac have plane politi públi retor aplic entre refle vist agi valu aspe mon produ nunc devoluçõe human compe 0.0 341 274 cheg vam efectu apli dade cadeia valia explicit aumentan estrutu contr razã novam demi dois actualm amp totalid acord prátic tiver eficiência qualifica devido dess haver sendo nest positiva reativa necessá resumi negativ associ portan defini conce benef existi técni acti usa capacid implícita então positi definiçã auto pode existe 260 recursos apresen permit devepodefinal prémio 265 conhecim adequa visand gera correspo membr 251 baseada sucesso quer longo sociedade participaç prazo tendo associa através permite aumento317 característic existir normas 276trabalhado 304 facto conceito 278 284 282 314 247 332 315 338 343 296 273 positiva 291 valor 253relação 312 320 306 294 261 maior 248 serviço 342 345 271 produto 311 329 -5.0 281 rendibilidade dade -40 -30 -20 245 -10 Figura 3.9.5.1. Biplot correspondente às duas primeiras dimensões do espaço semântico construído com a totalidade das respostas de 187 estudantes a uma questão relativa à qualidade total. Examinando a figura anterior parece que a estrutura global das respostas se pode descrever em função de três grupos associados a questões conceptuais (textos do grupo que aponta para o canto superior esquerdo), textos associados a questões de eficiência (grupo do centro) e testes ligados a questões operacionais e resultados (grupo que aponta para o canto inferior esquerdo). Isto é, o biplot anterior transmite a estrutura subjacente à totalidade da informação associada às 187 respostas. 145 Usando agora apenas 85 destes textos, escolhidos ao acaso, para construir um espaço semântico que retrate a linguagem dos estudantes – e nos quais poderiam também ser incluídas algumas respostas elaboradas pelo professor – obtém-se uma matriz de frequências X (n, p) com n= 1303 palavras e p= 85 textos. Procedendo à decomposição em valores e vetores singulares, verifica-se que a dimensão d necessária a obter 90% da informação é d= 41 e que um biplot correspondente às primeiras duas dimensões absorve 46% dessa informação. Na figura 3.9.5.2. apresenta-se esse biplot, constatando-se que tem uma estrutura muito semelhante à do biplot construído com a totalidade (187) dos textos de resposta. Examinando o biplot do ES, constata-se que não se notam distorções estruturais ou enviesamentos associados a textos específicos, podendo assumir-se que este biplot é representativo da estrutura do significado da totalidade da informação. Os restantes 187 – 85= 102 textos de resposta são em seguida usados para construir (em função do valor do parâmetro proporção) as amostras de treino (AT) e de teste (T) a validar. Na figura 3.9.5.3. apresenta-se agora o biplot correspondente ao ES retido e sobre o qual foram projetadas as amostras AT e T. Examinando o biplot da figura 3.9.5.3. – usando as facilidades incluídas no programa PAET – verifica-se que as respostas estão na maior parte dos casos relacionadas com a parte do espaço semântico (ES) ligada às questões operacionais e dos resultados da empresa. 146 empresa produtos 277 5.0 321 270 326 238 333 303 esforço processos 300 337 expectativa 340 298 operações melhoria traduz 225 243 filosofia base satisfação 239 226 264 230 324 222 250299 249 286 contínua 280 organização total 289 0.0 287 259 335 modo 328 302 252 288 221 322 poder 283 301 242custos negócio satisfazer 344 268 produção 327 serviços continua 235 295 concorrente inovação sempre novos 318 melhorar 319 292 aumentar 244 rentável ento crescer medida qota confiança baixar 293 assim nível ainda elevado setores 254 preços ramo tambem deve obter investir desenvolvim objetivo basicamente caso sejam começa concorrência reduzir serão expetativas logo positivos atingir resultados podem venda preferência ficar rentabilidad constante 256 330conseguir funcionários contrário mantendo admitir prestados satisfazendo gostam tenta fica topo superar-se bens/serviço benéfico exercendo excederem empenho servir merece obrigatoried cota segue fornecendo intermediári leque assegurand crescente atingindo devemos retirar melhorando grau irão dando diretamente pressão próprias imagem tratando teorias trar provar alcançando defendem requisitado aprefeiçoar apostar equilibrada escolha ente encontro constantem rviços diminuir colaborador produtos/se produzidos consiste operação elevadas objetivos ganhar devem 297 necessidade meio sistema forte atividade 323 241 258 tenham voltar teoria positivas espaço mercado objectivo deste desse disso primeiro além agradar cresce tentar ultrapassad toca reconhecida perceber partir operando nome evolução ganha retorno estipulados prespetiva aberto informação importa alteração adoptar adquir reacções descreve aplicação apresentand apresente organizaçõe serviços/pro tempo dutos e/ou vendidos vender defeitos pretende trabalha desenvolver envolvente entrar pelna multas nºao oferecer aumentarem aumentava benéfica tecnologia destina-se destina tendem seja 307 melhorava memória fortemente devia prespectivas restantes expandir falha ablidade indivíduos vendido comercializa colocando chegam altíssimos admirado probabilidad tiverem reclamações acrescidos alcançado aparecer ajuda definia trabalhar potenciais rege apresentar apostassem superar gerar obtendo ocorrer destes satisfaz continuada materiais mair abaixo prejudicado vantagens venderem zeros promover poderem tipo reputação alargar tornando-se compram rendabilidad aperfeiçoam perpectiva nivel exigido aumente objectivos cria resumindo melhor melhoramen dispostos durante virtuoso maxima fidelizado voltada dizer dizia preferências coloca focadas essencialme professor rentibilidade encantalos entendiment perfeição original negativa modelo operacional exigencia setor normal aspectos detetar resume-se fator gostos grais diminuirão distingue direção divide preocupa-se visível utilize f«gera-se estabilidade diz-nos finais defende ultrapassan pormenor concretizar possibilidade compras comprir conseguindo passando excedem satisfeitos melhores criando desses maximizar investigação curto dinheiro planeament cliente/cons agrada traçados umidor aperfeiçoa deles conseguirem consequênci consigam 266 motivada operadores suma mínima aumentarmo aumentou empregar funcionamen aumentamos aumentamo contudo evidenciar inspecções levando continuo lucro/rendibil maio fazer divulgar podemos vontade acontece acima incide idade essêncialme anização produz empresa/org entende-se entra pdca oferecemos executar levar distinguir certificado propria estamos procediment definidos dentro sustentáveis opera oferta caminho exigente neste milha atualmente atua-se frente controla-se diferença destacar satisfaça saída manter expetativa planeia-se vendê-lo verifica faz-se acessíveis acabado produtivos terem competitivid cofres despesas deixar conformidad apontar empresariais consumidore consegue-se conseguem encantado permitem certeza superando negócios organizacion opta nfase obtida melhorias continuar primas visa matérias defeito quantidades adquirir unir rentavel querer apesar 316 minimixar momento baratas diminuem-se eficiencia eficaz margem medir grande houver decida principio principal utilizar zero adaptando reconhecime reclamação recolhendo receitas quebras provoca tornar tradu reformuland desempenho consumidor enquadrar permanecer paras pagara gera-se gestao cause significa superamos taxas talvez mias baseando evoluem emprego tendência gastou controvérsia controlos atinge-se estudo elementos linearmente interesse ligados lança vida existem proporcional introduzir humana estam utilizadores tentando facilmente ficaram focada zela adquirem trespassam produto/be transpõe ponto provocar rectificar agrade agrado espetativas traduzir comprar desejada esforços enquanto mpra organizar-se originando surpreender surgido necessitand motivação optaresm organiza gera-nos benefício caia superadas nisso aumentada correstivas baratas/co correctas avanço correr tecnológico tecnologias sobretudo situações objectivos/m funciona justo/diminui contínuos controla atender atingido evidencia estratégia etas efectivamen diminui efqm destruturad melhorada melhoras novas nova exterior fase investe-se liquidação linha contem dirige dito tenha pertende planeia certificada lucros lugar fidelizar-los existente proporciona acções impacto hoje declínio estabelecido chegando climax filosofias próprios amigo alta precisament progressos cinja provocando rentabilizar reconhecer ramos demmings descuidar de-obra definida espaços eram conseguinte consiga 246 parta originar partido gerir centrada busca bens subir tação taxa autossusten beneficia caro simultaneam método funcionar aumenta aumentam correcta elevada seguinte interessadas intermédias continuamen aspectos/se ctores eficácia responsávei experimenta intuíto contam apte estarem estejão estar direcção vantagem vejamos chefias lucratividade foco accionistas acabar importantes inicial estabelece prestígio procurar tirar providencias acrescenta ambiente agradem adote traduz-se ultrapassar precisa tragam completame conclui-se relaciona descer conduzir equilíbrio esforce consumir consome pensar mudar motor participam palavra papel gere certificação capital tardias stocks optimização oferece geram executado empregados sociais sintam observada evitar sentimento número insatisfação lideram justas justos cumprimento contínuas cumpriment armazens cumprido estiverem económico detentores desta maneira expansão externas externo iremos comércio fonte vistorias qualidade/r administrativ acabando dedica triunfar cobranças ciclo financeiros recolhe ptica agira desnecessár podiam condicionam compra reparações regalias deseja específicas erros empresarial conseguém endibilidade enfoque período partes padrão obtenha ocorrem elevá-la atendido atravez evidente interessados logística contempor determinado economia vende vimos ltima propõe indiretament influenciam influência estando prejuízo face alterações aleatório afectado altos problema cilidade reacção realiza rendi desfazer-se possa resolver especial escala consideravel passo subsistemas caracteristic causa stakeholders gerais soburdinado controlar assenta criar efetuar satisfatório explica liderar lógico juros junto linhas daca estava disposição diretos vendas pessoas verifiquem visão acentava acaba indivíduo/so grandes iniciando domínio principais fluxo alcançar ciedade circuito relacionada rentabiliz analisando desenvolveu trabalham trabalhava posição condições conseguimos aproveitand empresas constatar parâmetros parágrafo gerido capacidades capaz minimizar necessita optimizar baseia obtenção diminuem tendencia serem inserido ativa satisfaçam resumida inunciada getão direta preparada preocupa respeitados respeita chega lufa-se ltimos foram vital implementar importância indice inicio podendo-se prod/serv previstas termos tima chegou adquiridas projectos projeção cima requer rapidamente reduzindo renderem reduzido descurar espectativas concebidas concepção remete-nos remunera relevante energico constitui partida sujeita níveis ofereço basta atualidade dimensão destinado sectores rigorosa menores fornecedore inspecção lacunas crescimento contínuo atinja determinar mantém-se máquinas maiores fazem iriam iram durar plenamente ficava falar fiel aconteça produtivo prioridade tinha claro amostra repercutirem rendável conseguiram eros encantá-lo encantar periódicas superior exista minimizando minimizam baixos baseava eliminação mercados funcionário garantir fundos crédito estruturada evitando formulou fracos local estiver disponível devolvido lote investindo utilizando coisas ficando fabrica acessível progressiva terão timo chegue reconhecido proveniente angariando andar denominand deslocar trabalhado torna torne produzida produtor quotas concentrada conquistar apresentado envolventes percurso operário tarefas supera exactidão funções digamos gestores cutos vendermos prestado competitiva fácil alcance reflete apenas compra-lo concluir relativament consegue consideramo conta aproveitame parametros origem passar organizada casa obvio auditorias avaliar exclusiva tecnológica atrás difícil extende-se favorável formas fato inputs/outpu lançado leis cumprir estipuladas económica eamento presentes luta extrema accionista importancia indiretos decisão/plan dá-se próprio qualida ponderantes transmite tomada posso complement recebe referi am-se deixa espelho relações entrevenien constituinte entanto padrões sustentabilid surge casos obtidos gera justo assíduos criou-se criou diferenciand marketing maneiras formação falhar interpretada investigar inerentes gestor inputs duração dúvida pessoa vamos varia certificam certificar administra indica procuram tinha-se trazem financeira fizer quantidade qualificar designa torna-se posto reduzidos relacionar render equipa consistente 313 origina output satisfeito temos utilizadas depois 290 263devoluções pertençam originam passiveis multidimensi natureza operacionali onal centralizada benefícios campo centra talentos tarefa niveis autoridade aumentos avaliada exceder exemplo situação objectivand função controlada atribuição atenção efeitos difusas destas rigor melhorados menor institucionali internas levam continuação determinada dever vezes responsabili máxima matéria médio normalment fazendo inlfuencia duas prima competência chave fabricação focaliza volume zação qualidades qualifica adequada activos improvment igual defenda procura utilização políticas pontos classificados circulos reflectindo refere-se redução queixas denominado possibilitand traduzir-se possibilita complexo comprada relaciona-se relativamen aplicar desenvolve conferem aproximação caracteriza baixa contribuem meios explícitas aqui plena lucro demming 269 mente diminuindo divisão visto actividade equipament perdas organizar outputs passa modelos baseia-se emente sinónimo criação viço maioria havendo feedback físicas possíveis quota consequent enfase naturalment também aumenta-se controlamos efectuamos novo internacional viáveis vista investimento tenho feito referido agimos desperdício traduzam requisitos aplicamos aplicada específica confere aprendemos envolve entidade consoante pera superiores necessárias pagássemos beneficiar significado técnicas métodos serve mentar ganhos melhorar/au levavam deve-se directa dividas verificar versa vice falência acabaríamos abordagem grátis prejuízos utilizado coisa altamente alterar ideia utiliza repetitivo consumo entravamos enyre certificados afirmar desperdícios produto/ser definir autores souberem simples aumentando atribuídos seleccionam estender planear visa-se própria abertas produtividad agir esquecer questão quer-se especializa conjunto considerar importante entender 229 existe vai-se perceptível pega boas money gerando nunca controlo atractivo aspecto atraz destacam efectuar efeito retornar máximo extensível interpreta custo dade directament distinções pode value certificações factores vistas produtivas públicas ambientais acossiado universais politicas relacionado representa refletir razão aperceber denominada tornando-o aplica-o energéticos entrega chegar aplica pagar 231 fabrico competitivo reas devido valia longo qualificados estrutura eficiente novamente dois princípio explicitas humanos produzir departamen ampla totalidade então segundo actualmente processo negativame beneficio técnicos associados resumidame existindo acordo activa positivament conceitos pode-se usar 332cliente parte corresponde marca haver tiver trabalho portanto práticas nesta definição depende 341 capacidade autor recursos permitir prazo definido apresenta diferencia visando factor final positivo dessa implícitas sendo eficiência adequação deming conheciment 227 geral membros forma reativadiminuição baseada possível 255 excelência tendo estão preço necessário cadeia participação 274 251 247 265 associada 260sociedade sucesso prémios quer leva através permite 282 228existir 236 314 característic 338 aumento facto positiva trabalhador normas 304 317276 343 284 273 relação 315 278 valor conceito 296 294 253 291 224 320 240 237312 232 306 345 261 248 serviço 342 maior 271 329311 223 -5.0 rendibilidade produto 281 245 -10.0 -30 -20 -10 0 10 Figura 3.9.5.2. Biplot do Espaço Semântico correspondente a 85 dos textos dos dados GESTÃO. 147 clientes gestão empresa 277 5.0 produtos 321 270 326 298 264 337 340 333 300303 212 238 processos esforço 131 139 146 operações 175 250 152 158 163 226 141197 melhoria 222 299 expectativa 235 135 147 249traduz 188 286 280 172 209 206 165 satisfação base 185 198 203 225 243 filosofia 183 191 302 324 217 289 259 total 192 241 242 164 287 335 219 150 modo 153 202 230 211 182 contínua 196 328 207 poder 149 178 244 159 239 216 283 205 129 221 174 assim 176 179 160 148 252 186 concorrente 154 171 301288318 produção 180 181 236 189 168 satisfazer 161 136 mercado 218 268 187 custos344 201 continua 170 295 223 crescer qota confiança serviços 137 269 nível 195 143 elevado baixar melhorar setores 144 ento 319 conseguir sempre 145 ramo desenvolvim rentável tambem 134 negócio sejam basicamente rentabilidad 155 231 objetivo 200 começa 190 investir inovação atingir concorrência ficar reduzir logo objectivo 208 positivos venda funcionários 232 229 consiste preferência expetativas 258 293 316 256 330necessidade preços mantendo objetivos serão resultados imagem tenta 173 topo obter satisfazendo 130 rviços equilibrada prestados produtos/se intermediári tratando trar requisitado assegurand bens/serviço benéfico excederem exercendo merece fornecendo teorias segue servir alcançando aprefeiçoar atingindo melhorando defendem crescente dando cota irão obrigatoried próprias provar superar-se retirar diretamente empenho encontro escolha produzidos pressão diminuir devem aumentar leque ganhar 214 colaborador primeiro devemos gostam fica 254 deste empresas comercializa meio sistema teoria 266 140 constante 215 tenha dinheiro matérias novos tentar atividade 162 positivas primas caso forma apresentar além cresce nome disso agradar ultrapassad gerar toca reconhecida 323 pessoas vender desse informação importa desenvolver descreve grau apresentand apresente aplicação alteração estipulados evolução defeitos aberto reacções retorno operando partir adoptar adquir perceber entrar e/ou prespetiva restantes vantagens vendidos aumentava reputação benéfica chegam estabilidade melhorava medida serviços/pro 169 237 alcançado ablidade definia rege ente admirado pelna dutos constantem colocando deve melhores seja 307 ainda envolvente probabilidad modelo rendabilidad objectivos tipo operação podemos organizaçõe pretende detetar visível ultrapassan aspectos fator serem setor 151 negativa distinguir distingue divide conseguirem durante pormenor compras coloca vendas venderem traçados utilize zeros exigencia exigido lucros maximizar mair gostos grais satisfeito focadas criando defende cria promover obtendo resume-se 138 satisfaz tornando-se alargar operacional partida conseguindo encantalos poderem elevadas dizia compram concretizar comprir preferências preocupa-se professor destes virtuoso impacto voltada maxima rentibilidade fazer essencialme ganha abaixo fidelizado melhoramen ocorrer nivel resumindo suma perpectiva entendiment contrário prejudicado motivada aumentou finais funcionamen perfeição empregar diz-nos dizer produz procura aumente baratas fornecedore agrada acima preço anização materiais incide idade trabalhar essêncialme lucro/rendibil levando contudo operadores negócios empresa/org continuo entra verifica executar dentro grande alta definidos receitas propria normal opera saída pdca procediment introduzir motivação vida unir marca mínima mias humana traduz-se traduzir vontade apesar aumentarmo baseando existem evoluem linearmente desejada ligados rentavel terem aumentamos aumentamo 246 193 213 reconhecido oferecemos obtida gastou superior superando permanecer querer adquirir elementos eficácia esforços diferença vendê-lo despesas destacar caminho manter exigente levar frente forte cliente atualmente estar oferta satisfaça sustentáveis empresariais acessíveis organizacion quantidades conseguem cofres competitivid produtivos expetativa milha vantagem voltar excelência apontar factores faz-se custo defeito deixar reclamação 204 atua-se ramos nfase planeia-se permitem controla-se continuar opta encantado consegue-se consumidor conformidad principal principio diminuem-se investe-se mpra minimixar margem utilizar aperfeiçoam atender aumenta-se baratas/co caro desempenho lucro de-obra lugar remunera grandes apostar aumentada cinja justo/diminui melhoras medir reconhecer recolhendo propõe 290 263 espectativas tempo período reformuland provoca provocar enquadrar dirige planeia podem controla conseguinte organiza quebras consiga adaptando eficiencia interesse visão trabalha tradu zela amigo cause estabelecido estudo cumprir lança gera-se gestao atinge-se melhorada paras superar superamos tendência continuamen controvérsia agrade agrado operário talvez emprego enquanto consumidore condições produto/be interessados minimizar trespassam utilizadores transpõe avanço caia desfazer-se descuidar gera-nos houver ambiente altos chegando ciclo espetativas facilmente focada estam fase liquidação logística proporcional rectificar obtenha foco 167 atingido declínio provocando necessitand próprios padrão realiza pagara níveis tecnológico dispostos continuada controlos correr quota adquirem efectivamen elevá-la ponto completame climax especial espaços erros direcção intuíto intermédias responsávei interessadas autossusten exterior trabalham tragam zero apte centrada benefício chefias bens financeiros estabelece estratégia existente lucratividade demmings método rentabilizar novas nova gerir tirar filosofias estarem estejão definida reconhecime proporciona progressos mudar partes parta tecnologias superadas sobretudo correcta agradem providencias originando partido nisso surpreender surgido tação taxa dito contínuos consumir accionistas adote organizar-se optaresm elevada acrescenta eficaz consome produzir precisament precisa influenciam insatisfação inicial vejamos vistorias certificação certificados externas desnecessár reparações indiretament aspectos/se armazens beneficia evitar cumprimento cumpriment ctores linha geram gere seguinte simultaneam específicas dedica necessita observada oferece situações stocks correctas acabando acabar acaba ptica tardias endibilidade empresarial enfoque podiam correstivas contam administrativ acções optimização qualidade/r conseguém cobranças comprar comércio conduzir conclui-se eram detentores motor vende importantes triunfar capital externo face executado estiverem expansão maneira deseja baseia-se crescimento cumprido lideram justos recolhe fonte sentimento sintam alcançar justas participam palavra regalias papel sociais agira empregados pensar económico condicionam possibilidade possa influência termos estando iremos reduzindo número stakeholders direta relacionada vimos desta respeitados resolver respeita implementar indivíduo/so iniciando inserido inicio verifiquem analisando caracteristic baixa fabrico desenvolveu descurar indice trabalhava assenta aproveitand ciedade chegou baseia causa chega exceder financeira evidente fazem fluxo demming liderar lufa-se lógico ltimos linhas máximo relevante rentabiliz reduzido gestores gerido gerais foram aleatório aumentam atendido circuito 227 estava juros junto daca rapidamente parâmetros projectos projeção soburdinado satisfaçam satisfatório tendencia resumida disposição controlar acabado entender energico domínio contempor conseguimos adquiridas acentava optimizar passo constatar posição efetuar concebidas concepção preparada preocupa produtivo problema principais previstas prod/serv devolvido minimizando minimizam inspecções utilizando capaz fabrica mantém-se máquinas maioria repercutirem cilidade chegue atinja basta falar lacunas criar render rendi fracos gestor terão periódicas torne torna atravez claro ficando fiel ofereço disponível diretos encantá-lo encantar contínuo consideravel acessível aconteça economia coisas escala posso eros iram explica importancia utilizadas fizer maiores sectores ativa estamos iriam garantir conseguiram diminuem dimensão determinar investindo destinado inspecção inputs vendermos angariando andar deslocar marketing trabalhado aproveitame amostra baixos baseava fácil exactidão estiver exista denominand mercados local lote rendável funcionário formulou funções fundos tinha timo atualidade ficava crédito cutos 297 sujeita supera quotas rigorosa tarefas divulgar consideramo quantidade passar eliminação durar conquistar competitiva compra-lo progressiva produzida produtor processo determinado estruturada menores menor relativament proveniente taxas plenamente origem eficiente envolventes equipa concentrada prestado prioridade indiretos transmite formas satisfeitos apresentado estipuladas favorável espelho fato lançado dá-se leis reduzidos gera auditorias entanto entrevenien difícil extende-se inputs/outpu avaliar extrema indica casa evitando falhar formação torna-se tomada atrás 313 decisão/plan parametros relações próprio referi obvio tecnológica temos também qualida ponderantes económica eamento consegue constituinte presentes diferenciand digamos interpretada investigar trazem varia am-se exclusiva maneiras assíduos evidencia percurso alcance justo relacionar reflete origina sustentabilid duração contribuem consumo dúvida complement consistente procuram dever internas destas institucionali inlfuencia visto improvment volume zação atenção caracteriza centralizada aumentos fazendo desenvolve depois tinha-se aplicar melhor melhorados normalment objectivand reflectindo própria relativamen focaliza natureza niveis originam outputs output rigor pessoa continuação contínuas passiveis políticas competência concluir possibilitand possibilita determinada meios situação tarefa efeitos possível difusas viço explícitas responsabili utilização autoridade avaliada certeza campo fabricação matéria traduzir-se aproximação benefícios centra defenda levam médio redução tornar atribuição circulos multidimensi relaciona-se operacionali refere-se neste onal pertençam plena controlada queixas talentos duas conferem adequada qualidades complexo comprada compra activos posto prima diminuindo vista desperdícios igual chave denominado máxima feedback função perdas classificados consequent emente qualifica pontos produtividad investimento modelos vezes desperdício trabalho vai-se aqui físicas feito criação tenho enfase divisão actividade produto/ser verificar altamente leva mente sinónimo aumenta internacional viáveis requisitos traduzam depende aprendemos aplicamos aplicada referido abordagem naturalment controlamos agimos passa entidade conjunto confere efectuamos envolve consoante equipament específica exemplo novo segundo melhorias 224 afirmar organizar possíveis princípio directa vice utilizado utiliza versa repetitivo alterar melhorar/au definir mentar 255 conta pera métodos grátis beneficiar falência levavam ganhos significado serve pagássemos necessárias pagar superiores técnicas dividas acabaríamos entravamos efeito coisa enyre prejuízos importante ideia boas gerando estão parte diminuição diferencia interpreta money vistas extensível destacam universais value aperceber certificações autores departamen denominada representa havendo aspecto ambientais aplica-o factor significa directament perceptível tornando-o atractivo atraz relacionado refletir reas retornar distinções planear agir públicas energéticos politicas acossiado pega entrega produtivas nunca devoluções humanos competitivo vamos aplica chegar 240 dade efectuar valia cadeia explicitas aumentando estrutura razão controlo novamente deming dois actualmente ampla totalidade tiver 228 acordo práticas devido dessa haver sendo qualificados eficiência 341 nesta usar associados beneficio existindo definido reativa necessário resumidame técnicos negativame activa positivament portanto conceitos capacidade implícitas 282 então positivo definição autor existe pode 260 recursos deve-se apresenta 314 permitir final pode-se prémios 265 visando conheciment adequação 247 geral baseada membros 274 251 corresponde sucesso quer longo 332 315 sociedade participação prazo associada tendo através 338 permite aumento317 322 organização 292 327 0.0 característic existir normas 276trabalhador 304 facto conceito 278 284 343 296 273 positiva 291 valor 253relação 312 320 306 294 261 maior 248 serviço 342 345 271 produto 311 329 -5.0 281 rendibilidade -20 -10 0 10 Figura 3.9.5.3. Espaço Semântico de 77 textos de Gestão sobre o qual foram projetados os restantes (AT e T). A tabela seguinte – tabela 3.9.5.1. – apresenta os dados de validação dos resultados correspondentes aos parâmetros 0.75 para a proporção da amostra de testes (AT) e k= 5. 148 CL.SYS CL.PROF 54 50 38 20 55 50 57 50 54 50 35 50 35 25 58 60 52 60 28 0 34 15 25 0 57 50 41 40 33 40 54 60 43 40 31 40 50 60 50 50 32 30 66 75 60 40 58 40 59 50 Tabela 3.9.5.1. Validação do classificador para 0.75 da AT e k= 5 vizinhos a considerar no cálculo ClSys. Valores de ClSys comparados com os valores reais ClProf. Constata-se que, para estes valores experimentais – ver à frente a razão desta escolha – obtém-se um coeficiente de correlação (ClSys, ClProf) de 0.781 – largamente significativo. A figura 3.9.5.4. contém uma reta de regressão construída para este valor usando os valores dos pares (ClSys, ClProf), verificando-se uma qualidade (R2= 0.61) razoável para predizer ClProf em função de ClSys no contexto de uma avaliação contínua na sala de aula (não para atribuir uma nota com consequências administrativas). 149 CL.PROF 80 y = 1.1921x ‐ 13.467 R² = 0.6096 70 60 50 40 CL.PROF 30 Linear ( CL.PROF ) 20 10 0 0 20 40 60 80 Figura 3.9.5.4. Reta de regressão de ClProf em função de ClSys para os parâmetros (0.75, 5). Na tabela seguinte podem ver-se uma ANOVA destes valores, obtida com o SPSS. ANOVAb Model 1 Regression Sum of Squares 4934 1 Mean Square 4934 137,391 df Residual 3160 23 Total 8094 24 F 35,912 Sig. ,000a t -1,415 Sig. 0,17 5,993 0 a. Predictors: (Constant), Clsys b. Dependent Variable: ClProf Coefficientsa Unstandardized Coefficients Model 1 (Constant) Clsys B Std. Error -13,467 9,516 1,192 0,199 Standardized Coefficients Beta 0,781 a. Dependent Variable: ClProf Tabela 3.9.5.2. Árvore dos valores. 150 Face a estes resultados, convém ainda testar as hipóteses de que as duas séries de valores (ClSys e ClProf) vêm da mesma distribuição e se vêm de populações com a mesma média. A tabela 3.9.5.3. apresenta o resultado do teste de Kolmogorov-Smirnov para comparar duas amostras, concluindo-se que não há diferenças significativas (nível 0.01) entre as distribuições de origem de ClSys e ClProf. Test Statisticsa Most Extreme Differences Notas 0,253 Absolute Positive Negative 0,131 -0,253 0,894 Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) 0,4 a. Grouping Variable: Sys_Prof Tabela 3.9.5.3. Clsys e ClProf têm a mesma distribuição. Usando o método da ANOVA implementado no SPSS, constata-se que não há diferença significativa entre as médias das suas populações ClSys e ClProf ao nível de significância 0.01 – ver tabela 3.9.5.4. ANOVA Notas Between Groups Within Groups Sum of Squares 317,222 11508,458 Total 11825,68 df 1 48 Mean Square 317,222 239,76 F 1,323 Sig. 0,256 49 Tabela 3.9.5.4. Comparação de médias das duas amostras de valores ClSys e ClProf. Finalmente, a figura seguinte, obtida com EXCEL – figura 3.9.5.5. – parece sugerir que um modelo mais adequado para predizer os valores de ClProf conhecendo os de ClSys fornecidos pelo sistema implementado (PAET) é um modelo quadrático a que corresponde R2= 0.645 um pouco melhor. 151 CL.PROF 80 y = ‐0.0317x2 + 4.035x ‐ 72.73 70 R² = 0.6454 60 50 40 CL.PROF 30 Polinomial ( CL.PROF ) 20 10 0 0 20 40 60 80 Figura 3.9.5.5. Ajustamento dos dados (ClSys e ClProf) usando um modelo quadrático. A figura 3.9.5.6. contém os resultados das experiências conduzidas com estes dados variando o valor dos parâmetros (Percentagem para AT, Número de Vizinhos). Para cada par de valores é apresentado o coeficiente de correlação (ClSys, ClProf) para k= 1, 2, …, 8 e percentagem da AT= 50%, 60% e 70% constata-se que a melhor combinação (a que conduz ao máximo do coeficiente de correlação) é o par (75%, 8) com o coeficiente de correlação 0.78 objeto da análise anterior. Nessa mesma figura pode ver-se o gráfico dos valores mencionados, constatando-se que uma percentagm de 75% para a amostra de treino conduz, consequentemente, a valores mais elevados do coeficiente de correlação (ClSys, ClProf). k 1 2 3 4 5 6 7 8 50% 60% 0,211 0,381 0,433 0,529 0,585 0,563 0,624 0,662 0,301 0,572 0,438 0,511 0,536 0,550 0,592 0,567 75% 0,571 0,729 0,657 0,696 0,711 0,700 0,700 0,781 Figura 3.9.5.6. Obtém-se a correlação máxima r(Clsys,ClProf) para 75% e k= 8. Em síntese, esta experiência mostra que é possível obter classificadores utilizáveis no âmbito da avaliação contínua, usando a metodologia da LSA/Biplot e dados 152 exclusivamente ao alcance dos professores na sua atividade letiva – o que constitui evidência a favor de uma das questões fundamentais em investigação. 3.9.6. Estudo Comparativo das Classificações dos Professores. Os testes do conjunto EXMIN foram classificados segundo regras fixadas num protocolo publicado para cada um dos exames. Nesses protocolos são comuns regras a respeito de correção linguística (Sintaxe, Morfologia, Pontuação, Ortografia, Léxico), número mínimo de palavras, estruturação do texto, qualidade da fundamentação da resposta e outras. Os professores contratados são instruídos na aplicação destes protocolos sendo o objetivo garantir homogeneidade de critérios e variabilidade mínima imputável a erros ou desvios do corretor. Em última análise, o objetivo é o de que, para um exame específico, dirigido a uma população específica, os resultados, ainda que obtidos por corretores diferentes, tenham a mesma distribuição de resultados. Isto é, os resultados específicos atribuídos por um corretor específico devem ter características tais que, estatisticamente, não se distingam das distribuições dos outros corretores. Quando não é este o caso (distribuições diferentes) pode ser necessário proceder a operações como “test equating”, isto é, uma operação de homogeneização dos resultados que passe por converter certos resultados nos resultados equivalentes de uma distribuição comum. No caso presente, o resultado usado é o que aparece imputado pelo corretor – inscrito na prova produzida pelo estudante e, portanto, antes de qualquer eventual homogeneização. Uma vez que se ignora se esses resultados a que se teve acesso foram produzidos por um único corretor ou por vários, assume-se que foram produzidos por um único corretor fictício aqui designado por Ministério. De acordo com a literatura consultada (Landauer, Foltz, & Laham, 1998), em particular as classificações atribuídas pelos classificadores automáticos construídos segundo a metodologia da ASL assumem uma perspetiva holística para a classificação. De resto, inicialmente assumia-se que estes classificadores funcionavam com base no chamado modelo “bag of words” para vincar bem que o que contava eram simplesmente as 153 frequências de ocorrência das palavras nos textos, não importando a ordem de ocorrência nem os aspetos gramaticais. Contudo, a tendência atual é, sem alterar a natureza da ASL, a consideração de certos aspetos gramaticais relacionados com a ordem das palavras e a estrutura das frases, “inferidas” de modo experimental, guiados pelos dados (Kintisch, 2001; Dennis, 2005). Sendo o nosso trabalho baseado no modelo “bag of words” sentiu-se a necessidade de verificar em que medida os resultados de uma classificação holística realizada por professores que classificassem os textos já classificados segundo os protocolos de correção do Ministério diferiam dessas classificações. Estando, por razões económicas e de tempo, fora de causa contratar professores que reclassificassem todos os testes disponíveis, obteve-se a colaboração de um professor de Português do Ensino Secundário que, de forma totalmente graciosa, se dispôs a classificar, segundo este critério holístico, os testes do Ministério relativos a 60 respostas relativos à prova 639 de 2008. A tabela 3.9.6.1. a seguir apresentada contém não só as classificações do Ministério relativas às duas questões envolvendo o Memorial do Convento, como as classificações atribuídas, segundo o critério holístico, a esses mesmos textos pelo professor que connosco colaborou. Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Curso Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Ciências Sociais e Humanas Comunicação Ciências e Tecnologia Ciências e Tecnologia Ciências e Tecnologia Ciências Sócio‐Económicas Ciências Sociais e Humanas Ciências e Tecnologia Ciências e Tecnologia Num Conv 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 856 861 862 863 864 865 866 867 Fase 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª Cod Exam 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 A B Total A B Total Data Min Min Min HOL HOL HOL 22‐07‐2008 3,9 2 5,9 3 4 7 22‐07‐2008 3,6 1,7 5,3 3,5 4 7,5 22‐07‐2008 4,3 2,5 6,8 3 4 7 22‐07‐2008 3,7 2,8 6,5 2,5 4,5 7 22‐07‐2008 4,9 1,5 6,4 3,5 3,9 7,4 22‐07‐2008 4,3 1,9 6,2 4 5 9 22‐07‐2008 3,8 1,8 5,6 3 5 8 22‐07‐2008 4,4 1,8 6,2 2,5 4 6,5 22‐07‐2008 3,7 2,3 6 2,5 4 6,5 22‐07‐2008 3,5 2,1 5,6 2 4 6 22‐07‐2008 3,3 1,7 5 3 4 7 22‐07‐2008 5 1,2 6,2 4 4,7 8,7 22‐07‐2008 3,7 1,5 5,2 3 4 7 22‐07‐2008 3,4 1,6 5 2 3,7 5,7 22‐07‐2008 3,8 1,5 5,3 2,5 3,5 6 22‐07‐2008 2,6 0 2,6 3 0 3 22‐07‐2008 5,6 0,8 6,4 4,5 3,5 8 22‐07‐2008 4 1,7 5,7 3 3 6 22‐07‐2008 4,8 2 6,8 3 4 7 22‐07‐2008 4,5 0 4,5 3 0 3 22‐07‐2008 4,5 0,8 5,3 4 3 7 22‐07‐2008 5,7 1,9 7,6 3,5 4 7,5 22‐07‐2008 4,3 1 5,3 3,5 3 6,5 154 Nº 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 Curso Administração Ciências e Tecnologia Ensino Recorrente Ciências e Tecnologia Ciências e Tecnologia Administração Ciências e Tecnologia Ciências Sócio‐Económicas Ciências e Tecnologia Ciências e Tecnologia Artes Visuais ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Ciências Sócio e Humanas Ciências Prof. Comunicação Ciências e Tecnologia I ‐ Informática Ciências e Tecnologia Tecn. de Administração Ciências e Tecnologia 1 ‐ Científico‐Natural Agrupamento 1 / Geral Ciências Sociais e Humanas Ciências Sociais e Humanas Tecn. de Administração ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Ciências e Tecnologia Ciências Sociais e Humanas Ciências e Tecnologia Ciências e Tecnologia ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Ciências Sociais e Humanas Ciências e Tecnologia Ciências Socioeconómicas Ciências e Tecnologia Ciências e Tecnologia Ciências e Tecnologia Tecn. de Administração Ciências e Tecnologia Num Conv 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 Fase 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª 2.ª Cod Exam 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 639 Data 22‐07‐2008 22‐07‐2008 22‐07‐2008 22‐07‐2008 22‐07‐2008 22‐07‐2008 22‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 23‐07‐2008 (continuação) A B Total A B Total Min Min Min HOL HOL HOL 4,3 1,9 6,2 4 4 8 4,3 0,8 5,1 2,5 4 6,5 6,4 2,8 9,2 3 4 7 5,9 2 7,9 4 4 4,9 2,1 7 3,5 4 7,5 4,9 1,7 6,6 2,5 4 6,5 2,1 0,6 2,7 2 3 5 5 2,4 7,4 4,5 4,5 9 4,8 2,3 7,1 4 4 8 3 2 5 3 3 6 4,5 1,7 6,2 3,5 4 7,5 5,4 3 8,4 5 4,9 9,9 3,3 1,6 4,9 2 3,5 5,5 5,1 2,4 7,5 3,5 3,7 7,2 2,4 2,1 4,5 2 3 5 4,8 0,7 5,5 4 3 7 3,5 2,2 5,7 3 4 7 4,6 2,4 7 3,5 4 7,5 4 1,6 5,6 2,5 3 5,5 4,4 2,2 6,6 3 3 6 4,1 0 4,1 3 1 4 3,5 1,5 5 3,5 4 7,5 4,3 1,7 6 3,5 4 7,5 4,9 1,8 6,7 2,5 2,5 5 1,9 1,1 3 1,5 2,5 4 5,6 2 7,6 4,5 4,5 9 4,8 0,9 5,7 3,5 3,5 7 3,3 2,8 6,1 3,5 4,5 8 6 1,2 7,2 2,5 4,5 7 5,3 1,7 7 2 3 5 5,4 1,7 7,1 3 4 7 4,4 2,1 6,5 3 4 7 2,8 0,7 3,5 3,5 4 7,5 5,3 1,7 7 4 3 7 6,1 2,2 8,3 4 4 8 4,4 1,7 6,1 3 3,5 6,5 4,8 0 4,8 3,5 0 3,5 2 1,6 3,6 1 4 5 Tabela 3.9.6.1. Classificações do Ministério e classificações atribuídas segundo o critério holístico. Ao reclassificar os textos segundo um critério holístico, o professor referido ignorava a nota oficial do Ministério. Na tabela 3.9.6.2. apresenta-se o resumo estatístico dos resultados oficiais (MIN) e das classificações holísticas (HOL), obtido com o software SPSS v17. 155 Descriptive Statistics N A_Min B_Min Total_Min A_HOL B_HOL Total_Hol Valid N (listwise) Minimum Maximum 1,9 0 2,6 1 0 3 6,4 3 9,2 5 5 10 61 61 61 61 60 61 60 Mean 4,292 1,66 5,948 3,14 3,57 6,65 Std. Deviation 1,0159 0,7 1,3422 0,781 1,067 1,459 Tabela 3.9.6.2. Resumos estatísticos das classificações holísticas (HOL) e do Ministério (MIN). Como se pode verificar, as maiores diferenças a nível de médias observam-se em relação à B) que no caso das classificações tem um valor substancialmente inferior à nota holística. Vê-se que, neste caso, as duas médias A) e B) são da mesma ordem de grandeza ao passo que no caso do Ministério são substancialmente diferentes. Precisando estas comparações através de uma análise de variância para comparação de médias (em que os grupos MIN ou HOL são definidos por uma variável com dois valores 1 e 2) obtém-se a tabela 3.9.6.3. ANOVA A 1 Mean Square 40,509 98,491 120 0,821 139 121 110,262 1 110,262 96,547 119 0,811 206,809 120 11,588 1 11,588 Within Groups 256,933 120 2,141 Total 268,521 121 Between Groups Within Groups Total B Sum of Squares 40,509 Between Groups Within Groups Total Total Between Groups df F 49,355 Sig. 0 135,905 0 5,412 0,022 Tabela 3.9.6.3. Comparação de médias entre grupos MIN e HOL para as respostas à A), à B) e Total. Nesta tabela confirma-se a perceção captada pelas estatísticas descritivas da tabela 3.9.6.1. Isto é, a nível de médias obtidas com os dois métodos (MIN e HOL) verifica-se que as médias A), B) e Total) são significativamente distintas ao nível de significância 0.05, 156 sendo as médias obtidas com o segundo método (HOL) significativamente superiores no caso A) (4.3 > 3.1) e o contrário no caso B) (1.7 < 3.6). Uma outra questão é a de saber se seria possível predizer os resultados do MIN conhecendo os resultados da classificação holística. A tabela 3.9.6.4. contém as correlações entre as três variáveis relativas ao Ministério e as variáveis correspondentes, relativas à classificação holística. Verifica-se que existem correlações significativas entre os resultados obtidos pelo ministério e os obtidos pelo método holístico. Com efeito, r (A-MIN, A-HOL)= 0.577 (Significativo ao nível 0.01) r (B-MIN, B-HOL)= 0.696 (Significativo ao nível 0.01) r (Total-MIN, Total-HOL)= 0.562 (Significativo ao nível 0.01) Correlations A_Min A_Min Pearson Correlation 1 Sig. (2-tailed) N B_Min A_HOL 0,196 Sig. (2-tailed) 0,129 Pearson Correlation Sig. (2-tailed) N B_HOL Pearson Correlation Sig. (2-tailed) N Total_Min Pearson Correlation Sig. (2-tailed) N Total_Hol Pearson Correlation Sig. (2-tailed) N A_HOL ,577** 0,129 0 0,168 0 0,003 61 61 60 61 61 0,1 ** ** ,537** 61 Pearson Correlation N B_Min 0,196 1 61 61 B_HOL Total_Min 0,18 ,859** ,696 ,670 Total_Hol ,372** 0,444 0 0 0 61 60 61 61 0,181 ** ,620** 0,167 0 0 60 61 61 1 ** ,844** 0 0 ** 0,1 0 0,444 61 61 0,18 ** 0,181 0,168 0 0,167 60 60 60 60 60 60 ** ** ** ** 1 ,562** ,577 ,859 ,696 ,670 0 0 1 61 ,489 0 ,505 ,489 ,505 0 0 61 61 61 60 61 61 ,372** ,537** ,620** ,844** ,562** 1 0,003 0 0 0 0 61 61 61 60 61 61 **. Correlation is significant at the 0.01 level (2-tailed). Tabela 3.9.6.4. Correlações entre as classificações do ministério e holístico. No caso dos totais, a figura seguinte – figura 3.9.6.1. – mostra essa informação graficamente e responde à questão de saber se seria possível predizer os resultados do Ministério conhecendo os holísticos. A resposta é afirmativa mas com grandes erros, como mostra abaixa qualidade da regressão (R2= 0.32) da ordem de grandeza dos valores obtidos 157 ao tentar predizer as classificações do ministério usando as classificações do sistema implementado. Figura 3.9.6.1. A figura mostra que a reta de previsão dos resultados do ministério conhecendo os do método holístico tem fraca qualidade. Os gráficos para A) e B) são semelhantes. Finalmente, interessa responder à questão de saber se – sim ou não – se pode considerar que os resultados holísticos e do Ministério vêm da mesma distribuição populacional. A resposta a esta questão obtém-se realizando testes (não paramétricos) de Mann-Whitney e Kolmogorov-Smirnov, cujos resultados aparecem na tabela 3.9.6.5. 158 Test Statisticsa Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed) A B 683 2574 -6,052 0 241 2132 -8,288 0 Total 1323 3214 -2,759 0,006 a. Grouping Variable: Classif Test Statisticsa Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) A 0,557 B 0,884 Total 0,328 0 -0,557 3,078 0 0,884 0 4,86 0 0,328 -0,033 1,811 0,003 a. Grouping Variable: Classif Tabela 3.9.6.5. Os resultados dos testes mostram que as distribuições significativamente diferentes das distribuições (MIN). (HOL) são Como pode ver-se, há diferenças significativas nas distribuições populacionais dos resultados obtidos pelos dois métodos de classificação (holístico e segundo os critérios do Ministério). Em síntese, embora na experiência se usem os resultados de um só professor, pode concluir-se que os resultados obtidos pelo método holístico aplicado são substancialmente distintos dos obtidos pelo método do Ministério. Além disso, constata-se que, do ponto de vista da validade (dada pelas correlações) as correlações (ClSys, ClProf) e (ClHol, ClProf) são da mesma ordem de grandeza, especialmente quando consideramos os resultados obtidos pelos dados GESTÃO – ver 3.9.5. acima. Isto significa que os resultados obtidos com o método de classificação automática de textos de resposta aberta integrado no sistema PAET são encorajadores e apoiam a expetativa de futuros desenvolvimentos interessantes nesta direção. 159 Conclusão Na introdução a este trabalho foram estabelecidos os grandes objetivos, motivações e resultados a atingir. Foram aí também formuladas as grandes questões a investigar (I, II e III). Neste capítulo sintetizam-se os principais resultados e as respostas às questões formuladas. Em relação à Questão I (estado da investigação relativa à avaliação automática com base nos textos de resposta a questões abertas), constatou-se que os Estados Unidos, depois de uma experiência acumulada de décadas, preparam-se para generalizar a todo o território, o uso da avaliação automática até mesmo dos exames finais, com implicações para a vida dos estudantes. Estes desenvolvimentos e a investigação aplicada em que se baseou assentam em organismos independentes como o ETS (Educational Testing Service). Depois de naturais resistências iniciais por parte dos professores esta tecnologia tem agora uma aceitação generalizada pelo facto de esses instrumentos serem percebidos não como substitutos do professor mas como garantia de uma melhor qualidade do trabalho dos mesmos. Em relação à Questão II (identificação de problemas ligados à construção de sistemas automáticos de avaliação de conhecimentos), a nossa própria experiência mostrou que há que distinguir claramente entre a criação de sistemas que sejam capazes de produzir resultados indistinguíveis dos obtidos pelos classificadores humanos de exames sumativos nacionais (como sucede atualmente nos Estados Unidos) e sistemas capazes de produzir resultados úteis à atividade diária dos professores na sua atividade letiva diária, implicando conceber e avaliar resultados de testes formativos associados à avaliação contínua. Pela nossa própria experiência, ao conceber e implementar um sistema experimental deste tipo (ver Capítulos II e III, análise de dados) e depois ao analisar estatisticamente os seus resultados, concluiu-se que um sistema para os exames sumativos – especialmente os pensados para exames nacionais – têm de ter caraterísticas que incorporem critérios de avaliação que têm que ver com questões ligadas aos aspetos linguísticos (Sintaxe, Morfologia, Pontuação, Ortografia, Léxico), estrutura de texto, presença ou ausência de certas características que só podem ser incorporadas através da utilização de conceitos de inteligência artificial – para lá de exigirem depois a realização de 160 experiências com grande quantidade de dados, controladas segundo metodologias psicométricas. Isto significa que, embora a esmagadora maioria das técnicas e metodologias seja relativamente bem conhecidas, a sua implementação exige uma organização com largos recursos humanos, científicos e financeiros a nível nacional. Uma vez que a implementação dessa metodologia permite economizar depois recursos consideráveis ligados à administração do processo de exames, crê-se que é um problema a considerar na estruturação futura do Ministério de Educação. Já quanto à implementação de sistemas que apoiem o professor na elaboração e avaliação de questões de resposta aberta ligadas à avaliação contínua, constatou-se pela nossa própria experiência de elaboração de um protótipo de um sistema desse tipo (o PAET – Programa de Análise Estatística de Textos) que não só é realizável como é possível com recursos modestos, como os resultados experimentais apresentados em 3.9.6. sugerem. Isto é, é possível pensar em desenvolver sistemas deste tipo que não exijam mais recursos para funcionar do que aqueles que estão ao alcance dos professores na sua atividade letiva. É admissível que estes sistemas possam ser produzidos e testados por empresas privadas e que, para serem usados pelos professores dependam apenas de recursos ao seu alcance. Em relação à Questão III, os factos têm ultrapassado as expetativas, verificando-se a emergência recente, durante o tempo que durou a atividade investigadora que conduziu a esta tese, do desenvolvimento da atividade designada por EDM (Educational Data Mining) que poderíamos designar um Português por MDE – Mineração de Dados Educacionais – abrangendo o uso intenso das técnicas de análise estatística de textos e outros dados na extração de conhecimentos e tomada de decisão (por estudantes e professores) a partir do funcionamento das plataformas eletrónicas formas de ensino, sistemas administrativos e sistemas de investigação ligadas ao ensino. Considera-se, pois, que a elaboração desta tese e a correspondente investigação se encontra em completa sintonia com a realidade atual e tendências percetíveis. A atividade investigadora teve de ultrapassar algumas dificuldades. A principal das consistiu na ausência de apoios financeiros, obrigando o signatário a financiar do seu próprio bolso atividades como a recolha e o registo em suportes magnéticos de todos os textos envolvidos no projeto. 161 Com efeito, esta metodologia só é aplicável na prática se incidir em documentos facilmente acessíveis em suportes magnéticos – como é, felizmente, a tendência atual. Apesar dos progressos no OCR (Optical Character Recognition), está para já fora de questão usá-lo para as tarefas de transcrição de documentos manuscritos. As resistências encontradas conduziram à impossibilidade prática de aceder aos conteúdos e experiências baseadas em plataformas de e-learning e a ter de encarar a necessidade de pedir autorização ao Ministério de Educação para aceder a exames nacionais em papel e respetivas classificações, arquivadas nas escolas onde foram realizados. Houve, enseguida, a necessidade de fotocopiar todo esse material e manuais de ensino selecionados que tiveram de ser transcritos para suportes digitais. Todo este processo levou muitos meses e consumiu consideráveis recursos – com grandes inconvenientes e prejuízo do calendário inicial. Apesar de todo o esforço, a amostra com que foi possível trabalhar não permitiu conclusões isentas de alguma ambiguidade. Ver experiências descritas em 3.9.1. e 3.9.2. Em contraste, os textos relativos à formação contínua no contexto de um instituto politécnico disponibilizados pela Professora Florinda Matos, já tinham as imagens digitalizadas pelo que foi apenas necessário realizar a respetiva transcrição mediante um processador de texto para textos utilizáveis pelo programa desenvolvido. Considera-se como um dos principais resultados obtidos, o desenvolvimento do programa PAET que, servindo de protótipo para futuros desenvolvimentos, serviu também de banco de ensaios sobre o qual foram testadas ideias a ter em conta no futuro e com o qual se realizaram as experiências de análise multivariadas descritas no Capítulo III. Um outro resultado que se considera importante é o do estabelecimento da relação entre ASL e os biplots, sendo a exploração desta relação um instrumento importante da exploração dos dados experimentais usados nesta tese e em futuros sistemas a desenvolver. Com efeito, embora a literatura mostre que nas análises de textos das respostas a questões abertas seja necessário considerar e usar dimensões muito superiores às dimensões 1, 2, ou 3 onde é habitualmente possível visualizar a informação, o uso dos biplots para representar esta informação em baixa dimensão é um poderoso auxiliar de intuição e do raciocínio geométrico, suporte da intuição. Concluiu-se que o uso sistemático dessa dualidade é a chave no desenvolvimento futuro de sistemas operacionais “amigos do 162 utilizador” tanto mais que desenvolvimentos recentes relativos aos chamados biplots cilíndricos reforçam esta perspetiva (Vairinhos & Galindo, 2012). Tendo em conta o que precede, as conclusões desta investigação são as seguintes: 1. É possível e aconselhável o uso crescente de técnicas de mineração de textos em tarefas ligadas à atividade letiva tanto de professores como de estudantes no contexto, de uma avaliação formativa contínua. 2. É possível – com meios pouco dispendiosos, como foi demonstrado pelo protótipo desenvolvido – desenvolver instrumentos de apoio à atividade docente que torne possível o uso em grande escala de questões de resposta aberta, sem grande sobrecarga para os possíveis utilizadores. 3. É possível desenvolver sistemas desse tipo que façam uso apenas de recursos acessíveis à generalidade dos docentes. 4. O funcionamento de sistemas deste tipo só é possível quando os textos envolvidos (manuais e respostas) estão em suporte magnético e sob a forma de texto. 5. O desenvolvimento de sistemas do tipo SAAT para exames sumativos a nível nacional é uma tendência internacional mas exige infraestruturas de investigação e produção a nível do Ministério da Educação. 6. Foi desenvolvido um protótipo que permite servir de banco de ensaios às metodologias envolvidas no desenvolvimento de sistemas futuros de apoio à atividade de elaboração de testes baseados em questões abertas. 7. As análises de dados realizadas no sistema protótipo desenvolvido puseram em evidência questões teóricas e práticas a abordar em projetos futuros nesta direção. 163 Referências Bibliográficas Almond, R. G., Steinberg, L. S., & Mislevy, R. J. (2002). Enhancing the design and delivery of assessment systems: a four process architecture. Journal of Technology, Learning, and Assessment, 1(5). Retrieved from: http://www.itla.org. Alvares, R. V. (2005). Investigação do processo de Stemming na língua portuguesa. Dissertação de Mestrado. Niterói: Universidade Federal Fluminense. Amershi, S., & Conati, C. (2009). Combining Unsupervised and Supervised Machine Learning to Build User Models for Exploratory Learning Environments. Journal of Educational Data Mining, 1(1), 18-71. Anaya, A. R., & Boticário, J. G. (2011). Application of machine learning techniques to analyse student interactions and improve the collaboration process. Expert Systems with Applications, 38, 1171–1181. doi: 10.1016/j.eswa.2010.05.010 Antunes, C. (2010) Anticipating student’s failure as soon as possible. In Romero, Ventura, Pechenizkiy, & Baker, 353-363. APA – American Psychological Association (2003). Guidelines on multicultural education, training, research, practice, and organizational change for psychologists. American Psychologist, May 2003, 377-402. Retrieved from http://www.indigenouspsych.org//resources/guidelines(2003)%20apa.pdf. Arends, R. (2008). Aprender a ensinar. Lisboa: McGraw-Hill (7.ª ed.). Arias, R. M. (1996). Psicometría: teoria de los testes psicológicos y educativos. Sintesís Psicologia. Madrid: Síntesis. Arnold, K.E. (2010). Signals: Applying Academic Analytics. Educause Quarterly, 33(1). Arroyo, I., & Woolf, B. P. (2005). Inferring learning and attitudes from a Bayesian Network of log file data. Proceedings of the 12th International Conference on Artificial Intelligence and Education, 33-40. Attali, Y., & Bustein, J (2004). Automated essay scoring with E-rates v.2.0. Conference of International Association for Educational Assessment (IAEA). Philadelphia, PA., June 13 -18. 164 Baker, F. B. (1992). Item response theory, parameters estimation techniques. New York: Marcel Dekker, Inc. Baker, F. B., Ryan, S. J. D., & Yacef, K. (2009). The state of educational data mining in 2009: a review and future visions. 2nd International Conference on Educational Data Mining. Cordoba, Spain, July 1-3, 2009. Bejar, I. I. (2011). A validity-based approach to quality control and assurance of automated scoring, assessment in education. Principles, Policy & Practice, 18(3), 319-341. Bellegarda, J. R. (2007). Latent semantic mapping: principles & applications. Georgia, Atlanta: Morgan & Claypool Publishers. Benoit, G. (2002). Data Mining. Annual Review of Information Science and Technology, 6, 265-310. Benzécri, J. (1973). L’analyse dês données. Paris: Dunod. Bergner, Y., Dröschler, S., Kortmeyers, G., Rayyan, S., Seaton, D., & Pritchard, D. E. (2012). Model – Based collaborative filtering analysis of student response data: machine-learning item response theory. Proceeding of the 5th International Conference on Educational Data Mining, 87-94. Biletska, O., Biletskiy, Y., Li, H., & Vovk, R. (2010). A semantic approach to expert system for e-Assessment of credentials and competencies. Expert Systems with Applications, 37, 7003–7014. doi:10.1016/j.eswa.2010.03.018 Bloom, P. (2000). How children learn the meaning of words. Cambridge, MA: MIT. Bond, T. G., & Fox, C. M. (2007). Applying the rasch model. Fundamental measurement in the human sciences. Mahwah, New Jersey: Lawrence Erlebaum Associates (LEA). Botana, G. J., Léon, J. A., Olmos, R., & Escudero, I. (2010). Latent semantic analysis parameters for essay evaluation using small-scale corpora. Journal of Quantitative Linguistic, 17(1), 1-29. Bridgeman, B., Trapant, C., & Attalli, Y. (2012). Comparasion of human and machine scoring of essay’s: differences by gender, ethnicity and country. Applied Measurement in Education, 25(1), 27-40. Bruner, J. (1996). The culture of education. Cambridge, MA: Harvard University Press. 165 Burnstein, J. (2003). The E-rater scoring engine: automated essay scoring with natural language processing. In Shermis & J. Burnstein, 113-122. Cheng, S. L. (2008). Intelligent cognition-based systems approach to multiple criteria computerized essay assessment. System Research, 27(6), 680-696. Chodorow, M., & Burnstein, J. (2004). Beyond essay length: evaluating e-rater’s performance or TOEFL essays. ETS – Educational Testing Service Research Reports. Report Number: RR-04-04, TOEFL-RR-73. Chomsky, N. (1968). Language and mind. New York: Harcourt, Brace & World. Retrieved from http://www.chomsky.info/books.htm. Cizek, G. J., & Page, B. A. (2003). The concept of reliability in the context of automated essay scoring. In Shermis, & Burnstein, 125-146. Dennis, Simon (2005). A memory-based theory of verbal cognition. Cognitive Science, 29, 145-193. Dewey, J. (1916). Democracy and education. New York: Macmillan. Dikli, S. (2006). An overview of automated scoring of essays. The Journal of Technology, Learning and Assessment, 5(1). Retrieved from: //www.jtla.org D’Mello, S., & Graesses, A. (2010) Mining bodily patterns of affective experience during learning. Proceedings of the 3rd Educational Data Mining. Dolezal, S. E., Welsh, L. M., Pressley, M., & Vincent, M. M. (2003). How nine third-grade teachers motivate student academic engagement. Elementary School Journal, 103(3), 239-269. Duwairi, R. M. (2006). A framework for the computerized assessment of university student essay. Computers in Human Behavior, 22(3), 381-388. Ebel, R. L., & Frisbie, D. A. (1991). Essentials of educational measurement. New Delhi: Prentice-Hall. Eckart, C., & Young, G. (1936). The approximation of one matrix by another of lower rank. Psychometrika, 1(3), 212-218. Ercan, T. (2011). Benefits of semantic approach in the learning environment. Procedia Social and Behavioral Sciences, 28, 963 – 967. doi: 10.1016/j.sbspro.2011.11.177 166 ETS – Educational Testing Service (2013). Automated scoring of natural language. Retrieved from: http://www.ets.org/research/topics/as-nlp/ Executive Office of the President – President’s Council of Advisors on Science and Technology (2010). Report to the president and congress designing a digital future: Federally funded research and development in networking and information technology. Executive Office of the President of the United States. Fayyad, U. M. , Piatetsky-Shapiro, G., Smyth, P., & Uthurusamy R. (1996). Advances in knowledge discovery and data mining. California: MIT Press. Feldman, R., & Sanger, J. (2007). The text Mining handbook: advanced approaches in analyzing unstructured data. Cambridge: Cambridge University Press. Friedman, J. H., & Jacqueline, J. M. (2004). Clustering objects on subsets of attributes. Journal of the Royal Statistical Society. Series B (Statistical Methodology), 66(4), 815-849. Retrieved from: http://www.jstor.org/stable/3647651 Gabriel, K. R. (1971). The biplot graphie of matrices with application to principal component analysis. Biometrika, 58(3), 453-467. Galindo, M. P. (1985). Constribuiciones a la representación simultanea de datos multidimensionales. Tesis Doctoral. Universidad de Salamanca. He, Y., Hui, S. C., & Quan, T. T. (2009). Automatic summary assessment for intelligent tutoring systems. Computers and Education, 53, 890-899. Hill, S. L., Wang, Y., Riachi, I., Schurmann, F., & Markram, H. (2012). Statistical connectivity provides a sufficient foundation for specify functional connectivity in neo cortical neural microcircuits. PNAS, E2885-E2894. Islam, M. M., & Hoque, A. S. M. L. (2010). Automated essay scoring using generalized latent semantic analysis. Proceedings of the 15th International Conference of Computer and Information Technology (I CCIT 2010). Jorge-Botana, G., León, J. A., Olmos, R., & Escudero, I. (2010). Latent semantic analysis parameters for essay evaluation using small-scale corpora. Journal of Quantitattive Linguistics, 17(1), 1-29. Keeves, J. P. (1988). Educational research, methodology and measurement: An international handbook. Oxford, England: Pergamon Press. 167 Keith, T. Z. (2003). Validity of automated essay scoring systems. In Shermis, & Burmstein, 147-167. Kintsch, Walter (2001). Predication. Cognitive Science, 25, 173-202. Lam, Dullon, & Chang (2010). Towards the use of semi-structured annotators for automated essay grading. 4th IEEE International Conference on Digital Ecosystems and Technologies (IEEE DEST 2010). Landauer, T. K., & Dumais, S. T. (1997). A solution to Plato’s problem: The latent semantic analysis theory of acquisition, induction and representations of knowledge. Psychological Review, 104, 211-240. Landauer, T. K., Foltz, P. W., & Laham, D. (1998). An introduction to latent semantic analysis. Discourse Processes, 25, 259-284. Landauer, T. K., Foltz, P. W., & Laham, D. (2003). Automatic essay assessment. Assessment in Education, 10(3), 295-308. Landauer, T. K., McNamara, D. S., Dennis, S., & Kintsch, W. (2007). Handbook of latent semantic analysis. Mahwah, New Jersey: Lawrence Erlbaum Associates (LEA). Landauer, T. K. (2011). Pearson’s text complexity measure. White paper. Pearson. Retrieved from http://www.pearsonassessments.com/research. Lebart, T., Salem, A. Y., & Benny, L. (1998). Exploring textual data. Dordrecht: Kluwer Academic Publishers. Linden, W. J. (1997). Handbook of modern item response theory. New York. SpringerVerlag. Liu, O. L., Lee, H.-S., & Linn, M. C. (2011). An investigation of explanation multiplechoice items in science assessment. Educational Assessment, 16(3), 164-184. Longford, N. T. (1995). Models for uncertainty in educational testing. NY: SpringerVerlag. Louwerse, M. M., & Ventura, M. (2005). How children learn the meaning of words and how LSA does it (too). Journal of the Learning Sciences, 14(2), 301-309. Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., & Byers, A. H. (2011). Big Data: The next frontier for innovation, competition, and productivity. McKinsey Global Institute. Retrieved from: 168 http://www.mckinsey.com/insights/business-technology/big-data-the-next-frontierfor-innovation. Miller, M. D., Linn, R. L., & Gronlund, N. E. (2009). Measurement and assessment in teaching. NJ: Pearson. Mislevy, R. J. (1992). Linking educational assessments: concepts, issues, methods, and prospects. NY: Princeton. Mislevy, R. J., Almond, R. G., & Lukas, J. F. (2003). A brief introduction to evidence – centered design. ETS – Educational Testing Service. NJ: Princeton. Mislevy, R. J., Behrens, J. T., Dicerbo, K. E., & Levy, R. (2012). Design and discovery in educational assessment: evidence – centered design, psychometrics, and educational data mining. Journal of Educational Data Mining, Article 2, 4(1). Moretti, F. (2005). Graphs, Maps, Trees. London: Verso. Mu, J., Stegmann, K., Mayfiled, E., Rosé, C., & Fisher, F. (2012). The ACODEA framework: Developing segmentation and classification schemes for fully automatic analysis of online discussion. International Journal of Computer Supported Collaborative Learning, 7(2), 285-305. Retrieved from: doi: 10.1007/s 11412 – 012 – 9147 – y. Muñiz, H. (1996). Psicometría. Madrid: Editorial Universita, S. A. Newman, D. A., & Vermunt, J. K. (2011). Using mixed-measurement item response theory with covariates (MM-IRT-C) to ascertain observed and unobserved measurement equivalence. Organizational Research Methods, 14(1), 147-176. Oliveri, M. E., & Davier, M. (2011). Investigation of model fit and score scale comparability in international assessments. Psychological Test and Assessment Modeling, 53(3), 315-333. Orengo, V. M., & Huyck, C. (2001). A stemming algorithm for the portuguese language. IEEE String Processing and Information Retrieval. SPIRE 2001. IEEE Xplore Digital Library. Retrieved from: http://ieeexplore.ieee.org/xpe/. Osuna Marin, Z. (2006). Contribuciones al análisis de datos textuales. Tesis Doctoral. Universidad de Salamanca. 169 Page, E. B. (1994). Computer grading prose, using modern concepts and software. Journal of Educational Education, 62(2), 127-133. Pintrich, P. R., & Schunk, D. H. (2002). Motivation in education: Theory, research, and applications (2nd ed.). New York: Prentice-Hall. Porter, M. F. (1980). The Porter stemming algorithm. Retrieved from http://tartarus.org/martin/PorterStemmer/index-????.htlm. Powers, D. E., Burnstein, J. C., Chodorov, M., Fowles, M. E., & Kukich, K. (2001). Stumping E-rater: Challenging the validity of automated essay scoring. ETS – Educational Texting Service. Ranadivé, & Maney (2011). The two-second advantage. New York: Crown Business. Rauch, D. P., & Hartig, J. (2010). Multiple-choice versus open-ended response formats of reading test items: A two-dimensional IRT analysis. Psychological Test and Assessment Modeling, 52(4), 354-379. Ribeiro, L. C. (1989). Avaliação de Aprendizagens. Lisboa: Texto Editora. Rocha, G. G., & Coelho, J. M. A. (2009). Incorporação de um lematizador da língua portuguesa a um agente de recuperação de informação baseado em algoritmos genéticos. Campinas: Anais do XIV Encontro de Iniciação Científica da PVC. Romero, C., Ventura, S., Espejo, P. G., & Hevais, C. (2008). Data mining to classify students. Processings of the 1st International Conference on Educational Data Mining, Montreal, Quebec, June 20-21, 2008. Romero, C., Ventura, S., Pechenizkiy, M., & Baker, R. S. D. (2011). Handbook of educational data mining. New York: CRC Press. Rudner, L. M., & Gagne, P. (2001). An overview of three approaches to scoring written essays by computer. Practical Assessment Research & Evaluation. Rudner, L. M., & Liang, T (2002). Automated essay scoring using Bayes’s theorem. Journal of Technology, Learning and Assessment, 1(2). Retrieved from: http://www.jtla.org. Rudner, L. M., Garcia, V., & Welch, C. (2006). An evaluation of the Intellimetric TM essay scoring systems. The Journal of Technology, Learning and Assessment, 4(4). Retrieved from: http://www.jtla.org. 170 Rupp, A. A., Nugent, R., & Nelson, B. (2012). Evidence centered design for diagnostic assessment within digital educational data mining. Journal of Educational Data Mining, 4(1), 1-10. Salton, G., Wong, A., & Yang, C. S. (1975). A vector space model for automatic indexing. Communications of the ACM, 18(11), 613-620. SPSS (2007). SPSS statistics 17.0 algorithms. Chicago: SPAA Inc. Schaefer, W. D. (1991). Essencial assessment skills in professional education for teachers. Educational Measurement: Issues and Paractices, 10(1), 3-6. Shermis M. D., & Burstein, J. C (ed.) (2003). Automated essay scoring - a cross disciplinary perspective. Mahwah: Lawrence Erlbaum. Shmueli, G., & Koppins, O. (2011). Predictive analytics in information systems research. MIS Quartely, 35(3), 553-572. Stiggins, R. J. (2004). Student-involved assessment for learning (4th ed.). Englewood Cliffs, NJ: Prentice-Hall. Têng, Ssu-yu (1943). Chinese influence on the western examination system. Harvard Journal of Asiatic Studies, 7(4), 267-312. Retrieved from http://www.jstor.org/stable/2717830 Vairinhos, V. M. (2003). Desarollo de un sistema de numería de datos basado en los metodos biplot. Tesis Doctoral. Universidad de Salamanca. Vairinhos, V. M., & Galindo, M. P. (2012). Biplots cilíndricos. XIX Jornadas de Classificação e Análise de Dados, Instituto Politécnico de Tomar. Livro de Resumos, 132-137. Vygotsky, L. S. (1978). Mind in society. The development of higher psychological processes. Cambridge, MA: Harvard University Press. Vygotsky, L. S. (1994). The problem of environment. In Rene van der Veer & J. Valsiner (eds.), The Vygotsky reader. Cambridge, England: Blackwell. Vojac, Kline, Cope, McCarthy, & Kalantzis (2011). New spaces and old places: Na analysis of writing assessment software. Computers and Compositions, 28, 97-111. Wainer, H. (1990). Computerized adaptive testing. Mahwah, NJ: Lawrence Erlbaum. 171 Wanters, K. , Desment, P., & Noortgate, W. Van (2011). Acquaring item difficulty estimated: a collaborative effort of data and judgement. Proceddings os the 4th International Conference on Educational Data Mining, July 6-8, 2011. Williamson, D. M., Benmett, R. E., Bernstein, J., Foltz, P. W., Landauer, T. K., Rusin, D. P., Way, W. D., & Sweeney, K. (2010). Automated scoring for the assessment of common core standards. Educational Testing Service, Person Education, The College Board. Williamson, D. M., Xi, X., & Breyer, F. J. (2012). A framework for evaluation and uue of automated scoring. Educational Measurement: Issues and Practice, 31(1), 2-13. Winne, P.H., & Hadwin, A.F. (1998). Studying as self-regulated learning. In D.J. Hacker, J.E. Dunlosky, and A.C. Graesser (Eds.). Metacognition in Educational Theory and Practice, 277-304. Mahwah: Lawrence Erlbaum Associates. Winne, P.H. (2001). Self-regulated learning viewed from models of information processing. In B.J. Zimmerman and D.H. Schunk (Eds.). Self-regulated learning and academic achievement: Theoretical perspectives (2nd Ed.), 153-189. Mahwah: Lawrence Erlbaum Associates. Winne, P.H. (2011). A cognitive and metacognitive analysis of self-regulated learning. In B.J. Zimmerman and D.H. Schunk (Eds.). Handbook of Self-Regulation of Learning and Performance, 15-32. New York: Routledge. Yang, Y., Buckendahl, W., Juszkiewicz, P. J., & Bhola, D. (2012). A review of strategies for validating computer – automated scoring. Applied Measurement in Education, 15(4), 391 – 412. Yin, J. (2012). Using tree diagrams as an assessment tool in statistics education. Educational Assessment, 17(1), 22-49. Young, G., & Householder, A. S. (1938). Discussion of a set of points in terms of their mutual distances. Psychometrika, 3(1), 19-22. Zhang, M. (2013). Contrasting automated and human scoring of essays. Educational Testing Service. Retrieved from: www.ets.org. Zeller, R. A. (1998). Validity. Keeves, John P., 322-330. 172 Zengina, K., Esgia, N., Erginerb, E., & Aksoya, M. E. (2011). A sample study on applying data mining research techniques in educational science: developing a more meaning of data. Procedia Social and Behavioral Sciences, 15, 4028–4032. doi: 10.1016/j.sbspro.2011.04.408 173 Índice das Figuras Figura 1.4.3.1.Modelo estrutural sugerido (elaboração própria) pela estrutura do sistema PEG. O modelo estrutural – a tracejado – está indefinido. ..................................... 21 Figura 1.4.4.2.1.Representação geométrica das proximidades de palavras do texto, obtida com o SPSS. Neste caso, a dimensão de espaço é k= 1. ......................................... 28 Figura 1.4.4.3.1.Grafo correspondente à tabela 1.4.4.2.2. depois de ter eliminado os arcos correspondentes à frequências mais baixas. ............................................................ 31 Figura 1.4.4.3.2.Proximidades entre as palavras e os textos da tabela F através da análise SVD. A azul as palavras, a vermelho (linhas) os textos. ......................................... 34 Figura 1.4.6.1.Esquema de treino de um sistema de classificação automática de textos. ................................................................................................................................. 45 Figura 1.4.6.2.Pretende-se, neste caso, explicar a classificação h a atribuir (mediante o modelo) ao texto T em função das k= 3 distâncias (d1, d2, d3) desse texto aos 3 vizinhos mais próximos T1, T2, T3 aos quais os classificadores humanos atribuíram previamente as classificações h1, h2, h3. .................................................................. 46 Figura 2.2.1.1.Armazenamento da informação de base e construção de espaços semânticos a partir de textos produzidos pelos professores e manuais escolares relativos ao ensino de certas matérias. ........................................................................................ 57 Figura 2.2.1.2.Estrutura do sistema de avaliação de conhecimentos com base em textos de resposta a questões abertas. ..................................................................................... 58 Figura 2.2.3.1.Os vetores representam os textos R1, R2, R3 e os pontos ○ representam os cinco locais em que se sobrepõem as 33 palavras. Neste caso, r= min (n, p) = min (33, 3)= 3. ................................................................................................................ 67 Figura 2.2.3.2.Os textos R1, R2, R3 estão representados por vetores e as 33 palavras estão projetadas no plano E1, E2. Face à sobreposição de palavras com as mesmas coordenadas, o resultado é pouco legível. ............................................................... 67 Figura 2.2.3.3.A matriz C que se obtém empilhando as matrizes A e B contém os marcadores de palavras e textos no espaço de dimensão r. ..................................... 70 174 Figura 2.2.4.1.1.Ilustração do Método 1. Os cossenos dos ângulos entre textos a classificar (lado esquerdo) e a da amostra de treino (topo) estão no corpo da tabela............... 76 Figura 2.2.4.1.2.Biplot 3D correspondente ao Método 1. Na figura, T1, T2, …, T15 são textos e W1, W2, …, W27 são palavras do ES. .......................................................... 77 Figura 2.2.4.2.1.Os textos dos estudantes são representados pelos vetores (marcadores) t1, t2, …, t10. O texto da resposta do professor está representado pelo vetor Tp. A classificação do estudante t5 é função do cosseno do ângulo entre esse texto e o vetor Tp. ................................................................................................................... 80 Figura 3.2.1.Texto relativo ao estudante identificado pelo número convencional 0385, relativo ao Exame da Português do 12º ano, Curso Científico-Humanísticos, depois de transcritos a partir do original manuscrito. ......................................................... 88 Figura 3.3.1.Consulta de um texto de resposta de um estudante. No lado esquerdo os elementos que permitem identificar o texto. Do lado direito o texto. ..................... 90 Figura 3.3.2.Palavras funcionais, separadores e outros símbolos a excluir da análise. ...... 90 Figura 3.3.3.Exemplo de palavras funcionais, separadores e outros símbolos. .................. 91 Figura 3.5.1.1.Distribuição das classificações do professor na A). .................................... 96 Figura 3.5.1.2.Distribuição das classificações nos textos de resposta à B)......................... 96 Figura 3.5.1.3.Distribuição das classificações do professor nos textos de resposta ao G3. ................................................................................................................................. 97 Figura 3.5.1.4.Distribuição do número de palavras no texto para as respostas à A). ......... 97 Figura 3.5.1.5.Distribuição do número de palavras no texto para as respostas à B). .......... 98 Figura 3.5.1.6.Distribuição das classificações do professor nos textos de resposta ao G3. ................................................................................................................................. 98 Figura 3.5.1.7.Gráfico de dispersão ClassProf, NPalTexto para A). Deteta-se uma certa tendência crescente. ............................................................................................... 100 Figura 3.5.1.8.Gráfico de dispersão ClassProf, NPalTexto para B). Não há relação percetível. .............................................................................................................. 100 Figura 3.5.1.9.Gráfico de dispersão ClassProf, NPalTexto para o Grupo III. Tendência crescente. ............................................................................................................... 101 175 Figura 3.5.2.1.Histograma da classificações dos professores. .......................................... 102 Figura 3.5.2.2.Histograma dos comprimentos dos textos em número de caracteres. ....... 102 Figura 3.5.2.3.Gráfico de dispersão das classificações do professor em função do número de caracteres dos textos. Tendência crescente. ...................................................... 103 Figura 3.5.3.1.Histograma da distribuição do número de caracteres do texto (comprimento). ...................................................................................................... 104 Figura 3.6.1.Textos das respostas de dois estudantes à questão da caracterização do conceito de qualidade total. ................................................................................... 106 Figura 3.7.1.Biplot dos 10 textos produzidos por 10 estudantes identificados por C= {11, 14, 17, 20, 23, 26, 29, 32, 35, 38}. ........................................................................ 111 Figura 3.7.2.Texto do estudante 20 ao responder à A). ................................................... 113 Figura 3.7.3.Texto do estudante 32 ao responder à A). .................................................... 113 Figura 3.7.4.Cossenos (de valor superior a 0.4) entre os textos do conjunto {11, 14, 17, 20, 23, 26, 29, 32, 35 e 38} e as palavras usadas nesses textos. ................................. 114 Figura 3.7.5.Projeção da totalidade dos estudantes na direção do estudante 23, com a nota máxima entre os 10 estudantes do conjunto C= {11, 14, 17, 20, 23, 26, 29, 32, 35, 38}. ........................................................................................................................ 115 Figura 3.7.6.Biplot construído com os 60 textos de resposta à A) dos dados EX-MIN (prova 639/2ª fase, 2008)....................................................................................... 116 Figura 3.7.7.Cossenos (de valor superior a 0.4) entre as palavras e os 62 textos de resposta à A) calculados com uma dimensão d= 30 correspondente a 89% da informação total. ....................................................................................................................... 117 Figura 3.8.3.1.Dendograma dos textos GESTÃO. Escala de dissemelhança na parte superior da janela do lado direito. ......................................................................... 119 Figura 3.8.4.1.Resultado da análise de clusters dos textos da resposta à questão GI A) dos exames nacionais de Português 2008. ................................................................... 122 Figura 3.9.1.1.Organização dos dados para treinar um classificador automático. ............ 125 Figura 3.9.2.1.Uso do PAET para contagem de palavras dos 90 textos do ES usados para construir o ES. ....................................................................................................... 127 176 Figura 3.9.2.2.Biplot correspondente aos dois primeiros eixos do espaço semântico relativo a 90 textos e 5678 palavras envolvidos no ensino do Memorial do Convento de José Saramago, representando 27% da informação total. ............................................. 128 Figura 3.9.2.3.Espaço semântico retido para análise, baseado em 88 textos usados no ensino do Memorial do Convento de José Saramago. ........................................... 129 Figura 3.9.3.1.Biplot que permite visualizar nas duas primeiras dimensões, as projeções sobre o ES dos textos das amostras AT e T........................................................... 132 Figura 3.9.3.2.Nas duas primeiras colunas, comparação das notas atribuídas pelo sistema PAET (à esquerda) e as notas atribuídas pelos professores. ................................. 133 Figura 3.9.3.3.Regressão das classificações do professor em função das classificações do sistema. .................................................................................................................. 134 Figura 3.9.3.4.Gráfico de coeficiente de correlação (ClSys, ClProf) em função de k para vários valores da percentagem da AT. .................................................................. 136 Figura 3.9.4.1.Biplot correspondente aos textos das respostas às questões A) e B), relativas ao Memorial do Convento. .................................................................................... 137 Figura 3.9.4.2.Biplot construído com os dois primeiros eixos da decomposição de uma matriz abrangendo as respostas A), B) e GIII. ...................................................... 139 Figura 3.9.4.3.Biplot correspondente aos três primeiros eixos da análise envolvente GI A), B) e GII. ................................................................................................................. 140 Figura 3.9.4.4.Espaço semântico relativo ao Memorial do Convento de José Saramago e as projeções dos textos das 120 respostas à A) e à B). .............................................. 141 Figura 3.9.4.5.Amplificação de uma zona da figura 3.9.4.4. permitindo ver com maior nitidez as amostras de treino (vetores a negro) e amostra de teste (vetores a verde). ............................................................................................................................... 142 Figura 3.9.4.6.Resultados da classificação (usando o espaço semântico relativo ao Memorial do Convento) de 60 textos de resposta (relativos a A) e a B)). ............ 143 Figura 3.9.4.7.Significado da reta de regressão da figura 3.9.4.6. .................................... 144 Figura 3.9.5.1.Biplot correspondente às duas primeiras dimensões do espaço semântico construído com a totalidade das respostas de 187 estudantes a uma questão relativa à qualidade total..................................................................................................... 145 177 Figura 3.9.5.2.Biplot do Espaço Semântico correspondente a 85 dos textos dos dados GESTÃO. .............................................................................................................. 147 Figura 3.9.5.3.Espaço Semântico de 77 textos de Gestão sobre o qual foram projetados os restantes (AT e T). ................................................................................................. 148 Figura 3.9.5.4.Reta de regressão de ClProf em função de ClSys para os parâmetros (0.75, 5). ........................................................................................................................... 150 Figura 3.9.5.5.Ajustamento dos dados (ClSys e ClProf) usando um modelo quadrático. 152 Figura 3.9.5.6.Obtém-se a correlação máxima r(Clsys,ClProf) para 75% e k= 8. ............ 152 Figura 3.9.6.1.A figura mostra que a reta de previsão dos resultados do ministério conhecendo os do método holístico tem fraca qualidade. ..................................... 158 178 Índice das Tabelas Tabela 1.2.1.Avaliação formativa e sumativa (Arends, 2008). ........................................... 12 Tabela 1.4.4.2.1.Coocorrências das “palavras” wi, wj num texto. ....................................... 27 Tabela 1.4.4.2.2.Na tabela a parte triangular inferior contém as frequências absolutas e a superior as frequências relativas; o símbolo X significa ausência de informação. . 28 Tabela 1.4.4.3.1.Frequências de ocorrência das “palavras” w1 … w10 nos textos d1 … d4. 32 Tabela 1.4.4.3.2.Componentes da SVD da matriz F. .......................................................... 33 Tabela 2.2.2.1.Representação vetorial de um corpus formado pelos documentos D1, D2, … Dp e pelo vocabulário formado pelas formas F1, F2, …, Fn (Osuna, 2006). ........... 62 Tabela 2.2.2.2.Tabela de frequência correspondente aos textos do exemplo 2.2.2.1. ........ 64 Tabela 3.5.1.1.Distribuição da amostra. .............................................................................. 94 Tabela 3.5.1.2.Resumo das classificações do professor e do comprimentos dos textos de resposta à A). ........................................................................................................... 94 Tabela 3.5.1.3.Resumo das classificações do professor e do comprimentos dos textos de resposta à B). ........................................................................................................... 95 Tabela 3.5.1.4.Resumo das classificações do professor e do comprimento dos textos de resposta ao Grupo III. .............................................................................................. 95 Tabela 3.5.2.1.Caracterização das variáveis classificação do professor e número de palavras dos textos de resposta. ............................................................................. 101 Tabela 3.6.1.Frequências de ocorrência das palavras nos textos das duas respostas constantes da figura 3.6.1. ..................................................................................... 107 Tabela 3.6.2.As palavras dos textos das respostas dos estudantes 129 e 143 dispostas de forma a facilitar as comparações. .......................................................................... 109 Tabela 3.8.3.1.Tabela de contingência cruzando as classificações do professor com as classes do processo de análise de clusters (distancia euclidiana, critério de WARD). ............................................................................................................................... 120 179 Tabela 3.8.3.2Resultado do teste do qui-quadrado, obtido com o SPSS. ......................... 121 Tabela 3.8.3.3.Estatísticas da classificação dos professores correspondentes às classes obtidas por análise de clusters (obtida com o software SPSS). ............................. 121 Tabela 3.8.4.1.Tabela de contingência cruzando as classificações atribuídas pelos professores e as classes obtidas por análise de clusters......................................... 123 Tabela 3.9.3.1.Resultados obtidos pelo classificador automático da PAET (ClSys) e atribuídos pelos professores (ClProf). ................................................................... 134 Tabela 3.9.3.2.Coeficientes de Correlação (ClSys, ClProf) quando se varia k e a % de textos na amostra de treino. ................................................................................... 135 Tabela 3.9.5.1.Validação do classificador para 0.75 da AT e k= 5 vizinhos a considerar no cálculo ClSys. Valores de ClSys comparados com os valores reais ClProf.......... 149 Tabela 3.9.5.2.Árvore dos valores..................................................................................... 150 Tabela 3.9.5.3.Clsys e ClProf têm a mesma distribuição. ................................................. 151 Tabela 3.9.5.4.Comparação de médias das duas amostras de valores ClSys e ClProf. .... 151 Tabela 3.9.6.1.Classificações do Ministério e classificações atribuídas segundo o critério holístico. ................................................................................................................ 155 Tabela 3.9.6.2.Resumos estatísticos das classificações holísticas (HOL) e do Ministério (MIN)..................................................................................................................... 156 Tabela 3.9.6.3.Comparação de médias entre grupos MIN e HOL para as respostas à A), à B) e Total. .............................................................................................................. 156 Tabela 3.9.6.4.Correlações entre as classificações do ministério e holístico. ................... 157 Tabela 3.9.6.5.Os resultados dos testes mostram que as distribuições (HOL) são significativamente diferentes das distribuições (MIN).......................................... 159 180 ANEXO A MANUAL DO PROGRAMA DE ANÁLISE ESTATÍSTICA DE TEXTOS (PAET) 181 ÍNDICE 1. Introdução e Funções Principais do PAET. ............................................................... 183 2. Janela de Leitura e Análise de Textos. ....................................................................... 185 3. Construção e Estudo de Biplots. ................................................................................ 191 4. Janela para Relacionar Palavras e Textos. ................................................................. 194 5. Janela para Análises de Clusters. ............................................................................... 195 6. Janela de Classificação Automática de Textos de Resposta a Questões Abertas. ..... 198 7. Estrutura da Tabela para Guardar Textos em Tabelas ACCESS. .............................. 203 182 1. Introdução e Funções Principais do PAET. Este programa foi desenvolvido para apoiar, ilustrar e experimentar as ideias principais da tese de Luís Agonia Pereira (2013) no departamento de Ciências da Educação da Universidade Nova de Lisboa. O programa foi concebido para implementar as ideias desenvolvidas no Capítulo II (Metodologias) da tese em questão. As funções principais são: 1. Análise estatística de conjuntos de textos previamente escolhidos pelo utilizador; 2. Classificação automática de textos que sejam respostas a questões abertas relativas a temas de ensino caracterizados por um certo espaço semântico (ES) usando a metodologia do AS. Em relação às análises estatísticas, as funções básicas dessa análise são: 1.1. Construção das tabelas de frequências dos textos selecionados (Representação Vetorial dos Textos); 1.2. Construção de biplots usando a SVD da tabela de frequências; 1.3. Realização de análises cluster sobre os resultados da SVD da tabela de frequências. O programa assume que os textos (manuais de ensino, textos de respostas a questões abertas) estão organizados em tabelas do sistema de gestão de bases de dados ACESS integrante do Microsoft Office, segundo a estrutura que está definida no número 7 deste manual. Além das tabelas com os textos deve existir ainda uma tabela – exterior ao ACESS – contendo a lista de palavras funcionais. O programa é invocado a partir do sistema Windows através do ícone que se apresenta na figura 1.1. e que invoca a janela principal da figura 1.2. 183 Figura 1.1. Ícone de invocação do PAET. Figura 1.2. Janela principal do programa PAET. Pressionando a parte central desta janela é apresentada uma janela de leitura do nome do ficheiro “gramática” onde estão armazenadas as palavras funcionais que não devem ser consideradas na construção da tabela de frequências, sendo apresentada a janela seguinte – ver figura 1.3. 184 2. Janela de Leitura e Análise de Textos. Figura 2.1. Janela se seleção e análise de textos. Chega-se a esta janela depois de ter pressionado o ecrã de entrada (figura 1.2.) e indicada a posição do ficheiro designado “gramática” que guarda as palavras funcionais. FUNÇÕES – Escolher os textos a analisar, identificar todas as palavras em todos os textos escolhidos e suas frequências (excluindo as palavras funcionais contidas no ficheiro “gramática”), construir a representação vetorial dos textos (palavras × frequências), realizar a decomposição em valores e vetores singulares e construir biplots com as duas primeiras componentes da decomposição anterior. FUNÇÃO DOS BOTÕES Botão de escolha da base de dados (entensão “.mdb”) e, dentro da base de dados, escolha da tabela contendo os textos que interessa analisar. Veja figuras 2.2., 2.3., 2.4. 185 Figura 2.2. Escolha da base de dados contendo os textos a escolher (extensão “.mdb”). Figura 2.3. Dentro da base de dados escolha da tabela contendo os textos (classificador, neste caso). 186 Figura 2.4. Escolhida a tabela com os textos, estes aparecem identificados à esquerda e cada um dos textos apontados aparece na janela da direita. Botão de seleção de textos a analisar, dentro da tabela escolhida. Os textos podem ser escolhidos usando as teclas Shift , ou usando a tecla Ctrl e apontando os textos desejados. Caso não seja selecionado nenhum texto, quando se prime este botão aparece uma janela de diálogo de leitura do nome do ficheiro de texto onde estão os identificadores dos registos com os ficheiros selecionados. Com os textos selecionados calcula a tabela de frequências e apresenta-as. Veja a figura 2.5. Botão que prepara a análise: obtém a representação vetorial dos textos (palavras × textos) e calcula a decomposição em valores e vetores singulares, apresentando o resultado dessa decomposição. Apresenta também a matriz que é submetida a análise (Matriz para LSA) e que pode ser exportada para um ficheiro de texto e lida por ACESS, SPSS ou EXCEL. Veja figuras 2.6., 2.7., 2.8. 187 Figura 2.5. Frequências das palavras nos textos selecionados. Figura 2.6. Escolha da opção de transformação da matriz de frequências antes da decomposição SVD. 188 Figura 2.7. Resultado da SVD da matriz de frequências (valores singulares, variância acumulada 4 vetores singulares à esquerda e à direita). Figura 2.8. Matriz com as frequências × textos antes da decomposição SVD. 189 FUNÇÃO DOS BOTÕES Apresenta o biplot construído com os eixos horizontal (eixo 1) e vertical (eixo 2) que forem indicados. Ver figura 4.1. com a janela de apresentação e estudo de biplots. Ver à frente janela 3. Análise de clusters. Este botão realiza uma análise de cluster dos textos usando os resultados da decomposição em valores e vetores singulares da matriz de frequências. Ver janela 4. Invoca o SAAT integrado neste sistema. Classificar automaticamente textos de resposta a questões abertas que tenham sido selecionados usando como referência o espaço semântico corrente. Este espaço semântico resulta da decomposição em valores e vetores singulares corrente, com a qual são produzidos os biplots e as análises de clusters correntes. Veja janela 5. Guarda num ficheiro de texto os identificadores, na tabela em uso, dos textos que foram selecionados. Embora não seja obrigatório sugere-se que quando estes textos foram usados para construir um espaço semântico a usar numa futura sessão, se comece o nome do ficheiro por “ES”, como no exemplo seguinte: ES_ xxx.txt. Isto facilita muito a busca dos ficheiros deste tipo. Veja janela 5. Em síntese, a sequência habitual para utilização da janela 2 é: Escolher a base de dados e a tabela, selecionando textos. Examinar os textos selecionados ou lidos de um ficheiro quando nada foi selecionado. Decompor a matriz em valores e vetores singulares. Criar e estudar biplots com os resultados da decomposição. 190 Análise de clusters usando as coordenadas da SVD. Realizar uma classificação automática, ascendente hierárquica (aglomerativa) de textos a classificar, usando o ES corrente. Guardar num ficheiro de texto, os identificadores dos textos que foram selecionados para análise e que podem vir a ser usados numa futura sessão. 3. Construção e Estudo de Biplots. Figura 3.1. Janela para construção e estudo de biplots. Chega-se a esta janela pressionando na janela 1 o botão . FUNÇÕES – As funções principais a realizar, a partir desta janela, são as de preparar a estrutura de dados usada para a representação gráfica dos biplots e apresentar o 191 biplot do plano fatorial que for escolhido (escrevendo nas janelas do topo o número do eixo horizontal (eixo 1) e vertical (eixo 2) a usar nesse gráfico. As funções dos botões que integram esta janela (veja figura 3.1., segunda linha da esquerda para a direita): Este botão organiza os dados necessários à construção dos gráficos dos biplots. O resultado aparece na grade do lado esquerdo. Para cada palavra aparece o identificador da palavra seguida de um vetor de números que são as coordenadas no espaço semântico dessa palavra. Terminadas as palavras seguem-se os textos tendo cada texto o vetor de coordenada correspondente ao seu lado direito. O valor da coluna “Atributo” é “0” para as palavras e “1” para os textos. Botão de pintura do biplot escolhido. Depois de ter acionado o botão anterior, este apresenta o gráfico do biplot cujos eixos estão em eixo 1 e eixo 2. Ver figura 3.1., um exemplo. Este botão permite amplificar a escala. Depois de ter pressionado este botão, marcar com o rato um retângulo sobre o gráfico: “click, arrastar, soltar” o botão esquerdo do rato. O resultado é que a parte marcada do gráfico passa a ocupar agora todo o espaço visível da janela gráfica. Este botão permite realizar translações do gráfico. Depois de o pressionar, fazer “click” com o apontador e, mantendo o botão esquerdo pressionado, arrastar todo o gráfico. Este botão permite identificar todos os objetos (textos e palavras) que se encontram dentro de uma janela que foi marcada, passando a lista respetiva para uma grade (designada Grupos). Veja exemplo na figura 3.2. A sequência é: premir o botão esquerdo do rato, fazer “click” no canto superior esquerdo da janela que interessa, arrastar, largar. O resultado é uma lista como a que se apresenta na figura 3.2. Apresenta a última imagem, antes da última transformação. 192 Guarda no ficheiro que for designado – com formato “.BMP” – e passa para o clipboard a imagem do biplot, de onde pode ser copiada por “paste” para outra aplicação qualquer como o Word, Excel, etc. Estudar relações entre palavras e textos. Sequência típica. Carregar os dados do biplot. Eixo 1 e Eixo 2 – escolher os eixos do biplot a representar. Exemplo: (15, 18). Apresentar o gráfico do biplot definido pelos respetivos eixos. Usar os botões de expansão, translação, etc., para estudar o gráfico. Inspecionar uma certa zona do biplot e ver que textos e palavras a integram. Estudar relações entre palavras e textos. Figura 3.2. Lista de palavras e textos que estão numa janela marcada sobre o gráfico. 193 4. Janela para Relacionar Palavras e Textos. Figura 4.1. Janela para estudo de relações entre palavras e textos. Usando a coluna 3 da grade do lado esquerdo (1ª coluna das coordenadas dos textos e das palavras), podem marcar-se duas sequências quaisquer: (palavras, palavras), (palavras, textos), (textos, textos), usando um menu flutuante a que se tem acesso pressionando o botão direito do rato. Ver figura 4.1. Depois de marcar uma sequência, indicar se é A ou B. Feito isto pressionar o botão do canto superior esquerdo . Na grade do lado direito aparecem os cossenos de valor acima do limiar que estiver inscrito na caixa à direita da frase: “Mostrar Cossenos Superiores a:”. O valor por omissão é 0.75, mas pode ser indicado qualquer valor entre “-1” e “+1”. Deste modo, é possível saber que objetos estão mais relacionados entre si a um nível de semelhança superior ao limiar indicado. 194 Figura 4.2. Tendo marcado na grade do lado esquerdo (coluna 1) os textos e as palavras a relacionar, a grade da direita apresenta os cossenos dos respetivos ângulos. 5. Janela para Análises de Clusters. Figura 5.1. Janela de Análises Clusters. 195 Chega-se a esta janela através do botão . FUNÇÕES – Permite realizar classificação automática aglomerativa (ascendente hierárquica) de textos representados por coordenadas obtidas em resultado da decomposição em valores e vetores singulares da matriz de frequências. A função dos botões associada a esta janela é: Ao premir este botão – caso já tenha sido realizada a decomposição em valores singulares da matriz de frequências – aparece na janela gráfica do lado direito (veja figura 5.1.) uma árvore – deitada – que representa uma classificação ascendente hierárquica dos textos que estiverem selecionados. A escala indicada é o índice de dissemelhança. Os textos – identificados por números inteiros sequenciais dentro da seleção de textos – estão ao nível “0” e vão sendo agregados em classes cada vez menos homogéneas até que todos estejam agregados – neste caso, ao nível 28 numa única classe. Se clicar no botão direito do rato aparece um menu flutuante que permite, entre outras funções – refazer a árvore, translação (pam), zoom, copiar para o clipboard e guardar a imagem – e cortar (cut) a árvore ao nível em que posicionarmos o rato. Veja a figura 5.2. Quando se corta a árvore ao nível correspondente à posição do rato – veja figura 5.3. – o conteúdo de cada um dos ramos que existem a esse nível é mostrado na grade do lado esquerdo. Nessa grade aparece não só a identificação sequencial dos textos na seleção efetuada (1, 2, 3, …) como o identificador do texto na tabela da base de dados, a classe da arvore a que pertence o texto e a classificação atribuída pelo professor a esse texto – no caso de respostas a questões de resposta aberta. Este botão – canto superior esquerdo da figura – não só ordena os textos pela classe resultante da análise de clusters, juntando os textos da mesma classe – como exporta estes resultados para um ficheiro de texto a designar pelo utilizador. Veja figura 5.4.. este ficheiro de texto pode ser importado por 196 EXCEL, SPSS, ACCESS para ser estudado e usado por qualquer desses sistemas. Este botão não está ainda implementado na versão atual. Figura 5.2. Com o botão direito do rato tem acesso a um menu flutuante que permite inspecionar a árvore e cortá-la a um nível arbitrário. Figura 5.3. Corte da árvore ao nível 18 de dissemelhança. A árvore fica cortada em cinco ramos cujo conteúdo aparece na grade do lado esquerdo. 197 Figura 5.4. Guardar num ficheiro de texto do resultado da análise de clusters. 6. Janela de Classificação Automática de Textos de Resposta a Questões Abertas. Figura 6.1. Janela para classificação de textos de resposta a questões abertas. 198 Esta janela é invocada pelo botão na janela 2. FUNÇÕES – Este botão invoca o sistema automático de avaliação dos textos (SAAT) produzidos por estudantes em resposta a questões abertas, posicionando os textos escolhidos no espaço semântico corrente. As funções dos botões são as seguintes: Permite que o utilizador fixe os valores dos parâmetros seguintes: Método de Classificação (na versão atual apenas está disponível o Método 1). Percentagem de Variância. Permite escolher a percentagem de variância captada pelo espaço semântico a partir da tabela de frequências. Um valor muito elevado é contraproducente (introduz ruído). Um valor demasiado baixo não tem dimensionalidade suficiente. O valor por omissão é 85% que corresponde a uma dimensionalidade d próxima de (1/2)/p em que p é o número de textos. Percentagem da Amostra de Treino. Da amostra de textos selecionados para classificação, uma certa parte é reservada para o treino (AT) do classificador e o resto para testar o classificador (T). Número de vizinhos mis próximos. É o número (k) de vizinhos no ES de um certo teste que vão ser usados para definir o resultado a atribuir a um certo texto a classificar (k= 1, 2, …, 8). Escolha da base de dados e dentro desta a tabela onde se encontram os textos classificados por um professor a usar para amostra de treino (AT) e amostra de teste (T). Uma vez apresentados os textos, aqueles – distintos dos usados para definir o Espaço Semântico (ES) – são marcados com auxilio do rato (apontando os que interessam) e as teclas Shift (série contínua) ou Ctrl (marcar um a um). Veja figura 6.2. 199 Esta tecla lê os textos marcados e procede à contagem de palavras e suas frequências segundo um processo idêntico à função equivalente quando da seleção de textos para o ES. Ver figura 6.3. No caso de não terem sido marcados quaisquer textos, o programa pede ao utilizador que diga qual o ficheiro de texto onde estão identificados os textos a usar – e que foram guardados no final de uma sessão anterior de classificação. No final são apresentadas as frequências das palavras nestes textos para inspeção do utilizador. Veja figura 6.4. Treino do classificador e sua utilização para classificar a amostra de teste (T). Tendo em conta os parâmetros escolhidos (percentagem de variância, percentagem da AT, número de vizinhos mais próximos) o SAAT vai determinar os cossenos dos ângulos entre cada texto a classificar na amostra T e cada um dos textos na AT. Em seguida, considerando os k mais próximos (maiores cossenos) obtém-se uma classificação Clsys. O resultado aparece na figura 6.5. em que as colunas Clsys e ClProf têm os resultados atribuídos pelo sistema e as classificações atribuídas pelo professor à amostra de treino (AT) correspondentes à escolha de parâmetros correntes. A coluna “correlação” contém a correlação entre as notas atribuídas pela máquina (Clsys) e as notas atribuídas pelo professor à amostra de teste (T). Este botão grava os resultados num ficheiro de texto que pode ser lido por EXCEL, SPSS para estudo estatístico aprofundado. Permite gravar num ficheiro de texto os identificadores dos textos usados num certo estudo, para uso futuro. Sugere-se que o nome destes ficheiros comece por “T_” afim de facilitar futuras consultas. Exemplo: T_yyyy.txt 200 Figura 6.2. Apresentação das frequências dos textos escolhidos para a constituição da amostra de treino e de teste. Figura 6.3. Seleção manual dos textos a usar na AT e na amostra T. 201 Figura 6.4. Indicação do ficheiro de texto onde estão os identificadores dos textos a usar no treino. Figura 6.5. Resultados do classificador. 202 7. Estrutura da Tabela para Guardar Textos em Tabelas ACCESS. A ordem dos campos é importante. Outros campos podem ser adicionados depois de ClasProf. IDTEXTO – Number TEMA – Text (20) TITULO – Text (20) AUTOR – Text (20) DATA – Date/Time TIPTEXT – Text (10) PARTE – Text (10) SPARTE – Text (10) TEXTO – MEMO CLASPROF – Number 203