Autor: António Manuel Rodrigues Lopes Data: 04/11/2013 Título Framework to editand use data fromfieldwork inlinguistic research Resumo O presente trabalho foi realizado no Centro Interdisciplinar de Documentação Linguística e Social, no âmbito do projeto “Framework to editand use data fromfieldwork in linguistic research”, que é um dos sub-projetos pertencentes ao CLARIN (CommonLanguageResourceandTechnologyInfrastructure) dentro do 7º Programa Quadro da UE (FP7). O objetivo do projeto consiste na construção de uma ponte entre os formatos de dados e ficheiros usados na documentação de línguas – especialmente ELANAnnotation-Format– e os formatos de dados usados em corpus linguísticos e em Processamento de Linguagem Natural, NLP (Natural LanguageProcessing), que hoje são armazenados em arquivos de línguas como o TheLanguageArchiveno Instituto Max Planck, situado em Nijmegen, Holanda. O projeto consiste no desenvolvimento de uma biblioteca que transforme os formatos de dados e ficheiros numa estrutura de dados unificados, seguindo uma implementação da ISO 24612 LAF (LinguisticAnnotation Framework).