Autor: António Manuel Rodrigues Lopes
Data: 04/11/2013
Título
Framework to editand use data fromfieldwork inlinguistic research
Resumo
O presente trabalho foi realizado no Centro Interdisciplinar de Documentação Linguística e
Social, no âmbito do projeto “Framework to editand use data fromfieldwork in linguistic
research”,
que
é
um
dos
sub-projetos
pertencentes
ao
CLARIN
(CommonLanguageResourceandTechnologyInfrastructure) dentro do 7º Programa Quadro
da UE (FP7). O objetivo do projeto consiste na construção de uma ponte entre os formatos
de dados e ficheiros usados na documentação de línguas – especialmente ELANAnnotation-Format– e os formatos de dados usados em corpus linguísticos e em
Processamento de Linguagem Natural, NLP (Natural LanguageProcessing), que hoje são
armazenados em arquivos de línguas como o TheLanguageArchiveno Instituto Max Planck,
situado em Nijmegen, Holanda. O projeto consiste no desenvolvimento de uma biblioteca
que transforme os formatos de dados e ficheiros numa estrutura de dados unificados,
seguindo uma implementação da ISO 24612 LAF (LinguisticAnnotation Framework).
Download

O presente trabalho foi realizado no Centro Interdisciplinar de