Procura_PALavras (P_PAL): Um
software para avaliação de palavras do
Português Europeu
Ana Paula Soares, Montserrat Comesaña, José João Almeida, Alberto
Simões & Álvaro Sanroman Iriarte
Universidade do Minho
Conteúdos
O que é?
Para que serve?
Quem envolve?
O que implicará?
O que é?
• P-PAL (Procura - PALavras)
• Uma base lexical que contenha informações relevantes
(objectivas e subjectivas) sobre palavras do PE
• Uma ferramenta electrónica que suporte a base lexical, e que
disponibilize tais informações num formato user-friendly e
disponibilizado gratuitamente a partir de um web-site.
• Recurso com inúmeras aplicações
• Linguística
• Inteligência Artificial (Proces. de Linguagem Natural)
• Neurociências cognitivas…
O que é?
• Base lexical
• Repositório de informações sobre cada palavra de uma dada
língua….
•
•
•
frequência de uso da palavras
número de letras, fonemas, sílabas, pronunciação da palavra,...
distância semântica entre palavras, co-ocorrência de palavras,...
• Baseia-se na análise de amostras reais de produção linguística
(oral e escrita) das pessoas de um dado idioma (Corpora)
• Ferramenta de uso incontornável na investigação científica
actual nos mais variados campos (psicolinguística, linguística,
neurociências…)
Para que serve?
• Realização de estudos que utilizam palavras
como estímulos:
• Comportamentais
(TRs e % acerto)
• movimentos oculares
(Eye Tracker)
• medidas de neuroimagem
(ERP, fMRI)
O que é?
• Já disponível em várias línguas…
•MRC Psycholinguistic
Database
http://www.psych.rl.ac.uk
•LEXIQUE: A French Lexical
Database
http://www.lexique.org/
•CELEX: A Dutch lexical database
(CD-ROM)
•LEXESP:
Léxico informatizado del
español (CD-ROM)
O que é?
• Adaptação do software N-Watch (Davis, 2005)
O que é?
O que é?
• Adaptado para o Espanhol (B-PAL) e para o
Basco (E-Hitz)
• Na adaptação para o PE, o P-PAL permitirá:
• analisar listas de palavras previamente constituídas pelo
investigador nos índices psicolinguísticos considerados
relevantes para a investigação (ex. frequência, estrutura,
familiaridade, imaginabilidade, vizinhos
ortográficos/fonológicos…)
• obter listas de palavras de palavras que obedeçam aos
critérios psicolinguísticos previamente definidos pelo
investigador.
Quem envolve?
• Projecto claramente inter-disciplinar…
Ana Paula Soares
[email protected]
Montserrat Comesaña
[email protected]
Psicolinguística
Linguística
Álvaro Iriarte
[email protected]
PLN
José João Almeida
[email protected]
Alberto Simões
[email protected]
O que implicará?
• Contratação 3 bolseiros de investigação para
as 3 áreas
Psicolinguística
Linguística
PLN
O que implicará?
• Bolseiro para a Psicolinguística
• Habilitações: mestrado
• Duração: 1 ano (renovável a três)
• Pode funcionar como doutoramento
• Tarefas
• planeamento e condução dos estudos
normativos dos índices psicolinguísticos
subjectivos incluídos na base
• recolha de dados a nível nacional
• tratamento estatístico dos dados
O que implicará?
• Bolseiro para a Lexicografia
• Habilitações: licenciatura
• Duração: 1 ano
• Tarefas
• compilação e análise de vários corpora do PE
• definição das entradas lexicais para a base
• inserção semi-automática de informação
linguística base (a partir da qual outra será
calculada)
• verificação e correcção da base
O que implicará?
• Bolseiro para Proc. de Ling. Natural
• Habilitações: licenciatura
• Duração: 1 ano (renovável até três)
• Pode funcionar como dissertação de mestrado
• Tarefas
• compilação e análise de vários corpora do PE
• definição das entradas lexicais para a base
• desenvolvimento das aplicações para a computação
dos índices derivados da informação base
• construção do interface do software
• construção do web-site
Download

O que implicará? - Projecto Natura