Cristina Mota
Encontro do Segundo HAREM
Universidade de Aveiro, 7 de Setembro de 2008
Opções Adicionais de Anotação
 Motivação: durante o processo de anotação mostrou-
se necessário esclarecer dúvidas com o grupo propente
 Resultado: documentámos a resposta a essas dúvidas
Opções Adicionais de Anotação
TEMPO clássico
Extensão da entidade quando incluída numa expressão que toda ela
responde adequadamente a "(prep) quando?" ou "quando?"
<EM ID="ric-22961-209“ CATEG="TEMPO" TIPO="GENERICO" >nos tempos</EM> em
que São Paulo amanhecia mais surpreendente
Extensão da entidade quando a expressão é constituída por DATA e
HORA
nasceu
<EM ID=" hub-71248-191" CATEG="TEMPO" TIPO="TEMPO_CALEND“
SUBTIPO="HORA">aos 30 segundos</EM> <EM ID="hub-71248-192" CATEG="TEMPO"
TIPO="TEMPO_CALEND" SUBTIPO="DATA">de hoje</EM>
Classificação como GENERICO
situado <EM ID=" H2-dhy6432-141" CATEG="TEMPO" TIPO="GENERICO">nos dias de
hoje</EM> no Paquistão [*quando é que estava [Mehrgarh] situada no Paquistão? /
nos dias de hoje]
Opções Adicionais de Anotação
TEMPO clássico
Classificação como DURACAO
<EM ID="aa87333-155" CATEG="TEMPO" TIPO="DURACAO">durante um
período</EM> de férias
Classificação de expressões iniciadas por "há“
o CCB iniciava, <EM ID="Ntyr-78-400" CATEG="TEMPO" TIPO="TEMPO_CALEND"
SUBTIPO="DATA">há quinze anos</EM>, a sua actividade é um projeto que vem
sendo realizado <EM ID="bob-14949-607" CATEG="TEMPO" TIPO="DURACAO">há mais
de dois anos</EM>
Ausência de marcação
"bimestral" em "com periodicidade bimestral"
"mais uma vez" e "outra vez"
Opções Adicionais de Anotação
TEMPO estendido
Expressões compostas por data absoluta e data referencial
<EM ID="hub-18050-209" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA"
TEMPO_REF="TEXTUAL" SENTIDO="SIMULT" VAL_DELTA="">a 30 desse mês
</EM>
Expressões com valor de data sem nenhum dos campos ANO-MES-DIA
especificado
<EM ID="ric-54609-190" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA"
TEMPO_REF="ABSOLUTO" VAL_NORM="">nos anos 90</EM>
Opções Adicionais de Anotação
TEMPO estendido
Expressões com valor simultâneo
<EM ID="aa33715-460" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA"
TEMPO_REF="ENUNCIACAO" SENTIDO="SIMULT" VAL_DELTA="">este ano
</EM>
Preenchimento de VAL_DELTA e VAL_NORM na ausência total de
informação
<EM ID="aa94781-176" CATEG="TEMPO" TIPO =" DURACAO" VAL_NORM="">Há
anos</EM>
CD TEMPO (1)
DOCS:
30
Parágrafos:
304
Palavras:
12992
Entidades:
1508
Entidades vagas: 118 [21 classes]
Entidades TEMPO: 232 [15.38%]
Distribuição de categorias
CD TEMPO (2)
Classes de vagueza
Categorias associadas
às entidades
CD TEMPO (3)
Avaliação do TEMPO
N
1
1
1
)c _ certa   (1 
)t _ certo   (1 
) st _ certo
ncats
ntipos
nsubtipos
n 1
M
1
1
1
 
c _ espuria 
t _ espurio 
st _ espurio
ncats
ntipos
nsubtipos
n 1
1   (1 
  * tr_certo
  * s_certo
HAREM Clássico
TEMPO_REF
TEMPO estendido completo
SENTIDO
HAREM estendido sem normalização
  * vd_certo
VAL_DELTA
HAREM estendido só normalização
 * vn_certo VAL_NORM DURACAO

  * (E_certa+ A_certo+ D_certo+ H_certo+ M_certo+ ES_certa+ lim_certo
 * (H_certo+ M_certo+ lim_certo)
VAL_NORM DATA

VAL_NORM HORA
Participantes
Sistema
Cage2
TEMPO
Com Com
SENTIDO
TIPO SUBTIPO
TEMPO_
REF
Norm

DobrEM
PorTexTO



Priberam



REMBRANDT



REMMA


SeRELeP



XIP-L2F/Xerox




R3M
SEI-Geo



Resultados (1)
Resultados (2)
Comentários finais
 Algum grau de desadequamento em relação ao modelo
semântico do HAREM
 GENERICO, por exemplo, pode não ter valor temporal:
Dezembro tem 8 letras
 Avalição dos atributos estendidos combinada ou
separada da avaliação clássica?
 O processo de anotação podia ter beneficiado por ter
colaboração de um dos proponentes
Agradecimentos
 A Linguateca e o HAREM são financiados através do
contrato nº 339/1.3/C/NAC, financiado pelo governo
português e pela União Europeia, e executado pela
FCCN.
15
Download

MotaSegundoHAREM