Magali Sanches Duran [email protected]
Sandra Maria Aluísio [email protected]
NÚCLEO INTERINSTITUCIONAL DE LINGUÍSTICA COMPUTACIONAL (NILC) USP-ICMC – SÃO CARLOS
A QUEM PERTENCE A PREPOSIÇÃO?
Ele trabalha em publicidade.
Ele trabalha em segredo.
PRÓXIMAS ETAPAS:
Analisar listas
preposições.
obtidas
para
as
demais
RESULTADO ESPERADO:
DESAFIO
Distinguir os sintagmas preposicionados (PP=
Prepositional Phrases) que são complementos de
verbos dos que são adjuntos.
Ele trabalha em publicidade.
Ele trabalha em segredo.
PP: em publicidade
Complemento do verbo
Responde a pergunta: Trabalha em quê?
Papel semântico: TÓPICO
PP: em segredo
Adjunto Adverbial de Modo
Responde a pergunta: Trabalha
como?
Papel Semântico: ADJUNTO DE
MODO
FINALIDADE
1.Relação de verbos que admitem complemento
preposicionado com suas respectivas preposições
admitidas e papéis semânticos dos complementos.
Anotação automática de papéis semânticos no Projeto
PROPBANK-BR.
PORQUÊ
Quando o PP é complemento do verbo, é possível prédeterminar o papel semântico do PP na descrição dos
frames do verbo. Se o PP é uma multipalavra, também
é possível pré-determinar seu papel semântico.
INSTRUMENTOS E MÉTODOS
Corpus Utilizado: CetenFolha.
Ferramenta de busca: AC/DC
Expressões de busca:
Lista das preposições que introduzem PP após verbos:
1
VERBO
PREP
falar
falar
falar
falar
falar
dar
dar
decidir
reclamar
em
de
sobre
com
para
para
a
entre
de
PAPEL
SEMÂNTICO1
topic
topic
topic
actor
recipient
beneficiary
beneficiary
theme1 theme 2
topic
Papéis semânticos utilizados no projeto VerbNet.
2.Relação
de
preposições.
multipalavras
introduzidas
TRABALHOS FUTUROS
Subcategorização semântica das multipalavras
MULTIPALAVRA
PAPEL SEMÂNTICO2
Procura: [pos="V"]@ [pos="PRP"].
Distribuição de lema
em sigilo
modo
em dobro
quantidade
Lista de verbos, em ordem de frequência, seguidos de
PP (consulta repetida para cada preposição para
analisar regência)
Procura: @[pos="V"] [lema="em"] .
Distribuição de lema
Lista colocados, em ordem de frequência, após cada
preposição que segue um verbo (consulta repetida
para cada preposição para analisar multipalavras)
em decorrência de X
causa
em conjunto com X
companhia
em seguida
tempo
Procura: [pos="V"] [lema="em" & pos="PRP"]@[pos="N.*"].
Distribuição de lema
RESULTADOS PARCIAIS
Preposição
Ocorrências Lemas
V + Prep
V + Prep
em
de
por
a
com
para
sobre
até
entre
contra
sem
77727
71957
54376
51365
50397
44876
7031
6182
6145
3747
3237
2651
2514
2426
1635
2263
1891
710
858
794
435
708
Verbos
Multipalavras
Regidos
levantadas
pela
preposição
193
86
33
48
81
46
0
19
47
0
2
0
2
4
0
2
por
Projeto financiado pela
2Papéis
semânticos adjuntos usados no Projeto Propbank-Br
REFERÊNCIAS:
Acesso ao corpus http://www.linguateca.pt/cetenfolha/
Descrição do corpus: PINHEIRO, G. M. ; ALUÍSIO, S. M. (2003).
Córpus Nilc: descrição e análise crítica com vistas ao projeto LacioWeb. NILC-TR-03-03.
ACDC: Diana Santos & Eckhard Bick. "Providing Internet access to
Portuguese corpora: the AC/DC project". In Maria Gavrilidou,
George Carayannis, Stella Markantonatou, Stelios Piperidis &
Gregory Stainhauer (eds.), Proceedings of the Second International
Conference on Language Resources and Evaluation (LREC 2000)
(Athens,
31
May-2
June
2000),
pp.
205-210.
http://www.linguateca.pt/documentos/SantosBickLREC2000.pdf
Propbank-Br:
DURAN, Magali Sanches. Propbank.Br: Regras sintáticosemânticas para mapeamento de perguntas-respostas de verbos
do português e anotação de papéis semânticos em um corpus do
português do Brasil. Projeto de Pós-Doutorado.
Propbank: http://verbs.colorado.edu/~mpalmer/projects/ace.html
PALMER, M.; GILDEA D.; KINGSBURY, P. (2005) The Proposition
Bank: A Corpus Annotated with Semantic Roles, Computational
Linguistics Journal, 31:1.
VerbNet: http://verbs.colorado.edu/~mpalmer/projects/ace.html
FAPESP
Download

Duran_and_Aluisio