Raw text
Newspaper texts
Noun Modifiers
Noun Arguments
N<
N<ARGS
A decisão
A decisão do Grupo ficaria
difícil...
Scientific texts
Literary texts
Transcribed
spoken text
de ontem foi
elogiada...
N<ARGO
(...) para que reveja a sua
decisão de boicote aos bancos
Partitives – secondary tags
N<ARG
(...) a comer tangerinas e a
macular, com as cascas, os
montes de neve branca ao
longo das estradas,
Formato árvores deitadas
“Um monte de artistas vai querer
ver os concertos”, diz Ohtake.
“Um monte de artistas vai querer ver os
..bebia copos de água
gaseificada.
...bebia copos de água gaseificada <nppartitive1>
...metade dos leitores <np-partitive2>
CP460-12 A viatura em que seguiam era igualmente roubada.
A1
STA:fcl
=SUBJ:np
==>N:art('o' <artd> F S)
A
==H:n('viatura' <np-def> F S) viatura
==N<:fcl
===ADVL:pp
====H:prp('em') em
====P<:np
=====H:pron-indp('que' <rel> F S)
que
===P:vp
====MV:v-fin('seguir' <fs-rel> <no-subj> IMPF 3P IND) seguiam
=P:vp
==MV:v-fin('ser' IMPF 3S IND)
era
=SC:adjp
==>A:adv('igualmente' <quant>) igualmente
==H:v-pcp('roubar' F S) roubada
=.
concertos”, diz Ohtake. <np-dequant>
SEARCHABLES
Bosque
Newspaper text
Floresta Virgem
c. 190.000 word
Unrevised
newspaper texts
1.600.000 words
9.368 sentences
Formato árvores deitadas
CP460-12 A viatura em que seguiam era igualmente roubada.
A1
STA:fcl
=SUBJ:np
==>N:art('o' <artd> F S)
A
==H:n('viatura' <np-def> F S) viatura
==N<:fcl
===ADVL:pp
====H:prp('em') em
====P<:np
☻ np-dequant
☻ np-partitive1
☻ np-partitive2
☻ fs-conc
☻ fs-cause
☻ fs-conf
☻ fs-cond
☻ fs-cons
☻ fs-temp
☻ fs-fin
☻ fs-rel
☻ fs-subst
☻ passive
☻ se-passive
☻ rel
☻ no-subj
Selva
estruturas com quantificadores
partitivos com "não contáveis"
partitivos com "contáveis"
verbos de orações concessivas
verbos de orações causais
verbos de orações conformativas
verbos de orações condicionais
verbos de orações consecutivas
verbos de orações temporais
verbos de orações finais
verbos de orações relativas
verbos de orações substantivas
verbos de orações passivas
verbos de orações passivas com se
pronomes relativos
orações sem sujeito explícito
Literary, scientific and transcribed spoken text
C. 100.000 words by section
C. 27.000 sentences
Equally divided:
European and Brazilian Portuguese
Partially revised
transcribed
spoken text
scientific and
academic text
etc
literary text
Formato PennTreebank
TGrep2
•both compiles and searches the corpus
•allows searches for the relationship
between nodes (and not only their
position)
•uses a standard format (PennTreebank)
(STA:fcl (SUBJ:np (>N:art:o:F_S::artd: A)
(H:n:viatura:F_S: viatura)
(N<:fcl (ADVL:pp (H:prp:em:::: em)
(P<:np
(H:pronindp:que:F_S::rel: que)))
(P:vp (MV:vfin:seguir:IMPF_3P_IND::fs-rel: seguiam))))
(P:vp (MV:v-fin:ser:IMPF_3S_IND::: era))
(SC:adjp (>A:adv:igualmente:::quant: igualmente)
(H:v-pcp:roubar:F_S::: roubada))
(.))
Milhafre
Compiled
Corpus
QUERY: “Informação” is the subject of …
?
?
SEARCHES
By corpus
Floresta Virgem
Bosque
!
Selva
By variant
PT
BR
Concordance
By form
Add element
By lemma
By morphology
By function
By text
Não
SAdv
foram fornecidas
P
informações sobre o balanço destes confrontos
SUBJ
References
•
•
•
Eckhard Bick. The Parsing System "Palavras": Automatic Grammatical
Analysis of Portuguese in a Constraint Grammar Framework. 2000
Douglas Rohde. “TGrep2 User Manual: version 1.15”. 2005
Susana Afonso, Eckhard Bick, Renato Haber & Diana Santos.
"Floresta sintá(c)tica: a treebank for Portuguese" (LREC 2002)
Linguateca is financed by the Portuguese government and
the European Union through grant nº 339/1.3/C/NAC
Fcl
The SAdv, P and SUBJ
functions are in the same
node (and level).
The finite clause (Fcl)
contains the nodes SAdv, P
and SUBJ.
Download

FreitasRochaBickPROPOR08Poster