Belinda Maia







Os Vikings?
Os Croatos?
Os Portugueses?
Os Chineses?
Cristoval Colon? E era espanhol, genovês ou
português
-------?
Mas a nossa ‘história’ é Euro-cêntrica






Latino-cêntrica?
Euro-cêntrica?
Anglo-cêntrica?
Será possível establecer universais com bases
nestes conceitos?
Será possível criar terminologia linguística
que oferece anotação aceitável em 1 língua?
…. Ou para várias línguas?








PoS - ‘Part-of-speech’
Análise morfosintá(c)tica
Análise sintá(c)tica
‘Parsing’
Analíse semântica
Análise do discurso
Análise pragmática
……..

Manual?
◦ Qual teoria?
◦ Qual nível?
◦ Quem tem ‘razão’?

Automática?
◦ Possibilidades?
◦ Problemas?

Semi-automática – ou automática +
correcção

Em inglês EN
◦ BNC
◦ CLAWS 5
◦ CLAWS 6

Em Português PT
◦
◦
◦
◦
Projecto AC/DC
PALAVRAS
Cintil
REPENTINO
EN
Masculino / feminino = sexo > léxico
PT
Masculino / feminino = género > léxico +
sintâxe
EN
Singular / plural
PT
Singular / plural + género








NN0
Common noun, neutral for number (e.g.
aircraft, data, committee)
NN1
Singular common noun (e.g. pencil, goose,
time, revelation)
NN2
Plural common noun (e.g. pencils, geese,
times, revelations)
NP0
Proper noun (e.g. London, Michael, Mars, IBM)














ND1 singular noun of direction (e.g. north, southeast)
NN common noun, neutral for number (e.g. sheep, cod,
headquarters)
NN1 singular common noun (e.g. book, girl)
NN2 plural common noun (e.g. books, girls)
NNA following noun of title (e.g. M.A.)
NNB preceding noun of title (e.g. Mr., Prof.)
NNL1 singular locative noun (e.g. Island, Street)
NNL2 plural locative noun (e.g. Islands, Streets)
NNO numeral noun, neutral for number (e.g. dozen, hundred)
NNO2 numeral noun, plural (e.g. hundreds, thousands)
NNT1 temporal noun, singular (e.g. day, week, year)
NNT2 temporal noun, plural (e.g. days, weeks, years)
NNU unit of measurement, neutral for number (e.g. in, cc)
NNU1 singular unit of measurement (e.g. inch, centimetre)
BNC at BYU - BNC tagset
Corpus de Português, BYU
>>
NN-
ms
nome masc livro
sg
fs
nome fem casa
sg
mp
nome masc livros
pl
fp
nome fem casas
pl
NN-J-
nome ou
adjetivo
católica
NP
nome
(próprio)
Brasil




WORD CLASS TAGS
N Nouns
PROP Proper nouns (names)
INFLECTION TAGS
Gender: M (male), F (female), M/F [for: N', PROP',
SPEC', DET, PERS, ADJ, V PCP, NUM]
Number: S (singular), P (plural), S/P [for: N,
PROP', SPEC', DET, PERS, ADJ, V PCP, V VFIN, INF,
NUM]
Case: NOM (nominative), ACC (accusative), DAT
(dative), PIV (prepositive), ACC/DAT, NOM/PIV
[for: PERS]



Case: NOM (nominative), ACC (accusative),
DAT (dative), PIV (prepositive), ACC/DAT,
NOM/PIV [for: PERS]
Pergunta:
Casos = sintâxe ou semântica?
 Ver
ficheiro

SEMTAG
Semantic tags = ????




Organização do léxico?
Tesaurus?
Ontologias?
Será possível ‘traduzir’ Wordnet?



















VBB the "base forms" of the verb "BE" (except the infinitive), i.e. AM, ARE
VBD past form of the verb "BE", i.e. WAS, WERE
VBG -ing form of the verb "BE", i.e. BEING
VBI infinitive of the verb "BE"
VBN past participle of the verb "BE", i.e. BEEN
VBZ -s form of the verb "BE", i.e. IS, 'S
VDB base form of the verb "DO" (except the infinitive), i.e.
VDD past form of the verb "DO", i.e. DID
VDG -ing form of the verb "DO", i.e. DOING
VDI infinitive of the verb "DO"
VDN past participle of the verb "DO", i.e. DONE
VDZ -s form of the verb "DO", i.e. DOES
VHB base form of the verb "HAVE" (except the infinitive), i.e. HAVE
VHD past tense form of the verb "HAVE", i.e. HAD, 'D
VHG -ing form of the verb "HAVE", i.e. HAVING
VHI infinitive of the verb "HAVE"
VHN past participle of the verb "HAVE", i.e. HAD
VHZ -s form of the verb "HAVE", i.e. HAS, 'S
VM0 modal auxiliary verb (e.g. CAN, COULD, WILL, 'LL)






VVB base form of lexical verb (except the infinitive)
(e.g. TAKE, LIVE)
VVD past tense form of lexical verb (e.g. TOOK,
LIVED)
VVG -ing form of lexical verb (e.g. TAKING, LIVING)
VVI infinitive of lexical verb
VVN past participle form of lex. verb (e.g. TAKEN,
LIVED)
VVZ -s form of lexical verb (e.g. TAKES, LIVES)














PR_IND presente do indicativo
INF infinitivo
GER gerúndio
IMPF_IND imperfeito do indicativo
PCP particípio passado
IMPF_SUBJ imperfeito do conjuntivo
FUT_IND futuro do indicativo
PR_SUBJ presente do conjuntivo
FUT_SUBJ futuro do conjuntivo
FUT_IND futuro do indicativo
COND condicional
MQP_IND mais que perfeito simples
PS_IND perfeito do indicativo
PS/MQP_IND perfeito ou mais que perfeito

>>
V
C-
condicional
falaríamos
F-
futuro
falaremos
1s
terei
2s
terás
3s
terá
1p
teremos
2p
tereis
3p
terão
+
tê-lo-ão
G
gerúndio
falando
I-
pret. imperfeito
falava
1s-3s
+
falava-se
J-
pretérito perfeito
falou
K-
particípio passado
falado
M-
pret. mais-que-perfeito falara
P-
presente
fala
R-
infinitivo
falar
S-
subjuntivo presente
fale
T-
subjuntivo passado
falasse
U-
subjuntivo futuro
tiverem
V-
infinitivo pessoal
fazermos
Y-
mandato (somente)
vá










Verbos auxiliares /modais
Pronomes
Possessivos
Preposições – e sua semântica
Sujeito nulo - sintâxe?
Artigos – ou falta deles
Determinadores
Clíticos
Pontuação
Etc……….

Boato
◦ Uma lista de PoS que sirva todas as línguas

Debate
◦ ‘Normalização’ das classificações

Alerta
◦ Todos os corpora / corpos que vamos ver foram
feitos e etiquetados segundo diferentes:




Conceitos
Teorias
Prioridades
… ou falta dos mesmos

Conclusões – não há

Vamos abrir um debate construtivo…
Download

Anotação multilingue