Belinda Maia Os Vikings? Os Croatos? Os Portugueses? Os Chineses? Cristoval Colon? E era espanhol, genovês ou português -------? Mas a nossa ‘história’ é Euro-cêntrica Latino-cêntrica? Euro-cêntrica? Anglo-cêntrica? Será possível establecer universais com bases nestes conceitos? Será possível criar terminologia linguística que oferece anotação aceitável em 1 língua? …. Ou para várias línguas? PoS - ‘Part-of-speech’ Análise morfosintá(c)tica Análise sintá(c)tica ‘Parsing’ Analíse semântica Análise do discurso Análise pragmática …….. Manual? ◦ Qual teoria? ◦ Qual nível? ◦ Quem tem ‘razão’? Automática? ◦ Possibilidades? ◦ Problemas? Semi-automática – ou automática + correcção Em inglês EN ◦ BNC ◦ CLAWS 5 ◦ CLAWS 6 Em Português PT ◦ ◦ ◦ ◦ Projecto AC/DC PALAVRAS Cintil REPENTINO EN Masculino / feminino = sexo > léxico PT Masculino / feminino = género > léxico + sintâxe EN Singular / plural PT Singular / plural + género NN0 Common noun, neutral for number (e.g. aircraft, data, committee) NN1 Singular common noun (e.g. pencil, goose, time, revelation) NN2 Plural common noun (e.g. pencils, geese, times, revelations) NP0 Proper noun (e.g. London, Michael, Mars, IBM) ND1 singular noun of direction (e.g. north, southeast) NN common noun, neutral for number (e.g. sheep, cod, headquarters) NN1 singular common noun (e.g. book, girl) NN2 plural common noun (e.g. books, girls) NNA following noun of title (e.g. M.A.) NNB preceding noun of title (e.g. Mr., Prof.) NNL1 singular locative noun (e.g. Island, Street) NNL2 plural locative noun (e.g. Islands, Streets) NNO numeral noun, neutral for number (e.g. dozen, hundred) NNO2 numeral noun, plural (e.g. hundreds, thousands) NNT1 temporal noun, singular (e.g. day, week, year) NNT2 temporal noun, plural (e.g. days, weeks, years) NNU unit of measurement, neutral for number (e.g. in, cc) NNU1 singular unit of measurement (e.g. inch, centimetre) BNC at BYU - BNC tagset Corpus de Português, BYU >> NN- ms nome masc livro sg fs nome fem casa sg mp nome masc livros pl fp nome fem casas pl NN-J- nome ou adjetivo católica NP nome (próprio) Brasil WORD CLASS TAGS N Nouns PROP Proper nouns (names) INFLECTION TAGS Gender: M (male), F (female), M/F [for: N', PROP', SPEC', DET, PERS, ADJ, V PCP, NUM] Number: S (singular), P (plural), S/P [for: N, PROP', SPEC', DET, PERS, ADJ, V PCP, V VFIN, INF, NUM] Case: NOM (nominative), ACC (accusative), DAT (dative), PIV (prepositive), ACC/DAT, NOM/PIV [for: PERS] Case: NOM (nominative), ACC (accusative), DAT (dative), PIV (prepositive), ACC/DAT, NOM/PIV [for: PERS] Pergunta: Casos = sintâxe ou semântica? Ver ficheiro SEMTAG Semantic tags = ???? Organização do léxico? Tesaurus? Ontologias? Será possível ‘traduzir’ Wordnet? VBB the "base forms" of the verb "BE" (except the infinitive), i.e. AM, ARE VBD past form of the verb "BE", i.e. WAS, WERE VBG -ing form of the verb "BE", i.e. BEING VBI infinitive of the verb "BE" VBN past participle of the verb "BE", i.e. BEEN VBZ -s form of the verb "BE", i.e. IS, 'S VDB base form of the verb "DO" (except the infinitive), i.e. VDD past form of the verb "DO", i.e. DID VDG -ing form of the verb "DO", i.e. DOING VDI infinitive of the verb "DO" VDN past participle of the verb "DO", i.e. DONE VDZ -s form of the verb "DO", i.e. DOES VHB base form of the verb "HAVE" (except the infinitive), i.e. HAVE VHD past tense form of the verb "HAVE", i.e. HAD, 'D VHG -ing form of the verb "HAVE", i.e. HAVING VHI infinitive of the verb "HAVE" VHN past participle of the verb "HAVE", i.e. HAD VHZ -s form of the verb "HAVE", i.e. HAS, 'S VM0 modal auxiliary verb (e.g. CAN, COULD, WILL, 'LL) VVB base form of lexical verb (except the infinitive) (e.g. TAKE, LIVE) VVD past tense form of lexical verb (e.g. TOOK, LIVED) VVG -ing form of lexical verb (e.g. TAKING, LIVING) VVI infinitive of lexical verb VVN past participle form of lex. verb (e.g. TAKEN, LIVED) VVZ -s form of lexical verb (e.g. TAKES, LIVES) PR_IND presente do indicativo INF infinitivo GER gerúndio IMPF_IND imperfeito do indicativo PCP particípio passado IMPF_SUBJ imperfeito do conjuntivo FUT_IND futuro do indicativo PR_SUBJ presente do conjuntivo FUT_SUBJ futuro do conjuntivo FUT_IND futuro do indicativo COND condicional MQP_IND mais que perfeito simples PS_IND perfeito do indicativo PS/MQP_IND perfeito ou mais que perfeito >> V C- condicional falaríamos F- futuro falaremos 1s terei 2s terás 3s terá 1p teremos 2p tereis 3p terão + tê-lo-ão G gerúndio falando I- pret. imperfeito falava 1s-3s + falava-se J- pretérito perfeito falou K- particípio passado falado M- pret. mais-que-perfeito falara P- presente fala R- infinitivo falar S- subjuntivo presente fale T- subjuntivo passado falasse U- subjuntivo futuro tiverem V- infinitivo pessoal fazermos Y- mandato (somente) vá Verbos auxiliares /modais Pronomes Possessivos Preposições – e sua semântica Sujeito nulo - sintâxe? Artigos – ou falta deles Determinadores Clíticos Pontuação Etc………. Boato ◦ Uma lista de PoS que sirva todas as línguas Debate ◦ ‘Normalização’ das classificações Alerta ◦ Todos os corpora / corpos que vamos ver foram feitos e etiquetados segundo diferentes: Conceitos Teorias Prioridades … ou falta dos mesmos Conclusões – não há Vamos abrir um debate construtivo…