O corpus COMPARA
Ana Frankenberg-Garcia
ISLA, Lisboa
COMPARA
Corpus paralelo de português e inglês
Ana Frankenberg-Garcia & Diana Santos
Apoio inicial (1999-2000)
FCT (Portugal)
ISLA Lisboa
Oxford University Language Centre
Financiamento actual (2001-2004)
FCT/ POSI (POSI/PLP/43931/2001)
COMPARA
Traduções EN
Originais PT
estrutura
Traduções PT
Originais EN
COMPARA
português
inglês
originais
inglês
original
original
inglês
português
traduções
português
traduzido
traduzido
COMPARA 5.6 variantes
Reino Unido
Portugal
EUA
Moçambique
África do Sul
Brasil
Angola
PORTUGUÊS
INGLÊS
COMPARA
5.6
datas de publicação
2000
1997
1988
1914
1880
1837
COMPARA 5.6 gênero
Ficção
outros gêneros
publicada
EXTENSÍVEL
COMPARA 5.6 autores
Autores portugueses
Camilo Castelo Branco
Eça de Queirós
José Cardoso Pires
Jorge de Sena
Mário de Carvalho
Sá Carneiro
COMPARA 5.6 autores
Autores brasileiros
Aluísio Azevedo
Autran Dourado
Chico Buarque
José de Alencar
Machado de Assis
Manuel Antônio de Almeida
Marcos Rey
Patrícia Melo
Paulo Coelho
Rubem Fonseca
COMPARA 5.6 autores
Autores angolanos
José Eduardo Agualusa
Autores moçambicanos
Mia Couto
COMPARA 5.6 autores
Autores britânicos
David Lodge
Julian Barnes
Joseph Conrad
Joanna Trollope
Lewis Carrol
Oscar Wilde
COMPARA 5.6 autores
Autores norte-americanos
Henry James
Edgar Allan Poe
Richard Zimler
Autores sul-africanos
Nadine Gordimer
Qualquer texto serve?
• Só originais e traduções
publicadas
• Só inglês traduzido diretamente
para português e português
traduzido diretamente para
português
COMPARA 5.6
textos
49 traduções
46 originais (excertos)
COMPARA 5.6 extensão
973317 893150
palavras palavras
em
inglês
em
português
Maior corpus paralelo editado do mundo
COMPARA
Digitalização dos textos
1. Não preservamos numeração das
páginas, figuras, diagramas, colunas de
texto, etc.
2. Atualizamos a ortografia
3. Corrigimos erros tipográficos
4. Transformamos travessões em hífens duplos
5. Normalizamos as aspas
COMPARA
Digitalização dos textos
6. Preservamos notas de tradução
7. Preservamos partes grifadas dos
textos com etiquetas para:
títulos
palavras estrangeiras
nomes de entidades
palavras com ênfase
COMPARA
opções estruturais
Capítulos
Parágrafos
Análise da tradução de
frases completas
na língua de origem
COMPARA
alinhamento
1 unidade de alinhamento = 1 frase do texto original
Original
Fa
Fb
Tradução
F
F
F
F2
F
F
F½
Ø
F
Fc
F(+F)
Fa
Fc
Fb
COMPARA
alinhamento
Pesquisa automática de separação, junção,
omissão, adição e reordenação de frases
na tradução
Alinhamento de um original com mais de
uma tradução fica mais simples (e o
original só tem de ser processado uma vez)
Comparação indireta entre duas ou mais
traduções (original=denominador comum)
COMPARA acessibilidade
Acesso gratuito através
da Internet
Investigação e educação
COMPARA acesso
www.linguateca.pt/COMPARA/
Interface DISPARA
Concordâncias paralelas
pesquisa: “however” %c
Interface DISPARA
Distribuição das formas
pesquisa: “.*mente”
Distribuição das fontes
pesquisa: “eu” %c
Jorge de Sena
Sinais de Fogo
Distribuição em português
original e traduzido
pesquisa: “eu” %c
Distribuição combinada Pt - EN
pesquisa:“perguntou” e “asked”
Restrição de alinhamento
pesquisa: “perguntou” ≠ “asked”
Restrição de alinhamento
pesquisa: “asked” ≠ “pergunt.*” %c
Outras pesquisas
Outras pesquisas…
Alguns estudos
Universais da Tradução
Frankenberg-Garcia, A. (2004) "Are
translations longer than source texts? A
corpus-based study of explicitation ". Paper
presented at the Third International CULT
(Corpus Use and Learning to Translate)
Conference, Barcelona, 22-24 January
2004.
Alguns estudos
Ensino da tradução
Frankenberg-Garcia, A. (2002) "COMPARA,
language learning and translation training"
in B. Maia, J. Haller & Ulyrch (eds.)
Training the Language Service Provider for
the New Millennium. Porto: FLUP, pp 187198.
Alguns estudos
Lingüística contrastiva
Santos, Diana (2004) Contrasting English and
Portuguese tense and aspect systems.
Amsterdam/New York: Rodopi.
Santos, Diana (2002) "Med e com: um estudo
contrastivo português - norueguês", Actas do XV
congresso dos romanistas escandinavos.
Universidade de Oslo, Agosto de 2002.
Alguns estudos
Ensino de línguas
Frankenberg-Garcia, A. (forthcoming)
“Pedagogical Uses of Monolingual and
Parallel Concordances” ELT Journal, April
2005, 59/2.
Frankenberg-Garcia, A. (2004) “Lost in
Parallel Concordances”. In G. Aston, S.
Bernardini and D. Stewart (eds.) Corpora
and language learners. Amsterdam: John
Benjamins.
Download

A Construção (e alguns usos) do corpus Compara