linguística de corpus, terminologia e tradução

15
UGF – Profa. Ms. Simone Vieira Resende

Upload: bruno-garrido

Post on 24-Dec-2014

1.521 views

Category:

Documents


7 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Linguística de Corpus, Terminologia e Tradução

UGF – Profa. Ms. Simone Vieira Resende

Page 2: Linguística de Corpus, Terminologia e Tradução

Linguística de corpus (ou córpus) é uma área da Linguística que se ocupa da coleta e análise de corpus, que é um conjunto de dados linguísticos.

A LC surgiu com a necessidade que estudiosos da língua sentiram de se apoiar em usos reais para fazerem generalizações ou esboçarem teorias a respeito do funcionamento linguístico.

Atualmente, a LC está intimamente ligada ao uso do computador, visto que os corpora/córpora (plural de corpus) são eletrônicos.

O corpus deve ser constituído de dados autênticos (não inventados), legíveis por computador e representativos de uma língua ou variedade da língua da qual se deseja estudar.

Page 3: Linguística de Corpus, Terminologia e Tradução

As ferramentas computacionais mais comuns são:

Programas para listar palavras - fazem a contagem das palavras em um corpus;

Concordanciadores - programas que permitem que o usuário procure por palavras específicas em um corpus, fornecendo exaustivas listas para as ocorrências da palavra em contexto;

Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos) de ordem morfossintática, sintática, semântica oudiscursiva.

Page 4: Linguística de Corpus, Terminologia e Tradução

É fato que o fazer terminológico é laborioso, principalmente se dependermos da nossa atenção para observarmos a recorrência de certas combinações.

O que geralmente ocorre é que, ao notarmos uma combinação que já vimos antes, não nos lembramos de onde a vimos, e provavelmente não somos capazes de localizá-la novamente se quisermos, por exemplo, compilar uma lista de espressões consagradas ou montar um glossário.

Page 5: Linguística de Corpus, Terminologia e Tradução

Com o advento do computador, tornou-se possível construir grandes bancos de textos e consultá-los com ferramentas computacionais apropriadas para detectar essas ocorrências, co-ocorrências e recorrências.

A LC oferece uma metodologia que veio facilitar muito a identificação das unidades convencionais de uma língua, assim como os termos técnicos de uma área de especialidade.

Page 6: Linguística de Corpus, Terminologia e Tradução

Os corpus eletronicos nos permitem notar as ocorrências das unidades fixas.

Para a LC, um corpus é uma coletânea de textos

Um exemplo de aplicação: o Vocabulário para Culinária SBS (série 1001 Termos)

Glossário de Gastronomia da Disal

Page 7: Linguística de Corpus, Terminologia e Tradução

Slide baseado no item 2 da bibliografia comentada.

Corpara e Ensino de tradução Linguística de Corpus Exemplo do artigo: elaboração de um

glossário técnico com base em corpus.

Page 8: Linguística de Corpus, Terminologia e Tradução
Page 9: Linguística de Corpus, Terminologia e Tradução

Conhecer palavras da área de pesquisa: sementes.

Fazer uma limpeza do corpus. Fotos – figuras – tabelas

Page 10: Linguística de Corpus, Terminologia e Tradução

Corpus comparável: conteúdo similar nas duas línguas.

Número de palavras (texto jurídico) Número de textos

Page 11: Linguística de Corpus, Terminologia e Tradução

Extrair os termos, colocações e fraseologias. 3 etapas: Gera-se uma lista de palavras mais frequentes

no corpus. Compara-se com outra de um corpus mais

geral, ou seja, não específico do tema investigado, para identificar as palavras peculiares, essas seriam as candidatas.

Finalmente produzem-se as listas de concordância para validar as candidatas.

A frequência leva à identificação de padrões fraseológicos (colocações).

Page 12: Linguística de Corpus, Terminologia e Tradução
Page 13: Linguística de Corpus, Terminologia e Tradução

A identificação é feita pela observação dos termos e suas colocações.

Exemplo da pimenta / gol contra / fazer cera

A quinta e última etapa seria a compilação de um glossário.

Page 14: Linguística de Corpus, Terminologia e Tradução

Links sobre pesquisa com corpora. http://www2.lael.pucsp.br/corpora/ http://www2.lael.pucsp.br/corpora/bp/conc/ http://www2.lael.pucsp.br/corpora/bricle/ http://www.corpusdoportugues.org/

http://www.termium.com/ (Canadense) http://www.geterm.ufscar.br/ (blog sobre terminologia) http://www.geltra.ibilce.unesp.br/grupo.php (GELTRA) http://www6.ufrgs.br/termisul/ (UFRGS) http://www6.ufrgs.br/textquim/ (TextQuim) http://www.fflch.usp.br/citrat/citrat.htm (CITRAT) http://www.nilc.icmc.usp.br/nilc/tools/pagina-visualtca/visualtca/tca.htm# (VISUAL TCA frases) http://www.nilc.icmc.usp.br/nilc/index.html http://www2.lael.pucsp.br/corpora/index.htm http://corpus.byu.edu/bnc/ http://corpus.byu.edu/coca/ http://www.linguateca.pt/ http://www.linguateca.pt/COMPARA/ http://www.nilc.icmc.usp.br/nilc/tools/visuallihla/lihla.htm (VISUAL TCA - palavras) http://www.termcat.cat/es (Centro de Terminologia em Catalão) http://www.corpusdelespanol.org/ www.webcorp.org.uk http://davies-linguistics.byu.edu/ http://www.natcorp.ox.ac.uk/

Page 15: Linguística de Corpus, Terminologia e Tradução