controlo da qualidade linguÍstica e parÁfrases web. e... · controlo da qualidade linguística...

Download CONTROLO DA QUALIDADE LINGUÍSTICA E PARÁFRASES web. e... · Controlo da qualidade linguística –…

Post on 07-Nov-2018

213 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

  • CONTROLO DA QUALIDADE LINGUSTICA EPARFRASES

    -AJUDANTES DA TRADUO AUTOMTICA

    Anabela BarreiroAnabela BarreiroLINGUATECA/FCCN

    Aspectos do Processamento da Linguagem Natural em portugus

    Ferramentas e recursos existentes > investigao futura

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • Controlo da qualidade lingustica

    Ferramentas

    Parfrase

    Definio

    Funes

    Bases tericas

    CONTEDO DA SESSO

    Bases tericas

    Tipos

    Aplicaes (importncia em PLN e outras reas)

    Parfrases de construes com verbo suporte

    Sistemas e bases de conhecimento parafrstico adquirido a partir do

    lxico

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • CONTEDO DA SESSO Parfrases e traduo

    Traduo de construes com verbo suporte

    Uso e impacto de parfrases em TA

    Tese

    Objectivos

    Avaliao

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

    Avaliao

    Concluso

    Aplicao: ParaMT parafraseador para a TA

    TA com parfrases

    Referncias

  • Tcnicas de verificao da qualidade da documentao especializada

    Verificao ortogrfica, gramatical, estilstica e terminolgica dos

    documentos tcnicos

    Linguagem consistente, directa e simples

    Gramtica restrita (evita certos tipos de construes)

    CONTROLO DA QUALIDADE LINGUSTICA

    Gramtica restrita (evita certos tipos de construes)

    Evita raciocnios complexos, figuras de estilo, metforas, etc.

    Optimizao de texto

    Mtodos de parafraseamento

    Reduo de palavras

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • Tem sido utilizada essencialmente na escrita tcnica em manuais, guias de

    utilizao, textos para a traduo automtica, entre outros.

    Manuais com instrues em como operar maquinaria, automveis

    Guias de utilizao de aparelhos elctricos, programas informticos

    As tcnicas de controlo de qualidade lingustica so extensveis a:

    Relatrios mdicos

    CONTROLO DA QUALIDADE LINGUSTICA

    Sistemas de deteco e denncia de eventos adversos ou farmacovigilncia

    Artigos cientficos

    Gesto de contedos para empresas

    Gesto de contedos dos stios na internet

    Sistema de emisso de mensagens e aplicaes de dilogo imediato (SMS,

    messenger, e outros servios de tecnologia de comunicao)

    E mais

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • MULTIDOC - [Haller, 2000]

    KANT CE Checker [Mitamura and Nyberg, 2001]; [Mitamura et al., 2003]

    CLAT [Schmidt-Wigger, 1998]; [Haller, 2000]; [Reuther and Schmidt-Wigger, 2000]

    CLOUT - the Controlled Language Optimized for Machine Translation. [Uwe Muegge,2006] http://www.muegge.cc/controlled-language.htm

    Linguagem controladaAgilent Technologies English (Smartny, 2002), Attempto Controlled English (ACE) (Fuchs

    FERRAMENTAS E LINGUAGEM CONTROLADA

    Agilent Technologies English (Smartny, 2002), Attempto Controlled English (ACE) (Fuchs

    and Schwitter, 1996), Boeing Technical English (Wojcik, Holmback, and Hoard, 1998),

    Caterpillar Technical English (Kamprath, Adolphson, Mitamura, and Nyberg, 1998),

    Diebold Controlled English (Moore, 2000), Ericsson English (Ericsson, 2000), General

    Motors CASL (Means and Godden, 1996), Global English (Means, Chapman and Liu,

    2000), Kodak English (Kodak, 2000), Nortel Standard English (Smartny, 2002), Oc

    Technologies English (Smartny, 2002), Perkins PACE (Douglas and Hurst, 1996) and

    Xerox MCE (Xerox, 2001).

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • PARFRASES

    Riqueza lingustica = muitas formas de dizer a mesma coisa

    usando palavras, expresses ou frases diferentes

    Seres humanos - usam estratgias lingusticas diferentes para

    expressar conhecimento do mundo ou de situaes do mundo

    real (parfrases referenciais - relacionadas com factores scio-culturais)

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

    Expresses alternativas (sintaxe ) para expressar o mesmo

    significado (semntica =)

    Retm equivalncia conceptual aproximada [Barzilay, 2003]

    Parafraseamento - tcnica para articular uma ideia ou veicular

    informao de forma alternativa, facilitando a sua compreenso e

    e para tornar os textos mais valiosos para a sua audincia.

  • FUNES Explicar - definir determinado termo ou conceito inexistente num pas ou

    realidade scio-cultural diferente referncia

    Interpretar - parafrasear termos tcnicos ou conceitos/ideias complexas empalavras ou expresses mais simples de entender para um falante comum, no

    especialista e menos familiarizado com certas terminologias ou complexidade

    lingustica

    Clarificar - comunicar de forma mais clara melhorar a compreensibilidade

    Simplificar - ideias e conceitos usando uma gramtica mais fcil, eliminando

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

    Simplificar - ideias e conceitos usando uma gramtica mais fcil, eliminandorepeties e o que no acrescenta significado novo

    Encurtar - tornar um texto mais sucinto, conciso e menos palavroso

    Valorizar - enriquecer a frase ou texto sem o tornar mais complexo

    Mudar o estilo - estabelecer um estilo diferente, mais ou menos formal, mais oumenos directo, metafrico, consistente, uniforme, etc.

    Praticar a escrita - usado como exerccio pedaggico

    Traduzir transpor para outra lngua de forma a manter a fluncia nessa lngua

  • BASES LINGUSTICAS Gramtica Generativa Transformacional [Chomsky, 1957] - as cadeias de expresses lingusticas so

    consideradas estruturas superficiais que podem formar-se com a ajuda de um conjunto de regras de formao

    a partir de estruturas subjacentes. A cada estrutura profunda pode fazer-se corresponder depois uma classe

    de estruturas superficiais que so como que parfrases dela (ex: transformao activa-passiva).

    Teoria Sentido-Texto [Meluk, 1988, 1996, 2003] as construes com verbos suporte so descritas eformalizadas in termos de funes lexicais (ex: Magn(X) faz o mapeamento de uma palavra X em palavras que

    a intensifica - Magn(shave)=clean). As funes lexicais podem ser usadas como uma interlngua para

    facilitar a transferncia lexical em projectos de TA. [Milievi, 2007] estabelece uma tipologia de parfrases

    baseadas em regras lxico-sintcticas.

    FrameNet [Fillmore et al., 2002, 2003] records the information necessary for the representation of FrameNet [Fillmore et al., 2002, 2003] records the information necessary for the representation ofargument mapping relations between a support verb and a nominalization. Explanatory CombinatorialDictionary

    NomBank [Meyers et al., 2004b, 2004b] - maps syntactic positions in nominalizations to verbal argumentsand identify the allowed complements for a nominalization, relating the nominal complements to the

    arguments of the corresponding verb, including information about support verbs.

    Teoria do Lxico-Gramtica [M. Gross, 1975, 1981, 1996 e seguidores] quadro terico estabelecido nagramtica transformacional de Harris. A unidade bsica de anlise e descrio do significado a frase simples

    ou elementar (o predicado ou ncleo da frase e os seus argumentos obrigatrios). Os predicados podem ser

    nomes, adjectivos ou advbios. Por exemplo, os nomes predicativos seleccionam os seus argumentos e os

    verbos suporte. As transformaes so relaes no orientadas de equivalncia entre frases (parfrases).

    9Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • Lexical (sinnimo) versus sintctica

    Granularidade (ver exemplos de [Barzilay, 2003] para o ingls)

    Palavra

    apresentar/expr (um trabalho)

    O Joo comprou um carro/automvel

    Expresso

    TIPOS DE PARFRASE

    Expresso

    uma pintura a leo > uma pintura feita a leo

    dar apoio a > apoiar

    Frase

    O Joo deu um presente Maria > a Maria recebeu um presente do Joo

    O Joo abraou a Maria > a Maria foi abraada pelo Joo

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • Parfrases idiossincrticas versus parfrases produtivas

    Atmicas versus composicionais (regras composicionais representadas como

    rvores de dependncia parcialmente lexicalizadas ex: activa-passiva - SN1

    VB1 SN2 > SN2 foi VB1-ado por SN1)

    Efeitos de distoro do significado [Dras, 1999]

    Mudana de perspectiva

    Mudana de enfse

    TIPOS DE PARFRASE

    Mudana de enfse

    Mudana de relao

    Apagamento

    Movimento (deslocao) de estruturas

    Classificaes de dimenses mltiplas

    [Dras, 1999]

    [Fujita, 2005]

    [Boonthum, 2002]

    Escola de Vero - CLUPAnabela Barreiro Porto, 29 Junho 3 Julho 2009

  • APLICAES Resposta a pergunta importante na validao de respostas - indicam que vrias

    respostas equivalentes (mas no iguais) esto correctas - [Ibrahim et al., 2003], [Paca,

    2003], [Dubou & Chu-Carroll, 2006]

    Extraco de informao e prospeco de texto ajudam nas tarefas de categorizao detexto ou de mapeamento de textos com caractersticas semelhantes - [Ibrahim et al.,

    2003], [Shinyama et al., 2002] [Shinyama & Sekine, 2003], [Sekine, 2005] [Paca, 2005],

    [Paca & Dienes, 2005]

    Sumarizao permitem que informao em vrios documentos seja condensada e Sumarizao permitem que informao em vrios documentos seja condensada eajudam a melhorar a qualidade dos resumos - [McKeown et al., 2002], [Barzilay, 2001,

    2003], [Hirao et al., 200

Recommended

View more >