josé ramom campos - opentrad

34
Pruebe el sistema en: http://opentrad.imaxin.com traducción automática una realidad Opentrad plataforma de traducción automática

Upload: i-conferencia-internacional-de-traducao-e-tecnologia

Post on 11-Jun-2015

161 views

Category:

Technology


3 download

DESCRIPTION

Apresentação do Dr. José Ramom Pichel Campos na I Conferência Internacional de Tradução e Tecnologia, 13 e 14 de Maio, Faculdade de Letras do Porto.

TRANSCRIPT

Pruebe el sistema en: http://opentrad.imaxin.com

traducción automática

una realidad

Opentrad plataforma de traducción automática

Galiza

Galiza

imaxin|software

16 anos pensando em

melhorar a

comunicação entre

pessoas com o

processamento da

linguagem natural e os

jogos multimédia.

Vendor de Microsoft Coporation.

Certificados na norma CMMI nivel3.

linhas de trabalho

Área multimédia especializada em aplicações educativas e formativas, jogos sociais, advergaming...

Soluções multilingues de processamento linguístico e documental.

Serviços integrais de localizaçao de software a galego/português, espanhol e inglês, catalao, francês.

linhas de trabalho

IngamingGranxa de Venanciohttp://www.youtube.com/watch?v=6gXVuffOSesClimánticahttp://www.youtube.com/watch?v=LK__z-3z31s

Localiza

http://www.youtube.com/watch?v=3wPC8EI4cIc

http://www.youtube.com/watch?v=jcg3z1Z6qCk

O que é Opentrad?

Opentrad, é a plataforma líder europeia em

serviços de traduçao automática RBMT em

código aberto.

http://www.opentrad.com

Onde nasceu Opentrad?

Pruebe el sistema en: http://opentrad.imaxin.com

Antecedentes do projeto• Opentrad é fruto de dois projetos PROFIT e três

AVANÇA I+D+i desenvolvido por um consórcio de empresas e universidades punteras em engenharia linguística e tradução automática.

• A missão deste consórcio é desenvolver projetos de I+D+i que tenham repercussão direta no mercado e sejam de utilidade para a sociedade.

• Opentrad é um projeto em contínuo desenvolvimento, com melhorias técnicas e linguísticas através de projetos de I+D+i desenvolvidos pelo consórcio

Membros dol consórcio Opentrad:

• UPC (Universitat Politécnica de Catalunya).

• Grupo Transducens (Traducción automática de la Universitat d´Alacant).

• Grupo IXA Taldea (Universidad del País Vasco).

• SLI (Seminario de Lingüística Informática da Universidade de Vigo).

• Fundación Elhuyar.

• Eleka ingeniaritza linguistikoa

• imaxin|software

Projetos derivados:

• OpenMT (Ministerio de Educación y Ciencia) 2006-2008

• EurOpenTrad (Ministerio de Industria) 2006-2007

• OpenTrad+(Gobierno Vasco) 2006-2007

• EixOpentrad, RecursOpentrad (Xunta de Galicia)

• CELTIC (FEDER-INNTERCONECTA)

Motores e tecnologias

Apertium (desenvolvido pelo consórcio)

Matxin (desenvolvido pelo consórcio)

Moses

Moses paralelizado

Tecnologías hibridas (RBMT+SMT): OpenMT (em

desenvolvimento)

Pruebe el sistema en: http://opentrad.imaxin.com

Motores de tradução

Opentrad trabalha com dois engenhos de tradução:

• Apertium: motor de transferência superficial adequado para idiomas de origem comum com similitudes léxicas e sintácticas.

• Matxin: motor de transferência profunda para a tradução entre idiomas distantes. Matxin utiliza uma parte importante dos programas de Apertium.

• Apertium 2.X e 3.X: evolução dos motores anteriores que permite a sua aplicação tanto a línguas de origem comum como a idiomas distantes. Além disso, este motor incorpora entre outras vantagens a sinonimia.

Pruebe el sistema en: http://opentrad.imaxin.com

Idiomas

Pares de idiomas• Galego Espanhol (96,2% cobertura)• Catalão Espanhol (96,2%

cobertura)• Espanhol Euskera (76% cobertura)

Novos pares de idiomas• Galego Português (92% cobertura)• Espanhol Português (90,2% cobertura)• Catalão Francês (90% cobertura)• Espanhol Romeno• Inglês Catalão

• Dada a sua estrutura modular, Opentrad permite a melhoria contínua, mediante a ampliação do número de entradas nos dicionários, a definição de novos formatos, a adaptação às normas linguísticas e o estilo de tradução.

• Apertium 2.0: permite a tradução entre pares de línguas distantes.

Pruebe el sistema en: http://opentrad.imaxin.com

Descrição da solução• Multidireccionalidade de tradução automática

• Possibilidade de personalização da BD e adaptação ao livro de estilo

• Incorporação contínua de novos pares de línguas

• Velocidade do sistema: mais de 10.000 palavras por segundo

• Open Source. Todo o projeto está desenvolvido usando código aberto

• Estrutura modular facilmente adaptável e integrable com outros sistemas existentes. Dados baseados em XML e standards abertos

• Contínua melhoria do sistema através de projetos I+D+i sem custo para o cliente

Pruebe el sistema en: http://opentrad.imaxin.com

Produtos

Opentrad

ConsultoriaInstalação

Personalização

Outros serviços

Diferentes tarifas

Serviços adicionais

Revisão linguística

Tradução e revisão de documentos

Aluguer de servidores de tradução

Instalação e personalização

Programa Partner

Pruebe el sistema en: http://opentrad.imaxin.com

Solução tecnológica

Desformatador: separa o texto do formato para ser traduzido.

Analisador morfológico: segmenta o texto e atribui à cada lema todas as suas possíveis categorias e flexões.

Desambiguador léxico: seleciona a opção correta entre as formas analisadas no módulo anterior.

Transferência estrutural: deteta e trata padrões de palavras que exigem um tratamento especial por causa das divergências gramaticais entre as línguas.

Transferência léxica: seleciona para a cada forma léxica do O a forma léxica correspondente na LM.

Gerador morfológico: flexiona adequadamente as formas na LM a partir da informação recebida.

Postgerador: realiza operações ortográficas como contrações e apostrofaciones.

Reformatador: reconstrói o formato original do texto.

Opentrad, está composto dos seguintes módulos:

Desformatadores e reformateadores de texto,

Motor de tradução

Dicionários monolingues e bilingues

LO

LM

Considerações técnicas

Opentrad está instalado e em produção nas seguintes

distribuições Linux:

Ubuntu 5.04 e superiores

Debian Sarge

Red Hat Enterprise Linux

Centos

Configuração de servidores

Diferentes configurações segundo:

as necessidades do cliente,

os idiomas utilizados,

os usos de tradutor,

a carga de trabalho,

o número de utentes concorrentes,

etc.

Opentrad Cloud computing

www.opentrad.com oferece serviços de

tradução automática seguindo o modelo de

cloud computing.

Sem licenças

Opentrad está desenvolvido em código aberto baixo

licença GPL.

– Sem custos por licenças nem por número de utentes.

– Assegura independência do fornecedor.

– Comunidade ativa que melhora o sistema e cria novos pares.

– Orçamento dedicado integralmente à adaptação do sistema ao cliente.

Idiomas soportados

Mais de 20 pares de idiomas!

Inglês

Espanhol

Galego

Catalão/valenciano

Euskara

Português

Francês

Italiano

Chinês

Idiomas destacados Pares de idiomas

Facilidade de integração

Opentrad conta com diferentes ferramentas para

facilitar a integração da tradução automática em

todas as suas aplicações.

Componentes de Integração

Ferramentas on-line:

Tradução textos

Tradução documentos

Tradução URL

Componentes de Integração

Ferramentas servidor:

API de integração

Pastas dinâmicas

Tradução via e-mail

Componentes de Integração

Ferramentas de utente:

Plug-in Microsoft Word

Plug-in

Navegadores Ferramentas de pré- e pós-edição

Integração em sistemas de memórias de

tradução

Soporte de principales formatos

Serviços que ofertamos o consórcio

Consultoria técnica

Consultoria linguística

Consultoria de implantação

Formação

Pruebe el sistema en: http://opentrad.imaxin.com

Tradutor de documentoshttp://www.opentrad.com

Pruebe el sistema en: http://opentrad.imaxin.com

PrémiosMelhor aplicação TIC por AETG 2009

Clientes de referênciaInstituto Cervantes

NovaCaixaGalicia

La Voz de Galicia.

Grupo Editorial Edebé

Grupo Planeta (ADN)

Educa Madrid

Xunta de Galicia

Diputación de A Coruña

Kutxa

Diario Oficial de Galicia

Donostia Turismo

Clientes de referencia•Parlamento de Galicia

•Consello de Contas de Galicia

•Ayuntamiento Coruña

•Ayuntamiento Lugo

•Elhuyar Fundazioa

•Faro de Vigo

•Grupo Correo Gallego

•La Opinión de Coruña

•Xornal de Galicia

•De Luns a Venres

•El Progreso de Lugo

•Axencia Galega de Noticias

•Diario de Pontevedra

•Liga San Miguel ACT

•Asociación de Editores Vascos

•Asociación Gallega de Editores

•Centro Hospitalario Universitario A

Coruña (CHUAC)•www.mercadogalego.eu

•GOB Menorca

•European Consultant Lobby

•ABC Enciklopedioj

•Universitat Oberta de Catalunya

•Grupo NC

•Alcaraz y Esteve

Melhoras comunidade

Google summer of code

Comunidade Opentrad-Apertium e Opentrad-Matxin

http://wiki.apertium.org/wiki/Main_Page

Alianças estratégicas

imaxin|software e Priberam

https://www.youtube.com/watch?feature=player_embedded&v=8gMEj-nwPQw#!