josé ramom campos - opentrad
DESCRIPTION
Apresentação do Dr. José Ramom Pichel Campos na I Conferência Internacional de Tradução e Tecnologia, 13 e 14 de Maio, Faculdade de Letras do Porto.TRANSCRIPT
Pruebe el sistema en: http://opentrad.imaxin.com
traducción automática
una realidad
Opentrad plataforma de traducción automática
imaxin|software
16 anos pensando em
melhorar a
comunicação entre
pessoas com o
processamento da
linguagem natural e os
jogos multimédia.
linhas de trabalho
Área multimédia especializada em aplicações educativas e formativas, jogos sociais, advergaming...
Soluções multilingues de processamento linguístico e documental.
Serviços integrais de localizaçao de software a galego/português, espanhol e inglês, catalao, francês.
linhas de trabalho
IngamingGranxa de Venanciohttp://www.youtube.com/watch?v=6gXVuffOSesClimánticahttp://www.youtube.com/watch?v=LK__z-3z31s
Localiza
http://www.youtube.com/watch?v=3wPC8EI4cIc
http://www.youtube.com/watch?v=jcg3z1Z6qCk
O que é Opentrad?
Opentrad, é a plataforma líder europeia em
serviços de traduçao automática RBMT em
código aberto.
http://www.opentrad.com
Pruebe el sistema en: http://opentrad.imaxin.com
Antecedentes do projeto• Opentrad é fruto de dois projetos PROFIT e três
AVANÇA I+D+i desenvolvido por um consórcio de empresas e universidades punteras em engenharia linguística e tradução automática.
• A missão deste consórcio é desenvolver projetos de I+D+i que tenham repercussão direta no mercado e sejam de utilidade para a sociedade.
• Opentrad é um projeto em contínuo desenvolvimento, com melhorias técnicas e linguísticas através de projetos de I+D+i desenvolvidos pelo consórcio
Membros dol consórcio Opentrad:
• UPC (Universitat Politécnica de Catalunya).
• Grupo Transducens (Traducción automática de la Universitat d´Alacant).
• Grupo IXA Taldea (Universidad del País Vasco).
• SLI (Seminario de Lingüística Informática da Universidade de Vigo).
• Fundación Elhuyar.
• Eleka ingeniaritza linguistikoa
• imaxin|software
Projetos derivados:
• OpenMT (Ministerio de Educación y Ciencia) 2006-2008
• EurOpenTrad (Ministerio de Industria) 2006-2007
• OpenTrad+(Gobierno Vasco) 2006-2007
• EixOpentrad, RecursOpentrad (Xunta de Galicia)
• CELTIC (FEDER-INNTERCONECTA)
Motores e tecnologias
Apertium (desenvolvido pelo consórcio)
Matxin (desenvolvido pelo consórcio)
Moses
Moses paralelizado
Tecnologías hibridas (RBMT+SMT): OpenMT (em
desenvolvimento)
Pruebe el sistema en: http://opentrad.imaxin.com
Motores de tradução
Opentrad trabalha com dois engenhos de tradução:
• Apertium: motor de transferência superficial adequado para idiomas de origem comum com similitudes léxicas e sintácticas.
• Matxin: motor de transferência profunda para a tradução entre idiomas distantes. Matxin utiliza uma parte importante dos programas de Apertium.
• Apertium 2.X e 3.X: evolução dos motores anteriores que permite a sua aplicação tanto a línguas de origem comum como a idiomas distantes. Além disso, este motor incorpora entre outras vantagens a sinonimia.
Pruebe el sistema en: http://opentrad.imaxin.com
Idiomas
Pares de idiomas• Galego Espanhol (96,2% cobertura)• Catalão Espanhol (96,2%
cobertura)• Espanhol Euskera (76% cobertura)
Novos pares de idiomas• Galego Português (92% cobertura)• Espanhol Português (90,2% cobertura)• Catalão Francês (90% cobertura)• Espanhol Romeno• Inglês Catalão
• Dada a sua estrutura modular, Opentrad permite a melhoria contínua, mediante a ampliação do número de entradas nos dicionários, a definição de novos formatos, a adaptação às normas linguísticas e o estilo de tradução.
• Apertium 2.0: permite a tradução entre pares de línguas distantes.
Pruebe el sistema en: http://opentrad.imaxin.com
Descrição da solução• Multidireccionalidade de tradução automática
• Possibilidade de personalização da BD e adaptação ao livro de estilo
• Incorporação contínua de novos pares de línguas
• Velocidade do sistema: mais de 10.000 palavras por segundo
• Open Source. Todo o projeto está desenvolvido usando código aberto
• Estrutura modular facilmente adaptável e integrable com outros sistemas existentes. Dados baseados em XML e standards abertos
• Contínua melhoria do sistema através de projetos I+D+i sem custo para o cliente
Pruebe el sistema en: http://opentrad.imaxin.com
Produtos
Opentrad
ConsultoriaInstalação
Personalização
Outros serviços
Diferentes tarifas
Serviços adicionais
Revisão linguística
Tradução e revisão de documentos
Aluguer de servidores de tradução
Instalação e personalização
Programa Partner
Pruebe el sistema en: http://opentrad.imaxin.com
Solução tecnológica
Desformatador: separa o texto do formato para ser traduzido.
Analisador morfológico: segmenta o texto e atribui à cada lema todas as suas possíveis categorias e flexões.
Desambiguador léxico: seleciona a opção correta entre as formas analisadas no módulo anterior.
Transferência estrutural: deteta e trata padrões de palavras que exigem um tratamento especial por causa das divergências gramaticais entre as línguas.
Transferência léxica: seleciona para a cada forma léxica do O a forma léxica correspondente na LM.
Gerador morfológico: flexiona adequadamente as formas na LM a partir da informação recebida.
Postgerador: realiza operações ortográficas como contrações e apostrofaciones.
Reformatador: reconstrói o formato original do texto.
Opentrad, está composto dos seguintes módulos:
Desformatadores e reformateadores de texto,
Motor de tradução
Dicionários monolingues e bilingues
LO
LM
Considerações técnicas
Opentrad está instalado e em produção nas seguintes
distribuições Linux:
Ubuntu 5.04 e superiores
Debian Sarge
Red Hat Enterprise Linux
Centos
Configuração de servidores
Diferentes configurações segundo:
as necessidades do cliente,
os idiomas utilizados,
os usos de tradutor,
a carga de trabalho,
o número de utentes concorrentes,
etc.
Opentrad Cloud computing
www.opentrad.com oferece serviços de
tradução automática seguindo o modelo de
cloud computing.
Sem licenças
Opentrad está desenvolvido em código aberto baixo
licença GPL.
– Sem custos por licenças nem por número de utentes.
– Assegura independência do fornecedor.
– Comunidade ativa que melhora o sistema e cria novos pares.
– Orçamento dedicado integralmente à adaptação do sistema ao cliente.
Idiomas soportados
Mais de 20 pares de idiomas!
Inglês
Espanhol
Galego
Catalão/valenciano
Euskara
Português
Francês
Italiano
Chinês
Idiomas destacados Pares de idiomas
Facilidade de integração
Opentrad conta com diferentes ferramentas para
facilitar a integração da tradução automática em
todas as suas aplicações.
Componentes de Integração
Ferramentas servidor:
API de integração
Pastas dinâmicas
Tradução via e-mail
Componentes de Integração
Ferramentas de utente:
Plug-in Microsoft Word
Plug-in
Navegadores Ferramentas de pré- e pós-edição
Integração em sistemas de memórias de
tradução
Serviços que ofertamos o consórcio
Consultoria técnica
Consultoria linguística
Consultoria de implantação
Formação
Pruebe el sistema en: http://opentrad.imaxin.com
Tradutor de documentoshttp://www.opentrad.com
Clientes de referênciaInstituto Cervantes
NovaCaixaGalicia
La Voz de Galicia.
Grupo Editorial Edebé
Grupo Planeta (ADN)
Educa Madrid
Xunta de Galicia
Diputación de A Coruña
Kutxa
Diario Oficial de Galicia
Donostia Turismo
Clientes de referencia•Parlamento de Galicia
•Consello de Contas de Galicia
•Ayuntamiento Coruña
•Ayuntamiento Lugo
•Elhuyar Fundazioa
•Faro de Vigo
•Grupo Correo Gallego
•La Opinión de Coruña
•Xornal de Galicia
•De Luns a Venres
•El Progreso de Lugo
•Axencia Galega de Noticias
•Diario de Pontevedra
•Liga San Miguel ACT
•Asociación de Editores Vascos
•Asociación Gallega de Editores
•Centro Hospitalario Universitario A
Coruña (CHUAC)•www.mercadogalego.eu
•GOB Menorca
•European Consultant Lobby
•ABC Enciklopedioj
•Universitat Oberta de Catalunya
•Grupo NC
•Alcaraz y Esteve
Melhoras comunidade
Google summer of code
Comunidade Opentrad-Apertium e Opentrad-Matxin
http://wiki.apertium.org/wiki/Main_Page
Alianças estratégicas
imaxin|software e Priberam
https://www.youtube.com/watch?feature=player_embedded&v=8gMEj-nwPQw#!