pite-fapesp regra - inovacao.scielo.brinovacao.scielo.br/pdf/inov/v3n1/a11v03n1.pdf · por bruno...

Post on 28-Jan-2019

215 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

P I T E - F A P E S P

2 0

por Bruno Buys

ReGra - um revisor gramatical para o português do Brasil

Há treze anos a Itautec e o NúcleoInterinstitucional de Lingüística Compu-tacional (Nilc) da Universidade de SãoPaulo mantêm uma parceria de pesqui-sa, desenvolvimento e mercado na área deprocessamento computacional da línguaportuguesa. Esses anos de trabalho con-junto levaram ao desenvolvimento doReGra, um programa de revisão ortográ-fica e gramatical de língua portuguesa,capaz de analisar textos em português,ainda dentro do editor de textos, e apon-tar incorreções, poupando o usuário do tra-balho exaustivo de correção manual.

A parceria começou quando a Itautecbuscou ajuda da universidade para a ela-boração de uma ferramenta de correçãogramatical e ortográfica, a ser embuti-da em seu processador de textos, cha-mado Redator. Isso ocorreu em 1993, oque, em termos de desenvolvimento eminformática, é muito tempo (só parasituar, o MS-Windows estava na sua ver-são 3.1, a primeira a fazer uso de inter-faces gráficas, a internet era um luxo,restrito a usuários corporativos e uni-versitários, e os computadores mais velo-zes do mercado eram os 486s). Nessaépoca o mercado para aplicativos de pro-cessamento de texto ainda era aberto,uma vez que não havia um produto domi-nante como o MS-Office de hoje. Doisanos depois, em 1995, o grupo de pes-quisa concluiu uma versão do corretor,

disponível para lançamento comercial.Naquela época, a Itautec comercializa-va o produto com o nome de RedaçãoLíngua Portuguesa, um aplicativo com-pleto de revisão. Ele possuía, adicional-mente, uma extensão a ser instalada pelousuário, que funcionava dentro doMicrosoft Word.

A necessidade de um revisor auto-mático de língua portuguesa vem do fatode que não é possível adaptar um revi-sor programado para outra língua, comoo inglês, por exemplo, que tem ferramen-tas tradicionais de revisão há bastantetempo. Era necessário desenvolver umrevisor para o português brasileiro capazde levar em conta as particularidadesda nossa língua.

Curiosamente, em relação a esse tra-balho, Maria das Graças Volpe Nunes,pesquisadora do Instituto de CiênciasMatemáticas e de Computação da USP,e integrante do Nilc, diz que o portuguêsnão é uma língua particularmente difí-cil. Contrariando um mito comum de queo português tem um alto grau de dificul-dade, Maria das Graças diz que nossa lín-gua apresenta o mesmo grau de comple-xidade de outras línguas naturais.

FAPESP ENTRA EM CENAOs anos seguintes seriam de muitos

(e bons) acontecimentos na trajetória doReGra. O primeiro aporte financeiro da

Fundação de Amparo à Pesquisa doEstado de São Paulo (Fapesp) começouem outubro de 1997, dentro do Programade Inovação Tecnológica ParceriaUniversidade-Empresa (Pite). A Fapespparticipou com um montante de cerca deR$ 40 mil reais, para uma contraparti-da de R$ 78 mil da Itautec. Por apostarna qualidade da linha de pesquisa desen-volvida pelo grupo de São Carlos, o finan-ciamento da Fapesp ajudou na sua con-solidação dentro da universidade, dan-do maior visibilidade. Maria das Graçasdiz que "o nome da Fapesp envolvido nes-sa parceria deu um peso muito grande,e credibilidade, permitindo a consolida-ção do grupo de pesquisa. A universida-de brasileira ainda está engatinhandona questão da interação com empresas.Hoje temos a Lei da Inovação, mas naque-la época isso era uma coisa nebulosa.Quando a Fapesp entrou, a USP passoua ver com outros olhos a nossa parce-ria", acrescenta a pesquisadora.

Os anos de 1998 e 1999 marcaramuma época de reconhecimento da exce-lência do produto: o ReGra recebeu osprêmios Peão da Tecnologia, daFundação Parque de Alta Tecnologia deSão Carlos, na edição de 1998, e o PrêmioInovação Tecnológica, da Alcatel/Brasil,em 1999. Em fins de 1998 a Microsoftiniciou conversações com a Itautec paraincorporar o ReGra ao pacote Microsoft

PARCERIA DA ITAUTEC COM NÚCLEO DE PESQUISA DA USP VIABILIZA CRIAÇÃO DE UM SOFTWARE LINGUÍSTICO

inova20-21pite.qxd 12/12/2006 11:13 AM Page 2

2 1

necessário (hipercorreção) ou não efe-tuava uma correção necessária (omis-são). Para este segundo projeto a Fapespcontribuiu com R$ 67 mil, para uma con-trapartida de R$ 216 mil da Itautec.

A satisfação da Microsoft com o revi-sor levou às renovações do licenciamen-to. Segundo Elizabeth Costa, gerente dedesenvolvimento de software da Itautec,"o MS-Office recebe novas versões a cadatrês anos. Em conjunto com esses lança-mentos, uma nova versão do ReGra é lan-çada, com atualizações e melhorias.Buscamos adaptar nosso produto àsnovidades que o MS-Office oferece, acom-panhando sua evolução".

O FUTURO DO REGRAO aumento da demanda por softwa-

re livre tem sido acompanhado de pertopela empresa, que produz e comerciali-za o Librix, uma solução completa desistema operacional e programas paradesktop, baseada em software livre.

"Nossos planos são continuar com a evo-lução do ReGra, mantendo a satisfaçãodo nosso grande cliente que é a Microsoft.E estaremos também com o revisor gra-matical integrado à suíte OpenOffice,para plataformas livres. Eu diria queatualmente o nosso projeto mais arro-jado é levar a mesma qualidade que temoscom o MS-Office para o OpenOffice, paraatender a este segmento de mercado queestá demandando plataformas abertase Linux". No ano que vem, o Librix inclui-rá o ReGra rodando na suíte livre de escri-tório OpenOffice.org, versão 2.0.

PESQUISA QUE GERA PRODUTO, MASTAMBÉM ATIVIDADE ACADÊMICA

O Nilc existe desde 1993, tendo ini-ciado suas atividades com o ReGra, ehoje em dia é uma referência em proces-samento de linguagem natural (como échamada a área da computação que dedi-ca-se a estudar linguagens de seres huma-nos, em oposição às linguagens artifi-ciais, que são as linguagens de progra-mação). Maria das Graças salienta ain-da que "por causa do ReGra, dos recur-sos e da visibilidade obtida, foi possívelmanter uma equipe de lingüistas e infor-matas em um grupo de pesquisas quepor si só seria muito difícil de manterna universidade brasileira, pela sua pró-pria natureza".

O Núcleo congrega bolsistas, alu-nos e pesquisadores originários dediversas instituições, em uma área depesquisa e desenvolvimento que é dealta tecnologia e, inevitavelmente, trans-disciplinar. Em seus treze anos de fun-cionamento, já formou cerca de 30 mes-tres e 7 doutores em processamento delíngua natural. Embora o ReGra seja oprojeto mais visível do Núcleo, existemdiversos outros projetos, todos orienta-dos a resolver problemas específicosdo processamento computacional dalíngua portuguesa.

Office, o que viria a acontecer por oca-sião do lançamento da versãoOffice2000. Nesse momento a Itautecdecidiu retirar do mercado seu proces-sador de textos Redator, uma vez que omercado havia definido o MS-Wordcomo padrão de fato, em processamen-to de texto. Mas o revisor gramaticalReGra havia atingido um alto grau deexcelência em revisão do português, oque atraiu a atenção da multinacionaldo software, que optou por incluí-lo naversão brasileira do MS-Office2000.

O licenciamento do ReGra pelaMicrosoft elevou-o à condição de produ-to hegemônico, sendo vendido embuti-do e funcionando em conjunto com oWord 2000 e versões posteriores, comosolução de processamento de textos emportuguês. Sendo o Word o editor de tex-tos mais usado no Brasil desde então, oReGra ganhou o mesmo grau de popula-ridade. A revisão ortográfica e gramati-cal automática do português brasileirotornou-se uma prática corriqueira entreusuários domésticos e corporativos.

Um segundo aporte financeiro daFapesp aconteceu nos anos de 2001 a2003, com a finalidade de melhorar odesempenho do revisor. Isso envolveriatarefas como reduzir os casos em que aferramenta intercedia onde não era

Divulgação

Reprodução

Tela do programa de correção ortográfica

inova20-21pite.qxd 12/12/2006 11:13 AM Page 3

top related