pite-fapesp regra - inovacao.scielo.brinovacao.scielo.br/pdf/inov/v3n1/a11v03n1.pdf · por bruno...

2
P I T E - F A P E S P 20 por Bruno Buys ReGra - um revisor gramatical para o português do Brasil Há treze anos a Itautec e o Núcleo Interinstitucional de Lingüística Compu- tacional (Nilc) da Universidade de São Paulo mantêm uma parceria de pesqui- sa, desenvolvimento e mercado na área de processamento computacional da língua portuguesa. Esses anos de trabalho con- junto levaram ao desenvolvimento do ReGra, um programa de revisão ortográ- fica e gramatical de língua portuguesa, capaz de analisar textos em português, ainda dentro do editor de textos, e apon- tar incorreções, poupando o usuário do tra- balho exaustivo de correção manual. A parceria começou quando a Itautec buscou ajuda da universidade para a ela- boração de uma ferramenta de correção gramatical e ortográfica, a ser embuti- da em seu processador de textos, cha- mado Redator. Isso ocorreu em 1993, o que, em termos de desenvolvimento em informática, é muito tempo (só para situar, o MS-Windows estava na sua ver- são 3.1, a primeira a fazer uso de inter- faces gráficas, a internet era um luxo, restrito a usuários corporativos e uni- versitários, e os computadores mais velo- zes do mercado eram os 486s). Nessa época o mercado para aplicativos de pro- cessamento de texto ainda era aberto, uma vez que não havia um produto domi- nante como o MS-Office de hoje. Dois anos depois, em 1995, o grupo de pes- quisa concluiu uma versão do corretor, disponível para lançamento comercial. Naquela época, a Itautec comercializa- va o produto com o nome de Redação Língua Portuguesa, um aplicativo com- pleto de revisão. Ele possuía, adicional- mente, uma extensão a ser instalada pelo usuário, que funcionava dentro do Microsoft Word. A necessidade de um revisor auto- mático de língua portuguesa vem do fato de que não é possível adaptar um revi- sor programado para outra língua, como o inglês, por exemplo, que tem ferramen- tas tradicionais de revisão há bastante tempo. Era necessário desenvolver um revisor para o português brasileiro capaz de levar em conta as particularidades da nossa língua. Curiosamente, em relação a esse tra- balho, Maria das Graças Volpe Nunes, pesquisadora do Instituto de Ciências Matemáticas e de Computação da USP, e integrante do Nilc, diz que o português não é uma língua particularmente difí- cil. Contrariando um mito comum de que o português tem um alto grau de dificul- dade, Maria das Graças diz que nossa lín- gua apresenta o mesmo grau de comple- xidade de outras línguas naturais. FAPESP ENTRA EM CENA Os anos seguintes seriam de muitos (e bons) acontecimentos na trajetória do ReGra. O primeiro aporte financeiro da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp) começou em outubro de 1997, dentro do Programa de Inovação Tecnológica Parceria Universidade-Empresa (Pite). A Fapesp participou com um montante de cerca de R$ 40 mil reais, para uma contraparti- da de R$ 78 mil da Itautec. Por apostar na qualidade da linha de pesquisa desen- volvida pelo grupo de São Carlos, o finan- ciamento da Fapesp ajudou na sua con- solidação dentro da universidade, dan- do maior visibilidade. Maria das Graças diz que "o nome da Fapesp envolvido nes- sa parceria deu um peso muito grande, e credibilidade, permitindo a consolida- ção do grupo de pesquisa. A universida- de brasileira ainda está engatinhando na questão da interação com empresas. Hoje temos a Lei da Inovação, mas naque- la época isso era uma coisa nebulosa. Quando a Fapesp entrou, a USP passou a ver com outros olhos a nossa parce- ria", acrescenta a pesquisadora. Os anos de 1998 e 1999 marcaram uma época de reconhecimento da exce- lência do produto: o ReGra recebeu os prêmios Peão da Tecnologia, da Fundação Parque de Alta Tecnologia de São Carlos, na edição de 1998, e o Prêmio Inovação Tecnológica, da Alcatel/Brasil, em 1999. Em fins de 1998 a Microsoft iniciou conversações com a Itautec para incorporar o ReGra ao pacote Microsoft PARCERIA DA ITAUTEC COM NÚCLEO DE PESQUISA DA USP VIABILIZA CRIAÇÃO DE UM SOFTWARE LINGUÍSTICO

Upload: hakhanh

Post on 28-Jan-2019

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PITE-FAPESP ReGra - inovacao.scielo.brinovacao.scielo.br/pdf/inov/v3n1/a11v03n1.pdf · por Bruno Buys ReGra - um revisor gramatical para o português do Brasil Há treze anos a Itautec

P I T E - F A P E S P

2 0

por Bruno Buys

ReGra - um revisor gramatical para o português do Brasil

Há treze anos a Itautec e o NúcleoInterinstitucional de Lingüística Compu-tacional (Nilc) da Universidade de SãoPaulo mantêm uma parceria de pesqui-sa, desenvolvimento e mercado na área deprocessamento computacional da línguaportuguesa. Esses anos de trabalho con-junto levaram ao desenvolvimento doReGra, um programa de revisão ortográ-fica e gramatical de língua portuguesa,capaz de analisar textos em português,ainda dentro do editor de textos, e apon-tar incorreções, poupando o usuário do tra-balho exaustivo de correção manual.

A parceria começou quando a Itautecbuscou ajuda da universidade para a ela-boração de uma ferramenta de correçãogramatical e ortográfica, a ser embuti-da em seu processador de textos, cha-mado Redator. Isso ocorreu em 1993, oque, em termos de desenvolvimento eminformática, é muito tempo (só parasituar, o MS-Windows estava na sua ver-são 3.1, a primeira a fazer uso de inter-faces gráficas, a internet era um luxo,restrito a usuários corporativos e uni-versitários, e os computadores mais velo-zes do mercado eram os 486s). Nessaépoca o mercado para aplicativos de pro-cessamento de texto ainda era aberto,uma vez que não havia um produto domi-nante como o MS-Office de hoje. Doisanos depois, em 1995, o grupo de pes-quisa concluiu uma versão do corretor,

disponível para lançamento comercial.Naquela época, a Itautec comercializa-va o produto com o nome de RedaçãoLíngua Portuguesa, um aplicativo com-pleto de revisão. Ele possuía, adicional-mente, uma extensão a ser instalada pelousuário, que funcionava dentro doMicrosoft Word.

A necessidade de um revisor auto-mático de língua portuguesa vem do fatode que não é possível adaptar um revi-sor programado para outra língua, comoo inglês, por exemplo, que tem ferramen-tas tradicionais de revisão há bastantetempo. Era necessário desenvolver umrevisor para o português brasileiro capazde levar em conta as particularidadesda nossa língua.

Curiosamente, em relação a esse tra-balho, Maria das Graças Volpe Nunes,pesquisadora do Instituto de CiênciasMatemáticas e de Computação da USP,e integrante do Nilc, diz que o portuguêsnão é uma língua particularmente difí-cil. Contrariando um mito comum de queo português tem um alto grau de dificul-dade, Maria das Graças diz que nossa lín-gua apresenta o mesmo grau de comple-xidade de outras línguas naturais.

FAPESP ENTRA EM CENAOs anos seguintes seriam de muitos

(e bons) acontecimentos na trajetória doReGra. O primeiro aporte financeiro da

Fundação de Amparo à Pesquisa doEstado de São Paulo (Fapesp) começouem outubro de 1997, dentro do Programade Inovação Tecnológica ParceriaUniversidade-Empresa (Pite). A Fapespparticipou com um montante de cerca deR$ 40 mil reais, para uma contraparti-da de R$ 78 mil da Itautec. Por apostarna qualidade da linha de pesquisa desen-volvida pelo grupo de São Carlos, o finan-ciamento da Fapesp ajudou na sua con-solidação dentro da universidade, dan-do maior visibilidade. Maria das Graçasdiz que "o nome da Fapesp envolvido nes-sa parceria deu um peso muito grande,e credibilidade, permitindo a consolida-ção do grupo de pesquisa. A universida-de brasileira ainda está engatinhandona questão da interação com empresas.Hoje temos a Lei da Inovação, mas naque-la época isso era uma coisa nebulosa.Quando a Fapesp entrou, a USP passoua ver com outros olhos a nossa parce-ria", acrescenta a pesquisadora.

Os anos de 1998 e 1999 marcaramuma época de reconhecimento da exce-lência do produto: o ReGra recebeu osprêmios Peão da Tecnologia, daFundação Parque de Alta Tecnologia deSão Carlos, na edição de 1998, e o PrêmioInovação Tecnológica, da Alcatel/Brasil,em 1999. Em fins de 1998 a Microsoftiniciou conversações com a Itautec paraincorporar o ReGra ao pacote Microsoft

PARCERIA DA ITAUTEC COM NÚCLEO DE PESQUISA DA USP VIABILIZA CRIAÇÃO DE UM SOFTWARE LINGUÍSTICO

inova20-21pite.qxd 12/12/2006 11:13 AM Page 2

Page 2: PITE-FAPESP ReGra - inovacao.scielo.brinovacao.scielo.br/pdf/inov/v3n1/a11v03n1.pdf · por Bruno Buys ReGra - um revisor gramatical para o português do Brasil Há treze anos a Itautec

2 1

necessário (hipercorreção) ou não efe-tuava uma correção necessária (omis-são). Para este segundo projeto a Fapespcontribuiu com R$ 67 mil, para uma con-trapartida de R$ 216 mil da Itautec.

A satisfação da Microsoft com o revi-sor levou às renovações do licenciamen-to. Segundo Elizabeth Costa, gerente dedesenvolvimento de software da Itautec,"o MS-Office recebe novas versões a cadatrês anos. Em conjunto com esses lança-mentos, uma nova versão do ReGra é lan-çada, com atualizações e melhorias.Buscamos adaptar nosso produto àsnovidades que o MS-Office oferece, acom-panhando sua evolução".

O FUTURO DO REGRAO aumento da demanda por softwa-

re livre tem sido acompanhado de pertopela empresa, que produz e comerciali-za o Librix, uma solução completa desistema operacional e programas paradesktop, baseada em software livre.

"Nossos planos são continuar com a evo-lução do ReGra, mantendo a satisfaçãodo nosso grande cliente que é a Microsoft.E estaremos também com o revisor gra-matical integrado à suíte OpenOffice,para plataformas livres. Eu diria queatualmente o nosso projeto mais arro-jado é levar a mesma qualidade que temoscom o MS-Office para o OpenOffice, paraatender a este segmento de mercado queestá demandando plataformas abertase Linux". No ano que vem, o Librix inclui-rá o ReGra rodando na suíte livre de escri-tório OpenOffice.org, versão 2.0.

PESQUISA QUE GERA PRODUTO, MASTAMBÉM ATIVIDADE ACADÊMICA

O Nilc existe desde 1993, tendo ini-ciado suas atividades com o ReGra, ehoje em dia é uma referência em proces-samento de linguagem natural (como échamada a área da computação que dedi-ca-se a estudar linguagens de seres huma-nos, em oposição às linguagens artifi-ciais, que são as linguagens de progra-mação). Maria das Graças salienta ain-da que "por causa do ReGra, dos recur-sos e da visibilidade obtida, foi possívelmanter uma equipe de lingüistas e infor-matas em um grupo de pesquisas quepor si só seria muito difícil de manterna universidade brasileira, pela sua pró-pria natureza".

O Núcleo congrega bolsistas, alu-nos e pesquisadores originários dediversas instituições, em uma área depesquisa e desenvolvimento que é dealta tecnologia e, inevitavelmente, trans-disciplinar. Em seus treze anos de fun-cionamento, já formou cerca de 30 mes-tres e 7 doutores em processamento delíngua natural. Embora o ReGra seja oprojeto mais visível do Núcleo, existemdiversos outros projetos, todos orienta-dos a resolver problemas específicosdo processamento computacional dalíngua portuguesa.

Office, o que viria a acontecer por oca-sião do lançamento da versãoOffice2000. Nesse momento a Itautecdecidiu retirar do mercado seu proces-sador de textos Redator, uma vez que omercado havia definido o MS-Wordcomo padrão de fato, em processamen-to de texto. Mas o revisor gramaticalReGra havia atingido um alto grau deexcelência em revisão do português, oque atraiu a atenção da multinacionaldo software, que optou por incluí-lo naversão brasileira do MS-Office2000.

O licenciamento do ReGra pelaMicrosoft elevou-o à condição de produ-to hegemônico, sendo vendido embuti-do e funcionando em conjunto com oWord 2000 e versões posteriores, comosolução de processamento de textos emportuguês. Sendo o Word o editor de tex-tos mais usado no Brasil desde então, oReGra ganhou o mesmo grau de popula-ridade. A revisão ortográfica e gramati-cal automática do português brasileirotornou-se uma prática corriqueira entreusuários domésticos e corporativos.

Um segundo aporte financeiro daFapesp aconteceu nos anos de 2001 a2003, com a finalidade de melhorar odesempenho do revisor. Isso envolveriatarefas como reduzir os casos em que aferramenta intercedia onde não era

Divulgação

Reprodução

Tela do programa de correção ortográfica

inova20-21pite.qxd 12/12/2006 11:13 AM Page 3