cogroo 4.0 no fisl 13

Post on 28-Jun-2015

262 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

Palestra sobre o CoGrOO 4.0 (beta) no FISL 13!

TRANSCRIPT

cogroo.org 1

CoGrOO 4.0betabeta

26 de julho de 2012

Arthur Branco Costa

William Colen

FISL 13FISL 1313º Fórum Internacional de Software Livre – A tecnologia que liberta

cogroo.org 2

O que é o CoGrOO?

CoGrOO é um corretor gramatical para português do Brasil, que pode ser usado nas

principais suítes livres de escritório.

cogroo.org 3

● Usuário entra um texto

● O verificador executa uma análise gramatical e busca padrões de erros na estrutura gerada

● O verificador sugere correções para o texto.

cogroo.org 4

Integração BrOffice.org

cogroo.org 5

Integração BrOffice.org

cogroo.org 6

Integração BrOffice.org

cogroo.org 7

Como funciona?● Processamento de Linguagem Natural probabilística +

sistema de regras:● Aprendizado de máquina usando corpus na fase de análise

● Regras de erros são aplicados nas estruturas resultantes

cogroo.org 8

Como funciona?

http://ccsl.ime.usp.br/cogroo/comunidade/grammar

cogroo.org 9

Como funciona?

http://ccsl.ime.usp.br/cogroo/comunidade/grammar

cogroo.org 10

Analisador de Textos● Delimitador de sentenças e tokens

● Etiquetador morfológico

● Identificador de sintagmas

● Identificador de sujeitos

● Etc...

cogroo.org 11

Como funciona?

http://ccsl.ime.usp.br/cogroo/comunidade/rules

cogroo.org 12

As versões do CoGrOO● CoGrOO 1.0 – 2005 (Poli-USP, FINEP)

● Perl – n-gramas

● Primeiro corretor gramatical integrado ao OO (no mundo!)

● Regras XML

● CoGrOO 2.0 – 2007 (Poli-USP, TCC)● Primeira versão usando Java + OpenNLP

● CoGrOO 3.0 – 2009 (órfão, depois CCSL)● Primeira versão totalmente integrada ao OO (instalador OXT, cobrinha

azul – OO 3.0)

● CoGrOO Comunidade

cogroo.org 13

CoGrOO 4.0 (2012)

● Nova licença: Apache 2.0 (antes era LGPL)● Compatível tanto com o LibreOffice quanto com o Apache

OpenOffice● Menores restrições de uso

cogroo.org 14

Novidades● Núcleo reescrito do zero!

● Desde 2009 → colaboração com o Apache OpenNLP

– Grande parte do código de avaliação e treinamento foi transferido para o Apache OpenNLP

● Benefícios:

– Maior qualidade na implementação (mais olhos)

– Menor quantidade de linhas de código para manutenção

– Maior proporção do código trata apenas de correção gramatical

Apache

cogroo.org 15

Novidades● Regras plugáveis: checkers

● 3 tipos

– XML: arquivo de configuração

– Regras em Java● Tipadas (deprecated)● Livres

– Regras de regência (em implementação, participação de alunas da UFMG)

cogroo.org 16

Novidades

● Novos recursos linguísticos (meu mestrado)● Modelos linguíticos treinados com um novo corpus● Novo dicionário (Jspell.br)

Ganho nas análises gramaticais!

cogroo.org 17

Novidades

● Repositório central Maven (quanto tivermos release)

● Nova API● Muito mais modular● Pronta para novos idiomas!● http://ccsl.ime.usp.br/redmine/projects/cogroo/wiki/API_CoGrOO_4x

cogroo.org 18

API

cogroo.org 19

API

cogroo.org 20

API

cogroo.org 21

E está pronto para usar!!

cogroo.org 22

Código no GitHub

cogroo.org 23

Código no GitHub

cogroo.org 24

Código no GitHub

cogroo.org 25

Obrigado pela oportunidade e pela atenção!

http://cogroo.orghttp://ccsl.ime.usp.br

top related