o latim clÁssico de cÍcero À luz da linguÍstica de corpus caio begotti — ufpr 2012

Post on 22-Apr-2015

106 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

O LATIM CLÁSSICO DE CÍCERO À LUZ DA LINGUÍSTICA DE CORPUS

Caio Begotti — UFPR 2012

AGRADECIMENTOS

Alessandro

Borges

Rodrigo

Márcio

AGENDA

Motivação

Implementação

Usos possíveis

Objetivos

MOTIVAÇÃO

MOTIVAÇÃO

Meu trabalho

MOTIVAÇÃO

• Cícero

• Linguística de corpus• Dados dizem muito

• Apoio dos resultados do inglês• Pesquisas similares (pra ensino)• Linguística aplicada no mundo real é em inglês

IMPLEMENTAÇÃO

• Dados abertos

• Corpora• Curadoria• Trabalho constante• Fonte de respostas

• Filtros e montagem• Stopwords• XML

• Programação• Python• NLTK

• Análise de Distribuição de Frequência

USOS POSSÍVEIS

• Mais programação, mais análises

• Estudo estilístico ou gramatical do latim

• Ensino de latim a partir dos corpora• Concordâncias• Vocabulários reais• Reading Latin

OBJETIVOS

• Criar corpora usáveis em computação: 75 de Cícero, mais de 1 milhão de termos

• Criar análises com programação de computadores: 1.000 linhas

• Criar catálogo lexical pra estudo/ensino: ≈ 550 termos

• Criar catálogo de stopwords para o latim: ≈ 600 termos

OBRIGADO!

top related