modelo geral, novidades e avaliação paula carvalho e hugo oliveira diana santos, cláudia freitas...

33
Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade de Aveiro, 7 de Setembro de 2008 1

Upload: internet

Post on 18-Apr-2015

104 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Modelo Geral, Novidades e Avaliação

Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota

Encontro do Segundo HAREMUniversidade de Aveiro, 7 de Setembro de

2008

1

Page 2: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Desafios HAREM clássico (seguindo genericamente

o modelo de classificação proposto no Primeiro HAREM, mas refinando algumas distinções, quer ao nível da segmentação das EM quer da sua classificação)

Pista para identificação e normalização de expressões temporais (Hagège et al., 2008)

Pista ReRelEM, para a identificação de relações semânticas entre EM

2

Page 3: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Calendário do HAREM (2007)

Primeira chamada para o Segundo HAREM

Data-limite para registo no HAREM

Data-limite para discussão sobre os moldes do Segundo HAREM

Versão preliminar das directivas do Segundo HAREM

3

Page 4: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Calendário do HAREM (2008)

Directivas finais e material de treino

Colecção HAREMPrimeira versão da Colecção Dourada

Primeira versão da mini-CD do TEMPO e a versão final CD Primeira versão da mini-CD do ReRelEM Versão final da mini-CD do TEMPO Resultados preliminares do HAREM clássicoResultados preliminares da pista do TEMPO

Versão final da mini-CD do ReRelEM

Resultados da pista ReRelEM Relatórios de desempenho

4

Page 5: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Caracterização do HAREM EM em contexto

 

 

5

O acordo político quanto à revisão foi obtido durante a <EM ID="aa46996-48" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Presidência Alemã</EM> , tendo cabido a <EM ID="aa46996-54" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Portugal</EM> concluir o processo de revisão.

Regressou então a <EM ID="hub-67792-106" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Portugal</EM>, onde iniciou meteórica carreira na experimentação de novas formas de expressão

Este debate passou completamente ao lado de <EM ID="H2-dftre765-8" CATEG="PESSOA" TIPO="POVO">Portugal</EM>

«o problema do <EM ID="hub-24360-322“ CATEG="ORGANIZACAO|ABSTRACCAO" TIPO="INSTITUICAO|DISCIPLINA">PSD</EM> é começar a ter só um <EM ID="hub-24360-323" CATEG="ABSTRACCAO" TIPO="IDEIA">Portugal</EM> ou dois dentro de si»

<EM ID=“Ex-1GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO">Portugal</EM> perdeu com a <EM ID=“Ex-2GM" CATEG="PESSOA" TIPO=“GRUPOMEMBRO“>Suíça</EM> por <EM ID=“Ex-3GM" CATEG=“VALOR" TIPO=“CLASSIFICACAO">2-0</EM>

Page 6: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Caracterização do HAREM EM vagas

 

 

6

Pela mão do <EM ID="aa66435-107" CATEG="PESSOA" TIPO="INDIVIDUAL">ministro Freitas do Amaral</EM>, e sem necessidade alguma, <EM ID="aa66435-108" CATEG="ORGANIZACAO|PESSOA" TIPO="ADMINISTRACAO|POVO">Portugal</EM> foi enxovalhado, coberto de vergonha e de cobardia, por um dos mais tristes textos políticos que já alguém escreveu.

<EM ID="hub-28874-31" CATEG="VALOR" TIPO="QUANTIDADE">Mais de 32 mil</EM> pessoas poderiam morrer se uma pandemia de gripe humana de origem aviária atingisse <EM ID="hub-28874-32" CATEG="PESSOA|LOCAL" TIPO="POVO|HUMANO" SUBTIPO="|PAIS">Portugal</EM>

os dois reinos católicos, <EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e<EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos do <EM ID="aa66435-54" CATEG="LOCAL|LOCAL" TIPO="FISICO|HUMANO" SUBTIPO="REGIAO|DIVISAO">Novo Mundo</EM>

Page 7: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Caracterização do HAREM Análises alternativas (ALT)

 

 

7

Ambiguidade estrutural: aproximava a <ALT> <EM ID="H2-dftre765-106" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja de Inglaterra</EM> | <EM ID="H2-dftre765-106-aa" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Igreja</EM> de <EM ID="H2-dftre765-16" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Inglaterra</EM> </ALT> do calvinismo.

Possibilidade de uma expressão poder ser reconhecida como EM, ou não:

<EM ID="aa66435-51" CATEG="PESSOA|ORGANIZACAO“ TIPO="GRUPOIND|ADMINISTRACAO">Portugal</EM> e <EM ID="aa66435-52" CATEG="PESSOA|ORGANIZACAO" TIPO="GRUPOIND|ADMINISTRACAO">Espanha</EM>, partiram à conquista do mundo e tornaram-se <ALT> <EM ID="aa66435-53" CATEG="OUTRO">Impérios</EM> | Impérios </ALT> marítimos;

Page 8: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Novidades no Segundo HAREM Uso extensivo de ALT para representação sistemática da

estrutura interna das EM constituídas por outras EM

<ALT><EM ID="aa55968-473" CATEG="PESSOA" TIPO="CARGO">presidente da Câmara de Nova Iorque</EM>

| presidente da   <EM ID="aa55968-7" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara de Nova

Iorque</EM> | presidente da   <EM ID="aa55968-475aa" CATEG="ORGANIZACAO" TIPO="ADMINISTRACAO">Câmara</EM> de <EM

ID="aa55968-475" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="DIVISAO">Nova Iorque</EM> </ALT>

 

 

8

Page 9: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Novidades no Segundo HAREM ALT sistematicamente aplicados

9

CATEG ESTRUTURA EXEMPLO

PESSOA PESSOA de LOCALPESSOA de ORGANIZACAOPESSOA de ORG|LOCALPESSOA de PESSOA

Santo António de LisboaPresidente do Parlamento EuropeuPresidente dos Estados UnidosFCP de José Mourinho

ORGANIZACAO ORG de LOCALORG de ORG

Associação Académica de CoimbraConselho da UE

LOCAL LOCAL de LOCALLOCAL de ORGANIZACAO

Teatro Scala de MilãoCentro de Eventos da Fiergs

OBRA OBRA de PESSOAOBRA|LOCAL de LOCAL

Sagrada Família de GaudíMosteiro de Santa Clara-a-Velha

ACONTECIMENTO

ACONT de LOCALACONT de TEMPO

Jogos Olímpicos de BarcelonaVolta a Espanha de 1985

ABSTRACCAO ABSTRACCAO de LOCAL Blues do Delta

COISA COISA de ORGANIZACAO iPhone da Apple

Page 10: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Novidades no Segundo HAREM Não reconhecimento de certas palavras em maiúsculas como EM

 

 

 

10

Quando ocorrem no âmbito de uma unidade lexical composta que não constitui, ela própria, uma EM

pastéis de Belém; amêijoas à Bulhão Pato

Se os restantes constituintes (grafados em minúscula) dessa unidade lexical integrarem a lista das minúsculas permitidas no âmbito desta avaliação, toda a unidade lexical deverá ser reconhecida como EM

<EM ID="ric-19806-172" CATEG="ABSTRACCAO“ TIPO="ESTADO">doençadoença de Chagas</EM>

Page 11: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

CATEGORIA TIPO SUBTIPOABSTRACCAO ESTADO, DISCIPLINA, IDEIA, NOME

OUTRO

ACONTECIMENTO EFEMERIDE, EVENTO, ORGANIZADOOUTRO

COISA CLASSE, MEMBROCLASSE, OBJECTOSUBSTANCIA, OUTRO

LOCAL

FISICO

HUMANO

VIRTUALOUTRO

AGUACURSO, AGUAMASSA, ILHA, PLANETA, REGIAO, RELEVO, OUTROCONSTRUCAO, DIVISAO, PAIS, REGIAO, RUA, OUTROCOMSOCIAL, OBRA, SITIO, OUTROOUTRO

OBRA ARTE, PLANO, REPRODUZIDA, OUTRO

ORGANIZACAOADMINISTRACAO, EMPRESA, INSTITUICAO, OUTRO

PESSOACARGO, GRUPOCARGO, GRUPOIND, GRUPOMEMBRO, INDIVIDUAL, MEMBRO, POVO, OUTRO

TEMPODURACAO, FREQUENCIA, GENERICOTEMPO_CALENDOUTRO

DATA, HORA, INTERVALO, OUTRO

VALORCLASSIFICACAO, MOEDA, QUANTIDADE, OUTRO

OUTRO13

X ESCOLA, OBRA, PLANO

X SUB

X PERIODO, CICLICO

X VARIADO

Page 12: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Colecção HAREM

14

Distribuição dos documentospor género na CD

DOCS: 1040Parágrafos: 15737Palavras: 670610

Page 13: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

CD em números (1)

15

DOCS: 129Parágrafos: 2274Palavras: 147991Entidades: 7836Entidades vagas: 633 [52 classes]

Distribuição de categorias

Page 14: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

16

CD em números (2)

Categorias associadas às entidades

Classes de vagueza(21 mais frequentes)

Page 15: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Processo de anotação da CDAnotação da CD, usando o Etiquet(h)arem

17

Page 16: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Processo de anotação da CDComparação automática das anotações, usando o

AlinhadorAnálise e discussão das diferenças encontradasValidação da sintaxe, usando o validador

desenvolvido para o efeitoRevisão manual da CDRevisão sequencial dos documentosRevisão por categoriaRevisão das análises alternativas (ALT)

18

Page 17: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Avaliação do HAREM clássico Melhorias em relação ao Primeiro HAREM

Contabilização de entidades parcialmente identificadas como incorrectas

Possibilidade de avaliação estrita dos ALT Casos conceptualmente distintos,

representados de forma diferente: ignorância, certeza de ser diferente, erro

Sistematização no tratamento das EM

19

Page 18: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Avaliação da classificação semântica

N

n

certostnsubtipos

certotntipos

certacncats1

_)1

1(_)1

1(_)1

1(1

M

n

espuriostnsubtipos

espuriotntipos

espuriacncats1

_1

_1

_1

N = número de diferentes classificações na CD de acordo com o cenárioM = número de classificações espúrias enviadas pelo sistemaα, β, γ = pesos das categorias (1), tipos (0.5) e subtipos (0.25)(c, t, st)_certo = 1, se estiver certo; caso contrário, (c, t, st)_certo = 0(c, t, st)_espuria= 1, se for espuria; caso contrário, (c, t, st)_espuria= 0

20

Page 19: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Programas de avaliação do HAREM clássico: entradas

<?xml version="1.0" encoding="ISO-8859-1" ?> <colHAREM versao="SegundoHarem">…<DOC DOCID="Xyz">

O <ALT> <EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> | <EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> <EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> | <EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> de <EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> <EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> </ALT> vai começar no <EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de <EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM>. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão.

</DOC>…</colHAREM>

CDHAREM.xmlCDHAREM.xml

<?xml version="1.0" encoding="ISO-8859-1" ?> <colHAREM versao="CD">…<DOC DOCID="Xyz">

O Tour de <EM ID="Xyz_1" CATEG="LOCAL" TIPO=“FISICO“ SUBTIPO=“REGIAO">França</EM> <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> vai começar no <EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> com um contra-relógio de <EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>, numa etapa que também terminará no principado monegasco. O início do contra-relógio terá lugar precisamente no mesmo local do local de partida das provas de Fórmula 1. "O prestígio do principado, a filosofia que tem para o desporto e grandes eventos e a localização geográfrica" foram apontados por <EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> como justificação para a decisão.

</DOC></colHAREM>

participacao.xmlparticipacao.xml

Page 20: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

DOC Xyz<ALT><ALT1><EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT1><ALT2><EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]<EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT2><ALT3><EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]<EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]<EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]<EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]<EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]

Programas de avaliação do HAREM clássico: Alinhador

Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

EMs na CD

EMs na participaç

ão

Page 21: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

DOC Xyz<ALT><ALT1><EM ID="Xyz-60" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França de 2009</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>, <EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Parcialmente_Correcto_por_Defeito(0.1; 0.9), Parcialmente_Correcto_por_Defeito(0.2; 0.8)]</ALT1><ALT2><EM ID="Xyz-60-aa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour de França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Parcialmente_Correcto_por_Defeito(0.16666666666666666; 0.8333333333333334)]<EM ID="Xyz-5" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto]</ALT2><ALT3><EM ID="Xyz-60-aaa" CATEG="ACONTECIMENTO" TIPO="ORGANIZADO">Tour</EM> ---> [null]::[Em_Falta]<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]<EM ID="Xyz-5-aa" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM> ---> [<EM ID="Xyz_2" CATEG="TEMPO" TIPO="TEMPO_CALEND" SUBTIPO="DATA">de 2009</EM>]::[Correcto]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]<EM ID="Xyz-585" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM> ---> [<EM ID="Xyz_4" CATEG="VALOR" TIPO="QUANTIDADE">15 quilómetros</EM>]::[Correcto]<EM ID="Xyz-586" CATEG="ABSTRACCAO" TIPO="DISCIPLINA">Fórmula 1</EM> ---> [null]::[Em_Falta]<EM ID="Xyz-587" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM> ---> [<EM ID="Xyz_5" CATEG="PESSOA" TIPO="INDIVIDUAL">Christian Prudhomme</EM>]::[Correcto]

Programas de avaliação do HAREM clássico: Avaliador de alinhamentos

Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

EM em falta

Alinhamentos classificados como: Correctos, Espurios,

Em Falta ou Parcialmente

Correctos

EMs parcialmente correctas são removidas na próxima fase

Page 22: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Tipos de cenário

Cenário total: elenco completo de categorias, tipos e subtipos propostos para o Segundo HAREM.

Cenário selectivo de avaliação: sub-conjunto de categorias, tipos e subtipos do cenário total que é alvo de avaliação.

Cenário selectivo de participação: sub-

conjunto de categorias, tipos e subtipos do cenário total que cada participante se propôs a utilizar.

24

Page 23: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<ALT><ALT1><EM CATEG="ESPURIO">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Espurio]</ALT1><ALT2></ALT2><ALT3><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]</ALT3></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]

Programas de avaliação do HAREM clássico: Véus HAREM

Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

Dentro desta alternativa, a EM é

espúria

Alinhamentos filtrados de acordo com o cenário

pretendido

Remoção de alinhamentos

parcialmente correctos

Page 24: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<ALT><ALT1><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[Correcto]^1</ALT1></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[Correcto]

Programas de avaliação do HAREM clássico: Organizador de ALTs

Organizadorde ALTs Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

- Remoção de alternativas vazias/duplicadas, surgidas depois da aplicação de véus- Remoção de EMs alinhadas mais do que uma vez dentro do mesmo ALT- Atribuição do peso1/total de ALT a cada EM dentro de um ALT

Peso

A EM espúria desapareceu porque alinhava correctamente com a alternativa

seguinte

Page 25: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Programas de avaliação do HAREM clássico: Avaliador semântico

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<ALT><ALT1><EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875) PALT(1.0)}]</ALT1></ALT><EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}]

Avaliadorsemântico

Organizadorde ALTs Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

Precisão

Abrangência

Medida-F

- Avaliação dos atributos semânticos.

Classificação máxima da EM na

CD

Classificação máxima da EM na

participação

Classificação efectiva

Peso ALT

Page 26: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Programas de avaliação do HAREM clássico: Selector de ALTs

#LOCAL(FISICO{ILHA,AGUACURSO,PLANETA,REGIAO,OUTRO,RELEVO,AGUAMASSA};HUMANO{PAIS,RUA,DIVISAO,REGIAO,CONSTRUCAO,OUTRO};OUTRO{OUTRO};VIRTUAL{COMSOCIAL,OUTRO,SITIO,OBRA})

DOC Xyz<EM ID="Xyz-61" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">França</EM> ---> [<EM ID="Xyz_1" CATEG="LOCAL" TIPO="FISICO" SUBTIPO="REGIAO">França</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[] Espurio:[FISICO] Em_Falta:[HUMANO]) Subtipo(Correcto:[] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5892857142857144) CSC(0.875)}]<EM ID="Xyz-584" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM> ---> [<EM ID="Xyz_3" CATEG="LOCAL" TIPO="HUMANO" SUBTIPO="PAIS">Mónaco</EM>]::[{Categoria(Correcto:[LOCAL] Espurio:[] Em_Falta:[]) Tipo(Correcto:[HUMANO] Espurio:[] Em_Falta:[]) Subtipo(Correcto:[PAIS] Espurio:[] Em_Falta:[]) MaxCSC_CD(1.5833333333333333) MaxCSC_S(1.5833333333333333) CSC(1.5833333333333333)}]

Avaliadorsemântico

Organizadorde ALTs Alinhador

CDHAREM.xmlCDHAREM.xml

participacao.xmlparticipacao.xml

Avaliador de alinhamentos

Véus(HAREM)

Selectorde ALTs

Selecção da melhor alternativa (melhor medida-F e melhor

classificação)

Ficou a única alternativa que existia

Page 27: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Participação no Segundo HAREM

Manifestações de interesse: 22Sistemas inscritos: 16Sistemas participantes: 10Saídas: 27 (máx. 4 por participante)

29

Page 28: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Cenários selectivos de participaçãoSistema CE

N PES

ORG

LOC OBR

ACO

ABS

COI

TEM VAL

Cage2 Sel2 CAT CAT F + H CAT

DobrEM Pes

PorTexTO Temp

Priberam Tot

R3M Sel3

REMBRANDT Tot

REMMA Sel4 C/T C/T

SEI-Geo Sel5 F + H

SeRELeP Tot

XIP/L2F/XEROX

Sel6 NORM

IdentificaçãoClassificação

30

CAT – apenas CATEGORIAC/T – apenas CATEGORIA e TIPOF+H – apenas locais FISICOs e HUMANOsNORM – normalização das expressões temporais

Page 29: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

ResultadosCenário total com avaliação estrita de ALTs

31

Page 30: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

ResultadosCenário total com avaliação relaxada de ALTs

32

Page 31: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

ResultadosCenário próprio com avaliação relaxada de

ALTs

33

Page 32: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Avaliação por categorias (melhores sistemas)

34

Precisão Abrangência

Medida-F

Page 33: Modelo Geral, Novidades e Avaliação Paula Carvalho e Hugo Oliveira Diana Santos, Cláudia Freitas e Cristina Mota Encontro do Segundo HAREM Universidade

Agradecimentos

A Linguateca e o HAREM são financiados através do contrato nº 339/1.3/C/NAC, financiado pelo governo português e pela União Europeia, e executado pela FCCN.

35