estrutura ontológica e unidades lexicais: uma aplicação … · 2013-03-25 · representam o...

37
Estrutura Ontológica e Unidades Lexicais: uma aplicação computacional no domínio da Ecologia Claudia Zavaglia – UNESP/IBILCE Leandro Henrique Mendonça de Oliveira – USP/ICMC-NILC Maria das Graças Volpe Nunes – USP/ICMC-NILC Sandra Maria Aluísio – USP/ICMC-NILC

Upload: others

Post on 13-Jul-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Est

rutu

ra O

nto

lóg

ica

e U

nid

ades

Lex

icai

s: u

ma

aplic

ação

co

mp

uta

cio

nal

no

d

om

ínio

da

Eco

log

ia

Cla

udia

Zav

aglia

–U

NE

SP

/IBIL

CE

Lean

dro

Hen

rique

Men

donç

a de

Oliv

eira

–U

SP

/ICM

C-N

ILC

Mar

ia d

as G

raça

s V

olpe

Nun

es –

US

P/IC

MC

-NIL

CS

andr

a M

aria

Alu

ísio

–U

SP

/ICM

C-N

ILC

Page 2: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Obj

etiv

o

Ava

liaçã

o de

mét

odos

de

extr

ação

au

tom

átic

a de

term

os (

EA

T)

a pa

rtir

de

córp

us p

ara

a co

nstr

ução

de

onto

logi

as.

Page 3: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Ava

liaçã

o de

mét

odos

de

extr

ação

au

tom

átic

a de

term

os (

EA

T)

a pa

rtir

de

córp

us p

ara

a co

nstr

ução

de

onto

logi

as.

Obj

etiv

o

Page 4: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Ext

raçã

o de

Ter

mos

A e

xtra

ção

de

term

os

éo r

econ

hec

imen

to d

os c

andid

atos

a te

rmos

em u

m c

órp

us

espec

ializ

ado;

O e

xtra

tor

de

term

os

éum

con

junto

de

pro

gra

mas

ou

ferr

amen

tas

com

puta

cionai

s que

reco

nhec

e e

extr

ai a

s unid

ades

ter

min

oló

gic

as

(ter

mos)

que

apar

ecem

nos

córp

us

espec

ializ

ados.

Extr

ato

r

córp

us

term

os

candid

atos

Page 5: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Tra

balh

o S

upor

te

Pro

jeto

ExP

orT

er:

Tel

ine,

M.F

. Ava

liaçã

o de

Mét

odos

de

Ext

raçã

o A

utom

átic

a de

Ter

min

olog

ia p

ara

text

os e

m P

ortu

guês

. IC

MC

-US

P, S

ão C

arlo

s, S

P, F

ever

eiro

200

4.

Dis

sert

ação

de

Mes

trad

o.D

omín

io: R

eves

timen

to C

erâm

ico;

rpus

448

.352

oco

rrên

cias

15 m

étod

os s

impl

es d

as 3

abo

rdag

ens:

ling

üíst

ica,

es

tatís

tica

e hí

brid

a (li

ngüí

stic

a +

est

atís

tica

+

lingü

ístic

a)

Page 6: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Abo

rdag

ens

EA

T

Mét

odos

est

atís

ticos

de

pend

ente

s do

tam

anho

do

córp

usse

o c

órpu

s d

e ap

licaç

ão é

pequ

eno,

ge

ra-s

e m

uito

silê

ncio

,m

esm

o qu

ando

o c

órpu

sap

rese

nta

milh

ões

de o

corr

ênci

as,

háse

mpr

e um

a po

rcen

tage

m d

e pa

lavr

as q

ue

não

pode

m s

er r

ecup

erad

as e

m r

azão

de

sua

baix

a fr

eqüê

ncia

de

uso

no c

órpu

s.

gera

m b

asta

nte

ruíd

om

uita

s da

s pa

lavr

as d

a lín

gua

gera

l ap

arec

em n

os te

xtos

com

um

a al

ta

freq

üênc

iasã

o in

depe

nden

tes

da lí

ngua

Mét

odos

ling

üíst

icos

a gr

ande

qua

ntid

ade

de r

uído

ger

ada

(ent

re 5

5% e

75%

) é

um d

os p

robl

emas

pr

inci

pais

dos

sis

tem

as

que

trab

alha

m a

pena

s da

dos

mor

foló

gico

s,

mor

foss

intá

ticos

,sin

tátic

os e

/ou

léxi

cos.

são

depe

nden

tes

da lí

ngua

e a

téde

va

riant

e

Mét

odos

híb

ridos

aque

les

que

aplic

am o

con

heci

men

to

esta

tístic

o pr

imei

ro

e de

pois

o

lingü

ístic

o,

mes

mos

pr

oble

mas

de

si

lênc

io

dos

sist

emas

pur

amen

te e

stat

ístic

os.

aque

les

que

utili

zam

a

esta

tístic

a ap

enas

co

mo

um

com

plem

ento

da

lin

güís

tica.

os

res

ulta

dos

finai

s m

elho

res

esta

tístic

a au

xilia

r no

m

omen

to

do

proc

esso

de

dete

cção

, re

afirm

ando

ou

recu

sand

o a

cond

ição

de

term

o de

um

a un

idad

e lin

güís

tica.

Page 7: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Ava

liaçã

oE

xige

a o

pini

ão d

e es

peci

alis

tas

Éum

trab

alho

car

o e

dem

orad

oU

so d

e lis

tas

de r

efer

ênci

as (

aval

iaçã

o tr

adic

iona

l) co

m a

s m

edid

as tr

adic

iona

is d

e pr

ecis

ão e

rev

ocaç

ão

(rec

all)

traz

ris

cos

List

as s

ão in

com

plet

as, d

evid

o a

cons

tant

e pr

oduç

ão d

e no

vos

term

os

Nos

sa a

valia

ção

foi t

radi

cion

alF

eita

com

um

a lis

ta d

e re

ferê

ncia

com

term

os d

o do

mín

io d

a E

colo

gia,

usa

ndo

as m

étric

as d

e pr

ecis

ão e

rev

ocaç

ão.

Gar

galo

da

área

EA

T

Page 8: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Cen

ário

no

Bra

sil

Um

dos

prim

eiro

s si

stem

as d

e E

AT

(T

ER

MIN

O)

1989

, na

Uni

vers

idad

e de

Que

bec,

Mon

trea

l.

Mui

tos

proj

etos

de

cons

truç

ão d

e re

pert

ório

s te

rmin

ológ

icos

ai

nda

utili

zam

o c

ritér

io s

emân

tico

para

a e

xtra

ção

de

term

os, e

m u

ma

abor

dage

m m

anua

l a p

artir

de

córp

us.

Crit

ério

sem

ântic

o ad

equa

doa

extr

ação

man

ual é

lent

a,

suje

ita à

subj

etiv

idad

e e

àom

issã

o de

term

os im

port

ante

s.

Page 9: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Obj

etiv

o

Ava

liaçã

o de

mét

odos

de

extr

ação

au

tom

átic

a de

term

os (

EA

T)

a pa

rtir

de

córp

us p

ara

a co

nstr

ução

de

onto

logi

as.

Par

a o

trab

alho

te

rmin

ográ

fico

são

fund

amen

tais

, po

is p

erm

item

, por

ex

empl

o, a

con

stru

ção

de d

efin

içõe

s de

um

a fo

rma

sist

emát

ica.

Em

um

pro

jeto

de

cons

truç

ão d

e pr

odut

os

term

inol

ógic

os

cont

extu

aliz

a os

ca

ndid

atos

a te

rmos

le

vant

ados

pel

a E

AT

, aj

udan

do o

esp

ecia

lista

a

aval

iá-lo

s.

Page 10: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

“O

ntol

ogia

s fo

rnec

em u

m v

ocab

ulár

io c

omum

de

uma

área

e de

fine,

com

nív

eis

dist

into

s de

form

alis

mos

, o s

igni

ficad

o do

s te

rmos

e d

osre

laci

onam

ento

s en

tre

eles

.”(G

ómez

-Pér

ez, 1

999)

Con

ceitu

ando

“on

tolo

gia”

“Um

a on

tolo

gia

éo

voca

bulá

rio u

sado

par

a re

pres

enta

r um

cer

to

dom

ínio

do

conh

ecim

ento

e a

conc

eitu

ação

que

est

es te

rmos

pr

eten

dem

cap

tura

r.”

(Cha

ndra

seka

ran,

et a

l. 19

99).

“Ont

olog

ias

são

term

os e

rel

açõe

s qu

e co

mpr

eend

em o

voc

abul

ário

de

uma

área

, com

o ta

mbé

m a

s re

gras

par

a co

mbi

nar

este

s te

rmos

e

rela

ções

par

a de

finir

exte

nsõe

s de

ste

voca

bulá

rio.”

(Nov

ello

, 200

2)

Page 11: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Ont

olog

ias

-O

dom

ínio

-

Por

que

um

dom

ínio

?

Ont

olog

ias

gera

isx

Ont

olog

ias

espe

cífic

as

Ont

olog

ias

gera

is:

Ont

olog

ias

gera

is:

Rep

rese

ntam

gra

ndes

e s

ubst

anci

osos

con

junt

os

Rep

rese

ntam

gra

ndes

e s

ubst

anci

osos

con

junt

os

de e

lem

ento

s.de

ele

men

tos.

Repr

esen

tam

o

sens

o co

mum

de

um

a Re

pres

enta

m

o se

nso

com

um

de

uma

com

unid

ade

soci

olin

gco

mun

idad

e so

ciol

ing ü

íüíst

ica.

stic

a.El

abor

aEl

abor

a çção

le

nta

dada

a

infin

idad

e de

ão

le

nta

dada

a

infin

idad

e de

in

form

ain

form

a ççõe

s co

ntid

as n

o U

nive

rso.

ões

cont

idas

no

Uni

vers

o.

Page 12: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Ont

olog

ias

-O

dom

ínio

-P

or q

ue u

m d

omín

io?

Ont

olog

ias

gera

is x

Ont

olog

ias

espe

cífic

as

Ont

olog

ias

espe

cO

ntol

ogia

s es

pec íí

ficas

:fic

as:

Rep

rese

ntam

co

njun

tos

de

obje

tos

e su

as

Rep

rese

ntam

co

njun

tos

de

obje

tos

e su

as

rela

rela

çç ões

de

um r

eduz

ido

e es

pec

ões

de u

m r

eduz

ido

e es

pec íí

fico

dom

fico

dom

íí nio

.ni

o.Rep

rese

ntam

o

cons

enso

de

um

gr

upo

de

Rep

rese

ntam

o

cons

enso

de

um

gr

upo

de

espe

cial

ista

s de

um

a es

peci

alis

tas

de u

ma

áá rea

res

trita

e e

spec

ial.

rea

rest

rita

e es

peci

al.

Elab

ora

Elab

ora çç

ão

ão ““

rr áápi

dapi

da””

e e ““ s

impl

essi

mpl

es”” ,

um

a ve

z qu

e o

, um

a ve

z qu

e o

nn úúm

ero

de in

form

am

ero

de in

form

a ççõe

s õe

s éé

rest

rito

e lim

itado

.re

strit

o e

limita

do.

Page 13: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Est

e tr

abal

ho fo

i um

exe

rcíc

io p

ara

refin

ar o

am

bien

te e

-ter

mos

, sen

do d

esen

volv

ido

no

NIL

C Oliv

eira

, L. H

. M. e

-Ter

mos

Am

bien

te W

eb

cola

bora

tivo

para

cria

ção

de p

rodu

tos

term

inol

ógic

os.

ICM

C-U

SP

, São

Car

los,

SP

.20

06.

Qua

lific

ação

de

Dou

tora

do.

Page 14: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Eta

pa

1:c

om

pila

ção e

av

alia

ção d

e có

rpus

de

espec

ialid

ade

Eta

pa 2

: ex

traç

ão

auto

mát

ica

de

term

os

Eta

pa 3

: ed

ição d

a onto

logia

e

cate

goriza

ção d

os

term

os

Eta

pa

4:

ger

enci

amen

to d

a base

te

rmin

oló

gic

a

Eta

pa

5:

ediç

ão d

os

verb

etes

e inte

rcâm

bio

de

pro

duto

s

M0

M1

M4

M2

M5

M3

O e

-Ter

mos

O e

-Ter

mos

éum

Am

bien

te C

olab

orat

ivo

Web

(C

ompu

ter-

Sup

port

ed

Col

labo

rativ

e W

ork

-C

SC

W)

com

post

o po

r se

is m

ódul

os d

e tr

abal

ho

inde

pend

ente

s pa

ra a

cria

ção

de p

rodu

tos

term

inol

ógic

os.

Page 15: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Usa

ndo

Ont

olog

ias

a pa

rtir

da

Ext

raçã

o de

Ter

mos

EA

T

corp

us

term

os

candid

atos

onto

logia

M2

M3

Ter

min

ólog

o

Esp

ecia

lista

Page 16: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

da

Pes

quis

a

Fas

e 1

–P

repa

raçã

o: O

Cór

pusE

co

Cór

pusE

co

260.

921

ocor

rênc

ias

•A

Eco

nom

ia d

a N

atur

eza

•E

colo

gia

Ed.

Gua

nabr

a K

ooga

n

•C

órpu

s de

Ref

erên

cia

Page 17: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Tex

tos

didá

ticos

Tex

tos

técn

ico-

cien

tífic

osdo

Lác

io-W

ebC

órpu

sEco

Gên

eros

Page 18: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

Fas

e 1

–P

repa

raçã

o: L

ista

de

Ref

erên

cia

(1)

Livr

os +

G

loss

ário

s

Cri

téri

o S

emân

tico

694

term

os

+Li

sta

de R

efer

ênci

a co

m 1

799

term

os

Dic

ioná

rio O

n-Li

ne d

o Jo

rnal

do

Mei

o A

mbi

ente

1105

term

osT

erm

os

Page 19: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

Fas

e 1

–P

repa

raçã

o: L

ista

de

Ref

erên

cia

(2)

1799

term

os–

Inte

rseç

ão

com

C

órpu

sEco

–E

limin

ação

do

sD

up

licad

os

List

a de

Ref

erên

cia

Fin

al:

520

term

os.

Page 20: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

Fas

e 2

–A

plic

ação

dos

Mét

odos

de

Ext

raçã

oT

rês

Abo

rdag

ens:

Est

atís

tica

Oito

mét

odos

Ling

üíst

ica

Trê

s m

étod

os

Híb

rida

(Lin

güís

tico

+ E

stat

ístic

o)Q

uatr

o m

étod

os

Tot

al d

e 15

mét

odos

.

Page 21: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

Abo

rdag

em E

stat

ístic

a

Cór

pusE

co

BIG

RA

MA

S

UN

IGR

AM

AS

TR

IGR

AM

AS

Fre

ênci

a (c

ort

e em

20)

Fre

ênci

a (1

8)L

og

-lik

elih

oo

d (

53,0

782)

Info

rmaç

ão M

útu

a (0

,009

7)C

oef

icie

nte

Dic

e (0

,168

9)

Fre

ênci

a (1

8)L

og

-lik

elih

oo

d (

113,

2980

)In

form

ação

tua

(0,0

066)

Qua

tro

Med

idas

Est

atís

ticas

do

pac

ote

NS

P

Page 22: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

Abo

rdag

em L

ingü

ístic

a (H

eid

et a

l (19

96);

Kla

vans

e M

ures

an (

2000

))

Cór

pusE

co

PO

S t

agg

er

Cór

pusE

co E

tique

tado

Est

rutu

ras

Lin

ísti

cas

Mar

cad

ore

s E

stru

tura

isP

adrõ

es M

orf

oss

intá

tico

sd

a E

colo

gia

S

top

Lis

t

BIG

RA

MA

S

UN

IGR

AM

AS

TR

IGR

AM

AS

n /

np

/ ad

j / v

erb

n_a

dj /

n_n

/ ad

j_n

/ ad

j_ad

j / n

_ad

v

n_p

rep

_n /

n_p

rep

_np

/ n

_n_a

dj /

n_a

dj_

adj /

n_p

rep

_ad

j

Page 23: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Cla

sses

de

expr

essõ

es e

indi

cado

res

estr

utur

ais

(exp

ress

ões)

Uso

Ger

al (

UG

):as

exp

ress

ões

apre

sent

adas

nes

sa

clas

se p

odem

ser

util

izad

as e

m q

ualq

uer

dom

ínio

de

espe

cial

idad

e.

Con

ceitu

al d

o do

mín

io d

e R

eves

timen

tos

Cer

âmic

os

(CD

):as

exp

ress

ões

enco

ntra

das

ness

a cl

asse

pod

em

ser

aplic

adas

pre

fere

ncia

lmen

te p

ara

córp

us d

o do

mín

io

de R

eves

timen

tos

Cer

âmic

os.

Sin

ais

gráf

icos

(S

G):

ness

a cl

asse

con

side

ra-s

e “(

)”,

“:”

e “-

Page 24: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

56 E

xpre

ssõe

s lin

güís

ticas

e m

arca

dore

s es

trut

urai

s le

vant

ados

; 45

impl

emen

tado

s (T

elin

e, 2

004)

Page 25: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

Abo

rdag

em H

íbrid

a (1

)P

arte

Lin

güís

tica:

Exp

ress

ões

Lin

ísti

cas

Cór

pusE

co

PO

S t

agg

er

Cór

pusE

co E

tique

tado

Seg

ue P

arte

Est

atís

tica…

Sub

-Cór

pus

Page 26: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Met

odol

ogia

Fre

ênci

a

Fre

ênci

aIn

form

ação

tua

Fre

ênci

a

Dua

s M

edid

as E

stat

ístic

as

Abo

rdag

em H

íbrid

a (2

)P

arte

Est

atís

tica:

BIG

RA

MA

S

UN

IGR

AM

AS

TR

IGR

AM

AS

Sub

-Cór

pus

+

ST

OP

LIS

T

Page 27: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Abo

rdag

em H

íbrid

a (3

)P

arte

Lin

güís

tica:

Met

odol

ogia

BIG

RA

MA

S

FIN

AIS

UN

IGR

AM

AS

FIN

AIS

TR

IGR

A M

AS

F

INA

IS

n /

np

/ ad

j / v

erb

n_a

dj /

n_n

/ ad

j_n

/ ad

j_ad

j / n

_ad

v

n_p

rep

_n /

n_p

rep

_np

/ n

_n_a

dj /

n_a

dj_

adj /

n_p

rep

_ad

j

Pad

rões

Mo

rfo

ssin

táti

cos

da

Eco

log

ia

Page 28: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Res

ulta

dos

-G

eral

Ab

ord

agem

Mét

od

os

Pre

cisã

oR

evo

caçã

o

Est

atís

tica

Fre

ênci

a –

un

igra

mas

9,48

34,2

7

Fre

ênci

a –

big

ram

as20

,31

14,4

4

Lo

g-L

ikel

iho

od

–b

igra

mas

20,3

114

,44

Info

rmaç

ão m

útu

a –

big

ram

as20

,31

14,4

4

Dic

e –

big

ram

as20

,31

14,4

4

Fre

ênci

a –

trig

ram

as2,

4110

,23

Info

rmaç

ão m

útu

a –

trig

ram

as2,

4110

,23

Lo

g-L

ikel

iho

od

–tr

igra

mas

2,41

10,2

3

Lin

ísti

caE

xPo

rTer

_lin

ísti

co –

un

igra

mas

2,74

89,1

8

ExP

orT

er_l

ing

üís

tico

–b

igra

mas

1,31

62,2

2

ExP

orT

er_l

ing

üís

tico

–tr

igra

mas

0,89

82,9

5

Híb

rid

aE

xPo

rTer

_híb

rid

o c

/ Fre

ênci

a –

un

igra

mas

12,7

623

,25

ExP

orT

er_h

íbri

do

c/ F

req

üên

cia

–b

igra

mas

41,1

87,

78

ExP

orT

er_h

íbri

do

c/ F

req

üên

cia

–tr

igra

mas

18,7

53,

41

ExP

orT

er_h

íbri

do

c/ I

nfo

rmaç

ão m

útu

a –

big

ram

as1,

68[1

]65

,0

[1]

Cal

cula

da s

em c

orte

.

O d

esem

penh

o ne

stas

ta

refa

s ra

ram

ente

ex

cede

F =

0.6

0

Page 29: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Res

ulta

dos

-15

0 pr

imei

ros

term

os

dos

mét

odos

com

mel

hor

prec

isão

150

can

did

ato

s a

term

os

anal

isad

os

Ab

ord

agem

esta

tíst

ica

Ab

ord

agem

Lin

ísti

caA

bo

rdag

emh

íbri

da

un

igra

mas

42 (

28%

) (>

n)21

(14%

) (n

)45

(30

%)

(>n)

big

ram

as51

(34%

) (n

+ad

j)4

(n+

adj)

19 (

n+ad

j)

trig

ram

as10

(6,

6%)

(n+

prep

+n)

1 (n

+pr

ep+

n)3

(n+

prep

+n)

TO

TA

L10

326

67

Page 30: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Con

side

raçõ

es F

inai

s

A E

AT

alim

ento

u o

delin

eam

ento

da

estr

utur

a ar

bóre

a da

ont

olog

ia

forn

eceu

uni

dade

s te

rmin

ológ

icas

que

se

cara

cter

izar

am c

omo

clas

ses

ou s

ubcl

asse

s, ta

is c

omo:

pop

ulaç

ão, c

omun

idad

e, e

nerg

ia, á

rea,

ec

olog

ia, t

abel

a de

vid

a, e

ntre

out

ros.

Jáa

abor

dage

m li

ngüí

stic

a ca

rece

de

mai

or d

etal

ham

ento

ain

da

para

que

pos

sam

os o

bter

res

ulta

dos

mel

hore

s em

um

a pr

óxim

a te

ntat

iva

de e

xtra

ção.

Em

bora

os

valo

res

dess

a no

ssa

aval

iaçã

o nã

o te

nham

sid

o al

tos,

M

étod

os d

e E

AT

ref

inad

os e

esp

ecia

lizad

os p

ara

os g

êner

os tr

atad

os,

e ta

man

ho d

e có

rpus

em

uso

, po

derá

auxi

liar

de m

anei

ra e

ficaz

o tr

abal

ho d

e ex

traç

ão d

o te

rmin

ólog

o,

pois

são

ráp

idos

. C

ompa

rado

s co

m e

xtra

ção

de te

rmos

com

bas

e no

crit

ério

sem

ântic

o, e

ssa

capt

ura

de u

nida

des

lexi

cais

dem

anda

ria te

mpo

e s

eria

cer

tam

ente

mui

to

mai

s le

nta

e su

bjet

iva.

Page 31: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Tre

cho

do C

órpu

sEco

Seg

undo

o N

ovo

Dic

ioná

rio A

urél

io, u

ma

defin

ição

de “

esta

bilid

ade”

é: “

Pro

prie

dade

ger

al

dos

sist

emas

mec

ânic

os, e

létr

icos

e

aero

dinâ

mic

os, p

ela

qual

o s

iste

ma

reto

rna

ao

esta

do d

e eq

uilíb

rio a

pós

sofr

er u

ma

pert

urba

ção.

" P

oder

íam

os g

ener

aliz

ar e

sta

defin

ição

par

a in

clui

r to

dos

os s

iste

mas

, in

clus

ive

os e

coló

gico

s. (

N. d

o T

.)

Exe

mpl

o de

def

iniç

ão, i

ndic

ador

es e

stru

tura

is e

nfat

izad

os

Page 32: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Des

envo

lvim

ento

de

uma

estr

utur

a co

ncei

tual

(on

tolo

gia)

par

a a

área

de

Nan

ociê

ncia

e N

anot

ecno

logi

a (N

&N

), 2

005

Gên

ero

técn

ico-

cien

tífic

o

Ter

min

olog

ia e

m L

íngu

a P

ortu

gues

a da

Nan

ociê

ncia

e

Nan

otec

nolo

gia:

Sis

tem

atiz

ação

do

Rep

ertó

rio V

ocab

ular

e

Ela

bora

ção

de D

icio

nário

-Pilo

to, 2

006-

2008

.G

êner

o in

form

ativ

o, c

ient

ífico

de

divu

lgaç

ão, t

écni

co-c

ient

ífico

.

Pro

jeto

s fin

anci

ados

do

NIL

C

Page 33: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

N&

N In

glês

6 gr

ande

s en

trad

as:

1. S

ynth

esis

, Pro

cess

ing

and

Fab

ricat

ion

2. M

ater

ials

3. P

rope

rtie

s an

d C

hara

cter

izat

ion

tech

niqu

es4.

Mac

hine

s an

d D

evic

es5.

The

orie

s an

d C

ompu

tatio

nal m

etho

ds6.

App

licat

ions

1907

term

os; c

orpu

s 2,

5 m

ilhõe

s de

pa

lavr

as

Ciê

ncia

s do

s M

ater

iais

, Bio

ciên

cias

, F

ísic

a e

Quí

mic

a T

eóric

as, E

ngen

haria

E

letr

ônic

a e

Ciê

ncia

da

Com

puta

ção

Inte

rfac

e W

eb d

e bu

sca

e vi

sual

izaç

ão h

iper

bólic

a

Dis

poní

vel e

m: w

ww

.nilc

.icm

c.us

p.br

/nan

otec

h

Page 34: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

N&

N P

ortu

guês

Cór

pus

de 2

milh

ões

de p

alav

ras

Uso

de

um c

abeç

alho

par

a os

text

os,

segu

indo

o p

adrã

o do

pro

jeto

Lác

io-W

eb

Pre

visã

o de

500

ent

rada

s pa

ra o

di

cion

ário

pilo

to

Page 35: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Ref

erên

cias

SA

NT

OS

, E. T

. ; B

AR

RO

S, L

. N.;

VA

LEN

TE

, V. C

. P. N

. P

roje

tand

o um

a O

ntol

ogia

de

Geo

met

ria D

escr

itiva

. A

nai

s d

o IV

Co

ng

ress

o In

tern

acio

nal

de

En

gen

har

ia

Grá

fica

nas

Art

es e

no

Des

enh

o (

GR

AP

HIC

A 2

001)

,p.

918-

928,

nov

. 200

1, S

ão P

aulo

, SP

.

CH

AN

DR

AS

EK

AR

AN

, B

.; J

OS

EP

HS

ON

, J. R

.; B

EN

JAM

INS

, V. R

. Wha

t are

ont

olog

ies,

and

why

do

we

need

them

?IE

EE

Int

ellig

ent

Sys

tem

s, p

.20-

25,

Janu

ary/

Feb

ruar

y 19

99.

Page 36: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Mét

odo

ExP

orT

er_l

ingü

ístic

o (T

elin

e, 2

004)

Page 37: Estrutura Ontológica e Unidades Lexicais: uma aplicação … · 2013-03-25 · Representam o senso comum de uma comunidade socioling ... Microsoft PowerPoint - arq0162_slides.ppt

Info

rmaç

ão M

útua

(IM

),Lo

g-lik

elih

ood

(LL)

e D

ice

IMum

a m

edid

a da

qua

ntid

ade

de in

form

ação

que

um

a va

riáve

l con

tém

sob

re

uma

outr

a, s

endo

ela

a r

eduç

ão d

a in

cert

eza

de u

ma

variá

vel r

andô

mic

a de

vido

ao

conh

ecim

ento

da

outr

a.

usad

a in

icia

lmen

te p

ara

extr

ação

de

colo

caçõ

es.

Exi

ste

uma

sobr

epos

ição

ent

re a

s co

loca

ções

e o

s te

rmos

técn

icos

: as

colo

caçõ

es tê

m u

ma

com

posi

cion

alid

ade

limita

da, e

os

term

os té

cnic

os a

ceita

m u

m n

úmer

o lim

itado

de

mod

ifica

dore

s.

Qua

ndo

toda

s as

oco

rrên

cias

de

x e

y sã

o ad

jace

ntes

um

as à

s ou

tras

, a in

form

ação

m

útua

éa

mai

or,

dete

riora

ndo-

se e

m c

onta

s de

bai

xa fr

eqüê

ncia

.

LL, p

or s

e ap

rese

ntar

mai

s ro

bust

a pa

ra e

vent

os d

e ba

ixa

freq

üênc

ia, é

utili

zada

a fi

m d

e am

eniz

ar o

pro

blem

a da

info

rmaç

ão m

útua

qua

ndo

esta

ap

rese

nta

cont

agen

s de

bai

xa fr

eqüê

ncia

.

Coe

ficie

nte

dice

depe

nde

apen

as d

a fr

eqüê

ncia

do

bigr

ama

e da

s pa

lavr

as d

o bi

gram

a.

Dife

rent

emen

te d

o qu

e oc

orre

com

a in

form

ação

mút

ua, e

ssa

med

ida

não

depe

nde

do ta

man

ho d

a am

ostr

a