3 léxico gerativo: modelo, teoria e implementação …€¦ · formal: a(s) característica(s)...

24
3 Léxico Gerativo: Modelo, Teoria e Implementação Proposta Muito da hipótese de extração automática de informação se baseia na assertiva de que a informação semântica é estruturável. Na abordagem gerativa da teoria lexical, a sistematização da informação semântica é tema de vários estudos. Para nossos propósitos, escolhemos usar a abordagem proposta por J. Pustejovsky, denominada de Teoria do Léxico Gerativo. O principal motivo para essa escolha é a independência entre estrutura e processos que inspira sua proposta. Na introdução de seu livro de 1995, Generative Lexicon , Pustejovsky anuncia que proporá uma nova concepção de um sistema semântico-lexical. Dentro de sua concepção, um conjunto de significados, estruturados com uma especificidade maior do que em outras teorias, é a base para a geração de um conjunto maior de significados onde os itens lexicais, antes individualizados, são contextualizados na expressão lingüística. O autor chama a estrutura que especifica os significados individualizados de léxico gerativo e os processos que norteiam a geração dos significados contextualizados de dispositivos gerativos. Em suas próprias palavras: “Após a discussão nestes capítulos, uma concepção de um sistema léxico-semântico emergirá como se segue. Dentro dessa teoria um conjunto de significados de palavras, especificados por uma estrutura interna maior do que a proposta por outras teorias, será usado para gerar um conjunto maior de significados de palavras quando os itens lexicais individuais forem combinados com outros em frases ou sentenças.” (PUSTEJOVSKY, 1995, p.2) i O autor sustenta que o modelo de interpretação semântica concebido deve refletir as propriedades e dificuldades encontradas em uma língua natural. Como o autor considera as línguas naturais como fracamente polifórmicas, isso implica que seu modelo deve ser capaz de gerar um número infinito de significados com um número finito de acepções. Conforme ele comenta no capítulo 7: “O que nós esperamos alcançar é um modelo de significação da língua que capture os processos pelos quais as palavras são capazes de assumir um potencialmente infinito número de sentidos quando em contexto, sendo limitado o número de sentidos realmente armazenados no léxico.” (PUSTEJOVSKY, 1995, p. 105) ii

Upload: nguyenanh

Post on 13-Oct-2018

237 views

Category:

Documents


0 download

TRANSCRIPT

3 Léxico Gerativo: Modelo, Teoria e Implementação Proposta

Muito da hipótese de extração automática de informação se baseia na assertiva de

que a informação semântica é estruturável. Na abordagem gerativa da teoria lexical, a

sistematização da informação semântica é tema de vários estudos. Para nossos propósitos,

escolhemos usar a abordagem proposta por J. Pustejovsky, denominada de Teoria do

Léxico Gerativo. O principal motivo para essa escolha é a independência entre estrutura e

processos que inspira sua proposta.

Na introdução de seu livro de 1995, Generative Lexicon, Pustejovsky anuncia que

proporá uma nova concepção de um sistema semântico-lexical. Dentro de sua concepção,

um conjunto de significados, estruturados com uma especificidade maior do que em

outras teorias, é a base para a geração de um conjunto maior de significados onde os itens

lexicais, antes individualizados, são contextualizados na expressão lingüística. O autor

chama a estrutura que especifica os significados individualizados de léxico gerativo e os

processos que norteiam a geração dos significados contextualizados de dispositivos

gerativos. Em suas próprias palavras: “Após a discussão nestes capítulos, uma concepção de um sistema léxico-semântico emergirá como se segue. Dentro dessa teoria um conjunto de significados de palavras, especificados por uma estrutura interna maior do que a proposta por outras teorias, será usado para gerar um conjunto maior de significados de palavras quando os itens lexicais individuais forem combinados com outros em frases ou sentenças.” (PUSTEJOVSKY, 1995, p.2)i

O autor sustenta que o modelo de interpretação semântica concebido deve refletir

as propriedades e dificuldades encontradas em uma língua natural. Como o autor

considera as línguas naturais como fracamente polifórmicas, isso implica que seu modelo

deve ser capaz de gerar um número infinito de significados com um número finito de

acepções. Conforme ele comenta no capítulo 7:

“O que nós esperamos alcançar é um modelo de significação da língua que capture os processos pelos quais as palavras são capazes de assumir um potencialmente infinito número de sentidos quando em contexto, sendo limitado o número de sentidos realmente armazenados no léxico.” (PUSTEJOVSKY, 1995, p. 105)ii

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

68

As ferramentas que construirão esses sentidos são os chamados dispositivos

gerativos, e é em cima dessa dicotomia estrutura/processo que nosso trabalho se insere.

Usaremos parte do modelo estrutural de Pustejovsky para aplicar processos de nossa

autoria para a recuperação de informação.

Também acreditamos que o modelo de representação proposto por ele é um

modelo que, voltando à questão dos modelos de arquitetura da mente, permitirá a

mesclagem de características tanto da abordagem simbolista quanto da conexionista. A

estrutura proposta por Pustejovsky é simbolista, mas os processos aplicados a ela podem

ser simbolistas ou conexionistas, graças à independência entre eles. Em nosso trabalho,

por exemplo, os processos são basicamente conexionistas: o valor de uma relação lexical

é função das relações estabelecidas entre os itens lexicais no momento do texto, isto é,

não há valores a priori.

Esse capítulo está dividido em duas seções: vamos primeiramente apresentar de

forma resumida o modelo estrutural de Pustejovsky e depois a nossa implementação do

modelo estrutural, com os acréscimos que consideramos necessários. Ao longo dessa

explanação, comentaremos os pressupostos teóricos e as implicações relevantes.

3.1 Introduzindo o Modelo do Léxico Gerativo

A representação estrutural do Léxico Gerativo de J. Pustejovsky caracteriza o

léxico como um sistema modular, abstraído em três níveis de representação, conectados

entre si por um conjunto de estratégias gerativas. As estratégias – que serão os processos

aplicados - constroem a interpretação dos itens lexicais de acordo com o contexto em

que eles se realizam.

Algumas das estratégias gerativas usadas para a construção do significado são:

coerção de significado – a limitação de interpretação de um item causada pela

presença de outro item que o domina.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

69

conexão seletiva – a delimitação do alcance de operação de um item lexical em

uma frase ou estrutura.

co-composição – a composição de um significado novo através da colaboração

entre as estruturas de itens.

Os três níveis de representação propostos no modelo podem ser resumidos como

adiante.

3.1.1 Estrutura argumental

A estrutura argumental em si é independente da sintaxe, apesar de refleti-la em

alguns pontos. Ela pode ser vista como uma especificação mínima da semântica lexical

de um item lexical. Os argumentos propostos são:

TRUE (“verdadeiro”): parâmetros da realização sintática do item lexical.

Ex.: “John arrived late.”

“João chegou tarde.”

Nos exemplos, os argumentos estão em itálico e os itens a que eles se referem estão

sublinhados.

DEFAULT: parâmetros ligados à expressão lógica da qualia (cf seção 3.1.3), mas

que não são necessariamente expressos sintaticamente.

Ex.: “John built the house out of bricks.”

“João construiu a casa com tijolos.”

SHADOW (“sombra”): parâmetros que estão semanticamente incorporados ao

item lexical e, por isso, raramente estão expressos na frase.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

70

Ex.: “Mary buttered her toast with an expensive butter.”

“Choveu uma chuva forte ontem à noite.”

TRUE ADJUNCTS (“adjuntos verdadeiros”): parâmetros que modificam a

expressão lógica proposta, mas que são parte do contexto pragmático (no texto,

situational interpretation ) e não estão presos a nenhum item lexical particular (adjuntos

adverbiais de tempo ou espaço, por exemplo).

Ex.: “Mary drove down to New York on Tuesday.”

“Maria viajou para Nova York na terça-feira.”

3.1.2 Estrutura de eventos

A estrutura de eventos relaciona os valores do item e a ocorrência desses valores

na linha do tempo. Dentro da estrutura de eventos devem-se discriminar os subeventos,

definindo-se estes últimos como:

TIPO(S) DE EVENTO(S): estado, processo e transição (télicos).

ORDEM PADRÃO: definição de hierarquia dos tipos de evento, quando há mais

de um. Expressa-se através da numeração dos eventos E1, E2, .., En.

RESTRIÇÃO DE ORDENAÇÃO: indicação de restrição na ordem cronológica

dos eventos relacionados, ou seja, se os eventos podem ocorrer simultaneamente ou se as

ocorrência é linear.

a) “exaustive ordered part of” (ordenação obrigatória das partes, indicada pelo

símbolo <α ) - a ordem é estritamente linear.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

71

Build Estrutura de Eventos E1=processo E2=estado R=<α

Ex: João constrói sua casa de campo sem pressa. (processo)

A casa foi construída em 1920. (estado)

b) “exaustive overlap part of” (sobreposição das partes, indicada pelo símbolo ° α) -

a execução dos eventos pode ser simultânea.

Accompany Estrutura de Eventos E1=τ 1 E2=τ 2 R=° α

Ex: John will accompany you to the store. (“John irá acompanhar você até a loja.”) Mary accompanied me while I was walking. (Mary me acompanhou enquanto eu caminhava.”)

HEAD (“núcleo”): especificação do subevento que caracteriza o evento destacado

pelo item lexical. Exemplifica-se melhor nos pares como comprar/vender, que se referem

ao mesmo processo visto de pontos diferentes. Ambos têm um ordenação obrigatória das

partes, mas a posição do núcleo define a diferença entre os dois

Sell Estrutura de Eventos Buy Estrutura de Eventos E1=processo E1=processo E2=estado E2=estado R=<α R=<α H=E1 H=E2

Na estrutura de eventos, pretende-se uma representação que seja também flexível

para expressar, quando necessário, as relações entre argumentos e eventos na estrutura

qualia. Essa possibilidade será demonstrada na construção da estrutura qualia.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

72

3.1.3 Estrutura qualia

É um sistema de conhecimento referencial. É composta por quatro papéis: formal,

constitutivo, télico e agentivo. É importante mencionar que cada categoria expressa uma

estrutura qualia e que nem todos os papéis da estrutura qualia de um item são

necessariamente preenchidos. Passemos à descrição dos mesmos.

FORMAL: a(s) característica(s) que distinguem um objeto em um domínio

(tamanho, posição, forma, dimensão).

CONSTITUTIVO: relação entre um objeto e seus constituintes ou partes

(material, peso, componentes ou partes).

TÉLICO: propósito do agente que executa a ação ou função do objeto.

AGENTIVO: fatores envolvidos na origem ou “bringing about” do objeto (criador,

artefato com o qual ele é criado, tipo natural, acontecimento anterior causador).

3.1.4 Sofisticando a especificação

Para lidar com a questão de itens ambíguos, não polissêmicos, o autor propõe

ainda a caracterização do paradigma conceitual lexical (Lexical Conceptual Paradigm –

LCP). O LCP provê um meio de caracterizar um item com uma meta-entrada, onde as

interpretações possíveis estão listadas e cuja seleção é feita através da contextualização.

Por exemplo, sendo a Estrutura Qualia de PORTA:

PORTA Estrutura Qualia Formal: objeto físico Télico: passagem

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

73

Teríamos a seguinte definição de LCP:

LCP: objeto físico.passagem = (objeto físico.passagem, objeto físico, passagem)

Apesar do item lexical PORTA ter mais de uma interpretação possível listada em

sua entrada, os verbos relacionados a ele nas frases indicariam a seleção correta, como

nos exemplos:

Ex: Mary painted the door.

Mary pintou a porta. (objeto físico)

Mary walks through the door.

Mary passou pela porta. (passagem)

A restrição se dará por conta das estruturas argumentais de PAINT (“PINTAR”) e

WALK (“PASSAR”)iii:

PAINT Estrutura Argumental Arg1: x: humano Arg2: y: objeto físico

WALK Estrutura Argumental Arg1: x: animado Arg2: y: passagem

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

74

3.2 A implementação da Teoria em nosso estudo

No início desse capítulo, afirmamos que a nossa escolha da Teoria do Léxico

Gerativo foi motivada pela independência entre estrutura e processos que inspira sua

proposta. Isso é importante por acreditarmos que um modelo de representação assim

proposto seria um modelo que permitiria a mesclagem de características das abordagens

simbolistas e conexionistas, caminho que consideramos adequado.

Com relação aos modelos de arquitetura da mente, a teoria subjacente e a

representação estrutural propostas no Léxico Gerativo realmente atendem a nossas

expectativas básicas a respeito de um sistema para recuperação da informação. A teoria

segue o modelo classicista, pois seu modelo de representação do objeto propõe uma

estrutura que lida com uma representação mental composta por combinações sintáticas e

semânticas, cujo conteúdo semântico é uma função tanto do conteúdo semântico de suas

partes quanto de sua constituição estrutural.

Paralelo a isso, apropria-se de um dos pontos fortes do modelo conexionista: o

conteúdo semântico também é resultado direto das relações estabelecidas, ou seja, da rede

que o constitui. Com isso temos um resultado único para cada rede, como é de esperar,

mas com a possibilidade de usar o conhecimento acumulado em um processo de

inferência para uma rede similar.

Com relação à independência entre estrutura e processos da proposta do Léxico

Gerativo, a própria inspiração gerativista já seria suficiente para atestá-la. Acreditando-se

que um número finito de informações a que se aplicam processos pode gerar um número

infinito de informações, não se pode supor um número finito de processos ou restringir de

alguma forma suas implementações.

Não temos certeza se essa seria a intenção inicial do autor em sua proposta, mas

não podemos nos furtar a apontar as potencialidades da mesma, tanto mais que esse

trabalho é fruto dessas potencialidades.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

75

3.2.1 A motivação das escolhas

O objetivo em nosso trabalho é demonstrar que as relações lexicais podem ser

sistematizadas e que sua utilização pode produzir resultados interessantes e significativos

em processos de recuperação de informação lingüística. Para alcançarmos nosso objetivo,

consideramos necessária a construção de um léxico computacional, ou parte de um, como

veremos, que nos permita estabelecer essa relações. Nosso léxico computacional seria

inspirado na proposta da teoria do léxico gerativo, já apresentada na seção anterior.

Porém, a informação lexical que nos interessava estava basicamente contida em

um dos níveis de representação propostos na teoria: a estrutura qualia. Daí, a

implementação do nosso léxico computacional ter sido baseada somente em um dos

níveis de representação do modelo. Como nosso objetivo, no momento, é limitado ao

estabelecimento de relações lexicais, sem compromissos com a produção ou análise, isso

pode ser feito. Elegemos a estrutura qualia para essa tarefa, pelos motivos que exporemos

a seguir.

3.2.1.1 Por que a estrutura qualia

É evidente que todos os níveis de representação da Teoria do Léxico Gerativo são

importantes para um modelo final, mas para nosso propósito atual, a utilização da

estrutura qualia já é suficiente. É importante lembrar que o objetivo é demonstrar a

possibilidade ou impossibilidade da recuperação de informações baseada nas informações

lexicais, que podem ser obtidas em um léxico computacional e não proceder à construção

de um léxico computacional.

Considerando a construção de relações lexicais como propósito, e prevendo um

processo de recuperação baseado no léxico somente, ou seja, sem a necessidade de

recorrer a outros domínios como a sintaxe ou morfologia, a escolha da estrutura qualia se

justifica porque:

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

76

Ela é o mecanismo em que se manifesta mais diretamente a correlação estrutural

entre os itens lexicais.

A estrutura qualia contém parte da informação semântica que caracteriza o item.

A informação semântica contida na estrutura qualia é, para os nossos propósitos,

independente das informações contidas em outras estruturas. Por isso, o uso dessas

informações isoladamente é possível.

Paralelo a essas características, o conteúdo formal da estrutura qualia de um item

pode ser composto por outros itens lexicais, daí a possibilidade de mapeamento entre os

itens do léxico para a construção de redes de relacionamento. A vantagem desse

mapeamento, com relação ao que é feito em um thesaurus, estaria no fato de que ele seria

automatizado. Com isso, as possibilidades de cruzamento são ilimitadas e produtivas para

qualquer texto.

Os outros níveis de representação tiveram como fator contra a sua escolha os

seguintes pontos:

a estrutura argumental é composta de informações relacionadas ao nível sintático

e não semântico. Suas informações serão primordiais num processo de parsing do texto,

por exemplo, etapa que não abordaremos nesse trabalho;

a estrutura de eventos também carrega um tipo de informação semântica, mas

com um caráter restritivo e não informativo. Ela restringe os candidatos possíveis à

composição lexical com o item em questão, e também poderá ser largamente utilizada em

etapas de análise de textos, como o parsing, que não abordaremos nesse trabalho.

3.2.2 A estrutura qualia em nossa análise

Cabe agora refletirmos melhor sobre os papéis da estrutura qualia, conforme

propostos por Pustejovsky, para explicitar e justificar nossas classificações.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

77

A estrutura qualia se pretende um sistema de conhecimento referencial através do

qual devemos poder compreender um objeto e sua posição no mundo. É importante

ressaltar que a estrutura qualia é um instrumento para essa compreensão. Ela não deve, de

acordo com a visão do autor, ser entendida como o significado completo do item lexical.

Segundo o autor, para que o significado de um item exista, o item deve estar

contextualizado e os processos gerativos devem ser aplicados. Concordamos com essa

alegação do autor, mas ressaltamos a existência de um conhecimento extralingüístico que

é de fundamental importância para essa composição e que não é previsto nesse processo.

Devemos encarar a estrutura qualia, assim como os outros níveis de representação

propostos na teoria, como um leque de possibilidades, que serão ativados ou não de

acordo com a utilização do item.

Dentro desse esquema, existe a possibilidade de um item ser subespecificado,

underspecified segundo o autor, isto é, de não ter todos os papéis preenchidos. Esses

itens terão os papéis incompletos preenchidos de acordo com os outros itens com que se

relacionarem no momento da produção lingüística.

Os papéis da estrutura qualia baseiam-se, segundo o autor, nos quatro sentidos ou

dimensões da causalidade propostos na Teoria das Quatro Causas por Aristóteles.

Segundo Marcondes (1997), as quatro causas poderiam ser assim resumidas:

“1. causa formal: Trata-se da forma ou modelo que faz com que a coisa seja o que é. É a resposta à questão: o que é x?. 2. causa material: É o elemento constituinte da coisa, a matéria de que é feita. Responde à questão: de que é feito x? 3. causa eficiente: Consiste na fonte primária da mudança, o agente da transformação da coisa. Responde à questão: porque x é x? Ou o que fez com que x viesse a ser x? 4. causa final: Trata-se do objetivo, propósito, finalidade da coisa. Responde à questão para que x? A visão aristotélica é fortemente teleológica (do grego telos finalidade), isto é, supõe que tudo na realidade possui uma finalidade. A natureza apresenta uma regularidade, uma ordem, e isso não pode ser obra do acaso: deve existir um propósito.”(MARCONDES, 1997, p. 73-4)

A Teoria das Quatro Causas tem evidentemente seus problemas de aplicação em

um mundo em que não exista a mesma regularidade idealizada por Aristóteles.

Observaremos essas dificuldades basicamente em conceitos abstratos, construtos teóricos

ou morais. Lembramos aqui as colocações de Fodor e Lepore (1998), quando

argumentam sobre a questão das relações semânticas interlexicais. Os autores apontam

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

78

que há uma dúvida razoável sobre “(...) quais são as relações interlexicais relevantes, ou

como elas devem ser individualizadas.”(FODOR e LEPORE, 1998, p. 274)iv Até termos

um limite mais preciso sobre o que está realmente expresso na língua e o que está no

conhecimento dos falantes sobre o mundo, teremos esse questionamento.

Passemos à especificação dos papéis da estrutura qualia, analisando os exemplos e

definições do autor, acompanhados de nossos comentários e observações.

Apresentaremos também nossos critérios para classificação de nosso corpus.

Quanto a essa questão, nunca é demais lembrar que a estrutura qualia não deve ser vista

como o significado de um item lexical, ela é um sistema de conhecimento referencial.

Isso significa que ela proverá informações sobre o item, mais especificamente sobre os

relacionamentos que ele pode acionar. Conforme o autor: “(...) a representação estrutural

que provê a força relacional de um item lexical” (PUSTEJOVSKY, 1995, p. 76)v.

Exemplificando, se alguém souber quem é o pai de X, o endereço de X, a idade de X,

saberá sobre X, mas não saberá necessariamente quem é X. Os processos pelos quais o

autor sugere que a estrutura qualia será útil na atribuição de um significado são

posteriores à classificação. Por isso, a pergunta a ser feita frente a uma classificação é que

tipo de relacionamento ela acarreta. Se o relacionamento for verdadeiro, ela é correta, se

não for, é incorreta. Verificaremos essa aplicação em nossos exemplos.

Algumas escolhas podem, por vezes, parecer imotivadas, arbitrárias, ou subjetivas

demais, e podem ser questionadas. Mas o importante é que alguma relação entre os dois

itens possa ser estabelecida, e que se mantenha uma coerência entre as classificações. Daí

a necessidade de se discutirem os critérios. Como já afirmamos em nosso capítulo II,

mais importante que a terminologia usada é a clareza e coerência de critérios.

Antes de começarmos, devemos informar uma decisão que tomamos no início das

classificações: não utilizar itens lexicais que não estivessem presentes no corpus. O

objetivo dessa restrição era evitar um processo em cascata de classificação de itens que

não poderiam ser testados no ambiente atual. Um processo em cascata acontecia quando

um item que não estava classificado ainda era o melhor candidato para a definição de

algum papel de outro item. Caso esse item pudesse ter mais de uma acepção, a

classificação era elemento chave para a diferenciação. Quando isso acontecia,

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

79

interrompíamos a classificação do item atual para classificar o item que ocuparia o papel

determinado. Esse processo poderia ser repetido na classificação dos papéis desse último

item e assim por diante. Por exemplo, mês pedia a classificação de dia, com a

diferenciação de dia – 24 horas - e dia –12 horas. Para classificar dia – 24 horas -,

classificamos também noite para compor com dia –12 horas.

Supondo a classificação de um item X, cujo papel formal tivesse um candidato Y

que não se encontrasse em nosso corpus, a inclusão do item Y pediria que ele também

fosse classificado, e se ele pedisse outro item W que também não se encontrasse em

nosso corpus, teríamos um processo em cascata de classificação inócua, pois não existiria

a possibilidade de seu uso na construção de uma rede lexical em nossos textos. Por esse

motivo evitamos ao máximo classificar itens que não constassem previamente em nosso

corpus. Voltaremos à questão de corpus e sua composição no capítulo IV.

Os exemplos de nossa classificação usados abaixo estão limitados às ocorrências

do próprio corpus. Sendo assim, alguns papéis podem estar incompletos ou vazios,

mesmo que pudessem ser preenchidos. Mas podemos acreditar que as classificações são

corretas, dentro do universo conhecido, só não podemos pretendê-las completas. Nos

exemplos usados, o papel télico será precedido da notação [x], onde x será a inicial do

nome do papel e as MetaEntradas (cf. capítulo II, seção Sobre a delimitação da unidade

lexical e capítulo IV) serão precedidas de [Me].

3.2.2.1 Papel Télico

O papel télico é o de mais simples compreensão inicial, mas também é o de mais

difícil classificação. O autor coloca que o papel télico deve refletir o propósito do agente

que executa a ação ou a função do objeto. Essa definição aparentemente simples reflete

fortemente a visão aristotélica e traz, para o momento da aplicação, algumas questões

filosóficas importantes. Qual seria, por exemplo, o papel télico de pessoa, ordinária ou

maior?

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

80

Levada ao pé da letra, a definição dada para o papel télico tem sua aplicação

muito restrita a duas categorias gramaticais: o propósito do agente que executa a ação

refere-se a verbos; e a função do objeto refere-se aos substantivos que possam ser

considerados objetos. Substantivos abstratos ou representativos de conceitos, como

pessoa, tornam-se de difícil classificação. Buscando apoio nos exemplos dados por

Pustejovsky no texto, encontramos algumas especificações de estrutura qualia, que

estarão listadas nos anexos deste trabalho. Os exemplos encontrados parecem comprovar

nossa interpretação: os substantivos MAN, HAND, BROTHER, EXAMINATION e

EXAM não têm papel télico definido; já os substantivos NOVEL, BEER, KNIFE,

BOOK, CAR, CAKE, TYPIST, RECORD e NEWSPAPER têm.

Em outra parte do texto, o autor coloca que “o qualia télico define qual é o

propósito ou função de um conceito, se existe algum associado a ele.” (PUSTEJOVSKY,

1995, p. 99)vi. Logo depois, porém, o autor cria uma complicação ao dizer que: “Mais do que demonstrar as funções semânticas associadas com um item lexical (ou conceito) em termos de descrições tradicionais de papéis temáticos, eu acredito que o conhecimento lexical contém os modos de explanação associados a uma palavra.”(PUSTEJOVSKY, 1995, p. 99). Grifos nossosvii.

Essa nova colocação gera uma dúvida: devemos considerar o item lexical, ou o

conceito a que ele se refere? No caso dos adjetivos, para se definir um papel télico,

deveríamos analisar o conceito expresso, ou os adjetivos não devem ter uma classificação

para o papel télico? Um adjetivo é um modificador, portanto a função da palavra é a

noção expressa por ela que é acrescida ao modificado? Exemplificando, com o adjetivo

maior, poderíamos dizer que o papel télico dele é COMPARAR, e o de ordinária, em

mulherzinha ordinária é DEPRECIAR? Parece que, como a definição do que seria o

papel télico transita entre os limites do léxico e da semântica, gera-se uma confusão na

classificação.

Conforme apontado por Fodor e Lepore (1998) “o problema de distinguir entre o

que a língua informa a alguém do que esse alguém sabe sobre o mundo”(FODOR e

LEPORE, 1998, p. 274)viii é uma das grandes questões para uma teoria semântica.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

81

Parece-nos que há aqui uma interferência entre os conceitos de significado e referência,

conforme já observamos em nosso capítulo II.

Como a classificação se baseia na Teoria das Quatro Causas de Aristóteles, ela

herda os pressupostos da Teoria de que tudo na natureza teria uma finalidade e o papel

télico seria preenchido com essa referência ao mundo exterior. A questão é que os

adjetivos, assim como alguns substantivos, não existem na natureza; são uma

representação de relações e escala de valores, portanto a referência se esvazia como uma

representação concreta.

Logicamente, é perfeitamente viável, dentro da proposta do Léxico Gerativo, que

alguns itens lexicais não tenham o papel télico preenchido. Mas não há sentido em

estabelecer uma regra que é uma exceção para a maior parte dos casos. Assim, para

efeitos de coerência na classificação, ampliamos o conceito de papel télico, assumindo

que ele deve refletir outras noções, de maneira a ser aplicado para outras categorias além

do verbo e substantivos, conforme demonstraremos adiante. Acreditamos que nossa

proposta é somente uma releitura da proposta original.

Tornamos a lembrar que os itens lexicais listados nos exemplos, tanto para o item

classificado como para o papel, são representações da MetaEntrada, cf. capítulo II. Por

vezes, uma classificação poderá parecer inadequada por conta da classe gramatical do

item, por exemplo, [Me] mole - [t] flexionar, onde o uso do adjetivo como MetaEntrada

dá um efeito de estranhamento. Se, em vez de mole, a forma verbal amolecer fosse usada,

talvez não existisse esse estranhamento.

As classificações propostas são discriminadas abaixo com os exemplos. Faremos

alguns comentários quando julgarmos pertinentes.

• o propósito do agente que executa a ação [Me] votar – [t] escolher – o propósito de quem vota é escolher.

[Me] chegar – [t] lugar – o propósito de quem chega é um lugar/

destino.

[Me] corte – [t] separar – o propósito de quem corta é separar.

[Me] costura – [t] criação – o propósito de quem costura é criar.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

82

• o propósito da situação que cria o conceito seria uma situação de herança [Me] aluno – [t] aprender – o propósito do aluno na situação que o

cria – educação/ escola – é aprender.

[Me] aula – [t] ensino – o propósito da aula na situação que a cria –

educação/ escola – é o ensino.

a função/utilidade de um objeto, conceito, entidade

[Me] veículo – [t] transporte – a função de veículo é transportar

[Me] abano – [t] refrescar – a função de abano é refrescar

[Me] abajur – [t] iluminar – a função de abajur é iluminar

[Me] boletim – [t] informação – a função de boletim é informar

[Me] resposta – [t] informar – a função de resposta é informar

[Me] mente – [t] processo – a função de mente é processar

[Me] tetas – [t] alimentação – a função de tetas é alimentar

[Me] bordado – [t] enfeite – a função de um bordado é enfeitar uma

peça

[Me]boca – [t] comer – a função de boca é comer/ingerir alimentos

[Me] cabeça – [t] controle – a função de uma cabeça é controlar

outros componentes, seja num corpo ou num sistema

[Me] cadastro – [t] consulta – a função de um cadastro é servir para

consultas posteriores

[Me] campanha – [t] opinião – a função de uma campanha é a de

formar uma opinião

[Me] carne – [t] suporte – a função da carne, em um corpo, é

sustentar os órgãos

[Me] osso – [t] suporte – a função dos ossos é sustentar um corpo

[Me] mercado – [t] comércio – a função de uma cabeça é controlar

outros componentes, seja num corpo ou num sistema

O exemplo da [Me] mente parece um bom exemplo para o teste de validação da

classificação proposta anteriormente. A relação mente e processo é verdadeira? A

resposta é sim; mesmo que se questione uma definição para mente e para processo, há

uma relação. Para o exemplo [Me] boca, poderia-se propor também a escolha de [t] falar,

mas teríamos que fazer uma discriminação entre humanos e outros seres vivos.

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

83

a função do conceito em um domínio:

[Me] mês – [t] medida (de tempo) - dentro do domínio tempo, mês

serve como uma unidade de medida

[Me] milênio – [t] medida (de tempo) - dentro do domínio tempo,

milênio serve como uma unidade de medida

[Me] altura – [t] medida (de distância) - dentro do domínio distância,

altura serve como uma medida

[Me] sábado – [t] contar (dia na semana) - dentro do domínio

semana, sábado serve para a contagem dos dias

[Me] abril – [t] contar (mês no ano) - dentro do domínio ano, abril

serve para a contagem dos meses

[Me] endereço – [t] localizar (no espaço) - dentro do domínio

espaço, endereço serve para localização

No caso das [Me] sábado e [Me] abril, o papel formal de cada uma remeterá aos

itens dia e mês, respectivamente. Estes últimos, por sua vez, serão parte do papel

constitutivo de semana e ano, respectivamente. Através desse caminho, a relação se

estabelecerá. Para o exemplo da [Me] altura, é preciso especificar direção da distância –

vertical - no papel formal.

Outra proposta, mais discutível, seria “objetivos a alcançar”:

[Me] exemplo - [t] modelo – o objetivo a alcançar com um exemplo

é ter um modelo

[Me] garantia - [t] certeza – o objetivo a alcançar com uma garantia

é dar uma certeza.

[Me] trabalho - [t] pagamento – o objetivo a alcançar com o trabalho

é o pagamento

[Me] vender - [t] lucro – o objetivo a alcançar com uma venda é o

lucro

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

84

[Me] vício - [t] satisfação – o objetivo a alcançar com um vício é

uma satisfação

3.2.2.2 Papel Constitutivo

O papel constitutivo deve dar conta da relação entre um objeto e seus

constituintes ou partes (material, peso, componentes ou partes), conforme o autor.

ESTRUTURA QUALIA de MÃO Formal Constitutivo Télico Agentivo

membro

Parte_do (corpo)

ESTRUTURA QUALIA de BOLO Formal Constitutivo Télico Agentivo

Comida

Massa

Comer

Ato_de_fazer_o_bolo

Estabelecemos também em nossa classificação a diferenciação entre elemento

contido (<) e elemento que contém (>), conforme o exemplo abaixo:

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

85

ESTRUTURA QUALIA de SEMANA

Formal Constitutivo Télico Agentivo

Período Dia (<) Mês (>) Tempo (>) Medida

Até o momento, considerando conceitos concretos, esse papel foi o menos

problemático em termos de classificação. As falhas que podem ter ocorrido são falhas de

não especificação, mas não de dúvidas. Já em relação a conceitos abstratos, algumas

controvérsias podem surgir, como no exemplo a seguir, onde consideramos que os itens

[c] compra e [c] venda são parte do conceito de [Me] comércio.

ESTRUTURA QUALIA de COMÉRCIO Formal Constitutivo Télico Agentivo

Troca Compra (<) Venda (<) Lucro Economia

Novamente a resposta para a pergunta de validação é positiva: há uma relação

entre o par compra/venda e comércio. Outros exemplos interessantes seriam:

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

86

[Me] enviar – [c] remetente(<), [c] destinatário (<), [c] conteúdo(<)

[Me] universidade - [c] graduação(<), [c] pós-graduação(<), [c]pesquisa (<)

[Me] viver – [c] morte, [c] viver

[Me] mercado - [c] mercadoria (<), [c] mercador (<)

3.2.2.3 Papel Agentivo

O papel agentivo seria o responsável pela identificação dos fatores envolvidos na

origem ou “bringing about” do objeto (criador, artefato com o qual ele é criado, tipo

natural, acontecimento anterior causador). Os exemplos dados por Pustejovsky são, em

alguns casos, auto-referentes: build_act (“ato_de_construir”) para BUILD (“construir”),

bake_Act (“ato_de_fazer_o_bolo”) para BAKE (“bolo”) etc. Um exemplo mais claro

dado pelo autor é o de NOVEL (“romance”)

ESTRUTURA QUALIA de NOVEL (“romance”) Formal Constitutivo Télico Agentivo

Livro Narrativa Ler Escrever

Em nosso corpus, consideramos como agentivos também uma situação sem a qual

consideramos o conceito referente ao item lexical impossível, conforme se pode verificar

nos itens amizade e aluno:

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

87

ESTRUTURA QUALIA de ALUNO Formal Constitutivo Télico Agentivo

homem aprender educação

ESTRUTURA QUALIA de AMIZADE Formal Constitutivo Télico Agentivo

relação Juntar Companhia

Outras classificações seriam:

[Me] internacional - [a] nação – para existir o internacional é preciso ter uma

nação

[Me] mãe - [a] grávidas – para ser mãe é preciso estar grávida antes

[Me] maior - [a] comparação – para ser maior é preciso ser comparado com algo

[Me] mandar - [a] poder – para mandar é preciso ter poder

[Me] matrícula - [a] escola – para existir uma matrícula é preciso uma escola

[Me] arma - [a] medo – para se criar uma arma é preciso ter medo de algo ou

alguém

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

88

3.2.2.4 Papel Formal

O papel formal deve remeter à característica que distingue um objeto em um

domínio. Tratando-se de substantivos, esse papel ora reflete seu argumento, ora explicita

a forma como os argumentos se relacionam.

A dificuldade dessa classificação é a escolha do domínio, que definirá a(s)

característica(s) a escolher. Consideremos o item carne, conforme classificado em nosso

corpus.

ESTRUTURA QUALIA de CARNE

Formal Constitutivo Télico Agentivo

Mole Animal Músculos Corpo Suporte

Porque mole e animal? Mole porque, se escolhermos o domínio corpo, temos uma

grande oposição entre osso – duro e carne - mole. Se pensarmos no domínio seres vivos,

temos carne como característica de animais em oposição a vegetais e minerais. Outras

pessoas irão pensar em outros domínios; por exemplo, poderíamos acrescentar comestível

em oposição, por exemplo, a cabelo, não comestível.

Mesmo entendendo que a classificação é correta, resta a necessidade de

estabelecer qual domínio deve ser considerado para a compreensão do papel. Uma vez

que o entendimento não é imediato por falta de informação, deve-se propor a inclusão da

mesma. Pode-se pensar, por exemplo, em associar o domínio ao papel formal; dessa

maneira teríamos:

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

89

ESTRUTURA QUALIA de CARNE Formal Constitutivo Télico Agentivo

Corpo/mole Seres/Animal Músculos Corpo Suporte

Ainda assim, restariam as questões de qual nome dar ao domínio e de como defini-

lo. Não implementamos essa diferenciação em nosso léxico por não termos certeza se

essa seria a melhor maneira de formalizar essa relação. A falta da definição do domínio já

havia sido apontada por Fodor e Lepore, 1998, com outro objetivo, em sua crítica à

Teoria do Léxico Gerativo, conforme se segue:

“Mas quaisquer palavras podem ser alternadas, salve veritate, em algum contexto; e.g., elefantes e asteróides alternam-se no contexto são, na maior parte das vezes, maiores do que uma caixa de pão. JP poderia evitar essa objeção se tivesse uma estratégia para individualizar ‘domínios’ semânticos; mas nós apostamos que ele não tem.” (FODOR e LEPORE, 1998, p. 274)ix

Ainda sobre o papel agentivo, no caso de um par tipo/subtipo como carro/Honda,

dia/domingo, o papel formal do subtipo (Honda, domingo) será o tipo (carro, dia); dessa

maneira o subtipo herda as características do item de onde se origina. Essa estratégia não

só é econômica, como principalmente garante que as modificações que possam ocorrer na

definição do tipo se reflitam imediatamente no subtipo.

Incluímos então em nossa classificação a diferenciação entre subtipo e

característica para expressarmos a relação apontada. Subtipos são marcados com @ nos

exemplos abaixo:

garoto – [a] homem@ , [a] novo

universidade – [a] escola@, [a] superior

abelha –[a] inseto@

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA

90

i “Given the discussion in these chapters, the following conception of lexical semantic systems emerges. Under such a theory, a core set of word senses, typically with greater internal structure than is assumed in previous theories, is used to generate a larger set of word senses when individual lexical items are combined with others in phrases and clauses.” (PUSTEJOVSKY, 1995, p.2) ii What we hope to achieve is a model of meaning in language that captures the means by which words can assume a potentially infinite number of senses in context, while limiting the number of senses actually stored in the lexicon.” (PUSTEJOVSKY, 1995, p. 105) iii Optamos por uma tradução livre em nome da clareza do exemplo. iv “ (…) which interlexical relations are the semantically relevants ones, or how they should be individuated.” (FODOR e LEPORE, 1998, p. 274) v “(…) the structured representation which gives the relational force of a lexical item “(PUSTEJOVSKY, 1995, p. 76) vi “the TELIC quale defines what the purpose or function of a concept is, if there is such a constraint associated with it.” (PUSTEJOVSKY, 1995, p. 99). vii “Rather than viewing the semantic functions associated with a lexical item (or concept) in terms of traditional thematic roles descriptions, I have argued that lexical knowledge encodes the modes of explanation associated with a word.” (PUSTEJOVSKY, 1995, p. 99). Grifos nossos viii “the problem of distinguishing what the language tells one from what one knows about the world.” (FODOR e LEPORE, 1998, p. 274) ix “But any two words can be substituted, salve veritate, in some context; e.g., elephants and asteroids substitute in the context are often bigger than a breadbox. JP could avoid this objection if he had an account of how to individuate semantic “domains”; but we bet he hasn’t.” (FODOR e LEPORE, 1998, p. 274)

DBD
PUC-Rio - Certificação Digital Nº 9815999/CA