computaÇÃo da polissemia regular em · contrariamente, uma palavra podia comportar diferentes...
TRANSCRIPT
SANDRA CRISTINA DOS SANTOS ANTUNES
COMPUTAÇÃO DA POLISSEMIA REGULAR EM
PORTUGUÊS
Dissertação de Mestrado em Linguística
(Área de Especialização: Processamento e Tecnologia das Línguas Naturais)
Apresentada à Faculdade de Letras da Universidade de Lisboa
Orientador: Professora Doutora Palmira Marrafa
2002
SANDRA CRISTINA DOS SANTOS ANTUNES
COMPUTAÇÃO DA POLISSEMIA REGULAR EM
PORTUGUÊS
Dissertação de Mestrado em Linguística
(Área de Especialização: Processamento e Tecnologia das Línguas Naturais)
Apresentada à Faculdade de Letras da Universidade de Lisboa
Orientador: Professora Doutora Palmira Marrafa
2002
AGRADECIMENTOS
Terminado este trabalho, não posso deixar de tornar presentes todos aqueles
que, de uma forma ou de outra, contribuíram para a sua realização, manifestando aqui
o meu reconhecimento.
À Professora Doutora Palmira Marrafa, minha orientadora, agradeço o
encorajamento e todas as sugestões e correcções que ajudaram a estruturar este
trabalho. Agradeço também o cuidado com que leu as sucessivas versões deste
trabalho e a sua crítica constante.
À Doutora Fernanda Bacelar agradeço o incentivo e a sensibilidade que sempre
demonstrou, permitindo que interrompesse a minha actividade no CLUL na fase final
de elaboração deste trabalho.
Aos meus colegas e companheiros de mestrado e do CLUL, nomeadamente à
Amália Mendes, à Florbela Barreto, à Rita Veloso e à Sara Mendes, agradeço a
motivação, a compreensão e o carinho sempre demonstrados, bem como todas as
sugestões sempre pertinentes e oportunas. À Raquel Amaro deixo um agradecimento
muito especial pela leitura sempre atenta de algumas partes deste trabalho, bem como
todo o apoio e ajuda essenciais na sua fase final. Ao Rui Chaves, pela sua inestimável
amizade, compreensão e motivação, bem como todos os “safanões” que nos momentos
mais críticos me ajudaram a ir para a frente. Agradeço também todas as leituras que fez
deste trabalho e todas as sugestões que em muito o beneficiaram.
À Ana Rosa e à Manuela Gonzaga agradeço o apoio e todas as sugestões feitas
após a leitura deste trabalho, sempre com o seu espírito crítico de linguistas.
Aos meus pais, pelo apoio, incentivo e carinho absolutos, de quem só quer o
melhor para mim.
Ao Jorge, uma inesgotável fonte de apoio, pelo carinho, compreensão,
preocupação e dedicação constantes e por ter feito sempre tudo o que esteve ao seu
alcance para que eu pudesse levar este barco a bom porto.
“When I use a word,” Humpty Dumpty said, in rather a scornful tone, “it
means just what I choose it to mean, neither more nor less”.
“The question is” said Alice, “whether you can make a word mean so many
different things”.
“The question is” said Humpty Dumpty, “which is to be master – that’s all”.
Lewis Carrol, Alice’s Adventures in Wonderland
ix
ÍNDICE
1. INTRODUÇÃO.............................................................................................................................. 1
1.1. Objecto de Estudo .......................................................................................................... 3
1.2. Metodologia e Selecção dos Dados ............................................................................. 9
1.3. Organização ................................................................................................................... 10
2. PROBLEMÁTICA ........................................................................................................................ 13
2.1. A Questão da Polissemia ............................................................................................. 14
2.2. Polissemia e Vaguidade ............................................................................................... 15
2.3. Polissemia e Homonímia ............................................................................................. 19
2.4. Polissemia e Contexto .................................................................................................. 22
2.5. Polissemia nas Categorias Sintácticas ....................................................................... 27
2.5.1. Polissemia Nominal ........................................................................................ 27
2.5.2. Polissemia Verbal ............................................................................................ 34
2.5.3. Polissemia Adjectival ...................................................................................... 37
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO ............................................................... 47
3.1. Léxico Enumerativo de Sentidos ................................................................................ 48
3.2. Regras Lexicais .............................................................................................................. 53
3.3. Léxico Generativo ......................................................................................................... 58
3.3.1. Níveis de Representação ................................................................................. 59
3.3.1.1. Estrutura Argumental ..................................................................... 61
3.3.1.2. Estrutura Eventiva ........................................................................... 64
3.3.1.3. Estrutura Qualia ................................................................................ 69
3.3.2. Sistema de Tipos Semânticos e Herança Lexical ........................................ 72
3.3.3. Paradigma Léxico-Conceptual (PLC) ........................................................... 74
3.3.4. Mecanismos Generativos ............................................................................... 76
3.3.4.1. Coerção de Tipo ................................................................................ 76
x
3.3.4.2. Coerção de Subtipo ........................................................................ 80
3.3.4.3. Coerção de Complemento .............................................................. 82
3.3.4.4. Co-composição ................................................................................. 85
3.3.4.5. Ligação Selectiva .............................................................................. 91
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO .................................................................... 95
4.1. Tipos Nominais Complexos ...................................................................................... 95
4.1.1. Selecção Semântica e Interpretação de Tipos Complexos ....................... 99
4.1.2. O Papel Constitutivo ..................................................................................... 101
4.2. Adjectivos Relativos e Modificadores de Propriedade ......................................... 104
4.2.1. Transcrição de Tipo ....................................................................................... 106
4.2.2. Posição do Adjectivo ..................................................................................... 108
4.2.2.1. Nomes com o Tipo Simples ‘Indivíduo’ ..................................... 108
4.2.2.2. Nomes com o Tipo Simples ‘Estado’ ........................................... 110
4.2.2.3. Nomes que Denotam Pares ‘Indivíduo’ – ‘Estado’ ................... 111
4.3. Causativos Aspectuais ............................................................................................... 113
4.3.1. Algumas Questões sobre a Coerção ........................................................... 114
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS ......................................... 121
5.1. Tipos Complexos e Co-predicação .......................................................................... 122
5.2. Polissemia Construcional (Modulação de Significados) ...................................... 127
5.2.1. Polissemia Construcional Adjectival .......................................................... 127
5.2.2. Polissemia Construcional Verbal ................................................................. 129
5.2.3. Polissemia Construcional Nominal ............................................................. 130
5.3. Extensão de Significados (Alteração de Significados) ........................................... 131
5.3.1. Extensão de Significados Nominais ............................................................ 133
5.3.2. Metáforas ........................................................................................................ 135
5.4. O Teste de Co-Predicação ......................................................................................... 136
5.5. A Problemática de Itens como Jornal ....................................................................... 141
6. CONCLUSÃO .............................................................................................................................. 149
REFERÊNCIAS ................................................................................................................................ 155
11.. INTRODUÇÃO
Psychologically, the remarkable fact about polysemy is how little trouble it
causes.
(Miller, 1978: 97)
A Semântica Lexical é a área da Linguística que se dedica essencialmente ao
estudo da estrutura semântica dos itens lexicais e ao modo como esta deve ser
representada no léxico.
O léxico tem sido predominantemente encarado como um repositório que contém
toda a informação pertinente, de natureza fonológica, morfológica, sintáctica e semântica,
sobre cada item lexical representado. Nesta perspectiva, essa informação não é derivável a
partir de quaisquer mecanismos gramaticais. As propriedades representadas nas entradas
lexicais poderão ser de natureza mais geral (especificando a categoria sintáctica, o quadro
de subcategorização e a classe semântica do item lexical, o que permite integrar os itens
em classes) ou de natureza mais idiossincrática, caracterizando apenas um ou um
pequeno número de itens. Neste quadro, a cada significado diferente de um item
corresponderá uma entrada lexical distinta.
O estudo do léxico ganhou vigor a partir da década de sessenta e, em particular, a
partir da década de oitenta, quando começaram a surgir vários trabalhos que tinham
como objecto de investigação a descrição e a classificação das categorias gramaticais de
acordo com o(s) seu(s) possível(is) significado(s). Até então, a sintaxe tinha sido
considerada a componente mais proeminente da gramática e, consequentemente, o
principal objecto de estudo dos linguistas.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
2
Foi nos últimos anos que o estudo da pluralidade de sentidos que um item lexical
pode ter despertou o interesse dos investigadores na área da semântica lexical.
“Polysemy has been the subject of remarkable little research. Linguists have found it insufficiently regular to succumb to their theoretical accounts, lexicographers have been concerned with instances rather than theory, and NLP has, until recently, overlooked the homonymy/polysemy distinction and ignored the relations between polysemous senses.” (Kilgarriff, 1995a: 3)
Robins (1967) foi dos primeiros trabalhos a ter em conta as relações complexas
existentes entre as palavras e os seus significados, a partir da observação de que um
conceito simples podia ser expresso por diferentes palavras - sinonímia - e que,
contrariamente, uma palavra podia comportar diferentes significados - polissemia ou
homonímia.
A distinção entre polissemia e homonímia tem sido largamente discutida na
literatura. Neste trabalho assume-se que se está perante uma caso de homonímia quando
dois, ou mais, significados distintos e não relacionados partilham acidentalmente a
mesma forma lexical (por exemplo, banco - peça de mobiliário - e banco - instituição
financeira). Por outro lado, está-se perante um caso de polissemia quando a mesma
unidade lexical comporta dois ou mais significados semanticamente relacionados (por
exemplo, janela - abertura na parede e objecto físico que tapa essa mesma abertura)1.
A polissemia é um fenómeno comum em todas as línguas, mas raramente constitui
um problema na comunicação. Seleccionamos fácil e inconscientemente o significado
apropriado, ainda que as palavras mais usadas tendam a ser as mais polissémicas.
Embora não constitua problema no uso da língua, excepto em casos de trocadilhos e jogos
de palavras, a polissemia coloca problemas a nível da representação semântica, estando
longe de haver consenso quanto ao número de significados que uma palavra pode ter ou
quanto ao modo como esses significados se relacionam entre si ou como devem ser
representados nos dicionários e no léxico.
Em termos de aplicações computacionais, o problema da desambiguação também
constitui uma questão crucial. A identificação automática dos vários sentidos relacionados
que se podem associar a um dado item lexical não é uma questão trivial em termos
1 A distinção entre homonímia e polissemia será debatida mais pormenorizadamente no capítulo 2.
1. INTRODUÇÃO
3
computacionais, uma vez que, na maioria dos casos, esses sentidos estão associados ao
mesmo contexto sintáctico ou a contextos sintácticos muito próximos.
Foram as categorias predicativas, verbos e adjectivos, que mais atenção mereceram
por parte dos estudiosos, como mostram, entre outros, trabalhos como Levin (1993), para
os verbos, Bouillon (1996, 1997, 1999) e Saint-Dizier (1998a, 1998b, 1999), para os
adjectivos. No seguimento destes trabalhos, bem como Pinto (2001) e Berkeley Coter
(2002), para o Português, o presente trabalho tem como principal objectivo o estudo da
polissemia regular nas classes nominal, verbal e adjectival, no Português, e sua
representação no quadro de um modelo computacionalmente executável.
Há que captar a sistematicidade da relação existente entre os significados
relevantes para a interpretação de um mesmo item lexical e dar conta da criação de novos
significados em contexto.
Trabalhos como os de Copestake & Briscoe (1992, 1995), Pustejovsky (1995a) e
Kilgarriff (1992), que assentam na criação de um formalismo que dê conta do fenómeno
de polissemia regular, servem de base para a elaboração do presente estudo.
Pustejovsky (1995a) propõe a criação de entradas lexicais suficientemente ricas
para modelizarem a semântica “intrínseca” das unidades lexicais e suficientemente
subespecificadas para permitirem a derivação, através de mecanismos generativos
apropriados, do sentido adquirido em contexto.
Copestake & Briscoe (1992, 1995) propõem um modelo que combina entradas
lexicais, semelhantes às propostas no âmbito do Léxico Generativo (Pustejovsky 1995a),
com regras lexicais, de forma a explicar a derivação de diferentes tipos de significados de
um item polissémico.
Ambos os modelos têm como objectivo prever o comportamento dos itens
polissémicos e obter a interpretação adequada no contexto apropriado.
1.1. OBJECTO DE ESTUDO
Quando surgiram os primeiros sistemas de Gramáticas Independentes do
Contexto (Context-Free Grammars - CFG) e de Gramáticas Transformacionais, a principal
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
4
motivação para a sua criação residia na aparente inadequação dos sistemas de estados
finitos existentes na altura para descrever todos os aspectos linguísticos associados à
natureza criativa das línguas naturais. Ainda que não se apreciasse a ideia de que os
sistemas de estados finitos não eram suficientes para analisar uma dada construção,
tornava-se cada vez mais necessária a criação de uma gramática com um maior poder
expressivo. Hoje, a semântica das línguas naturais encontra-se numa situação análoga.
Atingiu-se um estado em que se descobrem inúmeros fenómenos da língua que se
encontram além do poder explanatório dos nossos sistemas de semântica lexical.
Um dos fenómenos mais difíceis de tratar é o da ambiguidade lexical. De entre o
fenómeno de ambiguidade lexical destaca-se a distinção entre POLISSEMIA e HOMONÍMIA.
Atente-se nos seguintes exemplos:
(1) a. Este livro é muito deprimente.
b. A Rita deixou o livro em cima da mesa.
(2) a. A Clara foi buscar o banco ao sótão.
b. Este é o banco onde deposito o meu dinheiro.
Como se analisará mais detalhadamente no capítulo 2, é notória a existência de
uma relação semântica entre os significados de livro em (1), contrariamente aos
significados de banco, em (2), que não parecem apresentar qualquer relação semântica
entre si. Ou seja, pode estabelecer-se uma relação entre os significados de livro -
informação - e livro - objecto físico - em (1a) e (1b), respectivamente. A intuição de que
estes dois significados são inerentemente relacionáveis é reforçada pela possibilidade de
ocorrência de frases onde ambos os significados estão disponíveis ao mesmo tempo.
(3) O livro que a Rita deixou em cima da mesa é muito deprimente.
Em contrapartida, não é possível estabelecer-se qualquer relação semântica entre
os significados de banco - peça de mobília/assento - e banco - instituição financeira -
presentes em (2a) e (2b), respectivamente, nem ter ambos os significados disponíveis na
mesma frase.
1. INTRODUÇÃO
5
(4) *A Clara foi buscar ao sótão o banco onde deposito o meu dinheiro.
O estudo dos itens polissémicos levou à constatação de que a polissemia podia ser
regular, i.e., que certas alternâncias de significados ocorriam de forma previsível e
sistemática dentro de uma determinada classe de palavras (Apresjan, 1973).
(5) a. O livro/artigo/revista/quadro/fotografia está em cima da mesa.
b. O livro/artigo/revista/quadro/fotografia é muito deprimente.
Um dos principais problemas da semântica lexical reside na criação de modelos
que consigam captar todos os significados que um determinado item lexical pode
adquirir. Na perspectiva clássica do léxico, os itens lexicais têm significados fixos. A
aquisição de um novo significado por parte de um item lexical corresponde à criação de
uma nova entrada lexical, no léxico, de modo a permitir dar conta desse novo significado.
Um sistema com estas características é denominado LINGUAGEM MONOMÓRFICA, e
caracteriza-se essencialmente por atribuir um único significado a um item lexical. A
ambiguidade lexical é expressa através de múltiplas listas de entradas lexicais para um
dado item. Os Léxicos Enumerativos de Sentidos são um exemplo desta abordagem
monomórfica.
“Monomorphic Languages: A language where lexical items and complex phrases are provided a single type and denotation. In all these views, every word has a literal meaning. Lexical ambiguity is treated by multiple listing of words, both for contrastive ambiguity and logical polysemy.” (Pustejovsky, 1995a: 56)
Para os exemplos (1) e (2) supra, os itens livro e banco teriam ambos duas entradas
lexicais, correspondendo a livro1 [informação], livro2 [objecto físico], banco1 [peça de
mobiliário], e banco2 [instituição financeira]. Note-se que, neste sistema, não é possível
captar a relação existente entre livro1 e livro2, tornando-o um fenómeno de ambiguidade
semelhante a banco1 e banco2, o que não é o caso.
A par da categoria nominal, as categorias verbal e adjectival também apresentam
comportamentos polissémicos. Os exemplos em (6) e (7) ilustram alguns casos de
polissemia verbal.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
6
(6) a. A Rita ferveu o leite.
b. O leite ferveu.
(7) a. A Maria começou o livro.
b. A Maria começou a ler o livro.
c. A Maria começou a escrever o livro.
As estruturas em (6) correspondem à alternância causativa/incoativa, em que, do
ponto de vista sintáctico, o mesmo verbo se comporta quer como transitivo - (6a) - quer
como ergativo - (6b). Esta alternância encontra-se relacionada por um traço de
causalidade, sendo considerada um caso de polissemia regular.
No que respeita às estruturas em (7), o mesmo verbo pode, sintacticamente,
seleccionar diferentes tipos de complementos. No entanto, apesar das diferentes
estruturas sintácticas, existe uma relação semântica entre o significado dos diversos
complementos. Num modelo monomórfico existiriam vários verbos ferver e começar, cada
um com várias entradas lexicais, correspondendo, cada uma, a uma estrutura sintáctica
possível, o que não permitiria captar qualquer tipo de relação entre as diferentes
estruturas.
No que respeita aos adjectivos, esta categoria também apresenta um
comportamento polissémico. Do ponto de vista semântico, os adjectivos apresentam um
comportamento polimórfico, cuja origem pode dever-se, fundamentalmente, a três
factores: (i) semântica do próprio adjectivo - alternando entre interpretações de
experienciador e de causalidade, podendo seleccionar nomes que denotem indivíduos,
objectos ou eventos - como ilustram os exemplos em (8); (ii) semântica do nome que
modifica - adquirindo significados distintos de acordo com o item nominal que modifica -
como se pode observar pelos exemplos em (9); (iii) posição do adjectivo relativamente ao
nome que modifica – “activando” aspectos distintos da semântica do mesmo item
nominal - como mostram as estruturas em (10).
(8) a. O rapaz está triste.
b. Este livro é triste.
c. Hoje foi um dia triste.
1. INTRODUÇÃO
7
(9) a. um bom livro (que está bem concebido)
b. um bom investimento (que traz vantagens)
c. uma boa caldeirada (que é agradável ao paladar ou ao olfacto)
d. uma boa pessoa (que apresenta qualidades morais)
e. um bom médico (que desempenha bem as suas funções)
f. uma boa faca (que funciona bem)
(10) a. um velho marinheiro (de longa data)
b. um marinheiro velho (de idade avançada)
Como se pode observar pelos exemplos apresentados, torna-se difícil a um Léxico
Enumerativo de Sentidos conseguir captar e enumerar todos os significados possíveis de
um dado item.
O inverso de uma abordagem monomórfica consiste numa abordagem que negue
a existência de um significado literal, como é o caso de uma LINGUAGEM POLIMÓRFICA
NÃO RESTRINGIDA. O significado é determinado exclusivamente pelo contexto e não por
quaisquer propriedades inerentes da língua.
“Unrestricted Polymorphic Languages: No restriction on the type that a lexical item may assume. No operational distinction between subclasses of polymorphic transformations. (...). The contribution of “background knowledge” acts as the trigger to shift the meaning of an expression in different pragmatically determined contexts, and there is nothing inherent in the language that constrains the meaning of the words in context.” (Pustejovsky, 1995a: 56)
No entanto, o que se deseja é um modelo de semântica lexical que consiga captar e
prever o comportamento polissémico dos itens lexicais, sem sobregerar ou produzir
expressões semanticamente mal formadas. O significado deve ser em parte lexicalmente
determinado e não totalmente definido através da pragmática. Trata-se de uma
LINGUAGEM POLIMÓRFICA FRACA.
“Weakly Polymorphic Languages: All lexical items are semantically active, and have a richer typed semantic representation than conventionally assumed; semantic operations of lexically-determined type changing (e.g., type coercions) operate under well-defined constraints. Different subclasses of polymorphic operations are defined, each with independent properties and conditions on their application.” (Pustejovsky, 1995a: 57)
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
8
Pustejovsky (1995a), propõe, assim, o modelo do Léxico Generativo (LG), que
assenta na criação de entradas lexicais subespecificadas e de mecanismos generativos que,
ao interagirem com a informação codificada nas várias estruturas que compõem as
entradas lexicais, permitem a interpretação adequada do item em contexto.
“Instead of enumerating the different senses of the words as in a monomorphic approach, the theory adopts a generative (or semi-polymorphic) point of view (…). The word has a lexical sense that can be manipulated by a set of generative devices which derive an infinite number of senses in context.” (Bouillon, 1999: 4)
Uma outra proposta é a de Copestake & Briscoe (1992, 1995) que se fixa em testes
de co-predicação2 a partir dos quais distingue dois modos distintos de representação dos
itens polissémicos: entrada lexicais subespecificadas segundo o modelo generativo, por
um lado, e regras lexicais por outro.
Considerem-se os seguintes exemplos:
(11) a. O livro que a Rita deixou em cima da mesa é muito deprimente.
b. O banco onde deposito o meu dinheiro tem uma fachada renascentista.
(12) a. *O Jornal despediu o editor e está sujo de café.
b. *O João amamenta e come cabrito.
Nos exemplos em (11) o item livro é ambíguo entre a interpretação de ‘objecto
físico’ e ‘informação’ - em (11a) - e o item banco é ambíguo entre a interpretação de
‘instituição financeira’ e ‘edifício’ - em (11b). Ambos os itens podem entrar em estruturas
de co-predicação.
No que respeita aos exemplos em (12), os itens jornal e cabrito, ambíguos entre as
interpretações de ‘instituição’ e ‘objecto físico’ - em (12a) - e ‘animal’ e ‘comida’ - em (12b)
- não permitem a co-predicação, resultando em estruturas zeugmáticas.
2 A co-predicação consiste essencialmente na aplicação, numa mesma estrutura, de diferentes predicados sobre um item lexical polissémico, fazendo emergir os seus diferentes significados.
1. INTRODUÇÃO
9
Com base na não aceitação das estruturas em (12), em contraste com a aceitação
das estruturas em (11), Copestake & Briscoe (1992, 1995) propõem dois tipos de
polissemia regular e, consequentemente, dois modos distintos de representação lexical.
A nível computacional, ambas as propostas são executáveis. No âmbito do LG
existem algumas implementações de pequena escala em alguns trabalhos da área, a maior
parte deles sob a forma de Matrizes Atributo-Valor - MAV - (cf. capítulo 3, nota 3). A
proposta de Copestake & Briscoe (1992, 1995), desenvolvida no âmbito do projecto
ACQUILEX3, faz uso do LG, por um lado, e de regras lexicais, por outro, e é
implementada em LRL (Lexical Representation Language), com recurso a estruturas de
traços tipificadas.
Contrariando o que foi durante largos anos a perspectiva dominante, estas
abordagens sustentam que o léxico não é um componente estático e independente da
gramática, constituído por listas exaustivas de entradas lexicais providas de informação
intralinguística.
1.2. METODOLOGIA E SELECÇÃO DOS DADOS
“For an understanding of the lexicon, the contributing disciplines are lexicography, psycholinguistics and theoretical, computational and corpus linguistics.” (Kilgarriff, 1992: 4)
No seguimento de Pustejovsky (1995a), o presente estudo baseou-se
primeiramente no estabelecimento prévio de um conjunto de classes de alternâncias
nominais, verbais e adjectivais, nas quais os itens lexicais são sistematicamente ambíguos
entre dois ou mais significados.
3 ACQUILEX (The Acquisition of Lexical Knowledge for Natural Language Processing Systems) é um projecto que tem como objectivo o desenvolvimento de técnicas e metodologias para a utilização de dicionários informatizados (Machine-Readable Dictionaries – MRD) na construção de bases de conhecimento lexical, no âmbito do processamento das línguas naturais.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
10
O recurso à base de dados da WordNet do Português4 ajudou consideravelmente ao
alargamento desse conjunto de alternâncias, nomeadamente no que respeita aos itens
polissémicos da categoria nominal.
A consulta de um corpus de uso real da língua revelou-se útil na medida em que
permitiu captar a regularidade de alguns dados5.
Este trabalho reuniu, assim, um conjunto de exemplos que representam casos
relevantes de polissemia, os quais vão constituir objecto de um estudo sistematizado e tão
exaustivo quanto possível.
1.3. ORGANIZAÇÃO
No próximo capítulo procede-se a uma definição mais detalhada do conceito de
polissemia, em geral, e de polissemia regular, em particular, distinguindo estes conceitos
dos restantes fenómenos de ambiguidade semântica, nomeadamente da vaguidade e da
homonímia. Analisam-se alguns casos de polissemia regular no Português nas categorias
nominal, verbal e adjectival.
No capítulo 3 analisam-se as abordagens existentes com o objectivo de representar
os itens lexicais polissémicos, de modo a permitir o acesso a todas as suas possíveis
interpretações. Destacam-se as Técnicas Enumerativas de Sentidos, as Regras Lexicais e o
Léxico Generativo (LG), que pretende explicar o comportamento polimórfico das línguas
naturais e captar a criação de novos sentidos em contexto, desenvolvendo uma
representação semântica complexa com base na noção de co-composicionalidade6.
No capítulo 4 são analisadas algumas expressões polissémicas à luz do modelo do
LG, quadro teórico em que este estudo se insere.
4 Também designada WordNet.PT ou WN.PT. Trata-se de um projecto em curso no CLG – Grupo de Computação do Conhecimento Léxico-Gramatical - do Centro de Linguística da Universidade de Lisboa. Segundo os pressupostos da WordNet de Princeton, desenvolvida para o inglês americano pelo Laboratório de Ciências da Universidade de Princeton, este projecto consiste numa base de dados do conhecimento linguístico, em que a informação relativamente a cada item lexical é representada de forma estruturada, sendo o significado de cada unidade deduzido das suas relações com outras unidades (Marrafa, 2001). 5 Foi consultado o corpus construído no âmbito do projecto Léxico Multifuncional do Português Contemporâneo, coordenado pelo Centro de Linguística da Universidade de Lisboa. 6 Que respeita, em particular, à interacção entre o significado de um dado item lexical e o significado dos seus argumentos.
1. INTRODUÇÃO
11
No capítulo 5 distinguem-se dois tipos de polissemia regular - polissemia
construcional e extensão de significados - a que correspondem representações distintas
(Copestake & Briscoe, 1995). É introduzido o conceito de co-predicação e analisam-se
alguns exemplos.
Finalmente, e a título de conclusão, o capítulo 6 encerra esta dissertação, focando
os aspectos mais importantes analisados ao longo deste trabalho.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
12
2. PROBLEMÁTICA
The fundamental problem posed by polysemy for computation is that
particular words can take on an almost indefinite number of subtle
meaning variations.
(Verspoor, 1997a: 214)
As palavras relacionam-se com outras palavras de diversas maneiras, tornando-se
necessário seleccionar e isolar cada uma dessas relações para que sejam apropriadamente
analisadas. A sinonímia e a polissemia são, provavelmente, as relações mais produtivas de
qualquer língua e resultam em certa medida de uma das propriedades de todas as línguas
naturais: a sua criatividade. Para além de produzirem enunciados até então nunca antes
produzidos, os falantes também fazem novos usos das palavras, principalmente através
de processos metafóricos e metonímicos. No entanto, esses novos usos não são criados
arbitrariamente. No seu uso criativo de novos significados os falantes observam as regras
e as relações utilizadas na geração de significados conhecidos, gerando, por sua vez,
significados desconhecidos mas, contudo, possíveis. Deste modo, o uso criativo que os
falantes fazem da linguagem não produz qualquer impedimento à compreensão de novos
significados.
No entanto, no que respeita aos sistemas de Processamento das Línguas Naturais
(PLN), torna-se complicado identificar, de entre os vários sentidos relacionados que se
podem associar a uma dada palavra, aquele que é requerido num contexto particular.
Como reage um sistema de PLN quando, na sua busca através do léxico para encontrar o
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
14
significado de uma palavra, encontra vários? E, consequentemente, qual será o melhor
método de representação lexical dos vários significados que uma palavra pode adquirir?
Debruçando-se sobre o estudo da relação de polissemia regular, este capítulo
apresenta uma distinção entre os restantes fenómenos de ambiguidade lexical no
Português e uma descrição do modo como os vários significados dos itens lexicais se
relacionam entre si.
2.1. A QUESTÃO DA POLISSEMIA
O conceito de polissemia coloca dois problemas centrais na área da Semântica
Lexical: um diz respeito à definição e outro diz respeito à estrutura da polissemia.
No que respeita à definição, torna-se necessário, primeiramente, distinguir a
polissemia de dois outros fenómenos de ambiguidade lexical: a vaguidade1 e a
homonímia.
No respeitante à vaguidade, e de um modo sucinto, este fenómeno refere uma
falta de conteúdo informacional relativamente a diferentes especificações não dadas e
neutralizadas no contexto. De um modo mais simples, ao contrário da polissemia, que
respeita a uma variação de significados, a vaguidade respeita a uma variação dentro do
mesmo significado. Por exemplo, estudante ou criança não são palavras polissémicas, mas
vagas relativamente à informação sobre o sexo. Quando se opõe a polissemia à
vaguidade, coloca-se a questão de precisar se um determinado valor semântico - ou uso -
de uma palavra faz parte do conjunto de significados dessa palavra, ou se é o resultado de
uma especificação contextual de um desses significados. Do ponto de vista metodológico,
na determinação e delimitação dos vários significados de uma palavra, quais são os
critérios que se devem utilizar na distinção entre diferentes significados e meras
especificações contextuais?
Relativamente à homonímia, esta distingue-se da polissemia por envolver
diferentes significados com a mesma forma. Por outro lado, a polissemia envolve uma
1 Dada a diferente terminologia encontrada no que respeita a este tipo de ambiguidade, nomeadamente VAGUIDADE, VAGUEZA e INDETERMINAÇÃO, adoptou-se, neste trabalho, e no seguimento de Silva (1997) e Mendes (2001), o termo VAGUIDADE.
2. PROBLEMÁTICA
15
mesma palavra com vários significados relacionados. Uma vez que o que caracteriza a
polissemia, e a distingue da homonímia, é a relação existente entre os vários significados,
a questão que se coloca, neste caso, é a de definir a natureza dessa relação. Será ela
intuitivamente reconhecida pelos falantes?
No que respeita à questão da estrutura do item polissémico, duas questões se
afiguram importantes. Por um lado é necessário definir que tipos de relações unem os
diferentes significados de um item lexical: apenas as relações baseadas em processos
metafóricos e metonímicos, ou também fazem parte desse grupo outro tipo de relações,
como as relações hierárquicas? Por outro lado, importa estabelecer como é que se
distingue o significado-base e o significado derivado de um item polissémico.
2.2. POLISSEMIA E VAGUIDADE
Têm sido propostos vários testes para a distinção entre polissemia e vaguidade, ou
seja, para a distinção entre significados distintos e especificações - ou variações -
contextuais de um mesmo significado. Geeraerts (1993) classifica estes testes em três tipos:
lógicos, linguísticos e da definição2. No entanto, todos estes testes parecem apresentar
alguns problemas.
O primeiro grupo diz respeito aos testes lógicos, primeiramente definidos por
Quine (1960). Segundo o critério lógico dos valores de verdade, se uma asserção envolver
uma palavra que pode ser simultaneamente verdadeira e falsa em relação a um mesmo
referente, então essa palavra é polissémica. Um exemplo apresentado em Silva (1997: 613)
diz respeito ao item café, que pode ter como significados ‘fruto do cafezeiro’ e
‘estabelecimento comercial onde se toma a respectiva bebida’. A estrutura apresentada em
(1) ilustra como, segundo o teste lógico, o item café é polissémico por denotar valores de
verdade simultaneamente verdadeiros e falsos.
2 Não se consideram aqui os critérios de sinonímia, antonímia ou derivação morfológica, entre outros, a partir dos quais se considera que a existência de diferentes sinónimos, antónimos ou derivados morfológicos, em relação a um mesmo item lexical, são argumentos a favor da polissemia desse item. Trata-se de testes “ indirectos” , na terminologia de Cruse (1986), que são insuficientes no que respeita à distinção entre polissemia e vaguidade e que levantam, muitas vezes, alguns problemas de aplicação e de interpretação. Estes critérios também podem levar ao tratamento homonímico de um item, mesmo quando é notória a relação entre os significados.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
16
(1) Delta é um café, e não um café.
A frase é possível uma vez que café está a ser usado como ‘fruto do cafezeiro’, no
primeiro caso, e como ‘estabelecimento comercial’, no segundo.
Cruse (1986) acrescenta uma variação a este teste construindo asserções nas quais
ambos os significados de uma palavra podem ser verdadeiros, mas não redundantes.
(2) O João mudou a sua posição.
A frase pode ser verdadeira no que respeita à mudança da localização física do
sujeito no espaço ou à mudança do seu ponto de vista em relação a um determinado
assunto.
O segundo grupo de testes é de natureza linguística e consiste na existência de
restrições semânticas no que respeita ao uso de diferentes significados de um item
polissémico numa mesma estrutura. Este teste, também designado “teste da identidade”,
foi primeiramente introduzido por Lakoff (1970) e baseia-se na assunção de que a
coordenação de significados distintos produz frases zeugmáticas. Atente-se no seguinte
exemplo:
(3) a. *O João bebeu o café e o Manuel também entrou num.
b. O João deixou o café e o Manuel também.
A frase em (3a) ilustra como a coordenação dos significados distintos de café é
inaceitável. Em (3b) só pode haver uma interpretação para o item café, ou seja, só são
admissíveis as leituras em que tanto o João como o Manuel abandonaram ambos ou a
bebida ou o estabelecimento comercial. A leitura cruzada em que o João abandona a
bebida e o Manuel o estabelecimento, ou vice-versa, não é aceitável, o que mostra que esta
é uma palavra polissémica, pois não admite coordenação de significados distintos. Os
itens com o significado vago não produzem estruturas zeugmáticas em contextos de
coordenação. Considerem-se os seguintes exemplos apresentados em Mendes (2001: 229).
2. PROBLEMÁTICA
17
(4) a. A minha blusa era azul pastel, e a dela era azul forte.
b. A minha blusa era azul e a dela também.
A palavra azul, em (4b), constitui um caso de vaguidade e não de polissemia, uma
vez que é permitida a coordenação deste item, mesmo que este apresente variações de
significado (as blusas podem ser ambas azul pastel, azul forte, ou cada uma de um tom de
azul diferente).
No entanto, como se analisará pormenorizadamente no capítulo 5, este teste falha
quando se verifica a aceitabilidade de estruturas com coordenação de diferentes
significados de um item polissémico.
Finalmente, o terceiro grupo de testes, informalmente apresentado por Aristóteles,
contempla as definições. Segundo este teste, uma palavra é polissémica se mais do que
uma definição for necessária para dar conta dos seus significados. Por exemplo, ‘azul
pastel’ e ‘azul forte’ não representam duas definições, nem, consequentemente, dois
significados de azul, uma vez que esses valores podem ser abrangidos por uma única
definição: ’uma das cores do espectro solar que pode apresentar diversas gradações’. No
entanto, não existe uma definição maximamente genérica, i.e., que consiga abranger todo
o conjunto de significados do item café: ‘fruto do cafezeiro’, ‘bebida feita a partir do fruto
do cafezeiro’ e ‘estabelecimento comercial’. Este teste também comprova que café é
polissémico.
Todavia, Geeraerts (1993) constata alguns casos em que a aplicação destes
diferentes testes pode fazer previsões conflituosas. Se, por um lado, os três critérios
convergem relativamente à polissemia do item café, pode acontecer que um item seja
considerado polissémico segundo determinado(s) teste(s) e vago segundo outro(s). Os
casos mais visíveis ocorrem com palavras como cão e jornal. No que respeita ao item cão -
com os usos de canídeo e macho da cadela - este é polissémico de acordo com o teste
lógico, como se pode ver em (5).
(5) Layka é um cão, mas não é um cão.
Contudo, segundo os critérios linguístico e da definição, os dois usos de cão
representam um caso de vaguidade. Relativamente ao critério linguístico, são aceites
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
18
frases como a apresentada em (6), em que se exige uma identidade entre a semântica do
item cão - com o significado de canídeo - e do elemento anafórico o.
(6) O Pluto é um cão e a Layka também (o é).
No que respeita ao critério da definição, é possível formular uma definição que
cubra todos os significados do item cão: ‘canídeo doméstico tanto macho como fêmea’.
Tal como acontece com cão, também com itens como jornal é possível obter
resultados diferentes consoante os testes utilizados. Atente-se no seguinte exemplo:
(7) O jornal decidiu reduzir o seu tamanho.
Neste caso, o item jornal designa ‘o conjunto de pessoas que encabeçam a
organização’, enquanto o elemento anafórico seu designa ‘o objecto físico’. De acordo com
o teste linguístico, a aceitabilidade de (7) é um argumento a favor da interpretação de
jornal como vago (relativamente a estes dois valores) e não polissémico. No entanto o item
é polissémico de acordo com o teste da definição - uma vez que uma única definição não
chega para cobrir todos os seus significados - e de acordo com o teste lógico, tendo em
conta a não aceitabilidade de (8).
(8) Os redactores são o jornal mas não são o jornal.
A existência de resultados contraditórios dependendo do tipo de teste que se
aplica mostra, segundo Geeraerts (1993), que a distinção entre polissemia e vaguidade,
sendo uma distinção legítima e necessária, é instável e de limites não definidos. O que
nalguns contextos pode apresentar-se como um caso de significados distintos pode,
noutros contextos, tornar-se um caso de vaguidade e vice-versa.
“a oposição entre polissemia e vaguidade não constitui uma dicotomia estrita, mas antes um “continuum”. (...) Se de facto é difícil determinar os significados de uma palavra, então é porque os significados não são como as coisas, isto é, não são entidades que se possam delimitar, individualizar, contar, registar, encontrar, etc. (...) em vez de entendermos os significados como coisas, devemos entender a significação como um processo de criação de sentido. Metaforicamente falando, as palavras não são pacotes de informação
2. PROBLEMÁTICA
19
(...); as palavras são antes, (...), holofotes que se movem e que, em cada aplicação efectiva, iluminam uma porção particular de todo o seu domínio de aplicação.” (Silva, 1997: 620-621)
2.3. POLISSEMIA E HOMONÍMIA
O conceito de polissemia está estreitamente relacionado com o de homonímia,
uma vez que ambos os conceitos denotam “vários sentidos”3 que os itens lexical podem
comportar. Tradicionalmente, a distinção entre polissemia e homonímia é baseada num
critério diacrónico a partir do qual são consideradas palavras homónimas aquelas cujos
significados resultem de étimos diferentes, tornados homógrafos e homófonos através da
aplicação de vários processos linguísticos ao longo dos anos. Segundo esta distinção,
temos como exemplos de itens homónimos os apresentados em (9) e (10)4:
(9) camelo1 - com o sentido de “mamífero da fam. dos Camelídeos, de origem
asiática, de grande porte, ruminante, com duas corcovas dorsais,
muito utilizado como animal de carga nas regiões áridas”,
proveniente etimologicamente do grego kámelos, pelo latim came�lu-.
camelo2 - com o sentido de “corda grossa”, proveniente etimologicamente do
grego kámilos.
(10) pena1 - com os sentidos de “castigo; punição; desgosto; tristeza; dor; aflição”,
proveniente etimologicamente do latim poena-.
pena2 - com os sentidos de “cada um dos órgãos cutâneos que revestem o
corpo das aves (...)”, proveniente etimologicamente do latim penna-.
pena3 - com o sentido de “rocha, fraga, fraguedo”, proveniente do latim
pinna- ou penna-.
3 No seguimento de Mendes (2001) também neste trabalho se adopta o termo sentido quando não é referido um tipo específico de pluralidade de sentidos, uma vez que este termo pode abranger tanto variações de um mesmo significado, como variações que correspondem a diferentes significados. 4 Exemplos retirados do Dicionário da Língua Portuguesa, Porto Editora, 8ª Edição.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
20
No entanto, para além da dificuldade por vezes encontrada em precisar com
segurança a etimologia de um item lexical, tem vindo a impor-se como um problema
proeminente a determinação das semelhanças e das diferenças existentes entre os
significados que um determinado item pode assumir. Em consequência, polissemia e
homonímia distinguem-se usualmente com base em critérios semânticos sincrónicos,
nomeadamente na existência ou não de uma relação entre os vários significados do item
em questão.
“It came to be understood that systematic polysemy – senses that are systematically related and therefore predictable over classes of lexical items – is fundamentally different from homonymy – senses that are unrelated, non-systematic and therefore not predictable.” (Buitelaar, 1998:2)
Mais concretamente, um item lexical é considerado polissémico se os diferentes
significados que comporta estiverem semanticamente relacionados. Por outro lado, a
homonímia ocorre quando a uma mesma forma estão associados acidentalmente
significados distintos e não relacionados5.
Para ilustrar a distinção entre estes dois conceitos, considerem-se os exemplos de
homonímia apresentados em (11) e (12), em contraste com os casos de polissemia
apresentados em (13) e (14):
(11) a. O Carlos sentou-se num banco.
b. Nenhum de nós tem conta no banco.
(12) a. O tribunal decretou uma pena de 10 anos de prisão.
b. O piriquito arrancou uma pena da asa.
(13) a. Este banco foi fundado em 1910.
b. A loja que procuras fica ao lado do banco que construíram há pouco tempo.
5 Apresentando uma terminologia diferente, Weinreich (1964) defende que a ambiguidade pode ser de natureza contrastiva ou complementar. Os significados contrastivos são desprovidos de qualquer relação (o mesmo que homonímia), enquanto os significados complementares se encontram relacionados de modo sistemático (o mesmo que polissemia regular, definida mais adiante).
2. PROBLEMÁTICA
21
(14) a. O João entrou pela janela.
b. O João pintou a janela.
De facto, parece consensual que não existe qualquer relação entre os significados
de banco - ‘peça de mobiliário’ e ‘instituição financeira’, em (11a) e (11b), respectivamente.
O mesmo acontece com os significados de pena - ‘castigo’ e ‘órgão que reveste o corpo das
aves’, em (12a) e (12b), respectivamente. Em contrapartida, os significados de banco -
‘instituição financeira’, em (13a), e ‘edifício onde a instituição financeira se localiza’, em
(13b), encontram-se sistematicamente relacionados. Do mesmo modo, também é possível
estabelecer uma relação entre os significados de janela, em que o significado de ‘abertura
na parede’, em (14a), se encontra sistematicamente relacionado com o significado de
‘objecto que serve para tapar a abertura na parede’, em (14b).
Um outro aspecto importante a realçar é o facto de a relação existente entre os
significados dos nomes polissémicos ser sistemática, ou seja, parece existirem classes de
nomes que partilham a capacidade de exprimir conceitos da mesma ordem. Deste modo,
podemos encontrar o mesmo tipo de relação entre os significados presentes em banco em
nomes como escola, bem como podemos encontrar o mesmo tipo de relação entre os
significados presentes em janela em nomes como porta.
(15) a. Esta escola foi fundada em 1910.
b. A loja que procuras fica ao lado da escola que construíram há pouco tempo.
(16) a. O João entrou pela porta.
b. O João pintou a porta.
Uma definição interessante do conceito de polissemia denominada regular
(Apresjan, 1973) ou sistemática (Ostler & Atkins, 1992, Copestake & Briscoe, 1992, 1995) ou,
ainda, lógica (Pustejovsky, 1995a)6, pode ser encontrada em Apresjan (1973), e é aqui
reproduzida7:
6 O autor utiliza o termo Polissemia Lógica definindo-o como um tipo de ambiguidade complementar (no seguimento de Weinreich, 1964), onde não ocorre qualquer alteração da categoria sintáctica do item lexical, contrapondo-a aos casos em que existe tal alteração.
(i) a. John crawled through the window. b. The window is closed.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
22
“Polysemy of the word A with the meanings ai and aj is called regular if, in the given language, there exists at least one other word B with the meanings bi bj, which are semantically distinguished from each other in exactly the same way as ai and aj and if ai and bi, aj and bj are nonsynonymous. Polysemy is called irregular if the semantic distinction between ai and aj is not exemplified in any other word of the given language.”
Em suma, segundo o autor, a polissemia é irregular se a relação semântica
existente entre os significados de um item lexical for exclusiva desse item (tornando-o um
caso isolado dentro da sua classe), sendo a referência a vários significados distintos
considerada acidental. Por outro lado, a polissemia é regular (termo adoptado neste
trabalho) se o tipo de distribuição existente entre os significados de um item lexical for
comum a outros itens da mesma classe, tornando o fenómeno regular e previsível. O autor
observa ainda que a polissemia regular se baseia na maior parte das vezes na relação de
metonímia existente entre os itens lexicais.
2.4. POLISSEMIA E CONTEXTO
“One of the central problems of lexical semantics is the sensitivity of word meaning to context.” (Cruse, 2000: 30)
Dada a sensibilidade do significado dos itens lexicais relativamente ao contexto
importa questionar como é que, num plano linguístico, os diversos significados podem ser
captados.
“We do not think that it is possible to define a real theory of sense delimitation, but it is certainly possible to define a few principles or a strategy.” (Saint-Dizier, 1998a: 122)
(ii) a. If the store is open, check the price of the coffee.
b. Zac tried to open his mouth for the dentist.
No presente trabalho também só serão tratados casos de polissemia como os apresentados em (i), i.e., sem alteração de categoria sintáctica. 7 Apud Buitelaar (1998: 16).
2. PROBLEMÁTICA
23
É prática corrente definir o significado básico dos itens lexicais
independentemente do contexto, estabelecendo posteriormente princípios de acordo com
os quais, num contexto particular, os significados dos vários itens interagem entre si. A
questão central consiste em encontrar os aspectos do significado de um item que são pré-
definidos e invariantes através dos contextos e os aspectos que só se realizam em
determinado contexto. As abordagens existentes são divergentes no que respeita a esta
questão.
Wierzbicka (1996) e Goddard (2000), entre outros, consideram que os itens lexicais
têm o máximo de conteúdo semântico. Os autores propõem um método de definição
lexical denominado Natural Semantic Metalanguage – NSM – através do qual todo o
significado de uma expressão semântica (seja um item lexical ou uma expressão
gramatical) é captado através de uma paráfrase (ou explicação), construída numa
metalinguagem baseada em primitivos semânticos8. A NSM assenta em duas premissas
fundamentais: (i) toda a análise semântica deve ser definida numa língua natural e não
em formalismos técnicos ou símbolos lógicos, uma vez que estes não são suficientemente
explícitos até serem explicados numa língua natural; (ii) todo o significado de uma
expressão semântica deve poder ser captado em termos de uma paráfrase ou expressão
equivalente. A possibilidade de substituir qualquer expressão semântica por uma
paráfrase em todas as suas ocorrências contextuais permite sustentar que o significado de
um item está devidamente lexicalizado.
“... every language must have an irreducible semantic core consisting of a ‘mini-lexicon’ of indefinable words (a.k.a. ‘semantic primes’) and a ‘mini-syntax’ governing how they can be combined. (…) In the NSM system, the meaning of a semantically complex expression (be it a word or a grammatical construction) is described by means of an explanatory reductive paraphrase (an ‘explication’) framed entirely within the semantic metalanguage.” (Goddard, 2000: 129-130)
8 A proposta de Goddard (2000) surge no seguimento de trabalhos inseridos no âmbito de uma perspectiva tradicional, como Wierzbicka (1996). Segundo a autora, os significados das palavras podem ser decompostos num número finito de primitivos semânticos universais, chamados primes. Após cerca de trinta anos de investigação em vários domínios semânticos foram identificados cerca de sessenta primes. No entanto, a hipótese de que o significado lexical pode ser reduzido a um número finito de primitivos é fortemente contestada.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
24
Numa outra perspectiva, Schütze (2000) defende que os itens lexicais não têm
conteúdo semântico, mas apenas semelhanças semânticas com outros itens lexicais. O
autor propõe um algoritmo de desambiguação de palavras que agrupa contextos
semanticamente semelhantes com base em contagens de palavras semelhantes que co-
ocorrem com determinadas palavras num corpus.
“The more neighbours two words have in common, the more similar they are. The more similar words appear in two contexts, the more similar the two words are.” (Schütze, 2000: 208)
De acordo com o autor, o significado de um item lexical não está lexicalizado. O
significado é simplesmente um conjunto de ocorrências com contextos semelhantes.
“A contextual representation of a word is knowledge of how that word is used. (…) Two occurrences of an ambiguous word belong to the same sense to the extent that their contextual representations are similar.” (Schütze, 2000: 216)
Alguns modelos computacionais apresentam sistemas de delimitação de sentidos
tão extremos como os anteriores. Alguns léxicos estruturados distinguem cada sentido
consoante o uso - ou contexto - do item lexical, o que resulta numa proliferação de
sentidos. Uma abordagem deste tipo é bastante útil na medida em que fornece uma
descrição detalhada sobre o uso de várias palavras de uma língua. No entanto, esta
abordagem não permite dar conta de certas generalizações da língua, que são de extrema
utilidade em sistemas de PLN.
No outro extremo, alguns sistemas de Inteligência Artificial postulam a existência
de um único significado para um item lexical. Processos complexos de derivação
produzem os diferentes significados. As abordagens deste tipo têm como motivação
principal o modo de representação de um determinado item lexical, relegando para
segundo plano o uso da língua.
Outra proposta interessante é a de Cruse (1986: 50-54) que defende que o contexto
pode afectar a semântica de um item lexical de duas maneiras. O autor distingue entre o
que designa por MODULAÇÃO CONTEXTUAL de um único significado, por um lado, e
SELECÇÃO CONTEXTUAL de significados, por outro. O primeiro caso é entendido como a
variação induzida pelo contexto de modo a dar mais ou menos ênfase a determinados
traços semânticos do significado de uma palavra, enquanto o segundo refere a selecção de
um significado particular de entre outros que um item lexical possui.
2. PROBLEMÁTICA
25
“... a single sense can be modified in an unlimited number of ways by different contexts, each context emphasising certain semantic traits, and obscuring or suppressing others (…). This effect of a context on an included lexical unit will be termed modulation (…). The second manner of semantic variation concerns the activation by different contexts of different senses associated with ambiguous word forms. This will be termed contextual selection (of senses) (…).” (Cruse ,1986: 52)
Atente-se nos seguintes exemplos:
(17) a. O carro precisa de ir à revisão. (mecânica)
b. O carro precisa de ser lavado. (carroçaria)
(18) a. O quarto está pintado com uma cor leve. (clara)
b. O João fez uma refeição leve. (ligeira)
Segundo o autor, frases como as de (17) são consideradas casos de modulação
contextual, uma vez que são referidos diferentes aspectos de carro, ou seja, diferentes
traços semânticos do significado de carro: a mecânica e a carroçaria. Não se assume que
carro refere diferentes entidades em ambas as frases. Os diferentes aspectos do item
podem ser activados simultaneamente.
(19) O carro precisa de ser lavado e de ir à revisão.
A estrutura em (19) é semanticamente aceitável, ainda que diferentes aspectos de
carro estejam a ser referidos por cada um dos verbos.
Por outro lado, as frases em (18) apresentam casos de selecção contextual, uma vez
que só um significado de leve é seleccionado em cada caso. Os diferentes significados não
podem ser activados em simultâneo.
(20) *O João fez uma refeição leve e tem o quarto pintado da mesma maneira.
No entanto, a distinção de Cruse entre selecção e modulação contextuais vai ao
encontro da distinção entre polissemia e vaguidade, apresentada anteriormente,
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
26
pressupondo uma separação estável entre estes dois tipos de ambiguidade. Segundo o
autor, o contexto ou selecciona um significado particular de um dado item, ou modula um
significado particular de um item. No entanto, como já se referiu anteriormente, o que
num determinado contexto pode ser considerado uma variação de um determinado
significado, noutro contexto pode passar a constituir significados distintos. Se nos
exemplos (17) e (19) as variações do significado de carro - mecânica e carroçaria - são
compatíveis, encontrando-nos, de facto, perante um caso de modulação contextual de um
mesmo significado, contextos há em que esses dois aspectos podem tornar-se
incompatíveis. Considerando um carro velho (na sucata), sem componentes mecânicas,
bancos e algumas rodas, este pode ser considerado um carro no que respeita à sua forma e
alguma constituição, mas já não é um carro no que respeita à sua função. De acordo com o
teste lógico, o exemplo em (21) ilustra que o item carro pode ser, neste contexto particular,
polissémico por permitir denotar valores de verdade simultaneamente verdadeiros e
falsos.
(21) Isto é um carro mas já não é um carro.
O que esta reflexão ilustra é que o contexto pode seleccionar um significado de
entre outros que a palavra tenha e modular um mesmo significado, ou seja, realçar
determinados traços semânticos de um único significado. No entanto, o contexto também
pode tornar incompatíveis variações de um mesmo significado, passando a constituir
significados diferentes e vice-versa. Um exemplo extremo é a compatibilização de
significados de palavras homónimas que se podem transformar em variações de um
mesmo significado.
“Daddy, what exactly do you call a bank: the place where we moor the boat or the place where I bring my savings? - Well, son, the place where we moor the boat is a bank, but so is the place where you bring your savings.” (Geeraerts, 1993: 245)
O contexto influencia a interpretação do significado de um item lexical,
funcionando quer como elemento selectivo quer como elemento criador da sua
semanticidade, constituindo, consequentemente, um componente importante na sua
desambiguação.
2. PROBLEMÁTICA
27
A polissemia é um fenómeno contextual na medida em que o contexto pode
conduzir à interpretação particular de um dado valor semântico do item lexical. No
entanto, e apesar das várias influências contextuais, nem todos os valores semânticos de
um item lexical são o resultado exclusivo do contexto, ou seja, defende-se a existência de
propriedades semânticas independentes do contexto.
“... although in principle word meaning may be regarded as infinitely variable and context sensitive, there are nonetheless regions of higher semantic ‘density’ (…), forming, as it were, more or less well-defined ‘lumps’ of meaning with greater or lesser stability under contextual change.” (Cruse, 2000: 30)
2.5. POLISSEMIA NAS CATEGORIAS SINTÁCTICAS
Centrando-nos no fenómeno particular de polissemia regular - que pressupõe uma
determinada relação semântica entre os significados de um item lexical, tornando-se, essa
relação, sistemática e previsível na medida em que abrange toda uma classe de palavras –
as próximas três secções focarão os tipos de relações existentes nas três principais
categorias sintácticas em que se pode observar itens com comportamento polissémico –
nominal, verbal e adjectival.
2.5.1. POLISSEMIA NOMINAL
No seguimento das alternâncias nominais consideradas em Pustejovsky (1995a),
analisemos agora, para o português, alguns casos de polissemia regular nominal, em que
os significados se encontram relacionados entre si de forma sistemática e previsível.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
28
INSTITUIÇÃO – EDIFÍCIO – CONJUNTO DE PESSOAS
Retomemos as alternâncias apresentadas em (13), aqui renumeradas como (22):
(22) a. Este banco foi fundado em 1910.
b. A loja que procuras fica ao lado do banco que construíram há pouco tempo.
Como se verificou anteriormente, a alternância entre o significado de banco -
‘instituição financeira’ - e o de banco - ‘edifício’ - patentes em (22a) e (22b),
respectivamente, é extensível a todos os nomes que, a par de banco, denotem uma
entidade abstracta com carácter organizativo, por um lado, e uma edificação, por outro.
Apresentam esta alternância nomes como escola, faculdade, fábrica, empresa, editora, clínica,
jornal9, escritório, secretaria, entre outros. Note-se, ainda, uma terceira acepção destes itens
que consiste na capacidade que estes nomes têm em denotar uma ou mais entidades com
carácter [+volitivo], pertencentes a essa instituição, como ilustram os seguintes exemplos:
(23) a. A fábrica manifestou-se contra o reduzido aumento salarial.
b. A escola secundária de Sacavém saiu para a rua em protesto contra a
abolição do ensino nocturno.
c. A empresa aplaudiu a decisão da direcção.
ABERTURA – OBJECTO FÍSICO
Recordem-se, agora, os exemplos apresentados em (14), aqui renumerados como
(24):
(24) a. O João entrou pela janela.
b. O João pintou a janela.
9 O item jornal apresenta dois tipos de alternância: (i) instituição/edifício/conjunto de pessoas; (ii) informação/objecto físico (caracterizada mais adiante). A sua complexidade vai ser objecto de estudo mais detalhado no capítulo 5.
2. PROBLEMÁTICA
29
Neste caso, é expressa uma alternância de significado entre ‘abertura’ e ‘objecto
físico’ - (24a) e (24b), respectivamente - que se pode encontrar em nomes que partilhem as
mesmas propriedades semânticas que janela, como porta, portada, escotilha, entre outros.
CONTINENTE – CONTEÚDO
Atente-se nos seguintes exemplos:
(25) a. A Joana partiu o copo.
b. Vamos beber um copo com os amigos.
A alternância entre ‘continente’ e ‘conteúdo’, presente em (25a) e (25b),
respectivamente, exprime a propriedade que todos os nomes que denotam receptáculos
têm de denotarem quer o continente, quer, metonimicamente, o conteúdo desse
continente.
OBJECTO FÍSICO – INFORMAÇÃO
Relativamente à alternância de significados existente em nomes como livro, que
tanto podem ser interpretados como ‘objecto físico’ - (26a) - ou ‘informação contida no
objecto físico’ - (26b) - esta é extensível a nomes como revista, jornal, carta, artigo, relatório,
resumo, tese, exame, dissertação, cassete.
(26) a. O Duarte pousou o livro.
b. Este livro é muito divertido.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
30
ANIMAL – COMIDA
A alternância entre as interpretações contável (entidade) e massiva (substância) em
que participam nomes que denotam animais encontra-se representada nos exemplos em
(27).
(27) a. O cabrito foi amamentado por biberão.
b. A Maria comeu cabrito ao jantar.
Sendo um caso de polissemia regular, todos os nomes que denotam animais
deveriam permitir esta alternância de significados10. No entanto, é aceitável a existência
de um subconjunto de animais que são mais facilmente vistos como fontes de alimento. O
uso ou não de certos nomes de animais com o significado de massivo parece depender de
critérios sociais e pragmáticos.
(28) a. A Catarina foi à Coreia e comeu cão.
b. A semana passada provei escaravelho.
São, igualmente, critérios pragmáticos que estão na base da estranheza, ou mesmo
da não aceitação de frases como as apresentadas em (29). O significado massivo está
normalmente associado ao masculino, com algumas excepções, como é o caso de vaca,
ainda que, em algumas regiões, boi apresente também uma lexicalização para o
significado de ‘comida’ - (29e)11.
10 Línguas como o Inglês e o Francês apresentam algumas lexicalizações específicas para o significado de ‘comida’ que, normalmente, não são utilizadas com o significado de ‘animal’ , ainda que tal possa acontecer em registos dialectais ou familiares.
(1) a. John has a cow/ox/bull. (animal) b. We had a join of roast beef for lunch on Sunday. (comida)
(2) a. Pigs are often kept in a farm. (animal) b. Mary doesn’ t eat pork. (comida)
(3) a. La guerre consist uniquement à voler des poules et des cochons aux villains. (animal) b. Les musulmans et les israelites ne mangent pas de porc. (comida)
11 Contrariamente ao Português em que ocorre a lexicalização de vaca (feminino) para o significado de ‘comida’ , o Francês apresenta, para o mesmo significado, a lexicalização do masculino – boeuf.
(1) a. C’est une vache normande. (animal) b. Les boeufs attelés aux pesantes charrettes. (animal)
2. PROBLEMÁTICA
31
(29) a. *A minha vizinha come porca todos os dias.
b. ??*O jantar vai ser ovelha estufada.
c. ??*A cabrita estava saborosa.
d. ??*Ontem comi touro/boi ao jantar.
e. O ano passado fui a um restaurante no Porto e comi boi com ervilhas.
ÁRVORE - MADEIRA
Outra alternância entre as interpretações contável e massiva diz respeito aos
nomes de árvores, que podem ser sistematicamente interpretados quer como a própria
planta, por um lado, quer como a sua madeira, por outro, como se pode ver pelos
exemplos em (30).
(30) a. A minha avó tem uma cerejeira no quintal.
b. Comprei um móvel em cerejeira.
Uma excepção ocorre com a lexicalização de pinho para a substância proveniente
da entidade pinheiro.
PEDRA PRECIOSA – MINERAL
É também sistemática a relação existente entre o significado de ‘pedra preciosa’
(contável) e o de ‘mineral’ (massivo). É o caso de diamante, rubi, safira, esmeralda, jade,
topázio, ametista, ágata, entre outros.
(31) a. O anel de noivado da Lurdes tem um diamante.
b. Muitas ferramentas industriais são construídas a partir de diamante.
(2) a. *Je ne mange pas de vache. (comida)
b. Je ne mange pas de boeuf. (comida)
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
32
METAL – ELEMENTO
Existe, igualmente, uma relação sistemática entre o significado de ‘metal’ e o de
‘elemento’, presente em nomes como ferro, cobre, prata, ouro, platina, estanho, chumbo,
alumínio, níquel e zinco.
(32) a. As janelas eram gradeadas com um ferro ao meio.
b. O ferro pode ser encontrado sob quatro formas cristalizadas.
LOCAIS – CONJUNTO DE PESSOAS
Os nomes que denotam locais também podem alternar entre o significado locativo
e o significado que denota a população desse lugar, como se verifica em (33).
(33) a. A cidade é mais bonita à noite.
b. A cidade manifestou-se contra o presidente da Câmara.
OBJECTO - EVENTO
Nomes como almoço, jantar, banquete, refeição são sistematicamente ambíguos entre
a interpretação de ‘alimento’ e o evento que lhe está associado, como se pode observar a
partir dos exemplos em (34).
(34) a. O almoço estava saboroso.
b. O almoço foi divertido.
2. PROBLEMÁTICA
33
PROCESSO – RESULTADO
Um último exemplo de alternâncias diz respeito a nomes deverbais que podem
manifestar tanto uma interpretação de processo, como o estado resultante desse processo.
Nomes como construção, destruição, tradução, análise, demonstração, entre outros, permitem
esta alternância, como se pode ver pelos exemplos em (35) e (36), apresentados em Lopes
(1996: 18-19).
(35) a. A construção da barragem pela EDP demorou mais tempo do que o
previsto.
b. A construção da barragem alterou irremediavelmente a paisagem.
(36) a. A tradução das Minas de Salomão por Eça de Queirós demorou mais de um
ano.
b. A tradução das Minas de Salomão de Eça de Queirós continua a ser lida
com agrado.
Note-se que, enquanto resultado, nomes como tradução, análise ou demonstração
apresentam ainda a alternância entre as interpretações de ‘informação’ e ‘objecto físico’, já
referida anteriormente para nomes como livro.
(37) a. A tradução das Minas de Salomão por Eça de Queirós está bem feita.
b. Ontem comprei a tradução das Minas de Salomão de Eça de Queirós.
(38) a. A análise de Hernâni Cidade dos Lusíadas é muito interessante.
b. A análise de Hernâni Cidade dos Lusíadas está em cima da mesa.
As alternâncias nominais apresentadas em (35) e (36) ocorrem somente com nomes
deverbais, que, por se encontrarem relacionados com os verbos dos quais derivam,
deixam transparecer as suas propriedades sintácticas e semânticas. Nos casos em questão
os nomes pressupõem o mesmo tipo de evento denotado pelo predicado verbal ao qual
estão associados.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
34
2.5.2. POLISSEMIA VERBAL
Os itens verbais também podem apresentar comportamentos polissémicos. Nesta
secção descrevem-se dois tipos de comportamento que os verbos polissémicos podem
apresentar: (i) a alternância causativa/incoativa; (ii) a possibilidade de selecção de
diferentes tipos de complemento.
(i) ALTERNÂNCIA CAUSATIVA/INCOATIVA
No que respeita ao estudo das alternâncias verbais, destaca-se aqui o trabalho de
Levin (1993), para o Inglês, que agrupa estes itens em classes semânticas de acordo com o
seu comportamento sintáctico, i.e., de acordo com os argumentos que seleccionam12. Das
alternâncias verbais consideradas, importa aqui salientar a alternância
causativa/incoativa. Os predicados designados causativos caracterizam-se por poderem
ocorrer tanto em estruturas transitivas como em estruturas ergativas. No entanto, em
ambas as estruturas, os significados encontram-se relacionados através de um traço de
causalidade, podendo considerar-se os verbos em causa como polissémicos.
Considerem-se os seguintes exemplos:
(39) a. A Maria ferveu a sopa.
b. A sopa ferveu.
(40) a. O João partiu o copo.
b. O copo partiu-se.
c. O copo partiu.
12 Acerca das comummente denominadas alternâncias gramaticais (i.e. contextos sintácticos distintos), Pustejovsky (1995a) argumenta que a participação de um verbo numa determinada alternância gramatical não é suficiente para determinar a sua classe semântica. Só se pode explicar o comportamento de uma determinada classe semântica se se assumir que os diferentes padrões sintácticos de uma dada alternância não são independentes da informação contida nos argumentos envolvidos nessa alternância. De um modo mais simples, a diversidade relativamente ao tipo de complementos que um verbo - ou outra categoria sintáctica - pode seleccionar é em grande parte determinada pela semântica dos próprios complementos.
2. PROBLEMÁTICA
35
(41) a. O submarino afundou o barco.
b. O barco afundou-se.
c. O barco afundou.
Do ponto de vista sintáctico, nos exemplos em (39a), (40a) e (41a) os verbos ferver,
partir e afundar são transitivos, seleccionando um complemento com a função sintáctica de
objecto directo. No entanto, como se pode observar a partir dos exemplos em (39b), (40b,
c) e (41b, c), o mesmo verbo pode ocorrer numa construção ergativa.
Esta alternância pode ser vista como um caso de polissemia lógica, na medida em
que se considera a existência de uma relação de causalidade entre as duas construções. De
facto, parece consensual que os significados presentes em (39a), (40a) e (41a) pressupõem
os significados presentes em (39b), (40b, c) e (41b, c).
Importa salientar que as construções ergativas em (40) e (41) diferem de (39), na
medida em que, em termos sintácticos, verbos como partir e afundar apresentam
preferencialmente o clítico denominado ‘se ergativo’13 (muitos falantes atribuem um maior
grau de aceitabilidade a estruturas com o clítico do que a estruturas sem o clítico). A
questão do significado, ou ausência de significado, do clítico ‘se ergativo’ apresenta um
elevado grau de complexidade e não constitui objecto de estudo deste trabalho. Contudo,
Berkeley Cotter (2002) apresenta algumas hipóteses sobre esta questão:
“Em Português existe a possibilidade de um verbo pertencente ao PCD [Paradigma Causativo por Defeito] ser [+se] ou [-se]. A distinção passa pela possibilidade de o argumento interno poder ser, ou não, co-indexado com a causa, visto o clítico [+se] implicar agentividade.” (Berkeley Cotter, 2002: 87)14
(ii) POSSIBILIDADE DE SELECÇÃO DE DIFERENTES TIPOS DE COMPLEMENTO
Ainda dentro da classe dos verbos causativos, os predicados aspectuais começar e
acabar apresentam um comportamento polissémico, na medida em que, do ponto de vista
sintáctico, permitem a selecção de diferentes tipos de complementos. Considerem-se os
seguintes exemplos, apresentados em Berkeley Cotter (2002: 58):
13 Mateus et alii (1989: 213-217) 14 Para uma abordagem mais aprofundada sobre este assunto veja-se Berkeley Cotter (op. cit.: 63-87).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
36
(42) a. A Sónia começou o livro.
b. A Sónia começou a ler o livro.
c. A Sónia começou a escrever o livro.
(43) a. O Pedro acabou a cerveja.
b. O Pedro acabou de beber a cerveja.
No entanto, outros predicados que não os causativos podem ocorrer em diversos
quadros sintácticos. É o caso de querer, como se pode observar pelos exemplos em (44) e
(45).
um bolo. um cigarro. (44) O João quer uma cerveja. um livro. um filme.
comer um bolo. fumar um cigarro. (45) O João quer beber uma cerveja. ler/escrever um livro. ver um filme.
Como se verá pormenorizadamente no próximo capítulo, para explicar o
comportamento polissémico deste tipo de verbos, Pustejovsky (1995a) propõe a existência
de mecanismos generativos que permitem uma interacção entre o verbo e o seu
argumento interno.
2. PROBLEMÁTICA
37
2.5.3. POLISSEMIA ADJECTIVAL
No que respeita à função do adjectivo, este é caracterizado por denotar um
determinado estado relativamente ao nome que modifica. No seguimento da terminologia
adoptada por Casteleiro (1981), do ponto de vista sintáctico os adjectivos são classificados
como predicativos e não predicativos. Relativamente aos adjectivos predicativos - como
alegre, bonito, calmo, alto - estes caracterizam-se essencialmente, segundo o autor, por
poderem ocorrer em frases com as propriedades contextuais ou distribucionais que se
podem observar a partir dos exemplos em (46)15.
(46) a. Adoro as paisagens calmas. (propriedade pós-nominal)
b. Adoro as calmas paisagens. (propriedade pré-nominal)
c. Adoro as paisagens muito calmas. (propriedade de grau)
d. Adoro as paisagens que são calmas. (propriedade predicativa)
Por outro lado, os adjectivos não predicativos – como campestre, citadino,
municipal, rural - não podem ocorrer em estruturas com as propriedades distribucionais
supra referidas, como se pode verificar pelos exemplos em (47)16.
(47) a. Adoro as casas rurais.
b. *Adoro as rurais casas.
c. *Adoro as casas muito rurais.
d. ?*Adoro as casas que são rurais.
15 Exemplos retirados de Casteleiro (op. cit.:53). 16 Na gramática tradicional a terminologia adoptada pode variar. Contrariamente a Casteleiro (1981), alguns autores classificam os adjectivos que se encontram na posição predicativa como atributivos, uma vez que exprimem um atributo do sujeito, enquanto os adjectivos em posição adnominal são designados epítetos. Outros estudiosos, como Demonte (1999), classificam os adjectivos como atributivos na posição adnominal e predicativos na posição predicativa. A designação de adjectivo atributivo torna-se assim ambígua, uma vez que, enquanto para alguns autores corresponde à posição predicativa, para outros corresponde à posição adnominal. Note-se, porém, que alguns adjectivos podem ocorrer tanto em posição adnominal como em posição predicativa “ ... casi todos los adjetivos que funcionan como predicados en oraciones copulativas caracterizadoras pueden ser también modificadores. No todos los adjetivos modificadores, empero, concurren en posiciones predicativas...” (Demonte (1999: 133)).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
38
Em Português, muitos adjectivos predicativos estão associados a significados
diferentes, conforme ocupam a posição pré-nominal ou pós-nominal.
(48) a. Ele encontrou o seu amigo rico.
b. Ele encontrou o seu rico amigo.
(49) a. A Maria é uma rapariga pobre.
b. A Maria é uma pobre rapariga.
Na posição pós-nominal - (48a) e (49a) – os adjectivos têm um valor objectivo,
também designado sentido próprio, e podem ser introduzidos por uma frase relativa, sem
qualquer alteração do seu significado.
(50) a. Ele encontrou o seu amigo que é rico.
b. A Maria é uma rapariga que é pobre.
Na posição pré-nominal – (48b) e (49b) – os adjectivos têm um valor subjectivo,
avaliativo, e o seu valor semântico não pode ser obtido a partir de frases relativas.
Crisma (1990) designa os adjectivos em posição pré-nominal como apositivos. A
sequência [Adj N] é considerada uma sequência enfática que permite expressar a opinião
do locutor e a sua atitude relativamente ao objecto designado pelo nome ao qual o
adjectivo está associado. Em contrapartida, os adjectivos em posição pós-nominal são
denominados restritivos, pois restringem o universo denotado pelo nome que modificam.
A sequência [N Adj] é considerada a ordem canónica.
No entanto, a alteração de sentido mencionada não ocorre com todos os adjectivos
predicativos, sendo indiferente, do ponto de vista do seu valor semântico, que se
encontrem em posição pré-nominal ou em posição pós-nominal.
(51) a. um livro bom
b. um bom livro
(52) a. uma bonita rapariga
b. uma rapariga bonita
2. PROBLEMÁTICA
39
A relação entre os adjectivos apositivos e restritivos e/ou predicativos e não
predicativos constitui um problema extremamente complexo e não faz parte do objecto de
estudo deste trabalho17. O que se pretende realçar nesta secção é o facto de algumas
classes de adjectivos predicativos poderem apresentar comportamentos polissémicos
dependendo do nome que modificam e da posição que ocupam na estrutura frásica.
Trabalhos que se debruçam sobre o estudo dos adjectivos, como Bouillon (1996,
1997, 1999), observam que esta categoria, a par das já analisadas, também apresenta um
comportamento polimórfico, exprimindo significados diferentes em função dos contextos
nos quais ocorre. A autora defende que o carácter polimórfico dos adjectivos pode ter
uma origem semântica ou sintáctica. No que respeita à origem semântica esta pode estar
relacionada com a semântica do próprio adjectivo, com a semântica do nome com o qual
co-ocorre ou com a semântica resultante da composição destas duas categorias.
(53) Polimorfismo Adjectival
Semântico Sintáctico
Semântica do Adj Semântica do N Composição N-Adj
1. POLIMORFISMO SEMÂNTICO
(i) SEMÂNTICA LEXICAL DO ADJECTIVO
Bouillon (1997) defende que alguns adjectivos apresentam alternâncias
sistemáticas, como se ilustra em (54) e (55).
(54) a. Eu estou triste.
b. Este livro é triste.
c. Hoje foi um dia triste.
17 Para uma abordagem aprofundada sobre este assunto veja-se Casteleiro (op. cit.: 52-66).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
40
(55) a. Ele é inteligente.
b. A sua argumentação é inteligente.
O adjectivo psicológico em (54), tal como alegre ou divertido, entre outros, pode
alternar entre a interpretação de experienciador – como em (54a), em que o sujeito
expressa um estado de tristeza – e a interpretação causativa, em que se faz referência à
causa de certo estado – como em (54b, c), em que o livro/dia causa tristeza.
No que respeita ao adjectivo em (55), ou ainda hábil ou ingénuo, entre outros, este
pode denotar quer uma qualidade de um indivíduo – (55a) - quer a manifestação dessa
qualidade - (55b).
(ii) SEMÂNTICA LEXICAL DO NOME
Há contextos em que o adjectivo pode apresentar um número infinito de
significados, dependendo do nome que modifica. Considere-se, primeiramente, o
adjectivo bom, analisado em Saint-Dizier (1999) como sendo um dos adjectivos mais
polissémicos no Francês. No caso do Português, este é igualmente um dos adjectivos mais
polissémicos. Os seguintes exemplos são retirados do DLPC18.
(56) a. A fruta já não está boa. (que está são ou em perfeito estado)
b. Um bom livro. (que está bem concebido)
c. Um bom investimento. (que traz vantagens)
d. É bom passear pela cidade. (que dá prazer)
e. Uma boa caldeirada. (que é agradável ao paladar ou ao olfacto)
f. Um remédio bom para as dores de dentes. (que tem as qualidades necessárias a
um determinado fim)
g. Um problema bom de resolver. (que se faz com facilidade)
h. Uma pessoa boa. (que apresenta qualidades morais)
i. Um bom médico. (que desempenha bem as suas funções)
18 Dicionário da Língua Portuguesa Contemporânea, Academia das Ciências de Lisboa/Editorial Verbo, 2001.
2. PROBLEMÁTICA
41
j. Esperou uma boa hora e ninguém apareceu. (que indica uma quantidade)
k. Uma boa bofetada. (que é forte, intenso, violento)
l. “se o virem chegar com bom fato, bom chapéu, boa corrente de ouro, não o
tomarão por qualquer peneira, (...)” (que se distingue pela qualidade)
m. Precisa-se de uma boa faca. (que tem as qualidades que se esperam, de
acordo com a sua natureza ou função)
O mesmo fenómeno de “proliferação” de significados está presente em adjectivos
como rápido ou difícil, como se pode verificar pelos exemplos em (57) e (58).
(57) a. um desporto rápido (que envolve movimentos rápidos)
b. um carro rápido (que permite que seja conduzido rapidamente)
c. uma dactilógrafa rápida (que dactilografa rapidamente)
d. um livro rápido (que se lê rapidamente)
(58) a. Este é um texto difícil. (de compreender)
b. O Pedro é uma criança difícil. (de educar)
c. Esta é uma vida difícil. (de viver)
Os adjectivos pertencentes a uma mesma classe semântica19 podem apresentar
algumas semelhanças no que respeita ao comportamento polissémico. Podem encontrar-
19 Para além das classes determinadas a partir do comportamento sintáctico dos adjectivos, estes também podem ser distinguidos tendo em conta o seu significado. Dixon (1991) propõe o estabelecimento das seguintes classes:
DIMENSÃO (grande, pequeno, largo, comprido, curto); PROPRIEDADE FÍSICA (duro, macio, pesado, leve); COR (vermelho, verde, amarelo); PROPRIEDADE HUMANA (ciumento, feliz, orgulhoso, cruel); IDADE (jovem, velho, novo); VALOR (bom, mau, excelente, delicioso); VELOCIDADE (rápido, lento); DIFICULDADE (difícil, fácil); SEMELHANÇA (parecido, semelhante); QUALIFICAÇÃO (possível, provável).
A par da classificação anterior, Demonte (1999) propõe uma divisão dos adjectivos qualificativos (segundo a classificação da autora, os adjectivos qualificativos expressam uma propriedade que se refere à constituição do nome que modificam - cor, forma, idade, etc.), estabelecendo sete classes: DIMENSÃO, VELOCIDADE, PROPRIEDADE FÍSICA, COR, IDADE, PREDISPOSIÇÃO HUMANA E ATITUDE e AVALIATIVOS.
O agrupamento dos adjectivos em classes semânticas varia consoante os autores. No entanto, realça-se o facto de algumas classes se manterem relativamente constantes.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
42
se os significados patentes em bom noutros adjectivos avaliativos, como, por exemplo,
excelente ou mau – de acordo com a classificação de Dixon (1991) - como se pode ver a
partir dos exemplos em (59). Do mesmo modo, podem encontrar-se os mesmos
significados patentes em rápido noutros adjectivos de velocidade, como lento ou veloz,
como se observa a partir dos exemplos em (60). No entanto, pode acontecer que nem
todos os significados resultantes da co-ocorrência de um determinado adjectivo com um
determinado item nominal sejam partilhados por todos os adjectivos da sua classe,
quando associados ao mesmo item nominal, como é o caso de (59e) e (60d).
(59) a. um mau/excelente livro
b. um mau/excelente investimento
c. uma pessoa má/excelente
d. um mau/excelente médico
e. *Esperou uma má/excelente hora e ninguém apareceu.
(60) a. um desporto lento/veloz
b. um carro lento/veloz
c. uma dactilógrafa lenta/veloz
d. ??*um livro lento/veloz
Os exemplos de (56) a (60) ilustram que os diferentes significados adquiridos
pelos adjectivos dependem da semântica do nome que modificam20.
Pustejovsky (1995a) argumenta que o agrupamento dos adjectivos em classes deste tipo pode ser bastante
útil para fins descritivos, mas não revela muito acerca das suas propriedades semânticas e sintácticas, podendo agrupar itens com comportamentos sintácticos distintos. 20 Num estudo baseado em corpora, Saint-Dizier (1998b) sustenta que os adjectivos pertencentes às classes semânticas AVALIATIVA (bom, grande, caro), LOCATIVA (central, exterior) e FORMA (redondo, rectangular) são os mais polissémicos. Em contrapartida, os adjectivos pertencentes às classes TÉCNICA (químico), ASPECTUAL (final) e de NACIONALIDADE (internacional) são os menos polissémicos. As classes semânticas de adjectivos são definidas pelo autor e não correspondem às apresentadas por Dixon (1991).
2. PROBLEMÁTICA
43
(iii) COMPOSIÇÃO NOME - ADJECTIVO
Como já foi referido anteriormente, o mesmo adjectivo pode ter significados
diferentes conforme se encontra em posição pré-nominal - apositivos - ou pós-nominal -
restritivos. Ao analisar para o Francês o adjectivo velho (‘vieux’), Bouillon (1999) distingue
entre o que designa de adjectivo RELATIVO e adjectivo MODIFICADOR DE PROPRIEDADE. Nas
estruturas em que o adjectivo se encontra em posição pós-nominal - N Adj - o adjectivo é
considerado relativo, implicando que a entidade modificada seja um N e um Adj, como
ilustram os exemplos em (61).
(61) a. A Ana é a minha amiga velha. (de idade avançada)
→ A Ana é amiga.
→ A Ana é velha.
b. O João é um arquitecto falso. (que é velhaco)
→ O João é arquitecto.
→ O João é falso.
No entanto, o mesmo não acontece em estruturas em que o adjectivo se encontra
em posição pré-nominal - Adj N - ou seja, quando ele é modificador de propriedade.
Como se pode observar pelo exemplo (62a) não é necessariamente verdade que a entidade
denotada pelo N tenha a propriedade denotada pelo Adj, ainda que essa interpretação
seja igualmente possível. De facto, pode mesmo acontecer que a entidade modificada pelo
adjectivo não seja nem a entidade denotada pelo N nem tenha a propriedade denotada
pelo Adj, como se verifica em (62b).
(62) a. A Ana é a minha velha amiga. (de longa data)
→ A Ana é amiga.
→ (#)A Ana é velha.
b. O João é um falso arquitecto. (que não tem as aptidões que finge ter)
→ #O João é arquitecto.
→ #O João é falso.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
44
Como se pode verificar, neste caso, a alteração de significado resulta da posição
do adjectivo relativamente ao mesmo nome, realçando diferentes aspectos da semântica
do nome.
2. POLIMORFISMO SINTÁCTICO
Tal como os verbos, também os adjectivos podem ocorrer em contextos
sintácticos distintos, como ilustram os exemplos (63). Neste caso, os diferentes contextos
sintácticos não implicam necessariamente uma alteração de significado do adjectivo,
ainda que tenhamos, nos exemplos contemplados, uma interpretação de experienciador -
(63a), (63b), (63c) e (63d) - e uma interpretação causativa - (63e) e (63f).
(63) a. Este homem está triste.
b. Este homem está triste por tu partires.
c. Este homem está triste por partir.
d. Ele é um homem triste.
e. Partir é triste.
f. É triste que tu partas.
A partir da análise efectuada pode observar-se que, de um ponto de vista
sintáctico, os adjectivos podem ocorrer como modificadores de um nome (um livro triste)
ou em estruturas predicativas com verbos copulativos, como ser (este livro é triste). De um
ponto de vista semântico, os adjectivos apresentam um comportamento polimórfico
notório, cuja origem pode dever-se, fundamentalmente, à semântica do próprio adjectivo
(alternando entre interpretações de experienciador e causativas, podendo modificar
nomes que denotem indivíduos, objectos ou eventos), à semântica do nome que modifica
(adquirindo significados distintos de acordo com o item nominal que modifica) ou à
posição do adjectivo relativamente ao nome que modifica (realçando aspectos distintos da
semântica do mesmo item nominal).
2. PROBLEMÁTICA
45
Como podem as relações existentes entre os vários significados dos itens
polissémicos aqui descritos ser representadas no léxico, de modo a permitir o acesso a
todas as suas interpretações? É o que se discutirá no próximo capítulo.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
46
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO
GENERATIVO
... the form that a lexicon takes influences the overall design and structure
of the grammar.
(Pustejovsky, 1995a: 33)
Uma das preocupações centrais da investigação no âmbito da Semântica Lexical
Computacional reside na concepção de um modelo que permita representar a
ambiguidade lexical descrita no capítulo anterior. Em termos gerais, três abordagens
merecem particular atenção: (i) a enumeração de sentidos, que lista exaustivamente, tanto
quanto possível, todos os sentidos de uma palavra, em entradas lexicais distintas; (ii) as
regras lexicais, que geram significados derivados a partir de um significado-base; (iii) o
modelo do Léxico Generativo, que permite captar todos os significados de um item
através da interacção de mecanismos generativos com a informação especificada na sua
entrada lexical.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
48
3.1. LÉXICO ENUMERATIVO DE SENTIDOS
“Treating the lexicon as an enumerative listing of word senses has been the predominate view...” (Pustejovsky, 1995b: 74)
A forma mais directa, e tradicionalmente utilizada, de representar um item lexical
consiste na enumeração exaustiva de todos os seus significados. Cada sentido distinto
corresponde a uma entrada lexical distinta. Este modo de listar os significados das
palavras é normalmente referido como Léxico Enumerativo de Sentidos (LES), e é
utilizado, no âmbito de uma abordagem lexicográfica tradicional, por alguns modelos
teóricos e computacionais. No seguimento de Pustejovsky (1995a), um LES é caracterizado
da seguinte forma:
(1) Um léxico L é um Léxico Enumerativo sse para cada palavra w em L, com
múltiplos sentidos s1, ... , sn, existir uma entrada lexical distinta para cada
sentido: ws1, ... ,wsn.1
Um exemplo clássico da utilização de técnicas enumerativas de sentidos diz
respeito aos artigos de dicionário. Analisem-se os exemplos apresentados em (2), bem
como a figura 1, que representa o verbete abreviado do item banco, de acordo com o
DLPC2.
(2) a. A Maria foi buscar um banco para se sentar.
b. Este é o banco no qual deposito o meu dinheiro.
c. O banco fica ao lado do supermercado.
1 Traduzido de Pustejovsky (1995a: 34). 2 Dada a extensão dos verbetes, optou-se por omitir algumas abonações e registar apenas a definição das acepções sem os agrupamentos composicionais (colocações, combinatórias e expressões idiomáticas).
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
49
banco [bα��ku]. s.m. (Do ger. bank). 1. Assento estreito e comprido, de material variável, com ou sem encosto, para várias pessoas. No jardim havia bancos pintados de verde, onde os mais velhos se sentavam a ler o jornal. (...). 2. Assento para uma pessoa , sem encosto, de tampo redondo ou quadrado, sustentado por três ou quatro pés. � MOCHO. Comprou na feira dois bancos para a cozinha e um banco baixinho para descansar os pés. (...). 3. Assento comprido e largo, com encosto alto, de tampo amovível, que
pode servir também de tampa de uma arca. � ARQUIBANCO, ESCABELO, ESCANO. 4. Prancha comprida, sustentada por quatro pés, ou mesa de trabalho onde se fixam as peças em que se trabalha, especialmente em
marcenaria, carpintaria e serralharia � BANCADA. (...). 5. Elevação do fundo do mar ou dum rio por acumulação de areias, de rochas, de
detritos e que pode aflorar à superfície durante a maré baixa. � BAIXIO, BAIXO. Naquela zona havia vários bancos de areia que dificultavam a entrada e a saída das embarcações. (...). 6. Massa de gelo de grande altura, flutuando à superfície do mar. 7. Geol. camada ou estrato de aglomeração de detritos de rocha, de conchas fósseis ou de matérias sólidas. 8. Pesc. Grande quantidade de peixes que se encontram perto da costa, especialmente na época da desova. � CARDUME. Um banco de sardinha. 9. estabelecimento particular ou estatal, cuja actividade se centra no depósito e empréstimo de valores, transacções de fundos... «Houve [...] muitas pessoas que retiraram do banco as suas pequenas poupanças. » (PF, 971). (...) 10. edifício onde funciona esse estabelecimento. Pararam a conversar em frente do banco. (...). 11. Estabelecimento clínico onde se recolhem órgãos ou substâncias do organismo humano, para posterior utilização. (...).
Fig. 1. Verbete banco do DLPC
O verbete da figura 1 ilustra como, numa abordagem enumerativa, os diferentes
sentidos do item banco são exaustivamente listados. Fazendo corresponder os diferentes
significados de banco apresentados em (2) à entrada correspondente no verbete, o DLPC
regista na acepção número 2 o significado correspondente a (2a), na acepção número 9 o
significado correspondente a (2b) e na acepção número 10 o significado correspondente a
(2c).
No entanto, e para além da dificuldade muitas vezes encontrada em listar todos os
diferentes significados de uma palavra – uma vez que é sempre possível que esta adquira
novos significados em novos contextos - outro dos principais problemas das técnicas
enumerativas de sentidos reside no facto de estas não captarem as relações semânticas
sistemáticas existentes entre os significados dos itens polissémicos.
“it [polysemy] demands the impossible task of enumerating in advance all the senses which might be associated with a lexical form.” (Verspoor, 1997a: 219)
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
50
De facto, a partir da observação do verbete de banco, pode constatar-se que não há
qualquer forma de distinguir a relação polissémica existente entre as acepções 9 e 10, da
relação de homonímia existente relativamente às restantes acepções.
Dada a discriminação de todos os significados, uma abordagem enumerativa não
permite, deste modo, captar os significados de estruturas como as apresentadas em (3),
em que banco denota simultaneamente os significados de ‘instituição’ e de ‘edifício’.
(3) O banco no qual deposito o meu dinheiro fica ao lado do supermercado.
Pustejovsky (1995a) apresenta exemplos da abordagem enumerativa sob a forma
de estruturas de traços3. As estruturas em (4), (5) e (6) ilustram, do mesmo modo, como os
três significados da palavra banco, apresentados em (2), são representados através de
entradas distintas.
(4)
���
�
�
���
�
�
==
assento
contável nome
banco
GENUS
CAT
1
(5)
���
�
�
���
�
�
==
financeira oinstituiçã
contável nome
banco
GENUS
CAT
2
3 A informação acerca dos itens lexicais pode ser codificada em estruturas de traços organizadas em matrizes atributo-valor (MAV), como as utilizadas em formalismos como a HPSG (Pollard & Sag, 1994). Cada MAV é composta por pares atributo: valor, onde o atributo (ou traço) é expresso em maiúsculas e o seu valor em minúsculas. Este último pode ser atómico ou constituído por outras estruturas de traços.
(i)
���
�
�
���
�
�
��
���
�=
=
=
=
dd
ccb
aa
valor ATRIBUTO
valor ATRIBUTOATRIBUTO
valorATRIBUTO
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
51
(6)
���
�
�
���
�
�
==
edifício
contável nome
banco
GENUS
CAT
3
Em que o traço CAT designa a categoria gramatical da palavra e o traço GENUS designa, basicamente, o significado da palavra.
Este tipo de representação pode ser aplicada a expressões homónimas (banco1 vs
banco2 e banco3). No entanto, não parece ser a mais adequada no que respeita à
representação de expressões polissémicas em que, contrariamente à homonímia, os
diferentes significados se encontram estreitamente relacionados, como é o caso de banco2
e banco3.
Do mesmo modo que se verificou com a enumeração de sentidos exposta no
verbete da figura 1, as representações apresentadas em (4), (5) e (6) parecem, igualmente,
indicar que a relação entre os significados de banco2 e banco3 são comparáveis à relação
(ou ausência dela) existente entre estes e os significados de banco1, o que não é o caso. Ou
seja, também não parece ser possível representar, através deste tipo de entrada, a relação
semântica sistemática existente entre os diferentes significados das expressões
polissémicas.
Uma alteração possível à abordagem dos Léxicos Enumerativos, que permite
distinguir os casos de homonímia dos de polissemia, consiste na representação dos vários
significados numa única entrada lexical para os itens polissémicos, evitando-se, deste
modo, a proliferação de entradas lexicais.
(7)
���
�
�
���
�
�
==
assento
contável nome
banco
GENUS
CAT
1
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
52
(8)
��������
�
�
��������
�
�
��
���
�
��
���
�
=
==
=
==
edifício
contável nome
oinstituiçã
contáve nome
banco
GENUS
CAT OSIGNIFICAD
GENUS
l CAT OSIGNIFICAD
2
1
2
Deste modo, no seguimento de (Pustejovsky, 1995a), haverá que proceder a uma
reformulação da definição de Léxico Enumerativo apresentada em (1) supra, de modo a
dar conta desta distinção respeitante ao armazenamento dos diferentes significados.
(9) Um léxico L é um Léxico Enumerativo sse a cada palavra w em L, com
múltiplos sentidos s1, ... , sn:
(i) s1, ... , sn corresponderem a significados de palavras homónimas, não
apresentando qualquer relação semântica, e houver uma entrada lexical
distinta para cada significado, representada como ws1, ... ,wsn;
(ii) s1, ... , sn corresponderem a significados de palavras polissémicas,
apresentando uma relação semântica, e houver uma única entrada lexical que
lista todos os significados possíveis, representada como w{s1, ..., sn}.4
Esta é uma abordagem comum, que visa o estabelecimento de um conjunto finito
de significados e, em cada contexto, a selecção do mais apropriado. No entanto, não só
essa selecção envolve níveis de complexidade computacionalmente insatisfatórios, como a
própria enumeração de sentidos nem sempre é uma questão trivial:
“... there are three basic arguments showing the inadequacies of SELs [Sense Enumerative Lexicons] for the semantic description of language. (1) THE CREATIVE USE OF WORDS: Words may assume new senses
in novel contexts. (2) THE PERMEABILITY OF WORD SENSES: Word senses are not
atomic definitions but overlap and make reference to other senses of the word.
(3) THE EXPRESSION OF MULTIPLE SYNTACTIC FORMS: A single word sense can have multiple syntactic realization.” (Pustejovsky, 1995a: 39)
4 Traduzido de Pustejovsky (1995a: 38).
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
53
Um léxico fixo dificilmente dá conta de fenómenos de metonímia, metáfora ou
transferência de significados (Nunberg, 1995), cuja referência se encontra dependente do
contexto.
“Given the fact that reference transfer is an entirely context-dependent phenomenon, it is difficult to see how it could plausible be accounted for in terms of a fixed lexicon” (Verspoor, 1997a: 220)
A produtividade e dinamismo das línguas tornam as abordagens enumerativas
inadequadas tanto a nível estritamente linguístico, como a nível computacional. A
enumeração de significados trata o léxico como um repositório estático de informação, ao
qual se pode aceder, mas que, por ser um componente independente da gramática, não
interage com quaisquer processos gramaticais ou pragmáticos.
Outra desvantagem importante reside na falta de economia. Esta enumeração tem
como resultado uma lista exaustiva de significados que, em termos computacionais,
requer muito espaço - memória, com custos importantes a nível de eficiência do sistema.
3.2. REGRAS LEXICAIS
Em oposição à abordagem enumerativa apresentada anteriormente, os diferentes
significados podem ser derivados através de regras lexicais aplicadas a entradas lexicais
específicas. Permitindo gerar significados a partir de um significado-base, as regras
lexicais têm um papel central numa concepção dinâmica do léxico.
Se um sistema computacional captar uma regra que determine que ‘um nome
contável que denota um animal pode ser usado como um nome massivo que denota a
carne desse animal’, então terá uma base que lhe vai permitir distinguir significados como
os apresentados em (10).
(10) a. O João costuma passear o cão aos fins-de-semana.
b. Ontem comemos cão ao jantar.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
54
De modo a dar conta do fenómeno de polissemia regular, as instanciações desta
regra [animal → comida] irão permitir processar correctamente estruturas como as
representadas em (11).
(11) a. Ontem provei lagarto.
b. O coala estava delicioso.
Copestake & Briscoe (1992, 1995) propõem um conjunto de operações lexicais
baseadas em estruturas de traços, com a seguinte representação esquemática:
(12)
���
�
�
���
�
�
==
calsigno_lexi 0
calsigno_lexi 1
lexical_regra
Todas as regras lexicais têm de ter os traços 1 e 0 aos quais vão corresponder
valores do tipo signo_lexical. Estas regras vão ter como input a estrutura de traços presente
em 1 e como output a estrutura de traços presente em 0, que vai corresponder ao novo
significado gerado.
Retomando a alternância ANIMAL - COMIDA, a regra em (13) ilustra como a
estrutura de traços que tem como input o significado de ‘animal’ vai ter como output o
significado de ‘comida’. A operação lexical também dá conta da alteração de nome
contável para nome massivo.
(13) animal_comida � regra_lexical
���������������
�
�
���������������
�
�
���
�
�
���
�
�
⊃===
������
�
�
������
�
�
��
���
�
+=⊃
=
==
substância stânciacomida_sub
vonome_massi
0
dividualobjecto_in animal
velnome_contá
1
idaanimal_com
RQS
1ORTH
COMESTÍVELRQS
1ORTH
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
55
Em que ORTH significa orthography e RQS significa Relativised Qualia Structure (Calzolari, 1991).
O efeito desta regra consiste na transformação de um nome contável que denota
um animal num nome massivo que denota uma substância. A componente principal desta
regra consiste numa operação sintáctica, na medida em que afecta a realização sintáctica
do item possibilitando a sua ocorrência sem determinante, co-relacionada com uma
operação semântica subespecificada.
O uso de regras lexicais está dependente de um léxico estruturado.
“... it depends on a lexicon in which various generalisations are captured about the semantic classes which words in the lexicon belong to (e.g. animal nouns). (...) It is difficult to imagine a semantic motivated way of defining the appropriate input to a rule in the absence of represented semantic relationships between words. Lexical rules would be extremely difficult to formulate under a unstructured multiple lexical entry view of the lexicon, in which entries are not grouped into classes.” (Verspoor, 1997a: 221)
Uma das grandes questões relativamente ao uso de regras lexicais diz respeito à
necessidade de evitar ambiguidades desnecessárias que possam ser geradas por estas
regras. É necessário, assim, bloquear a geração de algumas regras lexicais. A aplicação de
uma regra é bloqueada se já existir no léxico uma palavra que possa estar no lugar do
suposto output. Existem dois tipos de bloqueio: pre-emption5 semântico - que ocorre
quando o significado que vai ser gerado já está lexicalizado noutra palavra (a lexicalização
de vaca para o significado de ‘comida’ bloqueia a geração de boi para o mesmo significado)
- e pre-emption lexical - que ocorre quando a palavra que vai ser gerada já existe no léxico
com outro significado.
Ostler & Atkins (1992) propõe que as regras devem ter uma direccionalidade
definida e que o fenómeno de bloqueio pode ser formulado através de restrições na
aplicação das regras.
Uma das questões centrais que resulta da assunção da direccionalidade das regras
lexicais consiste em determinar qual é o significado-base e qual é o significado derivado.
5 Dada a dificuldade em encontrar termos equivalentes em Português, adoptou-se a terminologia da versão original.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
56
Saint-Dizier (1998b) defende que o significado base é aquele que é mais usado e,
provavelmente, historicamente o mais antigo.
“... it is often the most usual usage which is the most primitive, probably the most concrete one, often one of the most widely used and also possibly historically and ontogenetically the oldest (...).” (Saint-Dizier, 1998b: 125)
Kilgarriff (1992) defende que há casos em que, numa relação sistemática, alguns
itens são mais proeminentes em certas instanciações do que outros. No caso da alternância
ÁRVORE-MADEIRA, os itens cerejeira e nogueira, por exemplo, têm como significado mais
saliente o de ‘árvore’, enquanto itens como faia e mogno têm como significado mais
saliente o de ‘madeira’. O mesmo acontece com a alternância ANIMAL-COMIDA, em que
para peru o significado de ‘comida’ é mais saliente, ao contrário de cão, em que o
significado mais saliente é o de ‘animal’. Na sua ontologia, Kilgarriff dá conta deste
fenómeno exprimindo as alternâncias em ambos os nós (relaciona o nó árvore com o nó
madeira e vice-versa), o que se torna desnecessariamente redundante.
Por outro lado, Copestake & Briscoe (1992, 1995) propõem adicionar às regras
lexicais uma condição probabilística, baseando-se na frequência dos significados de cada
item, e que vai reflectir o modo como esse item é usado num determinado contexto6.
Uma vez que as regras lexicais geram significados derivados a partir de
significados-base, estes significados vão estar associados a frequências diferentes,
podendo mesmo acontecer que, para algumas palavras, o significado derivado tenha uma
frequência mais alta que o significado-base. É o caso de peru, já referido anteriormente, em
que o significado derivado (‘comida’) ocorre com mais frequência que o significado-base
(‘animal’).
A informação sobre a frequência de ocorrência dos significados dos itens parece,
desta forma, não ser um critério para a definição do significado-base e do significado
derivado (uma vez que pode acontecer que os significados derivados tenham uma
frequência mais alta que os significados-base), mas apresenta alguma utilidade, na
medida em que reflecte o uso desses significados num determinado contexto.
A nível computacional, os parsers podem beneficiar desta informação estatística
para melhorar o seu processamento. Os itens polissémicos podem ser inicialmente 6 Kilgarriff (1997b) refere que alguns dicionários de língua inglesa, nomeadamente o Longman Dictionary of Contemporary English (3rd Edition, 1995) e o Collins Cobuild English Dictionary (New Edition, 1995), também incorporam informação acerca da frequência de um item a partir de corpora.
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
57
processados com base na frequência mais alta dos seus significados. A frequência mais
baixa será posteriormente escolhida no caso de conflitos sintácticos ou de subsequentes
processos pragmáticos, que determinarão que esse é o significado adequado.
Uma outra proposta é a de Ostler & Atkins (1992) que estabelece um conjunto de
cerca de 130 tipos de alteração sistemática de significado, denominados REGRAS DE
IMPLICAÇÃO LEXICAL (RIL), e que podem definir-se esquematicamente como se segue:
(14) CL1 [...α...]: [CS1 [...σ...] → CL1/CL2 [...α...]: [CS2 [...t...]
De acordo com este esquema, um item lexical é composto por uma componente
lexical (CL) - que contém informação fonológica, ortográfica, morfológica e sintáctica (α) -
e por uma componente semântica (CS) - que expressa as propriedades semânticas e o
significado do item lexical (σ/t). A aplicação das RIL pode ou não alterar a componente
lexical, mas altera sempre a componente semântica. De (15) a (19) encontram-se alguns
exemplos destas regras. Note-se que em (15) e (19) só se verifica alteração a nível
semântico. No entanto, de (16) a (18) existe alteração a nível sintáctico. Em (16) e (17)
verifica-se uma transição de nome contável (NC) para nome massivo (NM). Em (18)
verifica-se uma transição de verbo transitivo para verbo ergativo.
(15) NC: continente → NC: conteúdo
a. O João partiu a garrafa.
b. Não bebas a garrafa toda.
(16) NC: animal → NM: carne desse animal
a. O cabrito corre pelo prado.
b. A Maria não come cabrito.
(17) NC: árvore → NM: madeira
a. O João está escondido atrás do carvalho.
b. Esta mesa é de carvalho.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
58
(18) V Transitivo: causativo → V Ergativo: incoativo
a. A Rita ferveu o leite.
b. O leite ferveu.
(19) Adj: experienciador → Adj: causa
a. O João está triste.
b. Foi um dia triste.
A aplicação das RIL também pode ser bloqueada, através de pre-emption, a nível da
CS, quando o output resultante já estiver lexicalizado noutro item. É o caso da já
mencionada alternância ANIMAL – COMIDA, em que o significado de ‘comida’ para boi, já
está lexicalizado em vaca.
Uma das propriedades das RIL reside no facto de poderem ser específicas de uma
determinada língua ou dialecto, uma vez que a alternância de significados de uma classe
de palavras pode ser específica de uma língua e não universal.
3.3. LÉXICO GENERATIVO
O Léxico Generativo (LG) consiste num modelo de Semântica Lexical que permite
situar os casos de polissemia regular e fenómenos associados (metonímia, metáfora,
extensão de significados) na interface entre o significado lexical e o significado
composicional.
As entradas lexicais contêm idealmente toda a informação (sintáctica e semântica)
considerada necessária para a caracterização das unidades lexicais. Esta informação
encontra-se especificada em vários níveis de representação, que se relacionam de algum
modo, mas que não são dependentes uns dos outros. Interagindo com estes componentes
existe ainda um conjunto de mecanismos generativos que permitem captar a variação de
significado em função do contexto.
“What we hope to achieve is a model of meaning in language that captures the means by which words can assume a potentially
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
59
infinite number of senses in context, while limiting the number of senses actually stored in the lexicon”.(Pustejovsky, 1995a: 105)
Dadas as virtualidades deste modelo, o LG é pormenorizadamente apresentado
nas secções seguintes.
3.3.1. NÍVEIS DE REPRESENTAÇÃO
Tendo como objectivo fornecer uma descrição formal da língua que seja expressiva
e flexível o suficiente para captar a natureza generativa da criatividade lexical e os
fenómenos de extensão de significado, o LG envolve quatro níveis de representação:
1. ESTRUTURA ARGUMENTAL (A)
Especifica o número e o tipo de argumentos de um predicado, bem como o
modo como eles se realizam sintacticamente.
2. ESTRUTURA EVENTIVA (E)
Especifica o tipo do evento (estado, processo ou transição) associado a uma
expressão lexical ou sintáctica.
3. ESTRUTURA QUALIA (Q)
Codifica os aspectos essenciais da semântica das unidades lexicais,
estabelecendo a relação entre as duas primeiras estruturas (A e E), através dos
papéis constitutivo, formal, télico e agentivo.
4. ESTRUTURA DE HERANÇA LEXICAL (H)
Estabelece a relação entre uma estrutura lexical e outras estruturas lexicais
num dado reticulado.
A interagir com estes quatro níveis de representação, existe um conjunto de
mecanismos generativos que permite a interpretação composicional das unidades lexicais
em contexto:
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
60
(i) COERÇÃO DE TIPO
Um item lexical, ou um sintagma, é “coagido” a uma determinada
interpretação semântica através de um item regente (functor), sem qualquer
alteração do seu tipo sintáctico.
(ii) CO-COMPOSIÇÃO
Múltiplos elementos de um sintagma comportam-se como functores,
gerando novos significados não-lexicalizados para as palavras que fazem
parte da composição.
(iii) LIGAÇÃO SELECTIVA
Um item lexical ou sintagma operam especificamente na subestrutura de
outro sintagma, sem qualquer alteração do tipo da estrutura.
Estes mecanismos de composição semântica, explicados mais
pormenorizadamente na secção 3.3.4, são fundamentais para captar a relação semântica
existente entre expressões sintacticamente distintas.
Ao definir o comportamento funcional dos itens lexicais em diferentes níveis de
representação, espera-se chegar a uma caracterização do léxico como um componente
activo na composição dos significados em contexto. Os mecanismos generativos
envolvidos, que permitem obter o significado atribuído a uma dada expressão num dado
contexto, contribuem para que esta abordagem reúna toda a informação relativa a um
item lexical numa meta-entrada (que permite prever todas as regularidades de
comportamento desse item quando contextualizado) e, como resultado, reduza o número
de entradas no léxico. Essas meta-entradas denominam-se PARADIGMAS LÉXICO-
CONCEPTUAIS (PLC).
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
61
3.3.1.1. ESTRUTURA ARGUMENTAL
A estrutura argumental, definida como uma especificação dos argumentos de um
predicado (número de argumentos, tipo sintáctico e semântico, realização sintáctica), foi
objecto de investigação importante no âmbito da semântica lexical, particularmente dos
estudos sobre a interface sintaxe-semântica. O que originalmente começou por ser uma
lista simples dos argumentos associados a um predicado desenvolveu-se numa visão
sofisticada do modo como os argumentos são projectados na estrutura sintáctica.
No quadro do modelo de Princípios e Parâmetros (Chomsky, 1981), por exemplo,
o Princípio de Projecção requer que os argumentos sejam expressos como constituintes
sintácticos em todos os níveis de representação sintáctica7.
Uma das mais recentes e importantes contribuições para a teoria da gramática
consiste na assunção de que a estrutura argumental é altamente estruturada e
independente da sintaxe. Trabalhos como Grimshaw (1990) sustentam que a estrutura
argumental é hierarquicamente estruturada, estabelecendo e definindo relações de
proeminência entre os argumentos de um predicado.
Pustejosvky (1995a) propõe um nível de representação independente para a
estrutura argumental dos itens lexicais e distingue quatro tipos de argumentos:
(i) ARGUMENTOS VERDADEIROS
Os argumentos verdadeiros satisfazem os requisitos do Princípio de Projecção e do
Critério Temático da Teoria de Princípios e Parâmetros (Chomsky 1981, 1986a), sendo que
a sua realização sintáctica é obrigatória. A sua não realização induz normalmente
agramaticalidade, como se exemplifica em (20a) e (20b).
(20) a. *O João pôs.
b. *O João pôs o livro.
c. O João pôs o livro na prateleira.
7 “Representations at each syntactic level (i.e. LF and D- and S-structure) are projected from the lexicon, in that they observe the subcategorization properties of lexical items.” Chomsky (1981: 29).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
62
(ii) ARGUMENTOS POR DEFEITO
Os argumentos por defeito são considerados implícitos por estarem já expressos
nos qualia do item lexical. Só têm realização sintáctica em função de factores contextuais
ou discursivos, sendo, por isso, opcionais.
(21) a. O João construiu uma casa com tijolos/de madeira.
b. O João construiu uma casa.
(iii) ARGUMENTOS-SOMBRA
Os argumentos-sombra estão semanticamente incorporados no item lexical e só
são expressos em determinadas condições, nomeadamente em casos especificação do
discurso.
(22) a. O João pintou o quarto.
b. *O João pintou o quarto com tinta.
c. O João pintou o quarto com tinta lavável.
Denotando pintar “cobrir com tinta”, a realização de com tinta em (22b) é
redundante, tornando a expressão agramatical. No entanto, num caso de introdução de
uma maior especificação, como em (22c), a realização do argumento em causa já é
aceitável.
(iv) ADJUNTOS VERDADEIROS
Os adjuntos são modificadores - de que são exemplo os temporais e os locativos -
que fazem parte da interpretação situacional de uma expressão, mas que não estão ligados
à representação específica de um item lexical. Como tal, a sua realização é opcional.
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
63
(23) a. A Maria dormiu até tarde no domingo.
b. O Rui falou com o João no comboio.
A codificação da informação sobre os argumentos é feita através de uma estrutura
de traços como a apresentada em (24). Os traços ARG1 e ARG2 representam os tipos dos
argumentos verdadeiros. ARG-D vale por argumento por defeito e ARG-S por
argumento-sombra.
(24)
��������
�
�
��������
�
�
����
�
�
����
�
�
==
==
=
...
...
...
...
...
�
S -ARG
D-ARG
ARG
ARG
ESTR_ARG2
1
Deste modo, para os verbos mencionados anteriormente teremos as representações
informais apresentadas de (25) a (27)8.
(25)
������
�
�
������
�
�
���
�
�
���
�
�
===
=
...
local
sicoobjecto_fí
animadoindivíduo_
pôr
3
2
1
ARG
ARG
ARG
ESTR_ARG
(26)
������
�
�
������
�
�
���
�
�
���
�
�
===
=
...
matéria
artefacto
animadoindivíduo_
construir
D-ARG
ARG
ARG
ESTR_ARG 2
1
8 Por motivos de economia, em cada representação apresentada optou-se por incluir apenas os atributos relevantes para a análise do fenómeno em questão.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
64
(27)
������
�
�
������
�
�
���
�
�
���
�
�
===
=
...
tinta
sicoobjecto_fí
animadoindivíduo_
pintar
S-ARG
ARG
ARG
ESTR_ARG 2
1
3.3.1.2. ESTRUTURA EVENTIVA
Um predicado denota um determinado tipo de evento, entendido como uma
situação ou acontecimento, em que participam os seus argumentos. No seguimento de
Vendler (1967), Dowty (1979), Moens & Steedman (1988), Pustejovsky (1991) e Marrafa
(1993), entre outros, consideram-se aqui três tipos de eventos primitivos: ESTADOS (E),
PROCESSOS (P) e TRANSIÇÕES (T).
Um ESTADO pode ser informalmente definido como um evento atómico, alargado
no tempo, não se fazendo referência ao seu início nem ao seu fim, e não avaliado em
relação a qualquer outro.
Um PROCESSO consiste numa sequência de eventos idênticos (iteração), que pode
apresentar uma culminação ou não, em relação, geralmente, com a presença ou ausência
de operadores temporais ou quantificacionais.
Uma TRANSIÇÃO é descrita como um evento complexo, constituído por dois
subeventos, um processo e um estado, que representam, respectivamente, o período
inicial e final do evento, resultando numa mudança de estado.
Em termos estruturais, um ESTADO é representado como uma estrutura atómica,
não ramificada, um PROCESSO como uma estrutura com ramificações múltiplas e uma
TRANSIÇÃO como uma estrutura binária, como abaixo se ilustra.
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
65
(28) ESTADO: [e]
E
e
Exs: saber, amar, acreditar, conhecer, possuir
(29) PROCESSO: [e1... en]
P
e1 ... en
Exs: correr, nadar, conduzir, andar
(30) TRANSIÇÃO [P, E]
T
P E
Exs: construir, pintar, ler, escrever
Dado que os eventos apresentam uma estrutura interna, é necessário assumir um
nível específico para a sua representação que indique os tipos de eventos que estão
associados a um item lexical (E1 e E2), bem como as restrições que os regem (RESTR),
como se ilustra em (31).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
66
(31)
��������
�
�
��������
�
�
���
�
�
���
�
�
===
=
...
...
...
...
...
�
RESTR
E
E
ESTR_EVENT 2
1
No que respeita às restrições que regem os eventos, e no seguimento de
Pustejovsky (1995a), estas relacionam-se com a ordenação temporal dos eventos. Deste
modo podemos ter três tipos de relações:
(i) PRECEDÊNCIA (<α)
A restrição de precedência está associada a predicados que denotam uma
transição, como construir. Um evento complexo (e3) é constituído por dois subeventos (e1 e
e2) em que e1 e e2 estão temporalmente ordenados, de modo que o primeiro precede o
segundo (<α ({e1, e2}, e3)). Ou seja, para que algo esteja no estado construído é necessário,
em primeiro lugar, o processo de construção. A representação estrutural abreviada do
verbo construir será a apresentada em (32).
(32)
��������
�
�
��������
�
�
���
�
�
���
�
�
<===
=
...
�
estado:e
processo:e
...
construir
RESTR
E
E
ESTR_EVENT 22
11
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
67
(ii) SOBREPOSIÇÃO (o α)
A restrição de sobreposição está associada a predicados como acompanhar, em que
um evento complexo (e3) é constituído por dois subeventos (e1 e e2), que ocorrem
simultaneamente (o α ({e1, e2}, e3)).
(33)
��������
�
�
��������
�
�
���
�
�
���
�
�
===
=
...
o
processo:e
processo:e
...
acompanhar
�
22
11
RESTR
E
E
ESTR_EVENT
(iii) PRECEDÊNCIA COM SOBREPOSIÇÃO (<o α)
A restrição de precedência com sobreposição está associada a predicados como
andar, em que um evento complexo (e3) é constituído por dois subeventos simultâneos (e1
e e2), em que e1 começa primeiro que e2 (<o α ({e1, e2}, e3)). No caso de andar ocorre primeiro
o movimento das pernas, resultando no movimento final do corpo.
(34)
��������
�
�
��������
�
�
���
�
�
���
�
�
<===
=
...
o
processo:e
processo:e
...
andar
�
22
11
RESTR
E
E
ESTR_EVENT
Para além das restrições que regem os subeventos, Pustejovsky (1995a) propõe
também uma subespecificação das estruturas eventivas relativamente ao núcleo. Numa
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
68
estrutura eventiva bipartida, um dos subeventos pode ser mais proeminente em relação
ao outro, ocupando a posição de núcleo. O subevento que ocupa a posição de núcleo é
representado como e*1 ou e*2, quer seja o subevento inicial ou final, respectivamente. Em
(35) é apresentada a matriz por defeito da estrutura eventiva de um dado predicado α.
(35)
���������
�
�
���������
�
�
����
�
�
����
�
�
==
==
=
...
...
...
...
...
...
�
NÚCLEO
RESTR
E
E
ESTR_EVENT2
1
Relativamente à marcação das estruturas eventivas em relação ao núcleo,
considerando que o subevento mais proeminente pode ser o inicial, o final, ambos ou
nenhum, existem quatro hipóteses distintas de marcação, de acordo com Pustejovsky
(1995a: 73):
(i) ESTRUTURAS ENDOCÊNTRICAS À ESQUERDA
Exs: Construir [e*1 <α e2]
Comprar [e*1 oα e2]
Caminhar [e*1 <oα e2]
(ii) ESTRUTURAS ENDONCÊNTRICAS À DIREITA
Exs: Chegar [e1 <α e*2]
Vender [e1 oα e*2]
Caminhar para casa [e1 <oα e*2]
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
69
(iii) ESTRUTURAS ENDOCÊNTRICAS À ESQUERDA E À DIREITA
Exs: Dar [e*1 <α e*2]
Casar [e*1 oα e*2]
(iv) ESTRUTURAS NÃO ENDOCÊNTRICAS
Exs: Ferver [e1 <α e2]
Alugar [e1 oα e2]
Começar [e1 <oα e2]
As estruturas em (iv), que não são especificadas relativamente ao núcleo,
representam os casos de predicados polissémicos. Em termos de estrutura eventiva, a
polissemia ocorre quando uma expressão não é especificada relativamente ao núcleo,
admitindo duas interpretações. Encontram-se neste agrupamento, entre outros, os
predicados que alternam entre uma estrutura causativa/incoativa, como ferver, e certos
predicados causativos aspectuais, como começar.
De um modo sucinto, os predicados não endocêntricos podem ter como núcleo
qualquer um dos subeventos que constituem a estrutura eventiva. Uma vez que os
subeventos estão associados a papéis qualia distintos – o papel agentivo encontra-se
associado a e1 (processo), ao passo que o papel formal se encontra associado a e2 (estado) –
a proeminência de um ou de outro resulta em interpretações diferentes.
No caso da alternância causativa/incoativa, a interpretação causativa ocorre
quando o subevento inicial é o núcleo, projectando informação relativa ao papel agentivo
(A Maria ferveu o leite). Por outro lado, a interpretação incoativa ocorre quando o
subevento final é o núcleo, projectando informação relativa ao papel formal (O leite
ferveu).
3.3.1.3. ESTRUTURA QUALIA
A designação de qualia baseia-se na noção aristotélica de “ modos de explanação” ,
através da qual o sujeito processa a compreensão de um objecto ou relação no mundo.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
70
Esta estrutura codifica a informação semântica necessária para a interpretação de um item
nominal, e é constituída por quatro componentes, ou papéis qualia, distintos:
(i) CONSTITUTIVO
Especifica a relação entre o objecto semântico e as partes que o constituem,
codificando características como o material, o peso, os componentes.
(ii) FORMAL
Especifica aquilo que distingue o objecto semântico num dado domínio,
como a orientação, a magnitude, a forma, a dimensionalidade, a cor.
(iii) TÉLICO
Indica a função do objecto semântico.
(iv) AGENTIVO
Especifica os factores que estão envolvidos na origem do objecto semântico,
como o criador, tipo natural ou nexo de causalidade.
A estrutura qualia pode ser entendida como um conjunto de propriedades ou
eventos associados a um item lexical nominal, e, consequentemente, ao sintagma
nominal no qual está inserido. A informação contida nos papéis qualia vai ser associada
aos argumentos de um predicado e aos seus subeventos.
Esta estrutura inclui os diferentes tipos de relações que os objectos semânticos
podem estabelecer entre si: meronímia/holonímia9, através do papel constitutivo,
hiponímia/hiperonímia10, através do papel formal, propósito ou função, através do papel
télico e origem ou causalidade, através do papel agentivo. Enquanto os papéis
9 Corresponde à relação parte/todo. Em termos informais, a relação meronímia/holonímia pode ser definida do seguinte modo: A é merónimo de B sse A é necessariamente parte de B e B inclui necessariamente A; B é holónimo de A sse A é merónimo de B. Exemplificando, pétala é merónimo de corola e corola holónimo de pétala, uma vez que pétala é necessariamente parte de corola e corola inclui necessariamente pétala (Marrafa 2001: 38). 10 Segundo Fellbaum (1998), a hiperonímia e a hiponímia são relações inversas e dizem basicamente respeito à noção de inclusão em classes: se Y é um tipo de X, então X é hiperónimo de Y e Y é hipónimo de X. Exemplificando, o hiperónimo de cão será canídeo, e os hipónimos serão as várias raças de cães (dálmata, pastor alemão, etc.). A relação de hiponímia requer que o hiperónimo possa substituir o hipónimo num contexto referencial (este dálmatahipónimo é bonito / este cãohiperónimo é bonito).
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
71
constitutivo e formal estabelecem uma relação com outros objectos semânticos, os papéis
télico e agentivo fazem referência a eventos.
Todos os itens lexicais têm uma estrutura qualia associada, mas não existe
obrigatoriedade de atribuir valores a todos os papéis que a compõem. Em (36) é
apresentada a matriz por defeito da estrutura qualia de um dado predicado α.
(36)
���������
�
�
���������
�
�
����
�
�
����
�
�
==
==
=
�origem_de_
�função_de_
ção_de_�identifica
ão_de_�constituiç
...
�
AGENTIVO
TÉLICO
FORMAL
CONST
AESTR_QUALI
É fácil verificar através da estrutura qualia que, por exemplo, romance se distingue
de dicionário relativamente ao seu papel constitutivo (o primeiro é uma narrativa,
enquanto o segundo consiste numa lista de palavras), ao seu papel télico (o primeiro é
para ler enquanto o segundo é para consultar), e ao seu papel agentivo (o primeiro é
escrito enquanto o segundo é compilado), sendo somente semelhantes no seu papel
formal (ambos são livros). Em termos informais, teríamos as seguintes representações
para os referidos itens:
(37)
���������
�
�
���������
�
�
����
�
�
����
�
�
==
==
=
escrever
ler
livro
narrativa
...
romance
AGENTIVO
TÉLICO
FORMAL
CONST
AESTR_QUALI
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
72
(38)
���������
�
�
���������
�
�
����
�
�
����
�
�
==
==
=
compilar
consultar
livro
palavras de lista
...
dicionário
AGENTIVO
TÉLICO
FORMAL
CONST
AESTR_QUALI
É também neste nível de representação que se processa toda a informação
semântica pertinente para a caracterização de itens com comportamento polissémico.
3.3.2. SISTEMA DE TIPOS SEMÂNTICOS E HERANÇA LEXICAL
Os itens lexicais são definidos no léxico por um conjunto de tipos semânticos que
reflectem distinções ontológicas como humano, artefacto, objecto_físico, evento, entre outros.
Os tipos podem ser simples ou complexos. Os tipos simples caracterizam as
expressões não polissémicas, ou seja, que só têm uma interpretação. É o caso de homem (x:
humano), faca (x:artefacto) ou pedra (x:objecto_físico). Ao contrário das expressões não
polissémicas, as expressões polissémicas, por terem mais do que uma interpretação,
denotam tipos complexos (dotted types, segundo Pustejovsky (1995a)). É o caso de livro
(x:objecto físico, y:informação), janela (x:objecto_físico, y:abertura) ou banco (x:instituição,
y:edifício).
Os tipos complexos são representados pelo operador cartesiano “ •” . Deste modo,
por exemplo, livro denota o tipo complexo objecto_físico•informação, enquanto janela
denota o tipo complexo objecto_físico•abertura.
A todas as expressões de uma língua pode ser atribuído um tipo semântico.
Pustejovsky (1995a) defende que, para se obter a representação semântica de um item
lexical, é necessário que este aceda a um tipo semântico, presente numa rede de tipos
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
73
hierarquicamente organizada, de modo a permitir a herança de traços dos seus
supertipos.
No LG, um item lexical herda informação a partir da sua estrutura qualia. De facto,
os quatro papéis qualia introduzem quatro redes de herança lexical separadas. A herança
de traços processa-se, assim, através de quatro “ canais” diferentes e independentes.
Retomem-se os exemplos de romance e dicionário que, como se verificou a partir das
estruturas (37) e (38), apresentam uma estrutura qualia distinta, sendo o papel formal –
livro - o único que têm em comum. De um modo sucinto, estes itens terão as relações de
herança apresentadas em (39).
(39) a. dicionário É_FORMAL livro
b. dicionário É_TÉLICO consulta
c. dicionário É_AGENTIVO matéria_compilada
d. romance É_FORMAL livro
e. romance É_TÉLICO leitura
f. romance É_AGENTIVO escrita
g. livro É_FORMAL objecto_físico•informação
h. livro É_TÉLICO leitura
i. livro É_AGENTIVO escrita
De um modo mais simples, o diagrama em (40) representa as relações de herança
apresentadas em (39).
(40) objecto_físico•informação
escrita F
consulta leitura
matéria_compilada T A
T A livro
F F T A
dicionário romance
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
74
O diagrama em (40) ilustra como dicionário e romance são um subtipo de livro - uma
vez que ambos partilham o valor do papel formal (F). No entanto, estes objectos
semânticos distinguem-se relativamente aos traços que herdam do seu supertipo,
apresentando, consequentemente, valores distintos para os restantes papéis qualia.
Relativamente a dicionário, este só herda o valor do papel formal de livro -
objecto_físico•informação - distinguindo-se no que respeita aos papéis télico (T) – consulta
- e agentivo (A) – matéria_compilada. No que respeita a romance, este herda de livro os
valores dos papéis formal, télico – leitura - e agentivo – escrita.
3.3.3. PARADIGMA LÉXICO-CONCEPTUAL (PLC)
Um dos objectivos centrais do modelo do LG consiste em construir uma única
entrada lexical que englobe todos os significados das expressões polissémicas, reduzindo,
assim, o número de entradas armazenadas no léxico.
Considerem-se, os seguintes exemplos com o item livro, que é um nome
polissémico que denota o tipo complexo objecto_físico•informação.
(41) a. Este livro é muito divertido.
b. Este livro está mal estimado.
c. Este livro está mal estimado mas é muito divertido.
Nos exemplos acima, o nome livro apresenta três significados: ‘informação’ (41a),
‘objecto físico’ (41b) e ‘informação’ e ‘objecto físico’ em (41c). Pustejovsky & Anick (1988)
denominam PARADIGMA LÉXICO-CONCEPTUAL (PLC) a representação, numa mesma
entrada, dos vários sentidos de um mesmo item. Estas meta-entradas permitem que seja
projectado qualquer um dos três significados em contextos semânticos e sintácticos
distintos.
O PLC representa, assim, um tipo complexo para um item polissémico α que tem
os significados σ1 e σ2.
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
75
(42) ( ) 2 1
21��:�PLC
�:� �:�
•
O que (42) indica é que dois tipos simples (σ1 e σ2) podem juntar-se e formar um
tipo complexo (σ1•σ2). O PLC contém todas as combinações de tipos possíveis, ou seja, os
dois tipos simples e o tipo complexo resultante da sua combinação, como se pode ver em
(43).
(43) PLC = {σ1 • σ2, σ1, σ2}
Concretizando, o PLC do nome livro será o apresentado em (44) e terá a entrada
lexical apresentada abreviadamente em (45).
(44) objecto_físico•informação_PLC = {objecto_físico•informação, objecto_físico,
informação}
(45)
�����������
�
�
�����������
�
�
����
�
�
����
�
�
==
==
��
���
�
==
=
•
•
•
y)xv,,escrever(e
y)xw,,ler(e
x)conter(y,
físico_ objectoinformação
físico objecto :y
informação : x
livro
2
1
AGENTIVO
TÉLICO
FORMAL
PLC
AESTR_QUALI
ARG2
ARG1ESTR_ARG
Na próxima secção analisar-se-á de que modo é que a interacção entre a semântica
do predicado e dos seus complementos resulta na interpretação adequada do item
polissémico.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
76
3.3.4. MECANISMOS GENERATIVOS
Existe um conjunto de mecanismos generativos que se combinam com os
diferentes níveis de representação semântica descritos anteriormente (estrutura
argumental, estrutura eventiva e estrutura qualia) e que permitem dar conta da
interpretação composicional das palavras em contexto. Esses mecanismos são:
(i) COERÇÃO DE TIPO;
(ii) COERÇÃO DE SUB-TIPO;
(iii) COERÇÃO DE COMPLEMENTO;
(iv) CO-COMPOSIÇÃO;
(v) LIGAÇÃO SELECTIVA.
Nas secções seguintes será analisado cada um destes mecanismos, que permite
captar os meios através dos quais as palavras podem assumir um número potencialmente
infinito de significados em contexto, ao mesmo tempo que se limita o número de
significados armazenados no léxico.
3.3.4.1. COERÇÃO DE TIPO
Como já se referiu anteriormente, os tipos semânticos encontram-se ordenados
numa hierarquia de tipos, como a apresentada em (46), de acordo com Copestake &
Briscoe (1992) e Pustejovsky (1995a).
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
77
(46) nomrqs11
indivíduo proposição evento
abstracto objecto_físico informação
... ... ...
Cada tipo está associado a uma forma sintáctica canónica. Deste modo, o tipo
indivíduo está associado a um Sintagma Nominal (SN), o tipo proposição a uma Frase (F)
e o tipo evento a um Sintagma Verbal (SV).
A coerção de tipo consiste numa operação semântica que converte, no contexto de
uma dada função, um argumento no tipo esperado pela função. De outro modo resultará
um erro de tipo e a estrutura será anómala.
Existem alguns casos de verbos que foram comummente tratados como ambíguos,
mas cuja aparente ambiguidade pode ser explicada através do fenómeno de coerção.
Alguns casos discutidos por Dowty (1985) dizem respeito aos tipos de complementos do
verbo querer, como é ilustrado em (47) e (48).
(47) a. O João quer uma cerveja. (beber)
b. O João quer um livro. (ler)
c. O João quer um cigarro. (fumar)
(48) a. A Maria quer [comer um bolo]. [F]
b. A Maria quer [um bolo]. [SN]
Dowty (1985) defende uma abordagem enumerativa para explicar estas diferenças
de interpretação. Mas uma estratégia diferente é adoptada no Léxico Generativo.
Assumindo que o tipo do verbo se mantém inalterável, o que muda é o tipo do
complemento do verbo, que sofre uma operação de mudança de tipo em virtude de se
encontrar sob regência lexical do verbo. Esta operação é chamada de coerção de tipo, por
ser uma mudança de tipo lexicalmente regida.
11 Em que nomrqs refere o elemento supremo do subconjunto de tipos considerado, ou seja, o tipo imediatamente acima relativamente aos tipos ‘ indivíduo’ , ‘preposição’ e ‘evento’ .
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
78
“ TYPE COERCION: a semantic operation that converts an argument to the type which is expected by a function, where it would otherwise result in a type error.” (Pustejovsky, 1995a: 111)
Pustejovsky (1993) sugere que cada expressão α pode ter disponível um conjunto
de operadores de mudança, Σα, que pode operar sobre uma expressão, mudando o seu
tipo e denotação. Em (49) é apresentada uma formulação da regra de APLICAÇÃO DA
FUNÇÃO COM COERÇÃO (AFC):
(49) APLICAÇÃO DA FUNÇÃO COM COERÇÃO: se α é do tipo c e β é do tipo <a, b>,
então:
(i) se o tipo c = a, então β(α) é do tipo b;
(ii) se existir um σ ∈ Σα, tal que σ(α) resulte numa expressão do tipo a, então
β(σ (α)) é do tipo b;
(iii) de outro modo ocorrerá um erro de tipo.12
Para ilustrar os efeitos desta regra, tomem-se como exemplo as estruturas
apresentadas em (47) e (48). É necessário ter em conta: (i) os diferentes contextos
sintácticos que o verbo querer pode seleccionar, em (48); (ii) as diferentes interpretações
emergentes dos complementos SN em (47), que parecem requerer uma enumeração de
significados. No entanto, e como já foi referido, em vez de propor diferentes tipos
semânticos para o verbo - o que resultaria em diferentes entradas lexicais - propõe-se uma
única entrada, em que o tipo do verbo se mantém constante. Por sua vez o argumento
interno é uniformemente identificado com um determinado tipo, neste caso uma
proposição. A estrutura apresentada em (50) ilustra a relação existente entre o tipo
semântico requerido e as realizações sintácticas possíveis dos complementos.
12 Traduzido de Pustejovsky (1995a: 111).
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
79
(50) [prop]
coerção coerção
SN F SV
Segundo esta proposta, três hipóteses afiguram-se possíveis:
(i) se a forma sintáctica que ocorre na posição de complemento coincidir com
o tipo proposição, requerido pelo verbo, então a estrutura é bem formada;
(ii) se, pelo contrário, não houver essa correspondência, então o tipo do
complemento sofre um processo de coerção de forma a transformar-se no
tipo esperado, i.e., numa proposição, e a estrutura passa a ser bem
formada;
(iii) se não houver correspondência entre o tipo do complemento e o tipo
requerido pelo verbo, e não houver coerção, haverá um erro de tipo e a
estrutura é mal formada.
Constata-se, assim, que um mesmo tipo semântico pode ter realizações sintácticas
diferentes, e que uma dada estrutura sintáctica pode assumir um tipo semântico
particular dependendo do contexto em que se encontra.
No que respeita aos exemplos em (47), é importante salientar, em primeiro lugar,
as propriedades de selecção do predicado querer que, semanticamente, selecciona um
complemento com uma interpretação eventiva. Uma vez que, sintacticamente, este verbo
selecciona um SN com o tipo indivíduo, não satisfazendo, deste modo, a condição de
selecção de um complemento eventivo, o verbo executa um processo de coerção que
resulta na mudança de tipo do complemento, possível devido à informação contida na
estrutura qualia da expressão nominal. É a informação contida na estrutura qualia do
complemento, neste caso no papel télico, que permite interpretar correctamente o
significado de querer. O facto de o papel télico de cerveja, livro e cigarro ser ‘beber’, ‘ler’ e
‘fumar’, respectivamente (i.e. eventos) permite que, em (47), o complemento de querer seja
interpretado adequadamente como ‘beber uma cerveja’, ‘ler um livro’ e ‘fumar um
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
80
cigarro’, nos contextos apropriados. Note-se, contudo, que, no que respeita à estrutura
querer um livro, para além do papel télico, o papel agentivo também denota um evento -
neste caso ‘escrever’. Deste modo a estrutura torna-se ambígua entre as interpretações de
querer ler um livro e querer escrever um livro, sendo a primeira preferencial, decorrente de
razões pragmáticas.
3.3.4.2. COERÇÃO DE SUBTIPO
A coerção de subtipo baseia-se essencialmente na existência de uma hierarquia de
tipos que pode, de certa maneira, assemelhar-se à hierarquia lexical existente nas relações
de hiperonímia/hiponímia. Atente-se nos seguintes exemplos:
(51) a. O Pedro conduziu um Ferrari no sábado.
b. A Joana leu “ Os Maias” nas férias.
É necessário, neste caso, estabelecer uma relação entre o tipo semântico denotado
por cada SN na posição de complemento e o tipo que é formalmente seleccionado pelos
verbos conduzir e ler. Essa relação é convencionalmente denominada coerção de subtipo.
Nos casos acima listados o verbo conduzir selecciona um complemento do tipo veículo, que
tem como subtipos Ferrari, Honda, etc., enquanto o verbo ler selecciona um complemento
do tipo texto, que tem como subtipos Os Maias, Os Lusíadas, etc.. Assume-se então que se
uma função selecciona um tipo τ1 e ocorre um complemento do tipo τ2, em que τ2 é um
subtipo de τ1, (τ2 ≤ τ1), este deve ser aceite pela função como um argumento legítimo.
Assumindo que a representação lexical para o nome veículo é a apresentada em (52), e,
assumindo que Ferrari é um subtipo de carro, que, por sua vez, é um subtipo de veículo,
estabelece-se a seguinte relação: Ferrari ≤ carro ≤ veículo.
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
81
(52) [ ]
��������
�
�
��������
�
�
���
�
�
���
�
�
===
=
==
x)z,,econstruir(
x)y,,mover(e
x
sicoobjecto_fí : x
veículo
2
1
1
AGENTIVO
TÉLICO
FORMAL
AESTR_QUALI
ARGESTR_ARG
(53) [ ]
��������
�
�
��������
�
�
���
�
�
���
�
�
===
=
==
x)z,,econstruir(
x)y,,conduzir(e
x
veículo: x
carro
2
1
1
AGENTIVO
TÉLICO
FORMAL
AESTR_QUALI
ARGESTR_ARG
(54) [ ]
��������
�
�
��������
�
�
���
�
�
���
�
�
===
=
==
x)Co,-Ferrari,econstruir(
x)y,,conduzir(e
x
carro : x
Ferrari
2
1
1
AGENTIVO
TÉLICO
FORMAL
AESTR_QUALI
ARGESTR_ARG
Note-se que os valores dos qualia formal e télico de Ferrari são herdados da entrada
de carro, enquanto a especificidade do tipo do valor do quale agentivo é localmente
definida (especifica-se o produtor).
A relação de coerção de subtipo, formalmente representada pelo símbolo Θ, pode
ser definida de seguinte forma:
(55) [ ]
[ ]( ) 221
21211�:� � ��
��:� �� ,�:�
≤→≤
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
82
O que a representação em (55) indica é que, tendo um antecedente com uma dada
expressão α do tipo σ1, que é um subtipo de σ2, existe um mecanismo de coerção entre σ1 e
σ2 que tem como consequência alterar o tipo de α para σ2.
Concretizando, para o exemplo (51b) é estabelecida a relação Os Maias ≤ livro ≤
texto entre o tipo seleccionado pelo verbo ler e o tipo do complemento que neste caso
ocorre.
3.3.4.3. COERÇÃO DE COMPLEMENTO
Enquanto a coerção de subtipo envolve mecanismos de inferência disponíveis
numa estrutura de tipos, a coerção de complemento tem fundamentalmente como base a
informação disponível nos qualia dos complementos. Por outro lado, a coerção de
complemento é licenciada por regência lexical. Tomem-se como exemplos as estruturas
abaixo apresentadas:
(56) a. O João começou o livro.
b. O João começou a ler o livro.
c. O João começou a escrever o livro.
A regra de Aplicação da Função com Coerção (AFC), apresentada em (49),
assegura que o tipo semântico seleccionado pelo verbo é satisfeito nos três casos,
independentemente da estrutura sintáctica dos complementos.
Ao analisar a estrutura por defeito do verbo começar, apresentada em (57), verifica-
se que o segundo argumento (ARG2) é, explicitamente, um evento.
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
83
(57)
�����������
�
�
�����������
�
�
��
���
�
���
�
�
���
�
�
<=
��
���
�
==
=
=
==
=
=
=
)ex,,meçar(eacto_de_co
x),P(e
�
estado:e
processo:e
e
humano: x
começar
21
2
22
11
22
1
AGENTIVO
FORMAL A ESTR_QUALI
RESTR
E
E
ESTR_EVENT
ARG
ARGESTR_ARG
�
A coerção aplicada ao complemento de modo a satisfazer o tipo semântico
requerido pelo verbo (neste caso um evento) só é aplicada com sucesso se o complemento
tiver acessível, na sua estrutura, o tipo apropriado. No caso de (56), o complemento livro
tem disponível na sua estrutura qualia dois tipos de evento, patentes no valor dos seus
papéis télico e agentivo.
(58)
�����������
�
�
�����������
�
�
����
�
�
����
�
�
==
==
��
���
�
==
=
•
•
•
y)xv,,escrever(e
y)xw,,ler(e
x)conter(y,
sico_objecto_fíinformação
sicoobjecto_fí:y
informação: x
livro
2
1
2
1
AGENTIVO
TÉLICO
FORMAL
PLC
AESTR_QUALI
ARG
ARGESTR_ARG
Deste modo, e através do processo de coerção de complemento, o complemento
adquire o tipo semântico requerido pelo verbo e as interpretações presentes em (56b) e
(56c) são possíveis, sem qualquer alteração da estrutura sintáctica.
Considerem-se agora os seguintes exemplos:
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
84
(59) a. A Maria acredita no livro. (informação)
b. A Maria rasgou o livro. (objecto físico)
Contrariamente às estruturas em (56), nas frases em (59) os verbos acreditar e rasgar
não seleccionam um complemento com o tipo evento.
Ao observar a estrutura lexical de livro em (58), verifica-se que este item consiste
num dot object que denota dois tipos semânticos diferentes: ‘informação’ e ‘objecto físico’.
Como se referiu anteriormente, um dot object consiste num par lógico de significados
compostos por tipos individuais, formando um tipo complexo. Torna-se, assim, necessário
definir, a partir do tipo complexo, as operações de extracção do tipo que contém o
significado apropriado. Essas operações de coerção, que, a partir do tipo complexo (dot
object), extraem um tipo particular, são definidas através dos operadores Σ1 e Σ2, como se
evidencia em (60).
(60) PLC = {σ1 • σ2, Σ1[σ1 • σ2]:σ1, Σ2[σ1 • σ2]:σ2}
Informalmente, Σn é uma função que entra no dot object e extrai um dos tipos
disponíveis, fazendo emergir o tipo certo no contexto apropriado.
(61) a. Σ1[inf•objecto_físico]:inf
b. Σ2[inf•objecto_físico]:objecto_físico
c. inf•objecto_físico_PLC = {inf•objecto_físico, inf, objecto_físico}
Deste modo, através da aplicação das operações de coerção (AFC), subtipificação
(Θ) e do operador Σ, é possível extrair os dois significados de livro, como se pode observar
a partir de (62), permitindo interpretar adequadamente as estruturas em (59).
(62) a. livro ≤ informação ≤ proposição
b. livro ≤ objecto_físico ≤ indivíduo
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
85
3.3.4.4. CO-COMPOSIÇÃO
A co-composição está directamente relacionada com a polissemia verbal e permite
a derivação de novos sentidos em contexto, na medida em que consiste num mecanismo
que opera na semântica do verbo e na semântica do nome que lhe serve de complemento,
alterando o significado do primeiro.
Considere-se, para o Inglês, o verbo bake, apresentado em Pustejovsky (1995a: 122),
que, dependendo da natureza do complemento com que co-ocorre, pode ser interpretado
como uma “ mudança de estado” ou um “ processo de criação” , conforme ilustram os
exemplos (63a) e (63b), respectivamente.
(63) a. John baked the potato.
b. John baked the cake.
De modo a captar os diferentes significados sem postular a existência de entradas
lexicais distintas, Pustejovsky (1995a) propõe que os complementos contêm determinada
informação que vai “ actuar” sobre a semântica do verbo. Só existe uma entrada lexical
para bake e qualquer outro significado é derivado através do mecanismo generativo de co-
composição.
Considere-se a entrada lexical de bake, em (64)13:
(64)
�������������
�
�
�������������
�
�
���
�
���
�
==
�����
�
�
�����
�
�
��
���
�
===
��
���
�
==
=
��
���
�
==
=
=
)2,1AGENTIVEQUALIA
FORMAL2ARG
FORMAL 1ARG
ARGSTR
HEAD
EEVENTSTR
,bake_act(e
ge_lcpstate_chan
physobj
mass
physobj
danimate_in
e
process:e
bake
1
2
1
1
11
13 Por respeitar a um item em inglês optou-se por reproduzir a entrada lexical original, a partir de Pustejovsky (1995a: 123).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
86
Pertencente ao paradigma dos verbos de mudança de estado quando ocorre com
nomes como potato, o verbo bake passa a pertencer ao paradigma dos verbos de criação
quando ocorre com nomes como cake, bread ou cookie. A explicação para a alteração de
significado do verbo reside no facto de, enquanto complementos como potato denotam um
objecto natural, pelo que só podem sofrer uma mudança de estado, complementos como
cake não existem na natureza, tendo, por isso, de sofrer um processo de criação. A
distinção entre estes dois sentidos faz-se com base nas representações lexicais dos
complementos, nomeadamente através do seu papel agentivo.
Considere-se a entrada lexical de cake, em (65):
(65)
�����������
�
�
�����������
�
�
����
�
�
����
�
�
==
==
=
��
���
�
==
=
y)w,1,bake_act(e
x)z,eat(e2,
x
y
mass:y
food_ind: x
cake
AGENTIVE
TELIC
FORMAL
CONST
QUALIA
ARG-D
ARGARGSTR
1
1
A partir das estruturas lexicais em (64) e (65) pode verificar-se que ambas
partilham o valor do papel agentivo. A semântica do SV bake a cake resulta de duas
operações básicas: (i) aplicação de uma função que liga o objecto à estrutura argumental
do verbo bake (ARG2); (ii) unificação do traço do quale agentivo: QA(bake) = QA(the cake).
Em (66) encontra-se representada a estrutura lexical do SV bake a cake.
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
87
(66)
������������������������
�
�
������������������������
�
�
����
�
�
����
�
�
=
==
����������
�
�
����������
�
�
��
���
�
===
���
�
�
���
�
�
====
��
���
�
==
=
����
�
�
����
�
�
=<=
==
=
=
)3,1AGENTIVE
)2FORMALQUALIA
FORMAL3ARG
FORMAL
3CONST2ARG
FORMAL 1ARG
ARGSTR
HEAD
RESTR
E
E
EVENTSTR
,bake_act(e
,exist(e
create_lcp
mass
material
physobj
artifact
physobj
danimate_in
e
�
state:e2
process:e
cake a bake
1
2
3
2
1
1
2
11
O resultado do mecanismo de co-composição consiste, assim, numa representação
semântica a nível do SV.
Para o português, este tipo de operação é normalmente ilustrado com o verbo
cozer. Atente-se nos exemplos (67), apresentados em Berkeley Cotter (2002: 44):
(67) a. O Manuel cozeu a carne.
b. O Manuel cozeu o pão.
Neste caso, o verbo cozer também pode denotar uma mudança de estado - (67a) -
ou um processo de criação - (67b) - comportando-se do mesmo modo que bake. No
entanto, como a autora refere, a distinção entre estes sentidos para o verbo cozer pode não
ser tão linear em Português como o é em Inglês.
Observem-se os seguintes exemplos (Berkeley Cotter, op. cit.: 46):
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
88
(68) a. Vou pôr o pão a cozer.
b. O pão já está a começar a ficar cozido.
Em ambas as estruturas em (68) o item pão é interpretado como um artefacto já
confeccionado, que ainda não está no estado cozido, ou seja, não há nenhum processo de
criação, verificando-se somente a leitura de mudança de estado.
“ De facto, parece que o verbo cozer não implica uma criação, mas apenas uma mudança de estado, independentemente do complemento que o acompanha. (...) talvez os falantes considerem o artefacto pão enquanto tal, assim que dão a sua confecção por terminada e não apenas após a sua cozedura.” (Berkeley Cotter, op. cit.: 46)
Vai ser, igualmente, através do mecanismo de co-composição, ou seja, através da
interacção entre o significado de um item lexical e os significados dos seus argumentos,
que é possível interpretar adequadamente estruturas como as apresentadas em (69).
(69) a. A Maria abriu a carta.
b. A Maria abriu a porta.
Ao analisarmos as entradas lexicais de carta e porta, em (70) e (71), podemos
observar que o papel télico destes nomes é ‘ler’ e ‘atravessar’, respectivamente.
(70)
���������
�
�
���������
�
�
���
�
�
���
�
�
===
��
���
�
==
=
•
•
y)xz,,ler(e
y)conter(x,
_PLCinformaçãosicoobjecto_fí
informação:y
sicoobjecto_fí: x
carta
1
2
1
TÉLICO
FORMALAESTR_QUALI
ARG
ARGESTR_ARG
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
89
(71)
��������
�
�
��������
�
�
��
���
�
==
��
���
�
==
=
•
y)z,,(eatravessar
LCabertura_Psicoobjecto_fí
abertura:y
sicoobjecto_fí: x
porta
1
2
1
TÉLICOAESTR_QUALI
ARG
ARGESTR_ARG
O valor dos papéis télico dos complementos carta e porta é partilhado pelo valor do
papel formal do predicado abrir, procedendo-se, deste modo, a uma unificação qualia
entre o predicado e o complemento. Em (72) apresenta-se a representação lexical por
defeito de abrir.
(72)
[ ]��������������������
�
�
��������������������
�
�
����
�
�
����
�
�
=
�==
�����
�
�
�����
�
�
��
���
�
==
��
���
�
==
=
���
�
�
���
�
�
<===
=
) , ,rir(eacto_de_ab
) ) ( ,P(e
o_PLCpor_defeitcausativo_
sicoobjecto_fí
entidade
indivíduo
entidade
�
estado:e
processo:e
abrir
21 AGENTIVO
2 TÉLICOFORMALAESTR_QUALI
FORMAL2ARG
FORMAL1ARG
ESTR_ARG
RESTR
E
E
ESTR_EVENT
1
2
2
1
22
11
Em que � representa o operador modal que exprime possibilidade.
A partir da estrutura em (72) pode verificar-se que o argumento mais proeminente
é ARG2, ou seja, o argumento interno. É sobre o papel télico da estrutura deste argumento
que o verbo abrir vai operar, procedendo-se a uma unificação de papéis qualia.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
90
Estruturas como abrir a carta e abrir a porta possibilitam a “ actualização” do papel
télico dos complementos, i.e., ‘ler’ e ‘atravessar’. Deste modo, através do mecanismo
generativo de co-composição, a unificação qualia é possível, permitindo captar um
determinado significado verbal em contexto. Em (73) e (74) representam-se as estruturas
resultantes da co-composição dos SV’s abrir a carta e abrir a porta.
(73)
[ ]�����������������������������
�
�
�����������������������������
�
�
����
�
�
����
�
�
=
�==
�������������
�
�
�������������
�
�
����������
�
�
����������
�
�
���
�
�
���
�
�
==
==
��
���
�
==
==
��
���
�
==
=
���
�
�
���
�
�
<===
=
•
•
)2 , ,rir(eacto_de_ab
) ,P(e
o_PLCpor_defeitcausativo_
y)xz,ler(e,
y)conter(x,
_PLCinformaçãosicoobjecto_fí
informação:y
sicoobjecto_fí: x
carta
2
indivíduo
entidade
�
estado:e
processo:e
carta aabrir
1 AGENTIVO
3FORMALAESTR_QUALI
3 TÉLICO
FORMALAESTR_QUALI
ARG
ARGESTR_ARG
ARG
FORMAL1ARG
ESTR_ARG
RESTR
E
E
ESTR_EVENT
1
2
2
1
2
1
22
11
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
91
(74)
[ ]���������������������������
�
�
���������������������������
�
�
����
�
�
����
�
�
=
�==
������������
�
�
������������
�
�
��������
�
�
��������
�
�
���
�
���
�
===
��
���
�
==
==
��
���
�
==
=
���
�
�
���
�
�
<===
=
•
) 2 , ,rir(eacto_de_ab
) ,P(e
o_PLCpor_defeitcausativo_
y)z,(e,atravessar
LCabertura_Psicoobjecto_fí
abertura:y
sicoobjecto_fí: x
porta
indivíduo
entidade
�
estado:e
processo:e
porta aabrir
1 AGENTIVO
3FORMALAESTR_QUALI
3 TÉLICOAESTR_QUALI
ARG
ARGESTR_ARG2ARG
FORMAL1ARG
ESTR_ARG
RESTR
E
E
ESTR_EVENT
1
2
2
1
2
1
22
11
O mecanismo de co-composição permite, desta forma, fazer uso da informação
semântica presente nos qualia, tanto do functor como dos seus argumentos.
3.3.4.5. LIGAÇÃO SELECTIVA
A ligação selectiva está relacionada com a polissemia adjectival e opera dentro de
estruturas nome-adjectivo. Considerem-se os seguintes exemplos:
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
92
(75) a. O Carlos é um dactilógrafo rápido.
b. Precisamos de um carro rápido para chegar a tempo.
c. Há que tomar decisões rápidas.
O adjectivo rápido tem significados diferentes em (75) em consequência da relação
semântica que estabelece com o nome que modifica. Ou seja, o significado do adjectivo é
parcialmente determinado pela semântica do nome com o qual co-ocorre.
Através da operação de ligação selectiva o adjectivo selecciona uma determinada
interpretação contida na estrutura qualia do nome que modifica. Neste caso, é o adjectivo
que tem o papel de functor que é aplicado a um determinado papel quale do nome com o
qual co-ocorre. Nos casos de dactilógrafo e carro é o papel télico (que denota actividade ou
função) que é referido pelo adjectivo. No caso de decisões é o papel agentivo que é
seleccionado. Em suma, a diferença de significados em frases como as apresentadas em
(75) é explicada através de um dos papéis qualia do nome, sobre o qual o adjectivo opera.
Observem-se as seguintes representações para dactilógrafo rápido, em (76), e decisões
rápidas, em (77).
(76)
[ ]
[ ] �������������
�
�
�������������
�
�
==
��������
�
�
��������
�
�
��������
�
�
��������
�
�
��
���
�
==
=
��
���
�
==
===
==
)e,rápido(e
y)x,,far(edactilogra
x
texto:y
humano: x
fodactilógra
estado:e
rápido fodactilógra
21
2
2
1
1
11
FORMALAESTR_QUALI
TÉLICO
FORMALAESTR_QUALI
ARG
ARGESTR_ARGARGESTR_ARG
EESTR_EVENT
3. DOS LÉXICOS ESTÁTICOS AO LÉXICO GENERATIVO
93
(77)
[ ]
[ ] �������������
�
�
�������������
�
�
==
��������
�
�
��������
�
�
��������
�
�
��������
�
�
��
���
�
==
=
��
���
�
==
===
==
)e,rápido(e
x)y,, tomar(e
x
abstracto:x
humano:y
decisões
estado:e
rápidas decisões
21
2
2
1
1
11
FORMALAESTR_QUALI
AGENTIVO
FORMALAESTR_QUALI
ARG
ARGESTR_ARGARGESTR_ARG
EESTR_EVENT
Enquanto adjectivos como rápido seleccionam eventos, denotados pelos valores
dos papéis télico ou agentivo dos nomes com os quais se combinam, adjectivos como
bonito seleccionam objectos, denotados pelo valor do papel formal. Uma estrutura como
dactilógrafo bonito teria a seguinte representação:
(78)
[ ]
[ ] �������������
�
�
�������������
�
�
==
��������
�
�
��������
�
�
��������
�
�
��������
�
�
��
���
�
==
=
��
���
�
==
===
==
x),bonito(e
y)x,,far(edactilogra
x
texto:y
humano: x
fodactilógra
estado:e
bonito fodactilógra
1
2
2
1
1
11
FORMALAESTR_QUALI
TÉLICO
FORMALAESTR_QUALI
ARG
ARGESTR_ARGARGESTR_ARG
EESTR_EVENT
A diferença entre (76) e (77), por um lado, e (78), por outro, reside no facto de os
adjectivos se aplicarem a distintos papéis qualia de dactilógrafo: rápido aplica-se ao papel
télico, enquanto bonito se aplica ao papel formal.
Contrariamente a abordagens como os Léxicos Enumerativos de Sentidos, o
modelo do Léxico Generativo propõe uma única entrada lexical complexa, na qual está
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
94
codificada toda a informação pertinente para a interpretação do item lexical. Esta
informação encontra-se distribuída por vários níveis de representação, que, por sua vez,
se relacionam com vários mecanismos generativos, permitindo obter a interpretação
adequada do item polissémico no contexto apropriado.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
95
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
... generative lexicon theory (GL) has succeeded in describing and
explaining many cases of systematic polysemy.
(Buitelaar, 1998: 29)
Após a apresentação de várias abordagens utilizadas na representação dos itens
lexicais, este capítulo centra-se no modelo do Léxico Generativo, quadro teórico em que
este estudo se insere.
Caracterizados os níveis de representação, que codificam toda a informação
pertinente associada aos itens lexicais, bem como os mecanismos generativos, que,
interagindo com essa informação, captam a variação de sentidos em contexto, cabe agora
reflectir sobre alguns casos de polissemia em particular.
Em termos gerais, neste capítulo procede-se a uma caracterização de algumas
expressões polissémicas, do modo como são representadas no quadro do LG, salientando
as virtualidades e dificuldades encontradas, bem como algumas questões sobre a
aplicação dos mecanismos de coerção.
4.1. TIPOS NOMINAIS COMPLEXOS
Considere-se novamente o item livro, polissémico entre as interpretações de
‘objecto físico’ e ‘informação’, cuja entrada lexical se apresenta em (1), de acordo com o
modelo do LG.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
96
(1)
�����������
�
�
�����������
�
�
����
�
�
����
�
�
==
==
��
���
�
==
=
•
•
•
y)xv,,escrever(e
y)xw,,ler(e
x)conter(y,
sico_objecto_fíinformação
sicoobjecto_fí:y
informação: x
livro
2
1
2
1
AGENTIVO
TÉLICO
FORMAL
PLC
AESTR_QUALI
ARG
ARGESTR_ARG
O PLC1 de livro representa o tipo complexo (x•y), que é composto pelos tipos
simples (x:informação) e (y:objecto_físico). Como já foi referido, o PLC contém todas as
combinações possíveis entre os tipos, ou seja, os dois tipos simples e o tipo complexo
resultante da sua combinação. Quando o PLC surge em contexto torna-se necessário
extrair, a partir do tipo complexo, o tipo que contém o significado apropriado. Essa
extracção é feita através do operador Σ, que, do dot object, extrai um dos três tipos
disponíveis – cada um dos tipos individuais e o próprio tipo complexo - como se pode ver
a partir da função apresentada em (2) e contextualizada em (3).
(2) PLC = {σ1 • σ2, Σ1[σ1 • σ2]:σ1, Σ2[σ1 • σ2]:σ2}
(3) a. Σ1[inf•objecto_físico]:inf
b. Σ2[inf•objecto_físico]:objecto_físico
c. inf•objecto_físico_PLC = {inf•objecto_físico, inf, objecto_físico}
Analisem-se, agora, os seguintes exemplos:
(4) a. O João leu o livro.
b. O João escreveu o livro.
c. O João acredita no livro.
1 Para uma definição de PLC cf. 3.3.3.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
97
(5) a. O João rasgou o livro.
b. O João estragou o livro.
c. O João sujou o livro.
(6) O cão estragou o livro mais divertido que eu tinha.
Nas frases em (4) os predicados ler, escrever e acreditar seleccionam o tipo simples
que denota ‘informação’. Nas frases em (5), os predicados rasgar, estragar e sujar
seleccionam o tipo simples ‘objecto físico’. Finalmente, em (6), a ocorrência dos predicados
estragar e divertido na mesma estrutura seleccionam o tipo complexo
informação•objecto_físico, na medida em que cada um dos predicados é aplicado sobre
um tipo simples distinto, fazendo emergir ambos os tipos na mesma estrutura.
Formalmente, na selecção dos tipos semânticos são aplicados os mecanismos de
coerção de subtipo -Θ - e de coerção de complemento - Σ. Em (7) e (8) encontram-se
representados os mecanismos aplicados na extracção do tipo ‘informação’.
(7) a. Θ [livro ≤ informação] : livro → informação
b. Θ [informação ≤ proposição] : informação → proposição
(8) [ ]
[ ] proposição:sico))objecto_fí(inf( proposiçãoinf
proposiçãoinf:proposiçãoinf , inf:sico)objecto_fí(inf
1
1
•
•
Σ≤Θ→≤ΘΣ
A estrutura em (7) mostra como o operador Θ permite derivar um supertipo,
através da hierarquia de tipos (livro ≤ informação ≤ proposição). No que respeita à
estrutura em (8), esta ilustra como o operador Σ permite extrair o tipo ‘informação’ (inf)
que pode, por sua vez, ser usado por Θ para obter o supertipo ‘proposição’.
Em (9) é apresentada a interpretação semântica associada à representação em (8).
Em (9b) é aplicado o mecanismo de coerção de complemento que extrai o tipo semântico
adequado (inf). Em (9c) é aplicado o mecanismo de coerção de subtipo que permite
interpretar adequadamente livro como uma proposição, tornando possível interpretar
correctamente a estrutura O João acredita no livro como ‘o João acredita na informação que
está no livro’.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
98
(9) a. O João acredita no livro.
b. acreditar( Θ (Σ1(livro))) (João) �
c. acreditar( Θ (livro:inf)) (João) �
d. acreditar(livro:proposição) (João)
No que respeita à extracção do tipo ‘objecto físico’, em (10) e (11) encontram-se
representados os mecanismos aplicados.
(10) a. Θ [livro ≤ obj_físico] : livro → obj_físico
b. Θ [obj_físico ≤ indivíduo] : obj_físico → indivíduo
(11) [ ]
[ ] indivíduo:sico))objecto_fí(inf( indivíduoobj_físico
indivíduoobj_físico:indivíduoobj_físico , obj_físico:)obj_físico(inf
1
1
•
•
Σ≤Θ→≤ΘΣ
À semelhança do que se observou anteriormente, em (12) é apresentada a
interpretação semântica associada à representação em (11), a partir da qual é possível
interpretar adequadamente o João sujou o livro como ‘o João sujou o objecto físico que livro
representa’.
(12) a. O João sujou o livro.
b. sujar(Θ (Σ1(livro))) (João) �
c. sujar(Θ (livro:obj_físico)) (João) �
d. sujar(livro:indivíduo) (João)
Nos exemplos analisados, os mecanismos de coerção, nomeadamente de coerção
de subtipo (Θ ) e de coerção de complemento (Σ), permitem, desta forma, seleccionar o
tipo semântico requerido pelo verbo, obtendo-se a interpretação adequada no contexto
apropriado.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
99
4.1.1. SELECÇÃO SEMÂNTICA E INTERPRETAÇÃO DE TIPOS COMPLEXOS
Como se pode verificar, alguns predicados são semanticamente especificados na
medida em que seleccionam directamente um tipo semântico particular. É o caso de ler,
escrever, acreditar ou divertido, entre outros, que seleccionam o tipo ‘informação’, ou de
rasgar, sujar, riscar ou cair, entre outros, que seleccionam o tipo ‘objecto físico’.
No entanto, existem alguns predicados que podem ser vagos no que respeita ao
tipo semântico que seleccionam.
Observem-se os exemplos apresentados em (13)
(13) a. O João gostou do livro porque tem uma capa bonita.
b. O João gostou do livro porque a história é divertida.
c. O João gostou do livro.
É importante salientar, nestes casos, as propriedades de selecção do predicado
gostar que, semanticamente, selecciona um complemento com uma interpretação eventiva.
A presença das orações subordinadas causais em (13a) e (13b) remetem para a
interpretação de livro como ‘objecto físico’ e ‘informação’, respectivamente. No entanto,
em (13c), não há nenhuma informação que especifique quais são os aspectos de livro de
que o João gosta. Tanto pode ser denotado o ‘objecto físico’ (capa, tamanho, qualidade do
papel), como a ‘informação’ (história, estilo de escrita), como, ainda, o ‘objecto físico’ e a
‘informação’ simultaneamente.
Note-se ainda que o nome livro tem acessível, como parte da sua especificação
lexical, um papel agentivo e um papel télico, relativos ao seu processo típico de criação e
uso, respectivamente. Deste modo, se se aludir ao significado de ‘informação’ - (13b) -, a
frase tem ainda como interpretações possíveis O João gostou de ler/escrever o livro.
Para a estrutura em (13c) são possíveis os vários contextos presentes em (14), que
forçam uma dada interpretação. Nos exemplos em (15) representa-se a forma lógica de
cada interpretação.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
100
(14) a. O João gostou do livro. É de fácil leitura.
b. O João gostou do livro. Divertiu-se muito a escrevê-lo.
c. O João gostou do livro. A capa é bonita e o papel é de boa qualidade.
d. O João gostou do livro. A capa é bonita e a história é muito divertida.
(15) a. ∃x•y ∃e ∃e’[gostar(e, João, e’) ∧ ler(e’, João, y) ∧ livro(x:obj • y:inf)]
b. ∃x•y ∃e ∃e’[gostar(e, João, e’) ∧ escrever(e’, João, y) ∧ livro(x:obj • y:inf)]
c. ∃x•y ∃e[gostar(e, João, x) ∧ livro(x:obj • y:inf)]
d. ∃x•y ∃e[gostar(e, João, x•y) ∧ livro(x:obj • y:inf)]
No entanto, a leitura preferencial e imediatamente reconhecida pelos falantes é a
de ‘informação’, mais particularmente aquela que alude ao papel télico de livro, ou seja,
‘ler’. Contudo, a interpretação que se refere ao papel agentivo, i.e. ‘escrever’, também é
aceite, principalmente se a estrutura envolver aspectos relativos ao conhecimento do
mundo, como se pode observar em (16).
(16) “O Ensaio Sobre a Cegueira” é o livro de que Saramago gostou mais.
Finalmente, a interpretação de ‘objecto físico’ (14c) parece ser mais forçada do que
as anteriores, mas também é aceite pelos falantes e prevista pelo modelo.
Note-se que os predicados que se encontram numa relação de sinonímia,
antonímia ou hiponímia com gostar apresentam um comportamento semântico
semelhante.
(17) a. O João apreciou/adorou o livro.
b. O João detestou/odiou o livro.
A par de predicados como gostar, predicados como vender ou comprar, quando
seleccionam complementos como livro, também admitem ambiguidade relativamente ao
tipo semântico que seleccionam.
(18) O Pedro vendeu o livro.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
101
Neste caso, o complemento livro pode ser interpretado quer como ‘objecto físico’ –
leitura mais imediata – quer como ‘informação’, na medida em que vender o livro pode ser
entendido como vender o conteúdo informacional.
4.1.2. O PAPEL CONSTITUTIVO
Quando os itens lexicais denotam tipos complexos, uma das questões que se
coloca no modelo do LG diz respeito à atribuição do valor respeitante ao seu papel
constitutivo. Pustejovsky (1995a) não apresenta nenhuma especificação relativamente a
este quale. Na verdade, o autor defende a não obrigatoriedade de atribuir valores a todos
os papéis da estrutura qualia.
“There are two general points that should be made concerning qualia roles: (1) Every category expresses a qualia structure; (2) Not all lexical items carry a value for each qualia role.” (Pustejovsky, 1995a: 76)
No caso das expressões polissémicas, verifica-se que os dois tipos simples que
compõem o tipo complexo apresentam constituições diferentes. Relativamente a livro, se,
por um lado, enquanto ‘objecto físico’ livro é composto por capa, folhas e páginas, enquanto
‘informação’ livro é, por sua vez, composto por capítulos, parágrafos, frases, palavras, entre
outros.
Deste modo, o valor do papel constitutivo de livro teria uma representação como a
apresentada em (19).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
102
(19)
[]
��������������
�
�
��������������
�
�
��������
�
�
��������
�
�
==
∧∧∧∧∧∧∧∧=
=
=
��
���
�
==
=
•
•
•
y)xv,,escrever(e
y)xw,,ler(e
...x),parte_de(dfrase(d)x),parte_de(cpalavra(c)
y),parte_de(bfolha(b)y),parte_de(aapa(a)c
x)conter(y,
físico_ objectoinformação
sicoobjecto_fí:y
informação: x
livro
2
1
2
1
AGENTIVO
TÉLICO
CONST
FORMAL
PLC
AESTR_QUALI
ARG
ARGESTR_ARG
No entanto, esta enumeração exaustiva não é a opção mais económica. Como se
referiu no capítulo 3.3.2, para se obter a representação semântica de um item lexical é
necessário que este aceda a um tipo semântico, presente numa rede de tipos
hierarquicamente organizada, de modo a permitir a herança de traços dos seus
supertipos. Assim, também a informação respeitante à estrutura qualia é herdada através
da estrutura de tipos.
Deste modo, pode deduzir-se que livro herda o valor do papel constitutivo dos
seus supertipos - respeitantes ao objecto físico e à informação – não sendo necessário listar
esse valor na sua entrada lexical. O mesmo processo de herança de valores dos papéis
qualia parece ser válido para outros itens polissémicos como banco ou cerejeira, por
exemplo. Cerejeira herdará constituintes como folhas, ramos, tronco, ou raiz, a partir do
supertipo ‘árvore’. Por outro lado, herdará constituintes como veios ou nódulos, a partir do
supertipo ‘madeira’. Relativamente a banco, este herdará constituintes como paredes, tecto
ou janelas, a partir do supertipo ‘edifício’, bem como os constituintes trabalhadores ou
directores, a partir do supertipo ‘instituição’.
Um dos aspectos que merece particular atenção acerca dos elementos constituintes
– ou partes - de livro tem a ver com o facto de estes poderem representar, ou não, casos
análogos de polissemia regular.
Considerem-se, primeiramente, os constituintes relativos ao tipo ‘objecto físico’,
como capa, folhas e páginas.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
103
Relativamente a capa, importa realçar a relação de metonímia existente entre as
interpretações de ‘cobertura – dura ou mole – que protege as folhas que constituem o
livro’, por um lado, e ‘face oposta à contracapa’, por outro. No primeiro caso, capa é, por
sua vez, constituída pela lombada, pela contracapa e pela parte da frente, ou capa. Os
exemplos em (20) ilustram as duas acepções mencionadas.
(20) a. Os livros de capa mole são mais baratos. (cobertura)
b. Comprei o livro que tem o Stephen Hawking na capa. (oposto à contracapa)
Considerem-se agora os exemplos de (21) e (22):
(21) a. Esta capa está riscada/suja/mal impressa.
b. Esta folha está riscada/suja/mal impressa.
c. Esta página está riscada/suja/mal impressa.
(22) a. Esta capa é deprimente/falaciosa/confusa.
b. ??Esta folha é deprimente/falaciosa/confusa.
c. Esta página é deprimente/falaciosa/confusa.
Enquanto nas estruturas em (21) os itens capa, folha e página são interpretados
como ‘objecto físico’, em (22) os mesmos itens denotam a informação contida no
respectivo objecto físico.
A gramaticalidade de (22a) e (22c) mostra que os constituintes de livro - capa e
página - apresentam o mesmo tipo de polissemia que o seu holónimo, ou seja, permitem a
alternância entre as interpretações de ‘objecto físico’ e ‘informação’.
No que respeita a folha, a interpretação de ‘objecto físico’ parece ser mais
proeminente. De facto, quando se refere o tipo ‘informação’ página parece ser a expressão
mais aceite.
Atente-se agora nos constituintes relativos ao tipo ‘informação’, como frases,
parágrafos e desenho.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
104
(23) a. Esta frase é deprimente/falaciosa/confusa.
b. Este parágrafo é deprimente/falacioso/confuso.
c. Este desenho é deprimente/falacioso/confuso.
(24) a. Esta frase está riscada/suja/mal impressa.
b. Este parágrafo está riscado/sujo/mal impresso.
c. Este desenho está riscado/sujo/mal impresso.
Como se pode ver a partir dos exemplos em (23) e (24) os itens frase, parágrafo e
desenho, a par de livro, também apresentam um comportamento polissémico, podendo
entrar em construções que seleccionam quer o tipo ‘informação’ quer o tipo ‘objecto
físico’. Este último pode ser explicado tendo em consideração que estes elementos
ocupam um determinado espaço físico num dado objecto físico.
Tendo já em consideração que os elementos que se encontram numa relação de
subtipificação com livro - como romance ou dicionário - por herdarem certos traços do seu
supertipo são expressões que apresentam igualmente a alternância entre as interpretações
de ‘objecto físico’ e ‘informação’, esta secção tinha como objectivo principal questionar se
os seus constituintes, ou merónimos, também apresentavam esta alternância de
significados. A partir da análise dos exemplos de (21) a (24) pode verificar-se que os
diferentes constituintes referentes aos dois tipos denotados por livro também apresentam
comportamento polissémico.
4.2. ADJECTIVOS RELATIVOS E MODIFICADORES DE PROPRIEDADE
Como se referiu anteriormente no capítulo 2, o mesmo adjectivo pode ter
significados diferentes conforme se encontra em posição pré-nominal ou pós-nominal.
(25) O António é um marinheiro velho.
→ #O António é marinheiro há muito tempo.
→ O António é um marinheiro de idade avançada.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
105
(26) O António é um velho marinheiro.
→ O António é marinheiro há muito tempo.
→ O António é um marinheiro de idade avançada.
Na terminologia de Bouillon (1999), cuja proposta se explora nesta secção2,
enquanto em (25) o adjectivo velho é RELATIVO e a frase tem como única interpretação ‘o
António é um marinheiro de idade avançada’, em (26) o adjectivo é MODIFICADOR DE
PROPRIEDADE3 e a frase pode ser interpretada tanto como ‘o António é marinheiro há
muito tempo‘, como ‘o António é um marinheiro de idade avançada’4.
O comportamento de adjectivos como velho origina, assim, o levantamento de
algumas questões:
(i) Como é que se podem derivar os significados de relativo e de modificador de
propriedade a partir das representações do nome e do adjectivo?
(ii) Como é que o adjectivo velho pode ser ambíguo entre os significados de
relativo e de modificador de propriedade quando se encontra em posição
pré-nominal (Adj N), como se pode observar a partir de (26)?
(iii) Por que é que nem todas as construções Adj N apresentam essa alternância
de significados (por exemplo, porque é que se pode interpretar um velho
amigo como ‘alguém que é amigo há muito tempo’, mas estruturas como um
velho homem ou uma velha tia não podem ser interpretadas como ‘alguém que
é homem/tio há muito tempo’)?
(iv) Por que é que o adjectivo tem de preceder o nome para que a interpretação
de modificador de propriedade seja possível (um marinheiro velho dificilmente
é interpretado como ‘alguém que é marinheiro há muito tempo’)?
2 As representações aqui propostas seguem no essencial a análise de Bouillon (1999) para o Francês. 3 Como se referiu em 2.5.3, na terminologia de Bouillon (1997, 1999), o adjectivo é RELATIVO quando se encontra em posição pós-nominal e MODIFICADOR DE PROPRIEDADE quando se encontra em posição pré-nominal. 4 Os juízos de valor podem variar relativamente à interpretação de frases como O António é um velho marinheiro. Ainda que a interpretação preferencial seja ‘o António é marinheiro há muito tempo’ , em que o adjectivo adquire o valor de modificador de propriedade, não se exclui, neste trabalho, a interpretação de ‘ idoso’ . Note-se, contudo, que esta última não é decorrente da primeira, ou seja, não é necessariamente verdade que, sendo marinheiro há muito tempo, o António seja um indivíduo idoso.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
106
Nas próximas secções tentar-se-á responder a estas questões no quadro do modelo
do LG. As representações subespecificadas permitem derivar os diferentes significados de
adjectivos como velho, tendo em atenção a semântica do próprio adjectivo, a semântica do
nome e o modo como ambos se combinam.
4.2.1. TRANSCRIÇÃO DE TIPO
No que respeita à semântica de adjectivos como velho, estes podem modificar tanto
nomes que denotem indivíduos como nomes que denotem estados, como se pode
observar a partir dos exemplos (27) e (28), respectivamente.
(27) a. um velho homem
b. um velho cão
(28) a. uma velha amizade
b. um velho amor
Bouillon (1999) defende que existe uma relação entre os tipos ‘indivíduo’ e
‘estado’, uma vez que quando adjectivos como velho se combinam com um nome que
denota um indivíduo está implícito que este se encontra num determinado estado. A
partir das estruturas em (27) pode observar-se que homem e cão, ainda que denotando
indíviduos, é o estado de ‘existir’ que é modificado: ‘existem há bastante tempo’.
Os adjectivos como velho podem combinar-se com nomes que denotem
argumentos de tipos diferentes. No caso de marinheiro, por exemplo, que, por poder ser
definido como ‘alguém que tem aptidão para navegar’, pode ser caracterizado como
tendo argumentos de três tipos: humano, estado (ter aptidão) e processo (navegar).
De acordo com o modelo do LG, o adjectivo tem acesso à estrutura qualia do nome
com o qual se combina (Ligação Selectiva)5. Note-se que os adjectivos como velho podem
modificar dois tipos semânticos diferentes (‘indivíduo’ e ‘estado’). Deste modo, estes
5 Cf. capítulo 3.3.4.5.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
107
adjectivos podem predicar sobre ambos os tipos contidos na estrutura qualia do nome,
dando origem à ambiguidade presente nas construções Adj N.
Estruturas como um velho marinheiro podem ser interpretadas do seguinte modo:
(i) o adjectivo é aplicado ao argumento do tipo ‘humano’ denotado por marinheiro,
obtendo-se a interpretação de ‘um indivíduo velho que tem aptidão para navegar’; (ii) o
adjectivo é aplicado ao argumento do tipo ‘estado’ (ter aptidão), obtendo-se a
interpretação de ‘alguém que tem aptidão para navegar há bastante tempo’.
Em (29) encontra-se representada a entrada lexical para o adjectivo velho, adaptada
de Bouillon (1999: 7).
(29)
[ ][ ]
������
�
�
������
�
�
��
���
�
∧==
====
•
•
)velho(e)e x,existir(e
estado_
estado:e
estado:eindivíduo: x
velho
121
11
21
FORMAL
PLCAESTR_QUALI
EESTR_EVENT
ARGESTR_ARG
A estrutura em (29) representa um estado - existir(e1,x•e2) - que é ‘velho’ -
velho(e1). Bouillon (1999) propõe que o adjectivo toma como argumento o tipo complexo
indivíduo•estado. Esta proposta é inovadora na medida em que, ao considerar que o
adjectivo apresenta um argumento do tipo complexo, o adjectivo tem, necessariamente,
acesso aos tipos que compõem esse tipo complexo, podendo predicar sobre nomes que
denotem apenas um desses tipos. No entanto, no caso de o adjectivo modificar um nome
que denote somente o tipo ‘indivíduo’, por exemplo, este vai ser “coagido” de modo a
denotar igualmente um estado através de um processo de TRANSCRIÇÃO DE TIPO: o
indivíduo encontra-se num estado de existência e esse estado é “velho”.
A TRANSCRIÇÃO DE TIPO é uma variante à COERÇÃO DE TIPO. Em vez de alterar o
tipo semântico do argumento para o tipo requerido pelo predicado, a transcrição de tipo
adiciona à semântica do argumento a informação presente na semântica do predicado. A
sua aplicação depende de dois factores: (i) o adjectivo seleccionar um tipo complexo
indivíduo•estado; (ii) o argumento denotar um tipo contido no tipo complexo do
adjectivo. Deste modo, o argumento não sofre alteração de tipo, apenas lhe é acrescentada
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
108
informação relativa ao outro tipo simples que faz parte do tipo complexo do adjectivo,
que ele não possui.
4.2.2. POSIÇÃO DO ADJECTIVO
De acordo com a classificação apresentada em 2.5.3, velho é um adjectivo
predicativo que pode ocorrer tanto em posição adnominal (um homem velho/um velho
homem), como em posição predicativa (este homem é velho). Tendo em consideração esta
propriedade distribucional, esta secção tem como objectivo analisar o modo como o
adjectivo se combina com diferentes tipos de nomes no LG, quer em posição adnominal
quer em posição predicativa. Distinguir-se-ão três tipos de nomes: (i) nomes com o tipo
simples ‘indivíduo’; (ii) nomes com o tipo simples ‘estado’; (iii) nomes que contêm na sua
estrutura semântica elementos com o tipo ‘indivíduo’ e com o tipo ‘estado’.
4.2.2.1. NOMES COM O TIPO SIMPLES ‘INDIVÍDUO’
Considere-se em (30) a representação do nome homem, que denota o tipo simples
‘indivíduo’.
(30) [ ]
������
�
�
������
�
�
��
���
�
==
==
x
indivíduo_
indivíduo: x
homem
FORMAL
PLCAESTR_QUALI
ARGESTR_ARG 1
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
109
Quando se combina com nomes como homem, os adjectivos como velho só podem
ser aplicados ao tipo semântico ‘indivíduo’, adicionando, através do mecanismo de
transcrição de tipo, o tipo ‘estado’, constituinte do tipo complexo indivíduo•estado
exigido pelo adjectivo.
Em posição predicativa, o conteúdo semântico do nome é inserido no papel formal
da estrutura qualia do adjectivo, como se pode ver em (31).
(31)
[ ][ ]
������
�
�
������
�
�
��
���
�
∧∧==
====
•
•
indivíduo:homem(x))velho(e)ex,existir(e
estado_
estado:e
estado:eindivíduo: x
velhoé homem este
121
11
21
FORMAL
PLCAESTR_QUALI
EESTR_EVENT
ARGESTR_ARG
Em posição adnominal, é o conteúdo semântico do adjectivo que é inserido no
papel formal da estrutura qualia do nome, como se pode ver em (32).
(32) [ ]
������
�
�
������
�
�
��
���
�
∧∧==
==
• )velho(e)ex,existir(e:)velho(e x
indivíduo_
indivíduo: x
homem velhoum / velhohomem um
1211
1
FORMAL
PLCAESTR_QUALI
ARGESTR_ARG
Uma vez que o nome denota apenas um dos tipos simples - ‘indivíduo’ - que
constituem o tipo complexo denotado pelo adjectivo, este só pode modificar o estado
existir (que surge no conteúdo semântico do nome através do mecanismo de transcrição
de tipo) aplicado ao indivíduo denotado pelo nome. Em (33) verifica-se que só existe uma
interpretação possível, independentemente da posição ocupada pelo adjectivo.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
110
(33) a. um homem velho
b. um velho homem
c. Este homem é velho.
→ Um indivíduo que existe há bastante tempo.
4.2.2.2. NOMES COM O TIPO SIMPLES ‘ESTADO’
Considere-se em (34) a representação do nome amizade, que denota o tipo simples
‘estado’.
(34) [ ]
��������
�
�
��������
�
�
��
���
�
==
==
��
���
�
==
=
y) x,,amizade(e
estado_
estado:e
indivíduo:y
indivíduo: x
amizade
1
11
2
1
FORMAL
PLCAESTR_QUALI
EESTR_EVENT
D-ARG
D-ARGESTR_ARG
Do mesmo modo que se verificou anteriormente com o nome homem, que denota
somente o tipo simples ‘indivíduo’, o nome amizade denota somente o tipo simples
‘estado’. Quando nomes como amizade se combinam com adjectivos como velho, estes só
podem modificar o estado existir aplicado a esse tipo. A junção do conteúdo semântico do
adjectivo ao conteúdo semântico do nome processa-se do mesmo modo que se verificou
com homem.
Quando o nome denota um tipo simples - ‘estado’ ou ‘indivíduo’ - o adjectivo
modifica unicamente esse tipo e é sempre interpretado como relativo, não gerando
qualquer ambiguidade dependente da sua posição.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
111
4.2.2.3. NOMES QUE DENOTAM PARES ‘INDIVÍDUO’ - ‘ESTADO’
Considere-se a representação do nome alcoólico, que denota argumentos tanto do
tipo ‘indivíduo’ como do tipo ‘estado’.
(35)
[ ]
�����������
�
�
�����������
�
�
����
�
�
����
�
�
==
==
��
���
�
==
=
==
)ex,,o_de(e ter_hábit
x),beber(e
x
agentivo_
processo:e
estado:e
indivíduo: x
alcoólico
21
2
2-2
1-1
1
AGENTIVO
TÉLICO
FORMAL
PLC
AESTR_QUALI
DE
DEESTR_EVENT
ARGESTR_ARG
Bouillon (1999) distingue o que considera o NÚCLEO, ou seja, os argumentos e os
eventos verdadeiros denotados pelo item lexical, em contraste com os argumentos e os
eventos por defeito. No caso de alcoólico o núcleo é ARG1, enquanto os eventos por defeito
são E1-D e E2-D.
Dependendo do tipo de argumento sobre o qual o adjectivo vai ser aplicado, este
relaciona-se com o nome de modos diferentes: (i) se o adjectivo se aplicar ao núcleo do
nome é interpretado como relativo; (ii) se o adjectivo não se aplicar ao núcleo do nome é
interpretado como modificador de propriedade.
Por seleccionar o tipo complexo indivíduo•estado, os adjectivos como velho,
quando se combinam com nomes cujos argumentos denotam igualmente estes dois tipos,
vão adquirir uma interpretação relativa e de modificadores de propriedade. Observem-se
as representações em (36) e (37):
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
112
(36)
[ ]
�����������
�
�
�����������
�
�
����
�
�
����
�
�
==
∧∧==
��
���
�
==
=
==
•
)ex,,o_de(e ter_hábit
x),beber(e
)velho(e)e x,existir(e:)velho(e x
agentivo_
processo:e
estado:e
indivíduo: x
velhoalcoólico um / alcoólico velhoum
21
2
3233
2-2
1-1
1
AGENTIVO
TÉLICO
FORMAL
PLC
AESTR_QUALI
DE
DEESTR_EVENT
ARGESTR_ARG
(37)
[ ]
�����������
�
�
�����������
�
�
����
�
�
����
�
�
∧∧==
==
��
���
�
==
=
==
• )velho(e)e xexistir(e:)velho(e)ex,,o_de(e ter_hábit
x),beber(e
x
agentivo_
processo:e
estado:e
indivíduo: x
alcoólico velhoum
323,321
2
2-2
1-1
1
AGENTIVO
TÉLICO
FORMAL
PLC
AESTR_QUALI
DE
DEESTR_EVENT
ARGESTR_ARG
Em (36) o adjectivo modifica o tipo ‘indivíduo’, ou seja, o núcleo da estrutura de
alcoólico, adquirindo uma interpretação relativa, independentemente de se encontrar em
posição pré ou pós-nominal – ambas as estruturas um alcoólico velho e um velho alcoólico
têm a interpretação de ‘idade avançada’, ou seja, ‘um indivíduo que existe há bastante
tempo e que é alcoólico’. A informação semântica do adjectivo é inserida no papel formal
da estrutura qualia, ou seja, o papel que denota o tipo ‘indivíduo’.
A outra interpretação possível para o adjectivo em posição pré-nominal – ‘um
indivíduo que é alcoólico há bastante tempo’ - encontra-se representada em (37). O
adjectivo modifica o tipo ‘estado’ e o seu conteúdo semântico é inserido no papel
agentivo, ou seja, o papel que denota ‘o hábito de beber’.
Quando o adjectivo se encontra em posição predicativa – este alcoólico é velho – é a
informação semântica do nome que é inserida no papel formal da estrutura qualia do
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
113
adjectivo. A construção predicativa só tem como interpretação ‘um indivíduo que existe
há bastante tempo e que é alcoólico’. Nas construções predicativas, independentemente
de os nomes que se combinam com o adjectivo denotarem argumentos com apenas um
dos tipos ou ambos os tipos que constituem o tipo complexo denotado pelo adjectivo, este
só modifica o tipo ‘indivíduo’. A representação de este alcoólico é velho, em (38), é, deste
modo, semelhante à de este homem é velho, apresentada em (31).
(38)
[ ][ ]
������
�
�
������
�
�
��
���
�
∧∧==
====
•
•
indivíduo:x)alcoólico()velho(e)ex,existir(e
estado_
estado:e
estado:eindivíduo: x
velhoé alcoólico este
121
11
21
FORMAL
PLCAESTR_QUALI
EESTR_EVENT
ARGESTR_ARG
Através do modelo do LG é possível, deste modo, representar os diferentes
significados que os adjectivos como velho podem adquirir, dependendo da posição que
ocupam relativamente ao nome com o qual se combinam. As diferentes interpretações de
‘idade avançada’, por um lado, e ‘existência num determinado estado há bastante tempo’,
por outro, são representadas através da modificação de valores de papéis qualia distintos
da semântica do nome. Enquanto no primeiro caso o adjectivo modifica o valor do papel
formal, no segundo caso o adjectivo modifica o valor do papel agentivo.
4.3. CAUSATIVOS ASPECTUAIS
Os predicados causativos aspectuais, como começar, apresentam um
comportamento polissémico na medida em que, do ponto de vista sintáctico, permitem a
selecção de diferentes tipos de complementos, como se pode observar a partir das
estruturas em (39).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
114
(39) a. O João começou o livro
b. O João começou a ler o livro.
c. O João começou a escrever o livro.
Como foi referido no capítulo anterior, os diferentes contextos sintácticos são
explicados através de um mecanismo de coerção que “coage” os complementos que não
apresentam o tipo sintáctico-semântico requerido pelo verbo a adquirir esse tipo
sintáctico-semântico6.
O facto de a estrutura em (39a) poder ser ambígua entre as estruturas (39b) e (39c)
prende-se com o facto de o verbo começar seleccionar um evento que pode ser denotado
pelos valores dos papéis télico e agentivo do nome que lhe serve de complemento, neste
caso, livro.
No entanto, alguns autores têm contestado a aplicação do mecanismo generativo
de coerção de tipo como uma estratégia eficaz no que respeita à interpretação adequada
de algumas estruturas da língua. Na próxima secção analisar-se-ão algumas estruturas
que parecem apresentar-se como contra-exemplos à aplicação dos mecanismos de
coerção, mas que, como se verá, também podem ser analisadas através destes
mecanismos.
4.3.1. ALGUMAS QUESTÕES SOBRE A COERÇÃO
Algumas estruturas com começar parecem revelar que alguns complementos
nominais não permitem a aplicação dos processos de coerção, tornando-se necessário
restringir a acção dos mecanismos de coerção por forma a não haver sobregeração de
interpretações. Atente-se nos seguintes exemplos:
(40) a. *O João começou o dicionário. (... começou a consultar...)
b. *O João começou a auto-estrada. (... começou a conduzir...)
6 Cf. capítulo 3.3.4.1.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
115
O que as estruturas em (40) evidenciam é que, para as interpretações em questão, o
mecanismo de coerção falha, gerando agramaticalidade, por não encontrar no papel télico
do complemento nominal - ‘consultar’ no caso de dicionário e ‘conduzir’ no caso de auto-
estrada - o tipo esperado pelo verbo começar. Em Pustejovsky & Bouillon (1996)
argumenta-se que os verbos causativos como começar seleccionam um evento do tipo
transição, excluindo, consequentemente, as interpretações de consultar o dicionário e
conduzir a auto-estrada, visto tratar-se de processos. Deste modo, as estruturas em (40)
terão uma interpretação adequada se o mecanismo de coerção se aplicar ao papel agentivo
dos complementos, que denota o acto de criação, ou seja, um evento de transição do tipo
esperado (cf. 41).
(41) a. O João começou o dicionário. (... começou a compilar...)
b. O João começou a auto-estrada. (... começou a construir...)
A mesma explicação sobre a selecção de complementos que denotem transições
está na base da agramaticalidade das estruturas em (43).
(42) a. O João começou o livro. (... começou a ler/escrever...)
b. O João começou o queijo. (...começou a comer...)
(43) a. *O João começou livros. (... começou a ler/escrever...)
b. *O João começou queijos. (... começou a comer...)
Enquanto em (42) a estrutura eventiva denota uma transição, sendo a aplicação do
mecanismo de coerção bem sucedida, em (43), a indefinitude do SN complemento altera o
tipo de evento de transição para processo, falhando a aplicação do mecanismo de coerção.
Deste modo, conclui-se que os complementos seleccionados pelos verbos
causativos aspectuais têm de ter associada uma estrutura eventiva do tipo transição,
disponível directamente ou através do mecanismo de coerção.
Outra restrição à aplicação do mecanismo de coerção está relacionada com as
estruturas de controlo e de elevação em que alguns verbos causativos aspectuais podem
entrar. Atente-se nos seguintes exemplos:
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
116
(44) a. A festa começou.
b. O jantar começou.
Para além das estruturas de controlo como as apresentadas em (39), o verbo
começar pode, também, entrar em construções de elevação como as apresentadas em (44).
A relação sintáctica existente entre as construções de controlo e de elevação é, de
alguma forma, semelhante à relação existente entre as construções causativas e incoativas,
como se pode observar a partir de (45) e (46).
(45) a. O avião afundou o barco.
b. O barco afundou.
(46) a. A Maria começou o filme.
b. O filme começou.
Pustejovsky (1995a) propõe que se aplique o conceito de causalidade à alternância
entre as construções de controlo e de elevação.
“... both raising and control constructions exist for the same aspectual predicate, given that causative and unaccusative forms exist for the same predicate, as with sink. That is, we can view the relation between these two constructions as one involving causation in much the same way as the default causative paradigm.” (Pustejovsky, 1995a: 201)
Apesar de os significados associados às estruturas de controlo e de elevação
estarem estreitamente relacionados, em Pustejovsky & Bouillon (1996) defende-se que só
as estruturas de controlo permitem a coerção.
Atente-se nos seguintes exemplos:
(47) a. O Rui começou a escrever a tese.
b. O Miguel começou a beber a cerveja.
c. O ácido começou a corroer o mármore.
d. O João começou a ficar enjoado.
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
117
Um dos testes-diagnóstico que permite distinguir os predicados de controlo dos
predicados de elevação consiste em construir estruturas com o verbo forçar, denominadas
CONSTRUÇÕES COMPLEMENTO DE FORÇAR (force-complement constructions). Apenas o sentido
de controlo satisfaz as restrições de selecção impostas pelo verbo forçar.
(48) a. O João forçou o Rui a escrever a tese.
b. A Ana forçou o Miguel a beber a cerveja.
c. *O Luís forçou o ácido a corroer o mármore.
d. *A Sofia forçou o João a ficar enjoado.
Conforme se pode observar a partir das estruturas com o verbo forçar em (48), de
acordo com este teste-diagnóstico, a gramaticalidade de (48a) e (48b) permite concluir que
o verbo começar em (47a) e (47b) é um predicado de controlo, que selecciona uma
transição, e que permite a aplicação dos mecanismos de coerção.
(49) a. O Rui começou a tese. (... começou a escrever...)
b. O Miguel começou a cerveja. (... começou a beber...)
Pelo contrário, a agramaticalidade de (48c) e (48d) permite admitir que o verbo
começar em (47c) e (47d) é um predicado de elevação, que selecciona, nos exemplos
mencionados, um processo e um estado, respectivamente, mas que não coloca restrições
quanto à estrutura eventiva do seu complemento7. Estes predicados não permitem a
aplicação dos mecanismos de coerção.
(50) a. *O ácido começou o mármore (... começou a corroer...)
b. *O João começou o enjoo. (... começou a ficar...)
Deste modo, ainda que possa ocorrer em construções de controlo e de elevação, a
natureza da estrutura eventiva do complemento com que co-ocorre em cada um dos casos
é diversa: enquanto predicado de controlo selecciona apenas transições ao passo que
7 Para mais argumentação sobre esta análise cf. Pustejovsky & Bouillon (1996).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
118
enquanto predicado de elevação não impõe restrições quanto à estrutura eventiva do seu
complemento.
No âmbito do LG, a entrada lexical de começar, apresentada em (51) possibilita
ambos os sentidos, o de controlo e o de elevação.
(51)
�����������
�
�
�����������
�
�
��
���
�
���
�
�
���
�
�
<=
��
���
�
==
=
=
==
=
=
=
)ex,,meçar(eacto_de_co
x),P(e
�
estado:e
processo:e
e
humano: x
começar
21
2
22
11
22
1
AGENTIVO
FORMAL A ESTR_QUALI
RESTR
E
E
ESTR_EVENT
ARG
ARGESTR_ARG
�
Como se referiu no capítulo 3, a par dos predicados que exibem a alternância
causativo/incoativo, predicados como começar também são caracterizados pela natureza
não endocêntrica da sua estrutura eventiva, ou seja, não são especificados relativamente
ao núcleo. Deste modo, uma estrutura não endocêntrica como (51) pode ter como
proeminente, ou núcleo, qualquer um dos subeventos que compõem a estrutura eventiva.
Por sua vez, estes subeventos vão estar associados a um papel qualia específico.
“A proeminência de um subevento relativamente aos restantes dá conta da não projecção na sintaxe dos argumentos associados a todos os eventos não nucleares, licenciando apenas a projecção de argumentos associados ao subevento que constitui o NÚCLEO da estrutura.” (Berkeley Cotter, 2002: 69)
Como se pode observar a partir de (51), os papéis qualia estão associados a
subeventos diferentes. Vai ser com base no mecanismo de especificação do núcleo que se
determina o subevento e, consequentemente, o papel qualia mais proeminentes numa
determinada estrutura, desencadeando, assim, as construções de controlo ou de elevação.
Deste modo, se o subevento inicial (e1:processo) for o núcleo, projectando informação
relativa ao papel agentivo (acto_de_começar), está-se perante uma construção de controlo
(A Maria começou o filme). Por outro lado, se o subevento final (e2:estado) for o mais
4. POLISSEMIA: SUBESPECIFICAÇÃO E CONTEXTO
119
proeminente, projectando informação relativa ao papel formal (P(e2,x)), está-se perante
uma construção de elevação (O filme começou).
Ao longo desta secção pretendeu-se ilustrar que existem restrições ao nível da
aplicação dos mecanismos de coerção, evitando-se, deste modo, a sobregeração de
interpretações.
“Without a proper notion of constraints on coercion, however, there can indeed be overgeneration of interpretations in the semantics, and in fact, the notion of conditions on coercion has always been integral to the basic spirit of generative lexicons.” (Pustejovsky & Bouillon, 1996: 133)
No próximo capítulo analisar-se-ão diferentes casos de polissemia regular com
base num conjunto de fenómenos de referência, nomeadamente a co-predicação. No
seguimento de Copestake & Briscoe (1995), esta distinção tem como principal
consequência a existência de diferentes modos de representação dos itens lexicais:
descrições complexas segundo o modelo generativo de Pustejovsky (1995a), por um lado,
e significados relacionados através de regras lexicais, por outro.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
120
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
121
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE
SIGNIFICADOS
... there exist various types of polysemy, and, following from that, various
types of identifying and representing lexical senses.
(Verspoor, 1997: 225)
No seguimento da necessidade de representar computacionalmente os vários
significados dos itens polissémicos, no âmbito do projecto ACQUILEX, Copestake & Briscoe
(1995) distingue dois tipos de polissemia regular: a polissemia construcional, por um lado, e a
extensão de significados, por outro.
A polissemia construcional prevê um único significado atribuído numa entrada
lexical, contextualmente especificado através de processos de co-composição sintagmática. A
extensão de significados relaciona previsivelmente dois ou mais significados.
Do ponto de vista da formalização e da implementação, a polissemia construcional é
tratada como uma instanciação de uma entrada lexical subespecificada, enquanto a extensão
de significados recorre ao uso de regras lexicais (já referidas no capítulo 3), que podem ser
usadas tanto para relacionar significados completamente convencionados, como para serem
aplicadas produtivamente para reconhecer novos usos.
Um dos fundamentos para a distinção entre estes dois tipos de polissemia e,
consequentemente, a criação de dois modos distintos de representação, baseia-se no modo
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
122
como os diferentes significados de um item polissémico se relacionam entre si. Enquanto com
alguns itens é possível aceder aos seus diferentes significados na mesma estrutura, com
outros apenas é possível aceder a um dos significados em cada estrutura. O teste utilizado
para aceder aos diferentes significados de um item polissémico numa mesma estrutura
denomina-se CO-PREDICAÇÃO.
5.1. TIPOS COMPLEXOS E CO-PREDICAÇÃO
Como se referiu anteriormente, ao contrário dos nomes não polissémicos, que
denotam um tipo semântico simples - faca (x:artefacto), homem (x:indivíduo) -, os itens
polissémicos denotam tipos semânticos complexos - livro (x:objecto_físico, y:informação),
banco (x:instituição, y:edifício). No que respeita aos tipos complexos, é importante definir de
que modo é que eles se relacionam, i.e., se ambos os tipos podem ou não estar acessíveis
simultaneamente num dado contexto.
No âmbito do LG, Buitelaar (1998) propõe a existência de dois tipos complexos
distintos, ligados por diferentes operadores:
‘•’ - liga tipos relacionados sistematicamente que são sempre interpretados
simultaneamente.
‘°’ - liga tipos relacionados sistematicamente que nunca podem ser interpretados
simultaneamente.
Segundo o autor, o tipo complexo (x•y) denota um objecto complexo cujos tipos são
sempre interpretados em simultâneo, como, por exemplo, livro ou cassete (x:informação,
y:objecto físico). Por outro lado, o tipo complexo (x°y) denota um objecto complexo cujos
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
123
tipos nunca são interpretados em simultâneo, como, por exemplo, janela ou porta (x:abertura,
y:objecto físico).
No entanto, como se sustenta em Pinto (2001), se, por um lado, no Português, os tipos
denotados por cassete podem não ser interpretados simultaneamente, por outro, os tipos
denotados por porta podem ser interpretados simultaneamente, como se pode verificar em (1)
e (2) respectivamente1.
(1) A cassete está partida.
(2) A Ana entrou pela porta que o João pintou de amarelo.
Enquanto em (1) só se alude ao objecto físico, em (2) tanto a interpretação de
‘abertura’ como a de ‘objecto’ estão disponíveis.
Demonstrando a inadequação da proposta de Buitelaar (1998) para os casos acima
descritos, Pinto (2001: 85) procede a uma redefinição das relações existentes entre os tipos
complexos:
‘•’ - liga tipos relacionados sistematicamente que são interpretados
simultaneamente.
‘°’ - liga tipos relacionados sistematicamente que podem não ser interpretados
simultaneamente.
De acordo com esta nova proposta, o tipo complexo (x•y) denota um objecto
constituído por tipos que são geralmente interpretados em simultâneo, como, por exemplo,
cassete ou livro (x:informação, y:objecto físico). Por outro lado, o tipo complexo (x°y) denota
um objecto constituído por tipos que podem ou não ser interpretados em simultâneo, como,
por exemplo, banco (x:instituição, y:edifício).
1 Exemplos retirados de Pinto (2001: 85).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
124
No entanto, de acordo com esta nova proposta, ambos os tipos complexos (x•y) e (x°y)
permitem que os significados de um item polissémico possam ou não ser interpretados
simultaneamente, tornando-se, por isso, um pouco redundante.
Considerem-se os exemplos (3) e (4), apresentados em Pinto (2001: 63-64, 76).
(3) a. O João pediu um empréstimo ao banco.
b. O banco foi reconstruído por um arquitecto japonês.
c. O João pediu um empréstimo ao banco que foi reconstruído por um arquitecto
japonês.
(4) a. A cassete está partida.
b. A cassete ficou mal gravada.
c. A cassete está partida e ficou mal gravada.2
De acordo com a autora, banco seria representado pelo tipo complexo
instituição°edifício e cassete pelo tipo complexo informação•objecto físico. Os exemplos
apresentados em (3) e (4) ilustram que ambos os tipos complexos podem apresentar uma
estrutura em que cada um dos tipos simples está disponível (3a, 3b, 4a, 4b), bem como uma
estrutura em que ambos os tipos ocorrem simultaneamente (3c, 4c), não parecendo, assim,
existir nenhuma diferença relativamente ao modo como os tipos se combinam.
O que parece ser importante distinguir é se, por um lado, existe algum caso em que os
tipos que constituem o tipo complexo possam ser interpretados simultaneamente (não sendo,
contudo, necessário que tal aconteça sempre) e, por outro, verificar se existe algum caso em
que os tipos que constituem o tipo complexo nunca possam ser interpretados
simultaneamente (caso representado pelo operador ‘°’ proposto por Buitelaar (1998), mas
que, em Português, parece não ser adequado ao exemplo que o autor apresenta).
2 Ainda que Pinto (op. ci.:76) apresente a estrutura em (4c) por forma a ilustrar que o item cassete pode ser interpretado simultaneamente como ‘ objecto físico’ e ‘ informação’, na verdade, a expressão ficou mal gravada pode denotar também o objecto físico, não havendo, nesse caso, selecção de tipos diferentes. Um exemplo que ilustra melhor a interpretação simultânea de ambos os tipos será a cassete é “ pimba” e está partida.
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
125
Um dos testes utilizados para aceder aos tipos simples que compõem um tipo
complexo na mesma estrutura sintáctica consiste na co-predicação. Em concreto, dois
predicados distintos seleccionam o mesmo argumento sintáctico (que incluirá o item
polissémico), mas, a nível semântico, seleccionam tipos diferentes, como se pode verificar
pelos exemplos de (5) a (7).
(5) O livro está rasgado mas é muito divertido.
(6) O ladrão entrou pela janela amarela.
(7) Este banco dá facilidades de empréstimo e fica ao lado da minha casa.
Enquanto em (5) o predicado rasgado só pode remeter para o tipo ‘objecto físico’, o
adjectivo divertido envolve, necessariamente, o tipo ‘informação’. Do mesmo modo, em (6), o
verbo entrar selecciona o tipo que denota a abertura, enquanto o adjectivo amarela requer o
tipo que denota o objecto físico. Finalmente, em (7), a estrutura dá facilidades de empréstimo
remete para o tipo ‘instituição’, ao passo que fica ao lado da minha casa recupera o tipo
‘edifício’.
Propõe-se, deste modo, uma nova reformulação no que respeita à relação existente
entre os tipos complexos de um dado item.
‘•’ - liga tipos relacionados sistematicamente que podem ser interpretados
simultaneamente.
‘°’ - liga tipos relacionados sistematicamente que não podem ser interpretados
simultaneamente.
Deste modo, e seguindo o modelo do LG, janela, cujos tipos podem ser interpretados
simultaneamente, e cabrito, cujos tipos não podem ser interpretados simultaneamente, como
se analisará na secção 5.3.1, são representados da seguinte forma:
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
126
(8)
�����������
�
�
�����������
�
�
����
�
�
����
�
�
=∧=
==
��
���
�
==
=
•
•
y)xw,,econstruir(
y)x,,tapar(ey),luz(eentrar_ar_
x)conter(y,
abertura_sicoobjecto_fí
abertura :y
sicoobjecto_fí : x
janela
3
21
2
1
AGENTIVO
TÉLICO
FORMAL
PLC
QUALIA_ESTR
ARG
ARGESTR_ARG
(9)
�����������
�
�
�����������
�
�
����
�
�
����
�
�
=∧=
==
��
���
�
==
=
y)w,,cozinhar(e
y)z,,comer(ex),arne(efornecer_c
y)conter(x,
comida_animal
comida :y
animal : x
cabrito
3
21
2
1
AGENTIVO
TÉLICO
FORMAL
PLC
QUALIA_ESTR
ARG
ARGESTR_ARG
�
Diferente da proposta de Buitelaar (1998) é a de Copestake & Briscoe (1995). Com base
na assunção de que a impossibilidade de co-predicação entre os vários significados de um
item implica que esses mesmos significados não podem estar disponíveis na mesma
estrutura, os autores distinguem os dois tipos de polissemia e de representações já
mencionados, e sobre os quais vão incidir as próximas secções deste capítulo.
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
127
5.2. POLISSEMIA CONSTRUCIONAL (MODULAÇÃO DE SIGNIFICADOS)
Na polissemia construcional, o item lexical polissémico é representado através de
entradas lexicais complexas, seguindo o modelo do LG. Este tipo de polissemia assenta na
assunção de que a um dado item lexical é atribuído um significado básico e de que a
alternância entre o(s) outros(s) significado(s) em contexto é consequência da herança de
valores dos seus papéis qualia e da aplicação de processos de co-composição sintagmática (cf.
capítulo 3.3.4).
Os itens polissémicos pertencentes a esta classe podem ser co-predicados. Existe uma
única entrada lexical que, aliada a mecanismos de coerção, permite que se aceda a ambos os
significados do item, disponibilizando-os simultaneamente no mesmo contexto sintáctico.
Os itens polissémicos de categoria verbal e adjectival são sempre tratados como
fenómenos de polissemia construcional. São, igualmente, tratadas no âmbito da polissemia
construcional algumas alternâncias nominais.
5.2.1. POLISSEMIA CONSTRUCIONAL ADJECTIVAL
Um dos casos de polissemia construcional diz respeito à modificação adjectival.
(10) a. O squash é um jogo rápido.
b. O Ferrari é um carro rápido.
c. O João é um condutor rápido.
d. A Maria é uma dactilógrafa rápida.
e. Esta partida de ténis foi rápida.
f. Há que tomar decisões rápidas.
Como já foi referido, os adjectivos adquirem diferentes significados seleccionando
uma determinada interpretação, contida na estrutura qualia dos nomes que modificam,
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
128
através do mecanismo generativo de ligação selectiva (cf. capítulo 3.3.4.5). Nos exemplos em
(10), o adjectivo predica sobre os papéis agentivo ou télico dos nomes com os quais co-ocorre,
adquirindo os significados de ‘movimento rápido’ (a, b), ‘execução de uma acção
rapidamente’ (c, d, e) e ‘execução de uma acção que requer um tempo reduzido’ (f).
É possível coordenar adjectivos do mesmo tipo ou de tipos diferentes, ainda que
sejam impostas algumas restrições à produtividade deste processo, principalmente quando os
adjectivos seleccionam papéis qualia distintos (cf. (11a)). No entanto, em (11b), a coordenação
é gramatical, uma vez que as propriedades coordenadas se encontram relacionadas. Por
razões pragmáticas é mais esperado que um bom dactilógrafo seja ‘rápido e inteligente’ do que
‘rápido e bem vestido’.
(11) a. ?Uma dactilógrafa rápida e bem-vestida.
b. Uma dactilógrafa rápida e inteligente.
No que respeita à coordenação de nomes modificados pelo mesmo adjectivo, é
possível coordenar nomes que denotem o mesmo tipo ou que se encontrem numa relação de
subtipificação. A coordenação também é aceite se o adjectivo seleccionar o mesmo papel
qualia dos nomes coordenados.
(12) a. Alain Prost só se entusiasma com pistas e carros rápidos. (que se percorrem /
conduzem rapidamente)
b. A televisão e a serra eléctrica são boas. (funcionam bem)
c. O administrador quer para a sua empresa dactilógrafos e computadores
rápidos. (que trabalham rapidamente)
d. *Este livro e esta criança são difíceis. (de ler/de educar)
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
129
5.2.2. POLISSEMIA CONSTRUCIONAL VERBAL
Considerem-se agora os seguintes exemplos:
(13) a. O João quer uma cerveja
a’ O João quer beber uma cerveja.
b. O João quer um livro.
b’ O João quer ler um livro.
c. O João quer um cigarro.
c’ O João quer fumar um cigarro.
Nos exemplos em (13) o verbo querer, do ponto de vista sintáctico, subcategoriza um
SN ou uma frase infinitiva. Semanticamente, requer um complemento com uma interpretação
eventiva. As frases (13a), (13b) e (13c) são interpretadas como (13a’), (13b’) e (13c’),
respectivamente, devido à aplicação do mecanismo generativo de coerção de tipo. O verbo
querer, que selecciona um determinado tipo semântico, “coage” o seu argumento a adquirir o
tipo requerido. Este mecanismo evita que as diferentes interpretações que querer pode
assumir sejam listadas em entradas lexicais distintas, contrariamente ao que acontece com as
abordagens enumerativas (cf. capítulo 3.1).
A existência de uma única entrada lexical subespecificada que interage com o
mecanismo generativo de coerção de tipo permite que, em contexto, qualquer interpretação
do predicado verbal possa emergir. Essa acessibilidade de significados a partir da entrada
lexical licencia o fenómeno de co-predicação, somente possível nos casos de polissemia
construcional.
(14) a. O João quer uma cerveja e um cigarro.
a’. O João quer beber uma cerveja e fumar um cigarro.
b. A minha avó só quer renda e telenovelas.
b’. A minha avó só quer fazer renda e ver telenovelas.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
130
Realça-se aqui que, para se obter a interpretação adequada do verbo querer nas
estruturas (14a) e (14b), não é necessário que o mecanismo de coerção seja aplicado aos
mesmos papéis qualia dos complementos nominais coordenados. De facto, enquanto em (14a,
a’) o mecanismo de coerção é aplicado ao papel télico de cerveja e cigarro, em (14b, b’) o
mecanismo de coerção é aplicado ao papel agentivo de renda e ao papel télico de telenovelas.
5.2.3. POLISSEMIA CONSTRUCIONAL NOMINAL
Existem algumas alternâncias nominais em que os diferentes significados podem ser
co-predicados. Neste caso, o item nominal é representado através de uma única entrada
lexical em que a interacção entre as diferentes estruturas que a compõem - nomeadamente a
argumental e a qualia - e os vários mecanismos generativos permitem seleccionar os
diferentes significados nos contextos apropriados.
Os exemplos de (15) a (18) ilustram como nas alternâncias OBJECTO FÍSICO-
INFORMAÇÃO, OBJECTO FÍSICO-ABERTURA, CONTINENTE-CONTEÚDO e INSTITUIÇÃO-EDIFÍCIO,
através do PLC (que contém todas as combinações de tipos possíveis, ou seja, os dois tipos
simples e o tipo complexo resultante da sua combinação), é possível dar conta da
interpretação de cada um dos tipos isoladamente - alíneas (a) e (b) - ou em simultâneo - alínea
(c).
(15) a. Este livro é muito divertido.
b. O Duarte rasgou o livro.
c. O Duarte rasgou o livro mais divertido que tinha.
(16) a. Os bombeiros entraram pela janela.
b. O João tem uma janela de vidro fumado.
c. Os bombeiros entraram pela janela de vidro fumado.
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
131
(17) a. A Ana pegou no copo.
b. Vamos beber um copo com os amigos.
c. A Ana bebeu o copo que tinham posto à sua frente.
(18) a. Este banco tem o melhor crédito bonificado.
b. O banco fica ao lado do supermercado.
c. Este banco tem o melhor crédito bonificado e fica ao lado do supermercado.
5.3. EXTENSÃO DE SIGNIFICADOS (ALTERAÇÃO DE SIGNIFICADOS)
Contrastando com os casos de polissemia construcional, existe um caso de polissemia
regular, referida como extensão de significados, que consiste na criação previsível de
diferentes significados relacionados através de regras lexicais. O formalismo utilizado para
exprimir estas regras é suficientemente expressivo para descrever processos de morfologia
derivacional, conversão, metonímicos e metafóricos.
Uma das motivações para a aplicação destas regras tanto a processos metonímicos
como a processos de morfologia derivacional reside no facto de as regras lexicais criarem
significados derivados a partir de significados-base, muitas vezes relacionados com
alterações morfológicas ou gramaticais subtis. Em Copestake & Briscoe (1995) sublinha-se
que, no Inglês, alguns casos de metonímia, como a alternância CONTEÚDO-CONTINENTE,
podem ser acompanhados de processos derivacionais, como se pode verificar pelos exemplos
em (19).
(19)3 a. He drank a whole bottle (of whiskey).
b. He drank a bottleful (of whiskey).
3 Tradução: Ele bebeu uma garrafa inteira (de whiskey).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
132
As alternâncias que envolvem metonímia podem não envolver qualquer alteração
sintáctica numa determinada língua, mas envolver alterações sistemáticas noutras. Enquanto
no Inglês não há qualquer alteração na forma das palavras que denotam o fruto, por um lado,
e a árvore da qual o fruto é proveniente, por outro (olive, apple)4, resultando num caso de
polissemia regular nesta língua, o mesmo não acontece com línguas como o Português, o
Espanhol e o Italiano. No Português ocorre normalmente uma regra morfológica de sufixação
(maçã - macieira)5, enquanto no Espanhol e no Italiano, ambos apresentam uma alteração no
género da palavra (aceituna - aceituno, pomela - pomelo).
Outro exemplo semelhante ocorre com a alternância ANIMAL-COMIDA, em que não há
qualquer alteração na forma da palavra, tanto no Português (cordeiro) como no Inglês (lamb),
mas em que, contrariamente, no Alemão se procede a um processo de sufixação _vless para
derivar a interpretação de ‘carne’ (lams, lamsvless).
A par das regras de morfologia derivacional, que tanto podem alterar a categoria
sintáctica do item como mantê-la inalterável (construirV → construçãoN; cerejaN → cerejeiraN), as
regras de extensão de significados também podem alterar, ou não, a estrutura sintáctica e
semântica do item sobre o qual são aplicadas (cerejeiraNcontável → cerejeiraNmassivo).
Existem ainda outras semelhanças entre as regras derivacionais e as regras de
extensão de significados: ambos os processos são produtivos e ambos permitem ser
bloqueados. No que respeita à morfologia derivacional, a forma regular roubador não ocorre
normalmente devido à existência da forma ladrão. Por seu lado, no que respeita à extensão de
significados, a geração de boi, enquanto denotando a substância carne, derivada do animal
com o mesmo nome, é bloqueada devido à existência do lexema sinónimo vaca.
4 Tradução: (azeitona/oliveira, maçã/macieira). 5 No caso de oliveira, do latim olivaria, esta forma já sofreu um processo de sufixação no latim a partir da forma latina oliva. Em Português oliva tem, hoje em dia, um uso reduzido, praticamente só literário (“Creio que este voc. desapareceu do uso vencido pelo arabismo azeitona. A partir, porém, do séc. XVI voltou a aparecer, mas apenas como termo de linguagem literária, quer na acepção de “azeitona” , quer na de “oliveira” .” (in Dicionário Etimológico da Língua Portuguesa, José Pedro Machado)).
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
133
5.3.1. EXTENSÃO DE SIGNIFICADOS NOMINAIS
Um dos processos de polissemia de extensão de significados mais produtivos é aquele
que gera nomes massivos, que denotam uma substância, a partir de nomes contáveis, que
denotam um objecto físico. As alternâncias ANIMAL-COMIDA, ÁRVORE-MADEIRA e PEDRA
PRECIOSA-MINERAL são disso um exemplo.
Tal como no caso da polissemia construcional, não é assumido que os diferentes
significados deste tipo de expressões estejam exaustivamente listados no léxico. A geração de
novos significados é feita através de regras lexicais que têm como input um significado-base e
como output um significado derivado. A aplicação destas regras está sujeita a processos de
bloqueio (cf. capítulo 3.2).
No entanto, e contrariamente ao caso de polissemia construcional - em que os
diferentes significados são derivados a partir de uma única entrada lexical, permitindo que
sejam co-predicados - no caso de extensão de significados, a aplicação de regras lexicais
impede que os significados-base (input) e derivado (output) estejam acessíveis
simultaneamente. Os processos de co-predicação, permitidos pela polissemia construcional,
dificilmente são aceites na extensão de significados.
(20) a. O cabrito teve de ser amamentado com um biberão.
b. O João comeu cabrito ao jantar.
c. * O João amamenta e come cabrito.
(21) a. A Ana plantou uma cerejeira no quintal.
b. A Ana prefere os móveis em cerejeira.
c. *A Ana planta e prefere cerejeira.
(22) a. O Grão-Mogol é o diamante mais célebre do mundo, com 280 quilates.
b. Algumas ferramentas industriais são feitas de diamante.
c. *O diamante é muito valioso e pode ser utilizado na construção de algumas
ferramentas industriais.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
134
No entanto, no caso da alternância ANIMAL-COMIDA, é importante salientar a
existência de estruturas como a apresentada em (23), em que ambos os significados do item
estão acessíveis simultaneamente.
(23) Foi um prato de cabrito, colhido ali mesmo na Serra da Peneda, que o júri escolheu
como o melhor deste concurso.
Contudo, a alteração sintáctica de nome contável para nome massivo, nalgumas
línguas, a ocorrência de processos derivacionais de sufixação para derivar um dos
significados, noutras, e a existência de estruturas em que não é possível a co-predicação
continuam a ser motivações para que a alternância ANIMAL-COMIDA seja tratada através de
uma regra de extensão de significados.
Outro tipo de processo metonímico bastante produtivo nas línguas é aquele permite
que nomes de objectos e locais denotem indivíduos.
(24) a O terceiro violino é muito convencido.
b. A mesa três quer uma coca-cola.
c. O avião aplaudiu a aterragem do piloto.
(25) a. O país elegeu Jorge Sampaio para Presidente da República.
b. Lisboa admite encerrar o aeroporto devido ao mau tempo.
c. O Governo ouviu a aldeia no ano passado.
Tal como no caso das alternâncias anteriores, a co-predicação também não é possível
com este tipo de estruturas. Os exemplos em (26) mostram que não é possível, na mesma
estrutura, aceder aos significados de ‘objecto físico’ e ‘indivíduos’. O mesmo acontece nos
exemplos em (27) relativamente aos significados de ‘local’ e ‘indivíduos’.
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
135
(26) a. *O terceiro violino está riscado e é muito convencido.
b. *A mesa três está suja e quer uma coca-cola.
c. *O avião já tinha feito vários voos sem ir à revisão e aplaudiu a aterragem do
piloto.
(27) a. *O país é banhado a oeste pelo Oceano Atlântico e elegeu Jorge Sampaio para
Presidente da República.
b. *Lisboa fica situada na foz do Tejo e admite fechar o aeroporto devido ao mau
tempo.
c. *O Governo reconstruiu e ouviu a aldeia no ano passado.
No entanto, o teste de co-predicação pode nem sempre dar uma indicação clara acerca
da possibilidade de aceder, na mesma estrutura, a ambos os significados de um item
polissémico, podendo mesmo gerar previsões conflituosas, como adiante se verá.
5.3.2. METÁFORAS
Apesar de a maior parte dos fenómenos de extensão de significados estar relacionado
com processos metonímicos, Briscoe & Copestake (1991) sugere que mecanismos semelhantes
podem também ser usados para dar conta de processos metafóricos. Um desses processos
consiste na aplicação de características particulares de animais a humanos.
(28) Ele é um porco/burro.
Este tipo de extensão de significados é aparentemente produtivo, ainda que as
características envolvidas não possam ser previsíveis a partir do significado do animal. As
propriedades dos animais atribuídas aos humanos são associações estereotipadas do animal
que não estão codificadas na estrutura qualia. Deste modo, a interpretação do nome em frases
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
136
como a apresentada em (28) deve ser expressa em termos de uma regra lexical de extensão de
significados, como a apresentada em (29).
(29)
�������������������
�
�
�������������������
�
�
�������
�
�
�������
�
�
���
�
���
�
==
=
=
=
�������
�
�
�������
�
�
���
�
���
�
==
=
=
=
1SEXRQS
3ORTH
2SYNTAX
1SEXRQS
3ORTH
2SYNTAX
pessoa
0
animal
1
calregra_lexi
5.4. O TESTE DE CO-PREDICAÇÃO
Apesar de se fazer a distinção entre polissemia construcional e extensão de
significados e, consequentemente, de se sugerirem dois métodos diferentes de tratamento da
polissemia regular, essa distinção nem sempre é linear. Não é fácil, através do teste de co-
predicação, distinguir os casos em que os diferentes aspectos de uma entidade estão
codificados numa única entrada lexical dos casos em que é necessário postular a construção
de regras lexicais para determinar o significado apropriado do item lexical.
No âmbito do LG, também se torna difícil distinguir os casos em que os diferentes
tipos podem ser interpretados simultaneamente, sendo ligados pelo operador ‘•’, dos casos
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
137
em que os diferentes tipos não podem ser interpretados simultaneamente, sendo ligados pelo
operador ‘°’.
O teste de co-predicação, utilizado em ambos os modelos, pode não dar uma
indicação clara sobre se se consegue aceder simultaneamente aos diferentes significados de
um item polissémico, uma vez que os resultados da coordenação podem ser mais ou menos
antagónicos consoante as construções sintácticas utilizadas.
Ao longo deste trabalho as estruturas de co-predicação têm sido construídas a partir
de três construções sintácticas distintas: (i) coordenação; (ii) orações relativas; (iii) SN’s com
modificadores.
Considerem-se novamente os itens livro e aldeia. Como se verificou anteriormente,
enquanto no caso de livro a co-predicação é possível, sendo tratado como um caso de
polissemia construcional (Copestake & Briscoe, 1995), ou através do operador ‘•’ (Buitelaar,
1998), no caso de aldeia a co-predicação, à partida, não é possível, sendo tratado como um
caso de extensão de significados, ou através do operador ‘°’, conforme as propostas
adoptadas.
(i) CO-PREDICAÇÃO ATRAVÉS DE PREDICADOS COORDENADOS
A coordenação pode ser feita através de predicados adjectivais ou verbais, conforme
se pode observar pelos exemplos (30) e (31), respectivamente.
(30) a. ??Este livro é amarelo e divertido.
b. ??Esta aldeia é ocidental e comunista.
(31) a. O João comprou e memorizou o livro ontem.
b. *O Governo reconstruiu e ouviu a aldeia no ano passado.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
138
(ii) CO-PREDICAÇÃO ATRAVÉS DE ORAÇÕES RELATIVAS
A co-predicação através de orações relativas permite com alguma facilidade aceder
aos vários significados de um item, independentemente de as estruturas envolverem orações
relativas restritivas ou explicativas, como ilustram os exemplos (32) e (33).
(32) a. O livro que tem a capa amarela é muito divertido.
b. A aldeia que não foi reconstruída o ano passado manifestou-se contra o
governo.
(33) a. Este livro, que tem a capa amarela, é muito divertido.
b. Esta aldeia, que não foi reconstruída o ano passado, manifestou-se contra o
governo.
(iii) CO-PREDICAÇÃO ATRAVÉS DE SN’S COM MODIFICADORES
Considerem-se os seguintes exemplos:
(34) a. O João memorizou o livro amarelo.
b. O governo reconstruiu a aldeia comunista.
(35) a. O livro amarelo é divertido.
b. A aldeia ocidental é comunista.6
6 Comparem-se os seguintes exemplos:
(1) a. ??O livro divertido é amarelo. b. ??A aldeia comunista é ocidental.
O facto de a troca de adjectivos tornar as frases anómalas está relacionado com uma ordem generalizada que estabelece que os adjectivos se agrupam de acordo com o seu campo semântico: as características físicas precedem as características abstractas (Demonte, 1999).
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
139
(36) a. O livro de capa amarela é divertido.
b. A aldeia do lado ocidental é comunista.
O que se pretende mostrar a partir dos exemplos apresentados em (30) - (36) é que o
teste de co-predicação pode gerar construções gramaticais ou não consoante a estrutura
sintáctica utilizada. De facto, não é possível aceder simultaneamente aos diferentes
significados de aldeia através de estruturas com coordenação, o mesmo não acontecendo com
estruturas com orações relativas ou com SN’s com modificadores, o que torna estes testes
pouco fiáveis.
As construções de co-predicação com orações relativas ou com SN’s modificados
parecem permitir mais facilmente o acesso simultâneo aos vários significados de um item do
que as construções com coordenação.
No âmbito da proposta de Copestake & Briscoe (1995), se itens como aldeia forem
tratados como casos de extensão de significados, a co-predicação não é previsível nem pode
ocorrer. Os diferentes significados não estão acessíveis a partir de uma única estrutura.
Quando um dos significados é derivado a partir de uma regra lexical, o significado-base
deixa de estar acessível. Por este motivo não devia existir nenhuma estrutura em que a co-
predicação fosse possível. Contudo, os exemplos (32b), (33b), (34b), (35b) e (36b), construídos
a partir de orações relativas e de SN’s com modificadores, apresentam casos de co-
predicação, em que os significados de ‘local’ e ‘conjunto de pessoas’ estão acessíveis
simultaneamente. Apenas as construções de co-predicação através de estruturas com
coordenação geram agramaticalidade.
Como se referiu anteriormente, também no âmbito do modelo do LG, o facto de o
teste de co-predicação poder gerar resultados conflituosos torna difícil decidir se os tipos
semânticos dos itens lexicais se encontram relacionados através do operador ‘•’ ou através do
operador ‘°’.
Desta observação levantam-se algumas questões importantes. Pode considerar-se que
o teste de co-predicação através de construções com coordenação, por ser o mais restringido,
é o mais fiável e que, consequentemente, se gerar estruturas agramaticais, então a co-
predicação não pode ocorrer. No entanto, caso gere agramaticalidade, como no caso de aldeia,
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
140
em (30b) e (31b), torna-se necessário explicar a possibilidade de aceder simultaneamente aos
diversos significados através de outro tipo de construções.
De facto, o teste de co-predicação através de estruturas com coordenação parece ser o
mais fiável e o único em que os diferentes predicados, encontrando-se, do ponto de vista
sintáctico, ao mesmo nível, estão realmente a co-predicar sobre o mesmo item lexical.
No que respeita às estruturas com orações relativas que, contrariamente às estruturas
com coordenação, apresentam, do ponto de vista sintáctico, uma configuração de adjunção,
admite-se que, ao recuperar o objecto linguístico (livro, aldeia), o pronome relativo recupera
todo o tipo complexo e não apenas um dos tipos simples. Deste modo, o predicado
introduzido pela oração relativa continua a predicar sobre todo o tipo complexo e não sobre
um tipo simples em particular, deixando, assim, de haver co-predicação.
Relativamente às estruturas com SN’s com modificadores, que podem apresentar uma
configuração de adjunção ou complementação, admite-se que a presença do modificador
conduz a uma relação de subtipificação relativamente a um dos tipos simples que compõem
o tipo complexo. Em estruturas como o governo reconstruiu a aldeia comunista, o item aldeia
denotará o tipo complexo composto pelos tipos simples ‘local’ e ‘comunistas’, sendo este
último um subtipo de ‘indivíduos’. De um modo análogo, em estruturas como a aldeia
ocidental/do lado ocidental manifestou-se a favor da regionalização, o item aldeia denotará o tipo
complexo composto pelos tipos simples ‘indivíduos’ e ‘ocidental’, sendo este último um
subtipo de ‘local’. Nestes casos, os itens comunista e ocidental não estão a predicar sobre um
tipo simples (‘indivíduos’ e ‘local’, respectivamente), fazendo eles próprios parte do tipo
complexo. Deste modo, também neste tipo de estrutura sintáctica deixa de haver co-
predicação.
Admitindo que o teste de co-predicação através de construções com coordenação é o
teste mais fiável, é necessário explicar por que razão as estruturas em (30), em que são
coordenados predicados adjectivais, são pouco naturais se não mesmo inaceitáveis. De facto,
como se referiu em 5.2.1, da mesma forma que são impostas algumas restrições à
coordenação de adjectivos quando estes seleccionam papéis qualia diferentes, também
parecem ser impostas algumas restrições à coordenação de adjectivos que seleccionem tipos
semânticos diferentes. Enquanto em estruturas como um livro grande e amarelo ou um livro
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
141
metafórico e divertido os diferentes adjectivos seleccionam o mesmo tipo semântico e as frases
são gramaticais, em estruturas como um livro amarelo e metafórico os adjectivos seleccionam
tipos semânticos diferentes tornando a frase inaceitável.
Importa, ainda, salientar o facto de a estranheza das co-predicações poder dever-se,
também, a incompatibilidades entre os predicados. Há que ter em atenção a coerência
semântica das estruturas e evitar predicar propriedades sem uma relação aparente entre si,
uma vez que é fácil construir exemplos de co-predicação de difícil aceitação por incoerência
semântica.
5.5. A PROBLEMÁTICA DE ITENS COMO JORNAL
Existem alguns itens que constituem um tipo mais complexo de polissemia. É o caso
de jornal ou revista, que tanto podem ser interpretados como o ‘objecto físico’ ou como a
‘informação’ nele contida, comportando-se do mesmo modo que livro, carta ou artigo.
Contudo, estes itens também pode ter os significados de ‘instituição’, ‘edifício’ ou ‘grupo de
pessoas’, comportando-se do mesmo modo que banco, fábrica ou escola, entre outros. Atente-se
nos seguintes exemplos:
(37) a. Aquele jornal fica do outro lado da rua.
b. Aquele jornal foi processado por difamação.
c. Aquele jornal manifestou-se ontem, em frente à Assembleia da República,
contra a decisão do tribunal.
d. Aquele jornal está cheio de linguagem metafórica.
e. Aquele jornal está sujo de café.
Nos exemplos em (37) estão presentes os diferentes significados relativamente à
entidade jornal: distinguem-se as propriedades que denotam o ‘edifício’ (a), a ‘instituição’ (b),
o ‘conjunto de pessoas’ (c), o ‘conteúdo informativo’ (d) e o ‘objecto físico’ (e).
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
142
A co-predicação entre os significados de ‘edifício’, ‘instituição’ e ‘conjunto de pessoas’
parece ser permitida, conforme ilustram os exemplos em (38).
(38) a. Aquele jornal fica do outro lado da rua e foi processado por difamação.
b. Aquele jornal foi processado por difamação e manifestou-se ontem, em frente à
Assembleia da República, contra a decisão do tribunal.
c. Aquele jornal fica do outro lado da rua e manifestou-se ontem, em frente à
Assembleia da República, contra a decisão do tribunal.
d. Aquele jornal fica do outro lado da rua, foi processado por difamação e
manifestou-se ontem, em frente à Assembleia da República, contra a decisão
do tribunal.
Por outro lado, a co-predicação entre os significados de ‘informação’ e ‘objecto físico’
também parece ser permitida, conforme ilustram os exemplos em (39).
(39) Aquele jornal está cheio de linguagem metafórica e sujo de café, por isso é muito
difícil de ler.
No entanto, a co-predicação entre os significados de ‘instituição’, ‘edifício’ e ‘conjunto
de pessoas’, por um lado, e os significados de ‘objecto físico’ e ‘informação’, por outro, gera
agramaticalidade, como ilustram os exemplos de (40) a (42).
(40) a. *Aquele jornal fica do outro lado da rua e está sujo de café.
b *Aquele jornal fica do outro lado da rua e está cheio de linguagem metafórica.
(41) a. *Aquele jornal foi processado por difamação e está sujo de café.
b. *Aquele jornal foi processado por difamação e está cheio de linguagem
metafórica.
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
143
(42) a. *Aquele jornal manifestou-se ontem, em frente à Assembleia da República,
contra a decisão do tribunal e está sujo de café.
b. *Aquele jornal manifestou-se ontem, em frente à Assembleia da República,
contra a decisão do tribunal e está cheio de linguagem metafórica.
Contudo, em alguns casos, a co-predicação entre os significados de ‘instituição’ e
‘objecto físico’ parece aceitável.
(43) O jornal foi processado pela oposição e queimado nas ruas pelos manifestantes.
Estes dados conduzem a uma questão importante no que respeita a itens como jornal:
como é que as suas propriedades semânticas são representadas no léxico?
Uma das propostas é a apresentada em Pustejovsky (1995a: 155). O autor só
contempla três interpretações para jornal: ‘objecto’ físico’, ‘informação’ e ‘instituição’. Jornal
distingue-se, assim, de livro na medida em que este último não pode denotar a instituição
editorial.
Por poder denotar três tipos distintos, itens como jornal distinguem-se, igualmente, no
que respeita à construção do PLC. Deste modo, o PLC de jornal consiste numa construção de
dois tipos, um dos quais é por si só um tipo complexo. A estrutura em (44) representa o modo
como os tipos se combinam numa hierarquia de tipos.
(44) objecto_físico informação
instituição material_impresso (•)
jornal (•) livro
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
144
A partir das representações em (45) e (46) pode observar-se que o PLC de jornal é
construído recursivamente através de pares de tipos. Em (45) é construído o PLC relativo ao
tipo complexo objecto_físico•informação - σ1•σ2 - idêntico a nomes como livro. Em (46) é
construído o PLC relativo ao tipo complexo instituição•(objecto_físico•informação),
característico de itens como jornal.
(45) ( ) 2 1
21��:�PLC
�:� �:�
•
(46) ( ) ( )2 13
213���:
�PLC
��:�
�:�
••
•
A estrutura qualia de jornal especifica, deste modo, uma relação produto-produtor. O
papel agentivo refere o elemento que denota a relação produto-produtor e o papel formal
refere o elemento que denota o produto.
(47)
�����������
�
�
�����������
�
�
����
�
�
����
�
�
==
==
��
���
�
==
=
••
•
y)x,,publicar(e
y)w,ler(e
y
sico_objecto_fíinformaçãooinstituiçã
sicoobjecto_fíinformação:y
oinstituiçã: x
jornal
1
2,
2
1
AGENTIVO
TÉLICO
FORMAL
PLC
AESTR_QUALI
ARG
ARGESTR_ARG
Note-se que o tipo complexo instituição•(objecto_físico•informação) nunca ocorre
como valor dos papéis qualia, o que significa que só um dos valores semânticos –
‘objecto_físico•informação’, por um lado, e ‘instituição’, por outro - pode estar disponível.
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
145
Deste modo, é possível dar conta da agramaticalidade de frases como as apresentadas em (40)
- (42).
No entanto, esta proposta não contempla a aceitabilidade da frase apresentada em
(43), nem os casos em que jornal também pode ser interpretado como ‘edifício’ e ‘conjunto de
pessoas’. Como se referiu, itens como jornal ou revista denotam dois tipos complexos
distintos, ainda que, de certo modo, relacionados: o tipo complexo objecto_físico•informação
- podendo os tipos que o compõem entrar em estruturas de co-predicação - e o tipo complexo
edifício•(instituição•conjunto_pessoas)7 - cujos tipos também podem entrar em estruturas de
co-predicação. No entanto, através dos testes de co-predicação apresentados em (40) – (42),
verificou-se que a co-predicação entre estes dois tipos complexos gera, normalmente,
agramaticalidade.
Outro modo de representação possível por forma a captar os diferentes significados
de jornal e o modo como eles se relacionam baseia-se na proposta de Buitelaar (1998) e
consiste num PLC que representa o tipo complexo (objecto_físico•informação) °
(edifício•(instituição•conjunto_pessoas)), como se pode ver a partir de (48). O papel agentivo
continua a especificar a relação produtor-produto, o papel formal especifica o produto e o
papel télico o evento de ler. Contudo, ao contrário da representação em (47) os tipos
complexos ocorrem como valor dos papéis qualia. A possibilidade de só um dos tipos
complexos - objecto_físico•informação, por um lado, e edifício•(instituição•conjunto_pessoas),
por outro – estar disponível numa estrutura é representada por meio do operador ‘°’.
7 No seguimento de Pustejovsky (1995a) assume-se que a construção do PLC de jornal relativamente a estes três tipos é feita do seguinte modo:
(1) ( ) essoasconjunto_p oinstituiçã:�PLC
essoasconjunto_p:� oinstituiçã:�
•
(2) ( ) ( )essoasconjunto_p oinstituiçãedifício:�
PLC
essoasconjunto_poinstituiçã:�
edifício:�
••
•
Considera-se, deste modo, que a interpretação de ‘ conjunto de pessoas’ está mais estreitamente relacionada com a de ‘instituição’ do que com a de ‘edifício’ .
No que respeita à construção de tipos complexos a partir de três tipos (instituição•edifício•conjunto_pessoas) e não recursivamente através de pares de tipos, Pustejovsky (1995a: 155) defende que “There may, in fact, turn out to be instances of dot objects that are constructed from three dot elements or more, but this is question open to further investigation.”.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
146
(48)
�����������������
�
�
�����������������
�
�
����
�
�
����
�
�
==
∧==
����
�
�
����
�
�
====
=
••
•
••
•
y) xz, w,produzir(e
y) xi,,ler(e
w)conter(z,y)conter(x,
z)_w(y)(x
edifício:z
essoasconjunto_poinstituiçã: w
informação:y
sicoobjecto_fí: x
jornal
2
1
4
3
2
1
AGENT
TÉLICO
FORMAL
PLC
AESTR_QUALI
ARG
ARG
ARG
ARG
ESTR_ARG
�
Em suma, o PLC apresentado em (48) consiste, assim, no novo tipo complexo
(x•y)°(z•(w•k)). Enquanto o operador ‘•’ liga tipos que podem ser interpretados
simultaneamente, o operador ‘°’ liga tipos que não podem ser interpretados
simultaneamente. No entanto, no seguimento de Buitelaar (1998), admite-se que, em alguns
casos, esta restrição possa ser violada e a co-predicação seja permitida, ainda que o autor só
se refira a casos de trocadilhos e uso humorístico da linguagem. Mas dada a relação estreita,
imediatamente reconhecida pelos falantes, entre o produto e o produtor, existente em nomes
como jornal, torna-se possível interpretar estruturas como as apresentadas em (43).
No âmbito da proposta de Copestake & Briscoe (1995), que propõe a existência de
regras lexicais quando não é possível aceder a todos os significados de um item na mesma
estrutura, os autores não defendem, no entanto, a utilização das mesmas por forma a derivar
os significados de jornal - ‘instituição’, ‘edifício’ e ‘conjunto de pessoas’ - que não podem co-
predicar com os significados de ‘informação’ e ‘objecto físico’, ou vice-versa. Contudo, os
5. POLISSEMIA CONSTRUCIONAL E EXTENSÃO DE SIGNIFICADOS
147
autores também não consideram a existência de uma única entrada lexical que consiga captar
todos os significados de jornal.
“... assuming that a single structure can cover all the senses of newspaper is highly problematic. Constructing a qualia structure to cover all the senses of newspaper in such a way that different predicates can apply appropriately is difficult, since it seems that the copy and the organization sense (at least) should have their own distinct qualia.” (Copestake & Briscoe, 1995: 30)
Copestake & Briscoe (1995) assumem, então, a existência de duas estruturas,
correspondendo uma ao significado ‘objecto físico’, e a outra ao significado ‘instituição’.
“Thus, for newspaper, we assume two structures, one corresponding primarily to the copy and one to the institution. Both of these may be involved in constructional polysemy - the text and parent organisation of the newspaper copy is accessible via its qualia, and conversely the copies are accessible from the structure representing the parent organisation.” (Copestake & Briscoe, 1995: 30)
Da necessidade de criação de um modelo de semântica lexical que consiga captar
todos os significados que um item lexical pode adquirir surgem duas abordagens
interessantes e que mereceram particular destaque. O modelo do LG, inovador no que
respeita ao seu poder generativo, tem sido largamente estudado nos últimos anos e adoptado
por muitos investigadores na tentativa de criar um modelo computacional que consiga captar
o significado adequado dos itens lexicais no contexto apropriado. Desenvolvendo uma
representação semântica com base na noção de co-composicionalidade, o LG permite captar a
variação do significado em função do contexto reduzindo o número de entradas
armazenadas no léxico, tornando-se, assim, num modelo generativo universal, económico e
descritivamente adequado.
Por outro lado, a proposta de Copestake & Briscoe (1995) combina o poder generativo
do LG com a especificidade das regras lexicais, que permitem captar generalizações
específicas de uma língua. De facto, como se referiu na secção 5.3, uma das motivações para a
aplicação das regras lexicais reside no facto de, em algumas línguas, alguns casos de
metonímia serem acompanhados de processos derivacionais. No entanto, para além da
aplicação das regras lexicais poder ser específica de uma determinada língua, acarretam
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
148
ainda a desvantagem de não preverem a criação de novos significados. A produtividade e
criatividade das línguas permitem compor significados inesperados em contexto dificilmente
captáveis através das regras lexicais.
Outra das motivações fundamentais para a aplicação de regras lexicais respeitava ao
facto de não ser possível aceder simultaneamente aos diferentes significados de alguns itens
polissémico na mesma estrutura sintáctica, o que constituía um indício de que esses
significados não podiam estar acessíveis a partir de uma única entrada lexical. No entanto,
Buitelaar (1998) propõe, no âmbito do LG, a inserção do operador ‘°’, que também permite
distinguir os casos em que os diferentes significados de um item lexical não podem ser
interpretados simultaneamente, contribuindo, deste modo, para a “riqueza” e economia do
modelo.
6. CONCLUSÃO
149
6. CONCLUSÃO
Sense delimitation is largely an open problem. It is indeed almost
impossible to state precise and general principles that characterize the
boundaries of different senses of a lexeme and what a sense exactly is.
(Saint-Dizier, 1998a:125)
A polissemia é uma questão bastante complexa que tem constituído, nos últimos
anos, objecto de investigação aprofundada no âmbito da semântica lexical. A criatividade
das línguas naturais e o recurso a processos metafóricos e metonímicos constituem o
factor fundamental para a produção de novos significados.
A distinção entre a polissemia e os restantes fenómenos de ambiguidade lexical,
nomeadamente a vaguidade e a homonímia, ainda que teoricamente pareça bem
estabelecida, e de limites concretos, pode apresentar, na prática, alguns problemas. Por
vezes, pode tornar-se difícil precisar com segurança se se está perante: (i) diferentes
significados relacionados que uma palavra particular possui (polissemia); (ii) modulação
de um significado particular de uma palavra (vaguidade); (iii) diferentes significados
respeitantes a diferentes palavras com a mesma forma (homonímia). Como se pôde
observar no capítulo 2, o contexto desempenha um papel fundamental na delimitação de
sentidos de uma dada palavra, na medida em que conduz à interpretação particular do
seu valor semântico. O que num dado contexto pode ser entendido como uma palavra
vaga, pode, noutro contexto, ser interpretado como uma palavra polissémica.
Centrando-se no fenómeno de polissemia regular (que pressupõe que as
alternâncias de significados ocorrem de forma previsível e sistemática dentro de uma
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
150
determinada classe de palavras), este trabalho reuniu um vasto conjunto de exemplos que
representam casos relevantes de polissemia em Português. Verificou-se que se podem
observar itens com comportamento polissémico nas três principais categorias sintácticas
(nominal, verbal e adjectival) e analisaram-se os tipos de relações existentes em cada uma.
Tendo em atenção as relações existentes entre os vários significados dos itens
polissémicos, há que modelizar a informação lexical de modo a permitir o acesso a todas
as possíveis interpretações. Surgem, então, no âmbito da Semântica Lexical
Computacional, várias abordagens de representação dos itens lexicais. Destacam-se neste
trabalho os Léxicos Enumerativos de Sentidos, as Regras Lexicais e o modelo do Léxico
Generativo, analisados detalhadamente no capítulo 3.
Os Léxicos Enumerativos de Sentidos são considerados ineficientes e incompletos
tanto a nível linguístico como a nível computacional. Para além de postularem uma
entrada lexical distinta para cada significado da palavra (o que resulta numa proliferação
de entradas lexicais que, em termos computacionais, implica custos importantes a nível de
eficiência do sistema), os LES tornam-se incompletos na medida em que, dada a
produtividade e criatividade das línguas, não é possível enumerar exaustivamente todos
os significados de um item lexical. Para além disso, os LES acarretam ainda a
desvantagem de não permitirem captar a relação sistemática existente entre os
significados dos itens polissémicos, assumindo um processamento equivalente ao da
homonímia.
Diferente da abordagem enumerativa, as Regras Lexicais (Copestake & Briscoe
(1992, 1995), Ostler & Atkins (1992)) permitem a geração de significados a partir de um
significado-base. As regras estão sujeitas a processos de bloqueio de modo a evitar
ambiguidades desnecessárias, como a geração de um significado que já está lexicalizado,
no léxico, noutra palavra. É o caso da geração do significado de ‘comida’ para o item boi,
que é bloqueado devido à lexicalização de vaca para o mesmo significado. No entanto,
esta abordagem também apresenta algumas desvantagens. Para além do facto de
poderem ser específicas de uma determinada língua ou dialecto, e não universais, as
regras lexicais nem sempre conseguem prever a criação de novos significados, tornando-
se necessário construir novas regras para dar conta dos novos significados.
Tentando dar conta da polissemia regular de forma económica e descritivamente
adequada, o modelo do Léxico Generativo (Pustejovsky, 1995a) assenta em entradas
lexicais complexas e em mecanismos generativos que permitem obter a interpretação
6. CONCLUSÃO
151
adequada do item polissémico no contexto apropriado. As entradas lexicais são
compostas por três níveis de representação relevantes (Estrutura Argumental, Etrutura
Eventiva e Estrutura Qualia), que codificam toda a informação pertinente relativamente a
um item lexical. A interagir com essa informação encontram-se vários mecanismos
generativos (Coerção de Tipo, Co-composição e Ligação Selectiva) que permitem derivar
os significados em contexto, dando conta da criatividade característica das línguas
naturais.
Por ser baseado na co-composicionalidade, ou seja, na interacção entre o
significado de um dado item com o significado dos seus argumentos, o LG torna-se um
modelo económico (na medida em que reduz o número de entradas armazenadas no
léxico), dinâmico (encarando o léxico como um componente flexível, subespecificado e
sensível ao contexto), universal e, fundamentalmente, capaz de prever os significados das
palavras.
É no quadro do LG que se analisam, no capítulo 4, para o Português, alguns itens
com comportamento polissémico, representantes de cada uma das categorias sintácticas
consideradas. Observa-se como, através de representações no quadro do LG, itens como
livro, velho e começar são adequadamente processados e interpretados.
Uma outra proposta de processamento da polissemia é a de Copestake & Briscoe
(1995) que se fixa num conjunto de fenómenos de referência (co-predicação) que
permitem distinguir diferentes casos de polissemia regular e, consequentemente,
diferentes modos de representação: palavras dotadas de uma descrição complexa
segundo o modelo generativo, por um lado, e significados relacionados através de regras
lexicais, por outro. Um outro argumento a favor da existência de regras lexicais para
explicar os fenómenos de extensão de significados baseia-se na comparação com
processos morfológicos e derivacionais. De facto, em algumas línguas, como o Espanhol, o
Italiano, o Alemão e mesmo o Inglês, alguns processos de alteração de significados são
muitas vezes acompanhados de processos morfológicos, como a alteração do género da
palavra ou processos de sufixação, o que pode indiciar que os processos morfológicos e
semânticos agem em simultâneo.
Todavia, a motivação mais forte para postular dois modos diferentes de
representação dos itens polissémicos reside na possibilidade, ou não, de aceder, na mesma
estrutura, a todos os significados de um item polissémico. Através de testes de co-
predicação, Copestake & Briscoe (1995) propõe que, se for possível aceder
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
152
simultaneamente, na mesma estrutura sintáctica, aos diferentes significados de um item,
então este é tratado como um caso de polissemia construcional e representado através de
uma entrada lexical subespecificada. Por outro lado, se não for possível aceder
simultaneamente aos diferentes significados de um item polissémico, então este é tratado
como um caso de extensão de significados e derivado através de uma regra lexical.
No entanto, Buitelaar (1998) propõe, no âmbito do LG, a inserção do operador ‘°’,
que, contrariamente a ‘•’, relaciona tipos que não podem ser interpretados
simultaneamente. A distinção entre estes operadores contribui para a riqueza do modelo
do LG, deixando, deste modo, de haver necessidade de postular a existência de regras
lexicais.
No seguimento da inadequação das definições dos operadores ‘•’ e ‘°’, para o
Português, propostas por Buitelaar (1998) - por serem demasiado “rígidas” - e Pinto (2001)
- por serem pouco precisas -, propõe-se, no capítulo 5, uma nova reformulação no que
respeita à relação existente entre os tipos simples que compõem os tipos complexos de um
dado item.
Na tentativa de construir testes de co-predicação constatou-se, no presente
trabalho, que os mesmos podem não dar uma indicação clara acerca da possibilidade de
aceder, na mesma estrutura, a ambos os tipos semânticos de um item polissémico,
podendo mesmo gerar previsões conflituosas consoante as construções sintácticas
utilizadas. Podendo ser construídos através de estruturas com coordenação, orações
relativas e SN’s com modificadores, concluiu-se que, por ser aquele em que se verifica
uma verdadeira co-predicação, encontrando-se os predicados ao mesmo nível na
estrutura sintáctica, o teste mais fiável é o de co-predicação através de estruturas com
coordenação.
Analisaram-se, ainda, alguns itens que constituem um caso mais complexo de
polissemia, como jornal e revista, propondo-se uma representação no quadro do LG capaz
de captar todos os significados que estes itens podem comportar.
Como se evidenciou ao longo deste trabalho, o contexto é um componente
fundamental no estabelecimento da multiplicidade de significados de um item lexical.
Qualquer sistema de Semântica Lexical Computacional que vise captar e prever o
comportamento polissémico dos itens lexicais tem de ter em atenção que os itens se
relacionam uns com os outros, adquirindo significados diferentes em virtude dos itens
6. CONCLUSÃO
153
que seleccionam ou pelos quais são seleccionados. Por ter em atenção o contexto, o
modelo do LG parece ser, de facto, aquele que melhor capta e prevê essa alteração de
significados, sendo, como se referiu anteriormente, económico, dinâmico e universal. O
seu poder generativo, do qual se tentou dar conta ao longo deste trabalho, permite prever
o significado de um vasto conjunto de itens em contexto, tendo sido, por isso já muito
estudado e adoptado em várias implementações computacionais.
Sendo um modelo relativamente recente, o LG pode ainda estar incompleto ou ser
pouco preciso relativamente a algumas questões (as estruturas de hierarquia de tipos são
ainda pouco definidas). No entanto, os vários estudos e propostas de que tem sido alvo só
o podem beneficiar e servir para enriquecer e tornar mais sólido o modelo (note-se a
proposta de Buitelaar (1998)).
Um possível trabalho futuro poderá consistir na adaptação da informação
codificada nas estruturas qualia e argumental a bases de dados lexicais electrónicas, como
a WordNet, contribuindo assim para o enriquecimento das mesmas1.
1 De facto, já existem algumas propostas nesse sentido, nomeadamente Mendes & Chaves (2001): “Since WordNet is a lexical inheritance system, the qualia features (and in fact, the relations already available) must be monotonically inherited. Thus, if such an enrichment is to take place, what is semantically specified for a hyperonym is shared by its hyponyms, keeping synsets as simple as possible.” (Mendes & Chaves, op.cit.: 6)
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
154
REFERÊNCIAS
155
REFERÊNCIAS
ALVES, A. T. (1993), “Levantamento e Análise da Bibliografia sobre o Tempo na Língua
Portuguesa (first draft)”, Cadernos de Semântica nº 13, Faculdade de Letras da
Universidade de Lisboa.
APRESJAN, J. D. (1973), “Regular Polysemy”, Linguistics, 142, pp. 5-32.
ASHER, N., A. Lascarides (1995), “Metaphor in discourse”, Representation and Acquisition of
Lexical Knowledge: Polysemy, Ambiguity and Generativity, AAAI Symposyum, Menlo
Park, California.
ASHER, N., J. Pustejovsky (2000), “The Metaphysics of Words in Context”, in
BERKELEY COTTER, M.J.F. (2002), Especificações para a Computação dos Predicados Causativos,
Dissertação de Mestrado, Universidade de Lisboa.
BOUILLON, P. (1996), “Mental State Adjectives: the Perspective of Generative Lexicon”,
Proceedings of COLING-96, Copenhaguen.
BOUILLON, P. (1997), Polymorphie et Sémantique Lexical: Le Cas des Adjectifs, Thèse de Troisième
Cycle, Université de Paris 7 Denis Diderot.
BOUILLON, P. (1999), “The Adjective “Vieux”: the Point of View of “Generative Lexicon””, in
E. Viegas (ed.), Breadth and Depth of Semantic Lexicons, Kluwer, pp. 148-166.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
156
BRISCOE, T., A. Copestake (1991), “Sense Extension as Lexical Rules”, in D. Fass, E.
Hinkelman and J. Martin (eds.) Computational Approaches to Non-literal Language:
Metaphor, Metonymy, Idiom, Speech Acts, Implicature, in Proceedings of the IJCAI Workshop
on Computational Approaches to Non-Literal Language, Sydney, Australia, pp.12-20.
BRISCOE, T., A. Copestake (1996), “Controlling the Application of Lexical Rules”, in E. Viegas
(ed.), Proceedings.of the SIGLEX Workshop on Breadth and Depth of Semantic Lexicons,
ACL, Santa Cruz, California, pp. 7-19.
BUITELAAR, P. (1998), CoreLex: Systematic Polysemy and Underspecification, PhD., Brandeis
University.
CALZOLARI, N. (1991), “Representation of Semantic Information in a Lexical Knowledge
Base”, in T. Briscoe, A. Copestake (eds.), First ACQUILEX Workshop, Cambridge, MA.
CASTELEIRO, J. M. (1981), Sintaxe Transformacional do Adjectivo, Textos de Linguística, Instituto
Nacional de Investigação Científica; Lisboa.
CASTELEIRO, J. M. (coord.) (2001), Dicionário da Língua Portuguesa Contemporânea, Academia
das Ciências/Editorial Verbo, Lisboa.
CHOMSKY, N. (1970), “Remarks on Nominalization”, in R. Jacobs, P. Rosenbaum (eds,),
Readings in English Transformational Grammar, Walthan, MA, Ginn & Co., pp. 184-221.
CHOMSKY, N. (1981), Lectures on Government and Binding, Dordrecht, Foris Publications.
CHOMSKY, N. (1986a), Barriers, MA, The MIT Press.
CHOMSKY, N. (1986b), O Conhecimento da Língua: Sua Natureza, Origem e Uso, Colecção
Linguística, Editorial Caminho.
COPESTAKE, A. (1992), The Representation of Lexical Semantic Information, PhD., University of
Cambridge.
COPESTAKE, A. (1995), “Representing Lexical Polysemy”, in J. Klavans (ed.), Representation and
Acquisition of Lexical Knowledge: Polysemy, Ambiguity and Generativity, AAAI
Symposyum, Menlo Park, California, pp. 21-26.
REFERÊNCIAS
157
COPESTAKE, A. (2001), “The Semi-generative Lexicon: Limits on Lexical Productivity”,
Proceedings on the 1st International Workshop on Generative Approaches to the Lexicon,
Geneva.
COPESTAKE, A., T. Briscoe (1992), “Lexical Operations in a Unification-Based Framework”, in
J. Pustejovsky, S. Bergler (eds.), Lexical Semantics and Knowledge Representation, Berlin,
Springer-Verlag, LNAI nº 627, pp. 101-119.
COPESTAKE, A., T. Briscoe (1995), “Semi Productive Polysemy and Sense Extension”, in J.
Pustejovsky, B. Boguraev (eds.), Lexical Semantics, Oxford, Clarendon Press, pp. 15-61.
COSTA, J., A. Melo (1998), Dicionário da Língua Portuguesa, 8ª edição, Porto Editora, Porto.
CRISMA, P. (1990), Functional Categories Inside the Noun Phrases, Tesi di Laurea, Università
degli Studi di Venezia.
CRUSE, D.A. (1986), Lexical Semantics, Cambridge University Press.
CRUSE, D.A. (1995), “Polysemy and Related Phenomena from a Cognitive Linguistic
Viewpoint”, in P. Saint-Dizier, E. Viegas (eds.), Computational Lexical Semantics,
Cambridge University Press.
CRUSE, D. A. (2000), “Aspects of the Micro-structure of Word Meanings”, in Y. Ravin, C.
Leacock (eds.), Polysemy: Theoretical and Computational Approaches, Oxford, University
Press, pp. 30-51.
CUNHA, C., L. Cintra (1984), Nova Gramática do Português Contemporâneo, Edições João Sá da
Costa, Lisboa.
DEMONTE, V. (1999) “El Adjetivo: Clases y Usos. La Posición del Adjetivo en el Sintagma
Nominal”, in I. Bosque, V. Demonte (eds.), Gramática Descriptiva de la Lengua Española,
Real Academia Española, Colección Nebrija y Bello, Editorial Espassa.
DIXON, R. M. W. (1991), A New Approach to English Grammar on Semantic Principles, Oxford,
Clarendon Press.
DOWTY, D. (1979), Word Meaning and Montague Grammar: the Semantics of Verbs and Times in
Generative Semantics and Montague’s PTQ, Dordrecht, Reidel.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
158
DOWTY, D. (1985), “On Some Recent Analyses of Control”, Linguistics and Philosophy 8, pp. 1-
41.
FELLBAUM, C., (ed.) (1998), WordNet: an Electronic Lexical Database, MA, The MIT Press.
FELLBAUM, C. (1999), “The Case for Electronic Lexicography: Some Linguistic and
Computational Arguments”, in P. Marrafa, A. Mota (orgs.), Linguística Computacional:
Investigação Fundamental e Aplicações, Associação Portuguesa de Linguística, Edições
Colibri, 1999, Lisboa.
GEERAERTS, D. (1993), “Vagueness’s Puzzles, Polysemy’s Vagaries”, Cognitive Linguistics, pp.
223-72.
GODDARD, C. (2000), “Polysemy: A Problem of Definition”, in Y. Ravin, C. Leacock (eds.),
Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp. 129-
151.
GRIMSHAW, J. (1990), Argument Structure, Cambridge, MA, The MIT Press.
GRISHMAN, R. (1986), Computational Linguistics: An Introduction, Cambridge University Press.
JACKENDOFF, R. (1990), Semantic Structures, Cambridge, MA, The MIT Press.
JOHNSTON, M., F. Busa, (1996), “Qualia Structure and the Compositional Interpretation of
Compounds”, in E. Viegas (ed.), Proceedings.of the SIGLEX Workshop on Breadth and
Depth of Semantic Lexicons, ACL, Santa Cruz, California, pp. 77-88.
KILGARRIFF, A. (1992), Polysemy, PhD., University of Sussex.
KILGARRIFF, A. (1995a), “Inheriting Polysemy”, in P. Saint-Dizier, E. Viegas (eds.),
Computational Lexical Semantics, Cambridge University Press.
KILGARRIFF, A. (1997a), “What is Word Sense Disambiguation Good for?” Proceedings NLP
Pacific Rim Symposium’97, Phuket, Thailand.
KILGARRIFF, A. (1997b), “Using Word Frequency Lists to Measure Corpus Homogeneity and
Similarity between Corpora”.
REFERÊNCIAS
159
KROVETZ, R. (1998), “More than One Sense Per Discourse”, Proceedings of the ACL-SIGLEX
workshop.
LAKOFF, G. (1970), “A Note on Vagueness and Ambiguity”, Linguistic Inquiry, 1, pp. 357-359.
LAKOFF, G., M. Johnson (1980), Metaphors We Live By, The University of Chicago Press.
LAPATA, M. (2001), “A Corpus-based Account of Regular Polysemy: the Case of Context-
sensitive Adjectives”, Proceedings of NAACL.
LASCARIDES, A., A. Copestake (1995), “Pragmatics and Word meaning”, Proceedings of
Semantics and Linguistic Theory V.
LASCARIDES, A., Copestake, A., Briscoe, T. (1996), “Ambiguity and Coherence”, Journal of
Semantics 13.1, pp. 41-65.
LEVIN, B. (1993), English Verb Classes and Alternations: A Preliminary Investigation, Chicago, The
University of Chicago Press.
LOPES, M. H. (1996), Sintaxe e Aspecto dos Nomes Deverbais em Português, Dissertação de
Mestrado, Universidade do Porto.
LYON, J. (1977), Semantics, Cambridge University Press.
MACHADO, J. P. (1977), Dicionário Etimológico da Língua Portuguesa, 3ª Edição, Livros
Horizonte, Lisboa.
MARRAFA, P. (1993), Predicação Secundária e Predicados Complexos em Português: Análise e
Modelização, Dissertação de Doutoramento, Universidade de Lisboa.
MARRAFA, P. (2001), WordNet do Português: uma Base de Dados de Conhecimento Linguístico,
Instituto Camões.
MATEUS, M. H. M. et alii (1989), Gramática da Língua Portuguesa, Colecção Linguística,
Editorial Caminho.
MENDES, A. (2001), Propriedades Sintácticas e Semânticas de Predicados Verbais com Pluralidade de
Sentidos: o Caso dos Verbos psicológicos, Dissertação de Doutoramento, Universidade de
Lisboa.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
160
MENDES, S., R. P. Chaves (2001), “Enriching WordNet with Qualia Information”, Workshop on
WordNet and Other Lexical Resources, NAACL 2001, Pittsburgh, PA, USA.
MILLER, G.A. (1978), “Semantic Relation Among Words”, in M. Halle, J. Bresnen, G.A. Miller
(eds.), Linguistic Theory and Psycholinguistic Reality, Cambridge, MA, The MIT Press,
pp. 60-117.
MILLER, G. A., C. Fellbaum, (1991), “Semantic Networks in English”, Cognition, 41, pp. 197-
229.
MINEUR, A., Buitelaar, P. (1996), “A Compositional Treatment of Polysemous Arguments in
Categorial Grammar”, in K. van Deemter, S. Peters (eds.), Semantic Ambiguity and
Underspecification, Chicago, Chicago University Press, pp. 125-143.
MOENS, M., M. Steedman (1988), “Temporal Ontology and Temporal Reference”,
Computational Linguistics, vol. 14, pp. 15-28.
MONTAGUE, R. (1974), “Towards a Proper Treatment of Quantification in English”, in R. H.
Thomason (ed.), Formal Philosophy: Selected Papers of Richard Montague, New Haven,
Yale University Press.
NIGHTINGALE, S. (1999), Polysemy and Homonymy in Japanese Verbal Alternations, PhD.,
University of Edinburgh.
NUNBERG, G. (1995), “Transfers of Meaning”, Journal of Semantics, 1.
NUNBERG, G., A. Zaenen (1992), “Systematic Polysemy in Lexicology and Lexicography”,
Proceedings of Euralex92, Tampere, Finland.
OLIVEIRA, F. (1992), “Algumas Questões sobre o Tempo e Aspecto”, Cadernos de Semântica nº
9, Faculdade de Letras da Universidade de Lisboa.
OSTLER, N., B. Atkins (1992), “Predictable Meaning Shift: Some Linguistic Properties of
Lexical Implication Rules”, in J. Pustejovsky, S. Bergler (eds.), Lexical Semantics and
Knowledge Representation, Berlin, Springer-Verlag, LNAI nº 627, pp. 87-100.
PALMER, M. (1998), “Are WordNet Sense Distinctions Appropriate for Computational
Lexicons?”, Proceedings of Senseval, Siglexl98, Brighton, England.
REFERÊNCIAS
161
PANMAN, O. (1982), “Homonymy and Polysemy”, Lingua, 58, pp. 105-136.
PARTEE, B., M. Rooth (1982), “Generalized Conjunction and Type Ambiguity”, in Bäuerle,
Schwarze, von Stechow (eds.), Meaning, Use and Interpretation of Language, Walter de
Gruyter.
PARTEE, B., A. Meulen, R. Wall (1990), Mathematical Methods in Linguistics, Dordrecht, Kluwer
Academic Publishers.
PAUSE, P., D. Heitz (1998), “Verbal Polysemy: An Open Problem”, Arbeitspapier Nr. 95,
(English Version).
PETERS, W., I. Peters (2000), “Lexicalised Systematic Polysemy in WordNet”, Proceedings of
Second International Conference on Language Resources and Evaluation, Athens.
PINTO, C. (2001), Para a Computação da Polissemia Nominal em Português, Dissertação de
Mestrado, Universidade de Lisboa.
POLLARD, C., I. Sag (1994), Head-Driven Phrase Structure Grammar, University of Chicago
Press.
PUSTEJOVSKY, J. (1991), “The Syntax of Event Structure”, Cognition, 41, pp. 47-81.
PUSTEJOVSKY, J. (1993), “Type Coercion and Lexical Selection”, in J. Pustejovsky (ed.),
Semantics and the Lexicon, Dordrecht, Kluwer Academic Publishers.
PUSTEJOVSKY, J. (1995a), The Generative Lexicon, Cambridge, MA, The MIT Press.
PUSTEJOVSKY, J. (1995b), “Linguistic Constraints on Type Coercion”, in P. Saint-Dizier, E.
Viegas (eds.), Computational Lexical Semantics, Cambridge, Cambridge University
Press, pp. 71-97.
PUSTEJOVSKY, J. (1996), “The Semantics of Complex Types”, Langue Française.
PUSTEJOVSKY, J. (1997), “”Knowledge is Elsewhere”: Natural Language Semantics Meets the
X-Files”, Linguistic Inquiry.
PUSTEJOVSKY, J. (1998), “The Semantics of Lexical Underspecification” Folia Linguistica.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
162
PUSTEJOVSKY, J. (2001), “Type Construction and the Logic of Concepts” in P. Bouillon, F. Busa
(eds.), The Syntax of Word Meaning, Cambridge University Press.
PUSTEJOVSKY, J., P. Anick (1988), “On the Semantic Interpretation of Nominals”, Proceedings of
COLING-1988, Budapest.
PUSTEJOVSKY, J., B. Boguraev (1996), “Introduction: Lexical Semantics in Context”, in J.
Pustejovsky, B. Boguraev (eds.), Lexical Semantics: The Problem of Polysemy, Oxford
University Press, pp. 1-14.
PUSTEJOVSKY, J., P. Bouillon (1996), “Aspectual Coercion and Logical Polysemy”, in J.
Pustejovsky, B. Boguraev (eds.), Lexical Semantics: The Problem of Polysemy, Oxford
University Press, pp. 133-162.
QUINE, W. V (1960), Word and Object; Cambridge, Mass., The MIT Press.
RAPOSO, E. P. (1992), Teoria da Gramática. A Faculdade da Linguagem, Colecção Linguística,
Editorial Caminho.
RAVIN, Y., C. Leacock (2000), “Polysemy: An Overview”, in Y. Ravin, C. Leacock (eds.),
Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp. 1-29.
ROBINS, R. H. (1967), A Short History of Linguistics, Bloomington, Indiana University Press.
SAINT-DIZIER, P. (1995), “Generativity, Type Coercion and Verb Semantic Classes”,
Representation and Acquisition of Lexical Knowledge: Polysemy, Ambiguity and
Generativity, AAAI Symposyum, Menlo Park, California.
SAINT-DIZIER, P. (1998a), “Sense Variation and Lexical Semantics Generative Operations”, in
D.M.W. (ed.), New Methods in Language Processing and Computational Natural Language
Learning, ACL, pp. 121-130.
SAINT-DIZIER, P. (1998b), “A Generative Lexicon Perspective for Adjectival Modification”,
COLING-ACL.
SAINT-DIZIER, P. (1999), “On the Polimorphic Behavior of Word-Senses”, in P. Marrafa, A.
Mota (orgs.), Linguística Computacional: Investigação Fundamental e Aplicações,
Associação Portuguesa de Linguística, Edições Colibri, Lisboa, pp. 29-56.
REFERÊNCIAS
163
SCHÜTZE, H. (2000), “Disambiguation and Connectionism”, in Y. Ravin, C. Leacock (eds.),
Polysemy: Theoretical and Computational Approaches, Oxford, University Press, pp. 205-
219.
SILVA. A. S. (1997), A Semântica de Deixar: Uma Contribuição para a Abordagem Cognitiva em
Semântica Lexical, Fundação Calouste Gulbenkian, Fundação para a Ciência e a
Tecnologia, Ministério da Ciência e da Tecnologia.
TOMURO, N. (1998), “Semi-automatic Induction of Systematic Polysemy from WordNet”,
Proceedings of the Workshop on Usage of WordNet in Natural Language Processing Systems,
at COLING-ACL.
VENDLER, Z. (1967), Linguistics in Philosophy, Ithaca, Cornell University Press.
VERSPOOR, C. (1996), “Lexical Limits on the Influence of Context”, in G. W. Cottrell (ed.)
Proceedings of the Eighteen Annual Conference of the Cognitive Science Society, Lawrence
Erlbaum Associates Publishers, pp. 116-120.
VERSPOOR, C. (1997a), Contextually-Dependent Lexical Semantics, PhD., The University of
Edinburgh.
VERSPOOR, C. (1997b), “Conventinality-Governed Logical Metonymy”, in H. Bunt, L. Kievit,
R. Muskens, M. Verlinden (eds.), Proceedings of the 2nd International Workshop on
Computational Semantics, Tilburg, the Netherlands, pp. 300-312.
WEINREICH, U. (1964), “Webster’s Third: a Critique of its Semantics”, International Journal of
American Linguistics 30, pp. 405-409.
WIERZBICKA, A. (1996), Semantics: Primes and Universals, Oxford, Oxford University Press.
XAVIER, M. F. & M. H. Mateus (orgs.) (1992), Dicionário de Termos Linguísticos, Associação
Portuguesa de Linguística/Instituto de Linguística Teórica e Computacional, 2
Volumes, Edições Cosmos, Lisboa.
COMPUTAÇÃO DA POLISSEMIA REGULAR EM PORTUGUÊS
164