memorizaÇÃo de informaÇÕes de fasememorizaÇÃo de informaÇÕes de fase em osciladores neurais...

21
MEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC) 1 & Marcos Antonio Botelho Labmat Laboratório de Matemática Experimental Departamento de Matemática Instituto Tecnológico de Aeronáutica 12.228-900 São José dos Campos SP Brazil [email protected] [email protected] RESUMO O presente trabalho visa utilizar conceitos geométricos e técnicas da teoria de sistemas dinâmicos não-lineares para abordar algumas questões ligadas à for- mação de padrões em agrupamentos de neurônios. Mais especi…camente, o objetivo é estudar a sincronização de dois osciladores neurais idênticos perto de uma bifurcação de Hopf e estabelecer uma memorização de diferença de fases. ABSTRACT This work applies geometrical concepts and methods from the theory of non- linear dynamical systems to approach some basic questions concerning pattern formation in clusters of neurons. More speci…cally, the aim is to study the synchronization of two identical neural oscillators near a Hopf bifurcation in order to establish a memorization of phase di¤erence. Palavras-chave: Redes neurais; osciladores neurais; memorização de fase. 1 INTRODUÇÃO Estamos supondo aqui um prévio conhecimento básico da biologia dos neurônios e de alguns termos neuro…siológicos tais como axônios, dendrites e sinapses. Em particular, estaremos assumindo um postulado básico, conhecido como o princípio de Dale, que es- tabelece que um neurônio é excitatório ou inibitório. Ele é excitatório se o potencial da membrana pós-sináptica cresce, um processo que é chamado de despolarização. O au- mento do potencial da membrana facilita a geração de uma ação potencial no neurônio pós-sináptico. Se o potencial pós-sináptico decresce (hiperpolarização), o neurônio pré- sináptico é chamado de inibitório. A hiperpolarização normalmente impede a geração de uma ação potencial. O princípio de Dale tem um papel importante no modelamento matemático do cérebro como um sistema dinâmico porque ele impõe algumas restrições naturais na possível dinâmica das redes neurais. Este princípio pode ser colocado de maneira matemática nos seguintes termos: 0 Trabalho feito em iteração com o Departamento de Matemática e Física da Universidade de Taubaté. 1 Bolsista do PIBIC/CNPq.

Upload: others

Post on 13-Mar-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

MEMORIZAÇÃO DE INFORMAÇÕES DE FASEEM OSCILADORES NEURAIS

Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho

Labmat Laboratório de Matemática ExperimentalDepartamento de Matemática

Instituto Tecnológico de Aeronáutica12.228-900 São José dos Campos SP Brazil

[email protected] [email protected]

RESUMO

O presente trabalho visa utilizar conceitos geométricos e técnicas da teoria desistemas dinâmicos não-lineares para abordar algumas questões ligadas à for-mação de padrões em agrupamentos de neurônios. Mais especi…camente, oobjetivo é estudar a sincronização de dois osciladores neurais idênticos pertode uma bifurcação de Hopf e estabelecer uma memorização de diferença defases.

ABSTRACT

This work applies geometrical concepts and methods from the theory of non-linear dynamical systems to approach some basic questions concerning patternformation in clusters of neurons. More speci…cally, the aim is to study thesynchronization of two identical neural oscillators near a Hopf bifurcation inorder to establish a memorization of phase di¤erence.

Palavras-chave: Redes neurais; osciladores neurais; memorização de fase.

1 INTRODUÇÃO

Estamos supondo aqui um prévio conhecimento básico da biologia dos neurônios e dealguns termos neuro…siológicos tais como axônios, dendrites e sinapses. Em particular,estaremos assumindo um postulado básico, conhecido como o princípio de Dale, que es-tabelece que um neurônio é excitatório ou inibitório. Ele é excitatório se o potencial damembrana pós-sináptica cresce, um processo que é chamado de despolarização. O au-mento do potencial da membrana facilita a geração de uma ação potencial no neurôniopós-sináptico. Se o potencial pós-sináptico decresce (hiperpolarização), o neurônio pré-sináptico é chamado de inibitório. A hiperpolarização normalmente impede a geraçãode uma ação potencial. O princípio de Dale tem um papel importante no modelamentomatemático do cérebro como um sistema dinâmico porque ele impõe algumas restriçõesnaturais na possível dinâmica das redes neurais. Este princípio pode ser colocado demaneira matemática nos seguintes termos:

0 Trabalho feito em iteração com o Departamento de Matemática e Física da Universidade de Taubaté.1 Bolsista do PIBIC/CNPq.

Page 2: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

Princípio de Dale.Suponha que xi 2 R, i = 1; : : : ; n; denota um atributo …siológico observável do i-ésimoneurônio, tal como amplitude ou fase das oscilações, potencial da membrana, atividadesdos canais de íons nos axônios, variáveis descrevendo reações bioquímicas nas sinapses,etc. Assuma que aumentando xi corresponde a uma despolarização, e diminuindo-o cor-responde a uma hiperpolarização.Considere um conjunto de neurônios descritos por um sistema dinâmico da forma

_xi = fi(x1; : : : ; xn) ; i = 1; : : : ; n ; (1)

onde fi : Rn ! R é uma função suave que descreve a dinâmica do i-ésimo neurônio.Então, todos os coe…cientes sinápticos do j-ésimo neurônio para os outros neurônios,

sij =@fi

@xj; i 6= j ; têm o mesmo sinal :

Se sij ¸ 0 , para todo i, então o j-ésimo neurônio é excitatório, por ter um efeito exci-tatório no i-ésimo neurônio. Caso contrário, ele é inibitório.Osciladores neurais no cérebro consistem de populações de neurônios excitatórios e ini-bitórios interligados entre si e, eventualmente, em contatos com outras células distantes.A maneira como estas interligações se realizam de…nem o que chamamos de organizaçõessinápticas e esta variedade de modos de organizações implicam em várias propriedadesdinâmicas destas redes. O objetivo do presente trabalho é o de mostrar que algumas orga-nizações sinápticas permitem que a rede memorize retardamentos no tempo ou informaçõesde desvio de fases através do estudo de um modelo simpli…cado. Embora a importânciaou não deste tipo memorização é uma questão neuro…siológica ainda por ser estabelecida,estamos interessados em entender quais condições devem ser impostas numa arquiteturade rede neural para garantir que ela possa memorizar diferenças de fases. Isto signi…ca oseguinte: se, durante um período de aprendizagem, o neurônio A excita o neurônio B demaneira que B gera uma ação de potencial com um retardamento (time delay) ±, entãoocorrem algumas mudanças de modo que sempre que A gera uma ação de potencial, en-tão o mesmo acontece em B com o mesmo retardamento ±. Levando em conta que, numcérebro real, os neurônios tendem a gerar ações de potencial repetidamente, estaremos in-teressados na diferença de fases entre os neurônios A e B em vez do retardamento. Destaforma, se durante um período de aprendizagem, dois osciladores neurais geram ações depotencial com alguma diferença de fase, então eles podem reproduzir a mesma diferençade fase depois que a aprendizagem foi completada.Para isto, iremos assumir que tanto asatividades excitatórias quanto as inibitórias de cada neurônio i = 1; : : : ; n são descritaspor variáveis unidimensionais xi 2 R e yi 2 R, respectivamente, e que a dinâmica de umoscilador neural é governada por8<:

_xi = f(xi; ¡yi) + "pi(x; y; ")

_yi = g(xi; yi) + "qi(x; y; "); (2)

com @f(x;y)@y ; @g(x;y)

@x ¸ 0 , o que signi…ca que a diminuição da atividade yi faz aumentar aatividade xi e que o aumento da atividade xi faz aumentar a atividade yi. Estaremos assu-mindo que o oscilador (2) se encontra em uma bifurcação de Andronov-Hopf supercrítica,o que signi…ca uma perda suave da estabilidade do equilíbrio, ou seja, para valores posi-tivos pequenos do parâmetro ", existe um ciclo limite estável numa vizinhança do antigoequilíbrio fazendo com que x(t) possa se aproximar do novo atrator e, assim, continuarpequeno. Neste contexto, nossa tarefa será converter (2) para um modelo canônico e de-duzir uma condição necessária e su…ciente para que tal rede possa memorizar e reproduzirinformações de fase.

Page 3: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

2. MODELO CANÔNICO LOCAL PARA BIFURCAÇÕES DE HOPF

No modelamento matemático do cérebro, pode acontecer de modelos diferentes de umamesma estrutura cerebral gerarem resultados diferentes, uma vez que tais resultados po-dem depender de particularidades de algum modelo implícito. Uma estratégia para con-tornar estas eventuais disparidades é a de procurar originar resultados que sejam mar-cadamente independentes do modelo especí…co e que possam ser observados numa classebem ampla. Tal é o caso, por exemplo, se continuarmos obtendo essencialmente os mes-mos resultados depois de adicionarmos mais parâmetros e variáveis num dado modelo.Uma abordagem e…ciente consiste em estudar classes de modelos em vez de um modeloindividual, fazendo uma redução de toda uma família a um de seus modelos que tenhaum caráter universal em algum sentido e que, por isso, possa ser representativo da classe.Assim, dizemos que um modelo é canônico se existe uma mudança de variáveis contínua,inversível ou não, que transforma qualquer outro modelo da classe neste modelo especí-…co. Claro que se a mudança de variáveis simpli…cadora não for inversível, podemos perderinformações mas, em compensação, ganhamos em generalidade.Vamos supor que as dinâmicas do cérebro possam ser descritas por um sistema de equaçõesdiferenciais do tipo

_x = F (x); x 2 X (3)

onde X é um espaço de variáveis de estado e F : X ! X é alguma função. Na prática, nãoconhecemos quais são o espaço X e o campo vetorial F apropriados. Se este fosse o caso,poderíamos dizer que a equação (3) descreve o modelo matemático do cérebro. A saídamais usada para essa questão é imaginar um processo in…nito de re…namentos sucessivos,produzindo uma família de sistemas dinâmicos

F = fF¸ : X¸ ! X¸ j ¸ 2 ¤g

onde ¤ é um conjunto de índices (que, eventualmente, poderia ser não-enumerável) e cadaF¸ é construído sucessivamente a partir de casos mais simples, pela adição de mais e maisdados ao modelo de forma a re‡etir cada vez melhor as peculiaridades do cérebro. Pareceplausível supor que poderiam existir alguns resultados reproduzíveis por todos os sistemasdinâmicos em F ou, alternativamente, podemos postular que F denota, descritos de formaimplicíta, todos os sistemas dinâmicos que descrevem completamente (em algum sentido)o cérebro humano. Porém, em vez de estudar cada membro de F isoladamente, vamosadotar o seguinte enfoque: Suponha que existe um sistema dinâmico

_y = G(y); y 2 Y; (4)

tal que todo membro de F pode ser transformado em (4) por uma mudança de variáveiscontínua. A esse modelo (4) chamamos de modelo canônico da família F . Com isto,podemos estudar o modelo canônico e extrair informações sobre todos os membros de Fde uma só vez.Notemos que, a verdade, não é necessário determinar exatamente qual mudança de vari-áveis utilizar. Basta provar que tal mudança de variáveis existe.De…nição.(i) Uma observação de x(t) é qualquer função de…nida em X . Também, dizemos que avariável y(t) ´ h(x(t)) é um observável.(ii) Um sistema dinâmico

_x = F (x); x 2 Xtem

_y = G(y); y 2 Y;

Page 4: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

como modelo se existe uma função contínua (observação) h : X ! Y tal que, se x(t) éuma solução de (3), então y(t) = h(x(t)) é uma solução de (4).Quando h é um homeomor…smo, dizemos que os sistemas dinâmicos são conjugados ( ouque são topologicamente equivalentes).(iii) Suponha que existe uma família F = fF¸ : X¸ ! X¸ j ¸ 2 ¤g de sistemas dinâmicos

_x = F¸(x) ; x 2 X¸ ; ¸ 2 ¤ (5)

descrevendo o cérebro. Então, o sistema (4) é um modelo canônico para a família Fse, para cada membro F¸ 2 F existe uma observação contínua h¸ : X¸ ! Y tal que assoluções de (5) são mapeadas às soluções de (4).Existe toda uma teoria para derivar modelos canônicos, quer por análise local, quer global.Pode-se mostrar que os neurônios precisam estar perto de limiares de atividades de maneiraa participar não trivialmente da dinâmica cerebral, o que matematicamente signi…ca que oequilíbrio corresponde a um ponto de bifurcação. Em particular, no caso de redes neuraisperto de bifurcações de Hopf múltipla, temos o seguinte resultado que fornece um modelocanônico local nestas circunstâncias.Teorema 2.1 Se a rede neural fracamente acoplada

_xi = fi(xi; ¸) + "gi(x; ¸; ½; ") ; xi 2 R2 ; i = 1; 2; : : : ; n (6)

está perto de uma bifurcação múltipla de Andronov-Hopf e ¸(") = "¸1 + O("2), entãoexiste uma mudança de variáveis

xi(t) =p

" Vi

·ei­itzi(¿)e¡i­it¹zi(¿)

¸+O(p") (7)

onde ¿ = "t é um tempo lento que transforma a rede neural em

z0i = bizi + dizijzij2 +

nXj 6=i

cijzj +O(p") (8)

onde0 4=

d

d¿; bi ; di ; zi 2 C

e os coe…cientes sinápticos cij 2 C são dados por

cij =

½!i ¢ Dxj gi ¢ vj ; se ­i = ­j

0 ; se ­i 6= ­j(9)

O sistema (8) é um modelo canônico para uma rede neural fracamente acoplada perto deuma bifurcação de Andronov-Hopf múltipla.(V. Hoppensteadt-Izhikevich[1] para a prova).

3. MEMORIZAÇÃO DE INFORMAÇÃO DE FASE

Embora estaremos sempre considerando pares de osciladores neurais e conexões sinápticassomente em uma direção, …ca subentendido que a rede consiste de vários osciladores neuraise que conexões sinápticas do mesmo tipo existem entre quaisquer dois osciladores em todasas direções.Assumindo, sem perda de generalidade, que o oscilador tem (0; 0) como um equilíbrio,vamos considerar uma rede com dois osciladores neurais conforme representada na …gura1.

Page 5: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

Figure 1: Uma rede com dois osciladores neurais.

.Neste caso, a rede é um sistema dinâmico que pode ser escrito na forma½

_xi = f(xi; ¡yi) + "pi(x; y; ")_yi = g(xi; yi) + "qi(x; y; ")

; i = 1; 2 (10)

em termos das funções sinápticas

pi(x; y; 0) = f0½(xi; ¡yi)

2Xj=1

(sij1xj ¡ sij2yj) (11)

qi(x; y; 0) = g0½(xi; yi)

2Xj=1

(sij3xj ¡ sij4yj) (12)

onde as constantes sinápticas sijk são todas positivas e " ¿ 1.Denotando a matriz jacobiana no equilíbrio por

L =

·a1 ¡a2a3 ¡a4

¸temos que o oscilador neural está numa bifurcação de Andronov-Hopf quando L satisfaztr L = a1 ¡ a4 = 0 e detL = ¡a1a4 + a2a3 > 0. Neste caso, podemos associar a cadaoscilador neural sua freqüência natural ­ =

pdetL =

pa2a3 ¡ a1a4. O princípio de Dale

implica que a2 e a3 são constantes não-negativas, mas, como a1 = a4, a condição detL > 0implica que tanto a2 quanto a3 são positivas. Embora nem a1 ¸ 0 nem a1 < 0 contradigamo princípio de Dale, por simplicidade vamos considerar apenas o caso a1 = a4 ¸ 0. Doteorema 2.1 segue que a rede neural fracamente conectada (10) é governada pelo seguintemodelo canônico nas proximidades de bifurcação de Andronov-Hopf múltipla:

z0i = (®i + i !i) zi + (¾ + i °) zijzij2 +

2Xj 6=i

cijzj ; i = 1; 2 (13)

Não se conhece muito sobre aprendizagem no cérebro humano, mas nossas hipóteses maisimportantes acerca da dinâmica de aprendizagem parecem consistentes com o que se ob-serva na prática.Em termos de uma rede neural fracamente conectada [ _xi = fi(xi; ¸)+"gi(x1; :::; xn; ¸; ½; ")],estas hipóteses são:

² O aprendizado é descrito em termos de modi…cações dos coe…cientes cij = @gi=@xi.

² Para i e j …xados o coe…ciente wij = "cij se modi…ca de acordo com equações daforma

w0ij = h(wij; xi; xj): (14)

Page 6: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

² Usamos o tempo lento ¿ = "t para lidar com a terceira hipótese.

² h(wij ; 0; xj) = h(wij; xi; 0) = h(wij; 0; 0) = ~h(wij) = ¡°wij + ±w2ij + ::: para todosxi e xj , de modo que h é da forma

h(wij ; xi; xj) = ¡°wij + ¯xixj + ±1wijxi + ±2wijxj + ±w2ij + ::: . (15)

Usando o fato de que os coe…cientes wij são de ordem " e de que as atividades de neurôniossão de ordem

p", podemos usar a mudança de escala wij = "cij e xi =

p"yi (i = 1; :::; n)

para obtermos a expressão

c0ij = ¡°cij + ¯yiyj +O(p"); (16)

chamada regra de modi…cação sináptica de Hebb ou regra de aprendizagem de Hebb. As-sumiremos que ° (taxa de desvanecimento da memória ) e ¯ (taxa de plasticidade sináptica)são positivos e os mesmos para todas as sinapses. Seria razoável também pensarmos emtermos de ° = °ij e ¯ = ¯ij . Assim, temos:Lema A regra de aprendizagem de Hebb para uma rede fracamente conectada de os-ciladores neurais pode ser escrita na forma

c0ij = ¡bcij + kij2zi¹zj + kij3¹zizj ; (17)

ondekij2 = ·(a2¯1 ¡ a3¯2) +

a3a2¹·(a2¯3 ¡ a3¯4); (18)

kij3 = ·(a2¯1 ¡ a3¯3) +a3a2¹·(a2¯2 ¡ a3¯4); (19)

· =1

2(1¡ i

a4­);

sendo ¯ij usado no lugar de ¯ijk, i; j = 1; :::; n; k = 1; 2; 3; 4:¥ Prova. (V. Rodrigues-Botelho[2]).Em termos do modelo canônico, a memorização de informação de fase signi…ca o seguinte:Suponha que durante um período de aprendizagem as atividades zi(¿) do oscilador sãodadas de maneira que as diferenças de fase Arg zi¹zj são mantidas …xas. Chamemos opadrão das diferenças de fase de imagem a ser memorizadas. Adicionalmente, suponhaque os coe…cientes sinápticos cij evoluem de acordo com a regra (17). Então, dizemosque o modelo acnônico memorizou a imagem se existir um atrator no espaço Cn dos ztal que, quando a atividade z(¿) está no atrator, as diferenças de fase entre os osciladorescoincidem com aquelas a serem aprendidas. Temos, então, o seguinte resultado:Teorema 3.1 Considere a rede fracamente conectada de osciladores neurais governadapor

zi = (®i + i!i)zi + (¾i + i°i)zijzij2 +nX

j=1

cijzj; i = 1; :::; n

juntamente com a regra de aprendizagem (17). Suponha que os osciladores neurais pos-suam freqüências iguais ( !1 = ::: = !n = !), que a bifurcação de Andronov-Hopf sejasupercrítica ( ¾i < 0) e que °i = 0. Então, temos que tal rede consegue memorizar dife-renças de fase de pelo menos uma imagem se e somente se

kij2 > 0 e kij3 = 0; (20)

i.e., a regra de aprendizagem (17) tem a forma

c0ij = ¡bcij + kijzi¹zj; i 6= j; (21)

Page 7: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

onde kij =Re kij2, i; j = 1; :::; n, são números reais positivos.¥ Prova. (V. Rodrigues-Botelho[2]).

4. CONCLUSÃO

Agora que sabemos como kij2 e kij3 dependem das redes neurais fracamente conectadasoriginais, os resultados deste teorema podem ser reformulados em termos de (10). Paraisto, basta aplicar a condição (20) à representação (18) e teremos o seguinte:Corolário. Uma rede fracamente conectada de osciladores neurais pode memorizar dife-renças de fase se e somente se as razões de plasticidade satisfazem:

a2¯1 = a3¯3 ; a2¯2 = a3¯4 (22)

ekij = a2¯1 ¡ a3¯2 > 0 (23)

para cada i e j.Este resultado permite estabelecer que tipo de organizções sinápticas podem ou não me-morizar informações de fase. Por exemplo, suponhamos que ¯ij1 = 0; para algum i 6= j.Isto signi…ca que não há modi…cação de sinapses entre o j-ésimo e o i-ésimo neurôniosexcitatórios, a não ser atro…a, ou seja, um desaparecimento gradativo. Desta forma,mesmo que existisse uma sinapse sij1 entre xj e xi no início, ela iria atro…ar com o passardo tempo. Assim, sem perda de generalidade, podemos assumir que ¯ij1 = 0 indicaque é impossível tanto a formação quanto o crescimento de sinapses de xj para xi. Asmesmas considerações podem ser aplicadas para ¯ij2; ¯ij3 e ¯ij4. Chamando ¯ij de razãode plasticidade, ele vai ser diferente de zero ou igual a zero se o contato sináptico entre osdois neurônios for possível ou não, respectivamente. Desta forma, de acordo com a condição(22), se uma das razões de plasticidade é zero, isto é, se o contato entre dois neurônios nãoé possível numa dada organização sináptica, então o mesmo deve acontecer com a outrarazão de plasticidade correspondente. Isto signi…ca que uma condição necessária para queuma organização sináptica possa memorizar informação de fase é que ela seja tal que seum neurônio tem contatos sinápticos com algum oscilador neural, então ele deve ter acessotanto aos neurônios excitatórios quanto aos inibitórios do oscilador neural.

REFERÊNCIAS

[1] Hoppensteadt, F.C. & Izhikevich, E.M.: Weakly Connected Neural Networks. Springer,1997.[2] Rodrigues, L.L. & Botelho, M.A.: Organizações Sinápticas e Memorização de Infor-mações em Osciladores Neurais. Relatório de Atividades, CNPq/Pibic. ITA, Agosto de2002.[3] Verhulst, F.: Nonlinear Di¤erential Equations and Dynamical Systems. Springer-Verlag, Berlin, 1990.

Page 8: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

MODELO MATEMÁTICO PARA A TEORIA COGNITIVISTADOS FENÔMENOS MENTAIS

Paulo Franca Bandel (IC)1 & Marcos Antonio Botelho

Labmat Laboratório de Matemática ExperimentalDepartamento de Matemática

Instituto Tecnológico de Aeronáutica12.228-900 São José dos Campos SP [email protected] [email protected]

RESUMO

Este trabaho apresenta a construção de uma formalização matemática que per-mite interpretar as correntes behaviorista e cognitivista em termos da teoriada realização canônica da Teoria de Controle de Sistemas Lineares. Em par-ticular, é aqui mostrado que a representação de aspectos externos e comporta-mentais em termos de estados ‘internos’ implica no conexionismo, ou seja, nocérebro como um emaranhado de redes neurais.

ABSTRACT

This work presents the construction of a mathematical formalization that allowsone to interpret behaviorism and cognitivism in terms of a canonical realizationfrom the Linear Systems Control Theory. In particular, it is shown that therepresentation of external and behavioral aspects in terms of ‘internal’ statesimplies connectionism, that is, the mind as a manifold of neural networks.

Palavras-chave: Controle; realização; fenômenos mentais.

1 INTRODUÇÃO

Este trabalho procura aplicar métodos da teoria de controle de sistemas lineares paraabordar questões básicas sobre o modelamento de funções cerebrais e prover um funda-mento sistêmico-teorético para contribuirmos no debate de algumas questões polêmicasantagonizadas pelas escolas behaviorista e cognitivista de psicólogos. Em última análise,porém, nossa proposta é apresentar um modelo matemático que nos permita representaraspectos relevantes de qualquer tipo de objeto de processamento de informações que possadesempenhar atividades funcionais tais como, por exemplo, lembrar estímulos externos ouexecutar instruções para atividades como andar, ver e falar.Na primeira metade do século XX, a atitute behaviorista para livrar-se dos impasses deuma visão dualista mente-corpo foi eliminar toda noção de mente, estados mentais e rep-resentações mentais do foco das investigações teóricas e concentrar somente nos padrões

0 Trabalho feito em iteração com o Departamento de Matemática e Física da Universidade de Taubaté.1 Bolsista do PIBIC/CNPq.

Page 9: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

de estímulo-resposta dos comportamentos observáveis. Mais recentemente, uma propostaadvogada por pesquisadores em Ciências Cognitivas tem sido considerar que um estadomental pode ser de…nido por suas relações causais com outros estados mentais, e que taisestados mentais podem ser realizados por muitos sistemas. Em função destes aspectosgerais das duas escolas, parece-nos bastante natural, no presente estudo, representar aposição behaviorista através de um formalismo calcado nas relações de entrada-saída emsistemas de controle. Por outro lado, a proposta cognitivista pode ser representada atravésda descrição interna de sistemas de controle envolvendo a noção de estado, além das deentrada e de saída. Com isto, estaremos aqui usando o teorema da realização da teoriamatemática de sistemas para comparar estas duas visões e explorar o formalismo intro-duzido para abordar várias questões sobre os processos do conhecimento e as inevitáveisconsiderações sobre as limitações desta abordagem matemática.Em linhas gerais, nosso problema será o de, a partir da representação externa de umcomportamento ’inteligente’ através de padrões observáveis de estímulo-resposta, fazercorresponder uma descrição em termos de relações causais de estados internos que expliqueou seja compatível com a representação externa. Para uma representação matemática doproblema, vamos concentrar a abordagem em termos da teoria de sistemas lineares comevolução temporal discreta. Para a representação externa, a maneira como as respostas (ousinais de saída) dependem dos estímulos (ou sinais de entrada) pode ser descrita por umarelação de entrada/saída (ou estímulo/resposta) expressa por um ternoª = (­; ¡; f), onde­ e ¡ são espaços vetoriais de dimensão …nita e f é uma aplicação f : ­ ! ¡. Supondoque temos um objeto processador de informações L; um padrão de estímulo-resposta de Lé representado pela seqüência BL = f(ut; yt+1)g, para t = 0; 1; 2; :::

u ¡! L ¡! y

O comportamento externo do objeto L é descrito pela aplicação de estímulo/respostaf : ! 2 ­ 7¡! ° 2 ¡ onde a seqüência de entrada (estímulo) é ! = fuo; u1; u2; :::g; ! 2­; ui 2 U; e a de saída (resposta) é ° = fy1; y2; y3; :::g; ° 2 ¡; yi 2 Y:Estaremosassumindo que o modelo interno em termos dos estados cognitivos será descrito por meiode um sistema invariante no tempo, linear, de dimensão …nita, com tempo discreto de…nidopor uma tripla fU; X; Y g de espaços vetoriais reais de dimensão …nita e uma tripla detransformações lineares (matrizes, em última análise) A; B; C tais que½

xt+1 = Axt +But

yt = Cxt; xt=0 = xo (1)

Com isto, o problema básico de realização em espaços cognitivos pode …nalmente sercolocado de maneira mais precisa nos seguintes termos:

Dado um padrão de estímulo-resposta BL associado com uma descrição externade L = (­;¡; f; U; Y ), achar um modelo interno § = (X; A; B; C) tal queBL = B§, onde B§ é o padrão de estímulo-resposta de §:

No que segue, estaremos abordando este problema, num estudo calcado em Casti[1] eFuhrmann[2].

2. REALIZAÇÃO CANÔNICA DE SISTEMAS LINEARES

Um número in…nito de modelos § podem satisfazer o requisito acima. Por este motivo,precisamos estabelecer um critério para selecionar dentre esta in…nidade de candidatos,aquele que satisfaz os requisitos de uma maneira melhor, em algum sentido. A tal modelo‘ótimo’ daremos o nome de modelo canônico. Portanto, a realização canônica é caracter-izada por um modelo interno cujo espaço de estados não contém elementos irrelevantespara um padrão de estímulo-resposta B§.

Page 10: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

Vamos assumir que o espaço de entradas ­ é constituído de seqüências de vetores deRm, enquanto o espaço de saídas ¡ é constituído de seqüências de vetores de Rp. Maisprecisamente,

­ = f(u0; u1; u2; :::; uN) ; ui 2 Rm; N < 1 ; para algum N 2 Ng; (2)

¡ = f(y1; y2; y3; :::) ; yi 2 Rpg: (3)

A função f : ­ ! ¡, por sua vez, será representada através da relação de entrada-saída:

yt =t¡1Xi=0

Pt¡iui; t = 1; 2; 3; :::; (I/O)

com Pj são matrizes pertencentes a Rpxm: Pode-se comprovar esta relação observandoque a seqüência de entrada ! = (uo; u1; u2; :::uN) é transformada na seqüência de saída° = (y1; y2; y3; :::) através da matriz triangular inferior de Toeplitz:

T =

26664P1 0 0 0 :::P2 P1 0 0 :::P3 P2 P1 0 :::...

......

37775 ; Pi 2 Rpxm:

Assim, dada a aplicação f , tem-se determinada a seqüência BL = fP1; P2; P3; :::g e temos,portanto, o isomor…smo f »= fP1; P2; P3; :::g.Feitas as considerações de linearidade, temos que uma realização de f consiste na con-strução de um espaço vetorial n-dimensional X (que, sem perda de generalidade, tomare-mos X = Rn) e as matrizes reais A; B e C de ordens nxn, nxm e pxn, respectivamente.Este espaço X representa o espaço de estados do sistema, relacionado com os espaços deentrada e saída através das equações dinâmicas:

xt+1 = Axt +But

yt = Cxt; xo = 0; (§)

com xt 2 X; ut 2 Rm; yt 2 Rp. Assim, dada uma seqüência de entradas ! 2 ­, vemos que§ gera uma saída ° 2 ¡. Se, para todo instante t, o par de entrada e saída (ut; yt+1)§ de§ estiver coerente com o par (ut; yt+1)I/O dado pela matriz T e as relações de I/O citadas,§ será caracterizado como um modelo interno para a descrição de I/O de f . Deve-se, então, obter uma relação que ligue a descrição de entrada-saída dada pela seqüênciafP1; P2; P3; :::g com a descrição de variáveis de estado de § dada pelas matrizes A; B e C.É fácil ver que este será o caso se e somente se Pt = CAt¡1B; 8 t = 1; 2; 3:::, uma condiçãoque indica a identidade de comportamentos de f e §. Entretanto, há in…nitos sistemas §satisfazendo esta relação, de forma que necessitamos de condições adicionais que nos dêum critério para escolhermos de maneira inequívoca um modelo, o qual chamaremos demodelo canônico, dentre esta in…nidade de candidatos:De…nição(i) Dado qualquer modelo § = (X; Á; h; xo) , dizemos que § é completamente alcançávelse para cada estado x¤ 2 X, existe uma seqüência de entrada ! 2 ­ e um tempo T tal quexT = x¤. Isto é, ! transfere o estado do sistema de xo (t=0) para x¤ (t=T).(ii) Dado qualquer modelo § = (X; Á; h; xo) , dizemos que § é completamente observávelse cada estado inicial xo pode ser identi…cado somente a partir de seqüência de entradado sistema e da observação da saída yt em um intervalo 0 < t · T .(iii) § é canônico se ele é, simultaneamente, completamente observável e completamentealcançável.Assim, temos os seguintes resultados, cujas provas podem ser encontradas nos livros usuaisda Teoria de Controle ou Álgebra Linear (ver, por exemplo, Fuhrmann[2]).

Page 11: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

Teorema da alcançabilidade:Um estado x 2 Rn é alcançável a partir da origem para o sistema § se e só se x é umacombinação linear de colunas das matrizes B; AB; A2B; : : : ; An¡1B.Corolário.(i) Todo estado x 2 Rn é alcançável (i.e., § é completamente alcançável) se e só se amatriz D =

£B j AB j A2B j ¢ ¢ ¢ j An¡1B

¤possui posto n.

(ii) Se um estado x 2 Rn é alcançável, então não é alcançável em mais do que n passos.(iii) Os estados alcançáveis constituem um subespaço vetorial de Rn, isto é, se x; y 2 Rn

são alcançáveis, então os estados ®x+ ¯y são todos alcançáveis para todos os reais ® e¯.Teorema da observabilidade:Um estado inicial x0 2 Rn não é observável pelo sistema § se e só se xo está contido nonúcleo da matriz © =

£C CA CA2 ¢ ¢ ¢ CAn¡1

¤T .Corolário.(i) Os estados não-observáveis formam um subespaço de Rn.(ii) § é completamente observável se e só se o posto de © é n, i.e., ker© = f0g:Finalmente, a existência do modelo canônico é garantida pelo seguinteTeorema da Realização.Dada uma função de entrada-saída f : ­ ! ¡ , sempre existe um modelo canônico §= (A; B; C) tal que BL = B§. Além disso, o modelo é único dentro de uma mudança decoordenadas no espaço de estados de dimensão in…nita em questão.Este resultado pode ser expresso em termos cognitivos:Teorema da Cognição.Dado um padrão de estímulo-resposta BL; sempre existe um modelo cognitivo com umcomportamento dado por B§ tal que BL = B§. Além disso, este modelo cognitivo é único.

3 A METÁFORA DINÂMICO-SISTÊMICA DO CÉREBRO

Essencialmente, o que estabelecemos foi uma equivalência abstrata entre as escolas be-haviorista e cognitivista, usando como ferramenta a realização canônica da teoria de sis-temas lineares discretos e assumindo o postulado básico de que as informações dadas pelopadrão de comportamentos B são exatas. Por um lado, isto traz algumas conseqüênciasinteressantes: primeiro, que apenas o cognitivismo dentre estas escolas pode eventual-mente conduzir a uma teoria causal do comportamento inteligente e, segundo, que esteprocesso de ‘interiorização’ das relações de estímulo e comportamento observável resultanuma representação conexionista, em termos de redes neurais, para o cérebro. Por outrolado, existem várias limitações relevantes: neste nível de descrição, a dinâmica do cérebrodeve ser melhor modelada por sistemas em tempo contínuo e não discreto; o modelo deixatotalmente em aberto a questão da mente, ou seja, de eventos mentais como sentimentos,pensamentos, percepção, dor, prazer, etc.; e a hipótese sobre a linearidade do modelo nãocorresponde ao caráter extremamente não-linear da dinâmica do cérebro.Porém, levando em consideração que, no balanço entre os resultados e as limitações,pudemos encontrar uma representação matematicamente formalizada e precisa do cogni-tivismo que, embora trazendo profundas limitações como metáfora para o cérebro humano,pelo menos permite vislumbrar alguma relevância em aplicações na área de inteligênciaarti…cial.

Vamos agora abordar alguns dos pontos acima. Primeiro, podemos adotar um postu-lado mais geral de unicidade expresso da seguinte forma, que chamamos de princípio daunicidade:

Page 12: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

Se as informações B são exatas e completas, há um único sistema canônicoque representa as informações dadas.

O termo completo signi…ca simplesmente que os dados B “surgiram” de um sistema per-tencente a uma classe de sistemas a partir dos quais buscamos um modelamento. Nestecaso, está-se tratando dos sistemas lineares. Desta forma, concluímos que todos os mode-lamentos ”ótimos” de B são isomór…cos, independentemente de sua origem linear ou não-linear. Entretanto, a exigência de exatidão nos dados é fundamental, conforme podemosver na seguinte situação. Suponhamos que as informações B consistem de pares (t; xt) parat = 1; 2; 3; :::; N . Neste caso, a classe de sistemas é a dos polinômios, ou seja, o objetivoé encontrar um polinômio p tal que p(t) = xt ; t = 1; 2; 3; :::; N . Um modelo “ótimo”consiste, aqui, simplesmente no polinômio p de menor grau satisfazendo esta condição. Denosso estudo, segue que o teorema da realização para este problema é a chamada fórmulade interpolação de Lagrange para as informações B. Assim, tem-se a fórmula:

p¤(t) =NX

t=1

xt

Yt 6=j

z ¡ xt

xt ¡ xj

Embora não seja evidente que p¤ representa a realização “ótima”, é possível provar estaassertiva utilizando algumas ferramentas básicas. A condição de que B é completo étrivialmente satisfeita desde que para um determinado N assume-se em princípio que asinformações são “geradas” por um polinômio. A condição de isomor…smo é igualmentesatisfeita se observarmos que o fato de p¤ estar de acordo com as informações dadasdetermina o coe…ciente dominante do polinômio em questão. Portanto, existe um únicopolinômio “ótimo” que está concordando com B.Entretanto, caso as informações não sejam fornecidas de forma “exata”, o panorama muda.Suponhamos, por exemplo, que tomemos uma quantidade muito grande de pontos (porexemplo, um milhão) que estão de acordo exatamente com uma curva do quarto grau,mas não com qualquer curva de grau superior. Utilizando a fórmula de Lagrange paramodelar estas informações, obteremos um polinômio de grau 4. Introduzindo uma per-turbação extremamente pequena nas informações, a fórmula de Lagrange nos conduzirá aum polinômio de grau 106 em um novo modelo. Isso ocorre porque esta fórmula utilizadaé muito sensível a pequenos ruídos nas informações dadas. Assim, a complexidade domodelo p¤ neste caso de informações contendo ruído depende de N .

Agora, vamos abordar a tese subjacente do trabalho. Se tentarmos dar uma caracterizaçãode alguma forma mais explícita dos elementos do espaço de estados X, irá transpareceruma informação que podemos expressar como a seguinte tese implícita no que foi aquidesenvolvido:

Uma teoria causal do comportamento inteligente implica no conexionismo (i.e.,o cérebro, ou a ‘máquina inteligente’, como um emaranhado de redes neurais).

Vejamos. Até aqui, os elementos do espaço de estados X foram caracterizados simples-mente como pontos do espaço Rn. Para uma melhor interpretação deste modelamento,devemos investigar de maneira mais profunda os estados. Um estado x 2 X representauma “codi…cação” da entrada ! em sua forma mais compacta, sendo ainda consistentecom a geração de uma saída ° segundo a função de entrada-saída f . Assim, pode-sea…rmar que cada estado corresponde a uma classe equivalente de entradas. Neste caso,considera-se que duas entradas ! e !0 são equivalentes se geram a mesma saída regradaspor f , ou seja, ! ¼ !0 se e só se f(!) = f( !0). Assim, a codi…cação ! 7! x = [!]f podeser vista como o caminho através do qual o sistema § ”memoriza” a entrada !. Mas como que se parece uma operação de codi…cação? A maneira mais simples de se visualizar esta

Page 13: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

operação é representar formalmente cada entrada ! como um polinômio de grau N . Destaforma, recordando que ! = (u0; u1; u2; :::; uN); ui 2 Rm; N < 1, vamos identi…car ovetor ! com o polinômio:

! $ u0 + u1:z + u2:z2 + :::+ uN :zN = !(z)

Convém observar que, nesta representação, z é apenas um símbolo indeterminado cujopapel é o de funcionar como um ‘marcador de tempo’ para a entrada !. Desta forma, osímbolo zt corresponde ao tempo t em que a entrada ut é aplicada no sistema.Consideremos, agora, a matriz A que representa a estrutura interna. Utilizando a identi…-cação entre as seqüências de entrada e polinômios, temos o isomor…smo ­ ¼ Rm[z], ou seja,o isomor…smo entre ­ e o conjunto dos polinômios com coe…cientes em Rm. Seja ªA(z)o polinômio mínimo de A, ou seja, o polinômio não-nulo de menor grau possível tal queªA(A) = 0. Da teoria elementar de matrizes, temos que ªA(z) é um divisor do polinômiocaracterístico de A, que será de grau n se A 2 Rnxn. Daí, segue que degªA(z) · n. Umresultado, cuja demonstração foge do escopo deste trabalho mas pode ser encontrada naliteratura, diz que x = [!]f 2 ­ mod ªA(z). Em outras palavras, x é o resto da divisãodo polinômio vetorial ! pelo polinômio escalar ªA(z).O ponto mais importante a ser notado deste desenvolvimento diz respeito ao fato da “cod-i…cação” ser determinada unicamente pela matriz A. Desta maneira, diferentes realizaçõesirão codi…car diferentemente as entradas e, portanto, teremos diferentes espaços de estadoX. Portanto, o espaço de estados não é uma parte intrínseca ao comportamento obser-vado do sistema. Ele é apenas uma construção matemática para prover uma maneira de“lembrar” os estímulos numa forma conveniente para gerar as respostas correspondentes.A coisa …ca mais interessante ainda se examinarmos pictorialmente a estrutura da realiza-ção canônica desenvolvida em nosso estudo, mostrada na …gura 1.

Figure 1: As inúmeras conexões paralelas da realização em estados internos.

Nesta …gura, os blocos representados por bij e cij representam, respectivamente, os el-ementos das matrizes B e C, e os blocos representados por (zI ¡ Ai)

¡1 consistem emdecomposições de A na forma canônica de Jordan, ou seja:

A »= diag (A1; A2; :::; Aq)

Page 14: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

O que é mais digno de nota nesta …gura é o elevado grau de interconectividade entre osdiversos elementos constituintes do modelo, o que prova nossa tese.

Para …nalizar, vamos encarar a incômoda constatação de que o modelo construído parafundamentar nossas considerações no campo da cognição é linear, quando, na verdade,uma característica básica do cérebro é que ele é uma estrutura marcadamente complexa enão-linear.No nível da realização, a equivalência entre o comportamento B e o modelo canônico §f

não depende da linearidade da aplicação de entrada-saída f . A hipótese da linearidadepermite que o espaço de estados canônico possa ser descrito por meio de um dispositivomatemático bem simples, que são os polinômios, mas a equivalência em si poderia serestabelecida sob hipóteses mais fracas em f . Portanto, pelo menos neste nível, a questãoda linearidade acaba não sendo tão incômoda assim.No nível dinâmico, a constatação de que alguns fenômenos complexos podem ser descritospor sistemas determinísticos e relativamente simples como é o caso dos autômatos celu-lares e sistemas caóticos poderia ser animadora para, pelo menos em princípio, supor quepadrões complicados poderiam surgir de um emaranhado de blocos lineares ou quase lin-eares (em algum sentido). Apesar disso, nossa convicção a este respeito é que a dinâmicacerebral precisaria realmente ser descrita através de unidades não lineares. Portanto, nestenível não temos nenhuma desculpa.No nível da aproximação, podemos considerar nossa construção como sendo uma aprox-imação linear para um fenômeno de natureza não-linear. Aqui, temos duas saídas. Porum lado, um fato conhecido da teoria de sistemas lineares é que qualquer comportamentof razoavelmente suave pode ser aproximado por um processo bilinear com precisão arbi-trária. Daí, os mesmos problemas aqui endereçados poderiam ser abordados para o casode sistemas bilineares. Por outro lado, podemos complementar uma realização canônicalinear com um estudo de robustez da estabilidade do equilíbrio, uma vez que temos razõespara supor que a dinâmica dos modelos representativos das redes neurais é interessanteperto de equilíbrios. Por exemplo, podemos tentar explicar a correspondência do recon-hecimento de um determinado aspecto de uma …gura ambígua com a dinâmica perto deequilíbrios atratores; ou obter resultados de memorização de informações em organiza-ções sinápticas em sistemas perto de bifurcação de Hopf, quando o equilíbrio passa a serrepulsor e surge um ciclo limite atrator.

REFERÊNCIAS

[1] Casti,J.L.: Reality rules. Picturing the world in mathematics. Vol. II. John Wiley &Sons, 1992.[2] Fuhrmann,P.A.: A polynomial approach to linear algebra. Springer, 1996.

Page 15: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de
Page 16: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

REALIZAÇÃO CANÔNICA DA SEQÜÊNCIA DE FIBONACCI

Paulo Franca Bandel (IC)1 & Marcos Antonio Botelho

Labmat Laboratório de Matemática ExperimentalDepartamento de Matemática

Instituto Tecnológico de Aeronáutica12.228-900 São José dos Campos SP [email protected] [email protected]

RESUMO

Apresentamos aqui um procedimento de realização canônica que fornece umsistema linear de dimensão …nita em tempo discreto, invariante no tempo,cuja resposta é a seqüência de Fibonacci sempre que a entrada é a seqüênca1; 0; 0; 0; : : :. Este resultado pode ser interpretado como a construção de umaestrutura (máquina) capaz de gerar a seqüência de Fibonacci.

ABSTRACT

We present a procedure of canonical realization that yields a discrete time…nite-dimensional time invariant linear system whose output is the Fibonaccisequence whenever the input is the sequence 1; 0; 0; 0; : : :. This result can beinterpreted as the construction of a structure (machine) capable of generatingthe Fibonacci sequence.

Palavras-chave: Algoritmo de Ho; realização; seqüência de Fibonacci.

1 INTRODUÇÃO

Vamos supor que uma “caixa-preta”, representada por uma relação de entrada e saída

f : ­ ¡! ¡! 7¡! °

;

com ­ e ¡ sendo espaços vetoriais de dimensão …nita, é tal que a seqüência de es-tímulos (entrada) ! = f1; 0; 0; : : : ; 0g 2 ­ resulta na observação da resposta (saída)° = f1; 1; 2; 3; 5; 8; 13; : : :g 2 ¡, que é a seqüência de Fibonacci. Nosso problema con-siste em apresentar um modelo interno em termos de variáveis de estado descrito por umsistema linear, invariante no tempo, de dimensão …nita, em tempo discreto, de…nido poruma tripla fU; X; Y g de espaços vetoriais reais de dimensão …nita e uma tripla de matrizesfA; B; Cg satisfazendo

xn+1 = Axn +Bun

yn = Cxn(1)

0 Trabalho feito em iteração com o Departamento de Matemática e Física da Universidade de Taubaté.1 Bolsista do PIBIC/CNPq.

Page 17: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

e tal que explique, ou seja compatível, com a representação externa dada pela relação deentrada e saída f , ou seja, que (yn) seja a seqüência de Fibonacci sempre que (un) sejaa seqüência dada por uo = 1 e un = 0 ; para n ¸ 1. Representações internas deste tiposão chamadas de realizações em espaço de estados e os espaços U; X e Y são chamados deespaço de entradas, espaço de estados e espaço de saídas, respectivamente.

2 A SEQÜÊNCIA DE FIBONACCI

Em 1202, Leonardo Fibonacci (…lius Bonacci), também conhecido como Leonardo de Pisa,escreveu seu famoso livro, o Liber Abaci (Livro do Ábaco), obra modelo por mais de umséculo e principal meio de introdução do sistema indo-arábico em toda a Europa cristãculta. Um dos mais famosos enigmas deste livro é o chamado ‘problema dos coelhos’,que pode ser assim enunciado: Suponhamos que no mês de janeiro de um certo ano hajaum casal de coelhos, que gere um segundo casal no mês de fevereiro do mesmo ano. Umcasal de coelhos torna-se produtivo após dois meses de vida e, a partir deste momento,produz um novo casa a cada mês. Supondo que não haja mortes, quantos casais de coelhosteremos no …m de dezembro do mesmo ano?Podemos visualizar o enigma construindo a tabela abaixo, respeitando o seguinte código:A representa o número de casais que procriam no início do mês em questão.B, o número de casais que não procriam no início do mês em questão.C, o número de casais que nascem durante o mês em questão.D, o número de casais ao término do mês em questão.

MÊS A B C D

Janeiro 0 1 0 1Fevereiro 1 0 1 2Março 1 1 1 3Abril 2 1 2 5Maio 3 2 3 8Junho 5 3 5 13Julho 8 5 8 21Agosto 13 8 13 34Setembro 21 13 21 55Outubro 34 21 34 89Novembro 55 34 55 144Dezembro 89 55 89 233

Cada uma das colunas A, B, C e D, lidas seqüencialmente, dá origem à chamada seqüênciade Fibonacci, que é caracterizada pelo fato de que cada um de seus termos, após os doisprimeiros, ser a soma dos dois termos anteriores. Esta seqüência aparece em vários outroscontextos no mundo natural e apresenta várias propriedades interessantes. Para apresentaralgumas delas, consideremos a seqüência expressa através da seguinte equação:

®n = ®n¡1 + ®n¡2; n = 3; 4; 5; :::; ®1 = ®2 = 1 (2)

P1. Temos que

limn!1

®n

®n¡1=

p5 + 1

2

Page 18: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

ou, equivalentemente;

limn!1

®n

®n+1=

p5¡ 12

Esta razão (“razão áurea ”) está presente na natureza e nos estudos de geometria: seconstruirmos, a partir de qualquer retângulo, um quadrado “sobre ” o lado maior doprimeiro retângulo, se construirmos posteriormente um segundo quadrado a partirdo lado maior do novo retângulo (obtendo um terceiro retângulo), e se repetirmosin…nitamente este procedimento, veri…ca-se que a razão entre os lados do retângulotendem à razão áurea.

P2. ®1 + ®2 + ®3 + :::+ ®n = ®n+2 ¡ 1P3. ®2 + ®4 + ®6 + :::+ ®2n = ®2n+1 ¡ 1P4. ®1 + ®3 + ®5 + :::+ ®2n¡1 = ®2n

P5. ®21 + ®2

2 + ®23 + :::+ ®2

n = ®n:®n+1

P6. Se i e j são naturais, ®i é fator de ®ij :

P7. Se n é divisível por 5, então an é divisível por 5.

P8. Os números de Fibonacci dão origem a determinantes de valor zero. Este fato ocorredevido à peculiar lei de recorrência da seqüência, recordando que se a soma deduas colunas adjacentes é igual aos termos correspondentes da coluna seguinte, odeterminante da matriz é zero. Por exemplo,

det

24 3 5 813 21 3455 89 144

35 = 0 e det

26641 2 3 58 13 21 3455 89 144 233377 610 987 1597

3775 = 03 O ALGORITMO DE REALIZAÇÃO DE HO

Dado um padrão de entrada e saída B = f(un; yn+1) ; n = 0; 1; 2; : : :g expresso por umarelação f , representações internas como (1) fazem parte da teoria básica de sistemas lin-eares, caracterizadas através do conceito de modelo canônico. A questão é que um númeroin…nito de modelos § = (X; A; B; C) podem satisfazer os requisitos para ser uma repre-sentação interna que reproduza o padrão dado. Um modelo canônico seria a representaçãoótima, em algum sentido determinado, obtida por meio de um critério que permita sele-cionar um modelo interno que seja compacto no sentido do princípio da navalha de Occam,ou seja, cujo espaço de estados não contenha elementos irrelevantes para a reprodução dopadrão de entrada e saída. Assim, este modelo ótimo, ou canônico, seria aquele tal que:(1) a entrada ! transfere o estado inicial do sistema, xo, para qualquer estado dado x 2 Xdepois de algum tempo; e (2) qualquer estado inicial pode ser reconhecido univocamentea partir do conhecimento da seqüência de entrada (un) e da observação yn durante umintervalo de tempo 0 < n · T . Dizemos que um sistema que satisfaz os critérios (1) e(2) é completamente alcançável e completamente obserável, respectivamente. A teoriade realização fornece a caracterização matemática precisa destes critérios, assim como aexistência e unicidade do modelo ótimo na forma do seguinte teorema de realização: Dadoum padrão de entrada e saída B = f(un; yn+1) ; n = 0; 1; 2; : : :g; de…nido por uma funçãode entrada e saída f : ­ ! ¡, sempre existe um modelo canônico § = (X; A; B; C) que re-produza este padrão. Além disto, o modelo é único, no sentido de que todas as realizaçõescanônicas são isomór…cas.

Page 19: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

Estes são resultados clássicos da teoria de sistemas lineares de dimensão …nita (cf., porexemplo, Furhmann[1]). Em 1966, Ho-Kalman[2] apresentaram um algoritmo que per-mite construir esta realização canônica através do seguinte procedimento. Inicialmente,representemos a seqüência in…nita B na forma de Hankel:

H =

26664P1 P2 P3 P4 :::P2 P3 P4 P5 :::P3 P4 P5 P6 :::...

......

.... . .

37775Neste caso, Hij = Pi+j¡1. Será assumido que a forma in…nita H possui um posto n(…nito); isso signi…ca que todas as submatrizes r £ r de H possuem determinante igual azero para r > n. A partir desta suposição, é possível inferir que existe r < 1 tal que

Pr+j¡1 = ¡rX

i=1

¯i:Pi+j ;

sendo ¯i 2 R; 1 · i · r: Existem, portanto, matrizes S e T tais que

S HT =

·In 00 0

¸;

onde In representa a matriz identidade de ordem n. Utilizando-se as matrizes S e T , épossível obter uma realização canônica de B, conforme o algoritmo seguinte:Supondo que a matriz H possua posto …nito n, uma realização canônica da seqüênciaB = fP1; P2; P3; :::g é dada pelo sistema § = (X; A; B; C) onde o espaço de estados Xpossui dimensão n e

A = LnS ¾H T Un; B = LnSHUm; C = LpHT Un

As matrizes ¾H; Ln e Um representam, respectivamente, a matriz H deslocada para aesquerda (ou seja, deslocando todas as colunas uma posição à esquerda), a matriz quetoma apenas as primeiras n linhas e, por …m, a matriz que toma apenas as primeiras mcolunas.

4 REALIZAÇÃO DA SEQÜÊNCIA DE FIBONACCI

Vamos aplicar o algoritmo de Ho no caso que B = f(un; yn+1) ; n = 0; 1; 2; : : :g; ondeuo = 1 e un = 0, n ¸ 1, e (yn) é a seqüência de Fibonacci. Notando que as entradas esaídas são escalares, tem-se que qualquer sistema linear que satisfaça este comportamentode entrada e saída corresponde a um sistema com m = p = 1, i.e., um “sistema de simplesentrada e simples saída ”. Observando o modelo dinâmico

xn+1 = Axn +Bun ; n ¸ 0yn = Cxn ; n ¸ 1

; xo¢=

·00

¸com un 2 R e xn 2 R2 dados respectivamente por

un =

½1 ; se n = 00 ; se n ¸ 1

e xn¢=

·®n

®n+1

¸; n ¸ 1

e as matrizes A; B e C dsão adas por

A =

·0 11 1

¸; B =

·11

¸; C =

£1 0

¤

Page 20: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

A relaçãoPi = yi = CAi¡1B

está perfeitamente satisfeita, enquanto que ambas as matrizes de alcançabilidade e observ-abilidade, dadas respectivamente por

D = [B j AB] =

·1 11 2

¸e © =

·C

CA

¸=

·1 00 1

¸possuem posto = 2 = n = dimX. Estas condições garantem que o sistema § =(X; A; B; C) constitui um modelo canônico para a seqüência de Fibonacci. Neste con-texto, a seqüência B dá origem à seguinte matriz na forma de Hankel:

H =

266641 1 2 3 5 8 :::1 2 3 5 8 13 :::2 3 5 8 13 21 :::...

......

37775Recordando da relação de recorrência (2) da seqüência de Fibonacci, nota-se que uma col-una é determinada pela soma das duas colunas precedentes; assim, veri…ca-se a suposiçãode …nitude no posto de H, ou seja, posto de H = n = 2. Desta forma, devemos …xarnossas atenções na submatriz de H de ordem 2£ 2 dada por:

H2 =

·1 11 2

¸Assim, devemos encontrar matrizes S e T que “reduzam ” H2 à sua forma canônica, ouseja,

SH2T =

·1 00 1

¸Podemos constatar com facilidade que as matrizes

S = H¡12 =

·2 ¡1

¡1 1

¸e

T = I2 =

·1 00 1

¸satisfazem tal relação. Além disso, a matriz deslocada para direita ¾H é dada por:

¾(H2) =

·1 22 3

¸:

Aplicando, portanto, as relações indicadas pelo algoritmo de Ho:

A = L2S ¾(H2)T U2 = L2(H¡12 ) ¾(H2)(I2)U

2

de onde segue que

A =

·0 11 1

¸Também,

B = L2SH2U1 = L2H¡12 H2U1

fornecendo

B =

·10

¸

Page 21: MEMORIZAÇÃO DE INFORMAÇÕES DE FASEMEMORIZAÇÃO DE INFORMAÇÕES DE FASE EM OSCILADORES NEURAIS Leandro Linhares Rodrigues (IC)1 & Marcos Antonio Botelho Labmat Laboratório de

eC = L1H2T U2 = L1H2I2U2

o que resultaC =

£1 1

¤Com muita facilidade, é possível inferir que o sistema:

xn+1 =

·0 11 1

¸xn +

·10

¸un ; xo =

·00

¸yn =

£1 1

¤xn

produz de fato a seqüência de Fibonacci como sua saída, utilizando a entrada-padrãou0 = 1; ut = 0; t > 0. Simples cálculos também conduzem à conclusão de que o sistema§ = (X; A; B; C) é completamente observável e alcançável, ou seja, é um sistema canônicopara a seqüência de Fibonacci.

REFERÊNCIAS

[1] Fuhrmann, P.A.: A Polynomial Approach to Linear Algebra. Springer, 1996.[2] Ho, B.L. & Kalman, R.E.: E¤ective Construction of Linear State-variable Models fromINput/Output Functions. Regelungstech, 14 (1966), 545-548.[3] Casti,J.L.: Reality rules. Picturing the world in mathematics. Vol. II. John Wiley &Sons, 1992.