técnicas de identificação aplicadas à modelagem de um

Laboratorio de Modelagem, Analise e Controle de Sistemas Nao-Lineares

Departamento de Engenharia Eletronica

Universidade Federal de Minas Gerais

Av. Antonio Carlos 6627, 31270-901 Belo Horizonte, MG Brasil

Fone: +55 3409-4862 - Fax: +55 3409-4850

[email protected]

Tecnicas de Identificacao Aplicadas a

Modelagem de um Pendulo Duplo Caotico

Carlos Renato Magalhaes Duarte

Dissertacao submetida a banca examinadora

designada pelo Colegiado do Programa de Pos-

Graduacao em Engenharia Eletrica da Universidade

Federal de Minas Gerais, como parte dos requisitos

necessarios a obtencao do grau de Mestre em

Engenharia Eletrica.

Orientadores: Dr. Eduardo Mazoni Andrade Marcal Mendes

Dr. Leonardo Antonio Borges Torres

Belo Horizonte, 23 de setembro de 2009

Dedicatoria

Dedico este trabalho a minha famılia

e a todos aqueles que estiveram

comigo nesta caminhada.

iii

Agradecimentos

Agradeco a Deus, pela infinita bondade e amor.

Aos professores Eduardo Mazoni e Leonardo Torres, pela orientacao,

dedicacao e, acima de tudo, pela amizade.

A Marcela, pelo amor e dedicacao.

A minha famılia, pelo amor e os ensinamentos que me permitiram

chegar ate aqui.

Ao Sr. Marcelo e a Sra. Silvania, pelo apoio incondicional.

A Rose, pela acolhida.

Ao professor Marcelo Correa, pela ajuda com as rotinas para obtencao

de modelos racionais.

Ao Davidson Firmo, pela ajuda com os dados e entendimento do mo-

delo matematico do pendulo duplo.

Aos demais professores que contribuıram para a minha formacao du-

rante o mestrado.

A todos os meus amigos que estiveram comigo durante esta longa e

difıcil caminhada.

Ao apoio financeiro da Coordenacao de Aperfeicoamento de Pessoal de

Nıvel Superior (CAPES), o qual foi de vital importancia para a realizacao

deste trabalho.

Ao ensino publico e gratuito.

v

Epıgrafe

“A grandeza nao consiste

em receber honras,

mas em merece-las.”

Aristoteles

vii

Resumo

Neste trabalho, sao apresentados modelos identificados a partir dos dadosde um pendulo duplo que apresenta comportamento caotico. Tais mo-delos sao obtidos aplicando-se tecnicas de identificacao de sistemas e tresdiferentes tipos de representacoes nao -lineares: NARMAX (Nonlinear Au-toRegressive Moving Average models with eXogeneous inputs) polinomial,NARMAX racional e fuzzy NARX Takagi-Sugeno. A partir de uma buscaexaustiva por modelos dinamicamente validos, empregando-se as estrutu-ras anteriormente citadas, e mostrado que, ao se utilizar o mesmo criteriode validacao, os modelos fuzzy NARX Takagi-Sugeno apresentam melhordesempenho que os demais. Acredita-se que tal eficiencia seja atribuıda asua capacidade de representar as diversas nao -linearidades apresentadaspelo pendulo por meio de modelos locais, o que nao acontece para as ou-tras representacoes, consideradas globais. O processo de validacao se deupor meio da comparacao do maior expoente de Lyapunov e da dimensaofractal, calculados para os dados reais e para os dados provenientes dosmodelos identificados. Tambem foram comparadas as projecoes tridimen-sionais dos atratores reconstruıdos.

ix

Abstract

In this work models are identified directly from data generated by a dou-ble pendulum with chaotic dynamics. Such models are obtained by ap-plying system identification techniques considering three different typesof nonlinear representations: NARMAX (Nonlinear AutoRegressive Mo-ving Average models with eXogeneous inputs) polynomial models, NAR-MAX rational models and Takagi-Sugeno NARX fuzzy models. From anexhaustive search for dynamically valid models using the aforementionedstructures, it is suggested that the Takagi-Sugeno NARX fuzzy modelsperform better than the other models according to the same validationmeasure. The reason for that is that these models can represent variousnonlinearities using local linear models. This is not the case for the otherrepresentations since they are part of so-called global models. The modelsare validated by comparing the largest Lyapunov exponent and fractaldimension calculated from the actual data and from data generated fromthe identified models. Three-dimensional projections of the attractors arealso compared.

xi

Sumario

Resumo ix

Abstract xi

Lista de Tabelas xvii

Lista de Figuras xix

Lista de Sımbolos xxiii

Lista de Acronimos xxvii

1 Introducao 1

1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Estrutura da Dissertacao . . . . . . . . . . . . . . . . . . . 5

2 O Pendulo Duplo 7

2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Apresentacao da Plataforma . . . . . . . . . . . . . . . . . 8

2.2.1 O Sistema de Suporte . . . . . . . . . . . . . . . . 9

2.2.2 O Pendulo Duplo . . . . . . . . . . . . . . . . . . . 9

xiii

xiv

2.2.3 Os Sensores . . . . . . . . . . . . . . . . . . . . . . 10

2.2.4 O Sistema de Acionamento . . . . . . . . . . . . . . 13

2.2.5 O Sistema de Comando . . . . . . . . . . . . . . . 15

2.2.6 Funcionamento da Plataforma . . . . . . . . . . . . 15

2.3 Modelo Matematico do Pendulo Duplo Eletromecanico . . 16

2.4 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . 23

3 Tecnicas de Identificacao de Sistemas Dinamicos 25

3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

3.2 Etapas de Identificacao de Sistemas . . . . . . . . . . . . . 26

3.2.1 Testes Dinamicos e Coleta de Dados . . . . . . . . 26

3.2.2 Escolha da Representacao Matematica . . . . . . . 27

3.2.3 Selecao da Estrutura do Modelo . . . . . . . . . . . 28

3.2.4 Estimacao dos Parametros do Modelo . . . . . . . . 29

3.2.5 Validacao do Modelo . . . . . . . . . . . . . . . . . 29

3.3 Modelo NARMAX Polinomial . . . . . . . . . . . . . . . . 30

3.4 Modelo NARMAX Racional . . . . . . . . . . . . . . . . . 33

3.5 Modelos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . 35

3.5.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . 35

3.5.2 Modelos Fuzzy Takagi -Sugeno . . . . . . . . . . . . 37

3.5.3 Algoritmo de Identificacao . . . . . . . . . . . . . . 39


4 Caracterizacao Dinamica 45

4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2 Amostragem dos Dados . . . . . . . . . . . . . . . . . . . . 45

4.3 Analise de Estacionariedade dos Dados . . . . . . . . . . . 46

4.4 Caos Determinıstico . . . . . . . . . . . . . . . . . . . . . 50

xv

4.5 Reconstrucao do Espaco de Estados . . . . . . . . . . . . . 51

4.5.1 O Metodo da Informacao Mutua . . . . . . . . . . 52

4.5.2 O Metodo dos Falsos Vizinhos . . . . . . . . . . . . 54

4.5.3 Reconstrucao do Atrator do Pendulo Duplo . . . . 56

4.6 Expoentes de Lyapunov . . . . . . . . . . . . . . . . . . . 57

4.6.1 Expoentes de Lyapunov a Partir de Series Temporais 59

4.7 Dimensao Fractal . . . . . . . . . . . . . . . . . . . . . . . 63

4.7.1 O Metodo de Grassberger-Procaccia . . . . . . . . 64


5 Resultados e Discussoes 67

5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.2 Modelos NARMAX Polinomiais . . . . . . . . . . . . . . . 68

5.2.1 Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . 68

5.2.2 Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . 71

5.3 Modelos NARMAX Racionais . . . . . . . . . . . . . . . . 74

5.3.1 Modelo 3 . . . . . . . . . . . . . . . . . . . . . . . 75

5.3.2 Modelo 4 . . . . . . . . . . . . . . . . . . . . . . . 77

5.4 Modelos Fuzzy NARX Takagi-Sugeno . . . . . . . . . . . . 80

5.4.1 Modelo 5 . . . . . . . . . . . . . . . . . . . . . . . 81

5.4.2 Modelo 6 . . . . . . . . . . . . . . . . . . . . . . . 88

5.5 Validacao dos Modelos . . . . . . . . . . . . . . . . . . . . 99

5.5.1 Modelos NARMAX Polinomiais . . . . . . . . . . . 99

5.5.2 Modelos NARMAX Racionais . . . . . . . . . . . . 101

5.5.3 Modelos Fuzzy NARX TS . . . . . . . . . . . . . . 102


xvi

6 Conclusoes 105

6.1 Propostas para Trabalhos Futuros . . . . . . . . . . . . . . 107

Referencias Bibliograficas 109

A Rotinas Computacionais 119

A.1 fmclust . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

A.2 fmsim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

A.3 fmstruct . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

A.4 plotmfs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

A.5 fm2tex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

A.6 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

Lista de Tabelas

2.1 Logica de acionamento do motor em funcao das chaves . . 14

2.2 Logica do sistema de comando . . . . . . . . . . . . . . . . 15

2.3 Parametros utilizados no modelo final . . . . . . . . . . . . 20

2.4 Parametros utilizados na obtencao experimental da serie

temporal θ1 . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4.1 Valores estimados para o maior expoente de Lyapunov a

partir da serie temporal θ1 do pendulo . . . . . . . . . . . 63

5.1 Valores obtidos para os centros dos agrupamentos fuzzy uti-

lizados na obtencao do modelo 5 . . . . . . . . . . . . . . . 83

5.2 Valores obtidos para os centros dos agrupamentos fuzzy uti-

lizados na obtencao do modelo 6 . . . . . . . . . . . . . . . 92

5.3 Invariantes dinamicos calculados para os modelos

identificados e dados reais. . . . . . . . . . . . . . . . . . . 100

xvii

Lista de Figuras

2.1 Vista isometrica da plataforma (Firmo, 2007) . . . . . . . 8

2.2 Representacao do sistema de suporte da plataforma . . . . 9

2.3 Representacao do pendulo duplo . . . . . . . . . . . . . . . 10

2.4 Representacao do sensor S2 da plataforma . . . . . . . . . 11

2.5 Representacao da plataforma desenvolvida - perfil . . . . . 12

2.6 Circuito equivalente do motor CC da plataforma . . . . . . 13

2.7 Esquema de funcionamento da ponte H . . . . . . . . . . . 14

2.8 Diagrama de funcionamento da plataforma . . . . . . . . . 16

2.9 Serie temporal relativa a variavel de estado θ1 do sistema real 22

3.1 Grafico de uma funcao de pertinencia gaussiana . . . . . . 36

3.2 Estrutura basica de um mecanismo de inferencia fuzzy . . 37

3.3 Representacao de um agrupamento fuzzy . . . . . . . . . . 41

4.1 Funcoes de autocovariancia linear e nao -linear . . . . . . . 46

4.2 Funcoes de autocovariancia linear e nao -linear para uma

taxa de decimacao ∆ = 60 . . . . . . . . . . . . . . . . . . 47

4.3 Grafico com a media de cada janela ao longo dos dados . . 47

4.4 Graficos de recorrencia . . . . . . . . . . . . . . . . . . . . 49

4.5 Grafico de recorrencia da serie temporal do pendulo duplo 50

4.6 Grafico de I(τ) obtido a partir da serie temporal θ1 do pendulo 54

xix

xx

4.7 Grafico de aplicacao do metodo de falsos vizinhos a serie

temporal θ1 do pendulo . . . . . . . . . . . . . . . . . . . . 56

4.8 Projecao tridimensional do atrator reconstruıdo a partir dos

dados reais . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.9 Ilustracao da deformacao de uma hiperesfera num objeto

hiperelipsoidal . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.10 Grafico de S(k) obtido por meio da aplicacao do metodo de

Kantz (1994) a serie temporal θ1 do pendulo . . . . . . . . 61

4.11 Grafico de S(k) obtido por meio da aplicacao do metodo de

Rosenstein et al. (1993) a serie temporal θ1 do pendulo . . 62

4.12 Grafico de D2(ǫ, d) por ǫ obtido para o atrator reconstruıdo

a partir da serie temporal θ1 do pendulo . . . . . . . . . . 66

5.1 Grafico da massa de dados utilizada para se estimar o mo-

delo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.2 Grafico de um trecho da serie temporal produzida pelo mo-

delo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5.3 Visao bidimensional da projecao tridimensional do atrator

reconstruıdo a partir da serie temporal gerada pelo modelo 1 71


delo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.5 Grafico da serie temporal produzida pelo modelo 2 . . . . 73




delo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76


xxi




delo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79




5.13 Funcoes de pertinencia referentes ao modelo 5 . . . . . . . 87


delo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87


delo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88



5.17 Funcoes de pertinencia referentes ao modelo 6 . . . . . . . 97


delo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98


delo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98



Lista de Sımbolos

N numero de observacoes em um conjunto de dados;

E[·] esperanca matematica;

F [·] funcao polinomial;

de dimensao de imersao;

dA dimensao de Hausdorff;

G(·) funcao de torque;

V (·) funcao de excitacao;

I(·) informacao mutua;

θ posicao angular;

θ velocidade angular;

θ aceleracao angular;

γ angulo;

τ atraso de tempo;

τd tempo morto;

θ vetor de parametros estimado;

R conjunto dos numeros reais;

N conjunto dos numeros naturais;

Ra resistencia do enrolamento de armadura;

Rc resistencia do enrolamento de campo;

xxiii

xxiv

La indutancia do enrolamento de armadura;

Lc indutancia do enrolamento de campo;

Vc tensao aplicada aos terminais do enrolamento de campo;

ia corrente do enrolamento de armadura;

ic corrente do enrolamento de campo;

u(k) sinal de entrada no instante k;

y(k) sinal de saıda no instante k;

e(k) sinal de ruıdo no instante k;

kv constante de velocidade;

| · | modulo;

ruu(τ) funcao de autocorrelacao de u(k) no atraso τ ;

ruy(τ) funcao de correlacao cruzada de u(k) e y(k) no atraso τ ;

ry(τ) funcao de autocovariancia linear de y(k) no atraso τ ;

ry2

′ (τ) funcao de autocovariancia nao -linear de y(k) no atraso τ ;

y(k) media temporal de y(k);

ℓ grau de nao -linearidade;

X matriz de regressores de entrada;

y vetor de regressores de saıda;

nu maximo atraso entre os regressores de entrada;

ny maximo atraso entre os regressores de saıda;

ne maximo atraso entre os regressores de ruıdo;

σ2e variancia do sinal e(k);

ψ(k − 1) vetor de regressores que contem observacoes ate o instante k − 1;

∆ taxa de decimacao;

µA(x) funcao de pertinencia. Indica com que grau o elemento x pertence

ao conjunto A;

U ,X ,Y universos de discurso (domınios);

Ri regra do tipo Se-entao;

r numero de regras;

xxv

x vetor de variaveis premissas;

wi(x) grau de ativacao do antecedente da regra Ri;

ǫ raio da vizinhanca (threshold);

‖ · ‖ representa uma norma (norma-1, Euclidiana ou norma-∞);

Θ( · ) funcao de Heaviside;

λi expoente de Lyapunov;

D0 dimensao de contagem de caixas;

D1 dimensao de informacao;

D2 dimensao de correlacao.

Lista de Acronimos

ARX modelo autorregressivo com entradas exogenas

(autoregressive model with exogenous inputs);

EMQ estendido de mınimos quadrados;

ERR taxa de reducao de erro (error reduction ratio);

FP funcao de pertinencia;

GK Gustafson e Kessel;

MACSIN grupo de pesquisa que se dedica a modelagem, analise e

controle de sistemas nao -lineares;

MIMO multientradas, multisaıdas (multi-input, multi-output);

MISO multientradas e uma saıda (multi-input, single-output);

MQ mınimos quadrados;

MQP mınimos quadrados ponderados;

NARMAX modelo nao -linear autorregressivo, de media movel com

entradas exogenas (nonlinear autoregressive moving

average model with exogenous inputs);

NARX modelo nao -linear autorregressivo com entradas

exogenas (nonlinear autoregressive model with

exogenous inputs);

xxvii

xxviii

PRBS sinal binario pseudo-aleatorio (pseudo-random binary

signal);

TISEAN pacote computacional (time series analysis);

TS Takagi-Sugeno.

Capıtulo 1

Introducao

“O que vale na vida nao e o ponto de partida e sim a

caminhada. Caminhando e semeando, no fim teras o

que colher.”

Cora Coralina

1.1 Introducao

Desde a antiguidade, o homem tem procurado descrever matematicamente

sistemas reais para ajuda-lo a entende-los e assim resolver problemas re-

lacionados a eles (Aguirre, 2007). Desta forma, surgiu a modelagem ma-

tematica, area do conhecimento que estuda maneiras de desenvolver e im-

plementar modelos matematicos de sistemas reais.

Uma das formas de se obter modelos matematicos e a modelagem

caixa-branca ou modelagem fenomenologica. Essa tecnica se baseia nas

informacoes sobre o sistema a ser modelado e nas leis fısicas que descrevem

os fenomenos envolvidos.

Identificacao de sistemas ou modelagem caixa-preta e uma forma al-

ternativa de se obter modelos a partir de observacoes, ou seja, de dados

coletados diretamente dos sistemas.

A modelagem caixa-cinza, tambem conhecida como identificacao caixa-

cinza, busca combinar os procedimentos de identificacao caixa-preta e

caixa-branca. Nesse caso, tanto os dados de entrada e saıda obtidos no

sistema quanto informacoes auxiliares sao usados na identificacao (Correa

e Aguirre, 2004).

2 1 Introducao

Metodos de identificacao sao aplicados a sistemas lineares e nao -

lineares, conforme estudos de casos encontrados em Aguirre (2007). Di-

versas representacoes nao -lineares tem sido empregadas com o intuito de

se obter modelos. Entre elas, destacam-se as series de Volterra (Vol-

terra, 1930), os modelos NARMAX (nonlinear autoregressive moving mo-

del with exogenous variables) polinomiais e racionais (Leontaritis e Bil-

lings, 1985a,b; Billings e Chen, 1989; Billings e Zhu, 1991; Zhu e Billings,

1991, 1993; Correa, 1997, 2001; Campos, 2007), modelos de blocos in-

terconectados (Wiener, 1958; Narendra e Gallman, 1966; Wigren, 1993;

Patwardhan et al., 1998; Pearson e Pottmann, 2000; Coelho, 2002), redes

neurais artificiais (Elsner, 1992; Henrique et al., 1998; Braga et al., 2000;

Amaral, 2001; Haykin, 2001), wavelets (Graps, 1995; Billings e Coca, 1999;

Correa, 2001) e modelos fuzzy (Zadeh, 1973; Mamdani, 1977; Takagi e Su-

geno, 1985; Babusca et al., 1998; Campello e Amaral, 1999, 2001). Varias

tecnicas de selecao de estrutura e estimacao de parametros foram desenvol-

vidas para essas representacoes (Akaike, 1974; Billings et al., 1989; Aguirre

e Billings, 1995; Aguirre e Mendes, 1996). Tais representacoes sao utili-

zadas, inclusive, na identificacao de sistemas caoticos (Rodrigues, 1996;

Correa, 1997).

Dinamica caotica pode ser definida como um comportamento estacio-

nario que nao pode ser classificado como um equilıbrio, nao e periodico e

nem quasi-periodico (Chua e Parker, 1989). Em um sistema que apresenta

tal comportamento, as trajetorias sao limitadas a uma regiao no espaco

de fases, porem nao convergem, nao divergem, nao sao periodicas e, so-

bretudo, nao se cruzam. E considerado um sistema determinıstico que

apresenta pouca previsibilidade e possui comportamento aparentemente

estocastico.

Para que um sistema contınuo dissipativo apresente comportamento

caotico, e necessario que ele seja nao-linear e, pelo menos, tridimensional

(Monteiro, 2006). O caos determinıstico se deve a dependencia sensitiva

as condicoes iniciais (Fiedler-Ferrara e Prado, 1994).

O trabalho apresentado por Lorenz (1963), no qual e relatada a sensibi-

lidade as condicoes iniciais apresentadas por certos sistemas nao -lineares,

e considerado um marco historico no estudo de sistemas dinamicos caoti-

cos.

Apesar de relativamente recente, a ciencia dos sistemas dinamicos cao-

ticos evoluiu muito desde o primeiro trabalho publicado por Lorenz. Me-

1.2 Motivacao 3

todos de analise, identificacao e sıntese de sistemas caoticos sao desenvol-

vidos em varias frentes de pesquisa pelo mundo. O artigo de Andrievskii

e Fradkov (2004) relata uma grande variedade de aplicacoes de sistemas

caoticos em diversas areas da ciencia.

Neste trabalho, pretende-se obter modelos utilizando as tecnicas de

identificacao de sistemas, a partir de dados coletados de um sistema fısico

construıdo por Firmo (2007). Tal sistema constitui-se de um pendulo

duplo que apresenta comportamento caotico. Esse sistema foi concebido

com finalidades de pesquisa e didaticas. Alem desse sistema, podem ser

encontradas na literatura outras demonstracoes de comportamento caotico

em pendulos duplos, tais como os trabalhos de Shinbrot et al. (1992),

Levien e Tan (1993), Skeldon (1994) e Stachowiak e Okada (2006).

Para se obter os modelos propostos, serao utilizadas as representa-

coes NARMAX polinomiais e racionais (Leontaritis e Billings, 1985a,b),

bem como a representacao fuzzy NARX Takagi-Sugeno (Takagi e Sugeno,

1985; Babusca et al., 1998). Tais representacoes sao capazes de reproduzir

uma grande variedade de regimes dinamicos nao -lineares, tais como bifur-

cacoes, bilinearidades, ciclos limites e, principalmente, caos (Rodrigues,

1996; Aguirre, 1997; Correa, 1997). Alem disso, a partir das representa-

coes NARMAX polinomiais e racionais, e possıvel se determinar os pontos

fixos1 de um sistema.

A caracterizacao dinamica dos modelos identificados sera obtida

baseando-se nas estimativas dos valores dos invariantes dinamicos. Tais

estimativas serao encontradas utilizando-se o pacote computacional TI-

SEAN (time series analysis), desenvolvido por Hegger et al. (1999). Alem

disso, para a validacao, serao comparadas projecoes tridimensionais dos

atratores reconstruıdos.

1.2 Motivacao

Acredita-se que os pendulos tenham sido os sistemas fısicos responsaveis

pelo nascimento da teoria de sistemas dinamicos (Monteiro, 2006). Desta

forma, analises de sistemas pendulares sao mencionadas como exemplos

classicos em livros didaticos que abordam sistemas dinamicos, tais como

1Pontos fixos ou pontos de equilıbrio de um modelo discreto autonomo sao definidoscomo aqueles pontos para os quais y(k) = y(k + i), i ∈ Z.

4 1 Introducao

Fiedler-Ferrara e Prado (1994) e Monteiro (2006).

O estudo de modelos matematicos de pendulos e aplicado a diferen-

tes sistemas fısicos (Firmo, 2007), sendo que avancos obtidos na analise

de seu modelo e de seu comportamento dinamico podem ajudar na re-

solucao de problemas relacionados a sistemas cujos modelos matematicos

sejam isomorficos aos modelos utilizados para sistemas pendulares (Smith

e Blackburn, 1989; Heng e Martienssen, 1992).

Diversos trabalhos publicados mostram a utilizacao de modelos pendu-

lares aplicados a resolucao de problemas relacionados a diferentes sistemas

fısicos, tais como o comportamento de navios sujeitos a oscilacoes forcadas

provocadas pelo movimento das ondas (Henry et al., 2001; Abdel-Rahman

e Nayfeh, 2003); a modelagem de um sistema composto por um helicoptero

transportando uma carga suspensa por um cabo (Cicolani et al., 2001) e,

particularmente em relacao aos pendulos duplos, podem-se citar trabalhos

que fazem a modelagem do comportamento de diferentes partes do corpo

humano durante o caminhar, utilizando um modelo baseado em pendulos

duplos equivalentes (Russi, 2002; Gutnik et al., 2005). Na area da robo-

tica, relata-se a utilizacao de modelos de pendulos duplos para o estudo

do comportamento de manipuladores (Berkemeier e Fearing, 1999).

Diversos sistemas pendulares foram modelados utilizando-se tecnicas

de modelagem caixa branca, que, infelizmente, demandam muito tempo e

conhecimento, sendo inviavel a sua aplicacao a determinados sistemas.

Uma tecnica alternativa aplicada a modelagem matematica e a

identificacao de sistemas. Uma de suas caracterısticas e que pouco ou

nenhum conhecimento previo do sistema e necessario, representando, as-

sim, uma importante ferramenta na obtencao de modelos. De acordo com

Aguirre (2007), a identificacao de sistemas se propoe a obter um modelo

matematico que explique, pelo menos em parte e de forma aproximada, a

relacao de causa e efeito presente nos dados. Desta forma, tais aspectos

motivam a utilizacao de tal tecnica em sistemas pendulares, haja vista a

importancia dos modelos no estudo de sistemas fısicos equivalentes.

1.3 Objetivos

O presente trabalho tem como objetivos:

• verificar a estacionaridade e a correta amostragem dos dados reais do

1.4 Estrutura da Dissertacao 5

pendulo duplo visando a identificacao e a caracterizacao dinamica;

• obter modelos que representem a dinamica caotica do pendulo

utilizando-se as tecnicas de identificacao de sistemas e as seguin-

tes representacoes nao -lineares: NARMAX polinomiais e racionais

e fuzzy NARX Takagi-Sugeno;

• caracterizar dinamicamente os dados reais do pendulo por meio dos

invariantes dinamicos, que, neste caso, sao o maior expoente de Lya-

punov e a dimensao fractal, e, em seguida, comparar os resultados

obtidos com os encontrados em Firmo (2007) a fim de validar os

algoritmos utilizados;

• validar os modelos identificados baseando-se nas estimativas dos va-

lores dos invariantes dinamicos e comparar as projecoes tridimensi-

onais dos atratores reconstruıdos.

1.4 Estrutura da Dissertacao

A dissertacao esta organizada como se segue: no Capıtulo 2, e apresentado

o pendulo duplo, juntamente com o modelo matematico que o representa.

Alem disso, e apresentada a sua serie temporal real.

Tecnicas de identificacao de sistemas, representacoes a serem utilizadas

e conceitos uteis na obtencao dos modelos para o pendulo sao revisados

no Capıtulo 3.

No Capıtulo 4, sao revisados os metodos utilizados na caracterizacao

dinamica do pendulo duplo e na validacao dos modelos.

Os modelos identificados, suas series temporais, seus atratores recons-

truıdos e seus invariantes dinamicos calculados sao mostrados no Capı-

tulo 5. Discussoes sobre os resultados tambem podem ser encontradas no

mesmo.

No Capıtulo 6, sao apresentados alguns comentarios conclusivos e su-

gestoes para trabalhos futuros.

Finalmente, no Anexo A, encontram-se as rotinas computacionais uti-

lizadas na identificacao dos modelos fuzzy Takagi-Sugeno.

Capıtulo 2

O Pendulo Duplo

“Comece fazendo o que e necessario, depois o que e pos-

sıvel, e de repente voce estara fazendo o impossıvel.”

Sao Francisco de Assis

2.1 Introducao

Neste capıtulo, e apresentado um sistema dinamico a partir do

qual pretende-se obter modelos matematicos utilizando-se tecnicas de

identificacao de sistemas, bem como suas equacoes, informacoes a res-

peito de seu funcionamento e sua serie temporal experimental. O sistema

aqui descrito constitui-se de um pendulo duplo que apresenta comporta-

mento caotico e cuja construcao fısica e caracterizacao dinamica foram

apresentadas em Firmo (2007).

A construcao da plataforma na qual se encontra o pendulo foi baseada

nos trabalhos de Shinbrot et al. (1992) e Christini et al. (1996), sendo que,

no primeiro, o sistema nao possuıa entradas, ao passo que, no segundo, foi

contemplada uma fonte de excitacao externa, sendo essa completamente

diferente da excitacao utilizada na plataforma aqui apresentada. Alem

disso, ressalta-se que, em ambos os trabalhos, nao foi considerada a pre-

senca de nenhum tipo de atrito.

Conforme sera visto a seguir, a plataforma construıda, alem de apre-

sentar uma forma de excitacao desenvolvida de tal modo que o sistema se

tornasse autonomo, seu modelo considera o atrito presente no sistema.

8 2 O Pendulo Duplo

2.2 Apresentacao da Plataforma

A plataforma foi desenvolvida com o objetivo de ser utilizada no ensino de

dinamica nao -linear e caos e, por isso, tem como caracterısticas o baixo

custo e a simples construcao. Para um melhor entendimento do seu fun-

cionamento, serao apresentadas as suas partes principais1:

• o sistema de suporte;

• o pendulo duplo;

• os sensores;

• o sistema de acionamento;

• o sistema de comando.

A seguir, a Figura 2.1 apresenta uma vista isometrica da plataforma.

Figura 2.1: Vista isometrica da plataforma (Firmo, 2007).

A figura apresenta as partes principais da plataforma.

1Para maiores detalhes da plataforma, ver Firmo (2007).

2.2 Apresentacao da Plataforma 9

2.2.1 O Sistema de Suporte

O sistema de suporte, construıdo utilizando-se placas e cantoneiras de

alumınio, e responsavel por agrupar e manter a sustentacao das demais

partes do sistema. Esse suporte, que constitui a base mecanica da plata-

forma, e composto pelas seguintes partes: suportes SG e Sm, mancais do

eixo E2, eixo E2 e acoplamento ME. Verifica-se, a partir da Figura 2.2, a

representacao do sistema de suporte e os seus principais componentes.

Eixo E2Suporte SG

suporte Sm

Acoplamento ME Mancais do eixo E2

Figura 2.2: Representacao do sistema de suporte da plataforma (Firmo, 2007).

Representacao do sistema de suporte da plataforma e os seus prin-cipais componentes.

O suporte Sm tem por finalidade a sustentacao e a fixacao da fonte de

excitacao externa que, neste caso, e fornecida por um motor de corrente

contınua, responsavel pelo acionamento do pendulo duplo. Por sua vez, os

mancais do eixo E2 tem a funcao de oferecer a sustencao mecanica, com

baixo atrito, ao eixo E2, cujo papel e ligar o pendulo duplo ao eixo do

motor CC. A transmissao de torque entre o motor e o pendulo duplo e

realizada pelo acoplamento ME. O suporte SG tem a funcao de sustentar

as pecas citadas anteriormente.

2.2.2 O Pendulo Duplo

O pendulo duplo, cuja representacao e mostrada na Figura 2.3, e composto

por duas hastes, uma superior e uma inferior, denominadas, respectiva-

mente, barra 1 e barra 2. Essas barras sao interligadas por meio do eixo

E1. A haste externa pode girar livremente sobre seu eixo, enquanto que a

barra 1 depende do sistema de acionamento2 para girar.

2O sistema de acionamento e responsavel pelo torque fornecido a barra 1 por meiode um motor CC que esta acoplado a mesma por meio do eixo E2.

10 2 O Pendulo Duplo

A Figura 2.3 (b) apresenta a posicao de referencia (linha tracejada)

para o angulo das hastes, sendo que θ1 e θ2 representam as posicoes angu-

lares das barras 1 e 2 respectivamente. Ressalta-se que os angulos positivos

sao contabilizados no sentido anti-horario.

Barra 1

Barra 2

Eixo E1

Furos para fixacao do eixo E2

Rolamentos

(a) (b)

0

Figura 2.3: Representacao do pendulo duplo (Firmo, 2007).

Vistas em (a) perfil e (b) frontal do pendulo duplo. A linha trace-jada em (b) indica a referencia zero para o angulo das barras.

2.2.3 Os Sensores

A plataforma e provida de dois sensores responsaveis pelas informacoes

relacionadas a velocidade angular θ1 e a posicao θ1 da barra 1, indispensa-

veis ao seu funcionamento. O sensor S1 e formado por um pequeno motor

CC de ımas permanentes que funciona como gerador. O eixo do gerador

e acoplado diretamente ao eixo do motor CC do sistema de acionamento.


Consequentemente, o gerador e o motor giram a mesma velocidade da

barra 1 do pendulo duplo, ou seja, θ1.

O motor CC de ımas permanentes, utilizado como gerador, passa a

ter a velocidade angular θ1 como entrada e a tensao nos terminais da

armadura, em circuito aberto, como saıda. Desta forma, pode-se modelar

o sinal proveniente do sensor S1 como:

S1(θ1) = kfcem θ1, (2.1)

sendo que kfcem e a constante do gerador obtida a partir de ensaios.

O sensor S2 tem a funcao de informar se o angulo θ1 esta compreen-

dido entre um valor γ e a linha vertical. Um disco semi-aberto Ds e um

fotosensor compoem S2, conforme ilustrado na Figura 2.4.

disco semi-aberto fotosensor

0

(a) (b)

γ

Figura 2.4: Representacao do sensor S2 da plataforma (Firmo, 2007).

O sensor S2 e composto por (a) um disco semi-aberto e (b) umfotosensor.

O disco e feito em acrılico e e fixado no eixo de sustentacao E2. O foto-

sensor e composto por um diodo emissor de luz (LED) e um fototransistor,

cuja saturacao ou corte depende da luz emitida pelo LED e da posicao de

Ds, ou seja, do valor de θ1. De acordo com a posicao angular da barra 1,


modela-se o sinal de saıda do sensor da seguinte forma:

S2(θ1) =

0, se |θ1| ≥ γ;

1, se |θ1| < γ.(2.2)

As informacoes fornecidas pelos sensores S1 e S2 sao utilizadas na logica

de comando do motor CC, conforme sera apresentado na Secao 2.2.5. A

Figura 2.5 mostra a representacao da plataforma e as posicoes dos sensores

S1 e S2.

Motor CC

Sensor S2Sensor S1

Pendulo duplo

Figura 2.5: Representacao da plataforma desenvolvida - perfil (Firmo, 2007).

Plataforma desenvolvida e as posicoes de seus principais componen-tes.


2.2.4 O Sistema de Acionamento

O sistema de acionamento e composto por um motor CC e um circuito

de acionamento denominado ponte H. O motor e responsavel por produzir

o torque a ser aplicado ao pendulo duplo, produzindo o seu movimento.

Trata-se de um motor universal, utilizado em maquinas de costura, de 100

W e 110 V. Seus circuitos foram modificados a fim de se operar como um

motor de corrente contınua com excitacao independente, alimentado com

tensoes contınuas maximas de 32 V, aplicada aos terminais do enrolamento

da armadura, e 15 V, aplicada aos terminais do enrolamento de campo.

O circuito equivalente do motor modificado pode ser visualizado na

Figura 2.6, na qual constam os seguintes parametros: a resistencia de ar-

madura Ra, a resistencia de campo Rc, a indutancia de armadura La, a

indutancia de campo Lc, a corrente de campo ic, a constante de veloci-

dade kv e a tensao de campo Vc. Esses parametros sao mantidos constantes

durante o funcionamento da plataforma, com excecao da tensao de arma-

dura V (θ1, θ1), que esta em funcao da posicao e da velocidade da barra 1,

pois o acionamento do motor no sentido desejado, realizado pela ponte H,

depende de tais variaveis, conforme sera mostrado na Secao 2.2.5.

Conforme mencionado anteriormente, o circuito denominado ponte H

tem a funcao de acionar o motor CC no sentido desejado, cujo princıpio

reside na aplicacao da tensao V (θ1, θ1) com a polaridade correspondente

ao sentido de rotacao desejado. A Figura 2.7 apresenta o esquema eletrico

da ponte H.

Ra La

+

−

Rc

VcV (θ1, θ1) Lckv θ1

+

−

icia

Figura 2.6: Circuito equivalente do motor CC da plataforma (Firmo, 2007).

Circuitos de armadura (esquerda) e de excitacao de campo (direita).


+V

-V

C4

C2C1

C3

Motor CC

LaRa

Figura 2.7: Esquema de funcionamento da ponte H (Firmo, 2007).

A direcao da corrente determina o sentido de rotacao desejado.Chaves C1 e C4 fechadas fazem o motor girar no sentido anti-horario, enquanto que C2 e C3 fechadas o fazem girar no sentidohorario.

O circuito e composto por quatro chaves, denominadas C1, C2, C3 e C4,

que sao sempre acionadas aos pares com o objetivo de causar a inversao

no sentido da corrente de armadura ia. Considerando que o estado logico

fechado das chaves seja 1, e o aberto seja 0, a Tabela 2.1 fornece os estados

permitidos para o funcionamento da ponte.

Tabela 2.1: Logica de acionamento do motor em funcao das chaves.

ChavesEstado do motor

C1 e C4 C2 e C3

0 0 Desligado

0 1 Ligado no sentido horario

1 0 Ligado no sentido anti-horario

1 1 Estado nao permitido


2.2.5 O Sistema de Comando

O circuito de comando tem a funcao de energizar o motor e determinar o

seu sentido de rotacao, baseado nas informacoes provenientes dos sensores

citados na Secao 2.2.3. Para tal, desenvolveu-se a logica de comando

mostrada na Tabela 2.2.

Tabela 2.2: Logica do sistema de comando.

SensoresEstado do motor

S1(θ1) S2(θ1)

0 0 Desligado

0 1 Desligado

> 0 0 Desligado

< 0 0 Desligado

> 0 1 Ligado no sentido anti-horario

< 0 1 Ligado no sentido horario

2.2.6 Funcionamento da Plataforma

A interacao dos sistemas apresentados nas Secoes 2.2.1 a 2.2.5 fornece

o comportamento dinamico global da plataforma. Essa interacao, junta-

mente com a realimentacao dos sinais provenientes dos sensores, faz com

que o sistema apresente comportamento autonomo, ou seja, nao dependa

explicitamente do tempo, mas de seus proprios estados.

O circuito de comando recebe os sinais provenientes dos sensores S1

e S2 e, a partir da logica apresentada na Tabela 2.2, envia o sinal de

comando, correspondente ao modo adequado de acionamento do motor

CC, para o circuito da ponte H. Este ultimo, por sua vez, aciona o motor

aplicando uma tensao V (θ1, θ1), que depende da posicao e da velocidade

angular da barra 1 (estados do sistema) do pendulo duplo. A corrente

de armadura resultante, ia(θ1, θ1), e convertida no torque G(θ1, θ1). O

fechamento da malha se da por meio dos sensores que monitoram e enviam


os sinais ao circuito de comando. O sinal correspondente a velocidade

angular θ1 e armazenado e utilizado na identificacao de modelos e na

caracterizacao dinamica do sistema. O diagrama de funcionamento da

plataforma pode ser observado na Figura 2.8.

θ1

velocidade angular

Movimento

Sensores

V (θ1, θ1) G(θ1, θ1)

Ponte H - motor CC

Sistema de acionamento

Caracterizacao dinamica

sinalde

realim

enta

cao

Sistema de comando.Comparadores.

Sinal de comando

diadt

, θ1, θ2, θ1, θ2

S1(θ1)S2(θ1)

Figura 2.8: Diagrama de funcionamento da plataforma (Firmo, 2007).

A interacao dos sistemas e a realimentacao dos sinais provenien-tes dos sensores fazem com que o sistema possua comportamentoautonomo.

2.3 Modelo Matematico do Pendulo Duplo

Eletromecanico

O metodo de modelagem utilizado na obtencao do modelo matematico

da plataforma apresentada e conhecido como modelagem caixa branca ou

modelagem pela fısica do processo ou ainda modelagem fenomenologica.

Como o proprio nome diz, essa tecnica se baseia na aplicacao das leis

fundamentais da fısica e tem como resultado um conjunto de equacoes

que representam o processo modelado.

2.3 Modelo Matematico do Pendulo Duplo Eletromecanico 17

Durante o processo de modelagem, percorreram-se as seguintes etapas

ate a obtencao do modelo final (Firmo, 2007):

• obtencao de um modelo inicial, desprezando-se o atrito e a excitacao

externa;

• inclusao do amortecimento referente ao atrito presente no sistema;

• inclusao de uma excitacao V generica;

• teste utilizando funcao de excitacao V (t) periodica - sistema nao

autonomo;

• modelo final: consideracao da funcao de excitacao especıfica

V (θ1, θ1) - sistema autonomo.

Ao longo das etapas utilizadas no processo de modelagem, as hastes

que constituem o pendulo duplo foram substituıdas por massas pontu-

ais, localizadas nos centros de massa das barras e ligadas por hastes com

massas desprezıveis.

O modelo final obtido para o pendulo duplo eletromecanico, consi-

derando-se o atrito e o torque de excitacao, e formado pelas seguintes


equacoes diferenciais de tempo contınuo (Firmo, 2007):

θ1 =

(

−3 g l1 sen(θ1) (4 m1 + 5 m2)

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+

9 m2 l1 (g sen(−θ1 + 2 θ2) + l1 θ21 sen(2 β))

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+

−24 bm1 θ1 + 24 Kt ia(θ1, θ1) − 24 bm2 sgn(θ1)

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+

36 l1 cos(β) (b4 sgn(β) + b2 β) + 12 m2 l1 l22 θ22 sen(β)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))

)

; (2.3)

θ2 =

(

−24 b2 β (Mm + m1 l21 + 3 m2 l21)

m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−12 l1 θ21 sen(β) (Mm + m1 l21 + 3 m2 l21)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−9 l21 g sen(−2 θ1 + θ2) (m1 + 2 m2)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−36 l1 cos(β) (Kt ia(θ1, θ1) − bm1 θ1 − bm2 sgn(θ1))

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−24 b4 sgn(β) (Mm + m1 l21 + 3 m2 l21)

m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−3 sen(θ2) g (m1 l21 + 6 m2 l21 + 4 Mm)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−9 m2 l21 θ22 sen(2 β)

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)

)

; (2.4)

diadt

=

(

Va sgn(θ1)h(θ1) − Ks θ1 − Ra iaLa

)

, (2.5)

em que β = (θ1 − θ2) e β = (θ1 − θ2).


Os demais termos presentes nas Equacoes (2.3), (2.4) e (2.5) corres-

pondem aos parametros referentes ao motor, as hastes, aos rolamentos, aos

sensores e outros que se julgaram necessarios durante o processo de mode-

lagem. As descricoes, os valores e as fontes de obtencao desses parametros

sao apresentados na Tabela 2.3.

O modelo final tambem e constituıdo pelo operador sgn(·), introduzido

durante a modelagem do atrito de Coulomb e responsavel por fornecer o

sinal da variavel que e passada como argumento, tal que:

sgn(argumento) =

1, se argumento ≥ 0;

−1, se argumento < 0.(2.6)

Alem disso, a funcao h(θ1) representa o sinal proveniente do sensor S2

e e mostrada na Equacao (2.7).

h(θ1) =

0, se |θ1| ≥ γ;

1, se |θ1| < γ.(2.7)

A funcao de excitacao externa V (θ1, θ1), comentada na Secao 2.2.4, e

representada pelo termo Va sgn(θ1)h(θ1) da Equacao (2.5), em que Va e o

valor da amplitude da tensao aplicada aos terminais do enrolamento de

armadura do motor CC e, consequentemente, o parametro de bifurcacao3

da plataforma.

As Equacoes (2.3), (2.4) e (2.5) podem ser decompostas em cinco equa-

coes diferenciais de primeira ordem, formando um sistema de quinta or-

dem4, cujos estados sao a corrente de armadura, ia(θ1, θ1), a velocidade

angular da barra 1, θ1, a posicao da barra 1, θ1, a velocidade angular da

barra 2, θ2, e a posicao da barra 2, θ2. O conjunto de Equacoes (2.8)

apresenta o modelo final utilizando a representacao no espaco de estados.

3Parametro do sistema que, quando variado, gera diversos tipos de regimes dinami-cos.

4A este tipo de representacao se da o nome de representacao no espaco de estados.Para o caso autonomo, contınuo no tempo, a representacao no espaco de estados tem aseguinte forma geral x = f(x), sendo que x ∈ R

n e o vetor de estados n-dimensional,f(x), um conjunto de equacoes em funcao do vetor de estados e x = dx/dt. A ordemdo sistema e dada pelo numero de equacoes diferenciais de primeira ordem necessariaspara descrever o sistema.

202

OP

endulo

Duplo

Tabela 2.3: Parametros utilizados no modelo final (Firmo, 2007).

Parametro Descricao Valor Unidade Origem

l1 comprimento da barra 1 0,27305 m (Shinbrot et al., 1992)

l2 comprimento da barra 2 0,21600 m (Shinbrot et al., 1992)

m1 massa da barra 1 0,29730 kg Calculo

m2 massa da barra 2 0,23590 kg Calculo

Mm momento de inercia do motor 33,8 × 10−6 kgm2 Calculo

b1 coeficiente de amortecimento viscoso do rolamento do tipo 1 0,001150 Nm/rad http://www.skf.com

b2 coeficiente de amortecimento viscoso do rolamento do tipo 2 0,000015 Nm/rad http://www.skf.com

b3 coeficiente de amortecimento de Coulomb do rolamento do tipo 1 0,00002 Nm/rad http://www.skf.com

b4 coeficiente de amortecimento de Coulomb do rolamento do tipo 2 0,00002 Nm/rad http://www.skf.com

bm1 soma dos atritos viscosos do motor e do rolamento do tipo 1 0,00085 Nm/rad Ensaio

bm2 soma dos atritos de Coulomb do motor e do rolamento do tipo 1 0,00085 Nm/rad Ensaio

g gravidade 9,81 m/s2 (Meriam e Kraige, 2003)

Ra resistencia de armadura 13,7422 Ω Ensaio

La indutancia de armadura 31,10 mH Ensaio

Kt constante de torque do motor 0,0598 Nm/A Ensaio

Ks constante de velocidade do motor 0,0598 V/rad/s Ensaio

γ angulo de abertura do sensor S2 π/12 rad Tentativa e erro

Va amplitude da tensao aplicada a armadura do motor 18,5 Volts Ensaio


x1 = x2;

x2 =−3 g l1 sen(x1) (4m1 + 5m2)

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+

9 m2 l1 (g sen(−x1 + 2 x3) + l1 x22 sen(2 β))

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+

−24 bm1 x2 + 24 Kt x5 − 24 bm2 sgn(x2)

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+

36 l1 cos(β) (b4 sgn(β) + b2 β) + 12 m2 l1 l22 x24 sen(β)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β));

x3 = x4;

x4 =−24 b2 β (Mm + m1 l21 + 3 m2 l21)

m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−12 l1 x22 sen(β) (Mm + m1 l21 + 3 m2 l21)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−9 l21 g sen(−2 x1 + x3) (m1 + 2 m2)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−36 l1 cos(β) (Kt x5 − bm1 x2 − bm2 sgn(x2))

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−24 b4 sgn(β) (Mm + m1 l21 + 3 m2 l21)

m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+

−3 sen(x3) g (m1 l21 + 6 m2 l21 + 4 Mm)

l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))

−9 m2 l21 x24 sen(2 β)

8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β);

x5 =Va sgn(x2) h(x1) − Ks x2 − Ra x5

La;

y = x2,

(2.8)


sendo que x1 = θ1, x2 = θ1, x3 = θ2, x4 = θ2, x5 = ia, β = (x1 − x3) e

β = (x2 − x4). A saıda do sistema, y, corresponde a velocidade angular

da barra 1, que e obtida por meio do sensor S1 e que sera utilizada, neste

trabalho, no processo de identificacao.

Conforme verificado por Firmo (2007), a plataforma construıda apre-

senta certas caracterısticas que indicam a existencia de dinamica caotica,

tais como sensibilidade as condicoes iniciais, falta de previsibilidade a longo

prazo, maior expoente de Lyapunov positivo, dimensao fractal e atrator

estranho5.

A Figura 2.9 apresenta a serie temporal relativa a velocidade angular

da barra 1, obtida por meio do sensor S1 do sistema real.

−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

θ 1(r

ad/s)

Figura 2.9: Serie temporal relativa a variavel de estado θ1 do sistema real.

A aquisicao desses dados foi realizada utilizando -se o sensor S1.

Ressalta-se que foram obtidas varias series temporais para diferentes

valores do parametro de bifurcacao. Desta forma, escolheu-se apenas uma

serie temporal para ser utilizada ao longo deste trabalho. A escolha dessa

serie baseou-se na minimizacao de ruıdo devido a vibracao da bancada

onde o pendulo estava mecanicamente instalado e no menor valor possı-

vel do parametro de bifurcacao, de maneira que o sistema apresentasse

5Esses termos serao apresentados e discutidos no Capıtulo 4.

2.4 Consideracoes Finais 23

comportamento dinamico aparentemente caotico. A Tabela 2.4 fornece os

parametros de acionamento do motor CC e de aquisicao da serie.

Tabela 2.4: Parametros utilizados na obtencao experimental da serie temporalθ1.

Parametro Valor

Tensao de armadura Va 18,5 ± 0,1V

Tensao de campo Vc 10,2 ± 0,1V

γ 55

Frequencia de amostragem 2 kHz

Tamanho da serie temporal 12 × 106 pontos

Filtro anti-mascaramento R = 6k8 Ω e C = 100 nF

Frequencia de corte filtro 200 Hz

2.4 Consideracoes Finais

Neste capıtulo, foi apresentada a plataforma de estudo considerada neste

trabalho. Mostraram-se, de forma sucinta, as principais partes que com-

poem a plataforma, uma breve descricao de seu funcionamento e os pa-

rametros envolvidos na aquisicao da serie temporal real. Ressalta-se que

apenas a serie relativa a variavel de estado θ1 sera utilizada nos capıtulos

seguintes na obtencao e validacao de modelos dinamicos. Isso se deve ao

fato de nao ser possıvel medir diretamente as outras variaveis de estado

presentes no pendulo duplo.

Capıtulo 3

Tecnicas de Identificacao de

Sistemas Dinamicos

“Todo o nosso saber comeca nos sentimentos.”

Leonardo da Vinci

3.1 Introducao

Identificacao de sistemas ou modelagem caixa-preta ou ainda modelagem

empırica e a area do conhecimento que estuda tecnicas alternativas de mo-

delagem matematica1 (Aguirre, 2007). Nesse tipo de modelagem, obtem-se

modelos a partir dos dados coletados diretamente dos sistemas em estudo

e nao ha necessidade de nenhum conhecimento previo acerca desses. Em

contrapartida, a ausencia do significado fısico dos modelos obtidos e o nu-

mero excessivo de parametros sao exemplos de desvantagens desse tipo de

modelagem (Pottmann e Pearson, 1998).

Este capıtulo tem por objetivo apresentar os conceitos que serao uteis

na obtencao de modelos para o pendulo duplo utilizando as tecnicas de

identificacao de sistemas. Serao analisadas e discutidas as principais re-

presentacoes nao -lineares utilizadas no desenvolvimento deste trabalho.

1Modelagem matematica e a area do conhecimento que estuda maneiras de desen-volver modelos matematicos de sistemas reais.

26 3 Tecnicas de Identificacao de Sistemas Dinamicos

3.2 Etapas de Identificacao de Sistemas

As principais etapas de um problema de identificacao de sistemas, em-

pregadas em sistemas lineares e nao -lineares, podem ser encontradas em

Ljung (1999):

• testes dinamicos e coleta de dados;

• escolha da representacao matematica;

• selecao da estrutura do modelo;

• estimacao dos parametros do modelo;

• validacao do modelo.

3.2.1 Testes Dinamicos e Coleta de Dados

Testes dinamicos e coleta de dados compreendem os metodos relativos a

excitacao e a amostragem de dados de um sistema. E uma etapa muito

importante, pois tem o objetivo de garantir que, nos dados a serem mo-

delados, estejam presentes todas as frequencias de interesse e que essas

apresentem as caracterısticas estaticas e dinamicas do sistema.

O sinal de excitacao apresenta duas importantes funcoes. Uma delas e

excitar as caracterısticas dinamicas e estaticas do sistema em toda a faixa

de frequencia de interesse. A outra esta relacionada ao perfil de amplitudes

desse sinal, que e responsavel pela excitacao das nao -linearidades presentes

no sistema. As caracterısticas nao excitadas nao podem ser modeladas em

virtude de nao estarem contidas nos dados coletados. Portanto, o sinal

de excitacao deve ser persistentemente excitante. De acordo com Aguirre

(2007), um sinal persistentemente excitante de ordem n e um sinal que

tem potencia espectral em n ou mais frequencias distintas. Dois sinais

comumente usados sao o sinal pseudo-aleatorio e o ruıdo branco.

Um tipo de sinal pseudo-aleatorio e o sinal binario pseudo-aleatorio

(PRBS). Esse e um sinal binario, pois apresenta somente dois valores pos-

sıveis. Alem disso, um sinal pseudo-aleatorio possui ruu(k) ≈ 0 para

∀k 6= 0, sendo que ruu representa a funcao de autocorrelacao de um sinal

u(k). O ruıdo branco e um sinal de media nula que possui potencia espec-

tral em todas as frequencias e, portanto, pode ser definido como um sinal

puramente aleatorio.

3.2 Etapas de Identificacao de Sistemas 27

O tempo ou perıodo de amostragem, que corresponde ao intervalo entre

duas amostras, e determinado, na pratica, escolhendo-se a frequencia de

amostragem entre 5 e 10 vezes maior que a frequencia de interesse contida

nos dados. Se o tempo de amostragem for muito grande (subamostragem),

havera perda de informacao dinamica entre uma amostra e outra (Billings

e Aguirre, 1995). Por outro lado, se o tempo de amostragem for muito

pequeno (superamostragem), o desempenho do algoritmo de selecao de

estrutura e estimacao de parametros sera afetado devido ao mal condici-

onamento numerico. Nesse caso, o sinal deve ser decimado a fim de que

se torne devidamente amostrado. Para isso, e necessario verificar o grau

de correlacao entre as observacoes adjacentes do sinal. Um procedimento

adotado na escolha do melhor tempo de amostragem consiste na utilizacao

das funcoes de autocovariancia linear ry(τ) e nao -linear ry2

′ (τ) da saıda

do sistema:

ry(τ) = E[(

y(k) − y(k))(

y(k − τ) − y(k))]

; (3.1)

ry2

′ (τ) = E[(

y2(k) − y2(k))(

y2(k − τ) − y2(k))]

, (3.2)

sendo que y(k) e y2(k) representam os valores medios da saıda do sistema

e E[.] indica a esperanca matematica. O apostrofo indica apenas que o

sinal teve sua media removida.

Considerando que τy e τy2

′ correspondem, respectivamente, aos primei-

ros mınimos de ry e ry2

′ , estabelece -se que o menor desses mınimos sera o

valor de trabalho, ou seja, τm = min[τy,τy2′ ]. Portanto, o sinal se tornara

devidamente amostrado quando τm satisfizer a seguinte condicao (Aguirre,

2007):

10 ≤ τm ≤ 20, (3.3)

podendo as vezes ser estendido para:

5 ≤ τm ≤ 25. (3.4)

3.2.2 Escolha da Representacao Matematica

Representacao matematica e a classe de equacoes escolhida para represen-

tar um sistema dinamico. Como exemplos, tem-se as funcoes de transfe-

rencia em s e os modelos em espaco de estados.

A seguir, sao citadas algumas das representacoes nao -lineares mais


utilizadas:

• funcoes de base radial (Casdagli, 1989; Alves, 2004);

• modelos NARMAX (do termo em ingles nonlinear autoregressive

moving average model with exogenous inputs) polinomiais e racionais

(Leontaritis e Billings, 1985a,b; Billings e Chen, 1989; Billings e Zhu,

1991; Zhu e Billings, 1991, 1993; Correa, 1997, 2001; Campos, 2007);

• modelos de blocos interconectados (Wiener, 1958; Narendra e Gall-

man, 1966; Wigren, 1993; Patwardhan et al., 1998; Pearson e Pott-

mann, 2000; Coelho, 2002);

• redes neurais artificiais (Elsner, 1992; Henrique et al., 1998; Braga

et al., 2000; Amaral, 2001; Haykin, 2001);

• series de Volterra (Volterra, 1930);

• wavelets (Graps, 1995; Billings e Coca, 1999; Correa, 2001);

• modelos Fuzzy (Zadeh, 1973; Mamdani, 1977; Takagi e Sugeno, 1985;

Babusca et al., 1998; Campello e Amaral, 1999, 2001).

No desenvolvimento deste trabalho, serao utilizados modelos autono-

mos do tipo NARMAX polinomiais e racionais e modelos Fuzzy do tipo

Takagi-Sugeno (TS) (Takagi e Sugeno, 1985). As Secoes 3.3, 3.4 e 3.5

apresentam, em maiores detalhes, essas representacoes.

3.2.3 Selecao da Estrutura do Modelo

Dada uma representacao matematica, o primeiro passo para definir um

modelo e determinar a sua estrutura e, em seguida, estimar seus parame-

tros.

Um algoritmo utilizado para se determinar a estrutura de um modelo

e a taxa de reducao do erro (ERR - error reduction ratio), proposto por

Billings et al. (1989), adaptado por Mendes (1995) para modelos racionais

e alterado por Correa (1997) de forma a inserir termos de ruıdo.

O algoritmo consiste em associar a cada termo candidato um ındice

que corresponda a sua contribuicao na explicacao da variancia dos da-

dos de saıda. Esse algoritmo ordena os termos candidatos em uma lista

decrescente conforme a sua importancia na identificacao do sistema.

3.2 Etapas de Identificacao de Sistemas 29

O numero de termos candidatos possıveis em um modelo e definido pelo

grau de nao -linearidade, l, e pelos atrasos maximos referentes a saıda, ny,

e a entrada, nu. Portanto, um aumento desses parametros provocaria um

aumento significativo no numero de termos candidatos, fazendo com que

a estimacao de parametros seja mal-condicionada.

3.2.4 Estimacao dos Parametros do Modelo

Na estimacao dos parametros de um modelo, podem ser utilizados diversos

tipos de estimadores. O estimador de mınimos quadrados (MQ), cujo

princıpio reside em encontrar uma solucao (vetor de parametros estimados

θ) que minimize o somatorio do quadrado do erro de predicao, e aplicado

a estruturas lineares nos parametros.

Em estruturas nao -lineares nos parametros, pode-se utilizar, por exem-

plo, o estimador estendido de mınimos quadrados (EMQ). Tal estimador

tem por objetivo amenizar a polarizacao2 dos parametros estimados.

3.2.5 Validacao do Modelo

Um modelo sera considerado valido se incorporar as caracterısticas do

sistema que sao fundamentais para uma determinada aplicacao.

Na validacao de sistemas dinamicos nao -lineares com dinamica caotica,

e importante encontrar caracterısticas fundamentais desses sistemas que

possam ser utilizadas para validar os modelos obtidos. Isso se deve ao fato

de as predicoes temporais, utilizando modelos com dinamica caotica, nao

caracterizarem tais modelos, uma vez que uma infinitesima perturbacao

nas condicoes iniciais ou nos parametros do modelo resultam em predicoes

temporais completamente distintas.

Uma maneira de contornar essa condicao e trabalhar em um espaco

onde o tempo nao seja explicitamente representado. Tal metodologia e

conhecida como reconstrucao do espaco de estados. Dada uma serie tem-

poral y(k) (k = 1, 2, . . . ) de um sistema, a reconstrucao consiste em tomar

conjuntos subsequentes de de valores da mesma sequencia de forma a se

2Tambem conhecida como tendencia, vies ou ainda bias em ingles. Pode ser definidacomo a diferenca entre a esperanca matematica dos parametros estimados, E[θ], e oseu vetor de parametros θ.


ter:

ye(1) = [y(1) y(2) . . . y(de)]T;

ye(2) = [y(2) y(3) . . . y(de + 1)]T; (3.5)

ye(3) = [y(3) y(4) . . . y(de + 2)]T....

...

Desta forma, a sequencia de vetores de dimensao de (ye(1), ye(2),

ye(3), · · · ) pode ser representada como uma sequencia de pontos no espaco

Rde , tambem conhecido como espaco de imersao. Portanto, a sequencia

produzida e referida como sendo uma trajetoria do sistema, ou modelo,

imersa no espaco de estados.

No espaco de imersao, se duas sequencias temporais forem produzidas

pelo mesmo sistema, mesmo em condicoes iniciais distintas, ainda que o

sistema apresente dinamica caotica, ambas as trajetorias convergirao para

uma regiao limitada no espaco de fases denominada atrator. Desta forma,

os atratores podem ser utilizados na validacao de modelos caoticos, pois,

na maioria dos casos, apresentam robustez a perturbacoes infinitesimais

nas condicoes iniciais e nos parametros. Entao, em vez de se compararem

series temporais, e mais adequado compararem-se seus atratores, ou suas

projecoes bidimensionais e tridimensionais. Alem disso, tambem poderiam

ser comparados sequencias de atratores obtidos a medida que se varia o

parametro de bifurcacao (diagramas de bifurcacao) ou ainda cortes dos

atratores (secoes de Poincare).

Para validar os modelos obtidos neste trabalho, serao utilizados proje-

coes tridimensionais dos atratores e outros ındices, tais como estimativas

do maior expoente de Lyapunov e da dimensao fractal. Esses ındices tam-

bem serao conhecidos como invariantes dinamicos e sao empregados na

caracterizacao dinamica do pendulo duplo e dos modelos encontrados.

3.3 Modelo NARMAX Polinomial

O modelo NARMAX polinomial (Leontaritis e Billings, 1985a,b) e um

modelo discreto que explica o valor de saıda em funcao de valores previos

dos sinais de saıda, y(k), de entrada, u(k), e de ruıdo, e(k). O modelo

3.3 Modelo NARMAX Polinomial 31

NARMAX polinomial e apresentado em Aguirre (2007):

y(k) = F ℓ[

y(k − 1), . . . ,y(k − ny),u(k − τd), . . . ,u(k − nu),

e(k − 1), . . . ,e(k − ne)]

+ e(k), (3.6)

sendo que e(k) indica todos os efeitos que nao podem ser bem representa-

dos por F ℓ[.], que e uma funcao polinomial com grau de nao -linearidade

ℓ ∈ N. Os termos τd, ny, nu e ne representam, respectivamente, o tempo

morto e os maximos atrasos em y, em u e em e. Como exemplo, apresenta-

se um modelo com ℓ = 2, ny = 2, nu = 2 e ne = 5 (Cassini, 1999):

y(k) = 1,2929 y(k − 1) + 0,0101 u(k − 2)u(k − 1) + 0,0407 u(k − 1)2

−0,3779 y(k − 2) − 0,1280 u(k − 2)y(k − 1)

+0,0957 u(k − 2)y(k − 2) + 0,0051 u(k − 2)2

+5∑

i=1

θi e(k − i) + e(k). (3.7)

A parte determinıstica da Equacao (3.6) pode ser expandida como

o somatorio de termos com graus de nao -linearidade variando na faixa

1 ≤ m ≤ ℓ e e representada por (Peyton-Jones e Billings, 1989):

y(k) =

ℓ∑

m=0

m∑

p=0

ny ,nu∑

n1,nm

cp,m−p(n1, . . . ,nm)

p∏

i=1

y(k − ni)

m∏

i=p+1

u(k − ni), (3.8)

sendo queny ,nu∑

n1,nm

≡

ny∑

n1=1

· · ·nu∑

nm=1

, (3.9)

e o limite superior e ny se o somatorio se refere a fatores do tipo y(k−ni)

ou nu para fatores do tipo u(k − ni).

Portanto, cada termo de grau m podera conter um fator de grau p do

tipo y(k−i) e um fator de grau (m−p) do tipo u(k−i) sendo multiplicado

por um parametro representado por cp,m−p(n1, . . . ,nm). A seguir, e mos-

trado um exemplo no qual a funcao F ℓ[.] e expandida como um polinomio


de grau dois, ou seja, F 2[.]. Desta forma, tem-se (Aguirre, 2007):

y(k) = c0,0 +

ny∑

n1=1

c1,0(n1) y(k − n1) +

nu∑

n1=1

c0,1(n1) u(k − n1)

+

ny∑

n1

ny∑

n2

c2,0(n1,n2) y(k − n1)y(k − n2)

+

ny∑

n1

nu∑

n2

c1,1(n1,n2) y(k − n1)u(k − n2)

+nu∑

n1

nu∑

n2

c0,2(n1,n2) u(k − n1)u(k − n2). (3.10)

O exemplo a seguir e apresentado para ilustrar as definicoes anteriores

(Rodrigues, 1996):

y(k) = 0,44551 y(k − 1) + 0,57773 y(k − 2) − 0,83997 u(k − 2)

+0,64166 u(k − 1) − 0,00867 y(k − 1)2u(k − 1)

−1,31720 u(k − 3)u(k − 1)2 − 0,16796 y(k − 3)3

+0,78831 y(k − 2)u(k − 2) + 0,00056 y(k − 3)2u(k − 3),

(3.11)

sendo ℓ = 3 e ny = nu = 3. Representando o modelo (3.11) como em

(3.8), tem-se:

y(k) =3∑

m=0

m∑

p=0

3,3∑

n1,nm

cp,m−p(n1, . . . ,nm)

p∏

i=1

y(k−ni)m∏

i=p+1

u(k−ni), (3.12)

sendo:

c1,0(1) = 0,44551, c0,3(3,1,1) = −1,31720,

c1,0(2) = 0,57773, c3,0(3,3,3) = −0,16796,

c0,1(2) = −0,83997, c1,1(2,2) = 0,78831,

c0,1(1) = 0,64166, c2,1(3,3,3) = 0,00056,

c2,1(1,1,1) = −0,00867, demais cp,m−p(n1, . . . ,nm) = 0.

3.4 Modelo NARMAX Racional 33

3.4 Modelo NARMAX Racional

Modelos racionais sao definidos como a razao entre dois polinomios nao-

lineares (Billings e Mao, 1997). Tais modelos apresentam uma estrutura

mais flexıvel permitindo uma maior eficiencia na modelagem de certos

sistemas quando comparados com modelos polinomiais. Entretanto, os

modelos racionais sao mais sensıveis ao ruıdo.

Um modelo racional NARMAX tem a seguinte forma geral:

y(k) =a(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu),

b(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu),· · ·

· · ·e(k − 1), . . . ,e(k − ne))

e(k − 1), . . . ,e(k − ne))+ e(k), (3.13)

em que e(k) representa um ruıdo nao observavel, independente, com media

zero e variancia finita σ2e .

A Equacao (3.13) pode ser representada de forma simplificada como:

y(k) =a(k − 1)

b(k − 1)+ e(k), (3.14)

sendo conveniente definir os polinomios do numerador e do denominador

como:

a(k − 1) =Nn∑

j=1

pnjθnj = ψTn (k − 1)θn; (3.15)

b(k − 1) =Nd∑

j=1

pdjθdj = ψTd (k − 1)θd, (3.16)

sendo que θnj e θdj sao, respectivamente, os parametros dos regressores

do numerador e do denominador, que incluem informacao ate o instante

k − 1. O numero total de parametros a se estimar sera igual a Nn + Nd.

Os termos pnj e pdj sao os coeficientes das saıdas y(k − 1), · · · ,y(k − ny),

das entradas u(k − 1), · · · ,u(k − nu) e do ruıdo e(k − 1), · · · ,e(k − ne).

Devido a nao -linearidade dos parametros, apresentada pela Equacao

(3.13), nao e possıvel a estimacao direta dos parametros utilizando o MQ.

Uma alternativa para estima-los e fazer a pseudolinearizacao dos parame-

tros do modelo racional. Tal linearizacao se da por meio da multiplicacao


da Equacao (3.13), em ambos os lados, por b(k − 1). Apos a manipulacao

de termos, chega-se a:

y∗(k) = a(k − 1) − y(k)

Nd∑

j=2

pdjθdj + b(k − 1)e(k)

=

Nn∑

j=1

pnjθnj − y(k)

Nd∑

j=2

pdjθdj + ζ(k)

= ψTn (k − 1)θn − y(k)ψT

d1(k − 1)θd + ζ(k), (3.17)

sendo ψTd (k − 1) = [pd1 ψ

Td1(k − 1)], θd1 = 1 e

y∗(k) = y(k)pd1 =a(k − 1)

b(k − 1)pd1 + pd1e(k); (3.18)

ζ(k) = b(k − 1)e(k) =

(

Nd∑

j=1

pdjθdj

)

e(k), (3.19)

em que e(k) e um ruıdo branco. Como e(k) e independente de b(k − 1) e

tem media zero, tem-se que E[ζ(k)] = E[b(k − 1)]E[e(k)] = 0.

Verifica-se, a partir da Equacao (3.18), que os termos y(k)pdj, por

causa de y(k), incluem o ruıdo e(k), que, por sua vez, esta correlacionado

com ζ(k). Essa correlacao induz a polarizacao do estimador, mesmo que

e(k) seja um ruıdo branco com media zero. Este problema aparece quando

se multiplica a Equacao (3.13) por b(k−1) a fim de tornar o modelo linear

nos parametros.

Para reduzir o efeito da polarizacao devido a pseudolinearizacao, foi

desenvolvido por Correa (1997) um algoritmo para estimar os parametros

do modelo racional a partir do MQE e de uma modificacao no algoritmo

proposto por Billings e Zhu (1991). O estimador MQE e um processo

iterativo que consiste em incluir a parte correlacionada do vetor de erro

na matriz de regressores ate que se obtenha um vetor de erro resultante

que seja descorrelacionado de tal matriz. Em Correa (1997), assume-se

que o modelo racional pode ser aproximado por:

y(k) =a(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu))

b(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu))

+c(e(k − 1), . . . ,e(k − ne)) + e(k), (3.20)

3.5 Modelos Fuzzy 35

sendo que c(e(k − 1), . . . ,e(k − ne)) representa o polinomio utilizado para

modelar o ruıdo.

3.5 Modelos Fuzzy

A logica fuzzy3 foi introduzida por Zadeh (1965) como uma ferramenta

capaz de capturar informacoes vagas e aproximadas, em geral, descritas

em uma linguagem natural e expressas de uma maneira sistematica. Di-

ferentemente da logica concebida por Aristoteles, filosofo grego (384 - 322

a.C.), que leva a uma linha de raciocınio logico baseado em premissas e

conclusoes que devem ser necessariamente verdadeiras ou falsas, a logica

fuzzy viola estas suposicoes, admitindo que, ao mesmo tempo, uma dada

afirmacao seja parcialmente verdadeira e parcialmente falsa.

A logica fuzzy pode ser aplicada a modelagem de sistemas dinamicos.

Arquiteturas fuzzy foram demonstradas como aproximadores universais

(Pedrycz e Gomide, 1998), ou seja, capazes de aproximar qualquer fun-

cao contınua em um domınio compacto com qualquer nıvel de precisao

desejado.

Nesta secao, serao apresentados os principais conceitos da logica fuzzy,

bem como a arquitetura fuzzy TS e o algoritmo de identificacao aplicados

aos dados do pendulo.

3.5.1 Conceitos

A logica fuzzy teve o seu desenvolvimento baseado na teoria de conjuntos

fuzzy (Zadeh, 1965). Um conjunto fuzzy e definido como uma colecao de

elementos cujo grau de pertinencia ao conjunto varia entre 0 e 1. For-

malmente, um conjunto fuzzy A e caracterizado por uma funcao de per-

tinencia (FP), µA(x), que mapeia cada elemento do universo de discurso

(domınio), U , a um numero no intervalo unitario [0,1]. Tal conjunto pode

ser representado por:

A = (x, µA(x)), x ∈ U e µA(x) ∈ [0,1]. (3.21)

A FP µA(x) indica com que grau o elemento x pertence ao conjunto A.

Um grau de pertinencia 1 equivale ao sımbolo ∈, ao passo que o grau de

3Tambem conhecida como logica Nebulosa.


pertinencia 0 equivale a /∈. Em princıpio, as funcoes de pertinencia podem

ser quaisquer funcoes que produzam valores entre 0 e 1. Comumente, essas

sao definidas como triangulares, trapezoidais, sigmoides ou gaussianas. A

Figura 3.1 apresenta um grafico de uma FP gaussiana.

0 1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

µA(x

)

Figura 3.1: Grafico de uma funcao de pertinencia gaussiana.

A funcao de pertinencia gaussiana e descrita pela seguinte equacao:

µA(x) = exp(

−(x−α)2

2σ2

)

, sendo que α representa o seu centro e σ, a

sua abertura.

Um conceito relacionado aos conjuntos fuzzy e o de variavel linguıstica.

Entende-se que tal variavel pode assumir valores como nomes ou sentencas,

ao inves de assumirem apenas valores especıficos como ocorre em variaveis

numericas. Cada valor linguıstico e representado por um conjunto fuzzy e

apresenta a sua respectiva FP. Outro conceito e o de regra fuzzy, que e uma

sentenca composta por termos primarios (como exemplo, a temperatura

de uma sala: alta, baixa, media), por termos conectivos logicos (e, ou, nao)

e por termos modificadores (muito, pouco, extremamente). Utilizando-se

esses termos, pode-se dizer, por exemplo, que a temperatura de uma sala

e “nao muito fria”.

Um sistema fuzzy, seja ele um modelo ou controlador de um processo, e

composto de regras do tipo Se-entao4, que descrevem a dependencia entre

4Tambem conhecida como regra, implicacao ou, ainda, proposicao condicional fuzzy.


as variaveis linguısticas de entrada e de saıda. Uma regra Se-entao tem a

seguinte forma:

Ri : Se x e Ai entao y e Bi, (3.22)

sendo que Ri representa a regra i, Ai e Bi sao variaveis linguısticas, x e

y sao os elementos dos universos de discurso X ⊂ Rn e Y ⊂ R

m respecti-

vamente. A proposicao “x e Ai” e conhecida como antecedente da regra,

“y e Bi”, como consequente ou conclusao e “x”, como variavel premissa.

Ressalta-se que uma regra fuzzy tambem podera apresentar mais de um

antecedente.

As regras Se-entao sao utilizadas por um mecanismo de inferencia para

processar algum resultado a partir das informacoes de entrada. A estru-

tura basica de um mecanismo de inferencia pode ser vista na Figura 3.2.

A partir da Figura 3.2, observa-se que os sinais de entrada, obtidos por

meio de observacoes ou medicoes, passam, primeiramente, por uma etapa

denominada fuzzificacao. Essa etapa consiste em transformar as entradas

determinısticas em conjuntos fuzzy.

A etapa de inferencia consiste em disparar as regras paralelamente

com diferentes graus de ativacao quando uma entrada e fornecida para

inferir um resultado ou saıda. Na etapa defuzzificacao, e extraıdo dos

conjuntos fuzzy de saıda um valor significativo que corresponde a melhor

possibilidade de combinacao desses conjuntos.

DefuzzificacaoFuzzificacao

Inferencia

Regras

Entradas

Determinısticas

Conjuntos

Fuzzy

Conjuntos ou

Funcoes Fuzzy

Saıdas

Determinısticas

Figura 3.2: Estrutura basica de um mecanismo de inferencia fuzzy.

3.5.2 Modelos Fuzzy Takagi-Sugeno

O modelo fuzzy proposto por Takagi e Sugeno (1985) e um sistema de in-

ferencia composto por regras Se-entao capaz de descrever, de forma exata


ou aproximada, sistemas nao -lineares a partir de modelos locais lineares

ou nao -lineares. O modelo apresenta, como consequente das regras, uma

funcao qualquer das variaveis de entrada. Desta forma, o modelo TS e

composto por um conjunto de r regras que tem a seguinte forma:

Ri : Se x1 e Ai1 e . . . e xn e Ain entao yi = fi(x1, . . . , xn), (3.23)

sendo que i representa a i-esima regra (i = 1, 2, . . . , r), n indica a

quantidade de variaveis premissas (dimensao do espaco antecedente) e

fi(x1, . . . , xn) pode representar funcoes estaticas ou dinamicas.

Na premissa das regras, avalia-se o grau de compatibilidade de cada

entrada xn aos respectivos conjuntos fuzzy das variaveis linguısticas Ain,

obtendo-se os graus de pertinencia µAin(xn). O grau de ativacao do ante-

cedente da regra Ri e dado por:

wi(x) =n∏

i=1

µAin(xn), (3.24)

sendo x = [x1 x2 · · · xn]T o vetor de variaveis premissas. Ressalta-se

que seja necessario que, pelo menos, uma regra do modelo esteja ativa,

garantindo, assim, as seguintes propriedades:

wi(x) ≥ 0 e

r∑

i=1

wi(x) > 0. (3.25)

O valor de saıda do modelo resultante e obtido por meio da soma

ponderada dos modelos lineares, ou seja:

y =

∑r

i=1 wi(x)yi∑r

i=1 wi(x). (3.26)

Na identificacao de sistemas dinamicos nao -lineares utilizando mode-

los fuzzy TS, sao frequentemente empregadas as representacoes NARX

(nonlinear autoregressive model with exogenous inputs). O modelo NARX

explica o valor de saıda y(k) a partir de valores passados dos sinais de

entrada e saıda, ou seja,

y(k) = F[

y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu)]

, (3.27)


no qual F [.] representa uma funcao nao -linear. Os termos ny e nu repre-

sentam, respectivamente, os maximos atrasos em y e em u.

Reescrevendo o modelo (3.27) em termos do modelo TS e considerando

a funcao F [.] polinomial, chega-se a um conjunto de regras do tipo:

Ri : Se y(k − 1) e Ai1 e . . . e y(k − ny) e Ainy

e u(k − 1) e Bi1 e . . . e u(k − nu) e Binu,

entao: yi(k) =

ny∑

j=1

aijy(k − j) +

nu∑

j=1

biju(k − j) + ci, (3.28)

em que aij , bij e ci sao os parametros consequentes. O tempo morto pode

ser incluıdo substituindo-se u(k − 1) por u(k − τd).

Nota-se, a partir da regra (3.28), que cada fi(x1, . . . , xn) e repre-

sentada por um modelo linear ARX (autoregressive model with exogenous

inputs). O modelo NARX e o resultado da composicao de regras do tipo

(3.28), cujo valor de saıda e obtido a partir da Equacao (3.26). A nao-

linearidade e introduzida por meio das funcoes de pertinencia.

3.5.3 Algoritmo de Identificacao

Esta secao descreve o algoritmo de identificacao utilizado para estimar os

parametros de modelos fuzzy NARX TS. O presente algoritmo foi pro-

posto por Babusca et al. (1998) para sistemas MIMO (multi-input, multi-

output).

A estrutura do modelo, ou seja, os valores de ny, nu e τd sao deter-

minados pelo usuario com base no conhecimento a priori e/ou em outro

criterio, por exemplo, o ERR, descrito na Secao 3.2.3. Uma vez deter-

minada a estrutura, os parametros dos no modelos MISO5 (multi-input,

single-output), representados pela Equacao (3.28), podem ser estimados.

Esses parametros constituem-se dos parametros das funcoes de pertinencia

e dos parametros dos modelos consequentes aij , bij e ci. Um parametro

adicional utilizado e o numero de regras r, que pode ser especificado pelo

usuario ou obtido automaticamente, como sera apresentado nesta secao.

Os modelos MISO sao obtidos de forma independente um do outro por

meio do seguinte procedimento:

5Considera-se que valores passados tanto da entrada quanto da saıda constituem asmultiplas variaveis de entrada dos modelos fuzzy NARX TS.


1. a partir de N observacoes dos dados de entrada e saıda e dos pa-

rametros estruturais ny, nu e τd, montar a matriz de regressores de

entrada X e o vetor de regressores de saıda y;

2. dividir os dados em conjuntos de submodelos lineares locais utili-

zando o agrupamento fuzzy no espaco produto X × Y para cada

modelo;

3. calcular as funcoes de pertinencia a partir dos agrupamentos;

4. a partir das funcoes de pertinencia obtidas, estimar os parametros

consequentes utilizando o estimador de mınimos quadrados ponde-

rado (MQP).

Regressores

A matriz de regressores de entrada X e o vetor de regressores de saıda y

sao construıdos, respectivamente, da seguinte forma:

X =

x(1)...

x(N − 1)

e y =

y(2)...

y(N)

, (3.29)

sendo que x = [y(k − 1) . . . y(k − ny) u(k − 1) . . . u(k − nu)]T representa

o vetor de variaveis premissas.

Agrupamentos Fuzzy

Os agrupamentos fuzzy tiveram a sua origem na analise de dados e no re-

conhecimento de padroes, sendo que o conceito de funcoes de pertinencia e

usado para representar o grau de similaridade entre um objeto e algum ob-

jeto prototipo (Babusca e Verbruggen, 2003). O grau de similaridade pode

ser calculado utilizando, por exemplo, a medida de distancia Euclidiana.

Baseado nessa similaridade, vetores de dados podem ser agrupados de tal

forma que os dados que pertencam a um determinado agrupamento sejam

os mais similares possıveis e, ao mesmo tempo, sejam mais dissimilares

possıveis dos dados pertencentes a outros agrupamentos.

A ideia de agrupamento fuzzy e apresentada na Figura 3.3, sendo que

os dados estao agrupados em dois grupos com objetos prototipos v1 e v2,


usando a medida de distancia Euclidiana. O particionamento dos dados e

expresso por uma matriz de particionamento fuzzy, U , cujos elementos µik

sao os graus de pertinencia dos pontos [xk,yk] em um agrupamento fuzzy

com objeto prototipo vi.

A1 A2

x

µ

y

y projecao

dados

B2

B1

v1

v2

x

µ

Figura 3.3: Representacao de um agrupamento fuzzy.

Os dados estao agrupados em dois grupos com objetos prototiposv1 e v2 que foram obtidos para esta representacao utilizando -se amedida de distancia Euclidiana.

Os prototipos ou centros dos agrupamentos fuzzy podem ser definidos

como subespacos lineares (linhas, planos, hiperplanos) e sao utilizados em

conjunto com uma medida de distancia adequada capaz de quantificar

a distancia dos pontos a variedade local (Bezdek, 1981). No algoritmo

de identificacao apresentado nesta secao, sera utilizada uma medida de

distancia adaptativa baseada no algoritmo de Gustafson e Kessel (1979)

(GK).

A partir do numero de agrupamentos c, que corresponde ao numero de

regras, da matriz de regressores de entrada X e do vetor de regressores de

saıda y, o algoritmo GK calcula a matriz de prototipos, V = [v1, . . . , vc], o

conjunto de matrizes de covariancia dos agrupamentos, F = [F1, . . . , Fc],

sendo que Fi sao matrizes definidas positivas ∈ R(n+1)×(n+1), e a matriz

U = [µik]c×N representada a seguir:


U =

µ11 · · · µ1k · · · µ1N

... · · ·... · · ·

...

µi1 · · · µik · · · µiN

... · · ·...

. . ....

µc1 · · · µck · · · µcN

. (3.30)

O numero de agrupamentos deve ser especificado antes de se realizar

o agrupamento fuzzy, pois tal numero esta relacionado ao tipo de nao-

linearidade exibida pelo sistema em questao. Quanto mais regras o modelo

apresenta, mais “fina” e a sua aproximacao do sistema, fazendo com que o

numero de parametros a serem estimados seja maior e, consequentemente,

ocorrera um aumento da variancia devido a sobreparametrizacao. Quando

nao se tem nenhuma informacao a respeito da nao -linearidade, metodos

automaticos para se determinar o numero de regras podem ser aplica-

dos. Os metodos mais utilizados sao: validade das medidas (do ingles

validity measures) (Gath e Geva, 1989; Bezdek, 1981) e fusao de agru-

pamentos compatıveis (compatible cluster merging) (Kaymak e Babusca,

1995; Krishnapuram e Freg, 1992).

Funcoes de Pertinencia Antecedentes

As funcoes de pertinencia podem ser obtidas a partir da projecao dos

vetores, que sao formados pelas linhas da matriz U sobre os regressores

xn(k) do modelo, ou seja:

µAin(xn(k)) = projn(−→µiN

T), (3.31)

sendo que projn(·) representa o operador projecao. Cada linha da matriz

U corresponde a uma unica FP. Observa-se, a partir da Figura 3.3, a ideia

de projecao. Ressalta-se que a forma das FP dependera, obviamente, da

distribuicao dos dados.

Estimacao dos Parametros Consequentes

Para estimar os parametros consequentes, sera utilizado o estimador MQP.

Desta forma, o vetor de parametros consequentes, θi, e calculado por

θi = [XTe WiXe]

−1XTe Wi y, (3.32)


em que Xe = [X 1] e Wi representa uma matriz diagonal ∈ RN×N cujos

elementos sao os valores µik, ou seja, Wi = diag µi1 µi2 . . . µiN.


O objetivo deste capıtulo foi descrever, em linhas gerais, o contexto de

identificacao de sistemas dinamicos nao -lineares, foco do presente traba-

lho. Foram apresentados as principais estruturas dos modelos e os al-

goritmos utilizados na estimacao de seus parametros, mostrando maiores

detalhes para o modelo fuzzy NARX TS.

Capıtulo 4

Caracterizacao Dinamica

“Nossa recompensa se encontra no esforco e nao no re-

sultado. Um esforco total e uma vitoria completa.”

Ghandi

4.1 Introducao

Neste capıtulo, serao apresentados os metodos utilizados na caracteriza-

cao dinamica do pendulo duplo e na validacao dos modelos encontrados

para a serie temporal referente a variavel θ1. O procedimento de caracte-

rizacao dinamica baseia-se na obtencao de estimativas para os valores de

invariantes dinamicos, tais como o maior expoente de Lyapunov e a di-

mensao fractal. Alem disso, para a validacao, serao comparadas projecoes

tridimensionais dos atratores reconstruıdos.

Para a analise e o calculo dos invariantes dinamicos das series tempo-

rais obtidas do pendulo e dos modelos identificados, optou-se pelo pacote

computacional TISEAN (time series analysis), desenvolvido por Hegger

et al. (1999). Para validar os algoritmos desse pacote, comparar-se-ao os

valores encontrados com os valores obtidos por Firmo (2007) utilizando

tal pacote e a mesma serie temporal coletada do pendulo duplo.

4.2 Amostragem dos Dados

Aplicando o procedimento apresentado na Secao 3.2.1, avaliou-se o tempo

de amostragem da massa de dados referente a velocidade angular da

46 4 Caracterizacao Dinamica

barra 1, θ1. Essa massa de dados foi amostrada, originalmente, com uma

frequencia de 2000 Hz. A figura a seguir apresenta as funcoes de autoco-

variancia linear e nao -linear aplicadas a serie.

0 500 1000 1500−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

τ

r θ1

(τ)

(a)

0 200 400 600 800 1000−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

r θ1

2(τ

)τ

(b)

Figura 4.1: Funcoes de autocovariancia linear e nao -linear.

Funcoes de autocovariancia (a) linear, rθ1

(τ), e (b) nao -linear,

rθ 21(τ), aplicadas a serie temporal θ1.

Verifica-se, a partir da analise da Figura 4.1, que o menor mınimo

ocorre na funcao de autocovariancia nao -linear e vale τm ≈ 500. Observa-

se que a serie pode ser decimada com taxas de decimacao compreendidas

na faixa 20 ≤ ∆ ≤ 100. A Figura 4.2 mostra as funcoes de autocovariancia

para uma taxa de decimacao ∆ = 60.

4.3 Analise de Estacionariedade dos Dados

Antes de se realizar a caracterizacao dinamica dos dados, foi testada a

estacionariedade dos mesmos utilizando-se dois metodos. Tal teste se faz

necessario, devido ao fato de os algoritmos de identificacao utilizados con-

siderarem que os dados sejam estacionarios. Primeiramente, calcularam-

se os dois primeiros momentos estatısticos, ou seja, a media e a variancia

para janelas de tamanho T ao longo dos dados. A Figura 4.3 apresenta

um grafico com a media de cada janela.

A media de todas as janelas foi igual a xjan = −0,0026 e a variancia,

σ2jan = 0,00001681. Observa-se que os dados nao apresentam tendencia.

4.3 Analise de Estacionariedade dos Dados 47

0 5 10 15 20 25 30−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

r θ1

(τ)

τ

(a)

0 5 10 15 20−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

r θ1

2(τ

)

τ

(b)

Figura 4.2: Funcoes de autocovariancia linear e nao -linear para uma taxa dedecimacao ∆ = 60.

Funcoes de autocovariancia (a) linear, rθ1

(τ), e (b) nao -linear,rθ 21(τ).

0 10 20 30 40 50 60−0.015

−0.01

−0.005

0

0.005

0.01

janelas

med

ia

Figura 4.3: Grafico com a media de cada janela ao longo dos dados.

A media esta indicada por (), sendo que cada janela apresenta umtamanho T = 1000.


O segundo metodo utiliza os graficos de recorrencia, introduzidos

por Eckmann et al. (1987) e investigados em maiores detalhes em Cas-

dagli (1997). Os graficos de recorrencia, alem de serem utilizados na

verificacao de estacionariedade, tambem sao uteis, de forma qualitativa,

na identificacao de comportamentos dinamicos a partir de series tempo-

rais. Pode-se detectar, por exemplo, comportamentos caoticos, aleatorios,

intermitentes e periodicos.

O grafico de recorrencia consiste em uma matriz quadrada MN×N ob-

tida a partir da seguinte expressao:

Mde,ǫi,j = Θ(ǫ − ‖x(i) − x(j)‖), (4.1)

sendo que:

• i, j = 1, 2, . . . , N , em que N e o numero de amostras;

• ǫ e o raio da vizinhanca (threshold), cujo centro e x(i);

• ‖ · ‖ representa uma norma (norma-1, Euclidiana ou norma-∞);

• Θ( · ) e a funcao de Heaviside, isto e Θ(a) = 0, se a < 0 e Θ(a) = 1,

se a ≥ 0;

• de e a dimensao de imersao;

• x(i) e x(j) representam as amostras i e j da serie temporal em

analise.

Em um espaco com dimensao de imersao de, o elemento Mi,j da ma-

triz apresenta valor 1 quando a distancia entre os pontos x(i) e x(j) for

menor que o raio ǫ, indicando que os pontos sao vizinhos nesse espaco.

Desta forma, diz-se que tais pontos sao recorrentes. Caso contrario, o ele-

mento Mi,j apresenta valor 0, indicando que os pontos nao sao recorrentes.

Para melhor visualizacao, representam-se os valores binarios da matrix M

utilizando diferentes cores, por exemplo, pontos pretos para representar

Mi,j = 1 e pontos brancos para Mi,j = 0.

Os graficos de recorrencia sao simetricos a diagonal i = j, tambem

conhecida por linha de identidade (Marwan et al., 2007), uma vez que, se

x(i) e vizinho de x(j), entao x(j) tambem e vizinho de x(i).

4.3 Analise de Estacionariedade dos Dados 49

Para o teste de estacionariedade, o grafico de recorrencia nao e sensıvel

a escolha da dimensao de imersao de (Hegger et al., 1999). A seguir, a

Figura 4.4 apresenta os graficos de recorrencia de (a) um ruıdo aleatorio

estacionario e (b) um ruıdo aleatorio com tendencia.

0 0.5 1 1.5 2

x 105

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2x 10

5

j

i

(a)

0 0.5 1 1.5 2

x 105

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2x 10

5

j

i

(b)

Figura 4.4: Graficos de recorrencia.

Graficos de recorrencia: (a) ruıdo aleatorio estacionario e (b) ruıdoaleatorio com tendencia. Os graficos foram obtidos utilizando -sede = 2, ǫ = 0,001 e N = 200000.


Nota-se, a partir da Figura 4.4(a), que, em series temporais estaciona-

rias, os pontos estao distribuıdos uniformemente no grafico, enquanto que,

para series nao estacionarias, os pontos localizam-se proximos a linha de

identidade (Figura 4.4(b)), indicando tendencia.

Desta forma, para se verificar a estacionariedade da serie temporal do

pendulo duplo, gerou-se o grafico de recorrencia, como mostra a Figura

4.5. Conforme comentado anteriormente, verifica-se a estacionariedade

dos dados observando-se a distribuicao uniforme dos pontos no grafico.

0 0.5 1 1.5 2

x 105

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2x 10

5

j

i

Figura 4.5: Grafico de recorrencia da serie temporal do pendulo duplo.

O grafico foi obtido utilizando -se de = 2, ǫ = 0,001 e N = 196131.

4.4 Caos Determinıstico

Entende-se por sistemas caoticos aqueles que apresentam as seguintes ca-

racterısticas (Fiedler-Ferrara e Prado, 1994):

4.5 Reconstrucao do Espaco de Estados 51

• imprevisibilidade, isto e, o conhecimento do estado inicial do sis-

tema com grande, mas finita precisao nao permite predizer sua evo-

lucao temporal para intervalos arbitrariamente grandes de tempo,

com pequeno erro. Essa caracterıstica esta associada a dependencia

sensitiva as condicoes iniciais apresentadas por esses sistemas;

• espectro contınuo de frequencias, caracterizando um comportamento

aperiodico;

• invarianca de escala, significando uma certa estrutura no espaco de

estados com caracterısticas de autossimilaridade;

• estacionariedade, isto e, embora aperiodicos, os sinais gerados por

esses sistemas apresentam caracterısticas estatısticas invariantes no

tempo.

Para que um sistema autonomo contınuo apresente comportamento

caotico, e necessario que ele seja nao -linear, dissipativo e apresente, pelo

menos, dimensao tres. No caso de sistemas discretos (mapas), pode ha-

ver caos em sistemas unidimensionais autonomos. Tanto para sistemas de

tempo discreto, quanto para os de tempo contınuo, a sensibilidade as con-

dicoes iniciais e avaliada por meio do calculo dos expoentes de Lyapunov,

como sera visto na Secao 4.6. Alem disso, um sistema caotico apresenta

atrator estranho1. Ele e estranho porque, usualmente, apresenta detalhes

em escalas infinitesimalmente pequenas. Uma figura com tal caracterıstica

e chamada de fractal.

4.5 Reconstrucao do Espaco de Estados

A metodologia de reconstrucao do espaco de estados, apresentada no Ca-

pıtulo 3, foi introduzida por Packard et al. (1980) e provada matematica-

mente por Takens (1981). Essa tecnica e aplicada quando se tem apenas

a medicao de um dos estados do sistema, isto e, de apenas um observavel.

Takens, em seu trabalho, demonstrou que e possıvel reconstruir certas pro-

priedades topologicas do atrator original a partir de vetores y(k) extraıdos

de uma serie temporal x(k) do sistema, ou seja:

y(k) = x(k), x(k + τ), . . . , x(k + (de − 1)τ), (4.2)

1A palavra atrator estranho foi introduzida por Ruelle e Takens (1971).


em que τ e o atraso de tempo e de e a dimensao de imersao.

Para que se tenha seguranca em relacao aos resultados, e necessario re-

construir o atrator em um espaco de estados com dimensao suficientemente

elevada, desta forma, Takens estabeleceu que uma dimensao de imersao

de suficiente seria:

de > 2 dA, (4.3)

sendo que dA e a dimensao original2 do atrator a ser reconstruıdo.

Nota-se, a partir da Equacao (4.2), que a determinacao de de e τ e

necessaria no processo de reconstrucao. Uma dificuldade encontrada para

se determinar de, a partir da Equacao (4.3), e que, normalmente, quando

se trabalha com series temporais, se desconhece o valor de dA. Em relacao

ao valor de τ , qualquer valor poderia ser utilizado, desde que a serie dispo-

nıvel fosse infinita e livre de ruıdo (Abarbanel, 1995), o que, em situacoes

praticas, seria impossıvel. Desta forma, para se determinar os valores de

de e τ , serao utilizados os metodos dos falsos vizinhos (Kennel et al., 1992)

e de informacao mutua (Fraser e Swinney, 1986) respectivamente.

4.5.1 O Metodo da Informacao Mutua

O metodo proposto por Fraser e Swinney (1986) baseia-se na ideia de

informacao mutua introduzida por Shannon (1948). Para se encontrar o

valor de τ , utiliza-se uma caracterıstica intrınseca aos sistemas caoticos:

a geracao de informacao. Essa geracao ocorre devido a sensibilidade as

condicoes iniciais, que faz com que a taxa de divergencia entre condicoes

iniciais muito proximas cresca exponencialmente.

A geracao de uma nova informacao pode ser entendida como se segue:

considera-se que, em um espaco de fases, a distancia entre dois pontos

iniciais seja dada por ‖x1(0) − x2(0)‖2 e que ‖x1(0) − x2(0)‖2 < ǫ < r,

sendo que r representa a melhor resolucao disponıvel, tal que os pontos nao

possam ser distinguıveis. Apos um certo tempo δt, devido a divergencia

exponencial, os pontos x1(δt) e x2(δt) passarao a ser distinguıveis, ou seja,

‖x1(δt) − x2(δt)‖2 > r.

Para se quantificar a informacao, utiliza-se o criterio de informacao

mutua. Sejam dois conjuntos A e B que contem possıveis valores para as

variaveis aleatorias a e b. O valor de informacao mutua entre dois valores

2Tambem conhecida por dimensao de Hausdorff ou dimensao fractal.


a = ai e b = bj e dado por:

Iai, bj= log2

(

PA, B(ai, bj)

PA(ai)PB(bj)

)

, (4.4)

sendo que PA, B(ai, bj) e a probabilidade conjunta de se observar simulta-

neamente a = ai ∈ A e b = bj ∈ B; PA(ai) e PB(bj) sao as probabilidades

de se observar a = ai ∈ A, e b = bj ∈ B de forma independente, ou seja,

supondo que nao haja dependencia estatıstica entre as variaveis aleatorias

a e b. Quando se utiliza o logaritmo da Equacao (4.4) na base dois, o

resultado de informacao mutua e dado em bits.

Seguindo a linha de raciocınio, a Equacao (4.4) pode ser estendida

para quantificar a informacao mutua de todas as possıveis medidas dos

conjuntos A e B. Desta forma, tem-se uma medida da informacao mutua

media entre os valores dos conjuntos A e B, que e fornecida a partir da

seguinte equacao:

IA, B =∑

ai, bj

PA, B(ai, bj) log2

(

PA, B(ai, bj)

PA(ai)PB(bj)

)

. (4.5)

Um procedimento para se obter as distribuicoes de probabilidade e uti-

lizar histogramas construıdos seguindo uma particao do espaco de estados

em caixas n−dimensionais com a contagem de pontos contidos em cada

uma delas.

Para uma serie temporal x(k) devidamente amostrada, o valor de τ nao

pode ser muito pequeno, pois, desta forma, os valores de x(k) e x(k + τ)

estariam fortemente correlacionados e os pontos do atrator reconstruıdo

ficariam comprimidos junto a diagonal que forma o espaco de fases. Ao

contrario, se τ for muito grande, x(k) e x(k + τ) seriam pouco correlaci-

onados. Desta forma, o objetivo do metodo e encontrar um valor τ que

minimize a informacao mutua I(τ) garantindo que a reconstrucao do atra-

tor utilize o menor nıvel de informacao redundante e permitindo que x(k)

e x(k + τ) ainda estejam correlacionados.

Reescrevendo a Equacao (4.5) em termos de x(k), tem-se:

I(τ) =∑

x(k), x(k+τ)

P (x(k), x(k + τ)) log2

(

P (x(k), x(k + τ))

P (x(k))P (x(k + τ))

)

. (4.6)


De acordo com Fraser e Swinney (1986), observando-se um grafico de

I(τ), o seu primeiro mınimo indicaria uma boa escolha para τ . A Figura

4.6 apresenta um grafico de I(τ) obtido a partir da serie temporal θ1 do

pendulo. Nota-se que o valor de τ obtido para o primeiro mınimo de I(τ)

e igual 10. Ressalta-se que, em Firmo (2007), o primeiro mınimo ocorreu

em τ = 16. A diferenca nos resultados se deve as diferentes taxas de

amostragem empregadas em ambos os trabalhos.

0

0.5

1

1.5

2

2.5

3

0 10 20 30 40 50 60 70 80 90

τ

I(τ

)

Figura 4.6: Grafico de I(τ) obtido a partir da serie temporal θ1 do pendulo.

O primeiro mınimo de I(τ) indica um valor adequado para τ .

4.5.2 O Metodo dos Falsos Vizinhos

O metodo introduzido por Kennel et al. (1992) e capaz de determinar uma

dimensao mınima necessaria para imergir um atrator. Essa dimensao e ob-

tida por meio da analise da variacao das distancias entre pontos proximos

(vizinhos) num espaco de fases reconstruıdo para diferentes valores de di-

mensao de imersao de. Esses pontos proximos podem ser:

• vizinhos no tempo. Esses vizinhos sao triviais e aparecem devido a

sequencia de pontos no tempo. Por exemplo, os vizinhos triviais do

ponto y(k) sao os pontos y(k − 1) e y(k + 1);


• vizinhos devido a dimensao de imersao insuficiente. Esses sao cha-

mados falsos vizinhos e existem apenas devido a uma dimensao de

imersao mal determinada e que devem ser eliminados;

• vizinhos devido a dinamica. Sao os verdadeiros vizinhos e existem

devido as caracterısticas recorrentes do sistema. A distancia entre

eles nao muda de maneira significativa quando se aumenta a dimen-

sao de imersao.

Quando um atrator e reconstruıdo em uma dimensao menor que a

necessaria, pontos que estao afastados no espaco original ficam proximos

devido aos efeitos de projecao. A distancia entre os falsos vizinhos tende

a aumentar quando a dimensao de imersao e aumentada de de para de +1.

Desta forma, quando o numero de falsos vizinhos chega a zero (ou proximo

de zero) significa que o atrator tera sido suficientemente “desdobrado” e a

dimensao encontrada e a menor dimensao de imersao capaz de representa-

lo.

Para se determinar se um vizinho e verdadeiro ou falso, sao realizados

dois testes. O primeiro deles considera que um ponto e um falso vizinho

se[

D2de+1(k) − D2

de(k)

D2de

(k)

]12

> Lc, (4.7)

sendo que D2de

(k) representa o quadrado da distancia entre dois pontos

(um ponto e o seu vizinho mais proximo) num atrator reconstruıdo com

dimensao de, D2de+1(k) representa o quadrado da distancia para os mesmos

pontos num espaco reconstruıdo com dimensao de + 1 e Lc e um valor de

distancia crıtica. Entretanto, devido ao numero finito de pontos dispo-

nıveis nas aplicacoes praticas, podem ser encontradas situacoes em que o

vizinho mais proximo esta a uma distancia da ordem do tamanho do atra-

tor. Como o metodo proposto representa apenas uma condicao necessaria,

mas nao suficiente, foi estabelecido um segundo criterio:

Dde+1(k)

LA> Ac, (4.8)

em que LA e o tamanho tıpico do atrator e Ac e um limite crıtico (cons-

tante). Pode se mostrar que, se o vizinho mais proximo de um ponto qual-

quer estiver muito longe, isto e, Dde(k) ≈ LA, e ele for um falso vizinho,


entao, para uma dimensao de imersao de + 1, tem-se que Dde+1(k) ≈ 2LA

(Fiedler-Ferrara e Prado, 1994). Desta forma, um falso vizinho e um ponto

que satisfaz os dois criterios apresentados pelas Equacoes (4.7) e (4.8).

A Figura 4.7 apresenta um grafico de aplicacao do metodo de falsos

vizinhos a serie temporal θ1 do pendulo, utilizando-se o valor de τ = 10

obtido na secao anterior. Nota-se que, para de = 5, a quantidade de falsos

vizinhos foi de aproximadamente 2%.

0

10

20

30

40

50

60

70

80

90

100

1 2 3 4 5 6 7 8

fals

os

viz

inhos

(%)

de

Figura 4.7: Grafico de aplicacao do metodo de falsos vizinhos a serie temporalθ1 do pendulo.

O valor mınimo obtido para a dimensao de imersao foi de = 5.

Apesar de os resultados indicarem uma dimensao de imersao de = 5,

optou-se por investigar o comportamento dos invariantes dinamicos para

a faixa de dimensoes de de = 5 a de = 7, como sera visto nas proximas

secoes. Destaca-se que, em Firmo (2007), foi encontrado o mesmo valor

para dimensao de imersao.

4.5.3 Reconstrucao do Atrator do Pendulo Duplo

A partir da serie temporal θ1 e dos resultados encontrados para τ e de,

utilizou-se a Equacao (4.2) para reconstruir o atrator do pendulo duplo.

4.6 Expoentes de Lyapunov 57

A Figura 4.8 mostra a projecao tridimensional do atrator reconstruıdo a

partir dos dados reais.

−3−2

−1 0

1 2

3 4 −4

−3−2

−1 0

1 2

3 4

−4−3−2−1 0 1 2 3 4

−4

x(k + 2τ)

x(k + τ)x(k)

Figura 4.8: Projecao tridimensional do atrator reconstruıdo a partir dos dadosreais.

Reconstrucao obtida para τ = 10 e de = 5.

4.6 Expoentes de Lyapunov

Os expoentes de Lyapunov3 sao grandezas que medem a divergencia expo-

nencial de trajetorias vizinhas ao longo de uma certa direcao no espaco de

estados do sistema, quantificando a dependencia do sistema as condicoes

iniciais. E a principal grandeza utilizada para caracterizar o comporta-

mento caotico (Abarbanel, 1995).

Considere um conjunto de pontos vizinhos, y0, contidos em uma hipe-

resfera de raio ǫ(t0) cujo centro e um ponto inicial x0 pertencente a uma

trajetoria no espaco de estados. Em curto espaco de tempo, ocorre uma

deformacao dessa hiperesfera gerando um objeto aproximadamente hipe-

relipsoidal com eixos principais ǫi(t) (Figura 4.9), sendo i = 1, 2, . . . , m,

em que m representa o numero de equacoes diferenciais ordinarias.

3Na literatura, tambem sao conhecidos como expoentes caracterısticos de Lyapunovou numeros de Lyapunov.


x0

ǫ2(t)

ǫ1(t)

ǫ(t0)

Figura 4.9: Ilustracao da deformacao de uma hiperesfera num objeto hiperelip-soidal.

Depois de um tempo t, a hiperesfera de raio ǫ(t0) torna-se um hipe-relipsoide com eixos principais ǫ1(t) e ǫ2(t). Na figura, considera-sedinamica linear local, sendo ilustrado o caso bidimensional.

Desta forma, os expoentes de Lyapunov medem o crescimento expo-

nencial dos eixos principais ǫi, ou seja, ǫi(t) ≈ ǫi(t0)eλi(t−t0) e sao definidos

por:

λi =1

(t − t0)ln

(

ǫi(t)

ǫi(t0)

)

. (4.9)

Nota-se que a existencia de um ou mais expoentes de Lyapunov posi-

tivos indica uma instabilidade orbital nas direcoes associadas.

Os expoentes de Lyapunov fornecem informacoes importantes sobre um

sistema como, por exemplo, sobre a sua natureza. Assim, para sistemas

conservativos, tem-se que:m∑

i=1

λi = 0, (4.10)

enquanto que, para sistemas dissipativos, tem-se:

m∑

i=1

λi < 0. (4.11)


O tipo de atrator existente tambem pode ser determinado a partir dos

expoentes. Como, por exemplo, para um sistema tridimensional (m = 3),

tem-se:

• λ1, λ2 e λ3 < 0, indicam a contracao das tres direcoes para um unico

ponto. Logo, tem-se um ponto fixo;

• λ1, λ2 < 0 e λ3 = 0, significa contracao em duas direcoes e um

deslocamento na terceira direcao, indicando a existencia de um ciclo

limite;

• λ1 < 0, λ2 e λ3 = 0, existem duas direcoes ao longo das quais ocorrem

deslocamentos e, para essa condicao, tem-se um toro bidimensional;

• λ1 = 0, λ2 < 0 e λ3 > 0, existe uma direcao de divergencia expo-

nencial, caracterıstica de sistemas caoticos. Logo, tem-se um atrator

estranho. Um sistema que apresenta comportamento caotico tem,

pelo menos, um expoente de Lyapunov positivo. Sistemas que apre-

sentam mais de um expoente de Lyapunov positivo sao denominados

hipercaoticos.

4.6.1 Expoentes de Lyapunov a Partir de Series

Temporais

Na pratica, calculam-se analiticamente expoentes de Lyapunov em

pouquıssimos casos (Fiedler-Ferrara e Prado, 1994). Na maioria dos ca-

sos, calculam-se tais expoentes a partir de series temporais utilizando-se

metodos baseados em calculos numericos. Entre esses metodos, pode se

destacar o trabalho de Sano e Sawada (1985), no qual os autores propoem

a estimacao de todo o espectro de expoentes de Lyapunov a partir de

uma unica serie temporal e de uma aproximacao da matriz jacobiana do

sistema. Geralmente, esse espectro e estimado em um espaco de estados

reconstruıdo, o que poderia levar a um numero elevado de expoentes se

a dimensao de imersao de for superior a dimensao real do sistema. Esses

expoentes extras sao conhecidos como expoentes de Lyapunov espurios.

A estimacao dos expoentes de Lyapunov e tida como uma tarefa nao

trivial. Geralmente, estima-se somente o maior deles, λ1, que parece apro-

priado para caracterizar sistemas caoticos por dois motivos. Em primeiro

lugar, na maioria das vezes, λ1 e o unico expoente positivo. Em segundo


lugar, essa informacao da uma ideia da previsibilidade do sistema (Ro-

senstein et al., 1993). Alem disso, o maior expoente de Lyapunov tem

sido utilizado para comparar modelos identificados (Correa, 1997; Prin-

cipe et al., 1992; Abarbanel et al., 1989).

O metodo de Wolf et al. (1985) foi o primeiro metodo proposto para

se estimar o maior expoente de Lyapunov a partir de series temporais. In-

felizmente, esse metodo apresenta alguns problemas como a sensibilidade

a presenca de ruıdo e a necessidade de longas series para que haja con-

vergencia da estimativa. Desta forma, foram propostos por Kantz (1994)

e Rosenstein et al. (1993) dois metodos equivalentes baseados no metodo

de Wolf et al. (1985), mas que apresentam a vantagem de serem mais ro-

bustos a presenca de ruıdo e de utilizarem series temporais mais curtas.

Tais metodos se diferem somente no modo como consideram os pontos

vizinhos.

Para se obter λ1, ambos os metodos utilizam o seguinte procedimento:

a partir do espaco de estados reconstruıdo, escolhe-se um ponto de refe-

rencia nesse espaco, denotado por yi. Selecionam-se pontos vizinhos y′i a

esse ponto dentro de uma vizinhanca Yi de diametro ǫ. Calcula-se a media

das distancias dos pontos vizinhos a yi em funcao da evolucao temporal de

k passos. Apos o procedimento de media, determina-se o logaritmo, res-

ponsavel em fornecer a divergencia media local das trajetorias proximas.

O maior expoente de Lyapunov da serie temporal e obtido por meio dos

valores encontrados por esse procedimento aplicado em todo o atrator. O

calculo utilizado nesse procedimento e descrito pela seguinte equacao:

S(k) =1

N

N∑

i=1

ln

1

‖ Yi ‖

∑

y′

i∈ Yi

‖ yi+k − y′i+k ‖

, (4.12)

sendo que N representa o tamanho da serie.

Se S(k) exibir um crescimento linear identico para diversos valores de

de, pode-se estimar λ1 por meio de sua inclinacao, ou seja,

S(k) ∼= λ1k + c, (4.13)

em que c e a constante relacionada a distancia inicial entre os pontos

vizinhos.

Nota-se, a partir das Equacoes (4.12) e (4.13), que os metodos de Kantz


(1994) e Rosenstein et al. (1993) nao assumem divergencia exponencial,

mas a identificam pelo comportamento linear com inclinacao diferente de

zero. Alem disso, por meio do processo de media, os efeitos do ruido sao

minimizados.

Maior Expoente de Lyapunov do Pendulo Duplo

Nesta secao, apresentam-se as estimativas do maior expoente de Lyapunov

calculado para a serie temporal θ1 do pendulo utilizando os metodos de

Kantz (1994) e Rosenstein et al. (1993). Os resultados obtidos sao com-

parados com os resultados encontrados por Firmo (2007) a fim de serem

validados. As Figuras 4.10 e 4.11 apresentam os graficos obtidos para S(k)

aplicando-se os metodos.

−2.5

−2

−1.5

−1

−0.5

0

0 50 100 150 200 250k

S(k

)

de = 5

de = 6

de = 7

Figura 4.10: Grafico de S(k) obtido por meio da aplicacao do metodo de Kantz(1994) a serie temporal θ1 do pendulo.

Calcularam-se as curvas S(k) para as dimensoes de imersao de = 5a de = 7.


−2.5

−2

−1.5

−1

−0.5

0

0 50 100 150 200 250k

S(k

)

de = 6

de = 7

de = 5

Figura 4.11: Grafico de S(k) obtido por meio da aplicacao do metodo Rosens-tein et al. (1993) a serie temporal θ1 do pendulo.

Calcularam-se as curvas S(k) para as dimensoes de imersao de = 5a de = 7.

A partir da analise da inclinacao das curvas S(k) para diferentes dimen-

soes de imersao, estimaram-se4 os valores do maior expoente de Lyapu-

nov5. Os valores encontrados sao apresentados na Tabela 4.1, juntamente

com os valores obtidos por Firmo (2007)6.

Verifica-se que os resultados foram proximos do resultado obtido por

Firmo (2007) ao aplicar o metodo de Rosenstein et al. (1993). No trabalho

de Firmo (2007), considerou-se que o resultado obtido, aplicando-se o

metodo de Rosenstein et al. (1993), estaria mais proximo do real devido ao

fato de tal metodo apresentar melhores resultados para sistemas contınuos.

4As estimativas encontradas para os expoentes de Lyapunov e para a dimensao decorrelacao foram obtidas por meio de regressao linear. O valor de incerteza apresentadoe duas vezes o desvio padrao encontrado para cada estimativa.

5Para se obter os resultados em bits/s, deve-se multiplica-los pela frequencia deamostragem dos dados.

6O autor, em seu trabalho, nao apresentou como foram obtidas as incertezas asso-ciadas as grandezas estimadas.

4.7 Dimensao Fractal 63

Tabela 4.1: Valores estimados para o maior expoente de Lyapunov a partir daserie temporal θ1 do pendulo.

Metodo de λ1 (Firmo, 2007) λ1

Kantz (1994) 5 − 7 0,69 ± 0,09 bits/s 0,503 ± 0,026 bits/s

Rosenstein et al. (1993) 5 − 7 0,50 ± 0,02 bits/s 0,495 ± 0,018 bits/s

4.7 Dimensao Fractal

A dimensao fractal e um outro invariante dinamico utilizado, neste traba-

lho, para validacao dos modelos a serem apresentados no Capıtulo 5. Em

geral, o termo dimensao faz mencao a dimensao Euclidiana. Um conjunto

finito de pontos, por exemplo, tem dimensao zero; ja uma linha tem di-

mensao um; uma superfıcie, dimensao dois, etc. Ao contrario, a dimensao

de um sistema caotico nao e inteira, sendo essa conhecida como dimensao

fractal.

Na literatura, encontram-se algumas das metricas utilizadas para se

determinar o valor da dimensao fractal de um atrator. A primeira delas,

apresentada por Kolmogorov (1958), se baseia no princıpio de contagem de

caixas. Cobre-se o atrator por hipercubos de lado ǫ e conta-se o numero de

caixas (hipercubos), N(ǫ), que contem, pelo menos, um ponto do atrator

utilizando diferentes valores de ǫ. Sendo assim, a dimensao de contagem

de caixas, D0, e obtida por:

D0 = limǫ→0

log N(ǫ)

log (1/ǫ). (4.14)

Muitos atratores estranhos nao sao homogeneos, ou seja, algumas de

suas regioes sao mais visitadas do que outras. Desta forma, para se ca-

racterizar um atrator, faz-se necessario o calculo de outras dimensoes que

levam em conta suas nao -homogeneidades. Tais dimensoes foram propos-

tas, em 1957, por J. Belatoni e A. Renyi e se baseiam na frequencia relativa

pi com que cada caixa i e visitada. A frequencia pi e definida como:

pi = limN→∞

Ni

N, (4.15)


sendo N o numero total de pontos que pertencem ao atrator e Ni o numero

de pontos da i-esima caixa.

Entre as dimensoes generalizadas de Renyi, as mais relevantes (alem

de D0) sao a dimensao de informacao, D1, calculada por:

D1 = limǫ→0

∑N(ǫ)i=1 pi log pi

log(1/ǫ)(4.16)

e a dimensao de correlacao, D2:

D2 = limǫ→0

log∑N(ǫ)

i=1 pi2

log(ǫ). (4.17)

Na realidade, e possıvel mostrar que:

D2 ≤ D1 ≤ D0, (4.18)

sendo que a igualdade so ocorre em atratores homogeneos.

Quando se trabalha com series temporais reais, e usual calcular D2 ao

inves de D0 por dois motivos: o algoritmo utilizado para calcular D0 exige

um esforco computacional muito maior quando comparado ao algoritmo

utilizado para se calcular D2, principalmente quando D0 > 2. O outro

motivo esta no fato de, ao se calcular D2, obtem-se um limite inferior para

o valor de D0, visto que a relacao (4.18) e verdadeira (Monteiro, 2006).

Portanto, neste trabalho, sera estimado o valor da dimensao de correla-

cao D2 utilizando-se o metodo desenvolvido por Grassberger e Procaccia

(1983), apresentado a seguir.

4.7.1 O Metodo de Grassberger-Procaccia

O metodo desenvolvido por Grassberger e Procaccia (1983) foi responsavel

pela popularizacao da dimensao de correlacao nos ultimos anos devido

a sua facil implementacao. O metodo consiste em aproximar o termo∑N(ǫ)

i=1 pi2, que aparece na Equacao (4.17) e representa a frequencia relativa

com que dois pontos de um atrator caem na i-esima caixa de tamanho ǫ,

pela frequencia relativa na qual esses pontos estao separados por uma

distancia menor que ou igual a ǫ. Seja q(ǫ) a fracao de pontos do atrator

que esta dentro de uma hiperesfera de raio ǫ, centrada em xi. Tal fracao


pode ser representada por:

q(ǫ) =1

N

N∑

k=1

Θ(ǫ − ‖xi − xk‖), (4.19)

sendo que Θ( · ) representa a funcao de Heaviside.

Define-se a funcao de correlacao C(ǫ) como o valor medio de q(ǫ),

calculado sobre todos os pontos xi:

C(ǫ) =1

N

N∑

i=1 (i6=k)

q(ǫ). (4.20)

Para uma superfıcie fractal, tem-se que C e proporcional a ǫD2 , ou seja:

D2∼= lim

N→∞

(

limǫ→0

log C(ǫ)

log ǫ

)

. (4.21)

Para se obter uma maior confiabilidade nos resultados apresentados

pela Equacao (4.21), calcula-se D2 para varios valores de dimensao de

imersao. A partir do grafico de D2(ǫ, d) por ǫ, sendo que d representa

as varias dimensoes de imersao maiores que ou igual a de, estima-se a

dimensao de correlacao observando-se uma regiao linear para onde as cur-

vas convergem, denominada plateau. A Figura 4.12 mostra o grafico de

D2(ǫ, d) por ǫ obtido para o atrator reconstruıdo a partir da serie temporal

θ1 do pendulo.

A dimensao de correlacao encontrada foi igual a D2(ǫ, d) = 3,93±0,06.

Ressalta-se que Firmo (2007) obteve D2(ǫ, d) = 3,94 ± 0,02.


Neste capıtulo, descreveram-se os metodos utilizados na caracterizacao di-

namica do pendulo duplo e na validacao dos modelos encontrados para a

serie temporal referente a variavel θ1, apresentados no Capıtulo 5. Os al-

goritmos utilizados pertencem ao pacote computacional TISEAN (Hegger

et al., 1999). Os resultados obtidos por tais algoritmos foram comparados

com os encontrados em Firmo (2007).

Em relacao aos algoritmos, destaca-se que eles apresentam um grande


numero de parametros livres que devem ser ajustados de modo que o re-

sultado estimado apresente convergencia para o resultado esperado. Outro

fato observado foi a variabilidade dos resultados em funcao de pequenas

variacoes nos valores desses parametros. Por exemplo, para os algorit-

mos de Kantz (1994) e Rosenstein et al. (1993), essa caracterıstica nao

prejudica o diagnostico de existencia ou nao de expoente de Lyapunov

positivo, mas causa flutuacoes na determinacao de seu valor. No caso do

algoritmo de Grassberger e Procaccia (1983), verificou-se que os resulta-

dos obtidos por meio desse apresentam uma sensibilidade ainda maior a

pequenas variacoes nos parametros.

Os fatos descritos anteriormente justificam as diferencas apresentadas

entre os resultados obtidos neste trabalho e os encontrados em Firmo

(2007).

0

5

10

15

20

25

0.01 0.1 1 10

plateau

ǫ

D2(ǫ

,d)

Figura 4.12: Grafico de D2(ǫ, d) por ǫ obtido para o atrator reconstruıdo apartir da serie temporal θ1 do pendulo.

A linha tracejada indica a regiao de convergencia de D2 para osvarios valores de d que, neste caso, assumiu valores de 5 a 11.

Capıtulo 5

Resultados e Discussoes

“A simplicidade e o ultimo degrau da sabedoria.”

Kalil Gibran

5.1 Introducao

Neste capıtulo, sao apresentados os modelos identificados utilizando-se as

representacoes matematicas apresentadas no Capıtulo 3, a partir da serie

temporal referente a velocidade angular da barra 1, θ1, do pendulo (Figura

2.9). A validacao desses modelos e realizada por meio do calculo dos inva-

riantes dinamicos, descritos no Capıtulo 4. A ordem de apresentacao dos

modelos esta organizada como se segue: primeiramente, sao apresenta-

dos os modelos NARMAX polinomias; em seguida, os modelos NARMAX

racionais e, por ultimo, os modelos fuzzy NARX Takagi-Sugeno. Posteri-

ormente, para cada modelo apresentado, sao mostrados os seus respectivos

invariantes dinamicos.

Durante o processo de identificacao, foram utilizados diferentes tama-

nhos de janelas tomadas ao longo de toda a serie temporal. Diferentes

valores para a taxa de decimacao tambem foram empregados, obviamente

dentro da faixa 20 ≤ ∆ ≤ 100, conforme apresentada na Secao 4.2. Mo-

delos com dinamica caotica foram obtidos para uma taxa de decimacao

∆ = 60. Para essa taxa de decimacao, a nova frequencia de amostragem

dos dados passa a ser 33,33 Hz.

Para a verificacao da manutencao do regime dinamico dos modelos

identificados, esses foram simulados com predicao de infinitos passos a

68 5 Resultados e Discussoes

frente. Nas simulacoes, foram geradas series temporais com duzentas mil

amostras, sendo descartados os modelos que nao mantiveram o seu regime

dinamico durante os testes.

5.2 Modelos NARMAX Polinomiais

Optou-se, primeiramente, pela representacao NARMAX polinomial, pois

essa foi considerada a mais simples entre as tres utilizadas neste trabalho.

Para proceder ao processo de identificacao, escolheu-se, arbitrariamente,

o grau de nao-linearidade ℓ entre 2 e 6. Da mesma forma, selecionou-se o

numero de termos de processo, np, em uma faixa entre 5 e 50 termos e, por

tentativa, o maximo atraso de saıda, ny. Como os modelos identificados

nao apresentam termos de entrada1 e de ruıdo2, diz-se que a representacao

utilizada e a NAR polinomial, que e um caso particular da representacao

NARMAX polinomial.

Uma vez escolhidos o atraso maximo, o numero de termos de processo

e o grau de nao -linearidade, utilizou-se o algoritmo de selecao de estru-

tura ERR, apresentado na Secao 3.2.3, para escolher automaticamente os

termos que melhor explicam a variancia da saıda. Por sua vez, para esti-

mar os parametros, utilizou-se o estimador de mınimos quadrados (MQ).

Foram identificados dois modelos que apresentaram dinamica caotica para

os dados do pendulo. Tais modelos sao apresentados a seguir.

5.2.1 Modelo 1

O modelo 1 foi obtido a partir de uma janela com 500 observacoes, np = 48,

ny = 6 e ℓ = 5. Ressalta-se que, usando-se o algoritmo ERR, nao foiescolhido nenhum termo que apresentasse grau de nao -linearidade igual a6, mesmo quando utilizado ℓ = 6. A equacao a seguir apresenta o modelo1.

y(k) = 3,350 y(k − 1) − 4,380 y(k − 2) + 2,820 y(k − 3)

−0,840 y(k − 4) + 0,243 y(k − 5)3

+0,978×10−1 y(k − 4)y(k − 5)y(k − 6)

−0,188 y(k − 1)3y(k − 3)2 − 0,254×10−1 y(k − 1)y(k − 6)2 . . .

1Isso se deve ao fato de os modelos identificados serem autonomos.2A inclusao de termos de ruıdo durante o processo de identificacao nao alterou

significativamente os valores dos parametros estimados.

5.2 Modelos NARMAX Polinomiais 69

. . . −0,120×102 y(k − 1)3y(k − 2)2 − 0,179×10−1 y(k − 3)5

−1,040 y(k − 1)y(k − 3)4 + 0,119 y(k − 1)2y(k − 3)3

+3,820 y(k − 1)y(k − 2)2y(k − 3)2 − 1,200 y(k − 1)5

+5,770 y(k − 1)4y(k − 2) + 0,128 y(k − 3)2y(k − 5)3

+0,142×102 y(k − 1)2y(k − 2)3

−0,148×10−1 y(k − 2)y(k − 4)2y(k − 5)y(k − 6)

−0,103×102 y(k − 1)y(k − 2)4 + 4,020 y(k − 2)5

−1,230 y(k − 2)4y(k − 3) − 0,239 y(k − 2)2y(k − 5)

−0,315 y(k − 1)2y(k − 4) − 0,322 y(k − 3)2y(k − 6)

+0,958 y(k − 2)y(k − 3)4 − 2,060 y(k − 2)3y(k − 3)2

+0,408×10−1 y(k − 1)y(k − 3)y(k − 5)

+0,143 y(k − 2)3y(k − 3)y(k − 5)

−0,536×10−1 y(k − 1)4y(k − 5) − 0,260 y(k − 3)3y(k − 5)2

+0,179 y(k − 1)y(k − 2)y(k − 6)

+0,533 y(k − 2)y(k − 3)y(k − 5)

−0,334 y(k − 4)y(k − 5)2 + 0,103×10−2 y(k − 1)y(k − 6)4

−0,326×10−1 y(k − 2)2y(k − 4)2y(k − 6)

+0,474×10−2 y(k − 2)y(k − 3)y(k − 6)3

−0,922 y(k − 1)2y(k − 2)y(k − 3)2

−0,103 y(k − 1)y(k − 2)2 − 0,309×10−1 y(k − 5)5

+0,370×10−1 y(k − 4)2y(k − 5)2y(k − 6)

+0,196 y(k − 1)4y(k − 4) + 0,327×10−1 y(k − 2)3y(k − 6)2

−0,187×10−1 y(k − 1)2y(k − 6)3

+0,158 y(k − 1)y(k − 3)2y(k − 4)y(k − 5)

−0,705×10−1 y(k − 1)y(k − 2)2y(k − 4)y(k − 5)

−0,189 y(k − 1)3y(k − 2)y(k − 4) − 0,248×10−2 y(k − 6)5

+0,260 y(k − 1)2y(k − 3).

(5.1)

As Figuras 5.1 e 5.2 apresentam, respectivamente, os graficos da massa

de dados utilizada para se estimar o modelo 1 e um trecho da serie temporal

produzida pelo mesmo. Uma visao bidimensional da projecao tridimensi-


onal do atrator reconstruıdo a partir dessa serie e mostrada na Figura 5.3.

−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

θ 1(r

ad/s)

Figura 5.1: Grafico da massa de dados utilizada para se estimar o modelo 1.

No grafico, estao representadas 500 amostras.

−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

y(k

)(r

ad/s)

Figura 5.2: Grafico de um trecho da serie temporal produzida pelo modelo 1.



−3−2

−1 0

1 2

3 4 −4

−3−2

−1 0

1 2

3 4

−4−3−2−1 0 1 2 3 4

−4

y(k + 2τ)

y(k)y(k + τ)

Figura 5.3: Visao bidimensional da projecao tridimensional do atrator recons-truıdo a partir da serie temporal gerada pelo modelo 1.


5.2.2 Modelo 2

O segundo modelo identificado foi obtido a partir de um outro trecho daserie, diferente da empregada para se obter o modelo 1. Tambem foramutilizadas 500 amostras, np = 48, ny = 6 e ℓ = 5. A Equacao (5.2)apresenta o modelo.

y(k) = 3,400 y(k − 1) − 4,310 y(k − 2) + 2,450 y(k − 3)

−0,542 y(k − 4) + 0,219 y(k − 5)3 + 0,532 y(k − 4)y(k − 5)y(k − 6)

+2,770 y(k − 1)3y(k − 3)2 − 0,562×10−1 y(k − 1)y(k − 6)2

−0,366×10+2 y(k − 1)3y(k − 2)2 − 0,347 y(k − 3)5

−1,580 y(k − 1)y(k − 3)4 + 1,540 y(k − 1)2y(k − 3)3

+0,114×10+2 y(k − 1)y(k − 2)2y(k − 3)2 − 2,590 y(k − 1)5

+0,150×10+2 y(k − 1)4y(k − 2) − 0,531×10−1 y(k − 3)2y(k − 5)3

+0,466×10+2 y(k − 1)2y(k − 2)3

+0,106 y(k − 2)y(k − 4)2y(k − 5)y(k − 6)

−0,305×10+2 y(k − 1)y(k − 2)4 + 7,790 y(k − 2)5

+1,580 y(k − 2)4y(k − 3) − 2,740 y(k − 2)2y(k − 5)

−0,469 y(k − 1)2y(k − 4) − 0,718 y(k − 3)2y(k − 6) . . .


. . . +1,900 y(k − 2)y(k − 3)4 − 6,440 y(k − 2)3y(k − 3)2

−1,050 y(k − 1)y(k − 3)y(k − 5)

+0,498×10−1 y(k − 2)3y(k − 3)y(k − 5)

−0,539×10−1 y(k − 1)4y(k − 5) − 0,131×10−1 y(k − 3)3y(k − 5)2

+0,978 y(k − 1)y(k − 2)y(k − 6) + 2,320 y(k − 2)y(k − 3)y(k − 5)

−0,673 y(k − 4)y(k − 5)2 + 0,255×10−1 y(k − 1)y(k − 6)4

−0,226 y(k − 2)2y(k − 4)2y(k − 6)

+0,336×10−1 y(k − 2)y(k − 3)y(k − 6)3

−0,106×10+2 y(k − 1)2y(k − 2)y(k − 3)2 + 0,171 y(k − 1)y(k − 2)2

+0,423×10−1 y(k − 1)y(k − 4)3y(k − 5)

+0,117 y(k − 2)3y(k − 4)y(k − 6) + 0,209 y(k − 3)2y(k − 5)

−0,606 y(k − 1)2y(k − 6) + 1,980 y(k − 1)y(k − 2)y(k − 5)

+0,477×10−1 y(k − 1)4y(k − 4) − 0,963×10−1 y(k − 5)y(k − 6)2

−0,963×10−1 y(k − 1)y(k − 4)y(k − 6)3 − 0,451×10−2 y(k − 5)y(k − 6)4

+0,578×10−1 y(k − 1)y(k − 4)2y(k − 6)2.

(5.2)



produzida pelo mesmo. Uma visao bidimensional da projecao tridimen-

sional do atrator reconstruıdo a partir dessa serie e mostrada na Figura

5.6.

Analisando-se as figuras referentes aos modelos 1 e 2, nota-se que tais

modelos apresentam comportamentos dinamicos bem diferentes, apesar

de que, para ambos os casos, terem sido escolhidos o mesmo numero de

termos, a mesma quantidade de amostras, bem como o mesmo grau de

nao -linearidade e o mesmo maximo atraso ny.


−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

θ 1(r

ad/s)



−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

y(k

)(r

ad/s)

Figura 5.5: Grafico da serie temporal produzida pelo modelo 2.



−3−2

−1 0

1 2

3 4 −4

−3−2

−1 0

1 2

3 4

−4−3−2−1 0 1 2 3 4

−4

y(k) y(k + τ)

y(k + 2τ)



5.3 Modelos NARMAX Racionais

Funcoes racionais sao mais gerais e capazes de representar com exatidao

certos tipos de singularidades, ou caracterısticas proximas de singular,

alem de operar em faixas infinitas (Correa, 1997). Desta forma, optou-

se pela utilizacao da representacao NARMAX racional, pois essa e mais

eficiente na descricao das varias nao -linearidades existentes em um pro-

cesso quando comparada a representacao polinomial.

O processo de identificacao, empregando-se a representacao NARMAX

racional, passou pelos mesmos caminhos utilizados para se obterem os

modelos polinomiais, descritos na secao anterior. Devido ao fato de a

representacao NARMAX racional ser nao -linear nos parametros, utilizou-

se o estimador estendido de mınimos quadrados (EMQ) a fim de se reduzir

os efeitos da polarizacao. Foram identificados dois modelos racionais3 que

apresentaram dinamica caotica para os dados do pendulo. Tais modelos

sao apresentados a seguir.

3Devido ao fato de os modelos identificados serem autonomos, utilizou-se a repre-sentacao NARMA, que e um caso particular da representacao NARMAX.

5.3 Modelos NARMAX Racionais 75

5.3.1 Modelo 3

O modelo 3 foi obtido a partir de uma janela com 500 observacoes, np = 42,ny = 10, ne = 10 e ℓ = 5. As Equacoes (5.3) e (5.4) apresentam o modelo3.

y(k) =1

D×1,94410 y(k − 1) − 1,36370 y(k − 2) + 0,40047 y(k − 3)

−0,19364 y(k − 10) − 0,66264 y(k − 1)y(k − 8)2

+0,39371 y(k − 2)y(k − 8)2 − 0,80976×10−1 y(k − 3)y(k − 8)2

−0,11138×10−2 y(k − 8)y(k − 9)3y(k − 10)

+0,54596×10−1 y(k − 1)y(k − 8)4 − 0,14585×10−1 y(k − 2)y(k − 8)4

−0,46322×10−2 y(k − 3)y(k − 8)4

+0,28300×10−1 y(k − 8)y(k − 9)y(k − 10)

−0,30782×10−3 y(k − 1)y(k − 2)2y(k − 6)y(k − 10)

+0,30016×10−1 y(k − 1)2y(k − 3)y(k − 6)y(k − 10)

−0,89318×10−3 y(k − 7)y(k − 9)4

−0,16761×10−1 y(k − 2)2y(k − 6)y(k − 8)y(k − 10)

−0,36679×10−2 y(k − 1)2y(k − 2)y(k − 6)y(k − 10)

−0,74365×10−1 y(k − 1)3 + 0,33702×10−1 y(k − 2)2y(k − 9)

−0,70335×10−1 y(k − 1)y(k − 3)y(k − 9)

+0,17602×10−3 y(k − 2)y(k − 3)y(k − 4)3

−0,40721×10−1 y(k − 1)2y(k − 3) + 0,11229 y(k − 1)2y(k − 10)

−0,16732×10−1 y(k − 1)4y(k − 10)

+0,75006×10−2 y(k − 3)y(k − 7)2y(k − 9)y(k − 10)

+0,96931×10−1 y(k − 9)

−0,87089×10−2 y(k − 2)y(k − 7)y(k − 8)2y(k − 10)

+0,38141×10−2 y(k − 2)3y(k − 3)y(k − 9)

+10∑

i=1

θiξ(k − i) + ξ(k),

(5.3)

sendo,


D = 1 − 0,36182 y(k − 8)2 + 0,35114×10−1 y(k − 8)4

+0,26804×10−1 y(k − 2)y(k − 3)y(k − 6)y(k − 10)

+0,15233×10−2 y(k − 1)y(k − 5)y(k − 6)y(k − 10)

−0,19747×10−1 y(k − 3)y(k − 6)y(k − 8)y(k − 10)

−0,11297×10−2 y(k − 2)2y(k − 6)y(k − 10)

−0,36269×10−1 y(k − 1)2 − 0,10476 y(k − 2)2

+0,27479×10−1 y(k − 2)y(k − 3)

+0,41566×10−2 y(k − 1)y(k − 7)y(k − 9)2

−0,95518×10−3 y(k − 3)y(k − 7)y(k − 8)y(k − 9)

+0,67373×10−1 y(k − 1)y(k − 10) − 0,13269×10−1 y(k − 1)3y(k − 10).

(5.4)



produzida pelo mesmo. Uma visao bidimensional da projecao tridimensi-

onal do atrator reconstruıdo a partir dessa serie e mostrada na Figura 5.9.

−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

θ 1(r

ad/s)




−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500

y(k

)(r

ad/s)

k



−3−2

−1 0

1 2

3 4 −4

−3−2

−1 0

1 2

3 4

−4−3−2−1 0 1 2 3 4

−4

y(k + τ)

y(k + 2τ)

y(k)



5.3.2 Modelo 4

Um outro modelo foi identificado a partir dos dados do pendulo, o modelo4. Para o processo de identificacao, utilizaram-se 500 amostras da serietemporal, np = 34, ny = 8, ne = 10 e ℓ = 5. As Equacoes (5.5) e (5.6)


apresentam o modelo 4.

y(k) =1

D×2,20490 y(k − 1) − 1,77700 y(k − 2) + 0,56612 y(k − 3)

−0,21314 y(k − 8) − 0,93465 y(k − 1)y(k − 7)y(k − 8)

+0,78988 y(k − 2)y(k − 7)y(k − 8)

−0,26914 y(k − 3)y(k − 7)y(k − 8) + 0,27823×10−1 y(k − 8)3

+0,89704×10−1 y(k − 1)y(k − 7)y(k − 8)3

−0,75706×10−1 y(k − 2)y(k − 7)y(k − 8)3

+0,25759×10−1 y(k − 3)y(k − 7)y(k − 8)3

−0,23416×10−2 y(k − 8)5 + 0,142800 y(k − 7)

−0,21611×10−2 y(k − 3)2y(k − 5)

−0,24873×10−3 y(k − 1)y(k − 4)3y(k − 8) − 0,75200×10−1 y(k − 1)5

+0,12110 y(k − 1)4y(k − 2) − 0,45437×10−2 y(k − 1)4y(k − 3)

−0,14119 y(k − 2)2y(k − 8) + 0,17303 y(k − 2)2y(k − 6)

+0,10424×10−2 y(k − 1)y(k − 3)y(k − 4)y(k − 5)y(k − 6)

+0,16358×10−1 y(k − 1)3y(k − 3)y(k − 8)

−0,24942×10−2 y(k − 2)y(k − 3)2y(k − 8)2

−0,35630 y(k − 1)y(k − 2)y(k − 6) + 0,29329 y(k − 1)y(k − 2)y(k − 8)

−0,44758×10−1 y(k − 1)3y(k − 2)2 +

10∑

i=1

θiξ(k − i) + ξ(k),

(5.5)

sendo,

D = 1 − 0,41136 y(k − 7)y(k − 8) + 0,39218×10−1 y(k − 7)y(k − 8)3

−0,30893×10−1 y(k − 1)4 + 0,16344×10−1 y(k − 1)2y(k − 3)y(k − 8)

+0,27396×10−1 y(k − 1)3y(k − 2) + 0,13384 y(k − 2)y(k − 8)

−0,17213 y(k − 2)y(k − 6).

(5.6)

A Figura 5.10 mostra a massa de dados utilizada para se identificar

o modelo anterior. As Figuras 5.11 e 5.12 apresentam, respectivamente,

o grafico da serie temporal produzida pelo modelo 4 e uma visao bidi-


mensional da projecao tridimensional do atrator reconstruıdo a partir da

mesma.

−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

θ 1(r

ad/s)



−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

y(k

)(r

ad/s)




−3−2

−1 0

1 2

3 4 −4

−3−2

−1 0

1 2

3 4

−4−3−2−1 0 1 2 3 4

−4

y(k)y(k + τ)

y(k + 2τ)



5.4 Modelos Fuzzy NARX Takagi-Sugeno

Como alternativa ao uso das representacoes NARMAX polinomiais e racio-

nais, optou-se pela utilizacao da representacao fuzzy NARX Takagi-Sugeno

na obtencao de modelos a partir da serie temporal da velocidade angular

da barra 1. Tal representacao e composta por um conjunto de regras do

tipo Se-entao, apresentada pela Equacao (3.28), que contem modelos li-

neares do tipo ARX. Associadas a essas regras, encontram-se funcoes de

pertinencia responsaveis em fornecer o grau de compatibilidade de cada

variavel premissa ao respectivo conjunto fuzzy4. Ao final, por meio da

soma ponderada dos modelos lineares, obtem-se a representacao NARX.

Portanto, no processo de identificacao dos modelos, faz-se necessaria a

definicao do numero de regras r e do maximo atraso de saıda ny. Destaca-

se que esses foram obtidos por meio de tentativa e erro. Como valores

iniciais para ny, empregaram-se, primeiramente, os valores utilizados para

se obter os modelos anteriormente apresentados. Em relacao ao numero

de regras, iniciou-se com duas regras, evoluindo gradativamente para uma

quantidade maior. Nesse processo de identificacao foram testadas varias

possibilidades ate que fossem obtidos modelos.

4Neste trabalho, sera utilizada a mesma nomenclatura para denotar o conjunto fuzzye a sua funcao de pertinencia.

5.4 Modelos Fuzzy NARX Takagi-Sugeno 81

Uma vez que os modelos sao autonomos, nao se define nu e, conse-

quentemente, obtem-se modelos nao-lineares do tipo NAR. Para se esti-

mar os parametros dos modelos, utilizou-se o algoritmo apresentado na

Secao 3.5.3. Tambem foram identificados dois modelos que apresentaram

dinamica caotica. Tais modelos sao apresentados nas secoes a seguir.

5.4.1 Modelo 5

O primeiro modelo fuzzy NARX TS foi obtido a partir de um conjunto de500 amostras da serie temporal de θ1 utilizando-se r = 10 e ny = 8. Aequacao a seguir apresenta o referido modelo.

1. Se y(k − 1) e A11 e y(k − 2) e A12 e y(k − 3) e A13 e y(k − 4) e A14

e y(k − 5) e A15 e y(k − 6) e A16 e y(k − 7) e A17 e y(k − 8) e A18,

entao:

y1(k) = 3,77×103y(k − 1) − 4,43×103y(k − 2) + 1,80×103y(k − 3)

−7,36×103y(k − 4) + 1,15×104y(k − 5) − 4,79×103y(k − 6)

−3,64×103y(k − 7) + 3,69×103y(k − 8) − 4,20×102



entao:

y2(k) = 1,41×103y(k − 1) + 1,19×103y(k − 2) − 5,83×103y(k − 3)

+1,41×103y(k − 4) + 4,93×103y(k − 5) − 2,14×103y(k − 6)

−4,07×103y(k − 7) + 3,32×103y(k − 8) − 2,57×102



entao:

y3(k) = −9,69×103y(k − 1) + 1,49×104y(k − 2) − 7,26×103y(k − 3)

+1,18×104y(k − 4) − 2,11×104y(k − 5) + 1,30×104y(k − 6)

+4,30×103y(k − 7) − 6,93×103y(k − 8) + 8,09×102



entao:

y4(k) = −2,74×103y(k − 1) + 2,23×103y(k − 2) − 3,77×103y(k − 3)

+1,23×104y(k − 4) − 1,14×104y(k − 5) + 4,53×103y(k − 6)

−1,23×103y(k − 7) + 1,66y(k − 8) − 2,86×101



entao:


y5(k) = 3,96×103y(k − 1) − 8,35×103y(k − 2) + 1,41×104y(k − 3)

−1,93×104y(k − 4) + 1,31×104y(k − 5) − 7,81×103y(k − 6)

+6,69×103y(k − 7) − 2,57×103y(k − 8) + 5,48×102



entao:

y6(k) = 4,88×103y(k − 1) − 1,05×104y(k − 2) + 6,79×103y(k − 3)

−2,27×103y(k − 4) + 4,70×103y(k − 5) − 4,81×103y(k − 6)

−8,18×102y(k − 7) + 2,49×103y(k − 8) − 7,16×102



entao:

y7(k) = −5,79×102y(k − 1) − 8,33×101y(k − 2) + 3,36×102y(k − 3)

+2,60×103y(k − 4) − 3,11×103y(k − 5) + 6,76×102y(k − 6)

+4,92×102y(k − 7) − 3,04×102y(k − 8) + 4,04×101



entao:

y8(k) = −5,88×102y(k − 1) + 3,86×103y(k − 2) − 5,09×103y(k − 3)

+3,10×102y(k − 4) + 1,42×103y(k − 5) + 1,15×103y(k − 6)

−1,40×103y(k − 7) + 2,65×102y(k − 8) − 2,10×102



entao:

y9(k) = 8,47×102y(k − 1) − 1,89×103y(k − 2) + 1,49×,103y(k − 3)

−1,75×102y(k − 4) + 4,20×102y(k − 5) − 8,48×102y(k − 6)

−3,03×102y(k − 7) + 5,74×102y(k − 8) + 9,37×101



entao:

y10(k) = −1,25×103y(k − 1) + 3,02×103y(k − 2) − 2,54×103y(k − 3)

+6,36×102y(k − 4) − 4,90×102y(k − 5) + 1,00×103y(k − 6)

−1,32×101y(k − 7) − 5,45×102y(k − 8) + 1,41×102.

Conforme descrito na Secao 3.5.3, o numero de regras indica o numero

de agrupamentos fuzzy utilizados na obtencao do modelo. A Tabela 5.1

apresenta os valores obtidos para os centros desses agrupamentos.


Tabela 5.1: Valores obtidos para os centros dos agrupamentos fuzzy utilizadosna obtencao do modelo 5.

Regra y(k − 1) y(k − 2) y(k − 3) y(k − 4) y(k − 5) y(k − 6) y(k − 7) y(k − 8)

1 −0,168 −0,174 −0,174 −0,168 −0,159 −0,146 −0,130 −0,111

2 −0,128 −0,165 −0,197 −0,223 −0,242 −0,253 −0,257 −0,253

3 −0,115 −0,137 −0,155 −0,170 −0,180 −0,186 −0,186 −0,180

4 −0,109 −0,127 −0,140 −0,147 −0,148 −0,143 −0,134 −0,121

5 −0,075 −0,093 −0,108 −0,119 −0,126 −0,127 −0,125 −0,119

6 −0,019 −0,044 −0,070 −0,095 −0,119 −0,140 −0,157 −0,168

7 0,029 0,064 0,099 0,132 0,160 0,182 0,195 0,200

8 0,064 0,086 0,104 0,119 0,133 0,143 0,149 0,150

9 0,126 0,138 0,143 0,143 0,138 0,131 0,121 0,109

10 0,151 0,124 0,091 0,053 0,012 −0,031 −0,073 −0,110

Pode-se verificar os centros anteriormente citados observando-se as

funcoes de pertinencia5 do modelo 5 apresentadas na Figura 5.13.

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

0.55

0.6

y(k−1)

µ

A

11

A21

A31

A41

A51

A61

A71

A81

A91

A101

(a)

5As figuras estao ampliadas e, portanto, nao sao apresentados todos os valoresassumidos pelas variaveis que estao nos eixos das abscissas. Isso porque as funcoesde pertinencia permanecem constantes para as regioes que nao estao apresentadas nasfiguras.


−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15

0.1

0.11

0.12

0.13

0.14

0.15

0.16

0.17

0.18

0.19

0.2

y(k−2)

µ

A

12

A22

A32

A42

A52

A62

A72

A82

A92

A102

(b)

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

0.1

0.12

0.14

0.16

0.18

0.2

0.22

0.24

0.26

y(k−3)

µ

A

13

A23

A33

A43

A53

A63

A73

A83

A93

A103

(c)


−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15

0.1

0.12

0.14

0.16

0.18

0.2

0.22

y(k−4)

µ

A14

A24

A34

A44

A54

A64

A74

A84

A94

A104

(d)

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

0.1

0.12

0.14

0.16

0.18

0.2

0.22

0.24

0.26

0.28

y(k−5)

µ

A

15

A25

A35

A45

A55

A65

A75

A85

A95

A105

(e)


−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

0.1

0.15

0.2

0.25

0.3

0.35

y(k−6)

µ

A

16

A26

A36

A46

A56

A66

A76

A86

A96

A106

(f)

−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2

0.1

0.15

0.2

0.25

0.3

0.35

0.4

y(k−7)

µ

A

17

A27

A37

A47

A57

A67

A77

A87

A97

A107

(g)


−0.3 −0.2 −0.1 0 0.1 0.2

0.1

0.15

0.2

0.25

0.3

0.35

y(k−8)

µ

A

18

A28

A38

A48

A58

A68

A78

A88

A98

A108

(h)

Figura 5.13: Funcoes de pertinencia referentes ao modelo 5.

As figuras de (a) a (h) representam as funcoes de pertinencia paracada variavel premissa do modelo.

As Figuras 5.14 e 5.15 apresentam, respectivamente, a massa de da-

dos utilizada no processo de identificacao e um trecho da serie temporal

produzida pelo modelo 5.

−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500k

θ 1(r

ad/s)




−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500

y(k

)(r

ad/s)

k



Uma visao bidimensional da projecao tridimensional do atrator recons-

truıdo a partir dessa serie e mostrada na Figura 5.16.

−3−2

−1 0

1 2

3 4 −4

−3−2

−1 0

1 2

3 4

−4−3−2−1 0 1 2 3 4

−4

y(k)y(k + τ)

y(k + 2τ)



5.4.2 Modelo 6

O segundo modelo fuzzy NARX TS, denominado modelo 6, foi obtido paraum conjunto de 600 amostras da serie temporal em estudo. Tal modelo


apresenta nove regras com ny = 10. A Equacao (5.7) mostra o referidomodelo.


e y(k − 5) e A15 e y(k − 6) e A16 e y(k − 7) e A17 e y(k − 8) e A18

e y(k − 9) e A19 e y(k − 10) e A110,

entao:

y1(k) = 5,18×102y(k − 1) − 5,04×102y(k − 2) + 6,22×103y(k − 3)

−1,47×104y(k − 4) + 1,44×104y(k − 5) − 9,04×103y(k − 6)

+6,86×103y(k − 7) − 5,18×103y(k − 8) + 1,38×102y(k − 9)

+1,81×103y(k − 10) + 5,81



e y(k − 9) e A29 e y(k − 10) e A210,

entao:

y2(k) = 3,97×102y(k − 1) − 1,07×103y(k − 2) − 8,30×103y(k − 3)

+2,10×104y(k − 4) − 2,07×104y(k − 5) + 1,21×104y(k − 6)

−8,17×103y(k − 7) + 7,25×103y(k − 8) − 1,22×103y(k − 9)

−1,97×103y(k − 10) − 2,40×102



e y(k − 9) e A39 e y(k − 10) e A310,

entao:

y3(k) = −1,10×102y(k − 1) + 3,89×102y(k − 2) − 6,90×102y(k − 3)

+8,06×102y(k − 4) − 7,49×102y(k − 5) − 6,14×102y(k − 6)

+1,11×103y(k − 7) + 2,17×102y(k − 8) − 5,90×102y(k − 9)

+1,58×102y(k − 10) − 2,25×102



e y(k − 9) e A49 e y(k − 10) e A410,

entao:

y4(k) = 2,81×101y(k − 1) + 1,42×102y(k − 2) − 5,06×102y(k − 3)

+4,78×102y(k − 4) − 1,82×102y(k − 5) + 6,92×102y(k − 6)

+5,24×101y(k − 7) − 1,57×103y(k − 8) + 1,33×103y(k − 9)

−3,78×102y(k − 10) + 2,25×102



e y(k − 9) e A59 e y(k − 10) e A510,

entao:


y5(k) = −3.84×102y(k − 1) + 6.83×102y(k − 2) + 5.57×103y(k − 3)

−1,34×104y(k − 4) + 1,32×104y(k − 5) − 6,16×103y(k − 6)

+3,05×103y(k − 7) − 4,69×103y(k − 8) + 1,83×103y(k − 9)

+8,47×102y(k − 10) + 5,75×102



e y(k − 9) e A69 e y(k − 10) e A610,

entao:

y6(k) = −9,36×102y(k − 1) − 3,91×102y(k − 2) + 1,42×103y(k − 3)

+1,27×103y(k − 4) − 1,89×103y(k − 5) + 2,49×103y(k − 6)

−6,54×103y(k − 7) + 6,95×103y(k − 8) − 2,55×103y(k − 9)

−9,92×101y(k − 10) − 1,55×102



e y(k − 9) e A79 e y(k − 10) e A710,

entao:

y7(k) = −1.72×103y(k − 1) + 1,85×103y(k − 2) + 2,51×103y(k − 3)

−4,74×103y(k − 4) + 3,16×103y(k − 5) + 3,26×101y(k − 6)

−1,89×103y(k − 7) + 3,49×102y(k − 8) + 7,73×102y(k − 9)

−2,93×102y(k − 10) + 1,78×102



e y(k − 9) e A89 e y(k − 10) e A810,

entao:

y8(k) = 2,67×103y(k − 1) − 2,09×103y(k − 2) − 6,13×103y(k − 3)

+1,04×104y(k − 4) − 8,15×103y(k − 5) + 1,53×103y(k − 6)

+4,12×103y(k − 7) − 2,39×103y(k − 8) + 2,49×101y(k − 9)

−8,13×101y(k − 10) − 2,83×102



e y(k − 9) e A99 e y(k − 10) e A910,

entao:

y9(k) = −4,38×102y(k − 1) + 9,64×102y(k − 2) − 7,38×101y(k − 3)

−1,15×103y(k − 4) + 9,71×102y(k − 5) − 1,06×103y(k − 6)

+1,41×103y(k − 7) − 9,38×102y(k − 8) + 2,76×102y(k − 9)

+5,19y(k − 10) − 8,27×101.


Os centros dos agrupamentos fuzzy utilizados na obtencao do modelo 6,

bem como as funcoes de pertinencia, estao apresentados, respectivamente,

na Tabela 5.2 e na Figura 5.17.

A Figura 5.18 mostra a massa de dados utilizada no processo de

identificacao do referido modelo. Por sua vez, a Figura 5.19 apresenta

um grafico da serie temporal produzida pelo mesmo. Uma visao bidimen-

sional da projecao tridimensional do atrator reconstruıdo a partir dessa

serie e mostrada na Figura 5.20.

925

Res

ult

ados

eD

iscu

ssoe

s

Tabela 5.2: Valores obtidos para os centros dos agrupamentos fuzzy utilizados na obtencao do modelo 6.

Regra y(k − 1) y(k − 2) y(k − 3) y(k − 4) y(k − 5) y(k − 6) y(k − 7) y(k − 8) y(k − 9) y(k − 10)

1 −0,097 −0,116 −0,131 −0,141 −0,147 −0,147 −0,143 −0,134 −0,120 −0,103

2 −0,089 −0,113 −0,133 −0,147 −0,156 −0,158 −0,155 −0,147 −0,135 −0,120

3 −0,081 −0,068 −0,052 −0,034 −0,013 0,008 0,028 0,044 0,058 0,068

4 −0,033 −0,036 −0,037 −0,036 −0,036 −0,037 0,039 −0,041 −0,04 −0,042

5 −0,026 −0,041 −0,054 −0,064 −0,071 −0,074 −0,075 −0,074 −0,071 −0,067

6 0,014 0,010 0,005 −0,000 −0,007 −0,014 −0,021 −0,028 −0,034 −0,038

7 0,032 0,045 0,054 0,061 0,068 0,074 0,079 0,083 0,085 0,083

8 0,044 0,048 0,049 0,048 0,046 0,043 0,040 0,036 0,031 0,025

9 0,063 0,021 −0,022 −0,065 −0,105 −0,143 −0,177 −0,206 −0,227 −0,241


−0.1 −0.05 0 0.05 0.1 0.15

0.12

0.14

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

y(k−1)

µ

A

11

A21

A31

A41

A51

A61

A71

A81

A91

(a)

−0.14 −0.12 −0.1 −0.08 −0.06 −0.04 −0.02 0 0.02 0.04 0.06

0.12

0.14

0.16

0.18

0.2

0.22

0.24

0.26

0.28

0.3

0.32

y(k−2)

µ

A12

A22

A32

A42

A52

A62

A72

A82

A92

(b)


−0.15 −0.1 −0.05 0 0.05

0.11

0.115

0.12

0.125

0.13

0.135

0.14

0.145

0.15

0.155

0.16

y(k−3)

µ

A

13

A23

A33

A43

A53

A63

A73

A83

A93

(c)

−0.15 −0.1 −0.05 0 0.05 0.1

0.11

0.12

0.13

0.14

0.15

0.16

0.17

0.18

y(k−4)

µ

A

14

A24

A34

A44

A54

A64

A74

A84

A94

(d)


−0.15 −0.1 −0.05 0 0.05 0.1

0.115

0.12

0.125

0.13

0.135

0.14

y(k−5)

µ

A

15

A25

A35

A45

A55

A65

A75

A85

A95

(e)

−0.15 −0.1 −0.05 0 0.05 0.1

0.11

0.12

0.13

0.14

0.15

0.16

0.17

0.18

0.19

y(k−6)

µ

A16

A26

A36

A46

A56

A66

A76

A86

A96

(f)


−0.2 −0.15 −0.1 −0.05 0 0.05 0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

0.55

0.6

y(k−7)

µ

A

17

A27

A37

A47

A57

A67

A77

A87

A97

(g)

−0.2 −0.15 −0.1 −0.05 0 0.05 0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

y(k−8)

µ

A

18

A28

A38

A48

A58

A68

A78

A88

A98

(h)


−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

0.55

0.6

0.65

y(k−9)

µ

A

19

A29

A39

A49

A59

A69

A79

A89

A99

(i)

−0.3 −0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15

0.15

0.2

0.25

0.3

0.35

0.4

0.45

y(k−10)

µ

A

110

A210

A310

A410

A510

A610

A710

A810

A910

(j)

Figura 5.17: Funcoes de pertinencia referentes ao modelo 6.

As figuras de (a) a (j) representam as funcoes de pertinencia paracada variavel premissa do modelo.


−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500 600

k

θ 1(r

ad/s)



−4

−3

−2

−1

0

1

2

3

4

0 100 200 300 400 500 600

k

y(k

)(r

ad/s)



5.5 Validacao dos Modelos 99

−3−2

−1 0

1 2

3 4 −4

−3−2

−1 0

1 2

3 4

−4−3−2−1 0 1 2 3 4

−4

y(k) y(k + τ)

y(k + 2τ)



5.5 Validacao dos Modelos

Esta secao e destinada a validacao dos modelos identificados anterior-

mente. A validacao tem por objetivo verificar a eficiencia desses mode-

los na reproducao da dinamica apresentada pelos dados reais. Para tal,

comparar-se-ao as projecoes tridimensionais dos atratores reconstruıdos e

seus invariantes dinamicos com aqueles obtidos para os dados reais. Os

invariantes dinamicos em questao sao o maior expoente de Lyapunov e a

dimensao fractal.

Primeiramente, sao apresentados os valores dos invariantes dinamicos

calculados para os modelos identificados, juntamente com aqueles obti-

dos para os dados reais. A Tabela 5.3 mostra esses valores e os valores

encontrados para τ e de, necessarios para se estimar tais invariantes.

Para facilitar as analises dos modelos, essas serao dividas por tipo de

estrutura utilizada no processo de identificacao.

5.5.1 Modelos NARMAX Polinomiais

Durante o processo de identificacao dos modelos polinomiais,

encontraram-se diversos modelos que apresentavam apenas compor-

tamentos dinamicos periodicos ou instaveis, indicando que a estrutura


Tabela 5.3: Invariantes dinamicos calculados para os modelos identificados edados reais.

Modelo/Real τ de λ1 (Kantz) λ1 (Rosenstein) D2(ǫ, d)

Modelo 1 7 5 1,396 ± 0,030 1,384 ± 0,028 2,158 ± 0,010

Modelo 2 7 5 1,740 ± 0,036 1,677 ± 0,038 2,267 ± 0,014

Modelo 3 11 5 0,283 ± 0,010 0,283 ± 0,014 1,140 ± 0,020

Modelo 4 7 5 0,843 ± 0,014 0,823 ± 0,018 2,860 ± 0,080

Modelo 5 11 5 0,580 ± 0,026 0,564 ± 0,022 3,145 ± 0,120

Modelo 6 10 5 0,556 ± 0,022 0,551 ± 0,018 3,613 ± 0,076

Real 10 5 0,503 ± 0,026 0,495 ± 0,018 3,930 ± 0,060

NARMAX polinomial nao seria capaz de representar a dinamica presente

nos dados reais. Mesmo assim, identificaram-se dois unicos modelos

caoticos, o modelo 1 e o modelo 2. Tal fato pode ser comprovado a partir

dos invariantes dinamicos encontrados na Tabela 5.3. Os modelos obtidos

sao complexos, contendo um elevado numero de termos de processos e

alto grau de nao -linearidade, conforme apresentam as Equacoes (5.1) e

(5.2).

Ressalta-se que alguns modelos identificados apresentaram comporta-

mento periodico semelhante a serie temporal real. Desta forma, variou-se

o parametro do regressor y(k−1) desses modelos, uma vez que eles explica-

vam 95% da variancia dos dados, na tentativa de se recuperar a dinamica

caotica do pendulo (Aguirre et al., 2002). Esse procedimento mostrou

que a estrutura NARMAX polinomial, para esse caso, e muito sensıvel as

variacoes mınimas de parametros, levando os modelos a instabilidade.

A hipotese de que a estrutura NARMAX polinomial nao seja capaz de

representar a dinamica presente nos dados ganha mais enfase ao se com-

parar os invariantes dinamicos dos dados reais com aqueles encontrados

para os modelos 1 e 2. Nota-se que os valores medios dos invariantes di-

ferem dos encontrados para o sistema real, apesar da incerteza presente.

Os expoentes de Lyapunov apresentaram valores maiores do que um, bem

distantes dos pequenos valores apresentados pelos dados reais. Por sua

5.5 Validacao dos Modelos 101

vez, as dimensoes de correlacao ficaram abaixo de tres, ao passo que a

dimensao real esta bem proxima do valor inteiro quatro. Verifica-se tam-

bem, a partir da inspecao visual das Figuras 5.3 e 5.6, que a projecao dos

atratores dos modelos polinomiais nao reproduzem a forma do atrator do

pendulo duplo (Figura 4.8).

O resultado anterior ja era esperado, uma vez que a representacao

NARMAX polinomial e limitada na capacidade de representar diversas

nao -linearidades como as apresentadas pelo pendulo duplo. Para efeito de

comparacao e para se ter uma ideia de quais nao -linearidades estao presen-

tes, basta observar o modelo matematico do pendulo duplo, representado

pelo conjunto de Equacoes (2.8), que e racional e apresenta produto entre

as variaveis de estado. De acordo com Correa (1997), pode-se generalizar

a aplicacao da representacao racional quando ocorrer produto entre as va-

riaveis de estado no modelo contınuo. Alem disso, tal modelo apresenta

a funcao sgn(·), que e fortemente nao -linear, utilizada para representar

oposicao ao movimento das hastes causada pelo atrito de Coulomb.

Vale a pena observar que a dimensao de correlacao do sistema real e

muito proxima de um valor inteiro, o que, de certa forma, poderia ter

contribuıdo com o desempenho nao satisfatorio dos modelos polinomiais

obtidos neste trabalho.

5.5.2 Modelos NARMAX Racionais

Partindo do insucesso na utilizacao da representacao polinomial e nas con-

jecturas apresentadas anteriormente, optou-se pela utilizacao da represen-

tacao racional NARMAX na tentativa de se obterem melhores resultados.

Durante o processo de identificacao, assim como no caso dos mode-

los polinomiais, foram encontrados diversos modelos que apresentaram

comportamentos dinamicos periodicos ou instaveis. Tambem variou-se o

parametro do regressor y(k−1) dos modelos com dinamica periodica, mas,

infelizmente, o resultado nao foi diferente daquele encontrado para os mo-

delos polinomiais. Diversos modelos caoticos tambem foram obtidos, mas,

durante o processo de simulacao, os mesmos deixavam de apresentar com-

portamento caotico e se tornavam periodicos, sendo descartados. Desta

forma, obtiveram-se apenas dois modelos que preservaram o comporta-

mento caotico, sao eles: o modelo 3 e o modelo 4.

Os modelos racionais identificados, quando comparados aos modelos


polinomiais, apresentam menor numero de termos de processo. Ressalta-

se que os algoritmos de identificacao de modelos racionais nao convergiram

quando foram utilizados elevados numeros de termos de processo para

um mesmo grau de nao -linearidade. Nota-se que os modelos racionais

apresentam termos de ruıdo que foram incluıdos a fim de se minimizar os

efeitos da polarizacao, uma vez que a representacao e sensıvel a presenca

de ruıdo nos dados.

A partir da analise da Tabela 5.3, constata-se que os modelos 3 e 4

nao foram capazes de representar a dinamica presente nos dados reais.

Apesar de os expoentes de Lyapunov terem apresentado valores menores

que um, ainda se diferem dos valores dos dados reais. Assim como nos

modelos polinomiais, as dimensoes de correlacao foram menores do que

tres. Observando-se as Figuras 5.9 e 5.12, nota-se que elas nao reproduzem

a forma do atrator original.

Acredita-se que o insucesso da utilizacao da representacao NAR-

MAX racional consista no fato de existirem, nos dados reais, certas nao-

linearidades que nao podem ser representadas por um unico modelo global,

pois, nesses modelos, os parametros sao calculados para todo o conjunto

de dados repassados aos algoritmos, fazendo com que se encontrem pa-

rametros medios, tornando o modelo incapaz de representar certos com-

portamentos dinamicos especıficos. Observando-se a Figura 2.9, nota-se

que a serie temporal real parece com um sinal periodico, mas que e re-

pleto de mudancas abruptas e“quinas”que talvez nao sejam captadas pela

representacao em questao.

Assim como no caso dos modelos polinomiais, acredita-se que o fato de

a dimensao de correlacao do sistema real ser muito proxima de um valor

inteiro tambem poderia ter contribuıdo com o desempenho nao satisfatorio

dos modelos racionais.

5.5.3 Modelos Fuzzy NARX TS

Baseado na justificativa apresentada anteriormente, utilizou-se uma es-

trutura que fosse capaz de representar especificamente certas regioes dos

dados reais, ou seja, uma estrutura que apresentasse modelos locais. A es-

trutura utilizada foi a fuzzy NARX Takagi-Sugeno, apresentada na Secao

3.5.2.

Foram identificados, aproximadamente, seis modelos que apresentaram


dinamica caotica. Desses, apenas os modelos 5 e 6 permaneceram caoticos

durante extensas simulacoes.

A partir da Tabela 5.3, podem-se comparar os invariantes dinami-

cos calculados para os modelos com os encontrados para os dados reais.

Verifica-se que os modelos 5 e 6 foram os que melhor representaram a

dinamica dos dados reais.

O modelo 5 e composto por dez modelos lineares do tipo AR, que,

interpolados, sao capazes de aproximar a dinamica do pendulo duplo. O

maior expoente de Lyapunov calculado para o referido modelo esta pro-

ximo do valor real, mas, em relacao a dimensao fractal, essa se apresenta

distante, 3,145±0,120 contra 3,930±0,060. Em relacao a forma do atrator,

verifica-se que, aparentemente, o modelo e capaz de reproduzı-la (Figura

5.16).

Por sua vez, o modelo 6, composto por nove modelos lineares, foi o

melhor resultado obtido. A partir dos valores e suas respectivas incertezas,

nota-se que tanto o maior expoente de Lyapunov quanto a dimensao fractal

foram os mais proximos dos resultados encontrados para os dados reais.

Alem disso, os valores de τ e de foram identicos aos dos dados reais. A

Figura 5.20 apresenta uma visao bidimensional da projecao tridimensional

do atrator do modelo pela qual se observa que, aparentemente, sua forma

e a que mais se aproxima da forma do atrator original quando comparado

aos demais modelos.

Os resultados apresentados pelos modelos fuzzy NARX TS reforcam a

hipotese da presenca de certas nao -linearidades nos dados reais que nao

puderam ser representadas pelos modelos globais. Desta forma, verificou-

se que os modelos capazes de representar as dinamicas locais foram mais

eficientes.


Neste capıtulo, foram apresentados os modelos identificados utilizando as

representacoes NARMAX polinomial e racional bem como a representacao

fuzzy NARX Takagi-Sugeno a partir dos dados reais referentes a velocidade

angular da barra 1.

Constatou-se que as representacoes racionais e polinomiais nao foram

capazes de representar a dinamica presente nos dados reais. No caso da

primeira, acredita-se que, pelo fato de esses modelos serem globais, eles nao


conseguiram representar certas nao -linearidades presentes nos dados reais

e, na segunda, pelo fato de ser uma estrutura mais simples e, por isso, seja

limitada na capacidade de representar certos comportamentos dinamicos.

Alem disso, acredita-se que o fato de a dimensao de correlacao do sistema

real ser muito proxima de um valor inteiro tambem poderia ter contribuıdo

com o desempenho nao satisfatorio tanto dos modelos polinomiais quanto

dos racionais.

Por sua vez, os modelos fuzzy NARX TS representaram bem a dina-

mica dos dados. Tal fato se justifica pela capacidade desses em representar

eficientemente as dinamicas locais.

Capıtulo 6

Conclusoes

“Muitos dos fracassos da vida ocorrem com as pessoas

que nao reconheceram o quao proximas elas estavam do

sucesso quando desistiram.”

Thomas A. Edison

A capacidade de predizer corretamente comportamentos dinamicos de

sistemas reais a partir de modelos e um dos grandes desafios da socie-

dade moderna. Varias tecnicas e estruturas foram discutidas e analisadas

durante os ultimos anos. A identificacao de sistemas surgiu como uma

alternativa as tecnicas baseadas nas leis fısicas que descrevem os sistemas

a serem modelados. Uma das caracterısticas da identificacao e que pouco

ou nenhum conhecimento previo do sistema em estudo e necessario, sendo

apenas utilizados dados coletados a partir desses.

Neste trabalho, procurou-se obter modelos que descrevessem a dina-

mica de um pendulo duplo que apresenta comportamento caotico utili-

zando as tecnicas de identificacao de sistemas. Para tal, foram utilizadas

tres diferentes representacoes nao -lineares, a saber, NARMAX polinomi-

ais, NARMAX racionais e fuzzy NARX Takagi-Sugeno. O processo de

validacao se deu por meio da comparacao do maior expoente de Lyapunov

e da dimensao fractal calculados para os dados reais e para os dados pro-

venientes dos modelos identificados. Tambem foram comparadas, apenas

visualmente, as projecoes tridimensionais dos atratores reconstruıdos.

Obter tais modelos nao foi uma tarefa simples. A maioria dos modelos

identificados ora apresentava regime dinamico periodico ora era instavel.

Salienta-se que foi devotado muito tempo no processo de identificacao.

106 6 Conclusoes

Mesmo assim, foram obtidos alguns modelos nao -lineares que apresen-

taram dinamica caotica. Ressalta-se que esses modelos sao complexos,

contendo um elevado numero de termos de processo e alto grau de nao-

linearidade ou ainda, no caso dos modelos fuzzy NARX TS, elevado nu-

mero de regras.

Os modelos que foram obtidos utilizando-se a representacao NARMAX

polinomial, apesar de serem caoticos, nao conseguiram reproduzir a dina-

mica presente nos dados. Uma possıvel causa para o insucesso da repre-

sentacao polinomial seria a sua limitacao na capacidade de representar

diversas nao -linearidades apresentadas pelo pendulo duplo, uma vez que

seu modelo contınuo, utilizado para reproduzir o mesmo regime dinamico,

alem de racional, apresenta produto entre as variaveis de estado e a funcao

sgn(·), que e uma funcao fortemente nao -linear. Conforme discutido, tal

cenario apontava para a utilizacao da representacao NARMAX racional.

A representacao NARMAX racional tambem foi ineficaz na tentativa

de reproduzir a dinamica do pendulo. Supoe-se que certas nao-linearidades

nao possam ser representadas por um unico modelo global, pois, nesses

modelos, os parametros sao calculados para todo o conjunto de dados

repassados aos algoritmos, fazendo com que se encontrem parametros me-

dios, tornando o modelo incapaz de representar certos comportamentos

dinamicos especıficos. Observou-se ainda que a serie temporal, apesar

de se parecer com um sinal periodico, e repleto de mudancas abruptas e

“quinas”, que talvez nao sejam captadas por modelos globais.

Alem das possıveis causas anteriormente citadas, acredita-se que o fato

de a dimensao de correlacao do sistema real ser muito proxima de um valor

inteiro tambem poderia ter contribuıdo com o desempenho nao satisfatorio

tanto dos modelos polinomiais quanto dos racionais.

Verificou-se que a representacao fuzzy NARX Takagi-Sugeno se mos-

trou como a mais eficiente entre as tres empregadas. Os modelos

identificados representaram bem a dinamica do pendulo. Uma possıvel

explicacao para o sucesso seria a capacidade de tal estrutura de represen-

tar as diversas nao -linearidades apresentadas pelo pendulo por meio de

modelos locais.

Para o calculo dos invariantes dinamicos, utilizados tanto no processo

de caracterizacao dinamica do pendulo duplo quanto na validacao dos mo-

delos, optou-se pelos algoritmos pertencentes ao pacote computacional TI-

SEAN. Verificou-se que esses algoritmos apresentam um grande numero

6.1 Propostas para Trabalhos Futuros 107

de parametros livres que devem ser ajustados de modo que o resultado

estimado apresente convergencia para o resultado esperado. Outro fato

observado foi a variabilidade dos resultados em funcao de pequenas vari-

acoes nos valores desses parametros.

6.1 Propostas para Trabalhos Futuros

O trabalho desenvolvido e relatado nesta dissertacao apresentou resultados

relevantes e, como em todo processo de pesquisa, muitas questoes ainda

ficaram a ser respondidas. Desta forma, propostas para trabalhos futu-

ros surgem como meios para responder tais questoes. Como propostas,

destacam-se:

• alteracao dos algoritmos de identificacao de modelos fuzzy NARX

Takagi-Sugeno para permitir a inclusao de termos de ruıdo com o

intuito de reduzir os efeitos de polarizacao;

• utilizacao de modelos locais nao -lineares ao inves de modelos lineares

a fim de melhorar os resultados;

• desenvolvimento de controladores baseados nos modelos fuzzy

NARX TS para permitir o controle do pendulo;

• implementacao de um metodo para o calculo dos invariantes dina-

micos diretamente dos modelos fuzzy NARX TS.

Referencias Bibliograficas

Abarbanel, H. D. I. (1995). Analysis of observed chaotic data. Springer-

Verlag, New York, Inc.

Abarbanel, H. D. I., Brown, R., e Kadtke, J. B. (1989). Prediction and

system identification in chaotic nonlinear systems: time series with bro-

adband spectra. Physics Letters, 138:401–408.

Abdel-Rahman, E. M. e Nayfeh, A. H. (2003). Two-dimensional control

for ship-mounted cranes: a feasibility study. Journal of Vibration and

Control, 9(12):1327–1342.

Aguirre, L. A. (1997). Recovering map static nonlinearities from chaotic

data using dynamical models. Physica D, 100(1,2):41–57.

Aguirre, L. A. (2007). Introducao a Identificacao de Sistemas - Tecnicas

Lineares e Nao-Lineares Aplicadas a Sistemas Reais. Editora UFMG,

Belo Horizonte, MG.

Aguirre, L. A. e Billings, S. A. (1995). Improved structure selection for

nonlinear models based on term clustering. Int. J. Control, 62(3):569–

587.

Aguirre, L. A., Maquet, J., e Letellier, C. (2002). Induced one-parameter

bifurcations in identified models. International Journal of Bifurcation

and Chaos, 12(1):135–145.

Aguirre, L. A. e Mendes, E. M. A. M. (1996). Nonlinear polynomial

models: Structure, term clusters and fixed points. Int. J. Bifurcation

and Chaos, 6(2):279–294.

110 Referencias Bibliograficas

Akaike, H. (1974). A new look at the statistical model identification. IEEE

Trans. Automat. Contr., 19(6):716–723.

Alves, G. B. (2004). Propriedades das funcoes de base radiais aplicadas a

identificacao de sistemas dinamicos nao-lineares. Belo Horizonte: Uni-

versidade Federal de Minas Gerais. (Dissertacao de Mestrado, PPGEE).

Amaral, G. F. V. (2001). Uso de redes neurais e conhecimento a priori

na identificacao de sistemas dinamicos nao-lineares. Belo Horizonte:

Universidade Federal de Minas Gerais. (Dissertacao de Mestrado, PP-

GEE).

Andrievskii, B. R. e Fradkov, A. L. (2004). Control of chaos: methods

and applications. II. applications. Automation and Remote Control,

65(4):505–533.

Babusca, R., Roubos, J. A., e Verbruggen, H. B. (1998). Identification

of MIMO systems by input-output TS fuzzy models. In Proceedings

FUZZ-IEEE’98, p. 657–662.

Babusca, R. e Verbruggen, H. B. (2003). Neuro-fuzzy methods for nonli-

near system identification. Annual Reviews in Control, 27:73–85.

Berkemeier, M. D. e Fearing, R. S. (1999). Tracking fast inverted trajecto-

ries of the underactuated acrobot. IEEE Transactions on Robotics and

Automation, 15(4):740–750.

Bezdek, J. C. (1981). Pattern Recognition with Fuzzy Objective Function.

Plenum Press, New York.

Billings, S. A. e Aguirre, L. A. (1995). Effects of the sampling time on

the dynamics and identification of nonlinear models. Int. J. Bifurcation

and Chaos, 5(6):1541–1556.

Billings, S. A. e Chen, S. (1989). Identification of nonlinear rational sys-

tems using a prediction-error estimation algorithm. International Jour-

nal of Control, 20(3):467–494.

Billings, S. A., Chen, S., e Korenberg, M. J. (1989). Identification of

MIMO systems using a forward-regression orthogonal estimator. Inter-

national Journal of Control, 49:2157–2189.


Billings, S. A. e Coca, D. (1999). Discrete wavelet models for identification

and qualitative analysis of chaotic systems. Int. J. Bifurcation and

Chaos, 9(7):1263–1284.

Billings, S. A. e Mao, K. Z. (1997). Rational model data smoothers and

identification algorithms. International Journal of Control, 68(2):297–

310.

Billings, S. A. e Zhu, Q. M. (1991). Rational model identification using

an extended least-squares algorithm. International Journal of Control,

54(3):529–546.

Braga, A. P., Carvalho, A. P. L. F., e Ludemir, T. B. (2000). Redes neurais

artificiais: teoria e aplicacoes. Editora LTC.

Campello, R. J. G. B. e Amaral, W. C. (1999). A relational approch for

complex system identification. Controle & Automacao, 10(3):139–148.

Campello, R. J. G. B. e Amaral, W. C. (2001). Modeling and linguistic

knowledge extraction from systems using fuzzy relational models. Fuzzy

Sets and Systems, 121:113–126.

Campos, R. C. C. (2007). Projeto e construcao de planta piloto de neutrali-

zacao de pH e proposta de metodologia para incorporacao de informacoes

auxiliares na identificacao NARX racional. Coronel Fabriciano: Centro

Universitario do Leste de Minas Gerais - Unileste MG. (Dissertacao de

Mestrado, PPGE).

Casdagli, M. (1989). Nonlinear prediction of chaotic time series. Physica

D, 35:335–356.

Casdagli, M. (1997). Recurrence plots revisited. Physica D, 108(1-2):12–

44.

Cassini, C. C. S. (1999). Estimacao recursiva de caracterısticas estaticas

nao-lineares utilizando modelos polinomiais NARMAX. Belo Horizonte:

Universidade Federal de Minas Gerais. (Dissertacao de Mestrado, PP-

GEE).

Christini, D. J., Collins, J. J., e Linsay, P. S. (1996). Experimental con-

trol of high-dimensional chaos: The driven double pendulum. Physical

Review E, 54(5):4824–4827.


Chua, L. O. e Parker, T. S. (1989). Practical Numerical Algorithms for

Chaotic Systems. Springer-Verlag, New York.

Cicolani, L. S., McCoy, A. H., Sahai, R., Tyson, P. H., Tischler, M. B.,

Rosen, A., e Tucker, G. E. (2001). Flight teste identification and simu-

lation of a UH-60A helicopter and slung load. Journal of the American

Helicopter Society, 46(2):140–160.

Coelho, M. C. S. (2002). Modelos de Hammerstein e de Wiener: cone-

xoes com modelos NARX e sua aplicacao em identificacao de sistemas

nao-lineares. Belo Horizonte: Universidade Federal de Minas Gerais.

(Dissertacao de Mestrado, PPGEE).

Correa, M. V. (1997). Identificacao de sistemas dinamicos nao-lineares

utilizando modelos NARMAX racionais - aplicacao a sistemas reais.

Belo Horizonte: Universidade Federal de Minas Gerais. (Dissertacao de

Mestrado, PPGEE).

Correa, M. V. (2001). Identificacao caixa-cinza de sistemas nao-lineares

utilizando representacoes NARMAX racionais e polinomiais. Belo Ho-

rizonte: Universidade Federal de Minas Gerais. (Tese de Doutorado,

PPGEE).

Correa, M. V. e Aguirre, L. A. (2004). Identificacao nao-linear caixa-cinza:

uma revisao e novos resultados. SBA: Controle & Automacao Sociedade

Brasileira de Automatica, 15(2):109–126.

Eckmann, J.-P., Kamphorst, S. O., e Ruelle, D. (1987). Recurrence plots

of dynamical systems. Europhysics Letters, 4(9):973–977.

Elsner, J. B. (1992). Predicting time series using a neural network as

a method of distinguishing chaos from noise. Journal of Physics A,

25:843–850.

Fiedler-Ferrara, N. e Prado, C. P. C. (1994). Caos: uma introducao.

Editora Edgard Blucher Ltda, Sao Paulo.

Firmo, D. L. (2007). Construcao e Caracterizacao Dinamica de um Pen-

dulo Duplo Caotico. Belo Horizonte: Universidade Federal de Minas

Gerais. (Dissertacao de Mestrado, PPGEE).


Fraser, A. M. e Swinney, H. L. (1986). Independent coordinates for strange

attractors from mutual information. Physical Review A, 33(2):1134–

1140.

Gath, I. e Geva, A. B. (1989). Unsupervised optimal fuzzy cluste-

ring. IEEE Transactions on Pattern Analysis and Machine Intelligence,

7:773–781.

Graps, A. (1995). An introduction to wavelets. IEEE Computational

Science and Engineering, 2(2).

Grassberger, P. e Procaccia, I. (1983). Measuring the strangeness of

strange attractors. Physica D, 9(1–2):189–208.

Gustafson, D. E. e Kessel, W. C. (1979). Fuzzy clustering with a fuzzy

covariance matrix. In Proceedings IEEE CDC, San Diego, CA, USA. p.

761–766.

Gutnik, B., Mackie, H., Hudson, G., e Standen, C. (2005). How close to

a pendulum is human upper limb movement during walking? Homo -

Journal of Comparative Human Biology, 56(1):35–49.

Haykin, S. (2001). Redes neurais: princıpios e pratica. Editora Bookman,

2. ed. Porto Alegre.

Hegger, R., Kantz, H., e Schreiber, T. (1999). Practical implementation of

nonlinear time series methods: the TISEAN package. Chaos, 9(2):413–

435.

Heng, H. e Martienssen, W. (1992). Analysing the chaotic motion of a

driven pendulum. Chaos, Solitons & Fractals, 2:323–334.

Henrique, H. M., Lima, E. L., e Pinto, J. C. (1998). A bifurcation study on

neural network models for nonlinear dynamics systems. Latin American

Applied Research, 28:187–200.

Henry, R. J., Masoud, Z. N., Nayfeh, A. H., e Mook, D. T. (2001). Cargo

pendulation reduction on ship-mounted cranes via boom-luff angle ac-

tuation. Journal of Vibration and Control, 7(8):1253–1264.

Kantz, H. (1994). A robust method to estimate the maximal lyapunov

exponent of a time series. Physics Letters A, 185(1):77–87.


Kaymak, U. e Babusca, R. (1995). Compatible cluster merging for fuzzy

modeling. In Proceedings FUZZ-IEEE/IFES’95, Yokohama, Japan. p.

897–904.

Kennel, M. B., Brown, R., e Abarbanel, H. D. I. (1992). Determining

embedding dimension for phase-space reconstruction using a geometrical

construction. Physical Review A, 45(6):3403–3411.

Kolmogorov, A. N. (1958). A new metric invariant of transient dynamical

systems and automorphisms in lebesgue spaces. Doklady Akademii Nauk

SSSR, 119(5):861–864.

Krishnapuram, R. e Freg, C. (1992). Fitting an unknown number of lines

and planes to image data through compatible cluster merging. Pattern

Recognition, 25(4):385–400.

Leontaritis, I. J. e Billings, S. A. (1985a). Input-output parametric models

for nonlinear systems – Part 1: Deterministic nonlinear systems. Int.

J. Control, 41(2):303–328.

Leontaritis, I. J. e Billings, S. A. (1985b). Input-output parametric models

for nonlinear systems – Part 2: Stochastic nonlinear systems. Int. J.

Control, 41(2):329–344.

Levien, R. B. e Tan, S. M. (1993). Double pendulum: an experiment in

chaos. Am. J. Phys., 61(11):1038–1044.

Ljung, L. (1999). System Identification - Theory for the User. Prentice-

Hall International, New Jersey.

Lorenz, E. N. (1963). Deterministic nonperiodic flow. Journal of The

Atmospheric Sciences, 2(20):130–141.

Mamdani, E. H. (1977). Application of fuzzy logic to approximate reaso-

ning using linguistic systems. Fuzzy Set and Systems, 26:1182–1191.

Marwan, N., Romano, M. C., Thiel, M., e Kurths, J. (2007). Recurrence

plots for the analysis of complex systems. Physics Reports, 438:237–329.

Mendes, E. M. A. M. (1995). Identification of nonlinear discrete sys-

tems with intelligent structure detection. United Kingdom: University

of Sheffield. (Tese de Doutorado).


Meriam, J. L. e Kraige, L. G. (2003). Engineering Mechanics. John Wiley

& Sons, Inc.

Monteiro, L. H. A. (2006). Sistemas Dinamicos. Livraria da Fısica, Sao

Paulo.

Narendra, K. S. e Gallman, P. G. (1966). An iterative method for the

identification of the nonlinear systems using a Hammerstein model.

IEEE Trans. Automat. Control, 11(3):546–550.

Packard, N. H., Crutchfield, J. P., Farmer, J. D., e Shaw, R. S. (1980).

Geometry from a time series. Physical Review Letters, 45(9):712–716.

Patwardhan, R. S., Lakshminarayanan, S., e L., S. S. (1998). Constrai-

ned nonlinear MPC using Hammerstein and Wiener models: PLS fra-

mework. AIChE Journal, 44(7):1611–1622.

Pearson, R. K. e Pottmann, M. (2000). Gray-box identification of block

oriented nonlinear models. Journal of Process Control, pages 301–315.

Pedrycz, W. e Gomide, F. A. C. (1998). An Introduction to Fuzzy Sets:

Analysis and Design (Complex Adaptive Systems). MIT Press.

Peyton-Jones, J. E. e Billings, S. A. (1989). Recursive algorithm for com-

puting the frequency response of a class of non-linear difference equati-

ons models. International Journal of Control, 50(5):1925–1940.

Pottmann, M. e Pearson, R. K. (1998). Block-oriented NARMAX models

with output multiplicities. AI-ChE Journal, 44(1):131–140.

Principe, J. C., Rathie, A., e Kuo, J. M. (1992). Prediction of chaotic

time series with neural networks and the issue of dynamic modeling.

International Journal of Bifurcation and Chaos, 2(4):989–996.

Rodrigues, G. G. (1996). Identificacao de sistemas dinamicos nao-lineares

utilizando modelos NARMAX polinomiais - aplicacao a sistemas reais.

Belo Horizonte: Universidade Federal de Minas Gerais. (Dissertacao de

Mestrado, PPGEE).

Rosenstein, M. T., Collins, J. J., e de Luca, C. J. (1993). A practical

method for calculating largest lyapunov exponents from small data sets.

Physica D, 65(1–2):117–134.


Ruelle, D. e Takens, F. (1971). On the nature of turbulence. Communi-

cations in Mathematical Physics, 20:167–192.

Russi (2002). Estudo de Um Modelo Dinamico Para Avaliacao Fısica do

Corpo Humano. Universidade Paulista. (Dissertacao de Mestrado).

Sano, M. e Sawada, Y. (1985). Measurement of the lyapunov spectrum

from a chaotic time series. Physical Review Letters, 55(10):1082–1085.

Shannon, C. E. (1948). A mathematical theory of communication. The

Bell System Technical Journal, 27(1):379–423 e 623–656.

Shinbrot, T., Grebogi, C., Wisdom, J., e York, J. A. (1992). Chaos in a

double pendulum. Am. J. Phys., 60(6):491–498.

Skeldon, A. C. (1994). Dynamics of a parametrically excited double pen-

dulum. Physica D, 75:541–558.

Smith, H. J. T. e Blackburn, J. A. (1989). Chaos in a parametrically

damped pendulum. Physical Review A, 40(8):4708–4715.

Stachowiak, T. e Okada, T. (2006). A numerical analysis of chaos in the

double pendulum. Chaos, Solitons and Fractals, 29:417–422.

Takagi, T. e Sugeno, M. (1985). Fuzzy identification of systems and its

application to modeling and control. IEEE Transactions on Systems,

Man & Cibernetics, 15(1):116–132.

Takens, F. (1981). Detecting strange attractors in turbulence. Lecture

Notes in Mathematics, 898:366–381.

Volterra, V. (1930). Theory of functions. Blackie and Sons.

Wiener, N. (1958). Nonlinear problems in random theory. In Wiley, J.

and Sons, New York.

Wigren, T. (1993). Recursive prediction error identification using nonli-

near Wiener model. Automatica, 29(4):1011–1025.

Wolf, A., Swift, J. B., Swinney, H. L., e Vastano, J. A. (1985). Determining

lyapunov exponents from a time series. Physica D, 16:285–317.

Zadeh, L. A. (1965). Fuzzy sets. Information and Control, 8:338–353.


Zadeh, L. A. (1973). Outline of a new approach to the analysis of complex

systems and decision processes. IEEE Transactions on Systems, Man

& Cibernetics, 3:28–44.

Zhu, Q. M. e Billings, S. A. (1991). Recursive parameter estimation for

nonlinear rational models. J. Syst. Eng., 1:63–76.

Zhu, Q. M. e Billings, S. A. (1993). Parameter estimation for stochastic

nonlinear rational models. International Journal of Control, 57(2):309–

333.

Anexo A

Rotinas Computacionais

Neste capıtulo, sao apresentadas as principais rotinas utilizadas na obten-

cao dos modelos fuzzy NARX TS. Tais rotinas, implementadas utilizando-

se o software Matlab, sao descritas a seguir.

A.1 fmclust

fmclust identifica modelos MIMO estaticos ou dinamicos a partir de da-

dos de entrada e saıda. Os agrupamentos fuzzy sao obtidos a partir do

algoritmo de Gustafson e Kessel.

S intaxe :

[FM, part ] = fmclust (DAT,STR, out )

Parametros de entrada :

DAT e uma e s t r u tu r a que apresenta os s egu in t e s campos :

U, Y . . . matr izes de entrada e sa ıda , r espect ivamente

Ts . . . tempo de amostragem ( opc ional , d e f au l t =1)

NomeArquivo . . . nome do arquivo de dados ( opc iona l )

STR e uma e s t r u tu r a com os s egu in t e s campos p r i n c i p a i s :

c . . . numero de r eg r a s ( c l u s t e r s ) por sa ı da

m . . . expoente de f u z z i f i c a c a o ( d e f au l t =2)

t o l . . . t o l e r a n c i a de termino ( d e f au l t =0 ,01)

seed . . . va lo r a l e a t o r i o i n i c i a l para a pa r t i c a o fuzzy

( d e f au l t = sum(100∗ clock ) )

ante . . . t ipo de antecedente : 1 − espaco produto de FP;

2 − pro j e c a o de FP

cons . . . t ipo de est imac ao dos consequentes :

120 Anexo

1 − MQ Global ; 2 − MQP Local ; 3 − MQ Total

ny . . . maximo at raso em Y ( de f au l t =0)

nu . . . maximo at raso em U ( de f au l t =1)

nd . . . a t r a so de t ran spor te ( d e f au l t =0)

out r ep r e s en ta o numero de s a ı d a s a serem cons t ru ıdas

( d e f au l t=todas )

Parametros de sa ı da :

FM e uma e s t r u tu r a que contem todos os parametros do

modelo fuzzy i d e n t i f i c a d o . Veja fmstruct

part e uma e s t r u tu r a que contem a pa r t i c a o fuzzy

( c ) Robert Babuska , Stanimir Mollov 1997−1999

Anexo 121

A.2 fmsim

fmsim simula os modelos identificados.

S intaxe :

[Ym, q ,DOF, Yl ,Ylm ] = fmsim (U,Y,FM,Ymin ,Ymax, show ,H)


U, Y . . . matr izes de entrada e sa ıda , r espect ivamente

( os dados de sa ı da sao n e c e s s a r i o s para

i n i c i a l i z a c a o e para comparacao )

FM . . . e s t r u tu r a que contem todos os parametros do

modelo fuzzy i d e n t i f i c a d o

Ymin . . . l im i t e i n f e r i o r para s imula c ao da sa ı da

( opc iona l )

Ymax . . . l im i t e sup e r i o r para s imula c ao da sa ı da

( opc iona l )

show . . . 0 − sem g r a f i c o de s imula c ao ;

1 − g r a f i c o on l i n e ;

2 − g r a f i c o no f i n a l da s imula c ao ; ( d e f au l t =1)

H . . . 1 − s imula c ao de um passo a f r e n t e

se nao f o r n e c i d o − s imula c ao l i v r e ( d e f au l t )

Parametros de sa ı da :

Ym . . . s a ı da do modelo simulado

q . . . ı n d i c e de desempenho baseado na va r i a n c i a

DOF . . . fun c o e s de p e r t i n e n c i a

Y1 , Y1m . . . modelos l o c a i s


122 Anexo

A.3 fmstruct

fmstruct e a estrutura utilizada para armazenar os parametros dos mo-

delos fuzzy identificados pela rotina fmclust.

FM e uma e s t r u tu r a que apresenta os s egu in t e s campos :

Ts tempo de amostragem

ni numero de entradas

no numero de s a ı d a s

N numero de amostras u t i l i z a d a s na

i d e n t i f i c a c a o

t o l t o l e r a n c i a para o termino da gera c ao

dos agrupamentos

seed va lo r a l e a t o r i o i n i c i a l para a pa r t i c a o

fuzzy

ny maximo at raso em Y

nu maximo at raso em U

nd atraso de t ran spor te

ante t ipo de antecedente

cons t ipo de consequente

c numero de agrupamentos

m expoente de f u z z i f i c a c a o

r l s matr iz de r eg r a s

mfs matr iz de fun c o e s de p e r t i n e n c i a

th parametros consequentes

s desv io padrao dos parametros consequentes

V cen t ros dos agrupamentos

P matr iz de cova r i a n c i a do agrupamento

zmin minimo de cada coluna da matr iz de dados

zmax maximo de cada coluna da matr iz de dados

InputName nomes das v a r i a v e i s de entrada ( c e l l array )

OutputName nomes das v a r i a v e i s de sa ı da ( c e l l array )

( c ) Robert Babuska 1997

Anexo 123

A.4 plotmfs

plotmfs exibe as funcoes de pertinencia.

S intaxe :

p lotmfs (mfs , opt , f i g )


mfs . . . pode s e r um array numerico , um c e l l array ou

a e s t r u tu r a do modelo fuzzy (FM)

opt . . . u t i l i z a d o para d e f i n i r as op c oes da f i g u r a

f i g . . . numero da f i g u r a ( d e f au l t = 1)

( c ) Robert Babuska 1998

124 Anexo

A.5 fm2tex

fm2tex escreve as informacoes contidas na estrutura FM em um arquivo

LATEX.

S intaxe :

fm2tex (FM, f i l ename )


FM . . . e s t r u tu r a do modelo fuzzy (FM)

f i l ename . . . nome do arquivo LATEX a s e r gerado


Anexo 125

A.6 Exemplo

A seguir, e apresentado um exemplo de utilizacao das rotinas anterior-

mente citadas. Tal exemplo foi baseado na rotina de identificacao utilizada

neste trabalho.

load exemplo % carrega os dados

% Dados para i d e n t i f i c a c a o

u = zeros ( 500 , 1 ) ; % apesar de o s i s tema ser autonomo ,

% inc l u i −se um ve tor de ze ros como

% entrada , a fim de se e v i t a r e r ros

% na ro t ina ”fmc lu s t ”

y = y ( 1 : 5 0 0 ) ;

% Dados para va l i dacao

v = y (501 :end ) ;

% Estru tura dos s i n a i s de entrada e saida

DAT.U = u ;

DAT.Y = y ;

% Estru tura de parametros da funcao ” fmc lu s t ”

STR. c = 10 ; % numero de c l u s t e r s ( reg ras )

STR.m = 4 ; % parametro de f u z z i f i c a c a o

STR. t o l = 0 . 0 1 ; % to l e r an c i a de termino

STR. ante = 2 ; % t i po de antecedente

STR. cons = 2 ; % t i po de consequente

STR.Ny = 8 ; % maximo at raso em y

STR.Nu = 0 ; % maximo at raso em u

STR.Nd = 0 ; % atraso de t r an spor t e

% Calcu lo do modelo Fuzzy

[FM] = fmclust (DAT,STR) ;

% Simula e p l o t a modelo

figure (1 )

[Ym] = fmsim ( [ ] , v ,FM, [ ] , [ ] , 2 ) ;

126 Anexo

% Funcoes de pe r t i n enc i a (membership f unc t i on s )

p lotmfs (FM, [ ] , 2 )

% Exporta o modelo para um arqu ivo Latex

fm2tex (FM, ’identificacao_fuzzy.tex’ )

Car los Renato 2008−2009

técnicas de identificação aplicadas à modelagem de um

Documents