t´ecnicas de identificac¸˜ao aplicadas `a modelagem de um
TRANSCRIPT
Laboratorio de Modelagem, Analise e Controle de Sistemas Nao-Lineares
Departamento de Engenharia Eletronica
Universidade Federal de Minas Gerais
Av. Antonio Carlos 6627, 31270-901 Belo Horizonte, MG Brasil
Fone: +55 3409-4862 - Fax: +55 3409-4850
Tecnicas de Identificacao Aplicadas a
Modelagem de um Pendulo Duplo Caotico
Carlos Renato Magalhaes Duarte
Dissertacao submetida a banca examinadora
designada pelo Colegiado do Programa de Pos-
Graduacao em Engenharia Eletrica da Universidade
Federal de Minas Gerais, como parte dos requisitos
necessarios a obtencao do grau de Mestre em
Engenharia Eletrica.
Orientadores: Dr. Eduardo Mazoni Andrade Marcal Mendes
Dr. Leonardo Antonio Borges Torres
Belo Horizonte, 23 de setembro de 2009
Dedicatoria
Dedico este trabalho a minha famılia
e a todos aqueles que estiveram
comigo nesta caminhada.
iii
Agradecimentos
Agradeco a Deus, pela infinita bondade e amor.
Aos professores Eduardo Mazoni e Leonardo Torres, pela orientacao,
dedicacao e, acima de tudo, pela amizade.
A Marcela, pelo amor e dedicacao.
A minha famılia, pelo amor e os ensinamentos que me permitiram
chegar ate aqui.
Ao Sr. Marcelo e a Sra. Silvania, pelo apoio incondicional.
A Rose, pela acolhida.
Ao professor Marcelo Correa, pela ajuda com as rotinas para obtencao
de modelos racionais.
Ao Davidson Firmo, pela ajuda com os dados e entendimento do mo-
delo matematico do pendulo duplo.
Aos demais professores que contribuıram para a minha formacao du-
rante o mestrado.
A todos os meus amigos que estiveram comigo durante esta longa e
difıcil caminhada.
Ao apoio financeiro da Coordenacao de Aperfeicoamento de Pessoal de
Nıvel Superior (CAPES), o qual foi de vital importancia para a realizacao
deste trabalho.
Ao ensino publico e gratuito.
v
Epıgrafe
“A grandeza nao consiste
em receber honras,
mas em merece-las.”
Aristoteles
vii
Resumo
Neste trabalho, sao apresentados modelos identificados a partir dos dadosde um pendulo duplo que apresenta comportamento caotico. Tais mo-delos sao obtidos aplicando-se tecnicas de identificacao de sistemas e tresdiferentes tipos de representacoes nao -lineares: NARMAX (Nonlinear Au-toRegressive Moving Average models with eXogeneous inputs) polinomial,NARMAX racional e fuzzy NARX Takagi-Sugeno. A partir de uma buscaexaustiva por modelos dinamicamente validos, empregando-se as estrutu-ras anteriormente citadas, e mostrado que, ao se utilizar o mesmo criteriode validacao, os modelos fuzzy NARX Takagi-Sugeno apresentam melhordesempenho que os demais. Acredita-se que tal eficiencia seja atribuıda asua capacidade de representar as diversas nao -linearidades apresentadaspelo pendulo por meio de modelos locais, o que nao acontece para as ou-tras representacoes, consideradas globais. O processo de validacao se deupor meio da comparacao do maior expoente de Lyapunov e da dimensaofractal, calculados para os dados reais e para os dados provenientes dosmodelos identificados. Tambem foram comparadas as projecoes tridimen-sionais dos atratores reconstruıdos.
ix
Abstract
In this work models are identified directly from data generated by a dou-ble pendulum with chaotic dynamics. Such models are obtained by ap-plying system identification techniques considering three different typesof nonlinear representations: NARMAX (Nonlinear AutoRegressive Mo-ving Average models with eXogeneous inputs) polynomial models, NAR-MAX rational models and Takagi-Sugeno NARX fuzzy models. From anexhaustive search for dynamically valid models using the aforementionedstructures, it is suggested that the Takagi-Sugeno NARX fuzzy modelsperform better than the other models according to the same validationmeasure. The reason for that is that these models can represent variousnonlinearities using local linear models. This is not the case for the otherrepresentations since they are part of so-called global models. The modelsare validated by comparing the largest Lyapunov exponent and fractaldimension calculated from the actual data and from data generated fromthe identified models. Three-dimensional projections of the attractors arealso compared.
xi
Sumario
Resumo ix
Abstract xi
Lista de Tabelas xvii
Lista de Figuras xix
Lista de Sımbolos xxiii
Lista de Acronimos xxvii
1 Introducao 1
1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Estrutura da Dissertacao . . . . . . . . . . . . . . . . . . . 5
2 O Pendulo Duplo 7
2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Apresentacao da Plataforma . . . . . . . . . . . . . . . . . 8
2.2.1 O Sistema de Suporte . . . . . . . . . . . . . . . . 9
2.2.2 O Pendulo Duplo . . . . . . . . . . . . . . . . . . . 9
xiii
xiv
2.2.3 Os Sensores . . . . . . . . . . . . . . . . . . . . . . 10
2.2.4 O Sistema de Acionamento . . . . . . . . . . . . . . 13
2.2.5 O Sistema de Comando . . . . . . . . . . . . . . . 15
2.2.6 Funcionamento da Plataforma . . . . . . . . . . . . 15
2.3 Modelo Matematico do Pendulo Duplo Eletromecanico . . 16
2.4 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . 23
3 Tecnicas de Identificacao de Sistemas Dinamicos 25
3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.2 Etapas de Identificacao de Sistemas . . . . . . . . . . . . . 26
3.2.1 Testes Dinamicos e Coleta de Dados . . . . . . . . 26
3.2.2 Escolha da Representacao Matematica . . . . . . . 27
3.2.3 Selecao da Estrutura do Modelo . . . . . . . . . . . 28
3.2.4 Estimacao dos Parametros do Modelo . . . . . . . . 29
3.2.5 Validacao do Modelo . . . . . . . . . . . . . . . . . 29
3.3 Modelo NARMAX Polinomial . . . . . . . . . . . . . . . . 30
3.4 Modelo NARMAX Racional . . . . . . . . . . . . . . . . . 33
3.5 Modelos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . 35
3.5.1 Conceitos . . . . . . . . . . . . . . . . . . . . . . . 35
3.5.2 Modelos Fuzzy Takagi -Sugeno . . . . . . . . . . . . 37
3.5.3 Algoritmo de Identificacao . . . . . . . . . . . . . . 39
3.6 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . 43
4 Caracterizacao Dinamica 45
4.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 Amostragem dos Dados . . . . . . . . . . . . . . . . . . . . 45
4.3 Analise de Estacionariedade dos Dados . . . . . . . . . . . 46
4.4 Caos Determinıstico . . . . . . . . . . . . . . . . . . . . . 50
xv
4.5 Reconstrucao do Espaco de Estados . . . . . . . . . . . . . 51
4.5.1 O Metodo da Informacao Mutua . . . . . . . . . . 52
4.5.2 O Metodo dos Falsos Vizinhos . . . . . . . . . . . . 54
4.5.3 Reconstrucao do Atrator do Pendulo Duplo . . . . 56
4.6 Expoentes de Lyapunov . . . . . . . . . . . . . . . . . . . 57
4.6.1 Expoentes de Lyapunov a Partir de Series Temporais 59
4.7 Dimensao Fractal . . . . . . . . . . . . . . . . . . . . . . . 63
4.7.1 O Metodo de Grassberger-Procaccia . . . . . . . . 64
4.8 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . 65
5 Resultados e Discussoes 67
5.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2 Modelos NARMAX Polinomiais . . . . . . . . . . . . . . . 68
5.2.1 Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . 68
5.2.2 Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . 71
5.3 Modelos NARMAX Racionais . . . . . . . . . . . . . . . . 74
5.3.1 Modelo 3 . . . . . . . . . . . . . . . . . . . . . . . 75
5.3.2 Modelo 4 . . . . . . . . . . . . . . . . . . . . . . . 77
5.4 Modelos Fuzzy NARX Takagi-Sugeno . . . . . . . . . . . . 80
5.4.1 Modelo 5 . . . . . . . . . . . . . . . . . . . . . . . 81
5.4.2 Modelo 6 . . . . . . . . . . . . . . . . . . . . . . . 88
5.5 Validacao dos Modelos . . . . . . . . . . . . . . . . . . . . 99
5.5.1 Modelos NARMAX Polinomiais . . . . . . . . . . . 99
5.5.2 Modelos NARMAX Racionais . . . . . . . . . . . . 101
5.5.3 Modelos Fuzzy NARX TS . . . . . . . . . . . . . . 102
5.6 Consideracoes Finais . . . . . . . . . . . . . . . . . . . . . 103
xvi
6 Conclusoes 105
6.1 Propostas para Trabalhos Futuros . . . . . . . . . . . . . . 107
Referencias Bibliograficas 109
A Rotinas Computacionais 119
A.1 fmclust . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
A.2 fmsim . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
A.3 fmstruct . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
A.4 plotmfs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
A.5 fm2tex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
A.6 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Lista de Tabelas
2.1 Logica de acionamento do motor em funcao das chaves . . 14
2.2 Logica do sistema de comando . . . . . . . . . . . . . . . . 15
2.3 Parametros utilizados no modelo final . . . . . . . . . . . . 20
2.4 Parametros utilizados na obtencao experimental da serie
temporal θ1 . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.1 Valores estimados para o maior expoente de Lyapunov a
partir da serie temporal θ1 do pendulo . . . . . . . . . . . 63
5.1 Valores obtidos para os centros dos agrupamentos fuzzy uti-
lizados na obtencao do modelo 5 . . . . . . . . . . . . . . . 83
5.2 Valores obtidos para os centros dos agrupamentos fuzzy uti-
lizados na obtencao do modelo 6 . . . . . . . . . . . . . . . 92
5.3 Invariantes dinamicos calculados para os modelos
identificados e dados reais. . . . . . . . . . . . . . . . . . . 100
xvii
Lista de Figuras
2.1 Vista isometrica da plataforma (Firmo, 2007) . . . . . . . 8
2.2 Representacao do sistema de suporte da plataforma . . . . 9
2.3 Representacao do pendulo duplo . . . . . . . . . . . . . . . 10
2.4 Representacao do sensor S2 da plataforma . . . . . . . . . 11
2.5 Representacao da plataforma desenvolvida - perfil . . . . . 12
2.6 Circuito equivalente do motor CC da plataforma . . . . . . 13
2.7 Esquema de funcionamento da ponte H . . . . . . . . . . . 14
2.8 Diagrama de funcionamento da plataforma . . . . . . . . . 16
2.9 Serie temporal relativa a variavel de estado θ1 do sistema real 22
3.1 Grafico de uma funcao de pertinencia gaussiana . . . . . . 36
3.2 Estrutura basica de um mecanismo de inferencia fuzzy . . 37
3.3 Representacao de um agrupamento fuzzy . . . . . . . . . . 41
4.1 Funcoes de autocovariancia linear e nao -linear . . . . . . . 46
4.2 Funcoes de autocovariancia linear e nao -linear para uma
taxa de decimacao ∆ = 60 . . . . . . . . . . . . . . . . . . 47
4.3 Grafico com a media de cada janela ao longo dos dados . . 47
4.4 Graficos de recorrencia . . . . . . . . . . . . . . . . . . . . 49
4.5 Grafico de recorrencia da serie temporal do pendulo duplo 50
4.6 Grafico de I(τ) obtido a partir da serie temporal θ1 do pendulo 54
xix
xx
4.7 Grafico de aplicacao do metodo de falsos vizinhos a serie
temporal θ1 do pendulo . . . . . . . . . . . . . . . . . . . . 56
4.8 Projecao tridimensional do atrator reconstruıdo a partir dos
dados reais . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.9 Ilustracao da deformacao de uma hiperesfera num objeto
hiperelipsoidal . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.10 Grafico de S(k) obtido por meio da aplicacao do metodo de
Kantz (1994) a serie temporal θ1 do pendulo . . . . . . . . 61
4.11 Grafico de S(k) obtido por meio da aplicacao do metodo de
Rosenstein et al. (1993) a serie temporal θ1 do pendulo . . 62
4.12 Grafico de D2(ǫ, d) por ǫ obtido para o atrator reconstruıdo
a partir da serie temporal θ1 do pendulo . . . . . . . . . . 66
5.1 Grafico da massa de dados utilizada para se estimar o mo-
delo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.2 Grafico de um trecho da serie temporal produzida pelo mo-
delo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3 Visao bidimensional da projecao tridimensional do atrator
reconstruıdo a partir da serie temporal gerada pelo modelo 1 71
5.4 Grafico da massa de dados utilizada para se estimar o mo-
delo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.5 Grafico da serie temporal produzida pelo modelo 2 . . . . 73
5.6 Visao bidimensional da projecao tridimensional do atrator
reconstruıdo a partir da serie temporal gerada pelo modelo 2 74
5.7 Grafico da massa de dados utilizada para se estimar o mo-
delo 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
5.8 Grafico da serie temporal produzida pelo modelo 3 . . . . 77
xxi
5.9 Visao bidimensional da projecao tridimensional do atrator
reconstruıdo a partir da serie temporal gerada pelo modelo 3 77
5.10 Grafico da massa de dados utilizada para se estimar o mo-
delo 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.11 Grafico da serie temporal produzida pelo modelo 4 . . . . 79
5.12 Visao bidimensional da projecao tridimensional do atrator
reconstruıdo a partir da serie temporal gerada pelo modelo 4 80
5.13 Funcoes de pertinencia referentes ao modelo 5 . . . . . . . 87
5.14 Grafico da massa de dados utilizada para se estimar o mo-
delo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5.15 Grafico de um trecho da serie temporal produzida pelo mo-
delo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.16 Visao bidimensional da projecao tridimensional do atrator
reconstruıdo a partir da serie temporal gerada pelo modelo 5 88
5.17 Funcoes de pertinencia referentes ao modelo 6 . . . . . . . 97
5.18 Grafico da massa de dados utilizada para se estimar o mo-
delo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.19 Grafico de um trecho da serie temporal produzida pelo mo-
delo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.20 Visao bidimensional da projecao tridimensional do atrator
reconstruıdo a partir da serie temporal gerada pelo modelo 6 99
Lista de Sımbolos
N numero de observacoes em um conjunto de dados;
E[·] esperanca matematica;
F [·] funcao polinomial;
de dimensao de imersao;
dA dimensao de Hausdorff;
G(·) funcao de torque;
V (·) funcao de excitacao;
I(·) informacao mutua;
θ posicao angular;
θ velocidade angular;
θ aceleracao angular;
γ angulo;
τ atraso de tempo;
τd tempo morto;
θ vetor de parametros estimado;
R conjunto dos numeros reais;
N conjunto dos numeros naturais;
Ra resistencia do enrolamento de armadura;
Rc resistencia do enrolamento de campo;
xxiii
xxiv
La indutancia do enrolamento de armadura;
Lc indutancia do enrolamento de campo;
Vc tensao aplicada aos terminais do enrolamento de campo;
ia corrente do enrolamento de armadura;
ic corrente do enrolamento de campo;
u(k) sinal de entrada no instante k;
y(k) sinal de saıda no instante k;
e(k) sinal de ruıdo no instante k;
kv constante de velocidade;
| · | modulo;
ruu(τ) funcao de autocorrelacao de u(k) no atraso τ ;
ruy(τ) funcao de correlacao cruzada de u(k) e y(k) no atraso τ ;
ry(τ) funcao de autocovariancia linear de y(k) no atraso τ ;
ry2
′ (τ) funcao de autocovariancia nao -linear de y(k) no atraso τ ;
y(k) media temporal de y(k);
ℓ grau de nao -linearidade;
X matriz de regressores de entrada;
y vetor de regressores de saıda;
nu maximo atraso entre os regressores de entrada;
ny maximo atraso entre os regressores de saıda;
ne maximo atraso entre os regressores de ruıdo;
σ2e variancia do sinal e(k);
ψ(k − 1) vetor de regressores que contem observacoes ate o instante k − 1;
∆ taxa de decimacao;
µA(x) funcao de pertinencia. Indica com que grau o elemento x pertence
ao conjunto A;
U ,X ,Y universos de discurso (domınios);
Ri regra do tipo Se-entao;
r numero de regras;
xxv
x vetor de variaveis premissas;
wi(x) grau de ativacao do antecedente da regra Ri;
ǫ raio da vizinhanca (threshold);
‖ · ‖ representa uma norma (norma-1, Euclidiana ou norma-∞);
Θ( · ) funcao de Heaviside;
λi expoente de Lyapunov;
D0 dimensao de contagem de caixas;
D1 dimensao de informacao;
D2 dimensao de correlacao.
Lista de Acronimos
ARX modelo autorregressivo com entradas exogenas
(autoregressive model with exogenous inputs);
EMQ estendido de mınimos quadrados;
ERR taxa de reducao de erro (error reduction ratio);
FP funcao de pertinencia;
GK Gustafson e Kessel;
MACSIN grupo de pesquisa que se dedica a modelagem, analise e
controle de sistemas nao -lineares;
MIMO multientradas, multisaıdas (multi-input, multi-output);
MISO multientradas e uma saıda (multi-input, single-output);
MQ mınimos quadrados;
MQP mınimos quadrados ponderados;
NARMAX modelo nao -linear autorregressivo, de media movel com
entradas exogenas (nonlinear autoregressive moving
average model with exogenous inputs);
NARX modelo nao -linear autorregressivo com entradas
exogenas (nonlinear autoregressive model with
exogenous inputs);
xxvii
xxviii
PRBS sinal binario pseudo-aleatorio (pseudo-random binary
signal);
TISEAN pacote computacional (time series analysis);
TS Takagi-Sugeno.
Capıtulo 1
Introducao
“O que vale na vida nao e o ponto de partida e sim a
caminhada. Caminhando e semeando, no fim teras o
que colher.”
Cora Coralina
1.1 Introducao
Desde a antiguidade, o homem tem procurado descrever matematicamente
sistemas reais para ajuda-lo a entende-los e assim resolver problemas re-
lacionados a eles (Aguirre, 2007). Desta forma, surgiu a modelagem ma-
tematica, area do conhecimento que estuda maneiras de desenvolver e im-
plementar modelos matematicos de sistemas reais.
Uma das formas de se obter modelos matematicos e a modelagem
caixa-branca ou modelagem fenomenologica. Essa tecnica se baseia nas
informacoes sobre o sistema a ser modelado e nas leis fısicas que descrevem
os fenomenos envolvidos.
Identificacao de sistemas ou modelagem caixa-preta e uma forma al-
ternativa de se obter modelos a partir de observacoes, ou seja, de dados
coletados diretamente dos sistemas.
A modelagem caixa-cinza, tambem conhecida como identificacao caixa-
cinza, busca combinar os procedimentos de identificacao caixa-preta e
caixa-branca. Nesse caso, tanto os dados de entrada e saıda obtidos no
sistema quanto informacoes auxiliares sao usados na identificacao (Correa
e Aguirre, 2004).
2 1 Introducao
Metodos de identificacao sao aplicados a sistemas lineares e nao -
lineares, conforme estudos de casos encontrados em Aguirre (2007). Di-
versas representacoes nao -lineares tem sido empregadas com o intuito de
se obter modelos. Entre elas, destacam-se as series de Volterra (Vol-
terra, 1930), os modelos NARMAX (nonlinear autoregressive moving mo-
del with exogenous variables) polinomiais e racionais (Leontaritis e Bil-
lings, 1985a,b; Billings e Chen, 1989; Billings e Zhu, 1991; Zhu e Billings,
1991, 1993; Correa, 1997, 2001; Campos, 2007), modelos de blocos in-
terconectados (Wiener, 1958; Narendra e Gallman, 1966; Wigren, 1993;
Patwardhan et al., 1998; Pearson e Pottmann, 2000; Coelho, 2002), redes
neurais artificiais (Elsner, 1992; Henrique et al., 1998; Braga et al., 2000;
Amaral, 2001; Haykin, 2001), wavelets (Graps, 1995; Billings e Coca, 1999;
Correa, 2001) e modelos fuzzy (Zadeh, 1973; Mamdani, 1977; Takagi e Su-
geno, 1985; Babusca et al., 1998; Campello e Amaral, 1999, 2001). Varias
tecnicas de selecao de estrutura e estimacao de parametros foram desenvol-
vidas para essas representacoes (Akaike, 1974; Billings et al., 1989; Aguirre
e Billings, 1995; Aguirre e Mendes, 1996). Tais representacoes sao utili-
zadas, inclusive, na identificacao de sistemas caoticos (Rodrigues, 1996;
Correa, 1997).
Dinamica caotica pode ser definida como um comportamento estacio-
nario que nao pode ser classificado como um equilıbrio, nao e periodico e
nem quasi-periodico (Chua e Parker, 1989). Em um sistema que apresenta
tal comportamento, as trajetorias sao limitadas a uma regiao no espaco
de fases, porem nao convergem, nao divergem, nao sao periodicas e, so-
bretudo, nao se cruzam. E considerado um sistema determinıstico que
apresenta pouca previsibilidade e possui comportamento aparentemente
estocastico.
Para que um sistema contınuo dissipativo apresente comportamento
caotico, e necessario que ele seja nao-linear e, pelo menos, tridimensional
(Monteiro, 2006). O caos determinıstico se deve a dependencia sensitiva
as condicoes iniciais (Fiedler-Ferrara e Prado, 1994).
O trabalho apresentado por Lorenz (1963), no qual e relatada a sensibi-
lidade as condicoes iniciais apresentadas por certos sistemas nao -lineares,
e considerado um marco historico no estudo de sistemas dinamicos caoti-
cos.
Apesar de relativamente recente, a ciencia dos sistemas dinamicos cao-
ticos evoluiu muito desde o primeiro trabalho publicado por Lorenz. Me-
1.2 Motivacao 3
todos de analise, identificacao e sıntese de sistemas caoticos sao desenvol-
vidos em varias frentes de pesquisa pelo mundo. O artigo de Andrievskii
e Fradkov (2004) relata uma grande variedade de aplicacoes de sistemas
caoticos em diversas areas da ciencia.
Neste trabalho, pretende-se obter modelos utilizando as tecnicas de
identificacao de sistemas, a partir de dados coletados de um sistema fısico
construıdo por Firmo (2007). Tal sistema constitui-se de um pendulo
duplo que apresenta comportamento caotico. Esse sistema foi concebido
com finalidades de pesquisa e didaticas. Alem desse sistema, podem ser
encontradas na literatura outras demonstracoes de comportamento caotico
em pendulos duplos, tais como os trabalhos de Shinbrot et al. (1992),
Levien e Tan (1993), Skeldon (1994) e Stachowiak e Okada (2006).
Para se obter os modelos propostos, serao utilizadas as representa-
coes NARMAX polinomiais e racionais (Leontaritis e Billings, 1985a,b),
bem como a representacao fuzzy NARX Takagi-Sugeno (Takagi e Sugeno,
1985; Babusca et al., 1998). Tais representacoes sao capazes de reproduzir
uma grande variedade de regimes dinamicos nao -lineares, tais como bifur-
cacoes, bilinearidades, ciclos limites e, principalmente, caos (Rodrigues,
1996; Aguirre, 1997; Correa, 1997). Alem disso, a partir das representa-
coes NARMAX polinomiais e racionais, e possıvel se determinar os pontos
fixos1 de um sistema.
A caracterizacao dinamica dos modelos identificados sera obtida
baseando-se nas estimativas dos valores dos invariantes dinamicos. Tais
estimativas serao encontradas utilizando-se o pacote computacional TI-
SEAN (time series analysis), desenvolvido por Hegger et al. (1999). Alem
disso, para a validacao, serao comparadas projecoes tridimensionais dos
atratores reconstruıdos.
1.2 Motivacao
Acredita-se que os pendulos tenham sido os sistemas fısicos responsaveis
pelo nascimento da teoria de sistemas dinamicos (Monteiro, 2006). Desta
forma, analises de sistemas pendulares sao mencionadas como exemplos
classicos em livros didaticos que abordam sistemas dinamicos, tais como
1Pontos fixos ou pontos de equilıbrio de um modelo discreto autonomo sao definidoscomo aqueles pontos para os quais y(k) = y(k + i), i ∈ Z.
4 1 Introducao
Fiedler-Ferrara e Prado (1994) e Monteiro (2006).
O estudo de modelos matematicos de pendulos e aplicado a diferen-
tes sistemas fısicos (Firmo, 2007), sendo que avancos obtidos na analise
de seu modelo e de seu comportamento dinamico podem ajudar na re-
solucao de problemas relacionados a sistemas cujos modelos matematicos
sejam isomorficos aos modelos utilizados para sistemas pendulares (Smith
e Blackburn, 1989; Heng e Martienssen, 1992).
Diversos trabalhos publicados mostram a utilizacao de modelos pendu-
lares aplicados a resolucao de problemas relacionados a diferentes sistemas
fısicos, tais como o comportamento de navios sujeitos a oscilacoes forcadas
provocadas pelo movimento das ondas (Henry et al., 2001; Abdel-Rahman
e Nayfeh, 2003); a modelagem de um sistema composto por um helicoptero
transportando uma carga suspensa por um cabo (Cicolani et al., 2001) e,
particularmente em relacao aos pendulos duplos, podem-se citar trabalhos
que fazem a modelagem do comportamento de diferentes partes do corpo
humano durante o caminhar, utilizando um modelo baseado em pendulos
duplos equivalentes (Russi, 2002; Gutnik et al., 2005). Na area da robo-
tica, relata-se a utilizacao de modelos de pendulos duplos para o estudo
do comportamento de manipuladores (Berkemeier e Fearing, 1999).
Diversos sistemas pendulares foram modelados utilizando-se tecnicas
de modelagem caixa branca, que, infelizmente, demandam muito tempo e
conhecimento, sendo inviavel a sua aplicacao a determinados sistemas.
Uma tecnica alternativa aplicada a modelagem matematica e a
identificacao de sistemas. Uma de suas caracterısticas e que pouco ou
nenhum conhecimento previo do sistema e necessario, representando, as-
sim, uma importante ferramenta na obtencao de modelos. De acordo com
Aguirre (2007), a identificacao de sistemas se propoe a obter um modelo
matematico que explique, pelo menos em parte e de forma aproximada, a
relacao de causa e efeito presente nos dados. Desta forma, tais aspectos
motivam a utilizacao de tal tecnica em sistemas pendulares, haja vista a
importancia dos modelos no estudo de sistemas fısicos equivalentes.
1.3 Objetivos
O presente trabalho tem como objetivos:
• verificar a estacionaridade e a correta amostragem dos dados reais do
1.4 Estrutura da Dissertacao 5
pendulo duplo visando a identificacao e a caracterizacao dinamica;
• obter modelos que representem a dinamica caotica do pendulo
utilizando-se as tecnicas de identificacao de sistemas e as seguin-
tes representacoes nao -lineares: NARMAX polinomiais e racionais
e fuzzy NARX Takagi-Sugeno;
• caracterizar dinamicamente os dados reais do pendulo por meio dos
invariantes dinamicos, que, neste caso, sao o maior expoente de Lya-
punov e a dimensao fractal, e, em seguida, comparar os resultados
obtidos com os encontrados em Firmo (2007) a fim de validar os
algoritmos utilizados;
• validar os modelos identificados baseando-se nas estimativas dos va-
lores dos invariantes dinamicos e comparar as projecoes tridimensi-
onais dos atratores reconstruıdos.
1.4 Estrutura da Dissertacao
A dissertacao esta organizada como se segue: no Capıtulo 2, e apresentado
o pendulo duplo, juntamente com o modelo matematico que o representa.
Alem disso, e apresentada a sua serie temporal real.
Tecnicas de identificacao de sistemas, representacoes a serem utilizadas
e conceitos uteis na obtencao dos modelos para o pendulo sao revisados
no Capıtulo 3.
No Capıtulo 4, sao revisados os metodos utilizados na caracterizacao
dinamica do pendulo duplo e na validacao dos modelos.
Os modelos identificados, suas series temporais, seus atratores recons-
truıdos e seus invariantes dinamicos calculados sao mostrados no Capı-
tulo 5. Discussoes sobre os resultados tambem podem ser encontradas no
mesmo.
No Capıtulo 6, sao apresentados alguns comentarios conclusivos e su-
gestoes para trabalhos futuros.
Finalmente, no Anexo A, encontram-se as rotinas computacionais uti-
lizadas na identificacao dos modelos fuzzy Takagi-Sugeno.
Capıtulo 2
O Pendulo Duplo
“Comece fazendo o que e necessario, depois o que e pos-
sıvel, e de repente voce estara fazendo o impossıvel.”
Sao Francisco de Assis
2.1 Introducao
Neste capıtulo, e apresentado um sistema dinamico a partir do
qual pretende-se obter modelos matematicos utilizando-se tecnicas de
identificacao de sistemas, bem como suas equacoes, informacoes a res-
peito de seu funcionamento e sua serie temporal experimental. O sistema
aqui descrito constitui-se de um pendulo duplo que apresenta comporta-
mento caotico e cuja construcao fısica e caracterizacao dinamica foram
apresentadas em Firmo (2007).
A construcao da plataforma na qual se encontra o pendulo foi baseada
nos trabalhos de Shinbrot et al. (1992) e Christini et al. (1996), sendo que,
no primeiro, o sistema nao possuıa entradas, ao passo que, no segundo, foi
contemplada uma fonte de excitacao externa, sendo essa completamente
diferente da excitacao utilizada na plataforma aqui apresentada. Alem
disso, ressalta-se que, em ambos os trabalhos, nao foi considerada a pre-
senca de nenhum tipo de atrito.
Conforme sera visto a seguir, a plataforma construıda, alem de apre-
sentar uma forma de excitacao desenvolvida de tal modo que o sistema se
tornasse autonomo, seu modelo considera o atrito presente no sistema.
8 2 O Pendulo Duplo
2.2 Apresentacao da Plataforma
A plataforma foi desenvolvida com o objetivo de ser utilizada no ensino de
dinamica nao -linear e caos e, por isso, tem como caracterısticas o baixo
custo e a simples construcao. Para um melhor entendimento do seu fun-
cionamento, serao apresentadas as suas partes principais1:
• o sistema de suporte;
• o pendulo duplo;
• os sensores;
• o sistema de acionamento;
• o sistema de comando.
A seguir, a Figura 2.1 apresenta uma vista isometrica da plataforma.
Figura 2.1: Vista isometrica da plataforma (Firmo, 2007).
A figura apresenta as partes principais da plataforma.
1Para maiores detalhes da plataforma, ver Firmo (2007).
2.2 Apresentacao da Plataforma 9
2.2.1 O Sistema de Suporte
O sistema de suporte, construıdo utilizando-se placas e cantoneiras de
alumınio, e responsavel por agrupar e manter a sustentacao das demais
partes do sistema. Esse suporte, que constitui a base mecanica da plata-
forma, e composto pelas seguintes partes: suportes SG e Sm, mancais do
eixo E2, eixo E2 e acoplamento ME. Verifica-se, a partir da Figura 2.2, a
representacao do sistema de suporte e os seus principais componentes.
Eixo E2Suporte SG
suporte Sm
Acoplamento ME Mancais do eixo E2
Figura 2.2: Representacao do sistema de suporte da plataforma (Firmo, 2007).
Representacao do sistema de suporte da plataforma e os seus prin-cipais componentes.
O suporte Sm tem por finalidade a sustentacao e a fixacao da fonte de
excitacao externa que, neste caso, e fornecida por um motor de corrente
contınua, responsavel pelo acionamento do pendulo duplo. Por sua vez, os
mancais do eixo E2 tem a funcao de oferecer a sustencao mecanica, com
baixo atrito, ao eixo E2, cujo papel e ligar o pendulo duplo ao eixo do
motor CC. A transmissao de torque entre o motor e o pendulo duplo e
realizada pelo acoplamento ME. O suporte SG tem a funcao de sustentar
as pecas citadas anteriormente.
2.2.2 O Pendulo Duplo
O pendulo duplo, cuja representacao e mostrada na Figura 2.3, e composto
por duas hastes, uma superior e uma inferior, denominadas, respectiva-
mente, barra 1 e barra 2. Essas barras sao interligadas por meio do eixo
E1. A haste externa pode girar livremente sobre seu eixo, enquanto que a
barra 1 depende do sistema de acionamento2 para girar.
2O sistema de acionamento e responsavel pelo torque fornecido a barra 1 por meiode um motor CC que esta acoplado a mesma por meio do eixo E2.
10 2 O Pendulo Duplo
A Figura 2.3 (b) apresenta a posicao de referencia (linha tracejada)
para o angulo das hastes, sendo que θ1 e θ2 representam as posicoes angu-
lares das barras 1 e 2 respectivamente. Ressalta-se que os angulos positivos
sao contabilizados no sentido anti-horario.
Barra 1
Barra 2
Eixo E1
Furos para fixacao do eixo E2
Rolamentos
(a) (b)
0
Figura 2.3: Representacao do pendulo duplo (Firmo, 2007).
Vistas em (a) perfil e (b) frontal do pendulo duplo. A linha trace-jada em (b) indica a referencia zero para o angulo das barras.
2.2.3 Os Sensores
A plataforma e provida de dois sensores responsaveis pelas informacoes
relacionadas a velocidade angular θ1 e a posicao θ1 da barra 1, indispensa-
veis ao seu funcionamento. O sensor S1 e formado por um pequeno motor
CC de ımas permanentes que funciona como gerador. O eixo do gerador
e acoplado diretamente ao eixo do motor CC do sistema de acionamento.
2.2 Apresentacao da Plataforma 11
Consequentemente, o gerador e o motor giram a mesma velocidade da
barra 1 do pendulo duplo, ou seja, θ1.
O motor CC de ımas permanentes, utilizado como gerador, passa a
ter a velocidade angular θ1 como entrada e a tensao nos terminais da
armadura, em circuito aberto, como saıda. Desta forma, pode-se modelar
o sinal proveniente do sensor S1 como:
S1(θ1) = kfcem θ1, (2.1)
sendo que kfcem e a constante do gerador obtida a partir de ensaios.
O sensor S2 tem a funcao de informar se o angulo θ1 esta compreen-
dido entre um valor γ e a linha vertical. Um disco semi-aberto Ds e um
fotosensor compoem S2, conforme ilustrado na Figura 2.4.
disco semi-aberto fotosensor
0
(a) (b)
γ
Figura 2.4: Representacao do sensor S2 da plataforma (Firmo, 2007).
O sensor S2 e composto por (a) um disco semi-aberto e (b) umfotosensor.
O disco e feito em acrılico e e fixado no eixo de sustentacao E2. O foto-
sensor e composto por um diodo emissor de luz (LED) e um fototransistor,
cuja saturacao ou corte depende da luz emitida pelo LED e da posicao de
Ds, ou seja, do valor de θ1. De acordo com a posicao angular da barra 1,
12 2 O Pendulo Duplo
modela-se o sinal de saıda do sensor da seguinte forma:
S2(θ1) =
0, se |θ1| ≥ γ;
1, se |θ1| < γ.(2.2)
As informacoes fornecidas pelos sensores S1 e S2 sao utilizadas na logica
de comando do motor CC, conforme sera apresentado na Secao 2.2.5. A
Figura 2.5 mostra a representacao da plataforma e as posicoes dos sensores
S1 e S2.
Motor CC
Sensor S2Sensor S1
Pendulo duplo
Figura 2.5: Representacao da plataforma desenvolvida - perfil (Firmo, 2007).
Plataforma desenvolvida e as posicoes de seus principais componen-tes.
2.2 Apresentacao da Plataforma 13
2.2.4 O Sistema de Acionamento
O sistema de acionamento e composto por um motor CC e um circuito
de acionamento denominado ponte H. O motor e responsavel por produzir
o torque a ser aplicado ao pendulo duplo, produzindo o seu movimento.
Trata-se de um motor universal, utilizado em maquinas de costura, de 100
W e 110 V. Seus circuitos foram modificados a fim de se operar como um
motor de corrente contınua com excitacao independente, alimentado com
tensoes contınuas maximas de 32 V, aplicada aos terminais do enrolamento
da armadura, e 15 V, aplicada aos terminais do enrolamento de campo.
O circuito equivalente do motor modificado pode ser visualizado na
Figura 2.6, na qual constam os seguintes parametros: a resistencia de ar-
madura Ra, a resistencia de campo Rc, a indutancia de armadura La, a
indutancia de campo Lc, a corrente de campo ic, a constante de veloci-
dade kv e a tensao de campo Vc. Esses parametros sao mantidos constantes
durante o funcionamento da plataforma, com excecao da tensao de arma-
dura V (θ1, θ1), que esta em funcao da posicao e da velocidade da barra 1,
pois o acionamento do motor no sentido desejado, realizado pela ponte H,
depende de tais variaveis, conforme sera mostrado na Secao 2.2.5.
Conforme mencionado anteriormente, o circuito denominado ponte H
tem a funcao de acionar o motor CC no sentido desejado, cujo princıpio
reside na aplicacao da tensao V (θ1, θ1) com a polaridade correspondente
ao sentido de rotacao desejado. A Figura 2.7 apresenta o esquema eletrico
da ponte H.
Ra La
+
−
Rc
VcV (θ1, θ1) Lckv θ1
+
−
icia
Figura 2.6: Circuito equivalente do motor CC da plataforma (Firmo, 2007).
Circuitos de armadura (esquerda) e de excitacao de campo (direita).
14 2 O Pendulo Duplo
+V
-V
C4
C2C1
C3
Motor CC
LaRa
Figura 2.7: Esquema de funcionamento da ponte H (Firmo, 2007).
A direcao da corrente determina o sentido de rotacao desejado.Chaves C1 e C4 fechadas fazem o motor girar no sentido anti-horario, enquanto que C2 e C3 fechadas o fazem girar no sentidohorario.
O circuito e composto por quatro chaves, denominadas C1, C2, C3 e C4,
que sao sempre acionadas aos pares com o objetivo de causar a inversao
no sentido da corrente de armadura ia. Considerando que o estado logico
fechado das chaves seja 1, e o aberto seja 0, a Tabela 2.1 fornece os estados
permitidos para o funcionamento da ponte.
Tabela 2.1: Logica de acionamento do motor em funcao das chaves.
ChavesEstado do motor
C1 e C4 C2 e C3
0 0 Desligado
0 1 Ligado no sentido horario
1 0 Ligado no sentido anti-horario
1 1 Estado nao permitido
2.2 Apresentacao da Plataforma 15
2.2.5 O Sistema de Comando
O circuito de comando tem a funcao de energizar o motor e determinar o
seu sentido de rotacao, baseado nas informacoes provenientes dos sensores
citados na Secao 2.2.3. Para tal, desenvolveu-se a logica de comando
mostrada na Tabela 2.2.
Tabela 2.2: Logica do sistema de comando.
SensoresEstado do motor
S1(θ1) S2(θ1)
0 0 Desligado
0 1 Desligado
> 0 0 Desligado
< 0 0 Desligado
> 0 1 Ligado no sentido anti-horario
< 0 1 Ligado no sentido horario
2.2.6 Funcionamento da Plataforma
A interacao dos sistemas apresentados nas Secoes 2.2.1 a 2.2.5 fornece
o comportamento dinamico global da plataforma. Essa interacao, junta-
mente com a realimentacao dos sinais provenientes dos sensores, faz com
que o sistema apresente comportamento autonomo, ou seja, nao dependa
explicitamente do tempo, mas de seus proprios estados.
O circuito de comando recebe os sinais provenientes dos sensores S1
e S2 e, a partir da logica apresentada na Tabela 2.2, envia o sinal de
comando, correspondente ao modo adequado de acionamento do motor
CC, para o circuito da ponte H. Este ultimo, por sua vez, aciona o motor
aplicando uma tensao V (θ1, θ1), que depende da posicao e da velocidade
angular da barra 1 (estados do sistema) do pendulo duplo. A corrente
de armadura resultante, ia(θ1, θ1), e convertida no torque G(θ1, θ1). O
fechamento da malha se da por meio dos sensores que monitoram e enviam
16 2 O Pendulo Duplo
os sinais ao circuito de comando. O sinal correspondente a velocidade
angular θ1 e armazenado e utilizado na identificacao de modelos e na
caracterizacao dinamica do sistema. O diagrama de funcionamento da
plataforma pode ser observado na Figura 2.8.
θ1
velocidade angular
Movimento
Sensores
V (θ1, θ1) G(θ1, θ1)
Ponte H - motor CC
Sistema de acionamento
Caracterizacao dinamica
sinalde
realim
enta
cao
Sistema de comando.Comparadores.
Sinal de comando
diadt
, θ1, θ2, θ1, θ2
S1(θ1)S2(θ1)
Figura 2.8: Diagrama de funcionamento da plataforma (Firmo, 2007).
A interacao dos sistemas e a realimentacao dos sinais provenien-tes dos sensores fazem com que o sistema possua comportamentoautonomo.
2.3 Modelo Matematico do Pendulo Duplo
Eletromecanico
O metodo de modelagem utilizado na obtencao do modelo matematico
da plataforma apresentada e conhecido como modelagem caixa branca ou
modelagem pela fısica do processo ou ainda modelagem fenomenologica.
Como o proprio nome diz, essa tecnica se baseia na aplicacao das leis
fundamentais da fısica e tem como resultado um conjunto de equacoes
que representam o processo modelado.
2.3 Modelo Matematico do Pendulo Duplo Eletromecanico 17
Durante o processo de modelagem, percorreram-se as seguintes etapas
ate a obtencao do modelo final (Firmo, 2007):
• obtencao de um modelo inicial, desprezando-se o atrito e a excitacao
externa;
• inclusao do amortecimento referente ao atrito presente no sistema;
• inclusao de uma excitacao V generica;
• teste utilizando funcao de excitacao V (t) periodica - sistema nao
autonomo;
• modelo final: consideracao da funcao de excitacao especıfica
V (θ1, θ1) - sistema autonomo.
Ao longo das etapas utilizadas no processo de modelagem, as hastes
que constituem o pendulo duplo foram substituıdas por massas pontu-
ais, localizadas nos centros de massa das barras e ligadas por hastes com
massas desprezıveis.
O modelo final obtido para o pendulo duplo eletromecanico, consi-
derando-se o atrito e o torque de excitacao, e formado pelas seguintes
18 2 O Pendulo Duplo
equacoes diferenciais de tempo contınuo (Firmo, 2007):
θ1 =
(
−3 g l1 sen(θ1) (4 m1 + 5 m2)
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+
9 m2 l1 (g sen(−θ1 + 2 θ2) + l1 θ21 sen(2 β))
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+
−24 bm1 θ1 + 24 Kt ia(θ1, θ1) − 24 bm2 sgn(θ1)
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+
36 l1 cos(β) (b4 sgn(β) + b2 β) + 12 m2 l1 l22 θ22 sen(β)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))
)
; (2.3)
θ2 =
(
−24 b2 β (Mm + m1 l21 + 3 m2 l21)
m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−12 l1 θ21 sen(β) (Mm + m1 l21 + 3 m2 l21)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−9 l21 g sen(−2 θ1 + θ2) (m1 + 2 m2)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−36 l1 cos(β) (Kt ia(θ1, θ1) − bm1 θ1 − bm2 sgn(θ1))
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−24 b4 sgn(β) (Mm + m1 l21 + 3 m2 l21)
m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−3 sen(θ2) g (m1 l21 + 6 m2 l21 + 4 Mm)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−9 m2 l21 θ22 sen(2 β)
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)
)
; (2.4)
diadt
=
(
Va sgn(θ1)h(θ1) − Ks θ1 − Ra iaLa
)
, (2.5)
em que β = (θ1 − θ2) e β = (θ1 − θ2).
2.3 Modelo Matematico do Pendulo Duplo Eletromecanico 19
Os demais termos presentes nas Equacoes (2.3), (2.4) e (2.5) corres-
pondem aos parametros referentes ao motor, as hastes, aos rolamentos, aos
sensores e outros que se julgaram necessarios durante o processo de mode-
lagem. As descricoes, os valores e as fontes de obtencao desses parametros
sao apresentados na Tabela 2.3.
O modelo final tambem e constituıdo pelo operador sgn(·), introduzido
durante a modelagem do atrito de Coulomb e responsavel por fornecer o
sinal da variavel que e passada como argumento, tal que:
sgn(argumento) =
1, se argumento ≥ 0;
−1, se argumento < 0.(2.6)
Alem disso, a funcao h(θ1) representa o sinal proveniente do sensor S2
e e mostrada na Equacao (2.7).
h(θ1) =
0, se |θ1| ≥ γ;
1, se |θ1| < γ.(2.7)
A funcao de excitacao externa V (θ1, θ1), comentada na Secao 2.2.4, e
representada pelo termo Va sgn(θ1)h(θ1) da Equacao (2.5), em que Va e o
valor da amplitude da tensao aplicada aos terminais do enrolamento de
armadura do motor CC e, consequentemente, o parametro de bifurcacao3
da plataforma.
As Equacoes (2.3), (2.4) e (2.5) podem ser decompostas em cinco equa-
coes diferenciais de primeira ordem, formando um sistema de quinta or-
dem4, cujos estados sao a corrente de armadura, ia(θ1, θ1), a velocidade
angular da barra 1, θ1, a posicao da barra 1, θ1, a velocidade angular da
barra 2, θ2, e a posicao da barra 2, θ2. O conjunto de Equacoes (2.8)
apresenta o modelo final utilizando a representacao no espaco de estados.
3Parametro do sistema que, quando variado, gera diversos tipos de regimes dinami-cos.
4A este tipo de representacao se da o nome de representacao no espaco de estados.Para o caso autonomo, contınuo no tempo, a representacao no espaco de estados tem aseguinte forma geral x = f(x), sendo que x ∈ R
n e o vetor de estados n-dimensional,f(x), um conjunto de equacoes em funcao do vetor de estados e x = dx/dt. A ordemdo sistema e dada pelo numero de equacoes diferenciais de primeira ordem necessariaspara descrever o sistema.
202
OP
endulo
Duplo
Tabela 2.3: Parametros utilizados no modelo final (Firmo, 2007).
Parametro Descricao Valor Unidade Origem
l1 comprimento da barra 1 0,27305 m (Shinbrot et al., 1992)
l2 comprimento da barra 2 0,21600 m (Shinbrot et al., 1992)
m1 massa da barra 1 0,29730 kg Calculo
m2 massa da barra 2 0,23590 kg Calculo
Mm momento de inercia do motor 33,8 × 10−6 kgm2 Calculo
b1 coeficiente de amortecimento viscoso do rolamento do tipo 1 0,001150 Nm/rad http://www.skf.com
b2 coeficiente de amortecimento viscoso do rolamento do tipo 2 0,000015 Nm/rad http://www.skf.com
b3 coeficiente de amortecimento de Coulomb do rolamento do tipo 1 0,00002 Nm/rad http://www.skf.com
b4 coeficiente de amortecimento de Coulomb do rolamento do tipo 2 0,00002 Nm/rad http://www.skf.com
bm1 soma dos atritos viscosos do motor e do rolamento do tipo 1 0,00085 Nm/rad Ensaio
bm2 soma dos atritos de Coulomb do motor e do rolamento do tipo 1 0,00085 Nm/rad Ensaio
g gravidade 9,81 m/s2 (Meriam e Kraige, 2003)
Ra resistencia de armadura 13,7422 Ω Ensaio
La indutancia de armadura 31,10 mH Ensaio
Kt constante de torque do motor 0,0598 Nm/A Ensaio
Ks constante de velocidade do motor 0,0598 V/rad/s Ensaio
γ angulo de abertura do sensor S2 π/12 rad Tentativa e erro
Va amplitude da tensao aplicada a armadura do motor 18,5 Volts Ensaio
2.3 Modelo Matematico do Pendulo Duplo Eletromecanico 21
x1 = x2;
x2 =−3 g l1 sen(x1) (4m1 + 5m2)
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+
9 m2 l1 (g sen(−x1 + 2 x3) + l1 x22 sen(2 β))
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+
−24 bm1 x2 + 24 Kt x5 − 24 bm2 sgn(x2)
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β)+
36 l1 cos(β) (b4 sgn(β) + b2 β) + 12 m2 l1 l22 x24 sen(β)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β));
x3 = x4;
x4 =−24 b2 β (Mm + m1 l21 + 3 m2 l21)
m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−12 l1 x22 sen(β) (Mm + m1 l21 + 3 m2 l21)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−9 l21 g sen(−2 x1 + x3) (m1 + 2 m2)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−36 l1 cos(β) (Kt x5 − bm1 x2 − bm2 sgn(x2))
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−24 b4 sgn(β) (Mm + m1 l21 + 3 m2 l21)
m2 l22 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))+
−3 sen(x3) g (m1 l21 + 6 m2 l21 + 4 Mm)
l2 (8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β))
−9 m2 l21 x24 sen(2 β)
8 Mm + 8 m1 l21 + 15 m2 l21 − 9 m2 l21 cos(2 β);
x5 =Va sgn(x2) h(x1) − Ks x2 − Ra x5
La;
y = x2,
(2.8)
22 2 O Pendulo Duplo
sendo que x1 = θ1, x2 = θ1, x3 = θ2, x4 = θ2, x5 = ia, β = (x1 − x3) e
β = (x2 − x4). A saıda do sistema, y, corresponde a velocidade angular
da barra 1, que e obtida por meio do sensor S1 e que sera utilizada, neste
trabalho, no processo de identificacao.
Conforme verificado por Firmo (2007), a plataforma construıda apre-
senta certas caracterısticas que indicam a existencia de dinamica caotica,
tais como sensibilidade as condicoes iniciais, falta de previsibilidade a longo
prazo, maior expoente de Lyapunov positivo, dimensao fractal e atrator
estranho5.
A Figura 2.9 apresenta a serie temporal relativa a velocidade angular
da barra 1, obtida por meio do sensor S1 do sistema real.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
θ 1(r
ad/s)
Figura 2.9: Serie temporal relativa a variavel de estado θ1 do sistema real.
A aquisicao desses dados foi realizada utilizando -se o sensor S1.
Ressalta-se que foram obtidas varias series temporais para diferentes
valores do parametro de bifurcacao. Desta forma, escolheu-se apenas uma
serie temporal para ser utilizada ao longo deste trabalho. A escolha dessa
serie baseou-se na minimizacao de ruıdo devido a vibracao da bancada
onde o pendulo estava mecanicamente instalado e no menor valor possı-
vel do parametro de bifurcacao, de maneira que o sistema apresentasse
5Esses termos serao apresentados e discutidos no Capıtulo 4.
2.4 Consideracoes Finais 23
comportamento dinamico aparentemente caotico. A Tabela 2.4 fornece os
parametros de acionamento do motor CC e de aquisicao da serie.
Tabela 2.4: Parametros utilizados na obtencao experimental da serie temporalθ1.
Parametro Valor
Tensao de armadura Va 18,5 ± 0,1V
Tensao de campo Vc 10,2 ± 0,1V
γ 55
Frequencia de amostragem 2 kHz
Tamanho da serie temporal 12 × 106 pontos
Filtro anti-mascaramento R = 6k8 Ω e C = 100 nF
Frequencia de corte filtro 200 Hz
2.4 Consideracoes Finais
Neste capıtulo, foi apresentada a plataforma de estudo considerada neste
trabalho. Mostraram-se, de forma sucinta, as principais partes que com-
poem a plataforma, uma breve descricao de seu funcionamento e os pa-
rametros envolvidos na aquisicao da serie temporal real. Ressalta-se que
apenas a serie relativa a variavel de estado θ1 sera utilizada nos capıtulos
seguintes na obtencao e validacao de modelos dinamicos. Isso se deve ao
fato de nao ser possıvel medir diretamente as outras variaveis de estado
presentes no pendulo duplo.
Capıtulo 3
Tecnicas de Identificacao de
Sistemas Dinamicos
“Todo o nosso saber comeca nos sentimentos.”
Leonardo da Vinci
3.1 Introducao
Identificacao de sistemas ou modelagem caixa-preta ou ainda modelagem
empırica e a area do conhecimento que estuda tecnicas alternativas de mo-
delagem matematica1 (Aguirre, 2007). Nesse tipo de modelagem, obtem-se
modelos a partir dos dados coletados diretamente dos sistemas em estudo
e nao ha necessidade de nenhum conhecimento previo acerca desses. Em
contrapartida, a ausencia do significado fısico dos modelos obtidos e o nu-
mero excessivo de parametros sao exemplos de desvantagens desse tipo de
modelagem (Pottmann e Pearson, 1998).
Este capıtulo tem por objetivo apresentar os conceitos que serao uteis
na obtencao de modelos para o pendulo duplo utilizando as tecnicas de
identificacao de sistemas. Serao analisadas e discutidas as principais re-
presentacoes nao -lineares utilizadas no desenvolvimento deste trabalho.
1Modelagem matematica e a area do conhecimento que estuda maneiras de desen-volver modelos matematicos de sistemas reais.
26 3 Tecnicas de Identificacao de Sistemas Dinamicos
3.2 Etapas de Identificacao de Sistemas
As principais etapas de um problema de identificacao de sistemas, em-
pregadas em sistemas lineares e nao -lineares, podem ser encontradas em
Ljung (1999):
• testes dinamicos e coleta de dados;
• escolha da representacao matematica;
• selecao da estrutura do modelo;
• estimacao dos parametros do modelo;
• validacao do modelo.
3.2.1 Testes Dinamicos e Coleta de Dados
Testes dinamicos e coleta de dados compreendem os metodos relativos a
excitacao e a amostragem de dados de um sistema. E uma etapa muito
importante, pois tem o objetivo de garantir que, nos dados a serem mo-
delados, estejam presentes todas as frequencias de interesse e que essas
apresentem as caracterısticas estaticas e dinamicas do sistema.
O sinal de excitacao apresenta duas importantes funcoes. Uma delas e
excitar as caracterısticas dinamicas e estaticas do sistema em toda a faixa
de frequencia de interesse. A outra esta relacionada ao perfil de amplitudes
desse sinal, que e responsavel pela excitacao das nao -linearidades presentes
no sistema. As caracterısticas nao excitadas nao podem ser modeladas em
virtude de nao estarem contidas nos dados coletados. Portanto, o sinal
de excitacao deve ser persistentemente excitante. De acordo com Aguirre
(2007), um sinal persistentemente excitante de ordem n e um sinal que
tem potencia espectral em n ou mais frequencias distintas. Dois sinais
comumente usados sao o sinal pseudo-aleatorio e o ruıdo branco.
Um tipo de sinal pseudo-aleatorio e o sinal binario pseudo-aleatorio
(PRBS). Esse e um sinal binario, pois apresenta somente dois valores pos-
sıveis. Alem disso, um sinal pseudo-aleatorio possui ruu(k) ≈ 0 para
∀k 6= 0, sendo que ruu representa a funcao de autocorrelacao de um sinal
u(k). O ruıdo branco e um sinal de media nula que possui potencia espec-
tral em todas as frequencias e, portanto, pode ser definido como um sinal
puramente aleatorio.
3.2 Etapas de Identificacao de Sistemas 27
O tempo ou perıodo de amostragem, que corresponde ao intervalo entre
duas amostras, e determinado, na pratica, escolhendo-se a frequencia de
amostragem entre 5 e 10 vezes maior que a frequencia de interesse contida
nos dados. Se o tempo de amostragem for muito grande (subamostragem),
havera perda de informacao dinamica entre uma amostra e outra (Billings
e Aguirre, 1995). Por outro lado, se o tempo de amostragem for muito
pequeno (superamostragem), o desempenho do algoritmo de selecao de
estrutura e estimacao de parametros sera afetado devido ao mal condici-
onamento numerico. Nesse caso, o sinal deve ser decimado a fim de que
se torne devidamente amostrado. Para isso, e necessario verificar o grau
de correlacao entre as observacoes adjacentes do sinal. Um procedimento
adotado na escolha do melhor tempo de amostragem consiste na utilizacao
das funcoes de autocovariancia linear ry(τ) e nao -linear ry2
′ (τ) da saıda
do sistema:
ry(τ) = E[(
y(k) − y(k))(
y(k − τ) − y(k))]
; (3.1)
ry2
′ (τ) = E[(
y2(k) − y2(k))(
y2(k − τ) − y2(k))]
, (3.2)
sendo que y(k) e y2(k) representam os valores medios da saıda do sistema
e E[.] indica a esperanca matematica. O apostrofo indica apenas que o
sinal teve sua media removida.
Considerando que τy e τy2
′ correspondem, respectivamente, aos primei-
ros mınimos de ry e ry2
′ , estabelece -se que o menor desses mınimos sera o
valor de trabalho, ou seja, τm = min[τy,τy2′ ]. Portanto, o sinal se tornara
devidamente amostrado quando τm satisfizer a seguinte condicao (Aguirre,
2007):
10 ≤ τm ≤ 20, (3.3)
podendo as vezes ser estendido para:
5 ≤ τm ≤ 25. (3.4)
3.2.2 Escolha da Representacao Matematica
Representacao matematica e a classe de equacoes escolhida para represen-
tar um sistema dinamico. Como exemplos, tem-se as funcoes de transfe-
rencia em s e os modelos em espaco de estados.
A seguir, sao citadas algumas das representacoes nao -lineares mais
28 3 Tecnicas de Identificacao de Sistemas Dinamicos
utilizadas:
• funcoes de base radial (Casdagli, 1989; Alves, 2004);
• modelos NARMAX (do termo em ingles nonlinear autoregressive
moving average model with exogenous inputs) polinomiais e racionais
(Leontaritis e Billings, 1985a,b; Billings e Chen, 1989; Billings e Zhu,
1991; Zhu e Billings, 1991, 1993; Correa, 1997, 2001; Campos, 2007);
• modelos de blocos interconectados (Wiener, 1958; Narendra e Gall-
man, 1966; Wigren, 1993; Patwardhan et al., 1998; Pearson e Pott-
mann, 2000; Coelho, 2002);
• redes neurais artificiais (Elsner, 1992; Henrique et al., 1998; Braga
et al., 2000; Amaral, 2001; Haykin, 2001);
• series de Volterra (Volterra, 1930);
• wavelets (Graps, 1995; Billings e Coca, 1999; Correa, 2001);
• modelos Fuzzy (Zadeh, 1973; Mamdani, 1977; Takagi e Sugeno, 1985;
Babusca et al., 1998; Campello e Amaral, 1999, 2001).
No desenvolvimento deste trabalho, serao utilizados modelos autono-
mos do tipo NARMAX polinomiais e racionais e modelos Fuzzy do tipo
Takagi-Sugeno (TS) (Takagi e Sugeno, 1985). As Secoes 3.3, 3.4 e 3.5
apresentam, em maiores detalhes, essas representacoes.
3.2.3 Selecao da Estrutura do Modelo
Dada uma representacao matematica, o primeiro passo para definir um
modelo e determinar a sua estrutura e, em seguida, estimar seus parame-
tros.
Um algoritmo utilizado para se determinar a estrutura de um modelo
e a taxa de reducao do erro (ERR - error reduction ratio), proposto por
Billings et al. (1989), adaptado por Mendes (1995) para modelos racionais
e alterado por Correa (1997) de forma a inserir termos de ruıdo.
O algoritmo consiste em associar a cada termo candidato um ındice
que corresponda a sua contribuicao na explicacao da variancia dos da-
dos de saıda. Esse algoritmo ordena os termos candidatos em uma lista
decrescente conforme a sua importancia na identificacao do sistema.
3.2 Etapas de Identificacao de Sistemas 29
O numero de termos candidatos possıveis em um modelo e definido pelo
grau de nao -linearidade, l, e pelos atrasos maximos referentes a saıda, ny,
e a entrada, nu. Portanto, um aumento desses parametros provocaria um
aumento significativo no numero de termos candidatos, fazendo com que
a estimacao de parametros seja mal-condicionada.
3.2.4 Estimacao dos Parametros do Modelo
Na estimacao dos parametros de um modelo, podem ser utilizados diversos
tipos de estimadores. O estimador de mınimos quadrados (MQ), cujo
princıpio reside em encontrar uma solucao (vetor de parametros estimados
θ) que minimize o somatorio do quadrado do erro de predicao, e aplicado
a estruturas lineares nos parametros.
Em estruturas nao -lineares nos parametros, pode-se utilizar, por exem-
plo, o estimador estendido de mınimos quadrados (EMQ). Tal estimador
tem por objetivo amenizar a polarizacao2 dos parametros estimados.
3.2.5 Validacao do Modelo
Um modelo sera considerado valido se incorporar as caracterısticas do
sistema que sao fundamentais para uma determinada aplicacao.
Na validacao de sistemas dinamicos nao -lineares com dinamica caotica,
e importante encontrar caracterısticas fundamentais desses sistemas que
possam ser utilizadas para validar os modelos obtidos. Isso se deve ao fato
de as predicoes temporais, utilizando modelos com dinamica caotica, nao
caracterizarem tais modelos, uma vez que uma infinitesima perturbacao
nas condicoes iniciais ou nos parametros do modelo resultam em predicoes
temporais completamente distintas.
Uma maneira de contornar essa condicao e trabalhar em um espaco
onde o tempo nao seja explicitamente representado. Tal metodologia e
conhecida como reconstrucao do espaco de estados. Dada uma serie tem-
poral y(k) (k = 1, 2, . . . ) de um sistema, a reconstrucao consiste em tomar
conjuntos subsequentes de de valores da mesma sequencia de forma a se
2Tambem conhecida como tendencia, vies ou ainda bias em ingles. Pode ser definidacomo a diferenca entre a esperanca matematica dos parametros estimados, E[θ], e oseu vetor de parametros θ.
30 3 Tecnicas de Identificacao de Sistemas Dinamicos
ter:
ye(1) = [y(1) y(2) . . . y(de)]T;
ye(2) = [y(2) y(3) . . . y(de + 1)]T; (3.5)
ye(3) = [y(3) y(4) . . . y(de + 2)]T....
...
Desta forma, a sequencia de vetores de dimensao de (ye(1), ye(2),
ye(3), · · · ) pode ser representada como uma sequencia de pontos no espaco
Rde , tambem conhecido como espaco de imersao. Portanto, a sequencia
produzida e referida como sendo uma trajetoria do sistema, ou modelo,
imersa no espaco de estados.
No espaco de imersao, se duas sequencias temporais forem produzidas
pelo mesmo sistema, mesmo em condicoes iniciais distintas, ainda que o
sistema apresente dinamica caotica, ambas as trajetorias convergirao para
uma regiao limitada no espaco de fases denominada atrator. Desta forma,
os atratores podem ser utilizados na validacao de modelos caoticos, pois,
na maioria dos casos, apresentam robustez a perturbacoes infinitesimais
nas condicoes iniciais e nos parametros. Entao, em vez de se compararem
series temporais, e mais adequado compararem-se seus atratores, ou suas
projecoes bidimensionais e tridimensionais. Alem disso, tambem poderiam
ser comparados sequencias de atratores obtidos a medida que se varia o
parametro de bifurcacao (diagramas de bifurcacao) ou ainda cortes dos
atratores (secoes de Poincare).
Para validar os modelos obtidos neste trabalho, serao utilizados proje-
coes tridimensionais dos atratores e outros ındices, tais como estimativas
do maior expoente de Lyapunov e da dimensao fractal. Esses ındices tam-
bem serao conhecidos como invariantes dinamicos e sao empregados na
caracterizacao dinamica do pendulo duplo e dos modelos encontrados.
3.3 Modelo NARMAX Polinomial
O modelo NARMAX polinomial (Leontaritis e Billings, 1985a,b) e um
modelo discreto que explica o valor de saıda em funcao de valores previos
dos sinais de saıda, y(k), de entrada, u(k), e de ruıdo, e(k). O modelo
3.3 Modelo NARMAX Polinomial 31
NARMAX polinomial e apresentado em Aguirre (2007):
y(k) = F ℓ[
y(k − 1), . . . ,y(k − ny),u(k − τd), . . . ,u(k − nu),
e(k − 1), . . . ,e(k − ne)]
+ e(k), (3.6)
sendo que e(k) indica todos os efeitos que nao podem ser bem representa-
dos por F ℓ[.], que e uma funcao polinomial com grau de nao -linearidade
ℓ ∈ N. Os termos τd, ny, nu e ne representam, respectivamente, o tempo
morto e os maximos atrasos em y, em u e em e. Como exemplo, apresenta-
se um modelo com ℓ = 2, ny = 2, nu = 2 e ne = 5 (Cassini, 1999):
y(k) = 1,2929 y(k − 1) + 0,0101 u(k − 2)u(k − 1) + 0,0407 u(k − 1)2
−0,3779 y(k − 2) − 0,1280 u(k − 2)y(k − 1)
+0,0957 u(k − 2)y(k − 2) + 0,0051 u(k − 2)2
+5∑
i=1
θi e(k − i) + e(k). (3.7)
A parte determinıstica da Equacao (3.6) pode ser expandida como
o somatorio de termos com graus de nao -linearidade variando na faixa
1 ≤ m ≤ ℓ e e representada por (Peyton-Jones e Billings, 1989):
y(k) =
ℓ∑
m=0
m∑
p=0
ny ,nu∑
n1,nm
cp,m−p(n1, . . . ,nm)
p∏
i=1
y(k − ni)
m∏
i=p+1
u(k − ni), (3.8)
sendo queny ,nu∑
n1,nm
≡
ny∑
n1=1
· · ·nu∑
nm=1
, (3.9)
e o limite superior e ny se o somatorio se refere a fatores do tipo y(k−ni)
ou nu para fatores do tipo u(k − ni).
Portanto, cada termo de grau m podera conter um fator de grau p do
tipo y(k−i) e um fator de grau (m−p) do tipo u(k−i) sendo multiplicado
por um parametro representado por cp,m−p(n1, . . . ,nm). A seguir, e mos-
trado um exemplo no qual a funcao F ℓ[.] e expandida como um polinomio
32 3 Tecnicas de Identificacao de Sistemas Dinamicos
de grau dois, ou seja, F 2[.]. Desta forma, tem-se (Aguirre, 2007):
y(k) = c0,0 +
ny∑
n1=1
c1,0(n1) y(k − n1) +
nu∑
n1=1
c0,1(n1) u(k − n1)
+
ny∑
n1
ny∑
n2
c2,0(n1,n2) y(k − n1)y(k − n2)
+
ny∑
n1
nu∑
n2
c1,1(n1,n2) y(k − n1)u(k − n2)
+nu∑
n1
nu∑
n2
c0,2(n1,n2) u(k − n1)u(k − n2). (3.10)
O exemplo a seguir e apresentado para ilustrar as definicoes anteriores
(Rodrigues, 1996):
y(k) = 0,44551 y(k − 1) + 0,57773 y(k − 2) − 0,83997 u(k − 2)
+0,64166 u(k − 1) − 0,00867 y(k − 1)2u(k − 1)
−1,31720 u(k − 3)u(k − 1)2 − 0,16796 y(k − 3)3
+0,78831 y(k − 2)u(k − 2) + 0,00056 y(k − 3)2u(k − 3),
(3.11)
sendo ℓ = 3 e ny = nu = 3. Representando o modelo (3.11) como em
(3.8), tem-se:
y(k) =3∑
m=0
m∑
p=0
3,3∑
n1,nm
cp,m−p(n1, . . . ,nm)
p∏
i=1
y(k−ni)m∏
i=p+1
u(k−ni), (3.12)
sendo:
c1,0(1) = 0,44551, c0,3(3,1,1) = −1,31720,
c1,0(2) = 0,57773, c3,0(3,3,3) = −0,16796,
c0,1(2) = −0,83997, c1,1(2,2) = 0,78831,
c0,1(1) = 0,64166, c2,1(3,3,3) = 0,00056,
c2,1(1,1,1) = −0,00867, demais cp,m−p(n1, . . . ,nm) = 0.
3.4 Modelo NARMAX Racional 33
3.4 Modelo NARMAX Racional
Modelos racionais sao definidos como a razao entre dois polinomios nao-
lineares (Billings e Mao, 1997). Tais modelos apresentam uma estrutura
mais flexıvel permitindo uma maior eficiencia na modelagem de certos
sistemas quando comparados com modelos polinomiais. Entretanto, os
modelos racionais sao mais sensıveis ao ruıdo.
Um modelo racional NARMAX tem a seguinte forma geral:
y(k) =a(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu),
b(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu),· · ·
· · ·e(k − 1), . . . ,e(k − ne))
e(k − 1), . . . ,e(k − ne))+ e(k), (3.13)
em que e(k) representa um ruıdo nao observavel, independente, com media
zero e variancia finita σ2e .
A Equacao (3.13) pode ser representada de forma simplificada como:
y(k) =a(k − 1)
b(k − 1)+ e(k), (3.14)
sendo conveniente definir os polinomios do numerador e do denominador
como:
a(k − 1) =Nn∑
j=1
pnjθnj = ψTn (k − 1)θn; (3.15)
b(k − 1) =Nd∑
j=1
pdjθdj = ψTd (k − 1)θd, (3.16)
sendo que θnj e θdj sao, respectivamente, os parametros dos regressores
do numerador e do denominador, que incluem informacao ate o instante
k − 1. O numero total de parametros a se estimar sera igual a Nn + Nd.
Os termos pnj e pdj sao os coeficientes das saıdas y(k − 1), · · · ,y(k − ny),
das entradas u(k − 1), · · · ,u(k − nu) e do ruıdo e(k − 1), · · · ,e(k − ne).
Devido a nao -linearidade dos parametros, apresentada pela Equacao
(3.13), nao e possıvel a estimacao direta dos parametros utilizando o MQ.
Uma alternativa para estima-los e fazer a pseudolinearizacao dos parame-
tros do modelo racional. Tal linearizacao se da por meio da multiplicacao
34 3 Tecnicas de Identificacao de Sistemas Dinamicos
da Equacao (3.13), em ambos os lados, por b(k − 1). Apos a manipulacao
de termos, chega-se a:
y∗(k) = a(k − 1) − y(k)
Nd∑
j=2
pdjθdj + b(k − 1)e(k)
=
Nn∑
j=1
pnjθnj − y(k)
Nd∑
j=2
pdjθdj + ζ(k)
= ψTn (k − 1)θn − y(k)ψT
d1(k − 1)θd + ζ(k), (3.17)
sendo ψTd (k − 1) = [pd1 ψ
Td1(k − 1)], θd1 = 1 e
y∗(k) = y(k)pd1 =a(k − 1)
b(k − 1)pd1 + pd1e(k); (3.18)
ζ(k) = b(k − 1)e(k) =
(
Nd∑
j=1
pdjθdj
)
e(k), (3.19)
em que e(k) e um ruıdo branco. Como e(k) e independente de b(k − 1) e
tem media zero, tem-se que E[ζ(k)] = E[b(k − 1)]E[e(k)] = 0.
Verifica-se, a partir da Equacao (3.18), que os termos y(k)pdj, por
causa de y(k), incluem o ruıdo e(k), que, por sua vez, esta correlacionado
com ζ(k). Essa correlacao induz a polarizacao do estimador, mesmo que
e(k) seja um ruıdo branco com media zero. Este problema aparece quando
se multiplica a Equacao (3.13) por b(k−1) a fim de tornar o modelo linear
nos parametros.
Para reduzir o efeito da polarizacao devido a pseudolinearizacao, foi
desenvolvido por Correa (1997) um algoritmo para estimar os parametros
do modelo racional a partir do MQE e de uma modificacao no algoritmo
proposto por Billings e Zhu (1991). O estimador MQE e um processo
iterativo que consiste em incluir a parte correlacionada do vetor de erro
na matriz de regressores ate que se obtenha um vetor de erro resultante
que seja descorrelacionado de tal matriz. Em Correa (1997), assume-se
que o modelo racional pode ser aproximado por:
y(k) =a(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu))
b(y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu))
+c(e(k − 1), . . . ,e(k − ne)) + e(k), (3.20)
3.5 Modelos Fuzzy 35
sendo que c(e(k − 1), . . . ,e(k − ne)) representa o polinomio utilizado para
modelar o ruıdo.
3.5 Modelos Fuzzy
A logica fuzzy3 foi introduzida por Zadeh (1965) como uma ferramenta
capaz de capturar informacoes vagas e aproximadas, em geral, descritas
em uma linguagem natural e expressas de uma maneira sistematica. Di-
ferentemente da logica concebida por Aristoteles, filosofo grego (384 - 322
a.C.), que leva a uma linha de raciocınio logico baseado em premissas e
conclusoes que devem ser necessariamente verdadeiras ou falsas, a logica
fuzzy viola estas suposicoes, admitindo que, ao mesmo tempo, uma dada
afirmacao seja parcialmente verdadeira e parcialmente falsa.
A logica fuzzy pode ser aplicada a modelagem de sistemas dinamicos.
Arquiteturas fuzzy foram demonstradas como aproximadores universais
(Pedrycz e Gomide, 1998), ou seja, capazes de aproximar qualquer fun-
cao contınua em um domınio compacto com qualquer nıvel de precisao
desejado.
Nesta secao, serao apresentados os principais conceitos da logica fuzzy,
bem como a arquitetura fuzzy TS e o algoritmo de identificacao aplicados
aos dados do pendulo.
3.5.1 Conceitos
A logica fuzzy teve o seu desenvolvimento baseado na teoria de conjuntos
fuzzy (Zadeh, 1965). Um conjunto fuzzy e definido como uma colecao de
elementos cujo grau de pertinencia ao conjunto varia entre 0 e 1. For-
malmente, um conjunto fuzzy A e caracterizado por uma funcao de per-
tinencia (FP), µA(x), que mapeia cada elemento do universo de discurso
(domınio), U , a um numero no intervalo unitario [0,1]. Tal conjunto pode
ser representado por:
A = (x, µA(x)), x ∈ U e µA(x) ∈ [0,1]. (3.21)
A FP µA(x) indica com que grau o elemento x pertence ao conjunto A.
Um grau de pertinencia 1 equivale ao sımbolo ∈, ao passo que o grau de
3Tambem conhecida como logica Nebulosa.
36 3 Tecnicas de Identificacao de Sistemas Dinamicos
pertinencia 0 equivale a /∈. Em princıpio, as funcoes de pertinencia podem
ser quaisquer funcoes que produzam valores entre 0 e 1. Comumente, essas
sao definidas como triangulares, trapezoidais, sigmoides ou gaussianas. A
Figura 3.1 apresenta um grafico de uma FP gaussiana.
0 1 2 3 4 5 6 7 8 9 100
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
x
µA(x
)
Figura 3.1: Grafico de uma funcao de pertinencia gaussiana.
A funcao de pertinencia gaussiana e descrita pela seguinte equacao:
µA(x) = exp(
−(x−α)2
2σ2
)
, sendo que α representa o seu centro e σ, a
sua abertura.
Um conceito relacionado aos conjuntos fuzzy e o de variavel linguıstica.
Entende-se que tal variavel pode assumir valores como nomes ou sentencas,
ao inves de assumirem apenas valores especıficos como ocorre em variaveis
numericas. Cada valor linguıstico e representado por um conjunto fuzzy e
apresenta a sua respectiva FP. Outro conceito e o de regra fuzzy, que e uma
sentenca composta por termos primarios (como exemplo, a temperatura
de uma sala: alta, baixa, media), por termos conectivos logicos (e, ou, nao)
e por termos modificadores (muito, pouco, extremamente). Utilizando-se
esses termos, pode-se dizer, por exemplo, que a temperatura de uma sala
e “nao muito fria”.
Um sistema fuzzy, seja ele um modelo ou controlador de um processo, e
composto de regras do tipo Se-entao4, que descrevem a dependencia entre
4Tambem conhecida como regra, implicacao ou, ainda, proposicao condicional fuzzy.
3.5 Modelos Fuzzy 37
as variaveis linguısticas de entrada e de saıda. Uma regra Se-entao tem a
seguinte forma:
Ri : Se x e Ai entao y e Bi, (3.22)
sendo que Ri representa a regra i, Ai e Bi sao variaveis linguısticas, x e
y sao os elementos dos universos de discurso X ⊂ Rn e Y ⊂ R
m respecti-
vamente. A proposicao “x e Ai” e conhecida como antecedente da regra,
“y e Bi”, como consequente ou conclusao e “x”, como variavel premissa.
Ressalta-se que uma regra fuzzy tambem podera apresentar mais de um
antecedente.
As regras Se-entao sao utilizadas por um mecanismo de inferencia para
processar algum resultado a partir das informacoes de entrada. A estru-
tura basica de um mecanismo de inferencia pode ser vista na Figura 3.2.
A partir da Figura 3.2, observa-se que os sinais de entrada, obtidos por
meio de observacoes ou medicoes, passam, primeiramente, por uma etapa
denominada fuzzificacao. Essa etapa consiste em transformar as entradas
determinısticas em conjuntos fuzzy.
A etapa de inferencia consiste em disparar as regras paralelamente
com diferentes graus de ativacao quando uma entrada e fornecida para
inferir um resultado ou saıda. Na etapa defuzzificacao, e extraıdo dos
conjuntos fuzzy de saıda um valor significativo que corresponde a melhor
possibilidade de combinacao desses conjuntos.
DefuzzificacaoFuzzificacao
Inferencia
Regras
Entradas
Determinısticas
Conjuntos
Fuzzy
Conjuntos ou
Funcoes Fuzzy
Saıdas
Determinısticas
Figura 3.2: Estrutura basica de um mecanismo de inferencia fuzzy.
3.5.2 Modelos Fuzzy Takagi-Sugeno
O modelo fuzzy proposto por Takagi e Sugeno (1985) e um sistema de in-
ferencia composto por regras Se-entao capaz de descrever, de forma exata
38 3 Tecnicas de Identificacao de Sistemas Dinamicos
ou aproximada, sistemas nao -lineares a partir de modelos locais lineares
ou nao -lineares. O modelo apresenta, como consequente das regras, uma
funcao qualquer das variaveis de entrada. Desta forma, o modelo TS e
composto por um conjunto de r regras que tem a seguinte forma:
Ri : Se x1 e Ai1 e . . . e xn e Ain entao yi = fi(x1, . . . , xn), (3.23)
sendo que i representa a i-esima regra (i = 1, 2, . . . , r), n indica a
quantidade de variaveis premissas (dimensao do espaco antecedente) e
fi(x1, . . . , xn) pode representar funcoes estaticas ou dinamicas.
Na premissa das regras, avalia-se o grau de compatibilidade de cada
entrada xn aos respectivos conjuntos fuzzy das variaveis linguısticas Ain,
obtendo-se os graus de pertinencia µAin(xn). O grau de ativacao do ante-
cedente da regra Ri e dado por:
wi(x) =n∏
i=1
µAin(xn), (3.24)
sendo x = [x1 x2 · · · xn]T o vetor de variaveis premissas. Ressalta-se
que seja necessario que, pelo menos, uma regra do modelo esteja ativa,
garantindo, assim, as seguintes propriedades:
wi(x) ≥ 0 e
r∑
i=1
wi(x) > 0. (3.25)
O valor de saıda do modelo resultante e obtido por meio da soma
ponderada dos modelos lineares, ou seja:
y =
∑r
i=1 wi(x)yi∑r
i=1 wi(x). (3.26)
Na identificacao de sistemas dinamicos nao -lineares utilizando mode-
los fuzzy TS, sao frequentemente empregadas as representacoes NARX
(nonlinear autoregressive model with exogenous inputs). O modelo NARX
explica o valor de saıda y(k) a partir de valores passados dos sinais de
entrada e saıda, ou seja,
y(k) = F[
y(k − 1), . . . ,y(k − ny),u(k − 1), . . . ,u(k − nu)]
, (3.27)
3.5 Modelos Fuzzy 39
no qual F [.] representa uma funcao nao -linear. Os termos ny e nu repre-
sentam, respectivamente, os maximos atrasos em y e em u.
Reescrevendo o modelo (3.27) em termos do modelo TS e considerando
a funcao F [.] polinomial, chega-se a um conjunto de regras do tipo:
Ri : Se y(k − 1) e Ai1 e . . . e y(k − ny) e Ainy
e u(k − 1) e Bi1 e . . . e u(k − nu) e Binu,
entao: yi(k) =
ny∑
j=1
aijy(k − j) +
nu∑
j=1
biju(k − j) + ci, (3.28)
em que aij , bij e ci sao os parametros consequentes. O tempo morto pode
ser incluıdo substituindo-se u(k − 1) por u(k − τd).
Nota-se, a partir da regra (3.28), que cada fi(x1, . . . , xn) e repre-
sentada por um modelo linear ARX (autoregressive model with exogenous
inputs). O modelo NARX e o resultado da composicao de regras do tipo
(3.28), cujo valor de saıda e obtido a partir da Equacao (3.26). A nao-
linearidade e introduzida por meio das funcoes de pertinencia.
3.5.3 Algoritmo de Identificacao
Esta secao descreve o algoritmo de identificacao utilizado para estimar os
parametros de modelos fuzzy NARX TS. O presente algoritmo foi pro-
posto por Babusca et al. (1998) para sistemas MIMO (multi-input, multi-
output).
A estrutura do modelo, ou seja, os valores de ny, nu e τd sao deter-
minados pelo usuario com base no conhecimento a priori e/ou em outro
criterio, por exemplo, o ERR, descrito na Secao 3.2.3. Uma vez deter-
minada a estrutura, os parametros dos no modelos MISO5 (multi-input,
single-output), representados pela Equacao (3.28), podem ser estimados.
Esses parametros constituem-se dos parametros das funcoes de pertinencia
e dos parametros dos modelos consequentes aij , bij e ci. Um parametro
adicional utilizado e o numero de regras r, que pode ser especificado pelo
usuario ou obtido automaticamente, como sera apresentado nesta secao.
Os modelos MISO sao obtidos de forma independente um do outro por
meio do seguinte procedimento:
5Considera-se que valores passados tanto da entrada quanto da saıda constituem asmultiplas variaveis de entrada dos modelos fuzzy NARX TS.
40 3 Tecnicas de Identificacao de Sistemas Dinamicos
1. a partir de N observacoes dos dados de entrada e saıda e dos pa-
rametros estruturais ny, nu e τd, montar a matriz de regressores de
entrada X e o vetor de regressores de saıda y;
2. dividir os dados em conjuntos de submodelos lineares locais utili-
zando o agrupamento fuzzy no espaco produto X × Y para cada
modelo;
3. calcular as funcoes de pertinencia a partir dos agrupamentos;
4. a partir das funcoes de pertinencia obtidas, estimar os parametros
consequentes utilizando o estimador de mınimos quadrados ponde-
rado (MQP).
Regressores
A matriz de regressores de entrada X e o vetor de regressores de saıda y
sao construıdos, respectivamente, da seguinte forma:
X =
x(1)...
x(N − 1)
e y =
y(2)...
y(N)
, (3.29)
sendo que x = [y(k − 1) . . . y(k − ny) u(k − 1) . . . u(k − nu)]T representa
o vetor de variaveis premissas.
Agrupamentos Fuzzy
Os agrupamentos fuzzy tiveram a sua origem na analise de dados e no re-
conhecimento de padroes, sendo que o conceito de funcoes de pertinencia e
usado para representar o grau de similaridade entre um objeto e algum ob-
jeto prototipo (Babusca e Verbruggen, 2003). O grau de similaridade pode
ser calculado utilizando, por exemplo, a medida de distancia Euclidiana.
Baseado nessa similaridade, vetores de dados podem ser agrupados de tal
forma que os dados que pertencam a um determinado agrupamento sejam
os mais similares possıveis e, ao mesmo tempo, sejam mais dissimilares
possıveis dos dados pertencentes a outros agrupamentos.
A ideia de agrupamento fuzzy e apresentada na Figura 3.3, sendo que
os dados estao agrupados em dois grupos com objetos prototipos v1 e v2,
3.5 Modelos Fuzzy 41
usando a medida de distancia Euclidiana. O particionamento dos dados e
expresso por uma matriz de particionamento fuzzy, U , cujos elementos µik
sao os graus de pertinencia dos pontos [xk,yk] em um agrupamento fuzzy
com objeto prototipo vi.
A1 A2
x
µ
y
y projecao
dados
B2
B1
v1
v2
x
µ
Figura 3.3: Representacao de um agrupamento fuzzy.
Os dados estao agrupados em dois grupos com objetos prototiposv1 e v2 que foram obtidos para esta representacao utilizando -se amedida de distancia Euclidiana.
Os prototipos ou centros dos agrupamentos fuzzy podem ser definidos
como subespacos lineares (linhas, planos, hiperplanos) e sao utilizados em
conjunto com uma medida de distancia adequada capaz de quantificar
a distancia dos pontos a variedade local (Bezdek, 1981). No algoritmo
de identificacao apresentado nesta secao, sera utilizada uma medida de
distancia adaptativa baseada no algoritmo de Gustafson e Kessel (1979)
(GK).
A partir do numero de agrupamentos c, que corresponde ao numero de
regras, da matriz de regressores de entrada X e do vetor de regressores de
saıda y, o algoritmo GK calcula a matriz de prototipos, V = [v1, . . . , vc], o
conjunto de matrizes de covariancia dos agrupamentos, F = [F1, . . . , Fc],
sendo que Fi sao matrizes definidas positivas ∈ R(n+1)×(n+1), e a matriz
U = [µik]c×N representada a seguir:
42 3 Tecnicas de Identificacao de Sistemas Dinamicos
U =
µ11 · · · µ1k · · · µ1N
... · · ·... · · ·
...
µi1 · · · µik · · · µiN
... · · ·...
. . ....
µc1 · · · µck · · · µcN
. (3.30)
O numero de agrupamentos deve ser especificado antes de se realizar
o agrupamento fuzzy, pois tal numero esta relacionado ao tipo de nao-
linearidade exibida pelo sistema em questao. Quanto mais regras o modelo
apresenta, mais “fina” e a sua aproximacao do sistema, fazendo com que o
numero de parametros a serem estimados seja maior e, consequentemente,
ocorrera um aumento da variancia devido a sobreparametrizacao. Quando
nao se tem nenhuma informacao a respeito da nao -linearidade, metodos
automaticos para se determinar o numero de regras podem ser aplica-
dos. Os metodos mais utilizados sao: validade das medidas (do ingles
validity measures) (Gath e Geva, 1989; Bezdek, 1981) e fusao de agru-
pamentos compatıveis (compatible cluster merging) (Kaymak e Babusca,
1995; Krishnapuram e Freg, 1992).
Funcoes de Pertinencia Antecedentes
As funcoes de pertinencia podem ser obtidas a partir da projecao dos
vetores, que sao formados pelas linhas da matriz U sobre os regressores
xn(k) do modelo, ou seja:
µAin(xn(k)) = projn(−→µiN
T), (3.31)
sendo que projn(·) representa o operador projecao. Cada linha da matriz
U corresponde a uma unica FP. Observa-se, a partir da Figura 3.3, a ideia
de projecao. Ressalta-se que a forma das FP dependera, obviamente, da
distribuicao dos dados.
Estimacao dos Parametros Consequentes
Para estimar os parametros consequentes, sera utilizado o estimador MQP.
Desta forma, o vetor de parametros consequentes, θi, e calculado por
θi = [XTe WiXe]
−1XTe Wi y, (3.32)
3.6 Consideracoes Finais 43
em que Xe = [X 1] e Wi representa uma matriz diagonal ∈ RN×N cujos
elementos sao os valores µik, ou seja, Wi = diag µi1 µi2 . . . µiN.
3.6 Consideracoes Finais
O objetivo deste capıtulo foi descrever, em linhas gerais, o contexto de
identificacao de sistemas dinamicos nao -lineares, foco do presente traba-
lho. Foram apresentados as principais estruturas dos modelos e os al-
goritmos utilizados na estimacao de seus parametros, mostrando maiores
detalhes para o modelo fuzzy NARX TS.
Capıtulo 4
Caracterizacao Dinamica
“Nossa recompensa se encontra no esforco e nao no re-
sultado. Um esforco total e uma vitoria completa.”
Ghandi
4.1 Introducao
Neste capıtulo, serao apresentados os metodos utilizados na caracteriza-
cao dinamica do pendulo duplo e na validacao dos modelos encontrados
para a serie temporal referente a variavel θ1. O procedimento de caracte-
rizacao dinamica baseia-se na obtencao de estimativas para os valores de
invariantes dinamicos, tais como o maior expoente de Lyapunov e a di-
mensao fractal. Alem disso, para a validacao, serao comparadas projecoes
tridimensionais dos atratores reconstruıdos.
Para a analise e o calculo dos invariantes dinamicos das series tempo-
rais obtidas do pendulo e dos modelos identificados, optou-se pelo pacote
computacional TISEAN (time series analysis), desenvolvido por Hegger
et al. (1999). Para validar os algoritmos desse pacote, comparar-se-ao os
valores encontrados com os valores obtidos por Firmo (2007) utilizando
tal pacote e a mesma serie temporal coletada do pendulo duplo.
4.2 Amostragem dos Dados
Aplicando o procedimento apresentado na Secao 3.2.1, avaliou-se o tempo
de amostragem da massa de dados referente a velocidade angular da
46 4 Caracterizacao Dinamica
barra 1, θ1. Essa massa de dados foi amostrada, originalmente, com uma
frequencia de 2000 Hz. A figura a seguir apresenta as funcoes de autoco-
variancia linear e nao -linear aplicadas a serie.
0 500 1000 1500−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
τ
r θ1
(τ)
(a)
0 200 400 600 800 1000−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
r θ1
2(τ
)τ
(b)
Figura 4.1: Funcoes de autocovariancia linear e nao -linear.
Funcoes de autocovariancia (a) linear, rθ1
(τ), e (b) nao -linear,
rθ 21(τ), aplicadas a serie temporal θ1.
Verifica-se, a partir da analise da Figura 4.1, que o menor mınimo
ocorre na funcao de autocovariancia nao -linear e vale τm ≈ 500. Observa-
se que a serie pode ser decimada com taxas de decimacao compreendidas
na faixa 20 ≤ ∆ ≤ 100. A Figura 4.2 mostra as funcoes de autocovariancia
para uma taxa de decimacao ∆ = 60.
4.3 Analise de Estacionariedade dos Dados
Antes de se realizar a caracterizacao dinamica dos dados, foi testada a
estacionariedade dos mesmos utilizando-se dois metodos. Tal teste se faz
necessario, devido ao fato de os algoritmos de identificacao utilizados con-
siderarem que os dados sejam estacionarios. Primeiramente, calcularam-
se os dois primeiros momentos estatısticos, ou seja, a media e a variancia
para janelas de tamanho T ao longo dos dados. A Figura 4.3 apresenta
um grafico com a media de cada janela.
A media de todas as janelas foi igual a xjan = −0,0026 e a variancia,
σ2jan = 0,00001681. Observa-se que os dados nao apresentam tendencia.
4.3 Analise de Estacionariedade dos Dados 47
0 5 10 15 20 25 30−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
r θ1
(τ)
τ
(a)
0 5 10 15 20−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
r θ1
2(τ
)
τ
(b)
Figura 4.2: Funcoes de autocovariancia linear e nao -linear para uma taxa dedecimacao ∆ = 60.
Funcoes de autocovariancia (a) linear, rθ1
(τ), e (b) nao -linear,rθ 21(τ).
0 10 20 30 40 50 60−0.015
−0.01
−0.005
0
0.005
0.01
janelas
med
ia
Figura 4.3: Grafico com a media de cada janela ao longo dos dados.
A media esta indicada por (), sendo que cada janela apresenta umtamanho T = 1000.
48 4 Caracterizacao Dinamica
O segundo metodo utiliza os graficos de recorrencia, introduzidos
por Eckmann et al. (1987) e investigados em maiores detalhes em Cas-
dagli (1997). Os graficos de recorrencia, alem de serem utilizados na
verificacao de estacionariedade, tambem sao uteis, de forma qualitativa,
na identificacao de comportamentos dinamicos a partir de series tempo-
rais. Pode-se detectar, por exemplo, comportamentos caoticos, aleatorios,
intermitentes e periodicos.
O grafico de recorrencia consiste em uma matriz quadrada MN×N ob-
tida a partir da seguinte expressao:
Mde,ǫi,j = Θ(ǫ − ‖x(i) − x(j)‖), (4.1)
sendo que:
• i, j = 1, 2, . . . , N , em que N e o numero de amostras;
• ǫ e o raio da vizinhanca (threshold), cujo centro e x(i);
• ‖ · ‖ representa uma norma (norma-1, Euclidiana ou norma-∞);
• Θ( · ) e a funcao de Heaviside, isto e Θ(a) = 0, se a < 0 e Θ(a) = 1,
se a ≥ 0;
• de e a dimensao de imersao;
• x(i) e x(j) representam as amostras i e j da serie temporal em
analise.
Em um espaco com dimensao de imersao de, o elemento Mi,j da ma-
triz apresenta valor 1 quando a distancia entre os pontos x(i) e x(j) for
menor que o raio ǫ, indicando que os pontos sao vizinhos nesse espaco.
Desta forma, diz-se que tais pontos sao recorrentes. Caso contrario, o ele-
mento Mi,j apresenta valor 0, indicando que os pontos nao sao recorrentes.
Para melhor visualizacao, representam-se os valores binarios da matrix M
utilizando diferentes cores, por exemplo, pontos pretos para representar
Mi,j = 1 e pontos brancos para Mi,j = 0.
Os graficos de recorrencia sao simetricos a diagonal i = j, tambem
conhecida por linha de identidade (Marwan et al., 2007), uma vez que, se
x(i) e vizinho de x(j), entao x(j) tambem e vizinho de x(i).
4.3 Analise de Estacionariedade dos Dados 49
Para o teste de estacionariedade, o grafico de recorrencia nao e sensıvel
a escolha da dimensao de imersao de (Hegger et al., 1999). A seguir, a
Figura 4.4 apresenta os graficos de recorrencia de (a) um ruıdo aleatorio
estacionario e (b) um ruıdo aleatorio com tendencia.
0 0.5 1 1.5 2
x 105
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2x 10
5
j
i
(a)
0 0.5 1 1.5 2
x 105
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2x 10
5
j
i
(b)
Figura 4.4: Graficos de recorrencia.
Graficos de recorrencia: (a) ruıdo aleatorio estacionario e (b) ruıdoaleatorio com tendencia. Os graficos foram obtidos utilizando -sede = 2, ǫ = 0,001 e N = 200000.
50 4 Caracterizacao Dinamica
Nota-se, a partir da Figura 4.4(a), que, em series temporais estaciona-
rias, os pontos estao distribuıdos uniformemente no grafico, enquanto que,
para series nao estacionarias, os pontos localizam-se proximos a linha de
identidade (Figura 4.4(b)), indicando tendencia.
Desta forma, para se verificar a estacionariedade da serie temporal do
pendulo duplo, gerou-se o grafico de recorrencia, como mostra a Figura
4.5. Conforme comentado anteriormente, verifica-se a estacionariedade
dos dados observando-se a distribuicao uniforme dos pontos no grafico.
0 0.5 1 1.5 2
x 105
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2x 10
5
j
i
Figura 4.5: Grafico de recorrencia da serie temporal do pendulo duplo.
O grafico foi obtido utilizando -se de = 2, ǫ = 0,001 e N = 196131.
4.4 Caos Determinıstico
Entende-se por sistemas caoticos aqueles que apresentam as seguintes ca-
racterısticas (Fiedler-Ferrara e Prado, 1994):
4.5 Reconstrucao do Espaco de Estados 51
• imprevisibilidade, isto e, o conhecimento do estado inicial do sis-
tema com grande, mas finita precisao nao permite predizer sua evo-
lucao temporal para intervalos arbitrariamente grandes de tempo,
com pequeno erro. Essa caracterıstica esta associada a dependencia
sensitiva as condicoes iniciais apresentadas por esses sistemas;
• espectro contınuo de frequencias, caracterizando um comportamento
aperiodico;
• invarianca de escala, significando uma certa estrutura no espaco de
estados com caracterısticas de autossimilaridade;
• estacionariedade, isto e, embora aperiodicos, os sinais gerados por
esses sistemas apresentam caracterısticas estatısticas invariantes no
tempo.
Para que um sistema autonomo contınuo apresente comportamento
caotico, e necessario que ele seja nao -linear, dissipativo e apresente, pelo
menos, dimensao tres. No caso de sistemas discretos (mapas), pode ha-
ver caos em sistemas unidimensionais autonomos. Tanto para sistemas de
tempo discreto, quanto para os de tempo contınuo, a sensibilidade as con-
dicoes iniciais e avaliada por meio do calculo dos expoentes de Lyapunov,
como sera visto na Secao 4.6. Alem disso, um sistema caotico apresenta
atrator estranho1. Ele e estranho porque, usualmente, apresenta detalhes
em escalas infinitesimalmente pequenas. Uma figura com tal caracterıstica
e chamada de fractal.
4.5 Reconstrucao do Espaco de Estados
A metodologia de reconstrucao do espaco de estados, apresentada no Ca-
pıtulo 3, foi introduzida por Packard et al. (1980) e provada matematica-
mente por Takens (1981). Essa tecnica e aplicada quando se tem apenas
a medicao de um dos estados do sistema, isto e, de apenas um observavel.
Takens, em seu trabalho, demonstrou que e possıvel reconstruir certas pro-
priedades topologicas do atrator original a partir de vetores y(k) extraıdos
de uma serie temporal x(k) do sistema, ou seja:
y(k) = x(k), x(k + τ), . . . , x(k + (de − 1)τ), (4.2)
1A palavra atrator estranho foi introduzida por Ruelle e Takens (1971).
52 4 Caracterizacao Dinamica
em que τ e o atraso de tempo e de e a dimensao de imersao.
Para que se tenha seguranca em relacao aos resultados, e necessario re-
construir o atrator em um espaco de estados com dimensao suficientemente
elevada, desta forma, Takens estabeleceu que uma dimensao de imersao
de suficiente seria:
de > 2 dA, (4.3)
sendo que dA e a dimensao original2 do atrator a ser reconstruıdo.
Nota-se, a partir da Equacao (4.2), que a determinacao de de e τ e
necessaria no processo de reconstrucao. Uma dificuldade encontrada para
se determinar de, a partir da Equacao (4.3), e que, normalmente, quando
se trabalha com series temporais, se desconhece o valor de dA. Em relacao
ao valor de τ , qualquer valor poderia ser utilizado, desde que a serie dispo-
nıvel fosse infinita e livre de ruıdo (Abarbanel, 1995), o que, em situacoes
praticas, seria impossıvel. Desta forma, para se determinar os valores de
de e τ , serao utilizados os metodos dos falsos vizinhos (Kennel et al., 1992)
e de informacao mutua (Fraser e Swinney, 1986) respectivamente.
4.5.1 O Metodo da Informacao Mutua
O metodo proposto por Fraser e Swinney (1986) baseia-se na ideia de
informacao mutua introduzida por Shannon (1948). Para se encontrar o
valor de τ , utiliza-se uma caracterıstica intrınseca aos sistemas caoticos:
a geracao de informacao. Essa geracao ocorre devido a sensibilidade as
condicoes iniciais, que faz com que a taxa de divergencia entre condicoes
iniciais muito proximas cresca exponencialmente.
A geracao de uma nova informacao pode ser entendida como se segue:
considera-se que, em um espaco de fases, a distancia entre dois pontos
iniciais seja dada por ‖x1(0) − x2(0)‖2 e que ‖x1(0) − x2(0)‖2 < ǫ < r,
sendo que r representa a melhor resolucao disponıvel, tal que os pontos nao
possam ser distinguıveis. Apos um certo tempo δt, devido a divergencia
exponencial, os pontos x1(δt) e x2(δt) passarao a ser distinguıveis, ou seja,
‖x1(δt) − x2(δt)‖2 > r.
Para se quantificar a informacao, utiliza-se o criterio de informacao
mutua. Sejam dois conjuntos A e B que contem possıveis valores para as
variaveis aleatorias a e b. O valor de informacao mutua entre dois valores
2Tambem conhecida por dimensao de Hausdorff ou dimensao fractal.
4.5 Reconstrucao do Espaco de Estados 53
a = ai e b = bj e dado por:
Iai, bj= log2
(
PA, B(ai, bj)
PA(ai)PB(bj)
)
, (4.4)
sendo que PA, B(ai, bj) e a probabilidade conjunta de se observar simulta-
neamente a = ai ∈ A e b = bj ∈ B; PA(ai) e PB(bj) sao as probabilidades
de se observar a = ai ∈ A, e b = bj ∈ B de forma independente, ou seja,
supondo que nao haja dependencia estatıstica entre as variaveis aleatorias
a e b. Quando se utiliza o logaritmo da Equacao (4.4) na base dois, o
resultado de informacao mutua e dado em bits.
Seguindo a linha de raciocınio, a Equacao (4.4) pode ser estendida
para quantificar a informacao mutua de todas as possıveis medidas dos
conjuntos A e B. Desta forma, tem-se uma medida da informacao mutua
media entre os valores dos conjuntos A e B, que e fornecida a partir da
seguinte equacao:
IA, B =∑
ai, bj
PA, B(ai, bj) log2
(
PA, B(ai, bj)
PA(ai)PB(bj)
)
. (4.5)
Um procedimento para se obter as distribuicoes de probabilidade e uti-
lizar histogramas construıdos seguindo uma particao do espaco de estados
em caixas n−dimensionais com a contagem de pontos contidos em cada
uma delas.
Para uma serie temporal x(k) devidamente amostrada, o valor de τ nao
pode ser muito pequeno, pois, desta forma, os valores de x(k) e x(k + τ)
estariam fortemente correlacionados e os pontos do atrator reconstruıdo
ficariam comprimidos junto a diagonal que forma o espaco de fases. Ao
contrario, se τ for muito grande, x(k) e x(k + τ) seriam pouco correlaci-
onados. Desta forma, o objetivo do metodo e encontrar um valor τ que
minimize a informacao mutua I(τ) garantindo que a reconstrucao do atra-
tor utilize o menor nıvel de informacao redundante e permitindo que x(k)
e x(k + τ) ainda estejam correlacionados.
Reescrevendo a Equacao (4.5) em termos de x(k), tem-se:
I(τ) =∑
x(k), x(k+τ)
P (x(k), x(k + τ)) log2
(
P (x(k), x(k + τ))
P (x(k))P (x(k + τ))
)
. (4.6)
54 4 Caracterizacao Dinamica
De acordo com Fraser e Swinney (1986), observando-se um grafico de
I(τ), o seu primeiro mınimo indicaria uma boa escolha para τ . A Figura
4.6 apresenta um grafico de I(τ) obtido a partir da serie temporal θ1 do
pendulo. Nota-se que o valor de τ obtido para o primeiro mınimo de I(τ)
e igual 10. Ressalta-se que, em Firmo (2007), o primeiro mınimo ocorreu
em τ = 16. A diferenca nos resultados se deve as diferentes taxas de
amostragem empregadas em ambos os trabalhos.
0
0.5
1
1.5
2
2.5
3
0 10 20 30 40 50 60 70 80 90
τ
I(τ
)
Figura 4.6: Grafico de I(τ) obtido a partir da serie temporal θ1 do pendulo.
O primeiro mınimo de I(τ) indica um valor adequado para τ .
4.5.2 O Metodo dos Falsos Vizinhos
O metodo introduzido por Kennel et al. (1992) e capaz de determinar uma
dimensao mınima necessaria para imergir um atrator. Essa dimensao e ob-
tida por meio da analise da variacao das distancias entre pontos proximos
(vizinhos) num espaco de fases reconstruıdo para diferentes valores de di-
mensao de imersao de. Esses pontos proximos podem ser:
• vizinhos no tempo. Esses vizinhos sao triviais e aparecem devido a
sequencia de pontos no tempo. Por exemplo, os vizinhos triviais do
ponto y(k) sao os pontos y(k − 1) e y(k + 1);
4.5 Reconstrucao do Espaco de Estados 55
• vizinhos devido a dimensao de imersao insuficiente. Esses sao cha-
mados falsos vizinhos e existem apenas devido a uma dimensao de
imersao mal determinada e que devem ser eliminados;
• vizinhos devido a dinamica. Sao os verdadeiros vizinhos e existem
devido as caracterısticas recorrentes do sistema. A distancia entre
eles nao muda de maneira significativa quando se aumenta a dimen-
sao de imersao.
Quando um atrator e reconstruıdo em uma dimensao menor que a
necessaria, pontos que estao afastados no espaco original ficam proximos
devido aos efeitos de projecao. A distancia entre os falsos vizinhos tende
a aumentar quando a dimensao de imersao e aumentada de de para de +1.
Desta forma, quando o numero de falsos vizinhos chega a zero (ou proximo
de zero) significa que o atrator tera sido suficientemente “desdobrado” e a
dimensao encontrada e a menor dimensao de imersao capaz de representa-
lo.
Para se determinar se um vizinho e verdadeiro ou falso, sao realizados
dois testes. O primeiro deles considera que um ponto e um falso vizinho
se[
D2de+1(k) − D2
de(k)
D2de
(k)
]12
> Lc, (4.7)
sendo que D2de
(k) representa o quadrado da distancia entre dois pontos
(um ponto e o seu vizinho mais proximo) num atrator reconstruıdo com
dimensao de, D2de+1(k) representa o quadrado da distancia para os mesmos
pontos num espaco reconstruıdo com dimensao de + 1 e Lc e um valor de
distancia crıtica. Entretanto, devido ao numero finito de pontos dispo-
nıveis nas aplicacoes praticas, podem ser encontradas situacoes em que o
vizinho mais proximo esta a uma distancia da ordem do tamanho do atra-
tor. Como o metodo proposto representa apenas uma condicao necessaria,
mas nao suficiente, foi estabelecido um segundo criterio:
Dde+1(k)
LA> Ac, (4.8)
em que LA e o tamanho tıpico do atrator e Ac e um limite crıtico (cons-
tante). Pode se mostrar que, se o vizinho mais proximo de um ponto qual-
quer estiver muito longe, isto e, Dde(k) ≈ LA, e ele for um falso vizinho,
56 4 Caracterizacao Dinamica
entao, para uma dimensao de imersao de + 1, tem-se que Dde+1(k) ≈ 2LA
(Fiedler-Ferrara e Prado, 1994). Desta forma, um falso vizinho e um ponto
que satisfaz os dois criterios apresentados pelas Equacoes (4.7) e (4.8).
A Figura 4.7 apresenta um grafico de aplicacao do metodo de falsos
vizinhos a serie temporal θ1 do pendulo, utilizando-se o valor de τ = 10
obtido na secao anterior. Nota-se que, para de = 5, a quantidade de falsos
vizinhos foi de aproximadamente 2%.
0
10
20
30
40
50
60
70
80
90
100
1 2 3 4 5 6 7 8
fals
os
viz
inhos
(%)
de
Figura 4.7: Grafico de aplicacao do metodo de falsos vizinhos a serie temporalθ1 do pendulo.
O valor mınimo obtido para a dimensao de imersao foi de = 5.
Apesar de os resultados indicarem uma dimensao de imersao de = 5,
optou-se por investigar o comportamento dos invariantes dinamicos para
a faixa de dimensoes de de = 5 a de = 7, como sera visto nas proximas
secoes. Destaca-se que, em Firmo (2007), foi encontrado o mesmo valor
para dimensao de imersao.
4.5.3 Reconstrucao do Atrator do Pendulo Duplo
A partir da serie temporal θ1 e dos resultados encontrados para τ e de,
utilizou-se a Equacao (4.2) para reconstruir o atrator do pendulo duplo.
4.6 Expoentes de Lyapunov 57
A Figura 4.8 mostra a projecao tridimensional do atrator reconstruıdo a
partir dos dados reais.
−3−2
−1 0
1 2
3 4 −4
−3−2
−1 0
1 2
3 4
−4−3−2−1 0 1 2 3 4
−4
x(k + 2τ)
x(k + τ)x(k)
Figura 4.8: Projecao tridimensional do atrator reconstruıdo a partir dos dadosreais.
Reconstrucao obtida para τ = 10 e de = 5.
4.6 Expoentes de Lyapunov
Os expoentes de Lyapunov3 sao grandezas que medem a divergencia expo-
nencial de trajetorias vizinhas ao longo de uma certa direcao no espaco de
estados do sistema, quantificando a dependencia do sistema as condicoes
iniciais. E a principal grandeza utilizada para caracterizar o comporta-
mento caotico (Abarbanel, 1995).
Considere um conjunto de pontos vizinhos, y0, contidos em uma hipe-
resfera de raio ǫ(t0) cujo centro e um ponto inicial x0 pertencente a uma
trajetoria no espaco de estados. Em curto espaco de tempo, ocorre uma
deformacao dessa hiperesfera gerando um objeto aproximadamente hipe-
relipsoidal com eixos principais ǫi(t) (Figura 4.9), sendo i = 1, 2, . . . , m,
em que m representa o numero de equacoes diferenciais ordinarias.
3Na literatura, tambem sao conhecidos como expoentes caracterısticos de Lyapunovou numeros de Lyapunov.
58 4 Caracterizacao Dinamica
x0
ǫ2(t)
ǫ1(t)
ǫ(t0)
Figura 4.9: Ilustracao da deformacao de uma hiperesfera num objeto hiperelip-soidal.
Depois de um tempo t, a hiperesfera de raio ǫ(t0) torna-se um hipe-relipsoide com eixos principais ǫ1(t) e ǫ2(t). Na figura, considera-sedinamica linear local, sendo ilustrado o caso bidimensional.
Desta forma, os expoentes de Lyapunov medem o crescimento expo-
nencial dos eixos principais ǫi, ou seja, ǫi(t) ≈ ǫi(t0)eλi(t−t0) e sao definidos
por:
λi =1
(t − t0)ln
(
ǫi(t)
ǫi(t0)
)
. (4.9)
Nota-se que a existencia de um ou mais expoentes de Lyapunov posi-
tivos indica uma instabilidade orbital nas direcoes associadas.
Os expoentes de Lyapunov fornecem informacoes importantes sobre um
sistema como, por exemplo, sobre a sua natureza. Assim, para sistemas
conservativos, tem-se que:m∑
i=1
λi = 0, (4.10)
enquanto que, para sistemas dissipativos, tem-se:
m∑
i=1
λi < 0. (4.11)
4.6 Expoentes de Lyapunov 59
O tipo de atrator existente tambem pode ser determinado a partir dos
expoentes. Como, por exemplo, para um sistema tridimensional (m = 3),
tem-se:
• λ1, λ2 e λ3 < 0, indicam a contracao das tres direcoes para um unico
ponto. Logo, tem-se um ponto fixo;
• λ1, λ2 < 0 e λ3 = 0, significa contracao em duas direcoes e um
deslocamento na terceira direcao, indicando a existencia de um ciclo
limite;
• λ1 < 0, λ2 e λ3 = 0, existem duas direcoes ao longo das quais ocorrem
deslocamentos e, para essa condicao, tem-se um toro bidimensional;
• λ1 = 0, λ2 < 0 e λ3 > 0, existe uma direcao de divergencia expo-
nencial, caracterıstica de sistemas caoticos. Logo, tem-se um atrator
estranho. Um sistema que apresenta comportamento caotico tem,
pelo menos, um expoente de Lyapunov positivo. Sistemas que apre-
sentam mais de um expoente de Lyapunov positivo sao denominados
hipercaoticos.
4.6.1 Expoentes de Lyapunov a Partir de Series
Temporais
Na pratica, calculam-se analiticamente expoentes de Lyapunov em
pouquıssimos casos (Fiedler-Ferrara e Prado, 1994). Na maioria dos ca-
sos, calculam-se tais expoentes a partir de series temporais utilizando-se
metodos baseados em calculos numericos. Entre esses metodos, pode se
destacar o trabalho de Sano e Sawada (1985), no qual os autores propoem
a estimacao de todo o espectro de expoentes de Lyapunov a partir de
uma unica serie temporal e de uma aproximacao da matriz jacobiana do
sistema. Geralmente, esse espectro e estimado em um espaco de estados
reconstruıdo, o que poderia levar a um numero elevado de expoentes se
a dimensao de imersao de for superior a dimensao real do sistema. Esses
expoentes extras sao conhecidos como expoentes de Lyapunov espurios.
A estimacao dos expoentes de Lyapunov e tida como uma tarefa nao
trivial. Geralmente, estima-se somente o maior deles, λ1, que parece apro-
priado para caracterizar sistemas caoticos por dois motivos. Em primeiro
lugar, na maioria das vezes, λ1 e o unico expoente positivo. Em segundo
60 4 Caracterizacao Dinamica
lugar, essa informacao da uma ideia da previsibilidade do sistema (Ro-
senstein et al., 1993). Alem disso, o maior expoente de Lyapunov tem
sido utilizado para comparar modelos identificados (Correa, 1997; Prin-
cipe et al., 1992; Abarbanel et al., 1989).
O metodo de Wolf et al. (1985) foi o primeiro metodo proposto para
se estimar o maior expoente de Lyapunov a partir de series temporais. In-
felizmente, esse metodo apresenta alguns problemas como a sensibilidade
a presenca de ruıdo e a necessidade de longas series para que haja con-
vergencia da estimativa. Desta forma, foram propostos por Kantz (1994)
e Rosenstein et al. (1993) dois metodos equivalentes baseados no metodo
de Wolf et al. (1985), mas que apresentam a vantagem de serem mais ro-
bustos a presenca de ruıdo e de utilizarem series temporais mais curtas.
Tais metodos se diferem somente no modo como consideram os pontos
vizinhos.
Para se obter λ1, ambos os metodos utilizam o seguinte procedimento:
a partir do espaco de estados reconstruıdo, escolhe-se um ponto de refe-
rencia nesse espaco, denotado por yi. Selecionam-se pontos vizinhos y′i a
esse ponto dentro de uma vizinhanca Yi de diametro ǫ. Calcula-se a media
das distancias dos pontos vizinhos a yi em funcao da evolucao temporal de
k passos. Apos o procedimento de media, determina-se o logaritmo, res-
ponsavel em fornecer a divergencia media local das trajetorias proximas.
O maior expoente de Lyapunov da serie temporal e obtido por meio dos
valores encontrados por esse procedimento aplicado em todo o atrator. O
calculo utilizado nesse procedimento e descrito pela seguinte equacao:
S(k) =1
N
N∑
i=1
ln
1
‖ Yi ‖
∑
y′
i∈ Yi
‖ yi+k − y′i+k ‖
, (4.12)
sendo que N representa o tamanho da serie.
Se S(k) exibir um crescimento linear identico para diversos valores de
de, pode-se estimar λ1 por meio de sua inclinacao, ou seja,
S(k) ∼= λ1k + c, (4.13)
em que c e a constante relacionada a distancia inicial entre os pontos
vizinhos.
Nota-se, a partir das Equacoes (4.12) e (4.13), que os metodos de Kantz
4.6 Expoentes de Lyapunov 61
(1994) e Rosenstein et al. (1993) nao assumem divergencia exponencial,
mas a identificam pelo comportamento linear com inclinacao diferente de
zero. Alem disso, por meio do processo de media, os efeitos do ruido sao
minimizados.
Maior Expoente de Lyapunov do Pendulo Duplo
Nesta secao, apresentam-se as estimativas do maior expoente de Lyapunov
calculado para a serie temporal θ1 do pendulo utilizando os metodos de
Kantz (1994) e Rosenstein et al. (1993). Os resultados obtidos sao com-
parados com os resultados encontrados por Firmo (2007) a fim de serem
validados. As Figuras 4.10 e 4.11 apresentam os graficos obtidos para S(k)
aplicando-se os metodos.
−2.5
−2
−1.5
−1
−0.5
0
0 50 100 150 200 250k
S(k
)
de = 5
de = 6
de = 7
Figura 4.10: Grafico de S(k) obtido por meio da aplicacao do metodo de Kantz(1994) a serie temporal θ1 do pendulo.
Calcularam-se as curvas S(k) para as dimensoes de imersao de = 5a de = 7.
62 4 Caracterizacao Dinamica
−2.5
−2
−1.5
−1
−0.5
0
0 50 100 150 200 250k
S(k
)
de = 6
de = 7
de = 5
Figura 4.11: Grafico de S(k) obtido por meio da aplicacao do metodo Rosens-tein et al. (1993) a serie temporal θ1 do pendulo.
Calcularam-se as curvas S(k) para as dimensoes de imersao de = 5a de = 7.
A partir da analise da inclinacao das curvas S(k) para diferentes dimen-
soes de imersao, estimaram-se4 os valores do maior expoente de Lyapu-
nov5. Os valores encontrados sao apresentados na Tabela 4.1, juntamente
com os valores obtidos por Firmo (2007)6.
Verifica-se que os resultados foram proximos do resultado obtido por
Firmo (2007) ao aplicar o metodo de Rosenstein et al. (1993). No trabalho
de Firmo (2007), considerou-se que o resultado obtido, aplicando-se o
metodo de Rosenstein et al. (1993), estaria mais proximo do real devido ao
fato de tal metodo apresentar melhores resultados para sistemas contınuos.
4As estimativas encontradas para os expoentes de Lyapunov e para a dimensao decorrelacao foram obtidas por meio de regressao linear. O valor de incerteza apresentadoe duas vezes o desvio padrao encontrado para cada estimativa.
5Para se obter os resultados em bits/s, deve-se multiplica-los pela frequencia deamostragem dos dados.
6O autor, em seu trabalho, nao apresentou como foram obtidas as incertezas asso-ciadas as grandezas estimadas.
4.7 Dimensao Fractal 63
Tabela 4.1: Valores estimados para o maior expoente de Lyapunov a partir daserie temporal θ1 do pendulo.
Metodo de λ1 (Firmo, 2007) λ1
Kantz (1994) 5 − 7 0,69 ± 0,09 bits/s 0,503 ± 0,026 bits/s
Rosenstein et al. (1993) 5 − 7 0,50 ± 0,02 bits/s 0,495 ± 0,018 bits/s
4.7 Dimensao Fractal
A dimensao fractal e um outro invariante dinamico utilizado, neste traba-
lho, para validacao dos modelos a serem apresentados no Capıtulo 5. Em
geral, o termo dimensao faz mencao a dimensao Euclidiana. Um conjunto
finito de pontos, por exemplo, tem dimensao zero; ja uma linha tem di-
mensao um; uma superfıcie, dimensao dois, etc. Ao contrario, a dimensao
de um sistema caotico nao e inteira, sendo essa conhecida como dimensao
fractal.
Na literatura, encontram-se algumas das metricas utilizadas para se
determinar o valor da dimensao fractal de um atrator. A primeira delas,
apresentada por Kolmogorov (1958), se baseia no princıpio de contagem de
caixas. Cobre-se o atrator por hipercubos de lado ǫ e conta-se o numero de
caixas (hipercubos), N(ǫ), que contem, pelo menos, um ponto do atrator
utilizando diferentes valores de ǫ. Sendo assim, a dimensao de contagem
de caixas, D0, e obtida por:
D0 = limǫ→0
log N(ǫ)
log (1/ǫ). (4.14)
Muitos atratores estranhos nao sao homogeneos, ou seja, algumas de
suas regioes sao mais visitadas do que outras. Desta forma, para se ca-
racterizar um atrator, faz-se necessario o calculo de outras dimensoes que
levam em conta suas nao -homogeneidades. Tais dimensoes foram propos-
tas, em 1957, por J. Belatoni e A. Renyi e se baseiam na frequencia relativa
pi com que cada caixa i e visitada. A frequencia pi e definida como:
pi = limN→∞
Ni
N, (4.15)
64 4 Caracterizacao Dinamica
sendo N o numero total de pontos que pertencem ao atrator e Ni o numero
de pontos da i-esima caixa.
Entre as dimensoes generalizadas de Renyi, as mais relevantes (alem
de D0) sao a dimensao de informacao, D1, calculada por:
D1 = limǫ→0
∑N(ǫ)i=1 pi log pi
log(1/ǫ)(4.16)
e a dimensao de correlacao, D2:
D2 = limǫ→0
log∑N(ǫ)
i=1 pi2
log(ǫ). (4.17)
Na realidade, e possıvel mostrar que:
D2 ≤ D1 ≤ D0, (4.18)
sendo que a igualdade so ocorre em atratores homogeneos.
Quando se trabalha com series temporais reais, e usual calcular D2 ao
inves de D0 por dois motivos: o algoritmo utilizado para calcular D0 exige
um esforco computacional muito maior quando comparado ao algoritmo
utilizado para se calcular D2, principalmente quando D0 > 2. O outro
motivo esta no fato de, ao se calcular D2, obtem-se um limite inferior para
o valor de D0, visto que a relacao (4.18) e verdadeira (Monteiro, 2006).
Portanto, neste trabalho, sera estimado o valor da dimensao de correla-
cao D2 utilizando-se o metodo desenvolvido por Grassberger e Procaccia
(1983), apresentado a seguir.
4.7.1 O Metodo de Grassberger-Procaccia
O metodo desenvolvido por Grassberger e Procaccia (1983) foi responsavel
pela popularizacao da dimensao de correlacao nos ultimos anos devido
a sua facil implementacao. O metodo consiste em aproximar o termo∑N(ǫ)
i=1 pi2, que aparece na Equacao (4.17) e representa a frequencia relativa
com que dois pontos de um atrator caem na i-esima caixa de tamanho ǫ,
pela frequencia relativa na qual esses pontos estao separados por uma
distancia menor que ou igual a ǫ. Seja q(ǫ) a fracao de pontos do atrator
que esta dentro de uma hiperesfera de raio ǫ, centrada em xi. Tal fracao
4.8 Consideracoes Finais 65
pode ser representada por:
q(ǫ) =1
N
N∑
k=1
Θ(ǫ − ‖xi − xk‖), (4.19)
sendo que Θ( · ) representa a funcao de Heaviside.
Define-se a funcao de correlacao C(ǫ) como o valor medio de q(ǫ),
calculado sobre todos os pontos xi:
C(ǫ) =1
N
N∑
i=1 (i6=k)
q(ǫ). (4.20)
Para uma superfıcie fractal, tem-se que C e proporcional a ǫD2 , ou seja:
D2∼= lim
N→∞
(
limǫ→0
log C(ǫ)
log ǫ
)
. (4.21)
Para se obter uma maior confiabilidade nos resultados apresentados
pela Equacao (4.21), calcula-se D2 para varios valores de dimensao de
imersao. A partir do grafico de D2(ǫ, d) por ǫ, sendo que d representa
as varias dimensoes de imersao maiores que ou igual a de, estima-se a
dimensao de correlacao observando-se uma regiao linear para onde as cur-
vas convergem, denominada plateau. A Figura 4.12 mostra o grafico de
D2(ǫ, d) por ǫ obtido para o atrator reconstruıdo a partir da serie temporal
θ1 do pendulo.
A dimensao de correlacao encontrada foi igual a D2(ǫ, d) = 3,93±0,06.
Ressalta-se que Firmo (2007) obteve D2(ǫ, d) = 3,94 ± 0,02.
4.8 Consideracoes Finais
Neste capıtulo, descreveram-se os metodos utilizados na caracterizacao di-
namica do pendulo duplo e na validacao dos modelos encontrados para a
serie temporal referente a variavel θ1, apresentados no Capıtulo 5. Os al-
goritmos utilizados pertencem ao pacote computacional TISEAN (Hegger
et al., 1999). Os resultados obtidos por tais algoritmos foram comparados
com os encontrados em Firmo (2007).
Em relacao aos algoritmos, destaca-se que eles apresentam um grande
66 4 Caracterizacao Dinamica
numero de parametros livres que devem ser ajustados de modo que o re-
sultado estimado apresente convergencia para o resultado esperado. Outro
fato observado foi a variabilidade dos resultados em funcao de pequenas
variacoes nos valores desses parametros. Por exemplo, para os algorit-
mos de Kantz (1994) e Rosenstein et al. (1993), essa caracterıstica nao
prejudica o diagnostico de existencia ou nao de expoente de Lyapunov
positivo, mas causa flutuacoes na determinacao de seu valor. No caso do
algoritmo de Grassberger e Procaccia (1983), verificou-se que os resulta-
dos obtidos por meio desse apresentam uma sensibilidade ainda maior a
pequenas variacoes nos parametros.
Os fatos descritos anteriormente justificam as diferencas apresentadas
entre os resultados obtidos neste trabalho e os encontrados em Firmo
(2007).
0
5
10
15
20
25
0.01 0.1 1 10
plateau
ǫ
D2(ǫ
,d)
Figura 4.12: Grafico de D2(ǫ, d) por ǫ obtido para o atrator reconstruıdo apartir da serie temporal θ1 do pendulo.
A linha tracejada indica a regiao de convergencia de D2 para osvarios valores de d que, neste caso, assumiu valores de 5 a 11.
Capıtulo 5
Resultados e Discussoes
“A simplicidade e o ultimo degrau da sabedoria.”
Kalil Gibran
5.1 Introducao
Neste capıtulo, sao apresentados os modelos identificados utilizando-se as
representacoes matematicas apresentadas no Capıtulo 3, a partir da serie
temporal referente a velocidade angular da barra 1, θ1, do pendulo (Figura
2.9). A validacao desses modelos e realizada por meio do calculo dos inva-
riantes dinamicos, descritos no Capıtulo 4. A ordem de apresentacao dos
modelos esta organizada como se segue: primeiramente, sao apresenta-
dos os modelos NARMAX polinomias; em seguida, os modelos NARMAX
racionais e, por ultimo, os modelos fuzzy NARX Takagi-Sugeno. Posteri-
ormente, para cada modelo apresentado, sao mostrados os seus respectivos
invariantes dinamicos.
Durante o processo de identificacao, foram utilizados diferentes tama-
nhos de janelas tomadas ao longo de toda a serie temporal. Diferentes
valores para a taxa de decimacao tambem foram empregados, obviamente
dentro da faixa 20 ≤ ∆ ≤ 100, conforme apresentada na Secao 4.2. Mo-
delos com dinamica caotica foram obtidos para uma taxa de decimacao
∆ = 60. Para essa taxa de decimacao, a nova frequencia de amostragem
dos dados passa a ser 33,33 Hz.
Para a verificacao da manutencao do regime dinamico dos modelos
identificados, esses foram simulados com predicao de infinitos passos a
68 5 Resultados e Discussoes
frente. Nas simulacoes, foram geradas series temporais com duzentas mil
amostras, sendo descartados os modelos que nao mantiveram o seu regime
dinamico durante os testes.
5.2 Modelos NARMAX Polinomiais
Optou-se, primeiramente, pela representacao NARMAX polinomial, pois
essa foi considerada a mais simples entre as tres utilizadas neste trabalho.
Para proceder ao processo de identificacao, escolheu-se, arbitrariamente,
o grau de nao-linearidade ℓ entre 2 e 6. Da mesma forma, selecionou-se o
numero de termos de processo, np, em uma faixa entre 5 e 50 termos e, por
tentativa, o maximo atraso de saıda, ny. Como os modelos identificados
nao apresentam termos de entrada1 e de ruıdo2, diz-se que a representacao
utilizada e a NAR polinomial, que e um caso particular da representacao
NARMAX polinomial.
Uma vez escolhidos o atraso maximo, o numero de termos de processo
e o grau de nao -linearidade, utilizou-se o algoritmo de selecao de estru-
tura ERR, apresentado na Secao 3.2.3, para escolher automaticamente os
termos que melhor explicam a variancia da saıda. Por sua vez, para esti-
mar os parametros, utilizou-se o estimador de mınimos quadrados (MQ).
Foram identificados dois modelos que apresentaram dinamica caotica para
os dados do pendulo. Tais modelos sao apresentados a seguir.
5.2.1 Modelo 1
O modelo 1 foi obtido a partir de uma janela com 500 observacoes, np = 48,
ny = 6 e ℓ = 5. Ressalta-se que, usando-se o algoritmo ERR, nao foiescolhido nenhum termo que apresentasse grau de nao -linearidade igual a6, mesmo quando utilizado ℓ = 6. A equacao a seguir apresenta o modelo1.
y(k) = 3,350 y(k − 1) − 4,380 y(k − 2) + 2,820 y(k − 3)
−0,840 y(k − 4) + 0,243 y(k − 5)3
+0,978×10−1 y(k − 4)y(k − 5)y(k − 6)
−0,188 y(k − 1)3y(k − 3)2 − 0,254×10−1 y(k − 1)y(k − 6)2 . . .
1Isso se deve ao fato de os modelos identificados serem autonomos.2A inclusao de termos de ruıdo durante o processo de identificacao nao alterou
significativamente os valores dos parametros estimados.
5.2 Modelos NARMAX Polinomiais 69
. . . −0,120×102 y(k − 1)3y(k − 2)2 − 0,179×10−1 y(k − 3)5
−1,040 y(k − 1)y(k − 3)4 + 0,119 y(k − 1)2y(k − 3)3
+3,820 y(k − 1)y(k − 2)2y(k − 3)2 − 1,200 y(k − 1)5
+5,770 y(k − 1)4y(k − 2) + 0,128 y(k − 3)2y(k − 5)3
+0,142×102 y(k − 1)2y(k − 2)3
−0,148×10−1 y(k − 2)y(k − 4)2y(k − 5)y(k − 6)
−0,103×102 y(k − 1)y(k − 2)4 + 4,020 y(k − 2)5
−1,230 y(k − 2)4y(k − 3) − 0,239 y(k − 2)2y(k − 5)
−0,315 y(k − 1)2y(k − 4) − 0,322 y(k − 3)2y(k − 6)
+0,958 y(k − 2)y(k − 3)4 − 2,060 y(k − 2)3y(k − 3)2
+0,408×10−1 y(k − 1)y(k − 3)y(k − 5)
+0,143 y(k − 2)3y(k − 3)y(k − 5)
−0,536×10−1 y(k − 1)4y(k − 5) − 0,260 y(k − 3)3y(k − 5)2
+0,179 y(k − 1)y(k − 2)y(k − 6)
+0,533 y(k − 2)y(k − 3)y(k − 5)
−0,334 y(k − 4)y(k − 5)2 + 0,103×10−2 y(k − 1)y(k − 6)4
−0,326×10−1 y(k − 2)2y(k − 4)2y(k − 6)
+0,474×10−2 y(k − 2)y(k − 3)y(k − 6)3
−0,922 y(k − 1)2y(k − 2)y(k − 3)2
−0,103 y(k − 1)y(k − 2)2 − 0,309×10−1 y(k − 5)5
+0,370×10−1 y(k − 4)2y(k − 5)2y(k − 6)
+0,196 y(k − 1)4y(k − 4) + 0,327×10−1 y(k − 2)3y(k − 6)2
−0,187×10−1 y(k − 1)2y(k − 6)3
+0,158 y(k − 1)y(k − 3)2y(k − 4)y(k − 5)
−0,705×10−1 y(k − 1)y(k − 2)2y(k − 4)y(k − 5)
−0,189 y(k − 1)3y(k − 2)y(k − 4) − 0,248×10−2 y(k − 6)5
+0,260 y(k − 1)2y(k − 3).
(5.1)
As Figuras 5.1 e 5.2 apresentam, respectivamente, os graficos da massa
de dados utilizada para se estimar o modelo 1 e um trecho da serie temporal
produzida pelo mesmo. Uma visao bidimensional da projecao tridimensi-
70 5 Resultados e Discussoes
onal do atrator reconstruıdo a partir dessa serie e mostrada na Figura 5.3.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
θ 1(r
ad/s)
Figura 5.1: Grafico da massa de dados utilizada para se estimar o modelo 1.
No grafico, estao representadas 500 amostras.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
y(k
)(r
ad/s)
Figura 5.2: Grafico de um trecho da serie temporal produzida pelo modelo 1.
No grafico, estao representadas 500 amostras.
5.2 Modelos NARMAX Polinomiais 71
−3−2
−1 0
1 2
3 4 −4
−3−2
−1 0
1 2
3 4
−4−3−2−1 0 1 2 3 4
−4
y(k + 2τ)
y(k)y(k + τ)
Figura 5.3: Visao bidimensional da projecao tridimensional do atrator recons-truıdo a partir da serie temporal gerada pelo modelo 1.
Reconstrucao obtida para τ = 7 e de = 5.
5.2.2 Modelo 2
O segundo modelo identificado foi obtido a partir de um outro trecho daserie, diferente da empregada para se obter o modelo 1. Tambem foramutilizadas 500 amostras, np = 48, ny = 6 e ℓ = 5. A Equacao (5.2)apresenta o modelo.
y(k) = 3,400 y(k − 1) − 4,310 y(k − 2) + 2,450 y(k − 3)
−0,542 y(k − 4) + 0,219 y(k − 5)3 + 0,532 y(k − 4)y(k − 5)y(k − 6)
+2,770 y(k − 1)3y(k − 3)2 − 0,562×10−1 y(k − 1)y(k − 6)2
−0,366×10+2 y(k − 1)3y(k − 2)2 − 0,347 y(k − 3)5
−1,580 y(k − 1)y(k − 3)4 + 1,540 y(k − 1)2y(k − 3)3
+0,114×10+2 y(k − 1)y(k − 2)2y(k − 3)2 − 2,590 y(k − 1)5
+0,150×10+2 y(k − 1)4y(k − 2) − 0,531×10−1 y(k − 3)2y(k − 5)3
+0,466×10+2 y(k − 1)2y(k − 2)3
+0,106 y(k − 2)y(k − 4)2y(k − 5)y(k − 6)
−0,305×10+2 y(k − 1)y(k − 2)4 + 7,790 y(k − 2)5
+1,580 y(k − 2)4y(k − 3) − 2,740 y(k − 2)2y(k − 5)
−0,469 y(k − 1)2y(k − 4) − 0,718 y(k − 3)2y(k − 6) . . .
72 5 Resultados e Discussoes
. . . +1,900 y(k − 2)y(k − 3)4 − 6,440 y(k − 2)3y(k − 3)2
−1,050 y(k − 1)y(k − 3)y(k − 5)
+0,498×10−1 y(k − 2)3y(k − 3)y(k − 5)
−0,539×10−1 y(k − 1)4y(k − 5) − 0,131×10−1 y(k − 3)3y(k − 5)2
+0,978 y(k − 1)y(k − 2)y(k − 6) + 2,320 y(k − 2)y(k − 3)y(k − 5)
−0,673 y(k − 4)y(k − 5)2 + 0,255×10−1 y(k − 1)y(k − 6)4
−0,226 y(k − 2)2y(k − 4)2y(k − 6)
+0,336×10−1 y(k − 2)y(k − 3)y(k − 6)3
−0,106×10+2 y(k − 1)2y(k − 2)y(k − 3)2 + 0,171 y(k − 1)y(k − 2)2
+0,423×10−1 y(k − 1)y(k − 4)3y(k − 5)
+0,117 y(k − 2)3y(k − 4)y(k − 6) + 0,209 y(k − 3)2y(k − 5)
−0,606 y(k − 1)2y(k − 6) + 1,980 y(k − 1)y(k − 2)y(k − 5)
+0,477×10−1 y(k − 1)4y(k − 4) − 0,963×10−1 y(k − 5)y(k − 6)2
−0,963×10−1 y(k − 1)y(k − 4)y(k − 6)3 − 0,451×10−2 y(k − 5)y(k − 6)4
+0,578×10−1 y(k − 1)y(k − 4)2y(k − 6)2.
(5.2)
As Figuras 5.4 e 5.5 apresentam, respectivamente, os graficos da massa
de dados utilizada para se estimar o modelo 2 e um trecho da serie temporal
produzida pelo mesmo. Uma visao bidimensional da projecao tridimen-
sional do atrator reconstruıdo a partir dessa serie e mostrada na Figura
5.6.
Analisando-se as figuras referentes aos modelos 1 e 2, nota-se que tais
modelos apresentam comportamentos dinamicos bem diferentes, apesar
de que, para ambos os casos, terem sido escolhidos o mesmo numero de
termos, a mesma quantidade de amostras, bem como o mesmo grau de
nao -linearidade e o mesmo maximo atraso ny.
5.2 Modelos NARMAX Polinomiais 73
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
θ 1(r
ad/s)
Figura 5.4: Grafico da massa de dados utilizada para se estimar o modelo 2.
No grafico, estao representadas 500 amostras.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
y(k
)(r
ad/s)
Figura 5.5: Grafico da serie temporal produzida pelo modelo 2.
No grafico, estao representadas 500 amostras.
74 5 Resultados e Discussoes
−3−2
−1 0
1 2
3 4 −4
−3−2
−1 0
1 2
3 4
−4−3−2−1 0 1 2 3 4
−4
y(k) y(k + τ)
y(k + 2τ)
Figura 5.6: Visao bidimensional da projecao tridimensional do atrator recons-truıdo a partir da serie temporal gerada pelo modelo 2.
Reconstrucao obtida para τ = 7 e de = 5.
5.3 Modelos NARMAX Racionais
Funcoes racionais sao mais gerais e capazes de representar com exatidao
certos tipos de singularidades, ou caracterısticas proximas de singular,
alem de operar em faixas infinitas (Correa, 1997). Desta forma, optou-
se pela utilizacao da representacao NARMAX racional, pois essa e mais
eficiente na descricao das varias nao -linearidades existentes em um pro-
cesso quando comparada a representacao polinomial.
O processo de identificacao, empregando-se a representacao NARMAX
racional, passou pelos mesmos caminhos utilizados para se obterem os
modelos polinomiais, descritos na secao anterior. Devido ao fato de a
representacao NARMAX racional ser nao -linear nos parametros, utilizou-
se o estimador estendido de mınimos quadrados (EMQ) a fim de se reduzir
os efeitos da polarizacao. Foram identificados dois modelos racionais3 que
apresentaram dinamica caotica para os dados do pendulo. Tais modelos
sao apresentados a seguir.
3Devido ao fato de os modelos identificados serem autonomos, utilizou-se a repre-sentacao NARMA, que e um caso particular da representacao NARMAX.
5.3 Modelos NARMAX Racionais 75
5.3.1 Modelo 3
O modelo 3 foi obtido a partir de uma janela com 500 observacoes, np = 42,ny = 10, ne = 10 e ℓ = 5. As Equacoes (5.3) e (5.4) apresentam o modelo3.
y(k) =1
D×1,94410 y(k − 1) − 1,36370 y(k − 2) + 0,40047 y(k − 3)
−0,19364 y(k − 10) − 0,66264 y(k − 1)y(k − 8)2
+0,39371 y(k − 2)y(k − 8)2 − 0,80976×10−1 y(k − 3)y(k − 8)2
−0,11138×10−2 y(k − 8)y(k − 9)3y(k − 10)
+0,54596×10−1 y(k − 1)y(k − 8)4 − 0,14585×10−1 y(k − 2)y(k − 8)4
−0,46322×10−2 y(k − 3)y(k − 8)4
+0,28300×10−1 y(k − 8)y(k − 9)y(k − 10)
−0,30782×10−3 y(k − 1)y(k − 2)2y(k − 6)y(k − 10)
+0,30016×10−1 y(k − 1)2y(k − 3)y(k − 6)y(k − 10)
−0,89318×10−3 y(k − 7)y(k − 9)4
−0,16761×10−1 y(k − 2)2y(k − 6)y(k − 8)y(k − 10)
−0,36679×10−2 y(k − 1)2y(k − 2)y(k − 6)y(k − 10)
−0,74365×10−1 y(k − 1)3 + 0,33702×10−1 y(k − 2)2y(k − 9)
−0,70335×10−1 y(k − 1)y(k − 3)y(k − 9)
+0,17602×10−3 y(k − 2)y(k − 3)y(k − 4)3
−0,40721×10−1 y(k − 1)2y(k − 3) + 0,11229 y(k − 1)2y(k − 10)
−0,16732×10−1 y(k − 1)4y(k − 10)
+0,75006×10−2 y(k − 3)y(k − 7)2y(k − 9)y(k − 10)
+0,96931×10−1 y(k − 9)
−0,87089×10−2 y(k − 2)y(k − 7)y(k − 8)2y(k − 10)
+0,38141×10−2 y(k − 2)3y(k − 3)y(k − 9)
+10∑
i=1
θiξ(k − i) + ξ(k),
(5.3)
sendo,
76 5 Resultados e Discussoes
D = 1 − 0,36182 y(k − 8)2 + 0,35114×10−1 y(k − 8)4
+0,26804×10−1 y(k − 2)y(k − 3)y(k − 6)y(k − 10)
+0,15233×10−2 y(k − 1)y(k − 5)y(k − 6)y(k − 10)
−0,19747×10−1 y(k − 3)y(k − 6)y(k − 8)y(k − 10)
−0,11297×10−2 y(k − 2)2y(k − 6)y(k − 10)
−0,36269×10−1 y(k − 1)2 − 0,10476 y(k − 2)2
+0,27479×10−1 y(k − 2)y(k − 3)
+0,41566×10−2 y(k − 1)y(k − 7)y(k − 9)2
−0,95518×10−3 y(k − 3)y(k − 7)y(k − 8)y(k − 9)
+0,67373×10−1 y(k − 1)y(k − 10) − 0,13269×10−1 y(k − 1)3y(k − 10).
(5.4)
As Figuras 5.7 e 5.8 apresentam, respectivamente, os graficos da massa
de dados utilizada para se estimar o modelo 3 e um trecho da serie temporal
produzida pelo mesmo. Uma visao bidimensional da projecao tridimensi-
onal do atrator reconstruıdo a partir dessa serie e mostrada na Figura 5.9.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
θ 1(r
ad/s)
Figura 5.7: Grafico da massa de dados utilizada para se estimar o modelo 3.
No grafico, estao representadas 500 amostras.
5.3 Modelos NARMAX Racionais 77
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500
y(k
)(r
ad/s)
k
Figura 5.8: Grafico da serie temporal produzida pelo modelo 3.
No grafico, estao representadas 500 amostras.
−3−2
−1 0
1 2
3 4 −4
−3−2
−1 0
1 2
3 4
−4−3−2−1 0 1 2 3 4
−4
y(k + τ)
y(k + 2τ)
y(k)
Figura 5.9: Visao bidimensional da projecao tridimensional do atrator recons-truıdo a partir da serie temporal gerada pelo modelo 3.
Reconstrucao obtida para τ = 11 e de = 5.
5.3.2 Modelo 4
Um outro modelo foi identificado a partir dos dados do pendulo, o modelo4. Para o processo de identificacao, utilizaram-se 500 amostras da serietemporal, np = 34, ny = 8, ne = 10 e ℓ = 5. As Equacoes (5.5) e (5.6)
78 5 Resultados e Discussoes
apresentam o modelo 4.
y(k) =1
D×2,20490 y(k − 1) − 1,77700 y(k − 2) + 0,56612 y(k − 3)
−0,21314 y(k − 8) − 0,93465 y(k − 1)y(k − 7)y(k − 8)
+0,78988 y(k − 2)y(k − 7)y(k − 8)
−0,26914 y(k − 3)y(k − 7)y(k − 8) + 0,27823×10−1 y(k − 8)3
+0,89704×10−1 y(k − 1)y(k − 7)y(k − 8)3
−0,75706×10−1 y(k − 2)y(k − 7)y(k − 8)3
+0,25759×10−1 y(k − 3)y(k − 7)y(k − 8)3
−0,23416×10−2 y(k − 8)5 + 0,142800 y(k − 7)
−0,21611×10−2 y(k − 3)2y(k − 5)
−0,24873×10−3 y(k − 1)y(k − 4)3y(k − 8) − 0,75200×10−1 y(k − 1)5
+0,12110 y(k − 1)4y(k − 2) − 0,45437×10−2 y(k − 1)4y(k − 3)
−0,14119 y(k − 2)2y(k − 8) + 0,17303 y(k − 2)2y(k − 6)
+0,10424×10−2 y(k − 1)y(k − 3)y(k − 4)y(k − 5)y(k − 6)
+0,16358×10−1 y(k − 1)3y(k − 3)y(k − 8)
−0,24942×10−2 y(k − 2)y(k − 3)2y(k − 8)2
−0,35630 y(k − 1)y(k − 2)y(k − 6) + 0,29329 y(k − 1)y(k − 2)y(k − 8)
−0,44758×10−1 y(k − 1)3y(k − 2)2 +
10∑
i=1
θiξ(k − i) + ξ(k),
(5.5)
sendo,
D = 1 − 0,41136 y(k − 7)y(k − 8) + 0,39218×10−1 y(k − 7)y(k − 8)3
−0,30893×10−1 y(k − 1)4 + 0,16344×10−1 y(k − 1)2y(k − 3)y(k − 8)
+0,27396×10−1 y(k − 1)3y(k − 2) + 0,13384 y(k − 2)y(k − 8)
−0,17213 y(k − 2)y(k − 6).
(5.6)
A Figura 5.10 mostra a massa de dados utilizada para se identificar
o modelo anterior. As Figuras 5.11 e 5.12 apresentam, respectivamente,
o grafico da serie temporal produzida pelo modelo 4 e uma visao bidi-
5.3 Modelos NARMAX Racionais 79
mensional da projecao tridimensional do atrator reconstruıdo a partir da
mesma.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
θ 1(r
ad/s)
Figura 5.10: Grafico da massa de dados utilizada para se estimar o modelo 4.
No grafico, estao representadas 500 amostras.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
y(k
)(r
ad/s)
Figura 5.11: Grafico da serie temporal produzida pelo modelo 4.
No grafico, estao representadas 500 amostras.
80 5 Resultados e Discussoes
−3−2
−1 0
1 2
3 4 −4
−3−2
−1 0
1 2
3 4
−4−3−2−1 0 1 2 3 4
−4
y(k)y(k + τ)
y(k + 2τ)
Figura 5.12: Visao bidimensional da projecao tridimensional do atrator recons-truıdo a partir da serie temporal gerada pelo modelo 4.
Reconstrucao obtida para τ = 7 e de = 5.
5.4 Modelos Fuzzy NARX Takagi-Sugeno
Como alternativa ao uso das representacoes NARMAX polinomiais e racio-
nais, optou-se pela utilizacao da representacao fuzzy NARX Takagi-Sugeno
na obtencao de modelos a partir da serie temporal da velocidade angular
da barra 1. Tal representacao e composta por um conjunto de regras do
tipo Se-entao, apresentada pela Equacao (3.28), que contem modelos li-
neares do tipo ARX. Associadas a essas regras, encontram-se funcoes de
pertinencia responsaveis em fornecer o grau de compatibilidade de cada
variavel premissa ao respectivo conjunto fuzzy4. Ao final, por meio da
soma ponderada dos modelos lineares, obtem-se a representacao NARX.
Portanto, no processo de identificacao dos modelos, faz-se necessaria a
definicao do numero de regras r e do maximo atraso de saıda ny. Destaca-
se que esses foram obtidos por meio de tentativa e erro. Como valores
iniciais para ny, empregaram-se, primeiramente, os valores utilizados para
se obter os modelos anteriormente apresentados. Em relacao ao numero
de regras, iniciou-se com duas regras, evoluindo gradativamente para uma
quantidade maior. Nesse processo de identificacao foram testadas varias
possibilidades ate que fossem obtidos modelos.
4Neste trabalho, sera utilizada a mesma nomenclatura para denotar o conjunto fuzzye a sua funcao de pertinencia.
5.4 Modelos Fuzzy NARX Takagi-Sugeno 81
Uma vez que os modelos sao autonomos, nao se define nu e, conse-
quentemente, obtem-se modelos nao-lineares do tipo NAR. Para se esti-
mar os parametros dos modelos, utilizou-se o algoritmo apresentado na
Secao 3.5.3. Tambem foram identificados dois modelos que apresentaram
dinamica caotica. Tais modelos sao apresentados nas secoes a seguir.
5.4.1 Modelo 5
O primeiro modelo fuzzy NARX TS foi obtido a partir de um conjunto de500 amostras da serie temporal de θ1 utilizando-se r = 10 e ny = 8. Aequacao a seguir apresenta o referido modelo.
1. Se y(k − 1) e A11 e y(k − 2) e A12 e y(k − 3) e A13 e y(k − 4) e A14
e y(k − 5) e A15 e y(k − 6) e A16 e y(k − 7) e A17 e y(k − 8) e A18,
entao:
y1(k) = 3,77×103y(k − 1) − 4,43×103y(k − 2) + 1,80×103y(k − 3)
−7,36×103y(k − 4) + 1,15×104y(k − 5) − 4,79×103y(k − 6)
−3,64×103y(k − 7) + 3,69×103y(k − 8) − 4,20×102
2. Se y(k − 1) e A21 e y(k − 2) e A22 e y(k − 3) e A23 e y(k − 4) e A24
e y(k − 5) e A25 e y(k − 6) e A26 e y(k − 7) e A27 e y(k − 8) e A28,
entao:
y2(k) = 1,41×103y(k − 1) + 1,19×103y(k − 2) − 5,83×103y(k − 3)
+1,41×103y(k − 4) + 4,93×103y(k − 5) − 2,14×103y(k − 6)
−4,07×103y(k − 7) + 3,32×103y(k − 8) − 2,57×102
3. Se y(k − 1) e A31 e y(k − 2) e A32 e y(k − 3) e A33 e y(k − 4) e A34
e y(k − 5) e A35 e y(k − 6) e A36 e y(k − 7) e A37 e y(k − 8) e A38,
entao:
y3(k) = −9,69×103y(k − 1) + 1,49×104y(k − 2) − 7,26×103y(k − 3)
+1,18×104y(k − 4) − 2,11×104y(k − 5) + 1,30×104y(k − 6)
+4,30×103y(k − 7) − 6,93×103y(k − 8) + 8,09×102
4. Se y(k − 1) e A41 e y(k − 2) e A42 e y(k − 3) e A43 e y(k − 4) e A44
e y(k − 5) e A45 e y(k − 6) e A46 e y(k − 7) e A47 e y(k − 8) e A48,
entao:
y4(k) = −2,74×103y(k − 1) + 2,23×103y(k − 2) − 3,77×103y(k − 3)
+1,23×104y(k − 4) − 1,14×104y(k − 5) + 4,53×103y(k − 6)
−1,23×103y(k − 7) + 1,66y(k − 8) − 2,86×101
5. Se y(k − 1) e A51 e y(k − 2) e A52 e y(k − 3) e A53 e y(k − 4) e A54
e y(k − 5) e A55 e y(k − 6) e A56 e y(k − 7) e A57 e y(k − 8) e A58,
entao:
82 5 Resultados e Discussoes
y5(k) = 3,96×103y(k − 1) − 8,35×103y(k − 2) + 1,41×104y(k − 3)
−1,93×104y(k − 4) + 1,31×104y(k − 5) − 7,81×103y(k − 6)
+6,69×103y(k − 7) − 2,57×103y(k − 8) + 5,48×102
6. Se y(k − 1) e A61 e y(k − 2) e A62 e y(k − 3) e A63 e y(k − 4) e A64
e y(k − 5) e A65 e y(k − 6) e A66 e y(k − 7) e A67 e y(k − 8) e A68,
entao:
y6(k) = 4,88×103y(k − 1) − 1,05×104y(k − 2) + 6,79×103y(k − 3)
−2,27×103y(k − 4) + 4,70×103y(k − 5) − 4,81×103y(k − 6)
−8,18×102y(k − 7) + 2,49×103y(k − 8) − 7,16×102
7. Se y(k − 1) e A71 e y(k − 2) e A72 e y(k − 3) e A73 e y(k − 4) e A74
e y(k − 5) e A75 e y(k − 6) e A76 e y(k − 7) e A77 e y(k − 8) e A78,
entao:
y7(k) = −5,79×102y(k − 1) − 8,33×101y(k − 2) + 3,36×102y(k − 3)
+2,60×103y(k − 4) − 3,11×103y(k − 5) + 6,76×102y(k − 6)
+4,92×102y(k − 7) − 3,04×102y(k − 8) + 4,04×101
8. Se y(k − 1) e A81 e y(k − 2) e A82 e y(k − 3) e A83 e y(k − 4) e A84
e y(k − 5) e A85 e y(k − 6) e A86 e y(k − 7) e A87 e y(k − 8) e A88,
entao:
y8(k) = −5,88×102y(k − 1) + 3,86×103y(k − 2) − 5,09×103y(k − 3)
+3,10×102y(k − 4) + 1,42×103y(k − 5) + 1,15×103y(k − 6)
−1,40×103y(k − 7) + 2,65×102y(k − 8) − 2,10×102
9. Se y(k − 1) e A91 e y(k − 2) e A92 e y(k − 3) e A93 e y(k − 4) e A94
e y(k − 5) e A95 e y(k − 6) e A96 e y(k − 7) e A97 e y(k − 8) e A98,
entao:
y9(k) = 8,47×102y(k − 1) − 1,89×103y(k − 2) + 1,49×,103y(k − 3)
−1,75×102y(k − 4) + 4,20×102y(k − 5) − 8,48×102y(k − 6)
−3,03×102y(k − 7) + 5,74×102y(k − 8) + 9,37×101
10. Se y(k − 1) e A101 e y(k − 2) e A102 e y(k − 3) e A103 e y(k − 4) e A104
e y(k − 5) e A105 e y(k − 6) e A106 e y(k − 7) e A107 e y(k − 8) e A108,
entao:
y10(k) = −1,25×103y(k − 1) + 3,02×103y(k − 2) − 2,54×103y(k − 3)
+6,36×102y(k − 4) − 4,90×102y(k − 5) + 1,00×103y(k − 6)
−1,32×101y(k − 7) − 5,45×102y(k − 8) + 1,41×102.
Conforme descrito na Secao 3.5.3, o numero de regras indica o numero
de agrupamentos fuzzy utilizados na obtencao do modelo. A Tabela 5.1
apresenta os valores obtidos para os centros desses agrupamentos.
5.4 Modelos Fuzzy NARX Takagi-Sugeno 83
Tabela 5.1: Valores obtidos para os centros dos agrupamentos fuzzy utilizadosna obtencao do modelo 5.
Regra y(k − 1) y(k − 2) y(k − 3) y(k − 4) y(k − 5) y(k − 6) y(k − 7) y(k − 8)
1 −0,168 −0,174 −0,174 −0,168 −0,159 −0,146 −0,130 −0,111
2 −0,128 −0,165 −0,197 −0,223 −0,242 −0,253 −0,257 −0,253
3 −0,115 −0,137 −0,155 −0,170 −0,180 −0,186 −0,186 −0,180
4 −0,109 −0,127 −0,140 −0,147 −0,148 −0,143 −0,134 −0,121
5 −0,075 −0,093 −0,108 −0,119 −0,126 −0,127 −0,125 −0,119
6 −0,019 −0,044 −0,070 −0,095 −0,119 −0,140 −0,157 −0,168
7 0,029 0,064 0,099 0,132 0,160 0,182 0,195 0,200
8 0,064 0,086 0,104 0,119 0,133 0,143 0,149 0,150
9 0,126 0,138 0,143 0,143 0,138 0,131 0,121 0,109
10 0,151 0,124 0,091 0,053 0,012 −0,031 −0,073 −0,110
Pode-se verificar os centros anteriormente citados observando-se as
funcoes de pertinencia5 do modelo 5 apresentadas na Figura 5.13.
−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.55
0.6
y(k−1)
µ
A
11
A21
A31
A41
A51
A61
A71
A81
A91
A101
(a)
5As figuras estao ampliadas e, portanto, nao sao apresentados todos os valoresassumidos pelas variaveis que estao nos eixos das abscissas. Isso porque as funcoesde pertinencia permanecem constantes para as regioes que nao estao apresentadas nasfiguras.
84 5 Resultados e Discussoes
−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15
0.1
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
0.2
y(k−2)
µ
A
12
A22
A32
A42
A52
A62
A72
A82
A92
A102
(b)
−0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2
0.1
0.12
0.14
0.16
0.18
0.2
0.22
0.24
0.26
y(k−3)
µ
A
13
A23
A33
A43
A53
A63
A73
A83
A93
A103
(c)
5.4 Modelos Fuzzy NARX Takagi-Sugeno 85
−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15
0.1
0.12
0.14
0.16
0.18
0.2
0.22
y(k−4)
µ
A14
A24
A34
A44
A54
A64
A74
A84
A94
A104
(d)
−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2
0.1
0.12
0.14
0.16
0.18
0.2
0.22
0.24
0.26
0.28
y(k−5)
µ
A
15
A25
A35
A45
A55
A65
A75
A85
A95
A105
(e)
86 5 Resultados e Discussoes
−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2
0.1
0.15
0.2
0.25
0.3
0.35
y(k−6)
µ
A
16
A26
A36
A46
A56
A66
A76
A86
A96
A106
(f)
−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15 0.2
0.1
0.15
0.2
0.25
0.3
0.35
0.4
y(k−7)
µ
A
17
A27
A37
A47
A57
A67
A77
A87
A97
A107
(g)
5.4 Modelos Fuzzy NARX Takagi-Sugeno 87
−0.3 −0.2 −0.1 0 0.1 0.2
0.1
0.15
0.2
0.25
0.3
0.35
y(k−8)
µ
A
18
A28
A38
A48
A58
A68
A78
A88
A98
A108
(h)
Figura 5.13: Funcoes de pertinencia referentes ao modelo 5.
As figuras de (a) a (h) representam as funcoes de pertinencia paracada variavel premissa do modelo.
As Figuras 5.14 e 5.15 apresentam, respectivamente, a massa de da-
dos utilizada no processo de identificacao e um trecho da serie temporal
produzida pelo modelo 5.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500k
θ 1(r
ad/s)
Figura 5.14: Grafico da massa de dados utilizada para se estimar o modelo 5.
No grafico, estao representadas 500 amostras.
88 5 Resultados e Discussoes
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500
y(k
)(r
ad/s)
k
Figura 5.15: Grafico de um trecho da serie temporal produzida pelo modelo 5.
No grafico, estao representadas 500 amostras.
Uma visao bidimensional da projecao tridimensional do atrator recons-
truıdo a partir dessa serie e mostrada na Figura 5.16.
−3−2
−1 0
1 2
3 4 −4
−3−2
−1 0
1 2
3 4
−4−3−2−1 0 1 2 3 4
−4
y(k)y(k + τ)
y(k + 2τ)
Figura 5.16: Visao bidimensional da projecao tridimensional do atrator recons-truıdo a partir da serie temporal gerada pelo modelo 5.
Reconstrucao obtida para τ = 11 e de = 5.
5.4.2 Modelo 6
O segundo modelo fuzzy NARX TS, denominado modelo 6, foi obtido paraum conjunto de 600 amostras da serie temporal em estudo. Tal modelo
5.4 Modelos Fuzzy NARX Takagi-Sugeno 89
apresenta nove regras com ny = 10. A Equacao (5.7) mostra o referidomodelo.
1. Se y(k − 1) e A11 e y(k − 2) e A12 e y(k − 3) e A13 e y(k − 4) e A14
e y(k − 5) e A15 e y(k − 6) e A16 e y(k − 7) e A17 e y(k − 8) e A18
e y(k − 9) e A19 e y(k − 10) e A110,
entao:
y1(k) = 5,18×102y(k − 1) − 5,04×102y(k − 2) + 6,22×103y(k − 3)
−1,47×104y(k − 4) + 1,44×104y(k − 5) − 9,04×103y(k − 6)
+6,86×103y(k − 7) − 5,18×103y(k − 8) + 1,38×102y(k − 9)
+1,81×103y(k − 10) + 5,81
2. Se y(k − 1) e A21 e y(k − 2) e A22 e y(k − 3) e A23 e y(k − 4) e A24
e y(k − 5) e A25 e y(k − 6) e A26 e y(k − 7) e A27 e y(k − 8) e A28
e y(k − 9) e A29 e y(k − 10) e A210,
entao:
y2(k) = 3,97×102y(k − 1) − 1,07×103y(k − 2) − 8,30×103y(k − 3)
+2,10×104y(k − 4) − 2,07×104y(k − 5) + 1,21×104y(k − 6)
−8,17×103y(k − 7) + 7,25×103y(k − 8) − 1,22×103y(k − 9)
−1,97×103y(k − 10) − 2,40×102
3. Se y(k − 1) e A31 e y(k − 2) e A32 e y(k − 3) e A33 e y(k − 4) e A34
e y(k − 5) e A35 e y(k − 6) e A36 e y(k − 7) e A37 e y(k − 8) e A38
e y(k − 9) e A39 e y(k − 10) e A310,
entao:
y3(k) = −1,10×102y(k − 1) + 3,89×102y(k − 2) − 6,90×102y(k − 3)
+8,06×102y(k − 4) − 7,49×102y(k − 5) − 6,14×102y(k − 6)
+1,11×103y(k − 7) + 2,17×102y(k − 8) − 5,90×102y(k − 9)
+1,58×102y(k − 10) − 2,25×102
4. Se y(k − 1) e A41 e y(k − 2) e A42 e y(k − 3) e A43 e y(k − 4) e A44
e y(k − 5) e A45 e y(k − 6) e A46 e y(k − 7) e A47 e y(k − 8) e A48
e y(k − 9) e A49 e y(k − 10) e A410,
entao:
y4(k) = 2,81×101y(k − 1) + 1,42×102y(k − 2) − 5,06×102y(k − 3)
+4,78×102y(k − 4) − 1,82×102y(k − 5) + 6,92×102y(k − 6)
+5,24×101y(k − 7) − 1,57×103y(k − 8) + 1,33×103y(k − 9)
−3,78×102y(k − 10) + 2,25×102
5. Se y(k − 1) e A51 e y(k − 2) e A52 e y(k − 3) e A53 e y(k − 4) e A54
e y(k − 5) e A55 e y(k − 6) e A56 e y(k − 7) e A57 e y(k − 8) e A58
e y(k − 9) e A59 e y(k − 10) e A510,
entao:
90 5 Resultados e Discussoes
y5(k) = −3.84×102y(k − 1) + 6.83×102y(k − 2) + 5.57×103y(k − 3)
−1,34×104y(k − 4) + 1,32×104y(k − 5) − 6,16×103y(k − 6)
+3,05×103y(k − 7) − 4,69×103y(k − 8) + 1,83×103y(k − 9)
+8,47×102y(k − 10) + 5,75×102
6. Se y(k − 1) e A61 e y(k − 2) e A62 e y(k − 3) e A63 e y(k − 4) e A64
e y(k − 5) e A65 e y(k − 6) e A66 e y(k − 7) e A67 e y(k − 8) e A68
e y(k − 9) e A69 e y(k − 10) e A610,
entao:
y6(k) = −9,36×102y(k − 1) − 3,91×102y(k − 2) + 1,42×103y(k − 3)
+1,27×103y(k − 4) − 1,89×103y(k − 5) + 2,49×103y(k − 6)
−6,54×103y(k − 7) + 6,95×103y(k − 8) − 2,55×103y(k − 9)
−9,92×101y(k − 10) − 1,55×102
7. Se y(k − 1) e A71 e y(k − 2) e A72 e y(k − 3) e A73 e y(k − 4) e A74
e y(k − 5) e A75 e y(k − 6) e A76 e y(k − 7) e A77 e y(k − 8) e A78
e y(k − 9) e A79 e y(k − 10) e A710,
entao:
y7(k) = −1.72×103y(k − 1) + 1,85×103y(k − 2) + 2,51×103y(k − 3)
−4,74×103y(k − 4) + 3,16×103y(k − 5) + 3,26×101y(k − 6)
−1,89×103y(k − 7) + 3,49×102y(k − 8) + 7,73×102y(k − 9)
−2,93×102y(k − 10) + 1,78×102
8. Se y(k − 1) e A81 e y(k − 2) e A82 e y(k − 3) e A83 e y(k − 4) e A84
e y(k − 5) e A85 e y(k − 6) e A86 e y(k − 7) e A87 e y(k − 8) e A88
e y(k − 9) e A89 e y(k − 10) e A810,
entao:
y8(k) = 2,67×103y(k − 1) − 2,09×103y(k − 2) − 6,13×103y(k − 3)
+1,04×104y(k − 4) − 8,15×103y(k − 5) + 1,53×103y(k − 6)
+4,12×103y(k − 7) − 2,39×103y(k − 8) + 2,49×101y(k − 9)
−8,13×101y(k − 10) − 2,83×102
9. Se y(k − 1) e A91 e y(k − 2) e A92 e y(k − 3) e A93 e y(k − 4) e A94
e y(k − 5) e A95 e y(k − 6) e A96 e y(k − 7) e A97 e y(k − 8) e A98
e y(k − 9) e A99 e y(k − 10) e A910,
entao:
y9(k) = −4,38×102y(k − 1) + 9,64×102y(k − 2) − 7,38×101y(k − 3)
−1,15×103y(k − 4) + 9,71×102y(k − 5) − 1,06×103y(k − 6)
+1,41×103y(k − 7) − 9,38×102y(k − 8) + 2,76×102y(k − 9)
+5,19y(k − 10) − 8,27×101.
5.4 Modelos Fuzzy NARX Takagi-Sugeno 91
Os centros dos agrupamentos fuzzy utilizados na obtencao do modelo 6,
bem como as funcoes de pertinencia, estao apresentados, respectivamente,
na Tabela 5.2 e na Figura 5.17.
A Figura 5.18 mostra a massa de dados utilizada no processo de
identificacao do referido modelo. Por sua vez, a Figura 5.19 apresenta
um grafico da serie temporal produzida pelo mesmo. Uma visao bidimen-
sional da projecao tridimensional do atrator reconstruıdo a partir dessa
serie e mostrada na Figura 5.20.
925
Res
ult
ados
eD
iscu
ssoe
s
Tabela 5.2: Valores obtidos para os centros dos agrupamentos fuzzy utilizados na obtencao do modelo 6.
Regra y(k − 1) y(k − 2) y(k − 3) y(k − 4) y(k − 5) y(k − 6) y(k − 7) y(k − 8) y(k − 9) y(k − 10)
1 −0,097 −0,116 −0,131 −0,141 −0,147 −0,147 −0,143 −0,134 −0,120 −0,103
2 −0,089 −0,113 −0,133 −0,147 −0,156 −0,158 −0,155 −0,147 −0,135 −0,120
3 −0,081 −0,068 −0,052 −0,034 −0,013 0,008 0,028 0,044 0,058 0,068
4 −0,033 −0,036 −0,037 −0,036 −0,036 −0,037 0,039 −0,041 −0,04 −0,042
5 −0,026 −0,041 −0,054 −0,064 −0,071 −0,074 −0,075 −0,074 −0,071 −0,067
6 0,014 0,010 0,005 −0,000 −0,007 −0,014 −0,021 −0,028 −0,034 −0,038
7 0,032 0,045 0,054 0,061 0,068 0,074 0,079 0,083 0,085 0,083
8 0,044 0,048 0,049 0,048 0,046 0,043 0,040 0,036 0,031 0,025
9 0,063 0,021 −0,022 −0,065 −0,105 −0,143 −0,177 −0,206 −0,227 −0,241
5.4 Modelos Fuzzy NARX Takagi-Sugeno 93
−0.1 −0.05 0 0.05 0.1 0.15
0.12
0.14
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
y(k−1)
µ
A
11
A21
A31
A41
A51
A61
A71
A81
A91
(a)
−0.14 −0.12 −0.1 −0.08 −0.06 −0.04 −0.02 0 0.02 0.04 0.06
0.12
0.14
0.16
0.18
0.2
0.22
0.24
0.26
0.28
0.3
0.32
y(k−2)
µ
A12
A22
A32
A42
A52
A62
A72
A82
A92
(b)
94 5 Resultados e Discussoes
−0.15 −0.1 −0.05 0 0.05
0.11
0.115
0.12
0.125
0.13
0.135
0.14
0.145
0.15
0.155
0.16
y(k−3)
µ
A
13
A23
A33
A43
A53
A63
A73
A83
A93
(c)
−0.15 −0.1 −0.05 0 0.05 0.1
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
y(k−4)
µ
A
14
A24
A34
A44
A54
A64
A74
A84
A94
(d)
5.4 Modelos Fuzzy NARX Takagi-Sugeno 95
−0.15 −0.1 −0.05 0 0.05 0.1
0.115
0.12
0.125
0.13
0.135
0.14
y(k−5)
µ
A
15
A25
A35
A45
A55
A65
A75
A85
A95
(e)
−0.15 −0.1 −0.05 0 0.05 0.1
0.11
0.12
0.13
0.14
0.15
0.16
0.17
0.18
0.19
y(k−6)
µ
A16
A26
A36
A46
A56
A66
A76
A86
A96
(f)
96 5 Resultados e Discussoes
−0.2 −0.15 −0.1 −0.05 0 0.05 0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.55
0.6
y(k−7)
µ
A
17
A27
A37
A47
A57
A67
A77
A87
A97
(g)
−0.2 −0.15 −0.1 −0.05 0 0.05 0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
y(k−8)
µ
A
18
A28
A38
A48
A58
A68
A78
A88
A98
(h)
5.4 Modelos Fuzzy NARX Takagi-Sugeno 97
−0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.55
0.6
0.65
y(k−9)
µ
A
19
A29
A39
A49
A59
A69
A79
A89
A99
(i)
−0.3 −0.25 −0.2 −0.15 −0.1 −0.05 0 0.05 0.1 0.15
0.15
0.2
0.25
0.3
0.35
0.4
0.45
y(k−10)
µ
A
110
A210
A310
A410
A510
A610
A710
A810
A910
(j)
Figura 5.17: Funcoes de pertinencia referentes ao modelo 6.
As figuras de (a) a (j) representam as funcoes de pertinencia paracada variavel premissa do modelo.
98 5 Resultados e Discussoes
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500 600
k
θ 1(r
ad/s)
Figura 5.18: Grafico da massa de dados utilizada para se estimar o modelo 6.
No grafico, estao representadas 600 amostras.
−4
−3
−2
−1
0
1
2
3
4
0 100 200 300 400 500 600
k
y(k
)(r
ad/s)
Figura 5.19: Grafico de um trecho da serie temporal produzida pelo modelo 6.
No grafico, estao representadas 600 amostras.
5.5 Validacao dos Modelos 99
−3−2
−1 0
1 2
3 4 −4
−3−2
−1 0
1 2
3 4
−4−3−2−1 0 1 2 3 4
−4
y(k) y(k + τ)
y(k + 2τ)
Figura 5.20: Visao bidimensional da projecao tridimensional do atrator recons-truıdo a partir da serie temporal gerada pelo modelo 6.
Reconstrucao obtida para τ = 10 e de = 5.
5.5 Validacao dos Modelos
Esta secao e destinada a validacao dos modelos identificados anterior-
mente. A validacao tem por objetivo verificar a eficiencia desses mode-
los na reproducao da dinamica apresentada pelos dados reais. Para tal,
comparar-se-ao as projecoes tridimensionais dos atratores reconstruıdos e
seus invariantes dinamicos com aqueles obtidos para os dados reais. Os
invariantes dinamicos em questao sao o maior expoente de Lyapunov e a
dimensao fractal.
Primeiramente, sao apresentados os valores dos invariantes dinamicos
calculados para os modelos identificados, juntamente com aqueles obti-
dos para os dados reais. A Tabela 5.3 mostra esses valores e os valores
encontrados para τ e de, necessarios para se estimar tais invariantes.
Para facilitar as analises dos modelos, essas serao dividas por tipo de
estrutura utilizada no processo de identificacao.
5.5.1 Modelos NARMAX Polinomiais
Durante o processo de identificacao dos modelos polinomiais,
encontraram-se diversos modelos que apresentavam apenas compor-
tamentos dinamicos periodicos ou instaveis, indicando que a estrutura
100 5 Resultados e Discussoes
Tabela 5.3: Invariantes dinamicos calculados para os modelos identificados edados reais.
Modelo/Real τ de λ1 (Kantz) λ1 (Rosenstein) D2(ǫ, d)
Modelo 1 7 5 1,396 ± 0,030 1,384 ± 0,028 2,158 ± 0,010
Modelo 2 7 5 1,740 ± 0,036 1,677 ± 0,038 2,267 ± 0,014
Modelo 3 11 5 0,283 ± 0,010 0,283 ± 0,014 1,140 ± 0,020
Modelo 4 7 5 0,843 ± 0,014 0,823 ± 0,018 2,860 ± 0,080
Modelo 5 11 5 0,580 ± 0,026 0,564 ± 0,022 3,145 ± 0,120
Modelo 6 10 5 0,556 ± 0,022 0,551 ± 0,018 3,613 ± 0,076
Real 10 5 0,503 ± 0,026 0,495 ± 0,018 3,930 ± 0,060
NARMAX polinomial nao seria capaz de representar a dinamica presente
nos dados reais. Mesmo assim, identificaram-se dois unicos modelos
caoticos, o modelo 1 e o modelo 2. Tal fato pode ser comprovado a partir
dos invariantes dinamicos encontrados na Tabela 5.3. Os modelos obtidos
sao complexos, contendo um elevado numero de termos de processos e
alto grau de nao -linearidade, conforme apresentam as Equacoes (5.1) e
(5.2).
Ressalta-se que alguns modelos identificados apresentaram comporta-
mento periodico semelhante a serie temporal real. Desta forma, variou-se
o parametro do regressor y(k−1) desses modelos, uma vez que eles explica-
vam 95% da variancia dos dados, na tentativa de se recuperar a dinamica
caotica do pendulo (Aguirre et al., 2002). Esse procedimento mostrou
que a estrutura NARMAX polinomial, para esse caso, e muito sensıvel as
variacoes mınimas de parametros, levando os modelos a instabilidade.
A hipotese de que a estrutura NARMAX polinomial nao seja capaz de
representar a dinamica presente nos dados ganha mais enfase ao se com-
parar os invariantes dinamicos dos dados reais com aqueles encontrados
para os modelos 1 e 2. Nota-se que os valores medios dos invariantes di-
ferem dos encontrados para o sistema real, apesar da incerteza presente.
Os expoentes de Lyapunov apresentaram valores maiores do que um, bem
distantes dos pequenos valores apresentados pelos dados reais. Por sua
5.5 Validacao dos Modelos 101
vez, as dimensoes de correlacao ficaram abaixo de tres, ao passo que a
dimensao real esta bem proxima do valor inteiro quatro. Verifica-se tam-
bem, a partir da inspecao visual das Figuras 5.3 e 5.6, que a projecao dos
atratores dos modelos polinomiais nao reproduzem a forma do atrator do
pendulo duplo (Figura 4.8).
O resultado anterior ja era esperado, uma vez que a representacao
NARMAX polinomial e limitada na capacidade de representar diversas
nao -linearidades como as apresentadas pelo pendulo duplo. Para efeito de
comparacao e para se ter uma ideia de quais nao -linearidades estao presen-
tes, basta observar o modelo matematico do pendulo duplo, representado
pelo conjunto de Equacoes (2.8), que e racional e apresenta produto entre
as variaveis de estado. De acordo com Correa (1997), pode-se generalizar
a aplicacao da representacao racional quando ocorrer produto entre as va-
riaveis de estado no modelo contınuo. Alem disso, tal modelo apresenta
a funcao sgn(·), que e fortemente nao -linear, utilizada para representar
oposicao ao movimento das hastes causada pelo atrito de Coulomb.
Vale a pena observar que a dimensao de correlacao do sistema real e
muito proxima de um valor inteiro, o que, de certa forma, poderia ter
contribuıdo com o desempenho nao satisfatorio dos modelos polinomiais
obtidos neste trabalho.
5.5.2 Modelos NARMAX Racionais
Partindo do insucesso na utilizacao da representacao polinomial e nas con-
jecturas apresentadas anteriormente, optou-se pela utilizacao da represen-
tacao racional NARMAX na tentativa de se obterem melhores resultados.
Durante o processo de identificacao, assim como no caso dos mode-
los polinomiais, foram encontrados diversos modelos que apresentaram
comportamentos dinamicos periodicos ou instaveis. Tambem variou-se o
parametro do regressor y(k−1) dos modelos com dinamica periodica, mas,
infelizmente, o resultado nao foi diferente daquele encontrado para os mo-
delos polinomiais. Diversos modelos caoticos tambem foram obtidos, mas,
durante o processo de simulacao, os mesmos deixavam de apresentar com-
portamento caotico e se tornavam periodicos, sendo descartados. Desta
forma, obtiveram-se apenas dois modelos que preservaram o comporta-
mento caotico, sao eles: o modelo 3 e o modelo 4.
Os modelos racionais identificados, quando comparados aos modelos
102 5 Resultados e Discussoes
polinomiais, apresentam menor numero de termos de processo. Ressalta-
se que os algoritmos de identificacao de modelos racionais nao convergiram
quando foram utilizados elevados numeros de termos de processo para
um mesmo grau de nao -linearidade. Nota-se que os modelos racionais
apresentam termos de ruıdo que foram incluıdos a fim de se minimizar os
efeitos da polarizacao, uma vez que a representacao e sensıvel a presenca
de ruıdo nos dados.
A partir da analise da Tabela 5.3, constata-se que os modelos 3 e 4
nao foram capazes de representar a dinamica presente nos dados reais.
Apesar de os expoentes de Lyapunov terem apresentado valores menores
que um, ainda se diferem dos valores dos dados reais. Assim como nos
modelos polinomiais, as dimensoes de correlacao foram menores do que
tres. Observando-se as Figuras 5.9 e 5.12, nota-se que elas nao reproduzem
a forma do atrator original.
Acredita-se que o insucesso da utilizacao da representacao NAR-
MAX racional consista no fato de existirem, nos dados reais, certas nao-
linearidades que nao podem ser representadas por um unico modelo global,
pois, nesses modelos, os parametros sao calculados para todo o conjunto
de dados repassados aos algoritmos, fazendo com que se encontrem pa-
rametros medios, tornando o modelo incapaz de representar certos com-
portamentos dinamicos especıficos. Observando-se a Figura 2.9, nota-se
que a serie temporal real parece com um sinal periodico, mas que e re-
pleto de mudancas abruptas e“quinas”que talvez nao sejam captadas pela
representacao em questao.
Assim como no caso dos modelos polinomiais, acredita-se que o fato de
a dimensao de correlacao do sistema real ser muito proxima de um valor
inteiro tambem poderia ter contribuıdo com o desempenho nao satisfatorio
dos modelos racionais.
5.5.3 Modelos Fuzzy NARX TS
Baseado na justificativa apresentada anteriormente, utilizou-se uma es-
trutura que fosse capaz de representar especificamente certas regioes dos
dados reais, ou seja, uma estrutura que apresentasse modelos locais. A es-
trutura utilizada foi a fuzzy NARX Takagi-Sugeno, apresentada na Secao
3.5.2.
Foram identificados, aproximadamente, seis modelos que apresentaram
5.6 Consideracoes Finais 103
dinamica caotica. Desses, apenas os modelos 5 e 6 permaneceram caoticos
durante extensas simulacoes.
A partir da Tabela 5.3, podem-se comparar os invariantes dinami-
cos calculados para os modelos com os encontrados para os dados reais.
Verifica-se que os modelos 5 e 6 foram os que melhor representaram a
dinamica dos dados reais.
O modelo 5 e composto por dez modelos lineares do tipo AR, que,
interpolados, sao capazes de aproximar a dinamica do pendulo duplo. O
maior expoente de Lyapunov calculado para o referido modelo esta pro-
ximo do valor real, mas, em relacao a dimensao fractal, essa se apresenta
distante, 3,145±0,120 contra 3,930±0,060. Em relacao a forma do atrator,
verifica-se que, aparentemente, o modelo e capaz de reproduzı-la (Figura
5.16).
Por sua vez, o modelo 6, composto por nove modelos lineares, foi o
melhor resultado obtido. A partir dos valores e suas respectivas incertezas,
nota-se que tanto o maior expoente de Lyapunov quanto a dimensao fractal
foram os mais proximos dos resultados encontrados para os dados reais.
Alem disso, os valores de τ e de foram identicos aos dos dados reais. A
Figura 5.20 apresenta uma visao bidimensional da projecao tridimensional
do atrator do modelo pela qual se observa que, aparentemente, sua forma
e a que mais se aproxima da forma do atrator original quando comparado
aos demais modelos.
Os resultados apresentados pelos modelos fuzzy NARX TS reforcam a
hipotese da presenca de certas nao -linearidades nos dados reais que nao
puderam ser representadas pelos modelos globais. Desta forma, verificou-
se que os modelos capazes de representar as dinamicas locais foram mais
eficientes.
5.6 Consideracoes Finais
Neste capıtulo, foram apresentados os modelos identificados utilizando as
representacoes NARMAX polinomial e racional bem como a representacao
fuzzy NARX Takagi-Sugeno a partir dos dados reais referentes a velocidade
angular da barra 1.
Constatou-se que as representacoes racionais e polinomiais nao foram
capazes de representar a dinamica presente nos dados reais. No caso da
primeira, acredita-se que, pelo fato de esses modelos serem globais, eles nao
104 5 Resultados e Discussoes
conseguiram representar certas nao -linearidades presentes nos dados reais
e, na segunda, pelo fato de ser uma estrutura mais simples e, por isso, seja
limitada na capacidade de representar certos comportamentos dinamicos.
Alem disso, acredita-se que o fato de a dimensao de correlacao do sistema
real ser muito proxima de um valor inteiro tambem poderia ter contribuıdo
com o desempenho nao satisfatorio tanto dos modelos polinomiais quanto
dos racionais.
Por sua vez, os modelos fuzzy NARX TS representaram bem a dina-
mica dos dados. Tal fato se justifica pela capacidade desses em representar
eficientemente as dinamicas locais.
Capıtulo 6
Conclusoes
“Muitos dos fracassos da vida ocorrem com as pessoas
que nao reconheceram o quao proximas elas estavam do
sucesso quando desistiram.”
Thomas A. Edison
A capacidade de predizer corretamente comportamentos dinamicos de
sistemas reais a partir de modelos e um dos grandes desafios da socie-
dade moderna. Varias tecnicas e estruturas foram discutidas e analisadas
durante os ultimos anos. A identificacao de sistemas surgiu como uma
alternativa as tecnicas baseadas nas leis fısicas que descrevem os sistemas
a serem modelados. Uma das caracterısticas da identificacao e que pouco
ou nenhum conhecimento previo do sistema em estudo e necessario, sendo
apenas utilizados dados coletados a partir desses.
Neste trabalho, procurou-se obter modelos que descrevessem a dina-
mica de um pendulo duplo que apresenta comportamento caotico utili-
zando as tecnicas de identificacao de sistemas. Para tal, foram utilizadas
tres diferentes representacoes nao -lineares, a saber, NARMAX polinomi-
ais, NARMAX racionais e fuzzy NARX Takagi-Sugeno. O processo de
validacao se deu por meio da comparacao do maior expoente de Lyapunov
e da dimensao fractal calculados para os dados reais e para os dados pro-
venientes dos modelos identificados. Tambem foram comparadas, apenas
visualmente, as projecoes tridimensionais dos atratores reconstruıdos.
Obter tais modelos nao foi uma tarefa simples. A maioria dos modelos
identificados ora apresentava regime dinamico periodico ora era instavel.
Salienta-se que foi devotado muito tempo no processo de identificacao.
106 6 Conclusoes
Mesmo assim, foram obtidos alguns modelos nao -lineares que apresen-
taram dinamica caotica. Ressalta-se que esses modelos sao complexos,
contendo um elevado numero de termos de processo e alto grau de nao-
linearidade ou ainda, no caso dos modelos fuzzy NARX TS, elevado nu-
mero de regras.
Os modelos que foram obtidos utilizando-se a representacao NARMAX
polinomial, apesar de serem caoticos, nao conseguiram reproduzir a dina-
mica presente nos dados. Uma possıvel causa para o insucesso da repre-
sentacao polinomial seria a sua limitacao na capacidade de representar
diversas nao -linearidades apresentadas pelo pendulo duplo, uma vez que
seu modelo contınuo, utilizado para reproduzir o mesmo regime dinamico,
alem de racional, apresenta produto entre as variaveis de estado e a funcao
sgn(·), que e uma funcao fortemente nao -linear. Conforme discutido, tal
cenario apontava para a utilizacao da representacao NARMAX racional.
A representacao NARMAX racional tambem foi ineficaz na tentativa
de reproduzir a dinamica do pendulo. Supoe-se que certas nao-linearidades
nao possam ser representadas por um unico modelo global, pois, nesses
modelos, os parametros sao calculados para todo o conjunto de dados
repassados aos algoritmos, fazendo com que se encontrem parametros me-
dios, tornando o modelo incapaz de representar certos comportamentos
dinamicos especıficos. Observou-se ainda que a serie temporal, apesar
de se parecer com um sinal periodico, e repleto de mudancas abruptas e
“quinas”, que talvez nao sejam captadas por modelos globais.
Alem das possıveis causas anteriormente citadas, acredita-se que o fato
de a dimensao de correlacao do sistema real ser muito proxima de um valor
inteiro tambem poderia ter contribuıdo com o desempenho nao satisfatorio
tanto dos modelos polinomiais quanto dos racionais.
Verificou-se que a representacao fuzzy NARX Takagi-Sugeno se mos-
trou como a mais eficiente entre as tres empregadas. Os modelos
identificados representaram bem a dinamica do pendulo. Uma possıvel
explicacao para o sucesso seria a capacidade de tal estrutura de represen-
tar as diversas nao -linearidades apresentadas pelo pendulo por meio de
modelos locais.
Para o calculo dos invariantes dinamicos, utilizados tanto no processo
de caracterizacao dinamica do pendulo duplo quanto na validacao dos mo-
delos, optou-se pelos algoritmos pertencentes ao pacote computacional TI-
SEAN. Verificou-se que esses algoritmos apresentam um grande numero
6.1 Propostas para Trabalhos Futuros 107
de parametros livres que devem ser ajustados de modo que o resultado
estimado apresente convergencia para o resultado esperado. Outro fato
observado foi a variabilidade dos resultados em funcao de pequenas vari-
acoes nos valores desses parametros.
6.1 Propostas para Trabalhos Futuros
O trabalho desenvolvido e relatado nesta dissertacao apresentou resultados
relevantes e, como em todo processo de pesquisa, muitas questoes ainda
ficaram a ser respondidas. Desta forma, propostas para trabalhos futu-
ros surgem como meios para responder tais questoes. Como propostas,
destacam-se:
• alteracao dos algoritmos de identificacao de modelos fuzzy NARX
Takagi-Sugeno para permitir a inclusao de termos de ruıdo com o
intuito de reduzir os efeitos de polarizacao;
• utilizacao de modelos locais nao -lineares ao inves de modelos lineares
a fim de melhorar os resultados;
• desenvolvimento de controladores baseados nos modelos fuzzy
NARX TS para permitir o controle do pendulo;
• implementacao de um metodo para o calculo dos invariantes dina-
micos diretamente dos modelos fuzzy NARX TS.
Referencias Bibliograficas
Abarbanel, H. D. I. (1995). Analysis of observed chaotic data. Springer-
Verlag, New York, Inc.
Abarbanel, H. D. I., Brown, R., e Kadtke, J. B. (1989). Prediction and
system identification in chaotic nonlinear systems: time series with bro-
adband spectra. Physics Letters, 138:401–408.
Abdel-Rahman, E. M. e Nayfeh, A. H. (2003). Two-dimensional control
for ship-mounted cranes: a feasibility study. Journal of Vibration and
Control, 9(12):1327–1342.
Aguirre, L. A. (1997). Recovering map static nonlinearities from chaotic
data using dynamical models. Physica D, 100(1,2):41–57.
Aguirre, L. A. (2007). Introducao a Identificacao de Sistemas - Tecnicas
Lineares e Nao-Lineares Aplicadas a Sistemas Reais. Editora UFMG,
Belo Horizonte, MG.
Aguirre, L. A. e Billings, S. A. (1995). Improved structure selection for
nonlinear models based on term clustering. Int. J. Control, 62(3):569–
587.
Aguirre, L. A., Maquet, J., e Letellier, C. (2002). Induced one-parameter
bifurcations in identified models. International Journal of Bifurcation
and Chaos, 12(1):135–145.
Aguirre, L. A. e Mendes, E. M. A. M. (1996). Nonlinear polynomial
models: Structure, term clusters and fixed points. Int. J. Bifurcation
and Chaos, 6(2):279–294.
110 Referencias Bibliograficas
Akaike, H. (1974). A new look at the statistical model identification. IEEE
Trans. Automat. Contr., 19(6):716–723.
Alves, G. B. (2004). Propriedades das funcoes de base radiais aplicadas a
identificacao de sistemas dinamicos nao-lineares. Belo Horizonte: Uni-
versidade Federal de Minas Gerais. (Dissertacao de Mestrado, PPGEE).
Amaral, G. F. V. (2001). Uso de redes neurais e conhecimento a priori
na identificacao de sistemas dinamicos nao-lineares. Belo Horizonte:
Universidade Federal de Minas Gerais. (Dissertacao de Mestrado, PP-
GEE).
Andrievskii, B. R. e Fradkov, A. L. (2004). Control of chaos: methods
and applications. II. applications. Automation and Remote Control,
65(4):505–533.
Babusca, R., Roubos, J. A., e Verbruggen, H. B. (1998). Identification
of MIMO systems by input-output TS fuzzy models. In Proceedings
FUZZ-IEEE’98, p. 657–662.
Babusca, R. e Verbruggen, H. B. (2003). Neuro-fuzzy methods for nonli-
near system identification. Annual Reviews in Control, 27:73–85.
Berkemeier, M. D. e Fearing, R. S. (1999). Tracking fast inverted trajecto-
ries of the underactuated acrobot. IEEE Transactions on Robotics and
Automation, 15(4):740–750.
Bezdek, J. C. (1981). Pattern Recognition with Fuzzy Objective Function.
Plenum Press, New York.
Billings, S. A. e Aguirre, L. A. (1995). Effects of the sampling time on
the dynamics and identification of nonlinear models. Int. J. Bifurcation
and Chaos, 5(6):1541–1556.
Billings, S. A. e Chen, S. (1989). Identification of nonlinear rational sys-
tems using a prediction-error estimation algorithm. International Jour-
nal of Control, 20(3):467–494.
Billings, S. A., Chen, S., e Korenberg, M. J. (1989). Identification of
MIMO systems using a forward-regression orthogonal estimator. Inter-
national Journal of Control, 49:2157–2189.
Referencias Bibliograficas 111
Billings, S. A. e Coca, D. (1999). Discrete wavelet models for identification
and qualitative analysis of chaotic systems. Int. J. Bifurcation and
Chaos, 9(7):1263–1284.
Billings, S. A. e Mao, K. Z. (1997). Rational model data smoothers and
identification algorithms. International Journal of Control, 68(2):297–
310.
Billings, S. A. e Zhu, Q. M. (1991). Rational model identification using
an extended least-squares algorithm. International Journal of Control,
54(3):529–546.
Braga, A. P., Carvalho, A. P. L. F., e Ludemir, T. B. (2000). Redes neurais
artificiais: teoria e aplicacoes. Editora LTC.
Campello, R. J. G. B. e Amaral, W. C. (1999). A relational approch for
complex system identification. Controle & Automacao, 10(3):139–148.
Campello, R. J. G. B. e Amaral, W. C. (2001). Modeling and linguistic
knowledge extraction from systems using fuzzy relational models. Fuzzy
Sets and Systems, 121:113–126.
Campos, R. C. C. (2007). Projeto e construcao de planta piloto de neutrali-
zacao de pH e proposta de metodologia para incorporacao de informacoes
auxiliares na identificacao NARX racional. Coronel Fabriciano: Centro
Universitario do Leste de Minas Gerais - Unileste MG. (Dissertacao de
Mestrado, PPGE).
Casdagli, M. (1989). Nonlinear prediction of chaotic time series. Physica
D, 35:335–356.
Casdagli, M. (1997). Recurrence plots revisited. Physica D, 108(1-2):12–
44.
Cassini, C. C. S. (1999). Estimacao recursiva de caracterısticas estaticas
nao-lineares utilizando modelos polinomiais NARMAX. Belo Horizonte:
Universidade Federal de Minas Gerais. (Dissertacao de Mestrado, PP-
GEE).
Christini, D. J., Collins, J. J., e Linsay, P. S. (1996). Experimental con-
trol of high-dimensional chaos: The driven double pendulum. Physical
Review E, 54(5):4824–4827.
112 Referencias Bibliograficas
Chua, L. O. e Parker, T. S. (1989). Practical Numerical Algorithms for
Chaotic Systems. Springer-Verlag, New York.
Cicolani, L. S., McCoy, A. H., Sahai, R., Tyson, P. H., Tischler, M. B.,
Rosen, A., e Tucker, G. E. (2001). Flight teste identification and simu-
lation of a UH-60A helicopter and slung load. Journal of the American
Helicopter Society, 46(2):140–160.
Coelho, M. C. S. (2002). Modelos de Hammerstein e de Wiener: cone-
xoes com modelos NARX e sua aplicacao em identificacao de sistemas
nao-lineares. Belo Horizonte: Universidade Federal de Minas Gerais.
(Dissertacao de Mestrado, PPGEE).
Correa, M. V. (1997). Identificacao de sistemas dinamicos nao-lineares
utilizando modelos NARMAX racionais - aplicacao a sistemas reais.
Belo Horizonte: Universidade Federal de Minas Gerais. (Dissertacao de
Mestrado, PPGEE).
Correa, M. V. (2001). Identificacao caixa-cinza de sistemas nao-lineares
utilizando representacoes NARMAX racionais e polinomiais. Belo Ho-
rizonte: Universidade Federal de Minas Gerais. (Tese de Doutorado,
PPGEE).
Correa, M. V. e Aguirre, L. A. (2004). Identificacao nao-linear caixa-cinza:
uma revisao e novos resultados. SBA: Controle & Automacao Sociedade
Brasileira de Automatica, 15(2):109–126.
Eckmann, J.-P., Kamphorst, S. O., e Ruelle, D. (1987). Recurrence plots
of dynamical systems. Europhysics Letters, 4(9):973–977.
Elsner, J. B. (1992). Predicting time series using a neural network as
a method of distinguishing chaos from noise. Journal of Physics A,
25:843–850.
Fiedler-Ferrara, N. e Prado, C. P. C. (1994). Caos: uma introducao.
Editora Edgard Blucher Ltda, Sao Paulo.
Firmo, D. L. (2007). Construcao e Caracterizacao Dinamica de um Pen-
dulo Duplo Caotico. Belo Horizonte: Universidade Federal de Minas
Gerais. (Dissertacao de Mestrado, PPGEE).
Referencias Bibliograficas 113
Fraser, A. M. e Swinney, H. L. (1986). Independent coordinates for strange
attractors from mutual information. Physical Review A, 33(2):1134–
1140.
Gath, I. e Geva, A. B. (1989). Unsupervised optimal fuzzy cluste-
ring. IEEE Transactions on Pattern Analysis and Machine Intelligence,
7:773–781.
Graps, A. (1995). An introduction to wavelets. IEEE Computational
Science and Engineering, 2(2).
Grassberger, P. e Procaccia, I. (1983). Measuring the strangeness of
strange attractors. Physica D, 9(1–2):189–208.
Gustafson, D. E. e Kessel, W. C. (1979). Fuzzy clustering with a fuzzy
covariance matrix. In Proceedings IEEE CDC, San Diego, CA, USA. p.
761–766.
Gutnik, B., Mackie, H., Hudson, G., e Standen, C. (2005). How close to
a pendulum is human upper limb movement during walking? Homo -
Journal of Comparative Human Biology, 56(1):35–49.
Haykin, S. (2001). Redes neurais: princıpios e pratica. Editora Bookman,
2. ed. Porto Alegre.
Hegger, R., Kantz, H., e Schreiber, T. (1999). Practical implementation of
nonlinear time series methods: the TISEAN package. Chaos, 9(2):413–
435.
Heng, H. e Martienssen, W. (1992). Analysing the chaotic motion of a
driven pendulum. Chaos, Solitons & Fractals, 2:323–334.
Henrique, H. M., Lima, E. L., e Pinto, J. C. (1998). A bifurcation study on
neural network models for nonlinear dynamics systems. Latin American
Applied Research, 28:187–200.
Henry, R. J., Masoud, Z. N., Nayfeh, A. H., e Mook, D. T. (2001). Cargo
pendulation reduction on ship-mounted cranes via boom-luff angle ac-
tuation. Journal of Vibration and Control, 7(8):1253–1264.
Kantz, H. (1994). A robust method to estimate the maximal lyapunov
exponent of a time series. Physics Letters A, 185(1):77–87.
114 Referencias Bibliograficas
Kaymak, U. e Babusca, R. (1995). Compatible cluster merging for fuzzy
modeling. In Proceedings FUZZ-IEEE/IFES’95, Yokohama, Japan. p.
897–904.
Kennel, M. B., Brown, R., e Abarbanel, H. D. I. (1992). Determining
embedding dimension for phase-space reconstruction using a geometrical
construction. Physical Review A, 45(6):3403–3411.
Kolmogorov, A. N. (1958). A new metric invariant of transient dynamical
systems and automorphisms in lebesgue spaces. Doklady Akademii Nauk
SSSR, 119(5):861–864.
Krishnapuram, R. e Freg, C. (1992). Fitting an unknown number of lines
and planes to image data through compatible cluster merging. Pattern
Recognition, 25(4):385–400.
Leontaritis, I. J. e Billings, S. A. (1985a). Input-output parametric models
for nonlinear systems – Part 1: Deterministic nonlinear systems. Int.
J. Control, 41(2):303–328.
Leontaritis, I. J. e Billings, S. A. (1985b). Input-output parametric models
for nonlinear systems – Part 2: Stochastic nonlinear systems. Int. J.
Control, 41(2):329–344.
Levien, R. B. e Tan, S. M. (1993). Double pendulum: an experiment in
chaos. Am. J. Phys., 61(11):1038–1044.
Ljung, L. (1999). System Identification - Theory for the User. Prentice-
Hall International, New Jersey.
Lorenz, E. N. (1963). Deterministic nonperiodic flow. Journal of The
Atmospheric Sciences, 2(20):130–141.
Mamdani, E. H. (1977). Application of fuzzy logic to approximate reaso-
ning using linguistic systems. Fuzzy Set and Systems, 26:1182–1191.
Marwan, N., Romano, M. C., Thiel, M., e Kurths, J. (2007). Recurrence
plots for the analysis of complex systems. Physics Reports, 438:237–329.
Mendes, E. M. A. M. (1995). Identification of nonlinear discrete sys-
tems with intelligent structure detection. United Kingdom: University
of Sheffield. (Tese de Doutorado).
Referencias Bibliograficas 115
Meriam, J. L. e Kraige, L. G. (2003). Engineering Mechanics. John Wiley
& Sons, Inc.
Monteiro, L. H. A. (2006). Sistemas Dinamicos. Livraria da Fısica, Sao
Paulo.
Narendra, K. S. e Gallman, P. G. (1966). An iterative method for the
identification of the nonlinear systems using a Hammerstein model.
IEEE Trans. Automat. Control, 11(3):546–550.
Packard, N. H., Crutchfield, J. P., Farmer, J. D., e Shaw, R. S. (1980).
Geometry from a time series. Physical Review Letters, 45(9):712–716.
Patwardhan, R. S., Lakshminarayanan, S., e L., S. S. (1998). Constrai-
ned nonlinear MPC using Hammerstein and Wiener models: PLS fra-
mework. AIChE Journal, 44(7):1611–1622.
Pearson, R. K. e Pottmann, M. (2000). Gray-box identification of block
oriented nonlinear models. Journal of Process Control, pages 301–315.
Pedrycz, W. e Gomide, F. A. C. (1998). An Introduction to Fuzzy Sets:
Analysis and Design (Complex Adaptive Systems). MIT Press.
Peyton-Jones, J. E. e Billings, S. A. (1989). Recursive algorithm for com-
puting the frequency response of a class of non-linear difference equati-
ons models. International Journal of Control, 50(5):1925–1940.
Pottmann, M. e Pearson, R. K. (1998). Block-oriented NARMAX models
with output multiplicities. AI-ChE Journal, 44(1):131–140.
Principe, J. C., Rathie, A., e Kuo, J. M. (1992). Prediction of chaotic
time series with neural networks and the issue of dynamic modeling.
International Journal of Bifurcation and Chaos, 2(4):989–996.
Rodrigues, G. G. (1996). Identificacao de sistemas dinamicos nao-lineares
utilizando modelos NARMAX polinomiais - aplicacao a sistemas reais.
Belo Horizonte: Universidade Federal de Minas Gerais. (Dissertacao de
Mestrado, PPGEE).
Rosenstein, M. T., Collins, J. J., e de Luca, C. J. (1993). A practical
method for calculating largest lyapunov exponents from small data sets.
Physica D, 65(1–2):117–134.
116 Referencias Bibliograficas
Ruelle, D. e Takens, F. (1971). On the nature of turbulence. Communi-
cations in Mathematical Physics, 20:167–192.
Russi (2002). Estudo de Um Modelo Dinamico Para Avaliacao Fısica do
Corpo Humano. Universidade Paulista. (Dissertacao de Mestrado).
Sano, M. e Sawada, Y. (1985). Measurement of the lyapunov spectrum
from a chaotic time series. Physical Review Letters, 55(10):1082–1085.
Shannon, C. E. (1948). A mathematical theory of communication. The
Bell System Technical Journal, 27(1):379–423 e 623–656.
Shinbrot, T., Grebogi, C., Wisdom, J., e York, J. A. (1992). Chaos in a
double pendulum. Am. J. Phys., 60(6):491–498.
Skeldon, A. C. (1994). Dynamics of a parametrically excited double pen-
dulum. Physica D, 75:541–558.
Smith, H. J. T. e Blackburn, J. A. (1989). Chaos in a parametrically
damped pendulum. Physical Review A, 40(8):4708–4715.
Stachowiak, T. e Okada, T. (2006). A numerical analysis of chaos in the
double pendulum. Chaos, Solitons and Fractals, 29:417–422.
Takagi, T. e Sugeno, M. (1985). Fuzzy identification of systems and its
application to modeling and control. IEEE Transactions on Systems,
Man & Cibernetics, 15(1):116–132.
Takens, F. (1981). Detecting strange attractors in turbulence. Lecture
Notes in Mathematics, 898:366–381.
Volterra, V. (1930). Theory of functions. Blackie and Sons.
Wiener, N. (1958). Nonlinear problems in random theory. In Wiley, J.
and Sons, New York.
Wigren, T. (1993). Recursive prediction error identification using nonli-
near Wiener model. Automatica, 29(4):1011–1025.
Wolf, A., Swift, J. B., Swinney, H. L., e Vastano, J. A. (1985). Determining
lyapunov exponents from a time series. Physica D, 16:285–317.
Zadeh, L. A. (1965). Fuzzy sets. Information and Control, 8:338–353.
Referencias Bibliograficas 117
Zadeh, L. A. (1973). Outline of a new approach to the analysis of complex
systems and decision processes. IEEE Transactions on Systems, Man
& Cibernetics, 3:28–44.
Zhu, Q. M. e Billings, S. A. (1991). Recursive parameter estimation for
nonlinear rational models. J. Syst. Eng., 1:63–76.
Zhu, Q. M. e Billings, S. A. (1993). Parameter estimation for stochastic
nonlinear rational models. International Journal of Control, 57(2):309–
333.
Anexo A
Rotinas Computacionais
Neste capıtulo, sao apresentadas as principais rotinas utilizadas na obten-
cao dos modelos fuzzy NARX TS. Tais rotinas, implementadas utilizando-
se o software Matlab, sao descritas a seguir.
A.1 fmclust
fmclust identifica modelos MIMO estaticos ou dinamicos a partir de da-
dos de entrada e saıda. Os agrupamentos fuzzy sao obtidos a partir do
algoritmo de Gustafson e Kessel.
S intaxe :
[FM, part ] = fmclust (DAT,STR, out )
Parametros de entrada :
DAT e uma e s t r u tu r a que apresenta os s egu in t e s campos :
U, Y . . . matr izes de entrada e sa ıda , r espect ivamente
Ts . . . tempo de amostragem ( opc ional , d e f au l t =1)
NomeArquivo . . . nome do arquivo de dados ( opc iona l )
STR e uma e s t r u tu r a com os s egu in t e s campos p r i n c i p a i s :
c . . . numero de r eg r a s ( c l u s t e r s ) por sa ı da
m . . . expoente de f u z z i f i c a c a o ( d e f au l t =2)
t o l . . . t o l e r a n c i a de termino ( d e f au l t =0 ,01)
seed . . . va lo r a l e a t o r i o i n i c i a l para a pa r t i c a o fuzzy
( d e f au l t = sum(100∗ clock ) )
ante . . . t ipo de antecedente : 1 − espaco produto de FP;
2 − pro j e c a o de FP
cons . . . t ipo de est imac ao dos consequentes :
120 Anexo
1 − MQ Global ; 2 − MQP Local ; 3 − MQ Total
ny . . . maximo at raso em Y ( de f au l t =0)
nu . . . maximo at raso em U ( de f au l t =1)
nd . . . a t r a so de t ran spor te ( d e f au l t =0)
out r ep r e s en ta o numero de s a ı d a s a serem cons t ru ıdas
( d e f au l t=todas )
Parametros de sa ı da :
FM e uma e s t r u tu r a que contem todos os parametros do
modelo fuzzy i d e n t i f i c a d o . Veja fmstruct
part e uma e s t r u tu r a que contem a pa r t i c a o fuzzy
( c ) Robert Babuska , Stanimir Mollov 1997−1999
Anexo 121
A.2 fmsim
fmsim simula os modelos identificados.
S intaxe :
[Ym, q ,DOF, Yl ,Ylm ] = fmsim (U,Y,FM,Ymin ,Ymax, show ,H)
Parametros de entrada :
U, Y . . . matr izes de entrada e sa ıda , r espect ivamente
( os dados de sa ı da sao n e c e s s a r i o s para
i n i c i a l i z a c a o e para comparacao )
FM . . . e s t r u tu r a que contem todos os parametros do
modelo fuzzy i d e n t i f i c a d o
Ymin . . . l im i t e i n f e r i o r para s imula c ao da sa ı da
( opc iona l )
Ymax . . . l im i t e sup e r i o r para s imula c ao da sa ı da
( opc iona l )
show . . . 0 − sem g r a f i c o de s imula c ao ;
1 − g r a f i c o on l i n e ;
2 − g r a f i c o no f i n a l da s imula c ao ; ( d e f au l t =1)
H . . . 1 − s imula c ao de um passo a f r e n t e
se nao f o r n e c i d o − s imula c ao l i v r e ( d e f au l t )
Parametros de sa ı da :
Ym . . . s a ı da do modelo simulado
q . . . ı n d i c e de desempenho baseado na va r i a n c i a
DOF . . . fun c o e s de p e r t i n e n c i a
Y1 , Y1m . . . modelos l o c a i s
( c ) Robert Babuska , Stanimir Mollov 1997−1999
122 Anexo
A.3 fmstruct
fmstruct e a estrutura utilizada para armazenar os parametros dos mo-
delos fuzzy identificados pela rotina fmclust.
FM e uma e s t r u tu r a que apresenta os s egu in t e s campos :
Ts tempo de amostragem
ni numero de entradas
no numero de s a ı d a s
N numero de amostras u t i l i z a d a s na
i d e n t i f i c a c a o
t o l t o l e r a n c i a para o termino da gera c ao
dos agrupamentos
seed va lo r a l e a t o r i o i n i c i a l para a pa r t i c a o
fuzzy
ny maximo at raso em Y
nu maximo at raso em U
nd atraso de t ran spor te
ante t ipo de antecedente
cons t ipo de consequente
c numero de agrupamentos
m expoente de f u z z i f i c a c a o
r l s matr iz de r eg r a s
mfs matr iz de fun c o e s de p e r t i n e n c i a
th parametros consequentes
s desv io padrao dos parametros consequentes
V cen t ros dos agrupamentos
P matr iz de cova r i a n c i a do agrupamento
zmin minimo de cada coluna da matr iz de dados
zmax maximo de cada coluna da matr iz de dados
InputName nomes das v a r i a v e i s de entrada ( c e l l array )
OutputName nomes das v a r i a v e i s de sa ı da ( c e l l array )
( c ) Robert Babuska 1997
Anexo 123
A.4 plotmfs
plotmfs exibe as funcoes de pertinencia.
S intaxe :
p lotmfs (mfs , opt , f i g )
Parametros de entrada :
mfs . . . pode s e r um array numerico , um c e l l array ou
a e s t r u tu r a do modelo fuzzy (FM)
opt . . . u t i l i z a d o para d e f i n i r as op c oes da f i g u r a
f i g . . . numero da f i g u r a ( d e f au l t = 1)
( c ) Robert Babuska 1998
124 Anexo
A.5 fm2tex
fm2tex escreve as informacoes contidas na estrutura FM em um arquivo
LATEX.
S intaxe :
fm2tex (FM, f i l ename )
Parametros de entrada :
FM . . . e s t r u tu r a do modelo fuzzy (FM)
f i l ename . . . nome do arquivo LATEX a s e r gerado
( c ) Robert Babuska , Stanimir Mollov 1997−1999
Anexo 125
A.6 Exemplo
A seguir, e apresentado um exemplo de utilizacao das rotinas anterior-
mente citadas. Tal exemplo foi baseado na rotina de identificacao utilizada
neste trabalho.
load exemplo % carrega os dados
% Dados para i d e n t i f i c a c a o
u = zeros ( 500 , 1 ) ; % apesar de o s i s tema ser autonomo ,
% inc l u i −se um ve tor de ze ros como
% entrada , a fim de se e v i t a r e r ros
% na ro t ina ”fmc lu s t ”
y = y ( 1 : 5 0 0 ) ;
% Dados para va l i dacao
v = y (501 :end ) ;
% Estru tura dos s i n a i s de entrada e saida
DAT.U = u ;
DAT.Y = y ;
% Estru tura de parametros da funcao ” fmc lu s t ”
STR. c = 10 ; % numero de c l u s t e r s ( reg ras )
STR.m = 4 ; % parametro de f u z z i f i c a c a o
STR. t o l = 0 . 0 1 ; % to l e r an c i a de termino
STR. ante = 2 ; % t i po de antecedente
STR. cons = 2 ; % t i po de consequente
STR.Ny = 8 ; % maximo at raso em y
STR.Nu = 0 ; % maximo at raso em u
STR.Nd = 0 ; % atraso de t r an spor t e
% Calcu lo do modelo Fuzzy
[FM] = fmclust (DAT,STR) ;
% Simula e p l o t a modelo
figure (1 )
[Ym] = fmsim ( [ ] , v ,FM, [ ] , [ ] , 2 ) ;
126 Anexo
% Funcoes de pe r t i n enc i a (membership f unc t i on s )
p lotmfs (FM, [ ] , 2 )
% Exporta o modelo para um arqu ivo Latex
fm2tex (FM, ’identificacao_fuzzy.tex’ )
Car los Renato 2008−2009