jos´e lima luz netto - unicamp
TRANSCRIPT
UNIVERSIDADE ESTADUAL DE CAMPINAS
Faculdade de Engenharia Mecanica
Jose Lima Luz Netto
Controle Cooperativo H2 e H∞ Via Rede de Comunicacao:
Teoria e Implementacao Pratica em Pendulos Invertidos
CAMPINAS2018
Jose Lima Luz Netto
Engenheiro Mecanico - FEM/UNICAMP (2017)
Controle Cooperativo H2 e H∞ Via Rede de Comunicacao:
Teoria e Implementacao Pratica em Pendulos Invertidos
Dissertacao de Mestrado apresentada a Facul-dade de Engenharia Mecanica da UniversidadeEstadual de Campinas como parte dos requisi-tos exigidos para a obtencao do tıtulo de Mestreem Engenharia Mecanica, na Area de Mecanicados Solidos e Projeto Mecanico.
Orientadora: Profa. Dra. Grace Silva Deaecto
ESTE EXEMPLAR CORRESPONDE A VERSAOFINAL DA DISSERTACAO DEFENDIDA PELOALUNO JOSE LIMA LUZ NETTO, E ORIENTADAPELA PROFA. DRA. GRACE SILVA DEAECTO.
CAMPINAS2018
Agência(s) de fomento e nº(s) de processo(s): Não se aplica.
Ficha catalográficaUniversidade Estadual de Campinas
Biblioteca da Área de Engenharia e ArquiteturaLuciana Pietrosanto Milla - CRB 8/8129
Luz Netto, José Lima, 1992-L979c LuzControle cooperativo H2 e Hinf via rede de comunicação : teoria e
implementação prática em pêndulos invertidos / José Lima Luz Netto. –Campinas, SP : [s.n.], 2018.
LuzOrientador: Grace Silva Deaecto.LuzDissertação (mestrado) – Universidade Estadual de Campinas, Faculdadede Engenharia Mecânica.
Luz1. Sistemas com comutação. 2. Sistemas de controle por realimentação. 3.Desigualdades matriciais lineares. I. Deaecto, Grace Silva, 1983-. II.Universidade Estadual de Campinas. Faculdade de Engenharia Mecânica. III.Título.
Informações para Biblioteca Digital
Título em outro idioma: H2 and Hinf cooperative switched control through communicationnetwork : theory and practical implementation in inverted pendulumsPalavras-chave em inglês:Switched systemsFeedback control systemsLinear matrix inequalitiesÁrea de concentração: Mecânica dos Sólidos e Projeto MecânicoTitulação: Mestre em Engenharia MecânicaBanca examinadora:Grace Silva Deaecto [Orientador]Ricardo Coração de Leão Fontoura de OliveiraJean Marcos de Souza RibeiroData de defesa: 23-04-2018Programa de Pós-Graduação: Engenharia Mecânica
UNIVERSIDADE ESTADUAL DE CAMPINAS
FACULDADE DE ENGENHARIA MECANICA
COMISSAO DE POS-GRADUACAO EM ENGENHARIA
MECANICA
DEPARTAMENTO DE MECANICA COMPUTACIONAL
DISSERTACAO DE MESTRADO ACADEMICO
Controle Cooperativo H2 e H∞ Via Rede de Comunicacao:
Teoria e Implementacao Pratica em Pendulos Invertidos
Autor: Jose Lima Luz NettoOrientadora: Grace Silva Deaecto
A Banca Examinadora composta pelos membros abaixo aprovou esta Dissertacao:
Profa. Dra. Grace Silva Deaecto, PresidenteFaculdade de Engenharia Mecanica - UNICAMP
Prof. Dr. Ricardo Coracao de Leao Fontoura de OliveiraFaculdade de Engenharia Eletrica e de Computacao - UNICAMP
Prof. Dr. Jean Marcos de Souza RibeiroFaculdade de Engenharia - UNESP - Campus de Ilha Solteira
A Ata da defesa com as respectivas assinaturas dos membros encontra-se no processo de vidaacademica do aluno.
Campinas, 23 de Abril de 2018.
Agradecimentos
Antes de mais nada, e com muita alegria que gostaria de agradecer aos meus pais, JoaoLima e Maria de Lourdes. O imenso amor, apoio e dedicacao na educacao de seus filhostornou-me a pessoa que sou e, sem duvida, foi o fator mais relevante para o desenvolvimentodeste trabalho. A minha irma, Gabriela, pelo companheirismo e amizade em todas as etapasda minha caminhada.
Agradeco minhas avos Maria e Santinha pela ternura e carinho. Tambem ao meu padri-nho, Samuel, pelos conselhos e constante presenca no meu crescimento e amadurecimento. Asminhas tias Cristina e Dolores, pelos ensinamentos e aos meus primos Murilo, Junior, Thiagoe Bruna pela convivencia e momentos de descontracao. Assim como meus demais familiares,todos foram essenciais no meu aprendizado.
Meu amoroso obrigado a Bianca, pela paciencia, carinho e apoio na totalidade deste tra-balho, cujos conselhos me deram forcas para superar as duvidas e momentos difıceis.
A minha orientadora, professora Grace S. Deaecto, pelos ensinamentos e companheirismo.Sua imensuravel contribuicao tornou viavel a finalizacao deste projeto e ensinou-me, peloexemplo, que a dedicacao e amor pela profissao sao fatores fundamentais para a realizacaoprofissional e pessoal. Agradeco ao privilegio da oportunidade, por sempre acreditar no meupotencial e pelos ensinamentos que levarei para a vida.
Sou grato a todos os meus colegas de graduacao e pos-graduacao, por compartilhar osdesafios e recompensas desta caminhada. Em especial, gostaria de deixar meu muito obrigadoa todos os irmaos que fiz na Republica TicoTuco. Foram sete anos de convivencia que, semduvida, contribuıram para a conclusao desta dissertacao e para momentos inesquecıveis emminha vida. Tambem, aos meus amigos de laboratorio, Lucas e Helder, pelas discussoes, con-versas, paciencia e companhia.
Resumo
LUZ NETTO, Jose Lima. Controle Cooperativo H2 e H∞ Via Rede de Comunicacao: Teoria
e Implementacao Pratica em Pendulos Invertidos, Campinas: Faculdade de Engenharia Me-
canica, Universidade Estadual de Campinas, 2018. Dissertacao (Mestrado).
Esta dissertacao trata da sıntese e implementacao pratica do controle cooperativo, via rede
de comunicacao, de um conjunto de sistemas lineares e invariantes no tempo. Cada um deles
representa a dinamica de um pendulo invertido, acoplado a um carro, atuado por um motor
de corrente contınua, que se move sobre um trilho. A ideia e sintetizar o esforco de controle
a ser enviado atraves da rede para o carro, de forma a manter o pendulo na posicao vertical
para cima. O projeto de controle leva em conta que o canal de comunicacao apresenta largura
de faixa limitada e que, a cada intervalo de tempo, apenas um dos sistemas recebe o sinal de
controle atualizado, enquanto os demais mantem a informacao previamente recebida. Um dos
benefıcios desta polıtica de controle e evitar o congestionamento da rede dificultando, por-
tanto, a perda de pacotes no canal de comunicacao. Assim, um dos nossos principais objetivos
e determinar uma estrategia dinamica de distribuicao dos recursos da rede que permite asse-
gurar estabilidade, bem como otimizar ındices de desempenho H2 e H∞. Esta estrategia atua
como um coordenador, gerenciando o envio dos sinais de controle entre os sistemas e, mate-
maticamente, e representada por uma regra de comutacao. Inicialmente, o sistema mecanico
e analisado, modelado e identificado atraves de tecnicas simples de identificacao de sistemas.
Com um modelo adequado, o projeto da estrategia de controle com comutacao, baseado em
desigualdades de Lyapunov-Metzler generalizadas, e realizado. Por fim, a tecnica de controle
proposta e implementada. Os resultados experimentais obtidos mostram a eficiencia da meto-
dologia de controle desenvolvida.
Palavras-chave: sistemas com comutacao, sistemas de controle por realimentacao, desi-
gualdades matriciais lineares
Abstract
LUZ NETTO, Jose Lima. H2 and H∞ Cooperative Switched Control Through Communication
Network: Theory and Practical Implementation in Inverted Pendulums, Campinas: School of
Mechanical Engineering, University of Campinas, 2018. Master’s Thesis.
This master thesis treats the control design and practical implementation of switched
cooperative networked control of a set of linear time invariant systems. Each of them represents
the dynamics of a pendulum mounted on a motor-driven car that moves on a trail. The idea
is to synthesize the control effort to be transmitted through the network to act in car in
order to maintain the pendulum in the inverted vertical position. The control design takes
into account that the communication network presents limited bandwidth and that, at each
instant of time, only one of the systems is allowed to receive the updated control signal, while
the others must remain with the previously received information. Hence, our main goal is to
design a cooperative resource sharing dynamic strategy assuring stability as well as H2 and
H∞ performance indexes. This strategy acts as a coordinator managing the sending of control
signals among the systems and is mathematically represented by a switching rule. Initially, the
mechanical system is analyzed, modeled and identified in a simple and precise manner. With
a suitable model, the switching control conception and the technique, which is based on the
solution of generalized Lyapunov-Metzler inequalities, are presented. Finally, experimental
results and simulations show the efficiency of the adopted control methodology.
Keywords: switched systems, feedback control systems, linear matrix inequalities.
Lista de Figuras
1.1 Arquitetura de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.1 Sistema IP02, retirado de Quanser R©, User Manual 2012 . . . . . . . . . . . . 33
3.2 Diagrama do conjunto carro-pendulo . . . . . . . . . . . . . . . . . . . . . . . 34
3.3 Resposta do sistema para entrada de onda quadrada - E.IP02 No1 . . . . . . . 40
3.4 Resposta do sistema para entrada de onda quadrada - E.IP02 No2 . . . . . . . 40
3.5 Resposta do conjunto carro-motor . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.6 Deslocamento angular do pendulo . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.7 Comparacao do sistema para onda quadrada - E.IP02 No 1 . . . . . . . . . . . 47
3.8 Comparacao do sistema para onda quadrada - E.IP02 No 2 . . . . . . . . . . . 48
4.1 Resposta do conjunto carro-motor para controle H2 . . . . . . . . . . . . . . . 64
4.2 Diagrama do conjunto carro-pendulo com influencia do vento . . . . . . . . . . 65
4.3 Montagem do experimento de perturbacao por rajada de vento . . . . . . . . . 66
4.4 Resposta do conjunto carro-motor para controle H∞ . . . . . . . . . . . . . . . 68
Lista de Sımbolos
I - Matriz identidade.N - Conjunto dos numeros naturais.Z - Conjunto dos numeros inteiros.R - Conjunto dos numeros reais.R
m×n - Conjunto das matrizes reais de dimensao m× n.K - Conjunto dos N numeros naturais positivos 1, · · · , N.F (s) - Transformada de Laplace da funcao f(t).F (z) - Transformada Z da funcao f [k].L· - Operador transformada de Laplace aplicado a funcao f(t).Z· - Operador transformada Z aplicado a funcao f [k].‖ξ‖22 - Norma ao quadrado de uma trajetoria ‖ξ‖22 =
∫∞
0ξ(t)′ξ(t)dt para o caso
contınuo ou ‖ξ‖22 =∑∞
0 ξ[k]′ξ[k] para o caso discreto.L2 - Conjunto de todas as trajetorias ξ(t) no caso contınuo ou ξ[k] no caso
discreto tais que ‖ξ‖2 < ∞.U ′ - Transposto da matriz real U .U(jω)∗ - Conjugada da matriz complexa U(jω).P > (≥)0 - Matriz P simetrica e (semi-)definida positiva.P < (≤)0 - Matriz P simetrica e (semi-)definida negativa.diagU, V - Matriz bloco diagonal formada pelas matrizes U e V .tr(U) - Traco da matriz quadrada U .• - Bloco simetrico de uma matriz simetrica.
Indice
1 Introducao 13
1.1 Descricao sumaria dos capıtulos . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 Conceitos Fundamentais 17
2.1 Sistemas dinamicos lineares e invariantes no tempo . . . . . . . . . . . . . . . 17
2.2 Estabilidade de sistemas dinamicos . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Norma H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.1 Sistemas a tempo contınuo . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.2 Sistemas a tempo discreto . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Norma H∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.1 Sistemas a tempo contınuo . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.2 Sistemas a tempo discreto . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.5 Sistema discreto equivalente . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.6 Sistemas com comutacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.7 Consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Modelagem e Identificacao 32
3.1 Descricao do sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2 Equacionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3 Linearizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Representacao de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.5 Validacao do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.6 Consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4 Controle Cooperativo H2 e H∞ 50
4.1 Formulacao do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.2 Controle H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.2.1 Criterio de desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2.2 Controle via realimentacao de estado . . . . . . . . . . . . . . . . . . . 56
4.3 Controle H∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3.1 Criterio de desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.3.2 Controle via realimentacao de estado . . . . . . . . . . . . . . . . . . . 60
4.4 Resultados experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4.1 Controle H2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4.2 Controle H∞ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.5 Consideracoes finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5 Conclusoes e Perspectivas 70
13
CAPITULO 1
Introducao
A demanda por um mundo cada vez mais integrado e conectado produz a urgencia no
desenvolvimento de ferramentas mais eficientes na transmissao e no tratamento de dados. O
conceito de “Internet das Coisas” e bastante atual e compreende a comunicacao e controle
de diferentes dispositivos que visam proporcionar um melhor desempenho ao usuario. Neste
contexto, o controle via rede de comunicacao ganha destaque, pois permite a interacao simul-
tanea de um numero finito de sistemas, em que sinais de sensores, controladores e atuadores
sao transmitidos via canais de rede compartilhados dispondo da flexibilidade do trafico de
informacoes entre seus componentes.
Desta forma, durante o projeto de controle e importante levar em conta fenomenos que
podem ocorrer durante a transmissao e que sao intrınsecos da rede de comunicacao, tais
como: limitacao da largura de faixa, perda de pacotes de dados, atraso e erros de quantiza-
cao. Estes aspectos, que sao tradicionalmente estudados em teoria de comunicacao, se nao
forem considerados na malha de controle, podem piorar o desempenho do sistema contro-
lado, levando-o inclusive a instabilidade. As referencias (HESPANHA; NAGHSHTABRIZI;
XU, 2007) e (WANG; LIU, 2008) fornecem embasamento teorico e apontam os principais de-
safios cientıficos a serem superados sobre controle via rede de comunicacao. Neste contexto,
o estudo de sistemas com dados amostrados ganhou importancia especial, pois eles permitem
modelar a limitacao da largura de faixa no canal de comunicacao, veja (SOUZA et al., 2014).
As referencias (MAZO; TABUADA, 2008) e (MENG; CHEN, 2014) tambem sao importantes
pois apresentam estrategias de auto acionamento1 e acionamento por eventos2, normalmente
utilizadas para reduzir o consumo de recursos de transmissao do sinal de controle pela rede.
Outro tema de grande interesse atual e o estudo sobre sistemas com comutacao. Estes sao
definidos por um numero finito de subsistemas e uma regra de comutacao, que seleciona a
cada instante de tempo um deles. Esta regra pode ser arbitraria, exercendo o papel de uma
perturbacao externa, ou uma variavel de controle que, quando adequadamente projetada, pode
1do ingles self-triggering2do ingles event-triggering
14
assegurar estabilidade e melhorar o desempenho do sistema global. Nosso interesse e estudar
o segundo caso, no qual a regra e uma variavel de controle a ser determinada. As referencias
(DECARLO et al., 2000), (HESPANHA; MORSE, 2002), (SHORTEN et al., 2007) e os livros
(LIBERZON, 2012) e (SUN, 2006) sao importantes para iniciar o estudo do tema. No contexto
de controle em rede, as estrategias baseadas em comutacao ja foram utilizadas em (DAI; LIN;
GEE, 2009) e (DONKERS et al., 2009) para alocar o acesso a rede de forma a prevenir colisao
de informacoes no meio compartilhado.
Nesta dissertacao, nosso objetivo e tratar o controle cooperativo de varios sistemas lineares
e invariantes no tempo (LIT) controlados atraves de uma rede de comunicacao com largura de
faixa limitada. A Figura 1.1 apresenta o esquema da arquitetura de controle a ser adotada.
Nesta estrutura, as plantas recebem o sinal de controle que e transmitido pela rede. De
Planta 1
· · ·
· · ·
Planta N
x1 xNu1
G1
z1 zN
GN
C1 CN
uN
σ
x1, · · · , xN
uσ
Rede de Comunicacao
Coordenador
Controle 1 Controle N
Computador Central
sensorsensor atuadoratuador
Figura 1.1: Arquitetura de controle
forma a evitar perda de pacote de dados, bastante comum quando ha congestionamento de
informacao, supomos que a cada intervalo de tempo apenas o sinal de controle enviado a uma
das plantas ocupa o canal de comunicacao. Assim, apenas esta planta recebe o sinal de controle
atualizado, enquanto que as outras mantem a informacao previamente recebida. Alem disso,
o sinal atualizado se mantem constante durante um certo intervalo de tempo, escolhido de
tal forma a respeitar a largura de faixa do canal de comunicacao. A escolha de qual planta
recebe a informacao atualizada e feita por um coordenador, representado matematicamente
pela regra de comutacao. O controle global e responsavel por assegurar estabilidade e um
custo garantido de desempenho.
1.1. Descricao sumaria dos capıtulos 15
Mais especificamente, nesta dissertacao, desejamos realizar o projeto conjunto de ganhos
de realimentacao de estado, importantes para sintetizar a lei de controle u(·), e da logica do
coordenador σ(·) de forma a garantir estabilidade do sistema global. Dois criterios de desem-
penho sao adotados. O primeiro e inspirado na norma H2 de sistemas dinamicos, enquanto
que o segundo e inspirado na norma H∞. Como ficara claro em seguida, a teoria desenvolvida
considera resultados importantes sobre controle com dados amostrados, usado para modelar
a limitacao da largura de faixa do canal de comunicacao, e controle com comutacao, usado
para projetar a logica do coordenador. Alem disso, conta com uma funcao de Lyapunov do
tipo mınimo especial que permite concatenar o comportamento de todos os sistemas LIT ao
mesmo tempo viabilizando, assim, a estabilidade global do conjunto.
A teoria e validada experimentalmente atraves do controle cooperativo de duas estacoes
de trabalho IP02 do fabricante Quanser, que consiste em um pendulo invertido acoplado a um
carro que se move sobre um trilho, (QUANSER, 2012). Este sistema apresenta caracterısticas
interessantes que podem ser claramente observadas, por exemplo, no diciclo segway, que e um
sistema de transporte muito utilizado atualmente para turismo e para esquemas de seguranca
no mundo todo. O seu modelo matematico e nao-linear e muito utilizado em livros didaticos
de graduacao e pos-graduacao para ilustrar aspectos importantes sobre teoria de controle
de sistemas dinamicos. Esta dissertacao apresenta a modelagem matematica de ambas as
estacoes, a identificacao de seus parametros e o controle cooperativo considerando as tecnicas
de projeto aqui desenvolvidas. Os resultados relacionados ao controle cooperativo H2 estao
disponıveis em (LUZ NETTO et al., 2017). Enquanto que as referencias (EGIDIO; LUZ
NETTO; DEAECTO, 2018b) e (EGIDIO; LUZ NETTO; DEAECTO, 2018a) apresentam
resultados sobre o controle cooperativo H∞.
1.1 Descricao sumaria dos capıtulos
Esta dissertacao esta dividida em cinco capıtulos, que sao sumariamente descritos a seguir:
• Capıtulo 1: Neste capıtulo, introduzimos o problema que sera tratado nesta disserta-
cao, enfatizando a sua importancia, principalmente, no contexto de controle via rede de
comunicacao que, junto com a “Internet das Coisas”, compoem um dos assuntos mais
estudados atualmente pela comunidade cientıfica de controle e computacao.
• Capıtulo 2: Este capıtulo apresenta uma revisao sobre conceitos fundamentais relacio-
nados a sistemas dinamicos. Inicialmente, sao apresentados o criterio de estabilidade de
Lyapunov e o calculo de normas H2 e H∞ de sistemas lineares e invariantes no tempo.
Posteriormente, alguns topicos relacionados a sistemas com dados amostrados e sistemas
com comutacao sao discutidos, pois serao muito utilizados para a obtencao dos nossos
resultados principais.
1.1. Descricao sumaria dos capıtulos 16
• Capıtulo 3: Neste capıtulo, realizamos a modelagem fısica do sistema mecanico IP02
da Quanser bem como a identificacao de seus parametros, principalmente daqueles que
sofrem variacao devido a fatores externos, como por exemplo, desgaste dos equipamen-
tos e alteracao do coeficiente de atrito viscoso devido ao ambiente onde e realizado o
experimento. Discutimos e validamos o modelo que sera utilizado no capıtulo seguinte
para o projeto de controle.
• Capıtulo 4: Neste capıtulo, obtemos as condicoes para o projeto de controle cooperativo
H2 e H∞ de varios sistemas LIT atraves de rede de comunicacao. Aplicamos o resultado
no controle das duas estacoes de trabalho IP02 da empresa Quanser, modeladas e iden-
tificadas no capıtulo anterior. Como ficara claro, os resultados experimentais mostram
a eficiencia e a validade da teoria desenvolvida nesta dissertacao.
17
CAPITULO 2
Conceitos Fundamentais
Neste capıtulo, sao apresentados alguns conceitos basicos sobre analise de sistemas dina-
micos. Inicialmente, e realizada uma breve discussao sobre sistemas lineares e invariantes no
tempo, caracterizando-os em termos da sua representacao em espaco de estado e sua funcao
de transferencia, para os domınios de tempo contınuo e discreto. O estudo de estabilidade
em termos do criterio de Lyapunov e o calculo de normas H2 e H∞ sao tambem abordados.
Por fim, sao fornecidos alguns resultados recentes sobre sistemas com dados amostrados e
sistemas com comutacao, que sao essenciais para o desenvolvimento do tema principal desta
dissertacao.
2.1 Sistemas dinamicos lineares e invariantes no tempo
Um sistema linear e invariante no tempo (LIT) pode ser representado em espaco de estado
na formax(t) = Ax(t) +H w(t), x(0) = 0
z(t) = C x(t) +Gw(t)(2.1)
no domınio de tempo contınuo, 0 ≤ t ∈ R, ou na forma
x[k + 1] = Ah x[k] +Hhw[k], x[0] = 0
z[k] = Ch x[k] +Ghw[k](2.2)
no domınio de tempo discreto, 0 ≤ k ∈ Z, em que x ∈ Rnx e o vetor de estado, w ∈
Rnw a entrada exogena e z ∈ R
nz o vetor de saıda controlada. As matrizes (A,H,C,G)
ou (Ah, Hh, Ch, Gh) possuem dimensoes compatıveis e determinam a realizacao em espaco de
estado do sistema. Este e dito estritamente proprio se G = 0 ou Gh = 0, e proprio caso
contrario.
A funcao de transferencia do sistema (2.1), obtida atraves da transformada de Laplace, e
2.2. Estabilidade de sistemas dinamicos 18
dada por
Hwz(s) = C(sI −A)−1H + G (2.3)
e, utilizando a transformada Z, obtemos
Hwz(z) = Ch(zI − Ah)−1Hh +Gh (2.4)
que representa a funcao de transferencia do sistema a tempo discreto (2.2).
2.2 Estabilidade de sistemas dinamicos
O estudo de estabilidade e de fundamental importancia para a analise e o projeto de
controle de sistemas dinamicos. De fato, estabilidade e o atributo mais basico, sendo o primeiro
requisito de projeto em qualquer sistema de controle, (GEROMEL; KOROGUI, 2001). O
objetivo desta secao e introduzir o criterio de estabilidade de Lyapunov para sistemas LIT em
ambos os domınios de tempo. Por ser uma caracterıstica intrınseca, independente da entrada
exogena, vamos considerar o sistema (2.1) com w(t) ≡ 0, ∀t ≥ 0, e o sistema (2.2) com
w[k] ≡ 0, ∀k ∈ N. Alem disso, a definicao de ponto de equilıbrio e um conceito importante e
esta apresentada a seguir.
Definicao 2.2.1 (Ponto de Equilıbrio) O vetor de estado xe ∈ Rnx e ponto de equilıbrio
de um sistema dinamico a tempo contınuo (tempo discreto), se a condicao inicial x(0) = xe
implicar que x(t) = xe para todo t ≥ 0 (x[k] = xe para todo k ∈ N).
Note que se a matriz A do sistema a tempo contınuo, ou I−Ah do sistema a tempo discreto,
for nao singular o unico ponto de equilıbrio do sistema LIT e a origem xe = 0. A definicao de
estabilidade a seguir foi retirada de (KHALIL, 2002).
Definicao 2.2.2 (Estabilidade) O ponto de equilıbrio xe = 0 e dito estavel se, para cada
ǫ ≥ 0, existe δ(ǫ) tal que
1. ‖x(0)‖2 < δ(ǫ) ⇒ ‖x(t)‖2 < ǫ, ∀t ≥ 0, no caso do sistema a tempo contınuo;
2. ‖x(0)‖2 < δ(ǫ) ⇒ ‖x[k]‖2 < ǫ, ∀k ∈ N, no caso do sistema a tempo discreto;
Caso contrario, o sistema e dito instavel. Alem disso, a origem e dita assintoticamente estavel
se for estavel e se, para qualquer condicao inicial,
1. limt→∞
x(t) = 0, no caso do sistema a tempo contınuo.
2. limk→∞
x[k] = 0, no caso do sistema a tempo discreto.
2.2. Estabilidade de sistemas dinamicos 19
Como demonstrado em (KHALIL, 2002), o sistema LIT a tempo contınuo e globalmente
assintoticamente estavel se, e somente se, a matriz A for Hurwitz estavel, ou seja, se possuir
todos os seus autovalores com parte real negativa. Analogamente, para o caso discreto (2.2),
a matriz Ah deve ser Schur estavel, ou seja, apresentar todos os seus autovalores dentro do
cırculo unitario.
Outra maneira de estudar estabilidade de sistemas lineares e atraves da aplicacao do criterio
de Lyapunov. Este criterio define uma funcao v(x(t)) que pode ser interpretada como a
distancia ao quadrado entre um ponto generico da trajetoria x(t) e o ponto de equilıbrio xe = 0.
Se para toda condicao inicial x(0) = x0, a funcao v(x(t)) diminuir e, consequentemente, tender
para zero no decorrer do tempo, entao o ponto de equilıbrio xe e globalmente assintoticamente
estavel. A mesma interpretacao da funcao v(x[k]) pode ser utilizada no caso discreto. Define-se
v(x) como funcao de Lyapunov, aquela que possui as seguintes propriedades, (KHALIL, 2002):
1. v(x) = 0 para x = xe e v(x) > 0 para x 6= xe;
2. v(x) e contınua e diferenciavel em relacao a todas as componentes de x ∈ Rnx (ou apenas
contınua no caso discreto);
3. v(x) e decrescente para todo x 6= xe, ou seja, v(x(t)) ≤ 0, no caso contınuo e v(x[k +
1])− v(x[k]) ≤ 0 no caso discreto para todo x 6= xe.
Embora a definicao apresentada seja a mais geral, estamos interessados em funcoes de
Lyapunov que permitam assegurar estabilidade assintotica global. Neste caso, para assegurar
estabilidade assintotica, a terceira propriedade da definicao deve ficar restrita a funcoes v(x)
estritamente decrescentes, ou seja, v(x(t)) < 0 no caso contınuo, e v(x[k+1])− v(x[k]) < 0 no
caso discreto, para todo x 6= xe. Para levar em conta estabilidade global devemos acrescentar
a exigencia de que v(x) seja ilimitada para todo ‖x‖ ilimitado. O teorema a seguir apresenta o
criterio de Lyapunov para o estudo de estabilidade assintotica global de um sistema dinamico,
veja (KHALIL, 2002) e (SLOTINE; LI, 1991).
Teorema 2.2.1 (Teorema de Lyapunov) Considere um sistema dinamico a tempo contı-
nuo (tempo discreto) autonomo, ou seja, com entrada nula. O ponto de equilıbrio x = xe
e globalmente assintoticamente estavel, se existir uma funcao de Lyapunov v(x) : Rn → R,
ilimitada para ‖x‖ ilimitado, satisfazendo v(x) < 0, ∀x 6= xe (∆v(x) = v(x[k+1])− v(x[k]) <
0, ∀x 6= xe).
Para sistemas LIT uma escolha natural e a funcao de Lyapunov quadratica
v(x) = x′Px (2.5)
2.3. Norma H2 20
com P > 0. Note que ela atende as duas primeiras propriedades de uma funcao de Lyapunov,
alem de ser ilimitada para ‖x‖ ilimitado. Ademais, temos
v(x) = x′Px+ x′P x = x′(A′P + PA)x (2.6)
no caso do sistema (2.1) com w(t) ≡ 0 e
v(x[k + 1])− v(x[k]) = x′[k](A′hPAh − P )x[k] (2.7)
no caso do sistema (2.2) com w[k] ≡ 0. Fazendo A′P +PA < 0 no caso contınuo ou A′hPAh−
P < 0 no caso discreto, temos que as condicoes do Teorema 2.2.1 sao atendidas e, portanto, a
origem xe = 0 e globalmente assintoticamente estavel. Estas desigualdades matriciais lineares1
sao restricoes convexas na variavel P > 0 e, quando factıveis, possuem infinitas solucoes. Para
obtencao de uma unica solucao pode-se resolver a equacao matricial linear, tambem chamada,
equacao de Lyapunov A′P + PA = −Q ou A′hPAh − P = −Q, sendo Q uma matriz simetrica
definida positiva dada. O resultado seguinte expressa o criterio de Lyapunov para sistemas
LIT, veja (GEROMEL; KOROGUI, 2001).
Lema 2.2.1 (Criterio de Lyapunov - Sistemas LIT) O sistema x = Ax (x[k + 1] =
Ahx[k])e globalmente assintoticamente estavel se, e somente se, para uma matriz simetrica
Q > 0 dada, existir uma unica matriz simetrica P > 0 solucao de A′P + PA = −Q
(A′hPAh − P = −Q).
A seguir apresentamos a definicao e o calculo das normasH2 eH∞ para sistemas dinamicos.
2.3 Norma H2
A normaH2 e um importante criterio para analise do desempenho de um sistema dinamico.
A seguir apresentamos a sua definicao e o seu calculo atraves de gramianos e por meio de
desigualdades matriciais lineares, considerando sistemas definidos em ambos os domınios de
tempo, veja (COLANERI; GEROMEL; LOCATELLI, 1997).
2.3.1 Sistemas a tempo contınuo
Considere o sistema (2.1) com funcao de transferencia (2.3). A norma H2 e definida para
todas as funcoes de transferencia racionais, estritamente proprias, analıticas no semi-plano
1do ingles Linear Matrix Inequalities
2.3. Norma H2 21
complexo direito, incluindo o eixo imaginario e e dada por
‖Hwz(s)‖22 =1
2π
∫ ∞
−∞
tr(
Hwz(−jω)′
Hwz(jω))
dω =
∫ ∞
0
tr (hwz(t)′hwz(t)) dt (2.8)
em que a segunda igualdade foi obtida utilizando o Teorema de Parseval, sendo hwz(t) a
resposta ao impulso do sistema, ou seja, hwz(t) = L−1Hwz(s).A integral definida por (2.8) converge se, e somente se, A for Hurwitz estavel e a matriz
G = 0. De fato, para o caso geral, a resposta ao impulso do sistema e dada por
hwz(t) = L−1Hwz(s) = CeAtH +Gδ(t) , ∀t ≥ 0 (2.9)
portanto, de acordo com (2.8) e utilizando (2.9), temos
∫ ∞
0
tr(hwz(t)′hwz(t)) dt = tr
(
H ′
∫ ∞
0
eA′tC ′CeAtdtH
)
+ tr (H ′C ′G) +
+tr(G′CH) +∫∞
0tr(G′G)δ2(t) dt
(2.10)
Uma vez que∫∞
0δ2(t)dt → ∞, para que a norma seja finita, ambos os requisitos mencionados
devem ser atendidos. Logo, utilizando a equacao (2.10), com o auxılio da propriedade de
circularidade do operador traco em que tr(hwz(t)′hwz(t)) = tr(hwz(t)hwz(t)
′), podemos calcular
a norma H2 do sistema de duas maneiras distintas
‖Hwz(s)‖22 = tr(H ′PoH) = tr(CPcC′) (2.11)
na qual Po e Pc sao os gramianos de observabilidade e de controlabilidade, respectivamente,
dados por
Po =
∫ ∞
0
eA′tC ′CeAt dt, Pc =
∫ ∞
0
eAtHH ′eA′t dt (2.12)
E digno de nota que ambos os gramianos podem ser obtidos atraves da resolucao das seguintes
equacoes de Lyapunov, veja (GEROMEL; KOROGUI, 2001)
A′Po + PoA+ C ′C = 0
APc + PcA′ +HH ′ = 0
(2.13)
A observabilidade do par (A,C) e a controlabilidade do par (A,H) sao condicoes necessarias
e suficientes para que os gramianos Po e Pc sejam matrizes simetricas e definidas positivas,
respectivamente.
Para finalizar esta sessao, focaremos no calculo da norma H2 atraves da resolucao de
problemas de otimizacao convexa. O proximo lema, disponıvel em (OLIVEIRA, 1999), e
essencial para atingir este objetivo
2.3. Norma H2 22
Lema 2.3.1 Seja A uma matriz Hurwitz. Se os pares (P1, Q1) e (P2, Q2) satisfazem a equacao
de Lyapunov A′P + PA+Q = 0, entao Q1 > Q2 implica em P1 > P2.
Uma vez que toda solucao definida positiva de A′P + PA + C ′C < 0 satisfaz a equacao
de Lyapunov A′P + PA + C ′C = −V para alguma matriz V > 0, utilizando do Lema 2.3.1,
pode-se concluir que C ′C + V > C ′C e, portanto, P > Po. Assim sendo,
‖Hwz(s)‖22 = tr(H ′PoH) < tr(H ′PH) (2.14)
Entao, a norma H2 do sistema (2.1) pode ser calculada a partir da solucao do problema de
otimizacao convexa
‖Hwz(s)‖22 = infP>0
tr(H ′PH) : A′P + PA+ C ′C < 0 (2.15)
Analogamente, para o gramiano de controlabilidade, e possıvel obter a normaH2 resolvendo-se
‖Hwz(s)‖22 = infP>0
tr(CPC ′) : AP + PA′ +HH ′ < 0 (2.16)
As LMIs (2.15) e (2.16) apresentam duas formulacoes para o calculo da normaH2 via LMIs.
Esta abordagem considera a solucao de problemas de otimizacao convexa, que ja contam na
literatura com diversos algoritmos especializados em resolve-los. A sua grande vantagem,
quando comparada a solucao via gramianos e a possibilidade de generalizar as LMIs para
tratar problemas mais gerais, como por exemplo, projeto de controle via realimentacao de
estado e realimentacao dinamica de saıda, com ou sem restricoes nas matrizes de ganho.
2.3.2 Sistemas a tempo discreto
Considere o sistema (2.2), cuja funcao de transferencia e dada por (2.4). A norma H2
e definida para funcoes de transferencia racionais, analıticas no semi-plano complexo direito
fechado, e e dada por
‖Hwz(z)‖22 =1
2π
∫ 2π
0
tr(Hwz(e−jω)
′
Hwz(ejω)) dω =
∑
k∈N
tr(hwz[k]′hwz[k]) (2.17)
em que a segunda igualdade foi obtida utilizando o teorema de Parseval, sendo hwz[k] a resposta
ao impulso do sistema, ou seja, hwz[k] = Z−1Hwz(z). A relacao definida por (2.17) converge
se, e somente se, Ah for Schur estavel. De fato, considerando que a resposta ao impulso do
2.3. Norma H2 23
sistema e dada por
hwz[k] = Z−1Hwz(z) =
Gh, se k = 0
ChAk−1h Hh, se k ≥ 0
(2.18)
de acordo com (2.17) e utilizando (2.18), temos
∑
k∈R
tr(hwz[k]′hwz[k]) = tr
(
H ′h
∑
k∈N
(A′h)
kC ′hChA
khHh
)
+ tr(G′hGh) (2.19)
que e convergente se, e somente se, Ah for Schur estavel como mencionado anteriormente.
Note que diferente do caso contınuo, o sistema nao precisa ser estritamente proprio para o
calculo da norma. Alem disso, devido a propriedade de circularidade do operador traco, em
que tr(hwz[k]′hwz[k]) = tr(hwz[k]hwz[k]
′), a norma H2 tambem pode ser calculada atraves do
gramiano de controlabilidade, da seguinte forma
‖Hwz(z)‖22 = tr(H ′hPoHh +G′
hGh) = tr(ChPcC′h +GhG
′h) (2.20)
com os gramianos dados por
Po =∑
k∈N
(A′h)
kC ′hChA
kh, Pc =
∑
k∈N
AkhHhH
′h(A
′h)
k (2.21)
que podem ser obtidos atraves da resolucao das seguintes equacoes de Lyapunov (GEROMEL;
KOROGUI, 2001)
A′hPoAh − Po + C ′
hCh = 0
AhPcA′h − Pc +HhH
′h = 0
(2.22)
Podemos notar que toda solucao definida positiva de A′hPAh − P + C ′
hCh < 0 satisfaz
a equacao de Lyapunov A′hPAh − P + C ′
hCh = −V para alguma matriz V > 0. Como
C ′hCh + V > C ′
hCh temos que P > Po e, portanto
‖Hwz(z)‖22 = tr(H ′hPoHh +G′
hGh) < tr(H ′hPHh +G′
hGh) (2.23)
Assim, a normaH2 do sistema (2.2) pode ser calculada a partir da solucao do seguinte problema
de otimizacao convexa
‖Hwz(z)‖22 = infP>0
tr(H ′hPHh +G′
hGh) : A′hPAh − P + C ′
hCh < 0 (2.24)
2.4. Norma H∞ 24
ou, alternativamente, podemos resolver
‖Hwz(z)‖22 = infP>0
tr(ChPC ′h +GhG
′h) : AhPA′
h − P +HhH′h < 0 (2.25)
se desejarmos determina-la em termos do gramiano de controlabilidade. O operador ınfimo e
importante para deixar os lados direito e esquerdo de (2.23) arbitrariamente proximos.
2.4 Norma H∞
A normaH∞ e outro criterio importante para analisar o desempenho de sistemas dinamicos
e esta intimamente ligada a analise de robustez do sistema, veja (COLANERI; GEROMEL;
LOCATELLI, 1997).
2.4.1 Sistemas a tempo contınuo
Seja o sistema (2.1) com funcao de transferencia (2.3). A sua norma H∞ e definida como
‖Hwz(s)‖2∞ = supω∈R
σmaxHwz(jω) (2.26)
em que σmaxHwz(·) e o valor singular maximo da funcao Hwz(·). Esta norma e finita para
funcoes de transferencia Hwz(s) analıticas no semiplano complexo direito, incluindo o eixo
imaginario, e diferente do caso H2 contınuo, nao exige que Hwz(s) seja estritamente propria.
Considerando w(t) pertencente ao conjunto L2, ou seja
∫ ∞
0
w(t)′w(t)dt < ∞ (2.27)
utilizando o Teorema de Parseval, e o fato de que z(s) = Hwz(s)w(s), temos
∫ ∞
0
z(t)′z(t)dt =1
π
∫ ∞
0
z(−jω)′
z(jω)dω
=1
π
∫ ∞
0
w(−jω)′
Hwz(−jω)′
Hwz(jω)w(jω)dω
≤ ‖Hwz(s)‖2∞∫ ∞
0
w(t)′w(t)dt (2.28)
e, portanto, podemos fazer ‖Hwz(s)‖2∞ < ρ se, e somente se ‖z(t)‖22 < ρ‖w(t)‖22. Note que
embora a norma H∞ seja definida no domınio da frequencia, este resultado e importante pois
nos permite calcula-la atraves de funcoes descritas no domınio do tempo.
2.4. Norma H∞ 25
Utilizando a funcao de Lyapunov v(x) = x′Px, P > 0, e impondo
v(x(t)) < −z(t)′z(t) + ρw(t)′w(t), ∀t ≥ 0 (2.29)
para algum ρ > 0, apos a integracao de ambos os lados, de t = 0 a t → ∞ obtemos
v(x(∞))− v(x(0)) < −‖z‖22 + ρ‖w‖22 (2.30)
Note que v(x(∞)) = 0, pois o sistema e assintoticamente estavel, e v(x(0)) = 0, pois x(0) = 0.
Portanto, o lado esquerdo desta desigualdade e nulo e, consequentemente, ‖Hwz(s)‖2∞ < ρ.
Assim, podemos obter a norma H∞, sempre que a desigualdade (2.29) for verificada.
Para o sistema (2.1) temos
v(x(t)) = (x(t)′Px(t) + x(t)′P x(t) + z(t)′z(t)− ρw(t)′w(t))− z(t)′z(t) + ρw(t)′w(t)
=
[
x(t)
w(t)
]′ [
A′P + PA+ C ′C •H ′P +G′C G′G− ρI
][
x(t)
w(t)
]
− z(t)′z(t) + ρw(t)′w(t)
< −z(t)′z(t) + ρw(t)′w(t) (2.31)
em que a desigualdade e obtida sempre que
[
A′P + PA+ C ′C •H ′P +G′C G′G− ρI
]
< 0 (2.32)
Entao, podemos determinar a norma H∞ do sistema (2.1) atraves da solucao do seguinte
problema de otimizacao convexa
‖Hwz(s)‖2∞ = infρ>0,P>0
ρ :
[
A′P + PA+ C ′C •H ′P +G′C G′G− ρI
]
< 0
(2.33)
2.4.2 Sistemas a tempo discreto
Considere o sistema a tempo discreto (2.2) com funcao de transferencia (2.4). A sua norma
H∞ e definida como
‖Hwz(z)‖2∞ = supω∈[0,2π]
σmaxHwz(ejω) (2.34)
Ela e finita para funcoes de transferencia Hwz(z) assintoticamente estaveis. De forma similar
ao caso contınuo, utilizando o Teorema de Parseval, e o fato de que z(z) = Hwz(z)w(z),
podemos calcular a norma H∞ atraves de funcoes descritas no domınio do tempo da seguinte
2.5. Sistema discreto equivalente 26
forma∑
k∈N
(z[k]′z[k] − ρw[k]′w[k]) < 0 (2.35)
em que ‖Hwz(z)‖2∞ < ρ e w[k] ∈ L2. Esta desigualdade pode ser assegurada impondo
∆v(x[k]) = v(x[k + 1])− v(x[k]) < −z[k]′z[k] + ρw[k]′w[k] (2.36)
De fato, note que somando ambos os lados desta desigualdade de k = 0 ate k → ∞ obtemos
v(x[∞])− v(x[0]) < −‖z‖22 + ρ‖w‖22 (2.37)
O lado esquerdo desta desigualdade e nulo, uma vez que v(x[0]) = 0 pois x[0] = 0 e v(x[∞]) = 0
pois o sistema e assintoticamente estavel. Logo impondo (2.36) temos
∆v(x[k])=
[
x[k]
w[k]
]′[
A′hPAh − P + C ′
hCh •H ′
hPAh +G′hCh H ′
hPHh +G′hGh − ρI
][
x[k]
w[k]
]
− z[k]′z[k] + ρw[k]′w[k]
<−z[k]′z[k] + ρw[k]′w[k] (2.38)
que e valida sempre que a seguinte desigualdade
[
A′hPAh − P + C ′
hCh •H ′
hPAh +G′hCh H ′
hPHh +G′hGh − ρI
]
< 0 (2.39)
e verificada. Logo a norma H∞ do sistema (2.2) pode ser calculada atraves do seguinte
problema de otimizacao convexa.
‖Hwz(z)‖2∞ = infρ>0,P>0
ρ :
[
A′hPAh − P + C ′
hCh •H ′
hPAh +G′hCh H ′
hPHh +G′hGh − ρI
]
< 0
(2.40)
2.5 Sistema discreto equivalente
Nesta secao, vamos apresentar um resultado importante no contexto de controle via rede de
comunicacao, principalmente para levar em conta o fato de que, a largura de faixa de um canal
de comunicacao e, geralmente, limitada, veja (SOUZA et al., 2014). Considerando um sistema
a tempo contınuo, amostrado com perıodo de amostragem h > 0, a ideia e obter um modelo
a tempo discreto cuja norma L2 da sua saıda seja identica aquela determinada para a saıda
do sistema amostrado a tempo contınuo. Como a obtencao desta norma nao envolve qualquer
aproximacao, dizemos que o modelo obtido e um sistema discreto equivalente. Utilizando
este modelo, o projeto de controle de um sistema amostrado pode ser realizado totalmente no
2.5. Sistema discreto equivalente 27
domınio do tempo discreto e o controlador obtido aplicado diretamente no sistema a tempo
contınuo original.
Como motivacao, vamos apresentar um problema tıpico de controle via rede de comunica-
cao. Considere o sistema a tempo contınuo
x(t) = Ax(t) +B u(t), x(0) = x0
z(t) = C x(t) +Du(t)(2.41)
em que u(t) ∈ Rnu e a entrada de controle transmitida ao sistema atraves de um canal de
comunicacao. Devido ao limite da largura de faixa do canal, u(t) deve respeitar um perıodo
h > 0 mınimo exigido na transmissao, dentro do qual nao pode haver atualizacao. Desta
forma, a entrada u(t) e modelada como um sinal constante por partes dado por
u(t) = u(tk) = u[k], t ∈ [tk, tk+1) (2.42)
para todo k ∈ N. O tempo entre dois instantes de amostragem sucessivos deve entao respeitar
tk+1 − tk = h > 0. Definindo as matrizes
F =
[
A B
0 0
]
, E =[
C D]
(2.43)
em que F ∈ R(nx+nu)×(nx+nu) e E ∈ R
nz×(nx+nu), o proximo teorema, disponıvel em (SOUZA
et al., 2014) e (CHEN; FRANCIS, 2012), fornece o sistema discreto equivalente a (2.41) no
que diz respeito ao calculo da norma L2 da saıda.
Teorema 2.5.1 Considere o sistema dinamico (2.41), e defina as matrizes (Ah, Bh, Ch, Dh)
de dimensoes compatıveis tais que
eFh =
[
Ah Bh
0 I
]
(2.44)
Q(h) =
∫ h
0
eF′tE ′EeFtdt =
[
C ′h
D′h
][
C ′h
D′h
]′
(2.45)
e o sistema linear a tempo discreto
x[k + 1] = Ah x[k] +Bh u[k], x(0) = x0
z[k] = Ch x[k] +Dh u[k](2.46)
2.5. Sistema discreto equivalente 28
Entao, igualdade a seguir e satisfeita
∫ ∞
0
z(t)′z(t)dt =∑
k∈N
z′[k]z[k] (2.47)
Prova: Disponıvel em (SOUZA, 2012) e (CHEN; FRANCIS, 2012).
Podemos observar que, geralmente, as dimensoes de z(t) e de z[k] nao sao as mesmas. Por
exemplo, pode ocorrer que o lado esquerdo de (2.45) seja uma matriz definida positiva, o que
impoe z[k] ∈ Rnx×nu embora a dimensao da saıda do sistema amostrado seja z(t) ∈ R
nz com
nz ≤ nx < nx + nu.
Neste ponto e importante fazer algumas consideracoes no que se refere ao calculo das
matrizes do sistema a tempo discreto. Note que a dinamica de (2.46) pode ser facilmente
obtida a partir do sistema original atraves do calculo da exponencial de matriz eFh, que por
sua vez e avaliado a partir de tecnicas eficientes e ja disponıveis na literatura, veja (GOLUB;
LOAN, 2012). As matrizes da saıda do sistema a tempo discreto requerem um cuidado maior
pois dependem do calculo da integral
Q(h) =
∫ h
0
eF′tE ′EeFtdt (2.48)
que pode ser obtida a partir de rotinas de integracao numerica, veja (BURDEN; FAIRES, 2001).
Em seguida, utilizando Q(h) podemos calcular Ch e Dh atraves da sua decomposicao em va-
lores singulares. De fato, como Q(h) e simetrica e semidefinida positiva, existem matrizes
U ∈ R(nx+nu)×(nx+nu) unitaria e S ≥ 0 ∈ R
(nx+nu)×(nx+nu) diagonal, tais que
Q(h) = USU ′ = V V ′ (2.49)
em que V = US1/2. Note que a matriz V esta bem definida, uma vez que S ≥ 0. Assim, de
(2.45) e (2.49), temos que[
Ch Dh
]
= V ′ = S1/2U ′ (2.50)
Logo, Ch e Dh sao particoes de V ′, a primeira contendo as primeiras nx colunas e a segunda
as nu restantes. Observe que, como mencionado, as matrizes Ch e Dh possuem nx+nu linhas,
podendo algumas ser nulas. Como ficara claro nos proximos capıtulos, a obtencao do sistema
discreto equivalente sera fundamental para levar em conta o modelo da rede no projeto do
controle cooperativo de varios sistemas a partir do compartilhamento de um unico canal de
transmissao, que e o tema principal desta dissertacao.
2.6. Sistemas com comutacao 29
2.6 Sistemas com comutacao
Sistemas dinamicos com comutacao sao aqueles definidos por um numero finito de sub-
sistemas e uma regra de comutacao que seleciona a cada instante de tempo um deles. Esta
regra pode ser arbitraria, exercendo o papel de uma perturbacao externa, ou uma variavel
de controle que, quando adequadamente projetada, pode assegurar estabilidade e melhorar o
desempenho do sistema global, veja (GEROMEL; DEAECTO; DAAFOUZ, 2013). As refe-
rencias (DECARLO et al., 2000), (HESPANHA; MORSE, 2002), (SHORTEN et al., 2007) e
os livros (LIBERZON, 2012) e (SUN, 2006) sao importantes para iniciar o estudo do tema.
No contexto desta dissertacao, a regra de comutacao assume um papel importante na
alocacao dos recursos da rede de comunicacao para cada um dos sistemas conectados a ela.
Por esta razao, uma revisao sobre resultados recentes envolvendo o seu projeto possui particular
importancia. Considere entao um sistema com comutacao a tempo discreto dado por
x[k + 1] = Ahσ x[k], x(0) = x0
z[k] = Chσ x[k](2.51)
definido para todo k ∈ N, no qual σ e a regra de comutacao que seleciona a cada instante de
tempo um subsistema dentre os N disponıveis. No nosso contexto esta regra σ[·] : N → K e
uma variavel de controle a ser projetada para assegurar estabilidade e desempenho garantido
ao sistema global. Dentre os trabalhos existentes na literatura, veja por exemplo (GERO-
MEL; COLANERI, 2006), (FIACCHINI; JUNGERS, 2014), (FIACCHINI; GIRARD; JUN-
GERS, 2016) e (ZHANG; HU; ABATE, 2012), o primeiro e o mais adequado para os nossos
objetivos e e baseado na seguinte funcao de Lyapunov quadratica por partes do tipo mınimo
v(x) = mini∈K
x′Pix (2.52)
a qual esta associada a regra de comutacao
σ(x) = argmini∈K
x′Pix (2.53)
em que Pi > 0 ∈ Rnx×nx e uma matriz simetrica, definida positiva que deve satisfazer algumas
condicoes a serem apresentadas a seguir. Estas condicoes dependem de uma importante classe
de matrizes de Metzler denotada por M, que consiste de todas as matrizes Π ∈ RN×N , tais
que
πji ≥ 0,
N∑
j=1
πji = 1, ∀i, j ∈ K×K (2.54)
O teorema a seguir, disponıvel em (GEROMEL; COLANERI, 2006), apresenta estas condicoes.
2.7. Consideracoes finais 30
Teorema 2.6.1 Considere o sistema dinamico (2.51). Se existirem matrizes simetricas defi-
nidas positivas Pi, i ∈ K e uma matriz de Metzler Π ∈ M satisfazendo as seguintes desigual-
dades de Lyapunov-Metzler
A′hi
(
N∑
j=1
πjiPj
)
Ahi − Pi + C ′hiChi < 0, i ∈ K (2.55)
entao a regra de comutacao (2.53) faz com que a origem do sistema (2.51) seja um ponto de
equilıbrio globalmente assintoticamente estavel, e a seguinte desigualdade
∞∑
k=0
z[k]′z[k] < mini∈K
x′0Pix0 (2.56)
e satisfeita.
Prova: A prova esta disponıvel em (GEROMEL; COLANERI, 2006).
E importante notar que as condicoes apresentadas no Teorema 2.6.1 nao exigem nenhuma
propriedade de estabilidade das matrizes Ah1, ..., AhN tomadas individualmente. De fato,
para Π ∈ M, uma condicao necessaria para factibilidade das desigualdades de Lyapunov-
Metzler e que cada matriz√πiiAhi, i ∈ K, seja estavel. Entretanto, como 0 ≤ πii ≤ 1, esta
condicao nao recai sobre a matriz Ahi individualmente. Alem disso, as condicoes (2.55) asse-
guram estabilidade inclusive na eventual ocorrencia de modos deslizantes, veja (GALBUSERA
et al., 2012) para maiores detalhes. Outro ponto que deve ser mencionado, e que as condicoes
(2.55) sao nao convexas devido ao produto de variaveis matriciais Pi, i ∈ K,Π e, portanto,
podem ser difıceis de resolver. Para um numero pequeno de subsistemas N ≤ 3, podemos re-
solver estas desigualdades sem dificuldade atraves de busca unidimensional e a solucao de um
conjunto de LMIs. Caso contrario, a literatura apresenta condicoes alternativas mais simples,
porem mais conservadoras que sao convexas a menos de uma variavel escalar. Uma discussao
sobre este ponto pode ser encontrada em (GEROMEL; COLANERI, 2006).
Existem uma serie de aplicacoes desta teoria. Mesmo quando o sistema e LIT, pode-
mos utilizar controle com comutacao para tratar problemas de controle multiobjetivo, em
que o projeto deve atender varios criterios diferentes e possivelmente conflitantes, veja (LUZ
NETTO, 2016).
2.7 Consideracoes finais
Neste capıtulo, apresentamos uma serie de conceitos fundamentais para a analise e o con-
trole de sistemas dinamicos. Alem disso, apresentamos dois resultados recentes relacionados
2.7. Consideracoes finais 31
a sistemas com dados amostrados e com comutacao que serao utilizados conjuntamente nos
proximos capıtulos, para tratar o controle cooperativo de varios sistemas que compartilham o
mesmo canal de comunicacao, tema principal desta dissertacao.
Primeiramente, os conceitos de estabilidade e ponto de equilıbrio foram introduzidos, segui-
dos pela analise de estabilidade via criterio de Lyapunov. Em seguida, definimos os conceitos
de norma H2 e H∞, tanto para sistemas contınuos quanto para discretos no tempo, e apresen-
tamos como podemos calcular estas normas a partir da solucao de um problema de otimizacao
convexa descrito em termos de LMIs. O capıtulo tambem exibiu resultados relacionados a dis-
cretizacao exata de sistemas contınuos com dados amostrados e, por fim, foram apresentados
conceitos basicos importantes de sistemas com comutacao a tempo discreto.
32
CAPITULO 3
Modelagem e Identificacao
Neste capıtulo, nosso objetivo principal e a modelagem e a identificacao dos parametros
de um sistema mecanico, que consiste em um pendulo invertido acoplado a um carro que se
move sobre um trilho. Duas estacoes de trabalho IP02 do fabricante Quanser R©, denotados
por E.IP02 No1 e E.IP02 No2 sao utilizadas. Apos uma descricao detalhada da estacao IP02,
obtemos um conjunto de equacoes diferenciais, tendo como meta a simplicidade das relacoes
matematicas e, ao mesmo tempo, maxima precisao, de forma que as equacoes obtidas descre-
vam de maneira adequada o comportamento dinamico do sistema real. Realizamos entao a
validacao do modelo matematico a partir da comparacao entre as medidas obtidas do sistema
real e as respostas fornecidas pelo modelo com os parametros fısicos fornecidos pelo fabricante.
Sendo observada pequenas discrepancias e, tendo em vista que alguns destes parametros levam
em conta fatores externos como desgaste dos trilhos e o ambiente experimental, utilizamos tec-
nicas simples de identificacao de sistemas para uma melhor estimativa dos parametros fısicos,
obtendo sinais mais satisfatorios e proximos dos valores medidos. Os resultados deste capıtulo
tambem estao disponıveis em (LUZ NETTO et al., 2017) e em (LUZ NETTO, 2016).
3.1 Descricao do sistema
O modelo IP02 do fabricante Quanser R© , mostrado na Figura 3.1, consiste em um solido
carro de alumınio atuado por um motor de corrente contınua de baixa indutancia onde e
acoplado um pendulo com eixo de rotacao perpendicular ao movimento do carro. A montagem
do carro permite apenas a sua translacao sobre um trilho horizontal. A transmissao de potencia
entre o motor e o carro ocorre atraves de uma caixa de transmissao, composta por um conjunto
de engrenagens em montagem planetaria e pinhao-cremalheira, veja a parte direita da Figura
3.1. Este mecanismo permite a transformacao de um movimento rotativo para linear nos
trilhos.
Com a energia recebida do conjunto motor/caixa de transmissao, o carro movimenta o
3.2. Equacionamento 33
Conjunto planetario
Pinhao
Cremalheira
Motor CC
Pivo
Figura 3.1: Sistema IP02, retirado de Quanser R©, User Manual 2012
pendulo de haste cilındrica atraves do ponto de pivotamento proporcionando, assim, um mo-
vimento livre de ate 360o. A seguir, apresentamos a modelagem matematica do sistema.
3.2 Equacionamento
A metodologia utilizada para obtencao das equacoes de movimento tem como base as leis
que regem a dinamica de corpos solidos, para o caso do carro, e as leis de Kirchhoff, para o
motor. A Figura 3.2 mostra as variaveis de interesse e as constantes do sistema carro/pendulo,
com suas respectivas referencias adotadas no modelo.
Motor/caixa de transmissao
Do lado esquerdo da Figura 3.2, apresentamos o diagrama do motor com momento de
inercia Jm, em que Vm e a tensao de entrada, Im e a corrente, Rm a resistencia de armadura,
Lm a indutancia do motor e km a constante de forca contra-eletromotriz. Aplicando a Lei de
Kirchhoff no circuito da Figura 3.2, obtemos
Vm − Rm Im(t)− Lm Im(t)− km θm = 0 (3.1)
em que θm e o angulo de rotacao do motor e kmθm e a forca contra-eletromotriz. Considerando
que a indutancia do motor e desprezıvel, ou seja Lm ≈ 0, tem-se que a corrente eletrica e dada
por:
Im =Vm − kmθm
Rm(3.2)
3.2. Equacionamento 34
Vm
Rm
Im
θm
Lm
Fc
kg
x
y
FcMc
lp
Mp, Jp
θ
xc
Figura 3.2: Diagrama do conjunto carro-pendulo
Por outro lado, temos que o torque gerado pelo motor, que sera transferido a carga, e propor-
cional a corrente Im da seguinte forma:
τm = ηmktIm (3.3)
em que ηm e a eficiencia do motor e kt e a constante de proporcionalidade corrente-torque.
Apos alterado pela caixa de transmissao, com constante de reducao kg e eficiencia ηg, o torque
e responsavel por aplicar a forca
Fc =ηgkgτmrpm
(3.4)
no carro de massa Mc, em que rpm e o raio do pinhao, como pode ser visto no lado di-
reito da figura. As equacoes (3.1)-(3.4) descrevem a dinamica do sistema motor/caixa de
transmissao. Estas equacoes, em conjunto com a transformacao de movimento no mecanismo
pinhao-cremalheira, dado por
θm =kgxc
rpm(3.5)
permitem a obtencao da forca aplicada no carro em funcao da entrada de tensao Vm e da
velocidade xc, do tipo:
Fc =ηg ηm kg ktrpmRm
(
Vm(t)−km kgrpm
xc(t)
)
(3.6)
3.2. Equacionamento 35
E digno de nota que Fc e um parametro importante no estudo do sistema da Figura 3.1, pois
e o elemento que relaciona a dinamica do conjunto carro/pendulo com o movimento do motor.
Carro
Como pode ser observado no lado direito da Figura 3.2, o carro movimenta um pendulo
de massa Mp e esta imerso em um meio responsavel por um atrito viscoso de constantes Bc
e Bp no carro e no pendulo, respectivamente. Os referenciais adotados estao apresentados na
figura. Aplicando o princıpio de D’Alembert, a equacao dinamica do carro na horizontal e
dada por:
Mc xc + Fa + Tx +Bc xc = Fc (3.7)
na qual Tx e a forca causada pela haste do pendulo. A forca inercial da armadura Fa ocorre
devido a acao de rotacao do motor com torque de inercia τm = Jmθm = Jm(kgxc/rpm), sendo
expressa na forma:
Fa =ηg kg τm
rpm=
ηg k2g Jmxc
r2pm(3.8)
Utilizando (3.6) e (3.8), obtemos que a equacao do carro (3.7) torna-se
Meqxc + Beqxc + Tx = AeqVm (3.9)
em que a massa equivalente assume a forma:
Meq = Mc +ηgk
2gJm
r2pm(3.10)
o coeficiente de atrito viscoso equivalente:
Beq = Bc +ηgηmk
2gktkm
r2pmRm(3.11)
e, finalmente, o ganho de atuacao:
Aeq =ηgηmkgktrpmRm
(3.12)
Pendulo
O pendulo possui momento de inercia Jp em relacao ao seu centro de gravidade, que esta
localizado a uma distancia lp do ponto de pivoteamento. O movimento de translacao e da
forma
Mpd2
dt2(xc − lp sen(θ))− Tx = 0 (3.13)
3.3. Linearizacao 36
Adicionalmente, o movimento de rotacao e descrito por:
(Jp +Mp l2p) θ −Mp lp cos(θ) xc −Mp g lp sen(θ) +Bp θ = 0 (3.14)
A seguir, vamos acoplar as equacoes obtidas ate entao para encontrar aquelas que descrevem
o conjunto carro/pendulo.
Equacoes nao-lineares do sistema
Eliminando-se a forca Tx a partir das equacoes (3.9) e (3.13), verificamos que as equacoes
diferenciais nao-lineares, que descrevem o comportamento do carro xc(t) e o deslocamento
angular do pendulo θ(t) para todo t ≥ 0, podem ser resumidas a:
(Mp +Meq) xc + Beq xc −Mp lp cos(θ) θ +Mp lp sen(θ) θ2 = Aeq Vm (3.15)
(Mp l2p + Jp) θ +Bp θ −Mp lp cos(θ) xc −Mp lp g sen(θ) = 0 (3.16)
Desse modo, as equacoes (3.15)-(3.16) representam completamente o sistema dinamico de
interesse, o pendulo IP02 Quanser R©.
As proximas etapas tratam da manipulacao e analise de suas caracterısticas.
3.3 Linearizacao
A linearizacao e topico importante para o projeto do controlador, tanto no calculo propri-
amente dito, quanto na analise da abrangencia de um equacionamento mais simplista. Alem
disso, como ficara claro em seguida, o modelo linear e utilizado para identificacao dos parame-
tros fısicos, visto que estes valores podem diferir daqueles fornecidos pelo fabricante devido ao
desgaste dos trilhos, perdas de eficiencia, entre outros. Desenvolvendo as equacoes (3.15)-(3.16)
em serie de Taylor ate a primeira ordem e considerando a origem (x0, θ0, x0, θ0) = (0, 0, 0, 0)
como ponto de operacao, tem-se:
(Mp +Meq) xc + Beq xc −Mp lp θ = Aeq Vm (3.17)
(Mp l2p + Jp) θ +Bp θ −Mp g lp θ −Mp lp xc = 0 (3.18)
As Equacoes (3.17)-(3.18) representam a dinamica do sistema pendulo invertido linearizado
em relacao a origem.
3.4. Representacao de estado 37
3.4 Representacao de estado
A partir das Equacoes (3.15)-(3.16) e (3.17)-(3.18), que descrevem a dinamica do sistema
oriundas das subsecoes anteriores, e possıvel encontrar a equacao dinamica em espaco de estado
do conjunto definida como
x(t) = Ax(t) +B u(t), x(0) = x0 (3.19)
em que u(t) e a entrada de controle do sistema. Adote o seguinte vetor de estados x =
[xc θ xc θ]′ ∈ R
4 em que xi representa a i-esima componente do vetor x e a entrada de controle
u = Vm.
Caso linear
Feitas as consideracoes iniciais, basta substituir as variaveis de estado nas equacoes dina-
micas (3.17)-(3.18) e obter as matrizes A e B. Apos certo algebrismo, tem-se:
A =1
JT
0 0 JT 0
0 0 0 JT
0 M2p l
2p g −Beq (Mp l
2p + Jp) −BpMp lp
0 Mp lp g (Meq +Mp) −Beq Mp lp −Bp (Meq +Mp)
(3.20)
B =Aeq
JT
0
0
Mp l2p + Jp
Mp lp
(3.21)
com JT = Meq (Mp l2p + Jp) + JpMp.
Caso nao-linear
Em contrapartida, no caso nao-linear, as matrizes A e B sao dependentes das variaveis
de estado xi, i = 1, · · · , 4. Desse modo, para encontra-las, podemos reescrever as equacoes
(3.15)-(3.16) na forma matricial, obtendo:
Φ(x) x+ Γ(x) x+ Ω(x) = Ψ u (3.22)
3.5. Validacao do modelo 38
Sendo
Φ(x) =
1 0 0 0
0 1 0 0
0 0 Mp +Meq −Mp lp cos(x2)
0 0 −Mp lp cos(x2) Jp +Mp l2p
,Γ(x) =
0 0 −1 0
0 0 0 −1
0 0 Beq Mp lp sen(x2) x4
0 0 0 Bp
(3.23)
Ω(x) =
0
0
0
−Mp lp g sen(x2)
, Ψ =
0
0
Aeq
0
(3.24)
Isolando a variavel x, obtem-se:
x = −Φ(x)−1 Γ(x) x+ Φ(x)−1 Ψ u− Φ(x)−1 Ω(x) (3.25)
que explicita A(x) = −Φ(x)−1 Γ(x), B = Φ(x)−1 Ψ e E(x) = −Φ(x)−1 Ω(x). Portanto, os
resultados sao mostrados abaixo:
A(x) =1
JTn(x)
0 0 JTn(x) 0
0 0 0 JTn(x)
0 0 −Beq (Mp l2p + Jp) −BpMplp cos(x2)−Mplp x4 sen (x2) (Mpl
2p + Jp)
0 0 −BeqMplp cos(x2) −Bp(Meq +Mp)−M2p l
2p cos(x2) sen(x2)x4
(3.26)
e
B(x) =Aeq
JTn(x)
0
0
Mpl2p + Jp
Mplp cos(x2)
, E(x) =1
JTn(x)
0
0
M2p l
2p g sen(x2) cos(x2)
Mp lp g sen(x2)(Mp +Meq)
(3.27)
onde JTn(x) = −M2p l
2p (cos (x2))
2 + (Mp +Meq)(Mp l2p + Jp). As matrizes A(x) e B(x), junta-
mente com E(x), concluem a modelagem do sistema geral carro/pendulo invertido nao-linear
em representacao em espaco de estado.
3.5 Validacao do modelo
A validacao pode ser realizada atraves da comparacao entre a resposta medida do sistema
fısico e a simulada utilizando o modelo matematico obtido. As duas estacoes de trabalho dis-
ponıveis, denotadas por E.IP02 No1 e E.IP02 No2, sao consideradas para validacao. A Tabela
3.1 mostra os parametros fornecidos pelo fabricante Quanser R©, bem como suas respectivas
3.5. Validacao do modelo 39
unidades.
E. IP02 Mp [kg] lp [m] Bp
[
N.m.s
rad
]
Jp [kg.m2] Aeq
[
N
V
]
Meq [kg] Beq
[
N.s
m2
]
No 1 0.230 0.3302 0.0024 0.00788 1.0717 1.2863 5.4No 2 0.127 0.1778 0.0024 0.00120 1.0717 1.1598 5.4
Tabela 3.1: Parametros do fabricante Quanser R©
Para viabilizar esta etapa, deslocamos o conjunto carro/pendulo para um novo ponto de
operacao (xc, α) = (0, θ + π) que, diferente do anterior, representa um ponto de equilıbrio
estavel. Nesta situacao, o pendulo esta localizado na posicao de equilıbrio vertical para baixo.
Note que, naturalmente, as equacoes nao-lineares
(Mp +Meq) xc + Beq xc +Mp lp cos(α) α−Mp lp sen(α) α2 = Aeq Vm (3.28)
(Mp l2p + Jp) α +Bp α +Mp lp cos(α) xc +Mp lp g sen(α) = 0 (3.29)
e sua versao linearizada em torno do novo ponto de equilıbrio (x0, α0) = (0, 0)
(Mp +Meq) xc + Beq xc +Mp lp α = Aeq Vm (3.30)
(Mp l2p + Jp) α +Bp α +Mp lp g α +Mp lp xc = 0 (3.31)
sao identicas as anteriores, a menos de algumas trocas de sinal.
Logo, para ambas estacoes de trabalho, submetemos o sistema fısico e o seu modelo a uma
tensao Vm(t) quadrada. Para a E.IP02 No1, Vm = 5 [V] com frequencia de 2 [Hz] e, para
E.IP02 No2, Vm = 2 [V] com frequencia de 1.5 [Hz]. Realizamos a validacao para ambos
os modelos (linear e nao-linear), entretanto, para estas entradas em particular, nao houve
diferencas significativas entre as respostas de ambos. A Figura 3.3 mostra, para a estacao
de trabalho E.IP02 No 1, os sinais encontrados utilizando o modelo linear, em linha preta
tracejada, e os sinais adquiridos experimentalmente, em linha azul tracejada. Paralelamente,
a Figura 3.4 faz a mesma comparacao, porem utilizando linha vermelha tracejada para os
sinais adquiridos na estacao de trabalho E.IP02 No 2.
Podemos notar que o modelo capturou adequadamente as caracterısticas do sistema fısico.
Entretanto, apresentou pequenas diferencas de amplitude que podem ser explicadas pela utili-
zacao de parametros, tais como, coeficientes de atrito viscoso Bp e Bc e eficiencia do motor ηm,
que podem variar com o ambiente experimental, com as condicoes de realizacao do ensaio e
com o desgaste dos equipamentos e que, portanto, podem ser diferentes dos valores fornecidos
pelo fabricante. Alem dos parametros mencionados, nota-se que o efeito do cabo de transmis-
sao do sinal dos encoders e a nao-planicidade do eixo de corrida do carro contribuıram para
3.5. Validacao do modelo 40
0 1 2 3 4 5 6 7 8 9 10
-0.15
-0.1
-0.05
0
ExperimentalModelo c/ dados do fabricante
0 1 2 3 4 5 6 7 8 9 10
-0.2
-0.1
0
0.1
0.2
xc[m
]α[rad
]
tempo [s]
Figura 3.3: Resposta do sistema para entrada de onda quadrada - E.IP02 No1
0 5 10 15-0.1
-0.08
-0.06
-0.04
-0.02
0
ExperimentalModelo c/ dados do fabricante
0 5 10 15-0.4
-0.2
0
0.2
0.4
xc[m
]α[rad
]
tempo [s]
Figura 3.4: Resposta do sistema para entrada de onda quadrada - E.IP02 No2
as diferencas mencionadas. Assim, para obter um modelo mais preciso, realizamos a identifi-
cacao dos parametros do sistema, principalmente, daqueles que podem variar com o ambiente
e/ou com as condicoes do ensaio. A proxima etapa compreende a metodologia adotada para
identificacao, sua aplicacao e uma discussao sobre a abrangencia dos resultados obtidos.
3.5. Validacao do modelo 41
Identificacao dos parametros fısicos
Na secao anterior, realizamos a modelagem do sistema mecanico, pendulo invertido aco-
plado a um carro. As disparidades encontradas na comparacao entre a simulacao com os
parametros fornecidos pelo fabricante e o sistema fısico da Quanser R© indicam a necessidade
de se aperfeicoar o modelo. Logo, o estudo e a aplicacao de tecnicas de identificacao e de
suma relevancia para a determinacao de um modelo matematico adequado que descreve com
precisao a dinamica do sistema.
Neste momento, nosso objetivo e identificar os parametros relacionados aos coeficientes de
atrito viscoso Bp, Bc e as eficiencias ηm e ηg do motor e da caixa de transmissao, respecti-
vamente. O foco nestes parametros vem da sua forte dependencia a fatores externos, como
desgaste do trilho e o ambiente experimental, enquanto que as demais grandezas Mc, Mp, e lp
podem ser facilmente medidas. Os ensaios realizados durante a identificacao nos permitirao,
tambem, identificar nao linearidades que nao foram levadas em conta durante a modelagem.
Identificacao do conjunto carro/motor
Nota-se das equacoes (3.30)-(3.31) que e possıvel fazer a analise do conjunto carro/motor
e do pendulo separadamente. Podemos, neste caso, desacoplar o pendulo do carro, eliminando
os parametros α(t) e Mp em (3.30), obtendo apenas o movimento de translacao do carro, que
assumira o formato
Meq xc + Beq xc = Aeq Vm (3.32)
No sistema fısico da Quanser R© esta adaptacao pode ser feita simplesmente atraves da remocao
do pendulo da haste de apoio.
Definindo xc = vc, a velocidade linear do carro, obtemos uma equacao diferencial linear de
primeira ordem, que pode ser escrita na forma padrao:
τ vc + vc = κ0 Vm (3.33)
com:
κ0 =Aeq
Beq
, τ =Meq
Beq
(3.34)
A resposta deste sistema a uma entrada degrau com ν0 de amplitude Vm(t) = ν0, ∀t ≥ 0, e
dada por:
vc(t) = κ0ν0 (1− e−tτ ) (3.35)
o que permite a facil identificacao dos parametros de constante de tempo τ e do ganho κ0. De
fato, o procedimento para identificar os parametros passa por duas etapas bastante simples:
• Fazendo t → ∞ e facil verificar que κ0ν0 e o valor em regime permanente de vc(t);
3.5. Validacao do modelo 42
• Para t = τ temos que vc(τ) = κ0(1− e−1) e, portanto, τ e o instante em que a resposta
vc(t) atinge 63% do seu valor de regime.
Note, entretanto, que realizando apenas este ensaio para a determinacao de κ0 e τ nao
e possıvel encontrar separadamente os tres parametros de interesse Aeq, Meq e Beq. Esta
dificuldade pode ser contornada com o auxılio de um ensaio extra, de mesmo formato. A ideia
e acoplar uma massa conhecida ao carro Mk, de forma que a equacao dinamica resultante seja
identica a (3.33), mas com a nova constante de tempo
τ ′ =Meq +Mk
Beq
(3.36)
que, juntamente com (3.34), nos permite determinar
Beq =Mk
τ ′ − τ, Meq = Beqτ, Aeq = Beqκ0 (3.37)
E interessante o fato de que esta simples repeticao da metodologia, porem agora com uma
alteracao no sistema fısico, permita que encontremos as tres grandezas de interesse. Alem
disso, podemos notar que o ganho estacionario no segundo ensaio deve ser identico ao do
primeiro κ′0 = κ0, o que representa um ponto de conferencia para a validacao do metodo.
Ambas estacoes de trabalho foram submetidas a estes ensaios utilizando uma massa Mk =
0.25 [kg]. A identificacao foi realizada para uma faixa de tensao de entrada de 2.5 [V] a 4 [V],
com incremento de 0.5 [V] entre ensaios. A Tabela 3.2 mostra a media dos valores identificados
para cada estacao de trabalho IP02. Os ensaios mostram, como esperado, que κ0 ≈ κ′0 com
Parametros identificados - Carro/Motor
E. IP02 Aeq
[
N
V
]
Meq [kg] Beq
[
N.s
m2
]
No 1 1.3051 1.6895 7.3235No 2 1.1241 1.5653 6.6048
Tabela 3.2: Parametros identificados do carro
uma discrepancia pequena pouco maior que 2%.
Para fins de validar o modelo identificado, quatro entradas do tipo degrau foram aplicadas
na estacao de trabalho E.IP02 No1. A Figura 3.5 apresenta, no lado esquerdo, a velocidade
para a entrada degrau unitario e, no lado direito, a velocidade para um degrau de 3 [V]. O
comportamento para as entradas de 2 [V] e 4 [V] foram omitidos, pois sao similares a resposta
para a entrada de 3 [V]. Por simplicidade e semelhanca, nao serao exibidos as figuras referentes
a E.IP02 No2.
3.5. Validacao do modelo 43
0 0.5 1 1.5 2 2.5 3 3.5 40
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
ExperimentalModelo identificado
v c[m
/s]
tempo [s]0 0.2 0.4 0.6 0.8 1 1.2
0
0.1
0.2
0.3
0.4
0.5
0.6
ExperimentalModelo identificado
v c[m
/s]
tempo [s]
Figura 3.5: Resposta do conjunto carro-motor
Da Figura 3.5, na parte esquerda, observa-se a grande discrepancia entre os valores medidos
e aqueles obtidos atraves do modelo identificado. O fenomeno ocorre pois, para uma entrada
degrau de 1 [V], a inercia do cabo de ligacao do encoder nao pode ser desprezada e atua como
uma forte perturbacao externa que tende a retardar o movimento to carro. Alem disso, sabe-se
que a velocidade em regime permanente e proporcional a intensidade do degrau aplicado e, para
1 [V], o modulo da velocidade e suficientemente baixo e torna o atrito de Coulomb bastante
significativo. Este mesmo efeito pode ser notado e comprovado no grafico do lado direito.
Para vc < 0.3 [m/s], ha uma disparidade entre a curva identificada e a curva medida pelas
razoes ja mencionadas. Acima deste patamar, o modelo recupera fielmente o comportamento
do sistema fısico.
Identificacao do pendulo
Para identificar os parametros da equacao (3.31) trava-se o movimento do carro e considera-
se somente a oscilacao do pendulo. Neste caso xc e eliminada da equacao (3.31), que pode ser
escrita como
α + 2 ξ ωn α + ω2nα = 0 (3.38)
em que:
2 ξ ωn =Bp
(Mp l2p + Jp), ω2
n =Mp lp g
(Mp l2p + Jp)(3.39)
Verifica-se que, a partir da determinacao da frequencia natural nao-amortecida ωn e do fator
de amortecimento ξ, e possıvel obter os parametros Bp e Jp desejados. Os desenvolvimentos
que seguem foram baseados em (GEROMEL; KOROGUI, 2001). De fato, considerando que
o pendulo parte do repouso com condicao inicial α(0) = α0 e, aplicando a Transformada de
3.5. Validacao do modelo 44
Laplace em (3.38) obtemos
α(s) =α0 (s+ 2 ξ ωn)
s2 + 2 ξ ωn s+ ω2n
= α0
(
s+ ξωn
(s+ ξωn)2 + ω2d
+
(
ξωn
ωd
)
ωd
(s+ ξωn)2 + ω2d
)
em que ωd = ωn
√
1− ξ2 e a frequencia natural amortecida. A transformada inversa de Laplace,
por sua vez, nos permite encontrar a resposta no tempo do sistema da seguinte forma:
α(t) =α0e
−ξωnt
ωd(ωd cos(ωdt) + ξωnsen(ωdt))
=α0e
−ξωnt
sen(φ)sen(ωdt+ φ) (3.40)
em que:
tg(φ) =ωd
ξωn
=√
ξ−2 − 1 (3.41)
para 0 < ξ < 1. E importante notar que, a partir da equacao (3.40), a derivada de α(t) no
tempo nos permite observar que os pontos de maximo e mınimo da funcao satisfazem a regra
tg(ωd t+ φ) = tg(φ), ou seja:
ωd ti = i π , i = 0, 1, 2, ... (3.42)
Logo, como ωd(ti+1 − ti) = π, temos que o valor medio relacionado aos m pontos de maximo
e mınimo obtidos da medida do deslocamento, fornece a relacao:
ωd =(m− 1) π
m−1∑
i=1
(ti+1 − ti)
(3.43)
Com a aplicacao dos mesmos instantes de tempo na equacao (3.40), obtemos:
α(ti) = α0 e−ξ ωn ti (−1)i , i = 0, 1, 2, ... (3.44)
que faz com que os pontos de maximo e mınimo satisfacam a relacao:
|α(ti+1)||α(ti)|
= e−ξ ωn (ti+1−ti) = e−π/tg(φ) (3.45)
3.5. Validacao do modelo 45
Por fim, de maneira equivalente, apos algumas manipulacoes algebricas, chegamos a igualdade
tg(φ) =(m− 1) π
m−1∑
i=1
(ln(|α(ti)|)− ln(|α(ti+1)|))(3.46)
Observe que, apos determinar ωd a partir de (3.43), a utilizacao da equacao (3.46), junta-
mente com (3.41) nos permite obter o valor do fator de amortecimento ξ e, consequentemente,
da frequencia natural nao-amortecida ωn, concluindo o procedimento adotado.
No sistema fısico, fixou-se o carro de maneira que este nao influenciasse nas leituras de α(t)
e deslocou-se pendulo ate a condicao inicial α0 = 0.3129 [rad], para E.IP02 No 1, e α0 = 0.3988
[rad], para E.IP02 No 2. Utilizando os valores de maximo e mınimo de α(t), determinamos ξ,
ωn e, consequentemente, os parametros Bp e Jp desejados. A Tabela 3.3 apresenta os resultados
obtidos.
Parametros identificados - Pendulo
E. IP02 ξ ωn [rad/s] Bp [N.m.s/rad] Jp [kg.m2]No 1 0.0029 4.7847 0.00088 0.00747No 2 0.0110 6.6568 0.00073 0.00098
Tabela 3.3: Parametros identificados do pendulo
A Figura 3.6 compara a posicao angular medida com a obtida a partir do modelo identifi-
cado para a estacao E.IP02 No1. De maneira similar a identificacao do sistema carro/motor,
omitiremos aqui os resultados para a E.IP02 No2. Para E.IP02 No1, foram utilizados m = 46
pontos para o procedimento. Apresentamos a resposta apenas a partir dos 20 [s] iniciais, haja
vista que o ajuste para t ≤ 20 [s] e fiel as medidas do sistema.
Nota-se que a condicao de sistema subamortecido e encontrada na resposta α(t). Observe
que, a partir dos 100 [s], as duas curvas comecam a se diferenciar e os pontos coletados
no ensaio tendem mais rapidamente a origem do que o sistema identificado. Este fato esta
relacionado a omissao da forca de atrito de Coulomb no modelo, que atua no pendulo sempre
que a velocidade muda de sentido e sua influencia cresce quanto menor e a velocidade angular
do pendulo.
Comparacao dos resultados
Os resultados obtidos nas sessoes anteriores sao resumidos na Tabela 3.4. E notavel uma
diferenca significativa entre os valores obtidos na identificacao do sistema em relacao aqueles
fornecidos pelo fabricante Quanser R© . Esta disparidade torna-se importante na variavel Bp,
que e 69% menor do que o valor fornecido pelo fabricante, para o sistema E.IP02 No2.
3.5. Validacao do modelo 46
20 40 60 80 100 120 140-15
-10
-5
0
5
10
15ExperimentalModelo identificado
α(t)[rad]
tempo [s]
Figura 3.6: Deslocamento angular do pendulo
As Figuras 3.7 e 3.8 fazem a comparacao entre a resposta do sistema real, o modelo com
parametros identificados e o modelo com parametros Quanser R©. Aplicou-se uma forma de
onda quadrada com frequencia de 2.5 [Hz] e amplitude de 5 [V] na entrada Vm(t), para ambas
as estacoes de trabalho. Para E.IP02 No1, a curva em linha tracejada azul representa a resposta
experimental do conjunto. Ja para E.IP02 No2, este mesmo parametro e representado pela
linha tracejada vermelha. A linha preta contınua simula o modelo do pendulo com parametros
identificados e, finalmente, a linha preta tracejada simula o modelo com parametro fornecidos
pelo fabricante.
E notavel que a identificacao do sistema utilizando a metodologia apresentada permitiu a
obtencao de um modelo mais preciso do que aquele fornecido pelo fabricante. Isto ocorre devido
a maior proximidade das variaveis identificadas para o sistema real, uma vez que o desgaste de
uso e condicoes de laboratorio influenciam nestes fatores. Porem, tambem e importante discutir
alguns fenomenos que nao foram levados em conta no modelo e que explicam as pequenas
diferencas observadas. A resposta da simulacao com parametros identificados define bem a
dinamica do sistema, embora nota-se uma pequena defasagem, principalmente na variavel
α. A explicacao para este fenomeno deve-se a nao-linearidades, como o atrito de Coulomb,
que nao foi considerado no modelo. Para a variavel xc, nota-se uma pequena diferenca na
amplitude do deslocamento. Neste caso, fatores externos, tambem nao levados em conta no
3.5. Validacao do modelo 47
Variaveis identificadas versus fornecidas
E. IP02 no 1 Fornecido Identificado Unidade VariacaoAeq 1.0717 1.3051 [N/V] 22%Beq 5.4 7.3235 [N.s/m2] 36%Meq 1.2863 1.6895 [kg] 31%Bp 0.00240 0.00088 [N.m.s/rad] −63%Jp 0.00788 0.00746 [kg.m2] −5%
E. IP02 no 2 Fornecido Identificado Unidade VariacaoAeq 1.0717 1.1241 [N/V] 5%Beq 5.4 6.6048 [N.s/m2] 22%Meq 1.1598 1.5653 [kg] 35%Bp 0.0024 0.00073 [N.m.s/rad] −69%Jp 0.0012 0.00098 [kg.m2] −18%
Tabela 3.4: Comparacao entre os resultados
0 1 2 3 4 5 6 7 8 9 10
-0.15
-0.1
-0.05
0
ExperimentalModelo c/ dados identificadosModelo c/ dados Quanser
0 1 2 3 4 5 6 7 8 9 10
-0.2
-0.1
0
0.1
0.2
xc[m
]α[rad]
tempo [s]
Figura 3.7: Comparacao do sistema para onda quadrada - E.IP02 No 1
modelo, tais como a influencia do cabo do encoder e a nao planicidade do trilho de corrida,
sao responsaveis por este efeito. Apesar disso, e fato que o modelo engloba com bastante
eficiencia o movimento do conjunto como um todo, e segue corretamente os dados coletados
do ensaio. Verificamos, entao, de maneira clara, que o modelo e suficientemente adequado
para ser utilizado para fins de projeto de controle.
Os valores da Tabela 3.4, aplicados a dinamica linear do pendulo invertido modelada pelas
3.6. Consideracoes finais 48
0 5 10 15-0.1
-0.08
-0.06
-0.04
-0.02
0ExperimentalModelo c/ dados identificadosModelo c/ dados Quanser
0 5 10 15-0.4
-0.2
0
0.2
0.4
xc[m
]α[rad]
tempo [s]
Figura 3.8: Comparacao do sistema para onda quadrada - E.IP02 No 2
matrizes (3.20)-(3.21), nos proporcionam
A1 =
0 0 1 0
0 0 0 1
0 0.9979 −4.2034 −0.0012
0 25.2223 −9.8095 −0.0299
, B1 =
0
0
0.7491
1.7481
(3.47)
para o sistema E.IP02 No1, acrescentadas do ındice 1 e
A2 =
0 0 1 0
0 0 0 1
0 0.6293 −4.1532 −0.0021
0 47.1557 −18.7606 −0.1565
, B2 =
0
0
0.7068
3.1930
(3.48)
para o sistema E.IP02 No2, acrescentadas do ındice 2, que representam as bancadas do fabri-
cante Quanser R© e completam este capıtulo.
3.6 Consideracoes finais
Apresentamos a estacao de trabalho IP02 da empresa Quanser R©. Duas destas estacoes
serao utilizadas no proximo capıtulo para controle cooperativo, via rede de comunicacao. Desta
3.6. Consideracoes finais 49
forma, o presente capıtulo foi dedicado a descricao do sistema mecanico, a obtencao de seu
modelo matematico e a identificacao dos seus parametros. Mais especificamente, obtivemos
seu modelo matematico nao-linear e sua versao linearizada em torno do ponto de interesse.
Apresentamos tecnicas simples de identificacao de sistemas, para a obtencao, de forma precisa,
dos parametros dos modelos de ambas as estacoes de trabalho, identificadas como E.IP02 No1 e
E.IP02 No2, principalmente daqueles que sofrem variacao com as condicoes do ambiente e com
o desgaste dos equipamentos e que, portanto, diferem dos valores fornecidos pelo fabricante.
Os modelos de ambas foram validados e se mostraram bastante adequados para reproduzir a
dinamica real de ambas as estacoes de trabalho em consideracao.
50
CAPITULO 4
Controle Cooperativo H2 e H∞
Apos a modelagem e identificacao de ambas as estacoes de trabalho, estamos em condicoes
de realizar o controle cooperativo de ambos os sistemas atraves de uma rede de comunicacao.
O controle deve ser realizado a partir de uma estrategia dinamica de compartilhamento de
recursos a ser determinada. Esta estrategia e representada por uma regra de comutacao que
seleciona, a cada intervalo de tempo, qual sistema deve receber o sinal de controle atualizado,
enquanto o outro mantem o sinal previamente recebido. Consideramos que a rede apresenta
largura de faixa limitada e, portanto, o sinal de controle deve permanecer constante durante
um intervalo de tempo suficiente para respeitar a largura de faixa do canal de comunicacao.
Alem disso, o controle via realimentacao de estado deve ser realizado de forma a assegurar cri-
terios de desempenho H2 e H∞ a serem definidos posteriormente. Neste capıtulo, que contem
os principais resultados desta dissertacao, o projeto de controle H2 foi baseado na referen-
cia recente (SOUSA; GEROMEL; DEAECTO, 2015). Nossa contribuicao foi implementar e
validar experimentalmente as tecnicas de (SOUSA; GEROMEL; DEAECTO, 2015) para o
controle de ambas as estacoes de trabalho identificadas no capıtulo anterior. Os resultados
obtidos foram publicados em (LUZ NETTO et al., 2017). Outra contribuicao deste trabalho
foi obter as condicoes para o projeto de controle cooperativo H∞ via rede de comunicacao,
ate entao nao disponıveis na literatura, validando experimentalmente a tecnica de controle
obtida. Estes resultados foram submetidos a (EGIDIO; LUZ NETTO; DEAECTO, 2018b) e
(EGIDIO; LUZ NETTO; DEAECTO, 2018a) e estao em fase de revisao.
4.1 Formulacao do problema
A seguir formulamos o problema de controle para o caso generico de N sistemas lineares e
invariantes no tempo (LIT) de ordem nxique compartilham o mesmo canal de comunicacao.
Posteriormente, eles serao particularizados para o caso em estudo. Considere que a i-esima
4.1. Formulacao do problema 51
planta LIT possui a realizacao em espaco de estado
xi(t) = Aixi(t)+Biui(t)+Hiwi(t), xi(0)=0 (4.1)
zi(t) = Cixi(t)+Diui(t)+Giwi(t) (4.2)
para todo i ∈ K, com xi ∈ Rnxi , ui ∈ R
nui , wi ∈ Rnwi e zi ∈ R
nzi sendo o estado, o esforco de
controle, a entrada exogena e a saıda controlada, respectivamente. Note que as plantas podem
ter ordens distintas e numeros diferentes de entradas e de saıdas. Consideramos que os sinais
de controle devem satisfazer as seguintes caracterısticas:
• Largura de faixa limitada e aplicada levando em conta um esforco de controle do tipo
ui(t) = ui(tk) = ui[k], t ∈ [tk, tk+1), ∀i ∈ K (4.3)
no qual tkk∈N sao instantes de amostragem sucessivos tais que t0 = 0 e tk+1− tk = h ≥T > 0. A frequencia de amostragem 1/T deve respeitar a largura de faixa do canal de
transmissao, veja (HESPANHA; NAGHSHTABRIZI; XU, 2007) para maiores detalhes.
• Compartilhamento cooperativo e incluıdo de maneira que a cada instante tk ≥ 0
somente o sistema definido por σ[k] ∈ K deve receber o sinal de controle atualizado, ou
seja
ui[k] =
Kiui[k − 1] + Lixi[k] , i = σ[k]
ui[k − 1] , i 6= σ[k](4.4)
em que as matrizes (Ki, Li) para todo i ∈ K devem ser determinadas.
Considerando o exposto, podemos observar que uma regra de comutacao pode ser utilizada
como um coordenador para decidir a cada instante de amostragem tk ≥ 0 qual planta LIT deve
ser controlada enquanto as demais mantem o ultimo sinal de controle recebido. O controle
deve ser realizado de forma a levar em conta os seguintes ındices de desempenho:
• Indice de desempenho H2: Considerando Gi = 0, ∀i ∈ K, podemos definir o seguinte
ındice
J2(σ) = infKi,Li,σ∈Ω
N∑
i=1
nwi∑
q=1
∫ ∞
0
zqi (t)′zqi (t)dt (4.5)
em que zqi e a resposta da i-esima planta a entrada impulsiva wi(t) = eqδ(t), i ∈ K, em
que eq e a q-esima coluna da matriz identidade de ordem nwi.
• Indice de desempenho H∞: Para entradas wi(t) ∈ L2, i ∈ K, com wi(t) = wi(tk) =
4.2. Controle H2 52
wik(t) = wi[k], ∀t ∈ [tk, tk+1), podemos definir o seguinte ındice
J∞(σ) = infKi,Li,σ∈Ω
supwik(t)∈Ld2
∑Ni=1
∫∞
0zi(t)
′zi(t)dt∑N
i=1
∫∞
0wik(t)′wik(t)dt
(4.6)
Nestas definicoes Ω e o conjunto de todas as regras de comutacao estabilizantes.
Alternativamente, podemos reescrever o esforco de controle como
ui[k]=(1 − δiσ)ui[k − 1] + δiσ(Kiui[k − 1] + Lixi[k]) (4.7)
em que δij = 1 se i = j e δij = 0 se i 6= j para (i, j) ∈ K × K o que facilitara a modelagem
matematica nos desenvolvimentos que seguem.
4.2 Controle H2
Considerando que as entradas wi(t) = eqδ(t) sao do tipo impulsivas, podemos verificar que
o sistema (4.1)-(4.2) pode ser alternativamente reescrito como
xi(t) = Aixi(t)+Biui(t), xi(0+)= Hieq (4.8)
zi(t) = Cixi(t)+Diui(t) (4.9)
Esta equivalencia entre ambos os sistemas pode ser facilmente observada integrando ambos os
lados de (4.1) de forma a obter
∫ t
0
xi(τ) =
∫ t
0
(Aixi(τ)+Biui(τ) +Hieqδ(τ)) dτ (4.10)
=
∫ t
0
(Aixi(τ)+Biui(τ)) dτ +Hieq (4.11)
Considerando que a condicao inicial antes da aplicacao do impulso e x(0) e que x(0+) representa
a condicao inicial imediatamente apos a sua aplicacao, temos
xi(t)− xi(0)−Hieq =
∫ t
0
(Aixi(τ)+Biui(τ)) dτ (4.12)
Como x(0) = 0, obtemos exatamente o sistema alternativo (4.8)-(4.9), veja (GEROMEL;
DEAECTO; COLANERI, 2007). Alem disso, levando em conta que o sinal de controle (4.7)
se mantem constante dentro do intervalo de tempo definido por dois instantes de amostragens
4.2. Controle H2 53
sucessivos t ∈ [tk, tk+1) podemos obter o sistema discreto equivalente
xi[k + 1] = Aihxi[k]+Bihui[k], xi[0]=Hieq (4.13)
zi[k] = Cihxi[k]+Dihui[k] (4.14)
em que as matrizes (Aih, Bih, Cih, Dih) sao calculadas a partir das seguintes identidades
eFih =
[
Aih Bih
0 I
]
,
∫ h
0
eF′
itE ′iEieFitdt =
[
C ′ih
D′ih
] [
C ′ih
D′ih
]′
(4.15)
com as matrizes
Fi =
[
Ai Bi
0 0
]
, Ei =[
Ci Di
]
(4.16)
Esta descricao permite assegurar que o desempenho do sistema a tempo discreto (4.13)-(4.14)
seja identico aquele do sistema a tempo contınuo (4.8)-(4.9) sempre que a entrada de controle
for do tipo (4.3). Neste caso, a igualdade
∫ ∞
0
zi(t)′zi(t)dt =
∑
k∈N
zi(tk)′zi(tk) (4.17)
e preservada. Para maiores detalhes veja a Secao 2.5 desta dissertacao.
Definindo o vetor de estado aumentado ηi[k] = [xi[k]′ ui[k − 1]′]′ e utilizando o esforco de
controle ui[k] apresentado em (4.7), a dinamica do sistema em malha fechada torna-se
ηi[k + 1] = (Aiσ + BiσKi)ηi[k], ηi0 = Hieq (4.18)
zi[k] = (Ciσ +DiσKi)ηi[k] (4.19)
com Hi = [H ′i 0′]′ para todo i ∈ K. As matrizes indicadas sao
Aiσ =
[
Aih (1− δiσ)Bih
0 (1− δiσ)I
]
, Biσ =
[
δiσBih
δiσI
]
, Ciσ =
[
C ′ih
(1− δiσ)D′ih
]′
, Diσ =[
δiσDih
]
(4.20)
e as matrizes de ganho sao Ki = [Li Ki]. Note que o sistema em malha fechada e dado por
ηi[k + 1] =
[
Aih +BihLi BihKi
Li Ki
]
ηi[k] (4.21)
zi[k] =[
Cih +DihLi DihKi
]
ηi[k] (4.22)
4.2. Controle H2 54
quando o i-esimo sistema e escolhido pelo coordenador, ou seja, i = σ[k] e
ηi[k + 1] =
[
Aih Bih
0 I
]
ηi[k] (4.23)
zi[k] =[
Cih Dih
]
ηi[k] (4.24)
caso i 6= σ[k], o que deixa claro a importancia do coordenador. De fato para i = σ[k] sempre
e possıvel estabilizar o i-esimo sistema desde que o par (Aih, Bih) seja controlavel. Por outro
lado, os demais sistemas (4.23) sao instaveis pois nada e imposto sobre a Schur estabilidade de
Aih, ∀i ∈ K, e alem disso, ele possui varios autovalores unitarios. Logo, a regra de comutacao
e essencial para controlar esta classe de sistemas principalmente porque a funcao objetivo (4.5)
depende da saıda de todas as plantas LIT.
4.2.1 Criterio de desempenho
Considere o caso mais simples (4.18)-(4.19) com Ki dado para todo i ∈ K e a seguinte
realizacao em espaco de estado
ηi[k + 1] = Aiσηi[k], ηi[0] = ηi0 (4.25)
zi[k] = Ciσηi[k] (4.26)
em que Aij = Aij +BijKi, Cij = Cij +DijKi e o coordenador σ(·) e a unica variavel de projeto.
Adote a funcao de Lyapunov do tipo mınimo
V (ηi[k]) = minj∈K
∑
i∈K
ηi[k]′Pijηi[k] (4.27)
com Pij > 0 para todo (i, j) ∈ K×K a qual esta associada a regra de comutacao
σ(ηi[k]) = argminj∈K
∑
i∈K
ηi[k]′Pijηi[k] (4.28)
O Teorema 4.2.1, disponıvel em (SOUSA; GEROMEL; DEAECTO, 2015), apresenta as con-
dicoes de estabilidade e um custo garantido para este sistema.
Teorema 4.2.1 Considere que a matriz de Metzler Π ∈ M seja dada. Se existirem matrizes
Pij > 0 satisfazendo as desigualdades de Lyapunov-Metzler generalizadas
A′ij
(
∑
ℓ∈K
πℓjPiℓ
)
Aij − Pij < −C′ij Cij (4.29)
4.2. Controle H2 55
para todo (i, j) ∈ K×K, entao a regra de comutacao (4.28) assegura que o sistema em malha
fechada e globalmente assintoticamente estavel e satisfaz
∑
i∈K
∫ ∞
0
zi(t)′zi(t)dt < min
j∈K
∑
i∈K
η′i0Pijηi0 (4.30)
Prova: A prova esta disponıvel em (SOUSA; GEROMEL; DEAECTO, 2015).
Embora a prova esteja disponıvel em (SOUSA; GEROMEL; DEAECTO, 2015), devido a sua
importancia, ela sera repetida aqui em linhas gerais. De fato, considerando que para um
instante arbitrario t = tk temos σ[k] = j ∈ K e utilizando a funcao de Lyapunov (4.27) temos
V (ηi[k + 1]) = minℓ∈K
∑
i∈K
ηi[k]′A′
ijPiℓAijηi[k]
≤∑
i∈K
ηi[k]′A′
ij
(
∑
ℓ∈K
πℓjPiℓ
)
Aijηi[k]
< V (ηi[k])−∑
i∈K
zi[k]′zi[k] (4.31)
a primeira desigualdade decorre do fato de que cada coluna de Π e um vetor λ ∈ Λ, em que Λ
e o simplex unitario definido como
Λ =
λ ∈ RN : λi ≥ 0,
∑
i∈K
λi = 1
(4.32)
A segunda desigualdade vem de (4.29). Alem disso, levando em conta (4.17) e somando ambos
os lados de (4.31) para todo k ∈ N, obtemos
∑
i∈K
∫ ∞
0zi(t)
′zi(t)dt =∑
i∈K
∑
k∈N
zi[k]′zi[k]
<∑
k∈N
(V (ηi[k])− V (ηi[k + 1]))
< V (ηi0)
< minj∈K
∑
i∈K
η′i0Pijηi0 (4.33)
o que mostra a validade do custo garantido (4.30). Para Π dado, as condicoes sao LMIs e
podem ser resolvidas sem grandes dificuldades. Alem disso, para o caso de interesse, temos
N = 2 e, portanto, a matriz Π pode ser obtida atraves de busca unidimensional de apenas
dois parametros.
O proximo corolario apresenta um custo garantido H2 para o sistema (4.1)-(4.2). Este
custo decorre de (4.30) se lembrarmos que (4.1)-(4.2) com ui(tk) = ui[k], dado por (4.7), e
4.2. Controle H2 56
equivalente ao sistema (4.18)-(4.19).
Corolario 4.2.1 Considere que as condicoes do Teorema 4.2.1 sejam satisfeitas, a desigual-
dade
J2(σ) < minj∈K
N∑
i=1
tr(H′iPijHi) (4.34)
representa um custo garantido para o sistema (4.1)-(4.2).
Prova: A prova e simples e baseada no custo garantido (4.30). De fato, note que
N∑
i=1
nwi∑
q=1
∫ ∞
0
zqi (t)′zqi (t)dt =
N∑
i=1
nwi∑
q=1
∑
k∈N
zqi [k]′zqi [k]
<
nwi∑
q=1
(
minj∈K
N∑
i=1
η′i0Pijηi0
)
< minj∈K
N∑
i=1
nwi∑
q=1
(
e′qH′iPijHieq
)
< minj∈K
N∑
i=1
tr (H′iPijHi)
em que a primeira desigualdade e obtida de (4.30), a segunda decorre da propriedade de
operador mınimo, em que o mınimo da soma e menor ou igual a soma dos mınimos, provando,
assim o corolario proposto.
Neste ponto e importante observar que as matrizes Aij nao precisam ser Schur estaveis como
uma condicao necessaria para a factibilidade de (4.29). De fato, uma condicao necessaria e que
as matrizes√πjjAij sejam Schur estaveis e, portanto, como 0 ≤ πjj ≤ 1 nenhuma propriedade
de estabilidade e exigida de cada subsistema Aij.
4.2.2 Controle via realimentacao de estado
Considere o sistema mais geral (4.1)-(4.2), com Gi = 0, realimentado pela lei de con-
trole (4.7) e reescrito alternativamente como (4.18)-(4.19). O teorema a seguir retirado de
(SOUSA; GEROMEL; DEAECTO, 2015) generaliza os resultados anteriores para tratar do
projeto conjunto dos ganhos de realimentacao Ki e das matrizes Pij > 0 importantes para a
implementacao da regra de comutacao.
Teorema 4.2.2 Considere que a matriz de Metzler Π ∈ M seja dada. Existem matrizes
simetricas Pij > 0 satisfazendo (4.29) se, e somente se, existirem matrizes Rij ,Wijℓ, matrizes
4.3. Controle H∞ 57
Yi e Jij tais que as desigualdades
Rij • •AijRij Jij + J ′
ij −∑
ℓ∈K πℓjWijℓ •CijRij 0 I
> 0, i 6= j (4.35)
Rii • •AiiRii + BiiYi Jii + J ′
ii−∑
ℓ∈K πℓiWiiℓ •CiiRii +DiiYi 0 I
> 0 (4.36)
[
Wijℓ •J ′
ij Riℓ
]
> 0 (4.37)
sejam validas para todo (i, j, ℓ) ∈ K×K×K.
Prova: A prova esta disponıvel em (SOUSA; GEROMEL; DEAECTO, 2015).
De maneira a obter o menor limitante superior para o custo H2 definido em (4.5), o projeto
deve ser realizado a partir da solucao do seguinte problema de otimizacao
infRij ,Wijℓ,Jii,Yi
minj∈K
∑
i∈K
tr(H′iR−1
ij Hi) : (4.35)− (4.37)
(4.38)
que fornece os ganhos de realimentacao de estado Ki = YiR−1ii e as matrizes Pij = R−1
ij ,
(i, j) ∈ K×K importantes para a implementacao da regra.
4.3 Controle H∞
Considere novamente o sistema (4.1)-(4.2) com entrada exogena wi ∈ L2 nao-nula e trans-
mitida atraves de um canal de comunicacao com perıodo de amostragem h ≥ 0. Isto significa
que wi(t) e modelada como
wi(t) = wi(tk) = wik(t) = wi[k], ∀t ∈ [tk, tk+1) (4.39)
No presente contexto, este modelo e de nosso interesse pois pode representar ruıdos aditivos no
sinal de controle ou perturbacoes relativamente bem comportadas, como e o caso da influencia
do vento interferindo no controle dos pendulos identificados no capıtulo anterior. Note que,
como wi[k] e constante por partes, temos que
∫ ∞
0
wik(t)′wik(t)dt = h
∑
k∈N
wi[k]′wi[k] (4.40)
4.3. Controle H∞ 58
e, portanto, o sistema discretizado
xi[k + 1] = Aihxi[k]+Bihui[k] +Hihwi[k], xi[0] = 0 (4.41)
zi[k] = Cihxi[k]+Dihui[k] +Gihwi[k] (4.42)
obtido como em (4.15)-(4.16) mas com [Bih Hih] → Bih, [Dih Gih] → Dih em (4.15) e [Bi Hi] →Bi, [Di Gi] → Di em (4.16), permite obter a relacao
supwi(t)∈Ld2
∫∞
0zi(t)
′zi(t)dt∫∞
0wi(t)′wi(t)dt
= supwi∈Ld2
∑
k∈N zi[k]′zi[k]
h∑
k∈Nwi[k]′wi[k](4.43)
em que L2 e o conjunto de todas as trajetorias ξ(t) tal que∫∞
0ξ(t)′ξ(t)dt < ∞ e, analogamente,
Ld2 e o conjunto de todas as trajetorias ξ[k] tais que∑
k∈N ξ[k]′ξ[k] < ∞. Esta relacao indica
que o ındice de desempenho J∞(σ) se diferencia daquele obtido atraves do sistema a tempo
discreto (4.41)-(4.42) por um fator de h. Um ponto importante que deve ser mencionado e
que para uma entrada arbitraria w(t) ∈ L2, sem que ela seja modelada como em (4.39), temos
que
J∞(σ) ≤ supwi(t)∈L2
∑
i∈K
∫∞
0zi(t)
′zi(t)dt∑
i∈K
∫∞
0wi(t)′wi(t)dt
(4.44)
Para maiores detalhes a respeito da discretizacao e da relacao de custos (4.43) veja (SOUZA
et al., 2014). Como as entradas de interesse apresentam a estrutura (4.39) nosso objetivo e
encontrar um limitante superior para J∞(σ).
Utilizando o estado aumentado ηi[k] = [xi[k]′ ui[k−1]′]′ e o sinal de controle (4.7) obtemos
o sistema em malha fechada
ηi[k + 1] = (Aiσ + BiσKi)ηi[k] +Hiwi[k], ηi[0] = 0 (4.45)
zi[k] = (Ciσ +DiσKi)ηi[k] + Giwi[k] (4.46)
com as matrizes Aiσ,Biσ, Ciσ,Diσ ja definidas em (4.20), Hi = [H ′i 0
′]′ e Gi = Gi.
4.3.1 Criterio de desempenho
Considere primeiramente o caso mais simples em que Ki e dado para todo i ∈ K no sistema
(4.45)-(4.46). O proximo teorema apresenta um limitante superior para o custo J∞ do sistema.
Teorema 4.3.1 Considere que a matriz de Metzler Π ∈ M seja dada. Se existir Pij > 0 e
4.3. Controle H∞ 59
um escalar ρ > 0 satisfazendo as desigualdades de Riccati-Metzler generalizadas
Pij • • •0 ρI • •
(∑
ℓ∈K πℓjPiℓ
)
Aij
(∑
ℓ∈K πℓjPiℓ
)
Hi
(∑
ℓ∈K πℓjPiℓ
)
•Cij Gi 0 I
> 0 (4.47)
para todo (i, j) ∈ K×K, entao a regra de comutacao (4.28) assegura que o sistema em malha
fechada e globalmente assintoticamente estavel e satisfaz
J∞(σ) < ρ/h (4.48)
Prova: Considere que em um instante arbitrario de tempo t = tk a regra de comutacao
(4.28) fornece σ[k] = j ∈ K e que as desigualdades (4.47) sao satisfeitas. Logo, realizando o
complemento de Schur com relacao as duas ultimas linhas e colunas de (4.47) e organizando
o termos, obtemos
[
A′ijPπijAij −Pij •H′
iPπijAij H′iPπijHi
]
+
[
C′ij Cij •G ′iCij G ′
iGi − ρI
]
< 0 (4.49)
em que Pπij =∑
ℓ∈K πℓjPij . Da definicao da funcao de Lyapunov (4.27) segue
V (ηi[k + 1]) = minℓ∈K
∑
i∈K
[
ηi[k]
wi[k]
]′ [
A′ijPiℓAij •
H′iPiℓAij H′
iPiℓHi
][
ηi[k]
wi[k]
]
≤∑
i∈K
[
ηi[k]
wi[k]
]′ [
A′ijPπijAij •
H′iPπijAij H′
iPπijHi
][
ηi[k]
wi[k]
]
< V (ηi[k])−∑
i∈K
zi[k]′zi[k] + ρ
∑
i∈K
wi[k]′wi[k] (4.50)
em que a primeira desigualdade decorre do fato de que cada coluna de Π ∈ M e um vetor
λ ∈ Λ e a segunda desigualdade e obtida de (4.49) multiplicando a esquerda por [ηi[k]′ wi[k]
′] e
a direita pelo seu transposto. Note que o sistema e assintoticamente estavel pois a factibilidade
de (4.49) assegura que a desigualdade A′ijPπijAij−Pij < 0 e satisfeita para todo (i, j) ∈ K×K.
Assim, somando ambos os lados de (4.50) para todo k ∈ N obtemos
∑
k∈N
(V (ηi[k + 1])− V (ηi[k])) < −∑
k∈N
∑
i∈K
zi[k]′zi[k] + ρ
∑
k∈N
∑
i∈K
wi[k]′wi[k] (4.51)
como∑
k∈N (V (ηi[k + 1])− V (ηi[k])) = V (ηi[∞])−V (ηi[0]) = 0, pois a estabilidade assintotica
4.3. Controle H∞ 60
do sistema implica em V (ηi[∞]) = 0 e V (ηi[0]) = 0 pois as condicoes iniciais sao nulas, temos
∑
i∈K
∑
k∈N
zi[k]′zi[k] < ρ
∑
i∈K
∑
k∈N
wi[k]′wi[k], ∀wi ∈ Ld2
< ρ supwi∈Ld2
∑
i∈K
∑
k∈N
wi[k]′wi[k]
e, portanto,
supwi∈Ld2
∑
i∈K
∑
k∈N zi[k]′zi[k]
∑
i∈K
∑
k∈N wi[k]′wi[k]< ρ (4.52)
Levando em conta a relacao apresentada em (4.43), a desigualdade (4.48) e satisfeita con-
cluindo, assim, a prova.
4.3.2 Controle via realimentacao de estado
Considere agora o sistema mais geral (4.1)-(4.2), realimentado pela lei de controle (4.7)
e reescrito alternativamente como (4.45)-(4.46). O teorema a seguir generaliza os resultados
anteriores para tratar do projeto conjunto dos ganhos de realimentacao Ki e das matrizes
Pij > 0 importantes para a implementacao da regra de comutacao.
Teorema 4.3.2 Considere que a matriz de Metzler Π ∈ M seja dada. Existem matrizes
simetricas Pij > 0 satisfazendo (4.47) se, e somente se, existirem matrizes Rij ,Wijℓ, matrizes
Yi, Jij e um escalar ρ > 0 tais que as desigualdades
Rij • • •0 ρI • •
AijRij Hi Jij + J ′ij −
∑
ℓ∈K πℓjWijℓ •CijRij Gi 0 I
> 0, i 6= j (4.53)
Rii • • •0 ρI • •
AiiRii + BiiYi Hi Jii + J ′ii −
∑
ℓ∈K πℓjWiiℓ •CiiRii +DiiYi Gi 0 I
> 0 (4.54)
[
Wijℓ •Jij Riℓ
]
> 0 (4.55)
sejam validas para todo (i, j, ℓ) ∈ K×K×K.
Prova: Para a prova, considere que as desigualdades (4.47) sejam satisfeitas para o sistema em
malha fechada. Multiplicando ambos os lados de (4.47) por diagP−1ij , I,
(∑
ℓ∈K πℓjPiℓ
)−1, I
4.3. Controle H∞ 61
e definindo Rij = P−1ij , obtemos
Rij • • •0 ρI • •
AijRij Hi
(∑
ℓ∈K πℓjR−1iℓ
)−1 •CijRij Gi 0 I
> 0 (4.56)
para (i, j) ∈ K × K. Agora, utilizando o Complemento de Schur em (4.55) obtemos Wijℓ >
J ′ijR−1
iℓ Jij o que nos permite concluir que
(
∑
ℓ∈K
πℓjR−1iℓ
)−1
≥ Jij + J ′ij −
∑
ℓ∈K
πℓjJ ′ij R−1
iℓ Jij
> Jij + J ′ij −
∑
ℓ∈K
πℓjWijℓ (4.57)
Logo a desigualdade (4.56) com Jij+J ′ij−∑
ℓ∈K πℓjWijℓ no lugar de(∑
ℓ∈K πℓjR−1iℓ
)−1assegura
a validade do Teorema 4.3.1 para o sistema em malha fechada. Note que, para i 6= j as matrizes
(Aij, Cij) nao dependem do ganho de realimentacao de estado e, portanto, a desigualdade
(4.53) pode ser utilizada diretamente. Contudo, para i = j o problema e nao-convexo devido
ao produto de variaveis matriciais, sendo necessaria a mudanca de variavel Yi = KiRii, de
forma a obter a versao linearizada (4.54).
Para a necessidade, devemos mostrar que a factibilidade das desigualdades (4.56), implica
na validade de (4.53). Desta forma, escolhendo Jij =(∑
ℓ∈K πℓjR−1iℓ
)−1e Wijℓ = J ′
ijR−1iℓ Jij +
ǫI com ǫ > 0, temos
(
∑
ℓ∈K
πℓjR−1iℓ
)−1
= Jij + J ′ij −J ′
ij
(
∑
ℓ∈K
πℓjR−1iℓ
)
Jij (4.58)
= Jij + J ′ij −
∑
ℓ∈K
πℓjWijℓ + ǫI (4.59)
o que indica que se as condicoes (4.56) sao satisfeitas, (4.53) tambem sao para um ǫ > 0
arbitrariamente pequeno. A prova do teorema e assim concluıda.
De maneira a obter o menor limitante superior para o custo H∞ definido em (4.6), o projeto
deve ser realizado a partir da solucao do seguinte problema de otimizacao convexa
infRij ,Wijℓ,Jij ,Yi
ρ : (4.53)− (4.55) (4.60)
que fornece os ganhos de realimentacao de estado Ki = YiR−1ii e as matrizes Pij = R−1
ij ,
(i, j) ∈ K×K importantes para a implementacao da regra.
4.4. Resultados experimentais 62
A secao seguinte trata da validacao experimental da teoria desenvolvida neste capıtulo.
4.4 Resultados experimentais
Nesta secao, a estrategia de controle H2 e H∞ e implementada para o controle conjunto
dos dois pendulos invertidos ja identificados no capıtulo anterior. O projeto deve ser realizado
cooperativamente compartilhando o mesmo canal de comunicacao, ou seja, enquanto uma
estacao de trabalho recebe o sinal de controle atualizado, a outra mantem o sinal previamente
recebido sem atualizacao.
O modelo e definido por (4.1)-(4.2), com vetor de estados xi = [xci θi xci θi]′, entrada
de controle ui = Vmi e matrizes dinamica fornecidas no Capıtulo 3, a saber, (3.47)-(3.48),
que representam a estacao de trabalho E.IP02 No1 e E.IP02 No2, respectivamente. Todas as
simulacoes e rotinas numericas foram realizadas em um computador com sistema operacional
Windows 10 Pro utilizando o software MATLABr R2015b 64-bits, com o auxılio do LMILab
e Simulink.
4.4.1 Controle H2
Para o controle cooperativo H2, adota-se o sistema (4.8)-(4.9) com condicao inicial definida
pelas matrizes
H1 =
0
π/18
0
0
, H2 =
0
−π/12
0
0
(4.61)
A saıda controlada e dada por
zi =[
xci γθi (γui/10)]′
(4.62)
com i = 1, 2 e γ = 0.3.
O sistema global foi discretizado utilizando as relacoes definidas por (4.15)-(4.16) para um
perıodo de amostragem h = 10 [ms]. Resolvemos o problema de otimizacao convexa descrito
pelo Teorema 4.2.2, considerando uma matriz de Metzler da forma
Π =
[
p 1− q
1− p q
]
(4.63)
com os escalares (p, q) variando na caixa [0, 1]× [0, 1] com passo de 0.1. A solucao otima, do
problema (4.38), correspondente a um custo garantido de 0.0622 obtido para (p, q) = (0, 0),
4.4. Resultados experimentais 63
forneceu os ganhos de realimentacao de estado
L1 =[
28.9812 −94.4876 27.8288 −19.3330]
L2 =[
27.9916 −71.6480 24.4713 −10.4432]
com K1 = K2 ≈ 0 e as matrizes Pij , (i, j) ∈ K × K importantes para a implementacao da
regra de comutacao. Esta estrategia de controle foi implementada nas plantas do fabricante
Quanser, E.IP02 No 1 e E.IP02 No 2, que opera integrado ao Simulink MATLABr. Os ensaios
foram repetidos 20 vezes e os resultados estao apresentados na Figura 4.1.
Nesta figura, os quatro primeiros graficos correspondem as trajetorias xci, θi, i = 1, 2.A regiao sombreada representa um desvio padrao da media das repeticoes, as linhas traceja-
das em azul e vermelho representam as respostas de um dos ensaios relacionadas ao sistema
E.IP02 No 1 e E.IP02 No 2, respectivamente. A linha contınua em preto representa a resposta
obtida via simulacao numerica. A Figura 4.1 tambem exibe o esforco de controle ui[k] e a
regra de comutacao (coordenador σ[k]) relacionado ao mesmo ensaio escolhido anteriormente,
para i = 1, 2. Podemos observar pelo destaque apresentado no grafico de u[k] a natureza
cooperativa do controlador, uma vez que u1[k] e u2[k] nao sofrem alteracoes simultaneas, ou
seja, quando u1[k] e atualizado u2[k] permanece constante e vice-versa. A implementacao
capturou corretamente a dinamica do sistema com comutacao. A resposta e satisfatoria com-
parada a simulacao computacional. A pequena diferenca observada na variavel xc2 deve-se a
baixa inercia do sistema E.IP02 No 2 comparado ao sistema E.IP02 No 1, o que o deixa mais
suscetıvel as nao-linearidades que nao foram levadas em conta durante a modelagem como, por
exemplo, o atrito de Coulomb, a folga no conjunto pinhao-cremalheira e a influencia dos cabos
do encoder e da alimentacao. Mesmo assim, este fator causa uma oscilacao muito baixa, com
amplitude aproximada de 3 [cm]. E importante ressaltar a robustez da estrategia de controle
face a diversos fenomenos e incertezas que foram ignoradas durante a modelagem do sistema.
4.4. Resultados experimentais 64
0 1 2 3 4-0.2
-0.15
-0.1
-0.05
0
0.05
Região de variânciaEnsaio específicoSimulação
xc1[m
]
0 1 2 3 4-0.15
-0.1
-0.05
0
0.05
0.1
0.15
0.2
Região de variânciaEnsaio específicoSimulação
θ1[rad]
0 1 2 3 4-0.05
0
0.05
0.1
0.15
0.2
Região de variânciaEnsaio específicoSimulação
xc2[m
]
tempo [s]0 1 2 3 4
-0.3
-0.2
-0.1
0
0.1
0.2
Região de variânciaEnsaio específicoSimulação
θ2[rad]
tempo [s]
0 0.5 1 1.5 2 2.5 3 3.5 4-20
-10
0
10
20
30
Ensaio específico E. IP02 Nº 1Ensaio específico E. IP02 Nº 2
0.35 0.45-2
2
0 0.5 1 1.5 2 2.5 3 3.5 4
1
2 Regra de comutação
u[V
]σ
tempo [s]
Figura 4.1: Resposta do conjunto carro-motor para controle H2
4.4. Resultados experimentais 65
x
y
Fc
Fv
Mc
lp
Mp, Jp
θ
xc
Figura 4.2: Diagrama do conjunto carro-pendulo com influencia do vento
4.4.2 Controle H∞
Para o controle cooperativo H∞, adota-se o sistema (4.1)-(4.2). Neste caso, leva-se em
consideracao uma entrada exogena wi ∈ L2 constante por partes, com perıodo de amostragem
h > 0. Para os sistemas em estudo, a forca de arrasto produzida por uma rajada de vento de
intensidade constante e fluxo laminar pode ser aproximada como uma entrada exogena deste
tipo, pois e representada por um sinal de onda quadrada.
Para validar o controle H∞ consideramos que um dos pendulos das estacoes de trabalho
E.IP02 e submetido a uma rajada de vento concentrada na ponta da sua haste, como indicado
no diagrama de forcas da Figura 4.2, em que Fv representa a forca de arrasto causada pelo
movimento do ar. O modelo em espaco de estado desprezando, por conveniencia, o ındice i e
dado por
(Mp +Meq) xc + Beq xc −Mp lp cos(θ) θ +Mp lp sen(θ) θ2 + Fv = Aeq Vm (4.64)
(Mp l2p + Jp) θ +Bp θ −Mp lp cos(θ) xc −Mp lp g sen(θ)− 2 lp Fv cos(θ) = 0 (4.65)
Considerando a mesma escolha de vetor de estados x = [xc θ xc θ]′, apos linearizar o sistema
(4.64)-(4.65), obtemos a representacao em espaco de estado
xi(t) = Aixi(t) +Biui(t) +Hiwi(t), xi(0) = 0 (4.66)
4.4. Resultados experimentais 66
em que as matrizes Ai e Bi sao as mesmas dadas em (3.20)-(3.21), com valores numericos em
(3.47) e (3.48), e as matrizes Hi sao dadas por
H1 =1
JT
0
0
Mp l2p − Jp
Mp lp + 2Meq lp
=
0
0
0.3106
21.0178
(4.67)
H2 =1
JT
0
0
Mp l2p − Jp
Mp lp + 2Meq lp
=
0
0
0.3813
72.8588
(4.68)
Definindo a saıda controlada como zi = [xci γθi (5γui/30)]′, i = 1, 2 com γ = 0.3 e discre-
tizando o sistema com h = 50 [ms], resolvemos o problema de otimizacao convexa (4.60) rela-
cionado as condicoes do Teorema 4.3.2 para a matriz de Metzler (4.63) com (p, q) = (0, 0.6354)
determinado por busca unidimensional e obtivemos os seguintes ganhos de realimentacao de
estado
L1 =[
31.8872 −104.9489 30.5089 −21.5664]
L2 =[
175.4744 −321.8152 120.4072 −47.5117]
com K1 = K2 ≈ 0 e as matrizes Pij , (i, j) ∈ K × K importantes para a implementacao da
regra de comutacao, junto ao custo garantido ρ = 8.8731.
Compressor de Ar
E.IP02 no1 E.IP02 n
o2
Figura 4.3: Montagem do experimento de perturbacao por rajada de vento
4.4. Resultados experimentais 67
Implementamos esta estrategica de controle cooperativo no sistema cuja foto da montagem
no laboratorio esta apresentada na Figura 4.3. O compressor de ar, indicado na figura, e o
responsavel pela rajada de vento que perturba somente a estacao E.IP02 No 1. Como com-
pressor, utilizamos um aspirador de po na funcao reversa com 1400 [W] de potencia. A sua
saıda de ar foi posicionada na posicao horizontal e a aproximadamente 13 [cm] da ponta do
pendulo. Alem disso, de forma a ter precisao no momento de aplicacao da perturbacao, im-
plementamos um circuito temporizador simples utilizando um rele eletromagnetico de contato
reversıvel CP1CR-DC05V comandado por um microcontrolador FRDM-KL25Z para ligar e
desligar o aspirador. Foram realizados 20 repeticoes de um ensaio de 30 [s] de duracao, em
que o compressor foi programado para ligar apenas durante o intervalo t ∈ [5, 15] [s].
Para saber a intensidade da forca Fv calculamos o valor medio da inclinacao θ1 = −2.7617
do pendulo da E.IP02 No 1 durante os ultimos 5 segundos em que a perturbacao atuava no
sistema em todos os ensaios. Resolvendo entao a equacao (4.65) para Fv e considerando os
termos derivativos nulos, obtivemos o valor de Fv = 54.4 [mN]. Esta estrategia de controle foi
implementada nas plantas do fabricante Quanser, E.IP02 No 1 e E.IP02 No 2. Os resultados
estao apresentados na Figura 4.4.
Nesta figura, os dois primeiros graficos correspondem as trajetorias xc1(t) e θ1(t) enquanto
os dois abaixo correspondem as de xc2(t) e θ2(t). A regiao sombreada representa um desvio
padrao em relacao a media, considerando as 20 repeticoes realizadas, e as linhas em azul e
vermelho correspondem as medidas de um ensaio especıfico. A Figura 4.4 tambem exibe a regra
de comutacao (coordenador σ[k]) e o esforco de controle u[k] referente ao ensaio escolhido para
cada um dos pendulos. Nota-se que, para a E.IP02 No1, a influencia da perturbacao alterou
a posicao de equilıbrio, tanto para a variavel xc1(t) quanto para θ1(t) enquanto a E.IP02
No2 mantem-se suficientemente proxima a posicao vertical desejada. Apos o efeito cessar,
ambas tendem a voltar para a origem como esperado. As oscilacoes observadas durante o
regime permanente nas figuras sao consideradas aceitaveis tendo em vista a intensidade da
perturbacao envolvida. Note que, o coordenador σ[k] mostra em qual sistema a estrutura de
controle esta atualizando o sinal, enquanto mantem o outro constante respeitando o intervalo
de h = 50 [ms]. E importante ressaltar a robustez da estrategia de controle face a diversos
fenomenos e incertezas e, ademais, e valido notar que o intervalo de amostragem foi cinco vezes
maior que o utilizado para a implementacao pratica do caso H2, reforcando assim o sucesso
da tecnica de controle proposta.
4.4. Resultados experimentais 68
0 5 10 15 20 25 30
-0.3
-0.2
-0.1
0
0.1
0.2Região de variância do ensaioAmostra do ensaio
xc1[m
]
0 5 10 15 20 25 30
-0.1
-0.05
0
0.05
0.1Região de variância do ensaioAmostra do ensaio
θ1[rad]
0 5 10 15 20 25 30
-0.3
-0.2
-0.1
0
0.1
0.2
Região de variância do ensaioAmostra do ensaio
xc2[m
]
tempo [s]0 5 10 15 20 25 30
-0.1
-0.05
0
0.05
0.1Região de variância do ensaioAmostra do ensaio
θ2[rad]
tempo [s]
0 5 10 15 20 25 30-5
0
5
10 Ensaio específico E. IP02 Nº1Ensaio específico E. IP02 Nº 2
4.8 5 5.2 5.4 5.6-4
-2
0
2
4
0 5 10 15 20 25 30
1
2 Regra de comutação
u[V
]σ
tempo [s]
Figura 4.4: Resposta do conjunto carro-motor para controle H∞
4.5. Consideracoes finais 69
4.5 Consideracoes finais
Neste capıtulo, apresentamos os principais resultados desta dissertacao. Primeiramente,
obtivemos as condicoes H2 e H∞ relacionadas ao projeto de controle cooperativo de diversos
sistemas LIT. Estes resultados foram experimentalmente validados ao realizar o controle si-
multaneo de duas estacoes de trabalho, cada uma delas correspondentes ao sistema que foi
modelado e identificado no capıtulo anterior. Foram realizados dois experimentos, um relaci-
onado ao controle H2 e o outro ao controle H∞. Neste ultimo, a perturbacao foi representada
por uma rajada de vento de intensidade constante e fluxo laminar produzida por um compres-
sor de ar. As medidas obtidas deixaram claro a validade da teoria e a eficiencia do metodo de
controle proposto.
70
CAPITULO 5
Conclusoes e Perspectivas
Neste trabalho, tratamos de um tema bastante atual, relacionado ao controle atraves da
rede de comunicacao, levando em conta limitacao da largura de faixa do canal de comunica-
cao. Mais especificamente, propusemos uma estrategia dinamica de distribuicao dos recursos
da rede, representada matematicamente por uma regra de comutacao, responsavel por esco-
lher a cada intervalo de tempo, qual sistema LIT deve receber o sinal de controle atualizado,
enquanto que os demais guardam a informacao previamente recebida. O modelo geral e des-
crito por sistemas a tempo contınuo com dados amostrados, cada um deles representado por
um sistema discreto equivalente, cuja saıda contem a mesma norma L2 da saıda do sistema
a tempo contınuo correspondente. Utilizando os modelos discretos, obtivemos condicoes H2 e
H∞ descritas em termos de desigualdades de Lyapunov ou Riccati-Metzler generalizadas para
o controle cooperativo de varios sistemas LIT, obtendo como resultado um conjunto de ganhos
de realimentacao de estado e uma regra de comutacao que asseguram estabilidade e um de-
sempenho garantido H2 ou H∞ para o conjunto. Aplicamos a tecnica de controle desenvolvida
em um sistema real composto de duas estacoes de trabalho IP02 da empresa Quanser que
consistem de um pendulo invertido, acoplado a um carro que se move sobre um trilho apos ser
atuado pela aplicacao de uma tensao no seu motor de corrente contınua. A ideia e obter um
sinal de controle adequado para manter ambos os pendulos na posicao vertical para cima e os
carros na origem. O sistema foi modelado e seus parametros foram devidamente identificados
atraves de tecnicas simples de identificacao de sistemas. Os resultados experimentais obtidos
mostram a validade da teoria e ilustram a eficiencia da tecnica de controle obtida.
Os estudos realizados durante este perıodo resultaram nos seguintes artigos cientıficos:
• J. L. Luz Netto, L. N. Egidio, J. V. Ferreira, G. S. Deaecto, “Controle cooperativo com
comutacao H2: Implementacao em pendulos invertidos via rede de comunicacao”, Anais
do Simposio Brasileiro de Automacao Inteligente, pp. 171–176, Porto Alegre - RS, 2017.
• L. N. Egidio, J. L. Luz Netto, G. S. Deaecto, “Controle cooperativo H∞ via rede de
comunicacao’, Anais do Congresso Brasileiro de Automatica, submetido, Joao Pessoa -
71
PB, 2018.
• L. N. Egidio, J. L. Luz Netto, G. S. Deaecto, “H∞ cooperative switching control in
networked control systems”, Proc. of the IEEE Conference on Decision and Control,
submitted, 2018.
Como perspectivas para trabalhos futuros podemos enfatizar a generalizacao do controle
cooperativo aqui desenvolvido para o caso de realimentacao de saıda, incluindo no modelo da
rede outras restricoes tıpicas, como por exemplo, a robustez com relacao a perda de pacotes e a
possibilidade de ocorrencia de atrasos na transmissao, deixando o sistema ainda mais proximo
de um modelo real.
72
Bibliografia
BURDEN, R. L.; FAIRES, J. D. Numerical analysis. Brooks/Cole, USA, 2001.
CHEN, T.; FRANCIS, B. A. Optimal sampled-data control systems. [S.l.]: Springer Science& Business Media, 2012.
COLANERI, P.; GEROMEL, J. C.; LOCATELLI, A. Control Theory and Design: AnRH2 and RH∞ Viewpoint. [S.l.]: Academic press, 1997.
DAI, S.; LIN, H.; GEE, S. S. A switched system approach to scheduling of networkedcontrol systems with communication constraints. Proc. of the IEEE Conference on Decisionand Control, p. 4991–4996, 2009.
DECARLO, R. A.; BRANICKY, M. S.; PETTERSSON, S.; LENNARTSON, B.Perspectives and results on the stability and stabilizability of hybrid systems. Proc. of theIEEE, v. 88, p. 1069–1082, 2000.
DONKERS, M. C. F.; HETEL, L.; HEEMELS, W. P. M. H.; WOUW, N. van de;STEINBUCH, M. Stability analysis of networked control systems using a switched linearsystems approach. Hybrid Systems: Computation and Control–Lecture Notes in ComputerScience, v. 5459, p. 150–164, 2009.
EGIDIO, L. N.; LUZ NETTO, J. L.; DEAECTO, G. S. Controle cooperativo H∞ via redede comunicacao. Anais do Congresso Brasileiro de Automatica, Joao Pessoa - PB, 2018.Submetido.
EGIDIO, L. N.; LUZ NETTO, J. L.; DEAECTO, G. S. H∞ cooperative switching controlin networked systems. Proc. of the IEEE Conference on Decision and Control, 2018.Submitted.
FIACCHINI, M.; GIRARD, A.; JUNGERS, M. On the stabilizability of discrete-timeswitched linear systems: Novel conditions and comparisons. IEEE Transactions onAutomatic Control, v. 61, p. 1181–1193, 2016.
FIACCHINI, M.; JUNGERS, M. Necessary and sufficient condition for stabilizability ofdiscrete-time linear switched systems: A set-theory approach. Automatica, v. 50, p. 75–83,2014.
GALBUSERA, L.; BOLZERN, P.; DEAECTO, G. S.; GEROMEL, J. C. State and outputfeedback H∞ control of time-delay switched linear systems. International Journal of Robustand Nonlinear Control, v. 22, p. 1674–1690, 2012.
BIBLIOGRAFIA 73
GEROMEL, J. C.; COLANERI, P. Stability and stabilization of discrete time switchedsystems. International Journal of Control, v. 79, p. 719–728, 2006.
GEROMEL, J. C.; DEAECTO, G. S.; COLANERI, P. Multi-objective H2 control viaswitched linear systems. IFAC Proceedings Volumes, v. 40, p. 238–243, 2007.
GEROMEL, J. C.; DEAECTO, G. S.; DAAFOUZ, J. Suboptimal switching controlconsistency analysis for switched linear systems. IEEE Transactions on Automatic Control,v. 58, p. 1857–1861, 2013.
GEROMEL, J. C.; KOROGUI, R. H. Controle linear de sistemas dinamicos: Teoria,ensaios praticos e exercıcios. [S.l.]: Editora Edgard Blucher, 2001.
GOLUB, G. H.; LOAN, C. F. V. Matrix computations. [S.l.]: JHU Press, 2012. v. 3.
HESPANHA, J. P.; MORSE, A. S. Switching between stabilizing controllers. Automatica,v. 38, p. 1905–1917, 2002.
HESPANHA, J. P.; NAGHSHTABRIZI, P.; XU, Y. A survey of recent results in networkedcontrol systems. Proc. of the IEEE, v. 95, p. 138–162, 2007.
KHALIL, H. K. Nonlinear systems, 3rd. New Jewsey, Prentice Hall, 2002.
LIBERZON, D. Switching in Systems and Control. [S.l.]: Springer Science & BusinessMedia, 2012.
LUZ NETTO, J. L. Implementacao pratica do controle multiobjetivo H2 em um penduloinvertido atraves de rede de comunicacao. Trabalho de Graduacao, FEM - UNICAMP,2016.
LUZ NETTO, J. L.; EGIDIO, L. N.; FERREIRA, J. V.; DEAECTO, G. S. Controlecooperativo com comutacao H2: Implementacao em pendulos invertidos via rede decomunicacao. Anais do XIII Simposio Brasileiro de Automacao Inteligente, Porto Alegre -RS, p. 171–176, 2017.
MAZO, M.; TABUADA, P. On event-triggered and self-triggered control oversensor/actuator networks. Proc. of the IEEE Conference on Decision and Control, p.435–440, 2008.
MENG, X.; CHEN, T. Event triggered robust filter design for discrete-time systems. IETControl Theory & Applications, v. 8, p. 104–113, 2014.
OLIVEIRA, M. C. Controle de sistemas lineares baseado nas desigualdades matriciaislineares. Tese de Doutorado, FEEC - UNICAMP, 1999.
QUANSER. User manual, IP02 Linear Inverted Pendulum and IP02 Linear PendulumGantry Experiments. 2012.
SHORTEN, R.; WIRTH, F.; MASON, O.; WULFF, K.; KING, C. Stability criteria forswitched and hybrid systems. SIAM review, v. 49, p. 545–592, 2007.
BIBLIOGRAFIA 74
SLOTINE, J.-J. E.; LI, W. Applied nonlinear control. [S.l.]: Prentice hall Englewood Cliffs,NJ, 1991. v. 199.
SOUSA, T. T. de; GEROMEL, J. C.; DEAECTO, G. S. Switching control resourceallocation in networked control systems. Proc. of the IEEE Conference on Decision andControl, p. 6862–6867, 2015.
SOUZA, M. Controle de sistemas dinamicos atraves de redes de comunicacao. Dissertacaode Mestrado, FEEC - UNICAMP, 2012.
SOUZA, M.; DEAECTO, G. S.; GEROMEL, J. C.; DAAFOUZ, J. Self-triggered linearquadratic networked control. Optimal Control Applications and Methods, v. 35, p. 524–538,2014.
SUN, Z. Switched linear systems: control and design. [S.l.]: Springer Science & BusinessMedia, 2006.
WANG, F.; LIU, D. Networked Control Systems: Theory and Applications. London,England: Springer-Verlag, 2008.
ZHANG, W.; HU, J.; ABATE, A. Infinite-horizon switched LQR problems in discrete time:A suboptimal algorithm with performance analysis. IEEE Transactions on AutomaticControl, v. 57, p. 1815–1821, 2012.