controle linear quadr´atico - coep.ufrj.brnero/controtlqr.pdf · controle linear quadr´atico caso...

129
Controle Linear Quadr´ atico Caso Determin´ ıstico Notas de aula para um curso de Otimiza¸c˜ ao e Controle ´ Otimo COPPE-UFRJ esbo¸ cado em 1985 refeito e impresso no 2.o semestre de 1988 revisto, ampliado e ilustrado em fevereiro-mar¸co de 1989 revisto e enriquecido em fins de 1991 aperfei¸coado ainda uma vez em outubro de 1996 an´ alise no IR n e otimiza¸ ao em outubro-novembro de 1997 revisto, reformatado e enriquecido em 10,11/1999

Upload: vuongkhanh

Post on 13-Dec-2018

241 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Controle Linear Quadratico

Caso Determinıstico

Notas de aula paraum curso de

Otimizacao e Controle Otimo

COPPE-UFRJ

esbocado em 1985

refeito e impresso no 2.o semestre de 1988

revisto, ampliado e ilustrado em fevereiro-marco de 1989

revisto e enriquecido em fins de 1991

aperfeicoado ainda uma vez em outubro de 1996

analise no IRne otimizacao em outubro-novembro de 1997

revisto, reformatado e enriquecido em 10,11/1999

Page 2: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Sumario

1 Problemas Tıpicos de Controle 11.1 Problema das condicoes terminais . . . . . . . . . . . . . . . . 21.2 Anulando z(tf ): Problema do Regulador Terminal . . . . . . . 31.3 Comportamento Funcional em um Intervalo . . . . . . . . . . 41.4 Exercıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.5 Problema do Regulador Funcional . . . . . . . . . . . . . . . . 71.6 Regulador Linear Otimo Determinıstico . . . . . . . . . . . . . 81.7 Regulador Linear Otimo Determinıstico Fixo . . . . . . . . . . 91.8 Exercıcios, ainda . . . . . . . . . . . . . . . . . . . . . . . . . 12

2 Solucao do Problema do Regulador 152.1 Solucao pelo Calculo das Variacoes . . . . . . . . . . . . . . . 162.2 Equacoes Variacionais . . . . . . . . . . . . . . . . . . . . . . 19

2.2.1 Em resumo: . . . . . . . . . . . . . . . . . . . . . . . . 222.3 Busca de Caminhos Mais Simples . . . . . . . . . . . . . . . . 272.4 Equacao de Riccati Matricial . . . . . . . . . . . . . . . . . . . 292.5 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3 Horizonte de Tempo Infinito 353.1 Discussao do Problema . . . . . . . . . . . . . . . . . . . . . . 353.2 Solucao Para o PRLOHTI . . . . . . . . . . . . . . . . . . . . 36

3.2.1 Solucao da ERM quando tf → ∞ . . . . . . . . . . . . 373.2.2 Pequena Generalizacao . . . . . . . . . . . . . . . . . . 38

3.3 Um Pouco de Teoria . . . . . . . . . . . . . . . . . . . . . . . 393.4 Solucao para o PRLOHTI . . . . . . . . . . . . . . . . . . . . 423.5 Algoritmo para Solucao do PRLOHTI . . . . . . . . . . . . . 423.6 Que Acontece se a Condicao Falha? . . . . . . . . . . . . . . . 443.7 Controlabilidade e Observabilidade . . . . . . . . . . . . . . . 443.8 Comentarios e Referencias . . . . . . . . . . . . . . . . . . . . 44

i

Page 3: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

SUMARIO ii

4 Outros caminhos. . . 464.1 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

5 Propriedades da Solucao do PRLOHTI 475.1 Retomando o pe . . . . . . . . . . . . . . . . . . . . . . . . . . 475.2 Encontrando a solucao da ERMA . . . . . . . . . . . . . . . . 485.3 Um caminho alternativo . . . . . . . . . . . . . . . . . . . . . 505.4 Que Acontece aos Polos? . . . . . . . . . . . . . . . . . . . . . 585.5 Resumo Teorico . . . . . . . . . . . . . . . . . . . . . . . . . . 625.6 Discussao dos Resultados . . . . . . . . . . . . . . . . . . . . . 63

5.6.1 Caso do Controle Barato, r pequeno. . . . . . . . . . . 635.6.2 Caso do Controle Caro, r → ∞. . . . . . . . . . . . . . 65

6 Projeto Otimo de Observadores 666.1 Observadores Assintoticos de Estados . . . . . . . . . . . . . . 666.2 Problema do estimador aberto . . . . . . . . . . . . . . . . . . 696.3 O verdadeiro problema . . . . . . . . . . . . . . . . . . . . . . 716.4 Estimadores e Filtros . . . . . . . . . . . . . . . . . . . . . . . 756.5 Medias e correlacoes de sinais . . . . . . . . . . . . . . . . . . 77

6.5.1 Valor medio de um sinal . . . . . . . . . . . . . . . . . 776.5.2 Valor medio quadratico de um sinal . . . . . . . . . . . 776.5.3 Variancia de um sinal . . . . . . . . . . . . . . . . . . . 776.5.4 Autocorrelacao de um sinal . . . . . . . . . . . . . . . 776.5.5 Correlacao cruzada entre dois sinais . . . . . . . . . . . 776.5.6 Densidade espectral de um sinal . . . . . . . . . . . . . 77

6.6 Variaveis aleatorias . . . . . . . . . . . . . . . . . . . . . . . . 776.6.1 Probabilidades . . . . . . . . . . . . . . . . . . . . . . 776.6.2 Valor medio . . . . . . . . . . . . . . . . . . . . . . . . 776.6.3 Variancia . . . . . . . . . . . . . . . . . . . . . . . . . 776.6.4 Covariancia entre x e y . . . . . . . . . . . . . . . . . . 776.6.5 Funcao distribuicao de probabilidade . . . . . . . . . . 776.6.6 Funcao densidade de probabilidade . . . . . . . . . . . 776.6.7 Media . . . . . . . . . . . . . . . . . . . . . . . . . . . 776.6.8 Valor medio quadratico . . . . . . . . . . . . . . . . . . 776.6.9 Variancia e covariancia . . . . . . . . . . . . . . . . . . 776.6.10 Distribuicao uniforme . . . . . . . . . . . . . . . . . . . 776.6.11 Distribuicao normal . . . . . . . . . . . . . . . . . . . . 77

6.7 Processos aleatorios ou estocasticos . . . . . . . . . . . . . . . 776.7.1 Ruıdo branco . . . . . . . . . . . . . . . . . . . . . . . 776.7.2 Processo gaussiano . . . . . . . . . . . . . . . . . . . . 776.7.3 Processo estocastico estacionario . . . . . . . . . . . . 77

Page 4: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

SUMARIO iii

6.7.4 Processo estocastico ergodico . . . . . . . . . . . . . . 776.7.5 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . 776.7.6 Matriz de autocorrelacao . . . . . . . . . . . . . . . . . 77

6.8 Formulacao e solucao . . . . . . . . . . . . . . . . . . . . . . 77

A Formas Quadraticas 80A.1 Formas Lineares e Quadraticas . . . . . . . . . . . . . . . . . . 80A.2 Sinal da Forma . . . . . . . . . . . . . . . . . . . . . . . . . . 84A.3 Exercıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85A.4 Criterios de definicao . . . . . . . . . . . . . . . . . . . . . . . 86A.5 Normas, Metricas e “Tamanho” . . . . . . . . . . . . . . . . . 87A.6 Exercıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89A.7 Visao Geometrica das Formas Quadraticas . . . . . . . . . . . 89A.8 Miscelanea de Formulas . . . . . . . . . . . . . . . . . . . . . 90A.9 Matrizes Hamiltonianas . . . . . . . . . . . . . . . . . . . . . 92A.10 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

B Analise no IRn 101B.1 Funcao Real de variavel vetorial . . . . . . . . . . . . . . . . . 101B.2 Continuidade e Derivadas . . . . . . . . . . . . . . . . . . . . 102B.3 Derivada: caso escalar . . . . . . . . . . . . . . . . . . . . . . 102

B.3.1 Derivadas laterais . . . . . . . . . . . . . . . . . . . . . 103B.4 Derivada: caso vetorial . . . . . . . . . . . . . . . . . . . . . . 103B.5 Derivadas de ordem superior . . . . . . . . . . . . . . . . . . . 104B.6 Funcoes Vetoriais de Variaveis Vetoriais . . . . . . . . . . . . . 105B.7 Pontos Estacionarios e Extremos . . . . . . . . . . . . . . . . 105B.8 Otimizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105B.9 PGO — Problema Geral de Otimizacao . . . . . . . . . . . . . 106B.10 Pontos Viaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . 106B.11 Solucao do PGO . . . . . . . . . . . . . . . . . . . . . . . . . 106B.12 Caso Escalar sem Restricoes . . . . . . . . . . . . . . . . . . . 107B.13 Caso Vetorial sem Restricoes . . . . . . . . . . . . . . . . . . . 108B.14 Funcoes Quadraticas . . . . . . . . . . . . . . . . . . . . . . . 109B.15 Restricoes Lineares . . . . . . . . . . . . . . . . . . . . . . . . 112B.16 PGO com Restricoes Lineares de Igualdade . . . . . . . . . . . 113B.17 PGO com Restricoes Lineares de Desigualdade . . . . . . . . . 117

B.17.1 Estudo da Regiao Viavel . . . . . . . . . . . . . . . . . 118B.18 Programacao Linear . . . . . . . . . . . . . . . . . . . . . . . 119B.19 PGO com Restricoes Nao-Lineares de Igualdade . . . . . . . . 119B.20 PGO com Restricoes Nao-Lineares de Desigualdade . . . . . . 120B.21 Metodos Numericos . . . . . . . . . . . . . . . . . . . . . . . . 121

Page 5: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

SUMARIO iv

B.22 Caso Escalar: Obtencao de Raızes . . . . . . . . . . . . . . . . 121B.22.1 Metodo da Biseccao . . . . . . . . . . . . . . . . . . . 121B.22.2 Metodo de Newton . . . . . . . . . . . . . . . . . . . . 121B.22.3 Metodo da Secante . . . . . . . . . . . . . . . . . . . . 121B.22.4 Metodo da Regula Falsa . . . . . . . . . . . . . . . . . 122B.22.5 Metodo de Interpolacoes Superiores . . . . . . . . . . . 122B.22.6 Metodo Geral dos Intervalos . . . . . . . . . . . . . . . 122B.22.7 Metodo Garantidos . . . . . . . . . . . . . . . . . . . . 122

B.23 Caso Escalar sem Restricoes: Obtencao de mınimos . . . . . . 122B.23.1 Busca de Fibonacci . . . . . . . . . . . . . . . . . . . . 122B.23.2 Busca Aurea . . . . . . . . . . . . . . . . . . . . . . . . 122B.23.3 Interpolacao Polinomial . . . . . . . . . . . . . . . . . 122B.23.4 Aproximacoes Cubicas . . . . . . . . . . . . . . . . . . 122B.23.5 Metodos Garantidos . . . . . . . . . . . . . . . . . . . 122

B.24 Caso Vetorial sem Restricoes: Obtencao de mınimos . . . . . . 122B.24.1 Metodos de Busca Direta . . . . . . . . . . . . . . . . . 122B.24.2 Algoritmo do Politopo . . . . . . . . . . . . . . . . . . 122B.24.3 Algoritmo U . . . . . . . . . . . . . . . . . . . . . . . . 122B.24.4 Metodos dp Gradiente e da Derivada Segunda . . . . . 122B.24.5 Metodo de Newton . . . . . . . . . . . . . . . . . . . . 122B.24.6 Metodos da Decomposicao Espectral . . . . . . . . . . 122B.24.7 Metodos de Primeira Ordem . . . . . . . . . . . . . . . 122B.24.8 Metodos Nao Derivativos . . . . . . . . . . . . . . . . . 123B.24.9 Problema dos Mınimos Quadrados . . . . . . . . . . . 123

B.25 Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

Page 6: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Capıtulo 1

Problemas Tıpicos de Controle

Consideremos inicialmente o sistema linear variante no tempo S descritopelas seguintes equacoes dinamicas, validas ∀t ∈ IR :

S

x(t) = A(t)x(t) +B(t)u(t); x(t0) = x0

z(t) = D(t)x(t)y(t) = C(t)x(t)

onde x(t) e um vetor de dimensao n representando o estado do sistema noinstante t; u(t) e a entrada, no instante t, com dimensao m; z(·) representa aparticular combinacao das variaveis de estado que queremos controlar, comz(t) ∈ IRp simbolizando o valor de z(·) em t. Finalmente, y(·) representa acombinacao das variaveis de estado que podemos medir efetivamente e quedeve ser usada para implementar a lei de controle; o vetor r-dimensional y(t)tem o significado usual, exprimindo o valor em t da grandeza y(·).

SISTEMA S

CONTROLADOR

-u - z

?

y

Esta formulacao e bastante geral pois, alem de condiderarmos saıdas deduas naturezas diferentes, o modelo empregado e variante no tempo. Aposeste inıcio mais geral, logo recairemos no caso linear e invariante no tempo.

1

Page 7: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 2

1.1 Problema das condicoes terminais

Este primeiro problema pode ser formulado da seguinte maneira:

Para o sistema S acima, sendo especificado um instante de tempotf > t0 e um vetor z∗ ∈ IRp, gostarıamos de fazer com que z(tf )se aproximasse o maximo possıvel de z∗.

Para uma formulacao alternativa deste problema, usando sımbolos ma-tematicos, devemos definir um sinal de erro e(t) que deve ser minimizado:sendo e(t) = z(t) − z∗, encontrar u(·) de modo que e(tf ) seja mınimo. Ouseja, queremos minimizar e(tf ), mas isto e um vetor! Podemos transformaro problema em um problema de minimizar um escalar:

Encontrar u(·) ∋ ‖e(tf )‖ = eT (tf )e(tf ) seja mınimo.

O sımbolo ∋ deve ser entendido como “tal que”. Se ha mais interesse emalgumas componentes do que em outras podemos ponderar o vetor e(tf ) pormeio de uma forma quadratica:

Encontrar u(·) ∋ eT (tf )Qe(tf ) seja mınimo, onde Q > 0.

E desta maneira o nosso problema esta formulado, de varias maneirasdiversas. Mas e bom manter em mente que propor problemas e apenas umaface da moeda. Muito mais importante e gratificante do que isso e, quandopossıvel, encontrar as solucoes dos problemas propostos . . . Chegaremos la,certamente, mas antes disso e necessario continuar acertando detalhes daformulacao. O primeiro passo no ataque de problemas como o desta secao,por exemplo, e transforma-los em problemas de aproximar a saıda de zero,ao inves de um dado valor z∗. Para entender como, seja uma variavel p(t)definida por p(t) = z∗ ∀t. Obviamente isto significa que p(t) = 0 ∀t. Temosassim mais uma equacao dinamica para representar o sistema, e o modeloglobal seria:

S

x(t) = A(t)x(t) +B(t)u(t) x(t0) = x0

p(t) = 0 p(t0) = z∗

z(t) = D(t)x(t)y(t) = C(t)x(t)

Para apresentar estas equacoes de maneira mais condensada podemosconsiderar o estado expandido

xe(t) =

[

x(t)p(t)

]

Page 8: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 3

que permitira escrever

S

xe(t) = Ae(t)xe(t) +Be(t)u(t); xe(t0) = x0e

e(t) = De(t)xe(t)y(t) = Ce(t)xe(t)

onde as matrizes expandidas Ae, etc. sao dadas por

Ae =

[

A 00 0

]

, Be =

[

B0

]

, x0e =

[

x0

z∗

]

De = [ D −I ] Ce = [ C 0 ]

Vemos assim que o problema de aproximar a saıda de um dado valorsempre pode ser substituıdo pelo problema de aproxima-la de zero, desdeque facamos as necessarias substituicoes. Entao, ao inves de estudar esteproblema das condicoes terminais na forma descrita acima, passaremos aestudar um problema mais geral:

1.2 Anulando z(tf): Problema do Regulador

Terminal

Para o sistema com o qual estamos trabalhando, abaixo reescrito para acomodidade do leitor, queremos fazer com que z(tf ) assuma o menor valorpossıvel:

S{

x(t) = A(t)x(t) +B(t)u(t); x(t0) = x0

z(t) = D(t)x(t)

Evitamos o problema de minimizacao vetorial procedendo como anteri-ormente: procurando u(·) ∋ ‖z(tf )‖ = zT (tf )z(tf ) seja mınimo. Para tornarmais geral, podemos usar uma forma quadratica positiva definida. Destemodo, sendo Q uma matriz (p× p) positiva definida, o problema fica

Encontrar u(·) ∋ J = zT (tf )Qz(tf ) seja mınimo.

Lembrando que z(t) = D(t)x(t) podemos exprimir J em termos do estadoe nao da saıda:

J = xT (tf )DT (tf)QD(tf )x(tf ) = xT (tf )Px(tf)

onde P = DT (tf )QD(tf ) e uma matriz (n × n) positiva semidefinida (porque, leitores? talvez seja bom revisitar a secao A.6). A partir deste pontopodemos chegar a formulacao mais geral deste problema:

Page 9: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 4

Encontrar u(·) ∋ J = xT (tf )Px(tf) seja mınimo, onde P ≥ 0.

E util notar que minimizar o estado terminal implica em minimizar asaıda terminal, mas a recıproca nao e verdadeira, como mostra o

Exemplo 1.2.1 Para tf → ∞, sendo x(t) = [e−t et]T , e z(t) = [1 0]x(t),verificamos que e impossıvel minimizar x(tf ), pois as trajetorias x(·) crescemindefinidamente, mas no entanto z(tf ) = 0, pois z(·) tende a origem, e menordo que isto nao da!

E bom manter sempre em mente esta diferenca. Vejamos o que se podedizer quanto a existencia de solucoes para o problema acima descrito. Elogico que se ha controlabilidade conseguiremos fazer qualquer coisa com oestado, inclusive leva-lo ate a origem em tf . Assim,

S controlavel =⇒ existe solucao com x(tf ) = 0, ou seja, Jmin = 0.

Para o caso S incontrolavel devemos ter paciencia e esperar um poucomais pela solucao.

1.3 Comportamento Funcional em um Inter-

valo

Problemas terminais como os acimadescritos tem pouca utilidade napratica: podemos ter z(tf ) e x(tf )aceitaveis mas comportamentostransitorios ruins. No mundoreal, alem dos valores finaisou terminais ou pontuais, oque acontece antes deles,ou seja, o comportamentotransitorio, e de crucialimportancia. Assim sendopodemos definir este novo problema:

- t

6

t0 tf

Para o sistema acima, sendo especificados t0 ≥ 0 e tf > t0, gos-tarıamos de fazer com que z(·) tenha um comportamento tran-sitorio adequado, isto e, z(t) satisfaca certos requisitos em todosos pontos t tais que t0 ≤ t ≤ tf .

Page 10: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 5

Na pratica, a frase “comportamento adequado” significa que as variaveistem valores pequenos, estao o mais proximo possıvel de zero. Deste modoum enunciado alternativo para o problema seria

Encontrar u(·) ∋ z(t) esta proximo de 0 ∀t ∈ [t0 tf ]

Para transformar em um problema escalar usamos a ideias de norma ou,mais geral, uma forma quadratica :

Encontrar u(·) ∋ zT (t)Q(t)z(t) esta proximo de 0 ∀t ∈ [t0 tf ]

Temos agora a funcao escalar zT (t)Q(t)z(t) cujo comportamento deve“estar proximo de 0” em todos os instantes do intervalo [t0 tf ]. Esta colocacaoainda e bastante vaga e pode gerar duvidas. Qual, por exemplo, dentre ascurvas abaixo seria considerada a melhor de acordo com este criterio?

-t

6

t0 tf

A area sob uma curva da uma boa ideia da “proximidade” de 0 da funcaodurante o intervalo, e assim podemos escrever

Encontrar u(·) ∋ J =∫ tft0zT (t)Q(t)z(t) dt seja mınimo.

Esta e a formulacao matematica mais perfeita para este problema, res-tando apenas um pequeno detalhe: como escolher Q?

Exemplo 1.3.1 Seja J =∫ tf

t0zT (t)Q(t)z(t) dt, onde

Q(t) =

[

1 −1−1 1

]

e

z(t) =

[

et

et

]

-z1

6z2

�����

z0

E facil ver que zT (t)Q(t)z(t) = 0 ∀t, ou seja, J = 0 e e consequentementemınimo. E no entanto z(t) → ∞. Isto e algo que devemos evitar. Porque ocorre? Porque a matriz Q escolhida e apenas semidefinida positiva, epodemos ter zT (t)Q(t)z(t) = 0 sem que z(t) = 0. No caso especıfico desteexemplo, xTQx = 0 sempre que as componentes x1 e x2 de x forem iguais.

Page 11: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 6

Para matrizes Q ≥ 0 os movimentos em algumas direcoes serao repre-sentados por 0: elas sao incapazes de traduzir movimentos ocorrendo nessasregioes. Com isto em mente ja temos algo util para a escolha da matriz Qno problema em estudo. Ele ficaria:

Sendo Q(t) > 0 ∀t ∈ [t0 tf ], minimizar J =∫ tf

t0zT (t)Q(t)z(t) dt

Mais a frente veremos outros detalhes sobre como escolher a matriz deponderacao Q. Por ora, lembrando que z(t) = D(t)x(t) podemos expressaro problema de minimizacao acima em termos do estado e nao da saıda:

Com P (t) = DT (t)Q(t)D(t) ≥ 0 ∀t ∈ [t0 tf ], min J =∫ tf

t0xT (t)P (t)x(t) dt

Especulemos um pouco sobre a solucao deste problema. Se S e con-trolavel deve haver solucao, pois podemos fazer qualquer coisa com o estadoe, consequentemente, podemos impor a xT (t)P (t)x(t) o comportamento quequisermos. E assim e. Sendo S controlavel a tarefa de minimizar J parecefacil. Podemos ate pensar no seguinte:

-t

6

?t0 tf

-

Ou seja, entre t−0 e t+0 realizamos uma transferencia instantanea ate aorigem e depois la mantemos o estado. Havendo controlabilidade ate isto epossıvel! Precisarıamos entretanto de impulsos unitarios e suas derivadas naentrada, e infelizmente isto e inviavel na pratica.

1.4 Exercıcios

1. Para o Sistema Linear Invariante no Tempo.x (t) = Ax(t) + Bu(t)

com rank(B) = m = numero de colunas de B, seja x(0−) = x0. En-contrar a entrada u que deve ser aplicada para que o estado seja ins-tantaneamente transferido para a origem e la permaneca: x(0+) = 0 ex(t) = 0 ∀t > 0

Page 12: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 7

1.5 Problema do Regulador Funcional

Voltando ao problema anterior para um apanhado geral, e facil ver que po-demos associar o valor de J as amplitudes da saıda, e tambem a rapidez comque ela se aproxima de zero.

-t

6

t0 tf

O ındice J mede duas coisas: o comportamento da saıda z em termos deamplitudes e a rapidez com que este sinal se aproxima de zero:

J pequeno =⇒{

amplitudes pequenas ∀taproximacao rapida de zero

Desta maneira, minimizar J e uma tarefa duplamente benvinda. Ha noentanto alguns perigos pois, como ja deve ter dado para perceber, quandoJ diminui as amplitudes de u aumentam. Isto mostra que este problema,como formulado ate agora, nao tem grande sentido pratico, e deve ser refor-mulado. Alem de minimizar J gostarıamos tambem que u(·) fosse pequeno.Ao trabalho pois, com vontade. A nova ideia pode ser resumida:

encontrar u(·) ∋ J e mınimo e u(t) e “pequeno” ∀t ∈ [t0 tf ]

ou entao, tornando o segundo quesito mais preciso:

encontrar u(·) ∋{

J e mınimo∫ tft0uT (t)R(t)u(t) dt e mınimo

Minimizar duas coisas separadamente e a mesma coisa que minimizar asua soma, desde que estas coisas sejam positivas. Como este e precisamente onosso caso, podemos reformular este problema de uma maneira mais simplese direta:

Encontrar u(·) tal que

J =∫ tf

t0[zT (t)Q(t)z(t) + uT (t)R(t)u(t)] dt e mınimo

onde Q(t) > 0 ∀t ∈ [t0 tf ] e R(t) > 0 ∀t ∈ [t0 tf ]

Page 13: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 8

Esta e uma maneira comoda e elegante de impor comportamento aceitavele rapidez de convergencia tanto para z(·) como para u(·), e formulacoes destetipo ja apresentam aplicabilidade pratica muito grande. Como nos outroscasos da para perceber que tambem aqui a controlabilidade tem muito a vercom a existencia de solucao. Mais tarde veremos isso. Por ora, um outroaspecto precisa ser encarado:Suponhamos que para um dado sistemaS uma entrada uI acarreta saıda zIe ındice JI . Para uma outra en-trada uII terıamos zII e JII .Suponhamos ainda que‖zI(tf )‖ < ‖zII(tf )‖Pode perfeitamente serque JII < JI e no entantoas condicoes terminais sao piores.Como nada foi dito a esse respeito, escolherıamos JII e pronto. Este arrazo-ado nos leva de maneira natural a estabelecer o seguinte

-t

6

t0 tf

I

II

Fato 1.5.1 Melhorar o comportamento funcional das variaveis z e u naoimplica necessariamente em melhorar tambem o comportamento terminal.

Vemos assim que esta formulacao ainda admite aperfeicoamento: ela deveser ampliada para levar em conta as condicoes terminais.

1.6 Regulador Linear Otimo Determinıstico

Alem de um bom comportamento funcional das variaveis z e u, desejamostambem boas propriedades terminais; a formulacao seria:

Encontrar u(·) tal que

J =∫ tf

t0[zT (t)Q(t)z(t) + uT (t)R(t)u(t)] dt+ zT (tf )Tz(tf ) e mınimo

onde Q(t) > 0 ∀t ∈ [t0 tf ]; R(t) > 0 ∀t ∈ [t0 tf ]; T > 0

Este problema tem sido um dos mais estudados pela comunidade cien-tıfica de Controle. A analise de sua solucao e bem conhecida e, detalhe

Page 14: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 9

importante, estas solucoes podem ser expressas como realimentacoes, comoveremos. Talvez por esta razao este problema e o de maior aplicabilidadepratica dentre todos os problemas de Controle Otimo. E um belo exemploonde o arsenal de recursos da teoria matematica e posto a trabalhar pararesolver algo do mundo pratico. Embora a teoria desenvolvida nos ultimos30 anos, principalmente a partir dos trabalhos de Bellman e Kalman, sejavalida para o caso linear geral vamos nos restringir aqui ao caso linear einvariante no tempo, ou fixo.

1.7 Regulador Linear Otimo Determinıstico

Fixo

Seja o sistema padrao

S

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)y(t) = Cx(t)

Como as matrizes representativas do sistema sao constantes, e razoavelempregar matrizes tambem constantes nas formas quadraticas do ındice aser minimizado, que passaria a ser

J = J(u) =∫ tf

t0[zT (t)Qz(t) + uT (t)Ru(t)] dt+ zT (tf )Tz(tf )

onde Q > 0, R > 0 e T > 0. O Problema do Regulador Linear OtimoDeterminıstico e Invariante no Tempo, abreviadamente chamado de PRLOa partir de agora, pode ser enunciado como

Encontrar u∗(t), com t0 ≤ t ≤ tf tal que J(u∗) = J∗ e mınimo.

Lembrando que z(t) = Dx(t) temos zT (t)Qz(t) = xT (t)R1x(t), onde (videsecao A.6) R1 = DTQD ≥ 0, e tambem zT (tf )Tz(tf ) = xT (tf )Pfx(tf ), ondePf = DTTD ≥ 0. Fazendo R = R2 chegamos a outra formulacao equivalentepara o PRLO, agora em termos do estado e nao das saıdas:

Encontrar u(·) tal que

J = J(u) =∫ tf

t0[xT (t)R1x(t) + uT (t)R2u(t)] dt+ xT (tf)Pfx(tf ) e mınimo

onde R1 ≥ 0; Pf ≥ 0; R2 > 0

Page 15: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 10

Uma vez formulado o problema, pode-se pensar em resolve-lo: a partirdo conhecimento de A,B,C,D,Q,R, T devemos pesquisar a existencia desolucoes. Intuitivamente percebe-se que controlabilidade deve desempenharum papel, mas veremos isso mais para a frente. Antes porem notemos queA,B,C,D constituem o modelo matematico do sistema que se quer con-trolar, sendo portanto dados do problema. Como encontrar as matrizes deponderacao Q,R, T , e consequentemente as matrizes R1, R2 e Pf que delasderivam? As regras gerais para esta escolha sao um tanto quanto vagas, emuitas vezes o conhecimento do problema em estudo e do que se deseja fazercom ele levara a escolha. E uma tarefa bastante dependente do sentimentodo projetista. Mesmo assim ha uma linha basica geral. Ela e vaga, comodissemos, e fica mais claro apresenta-la por meio de um

Exemplo 1.7.1 Para um motor DC, seja θ(t) a posicao angular da carga,e ω(t) a sua velocidade angular. A equacao do modelo matematico para estesistema e dada por:

ω(t) = aω(t) + bu(t); onde

{

a = −0.5 s−1

b = 150 rd/(V s2)

A finalidade do problema e estabilizar a velocidade da maneira melhorpossıvel em torno de um valor desejado ω0. Traduzir este objetivo, principal-mente o trecho “da melhor maneira possıvel”, em termos mais precisos e oque se chama formulacao do problema. Vejamos em primeiro lugar que esta-bilizar em torno de ω0 e a mesma coisa que estabilizar em torno de 0, e isto sechama regular. Supondo provisoriamente que a situacao ideal ω(t) = ω0 ∀t esatisfeita, vejamos que entrada deveria ser aplicada ao sistema para mante-la. Temos ω(t) = aω0 + bu(t) = 0, donde u(t) = u0 = −(a/b)ω0. Definindoagora uma nova variavel de estado como x(t) = ω(t)− ω0 teremos

x(t) = ω(t) = aω(t) + bu(t)= aω(t)− aω0 + aω0 + bu(t)= ax(t)− bu0 + bu(t)

Considerando entao a variavel v(t) = u(t)−u0 podemos escrever as novasequacoes para o sistema:

{

x(t) = ax(t) + bv(t)z(t) = x(t)

Assim verificamos, conforme o prometido, que estabilizar ω(t) em tornode ω0 equivale a estabilizar x(t) em torno de 0, ou seja, regular x(t). Como

Page 16: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 11

todas as variaveis sao escalares podemos formular o nosso conhecido problemade otimizacao usando como ındice:

J =∫ tf

t0[zT (t)qz(t) + vT (t)rv(t)] dt+ zT (tf)pz(tf )

=∫ tf

t0[qz2(t) + rv2(t)] dt+ pz2(tf )

Como as matrizes de ponderacao sao tambem escalares podemos igualaruma delas a 1 e mesmo assim ainda conseguiremos dar pesos relativos. Destamaneira, sendo r > 0 e p > 0 o criterio a ser minimizado fica

J =∫ tf

t0[z2(t) + rv2(t)] dt+ pz2(tf )

Minimizar J garante tres coisas:

• z(·) e pequeno (ω(·) proximo de w0)

• v(·) e pequeno (u(·) proximo de u0)

• z(tf ) e pequeno

Situacoes onde e importante manter pequenas amplitudes da entrada saochamadas de situacoes de “controle caro”, e para que o ındice reflita estacondicao devemos usar um alto valor para r. Por outro lado, situacoes ondepodemos concentrar as atencoes na melhoria de z sem nos preocuparmoscom os “gastos” envolvidos (grandes amplitudes da entrada) caracterizam ochamado controle barato. Estas instrucoes sao comunicadas ao ındice usandoum valor baixo para r. No caso limite terıamos r = 0, significando que osvalores assumidos pela entrada sao totalmente irrelevantes.

Para achar efetivamente bons valores numericos para r e p precisamos dometodo de tentativa e erro. Depois, depois, e preciso antes saber a solucao.

Exemplo 1.7.2 Para o mesmo sistema anterior, se quisermos controlar aposicao e nao a velocidade precisaremos de um modelo mais completo. Sendoagora a = −4.6s−1 e b = 0.787rd/(V s2) teremos:

[

θω

]

=

[

0 10 a

] [

θω

]

+

[

0b

]

u

O objetivo e estabilizar a posicao θ do melhor modo possıvel em torno deum valor desejado θ0. Definindo as variaveis de estado x1 = θ−θ0, e x2 = ωchegamos a

Page 17: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 12

x =

[

0 10 a

]

x+

[

0b

]

u; z = [ 1 0 ]x

Vemos que θ → θ0 se e somente se z → 0. O ındice seria como acima:J =

∫ tf

t0[z2(t) + ru2(t)] dt+ πz2(tf )

1.8 Exercıcios, ainda

1. Mostrar que xTQx = xTQTx ∀x

2. Se A = −AT a matriz A sera chamada de antisimetrica. Sendo M umamatriz (n× n) qualquer mostrar que:

(a) 12(M +MT ) e simetrica.

(b) 12(M −MT ) e antisimetrica.

3. Mostrar que qualquer matriz quadrada Q pode ser decomposta emQ = Q1 +Q2 onde Q1 e simetrica e Q2 e antisimetrica.

4. Mostrar que a forma quadratica Q e identicamente nula (xTQx = 0 ∀x)se e somente se Q e anti simetrica.

5. Sendo.x= Ax, x(0) = x0, tracar um grafico para xT (t)Qx(t). A partir

deste grafico e possıvel dizer algo sobre a estabilidade do sistema?

A =

0 1 00 0 11 1 −1

; x0 =

111

; Q =

1 1 01 0 00 0 1

6. idem 5 para

Q =

1 1 11 1 11 1 1

7. Sendo Q simetrica e positiva definida e M inversıvel, que se pode dizerde P = M−1QM? sera simetrica tambem? qual o sinal da formaxTPx? sob que condicoes de M a matriz P e simetrica? anti simetrica?positiva definida?

Page 18: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 13

8. Sendo Q simetrica e p.d. (positiva definida) e D uma matriz (r × n),com r < n, que se pode dizer de P = DTQD? (repetir os quesitos doexercıcio anterior).

9. idem 8 para r = n.

10. idem 8 para r > n

11. A figura a seguir representa um pendulo invertido com base circular.Ao eixo do disco e acoplado um motor que devera ser acionado de formaa equilibrar o pendulo na posicao vertical. Os dados numericos sao:

x =

0 1 0 056.56 −0.09 −42.42 00 0 0 1

−28.28 0.045 71.21 0

x +

05.120

−2.56

u; x0 =

π/360

π/1800

&%'$

������

��

Considerando como saıda a posicao angular do pendulo com relacao avertical do seu ponto de apoio temos

z = [ 0 0 1 0 ]

Deseja-se equilibrar o pendulo na posicao vertical (θ2 = z = 0) da“melhor maneira possıvel”. As principais restricoes fısicas do sistemasao:

• a tensao maxima admissıvel pelo motor e |u|max = 10V

• para a linearizacao permanecer valida e necessario que |x3|max =|z|max = π/18 = 10◦

Pede-se:

(a) Encontrar λ(A), o espectro de malha aberta.

Page 19: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 1. PROBLEMAS TıPICOS DE CONTROLE 14

(b) Supondo que t0 = 0 e que temos um horizonte de tempo de 01segundos, formular o problema como um problema de reguladorotimo.

(c) Escolher matrizes de ponderacao adequadas.

(d) Resolver o problema dando solucoes em MA (malha aberta) e MF(malha fechada).

(e) Apresentar, se possıvel, uma solucao em MF com F ∗ = cte. En-contrar λ∗ = λ(A+BF ∗).

(f) Embora nada se exija das variaveis x1, x2 e x4, verificar o seu com-portamento para cada uma das solucoes encontradas (elas tendempara 0? quais sao seus valores maximos?).

(g) Supondo que agora o horizonte de tempo e de 02 segundos, repetiros itens b, c, d, e, f.

(h) idem g para 05 segundos.

(i) idem g para l0 segundos.

(j) idem g para horizonte de tempo inifinito.

(k) Comparar e comentar todos os resultados obtidos ate agora.

(l) Repetir todos os itens acima, de b ate k, supondo que o interessepassa a ser em todas as variaveis de estado: z = x. Supor tambemque |x1|max = |x3|max = π/18 e que x2 e x4 permanecem irrestritas.

Page 20: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Capıtulo 2

Solucao do Problema doRegulador

Seja o sistema linear e invariante no tempo ao qual temos nos dedicado comexclusividade quase total:

S

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)

O PRLO, relembremos, significa minimizar o criterio quadratico dado por

J = J(u) =∫ tf

t0[zT (t)Qz(t) + uT (t)Ru(t)] dt+ zT (tf )Pz(tf )

onde as natrizes de ponderacao sao positivas definidas: Q > 0, R > 0 eP > 0. Ou entao, em termos do estado, minimizar

J = J(u) =∫ tf

t0[xT (t)R1x(t) + uT (t)R2u(t)] dt+ xT (tf )Pfx(tf )

onde R1 = DTQD ≥ 0 R2 = R > 0 Pf = DTPD ≥ 0

Antes de estudar aspectos relativos a existencia de solucoes, sua unicidadeetc., vamos verificar que condicoes as solucoes — se existirem — deverao sa-tisfazer. Deste modo criaremos um conjunto onde as solucoes (se existirem)deverao ser buscadas. Muitas e muitas vezes este conjunto de possıveis can-didatos e composto de poucos ou ate mesmo de um unico elemento, e assima tarefa de checar a otimalidade dos candidatos fica bem mais suave. O co-nhecimento a priori de que existem solucoes otimas tambem ajuda. Para estecaso linear pode-se provar que existe solucao e ela e unica. Maiores detalhesvirao depois.

15

Page 21: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 16

2.1 Solucao pelo Calculo das Variacoes

Supondo que a solucao existe, seja ela u∗(t), t ∈ [t0 tf ], e sejam x∗(·) e J∗ atrajetoria acarretada por ela e o ındice correspondente:

u(·) = u∗(·) −→

x = x∗(·)

J = J(u∗) = J∗ = mınimo

Isto significa que x∗(·) e u∗(·) satisfazem a equacao basica do sistema, ouseja, ∀t ∈ [t0 tf ]:

x∗(t) = Ax∗(t) +Bu∗(t) (2.1)

Vamos supor que agora a entrada aplicada ao sistema sofre uma pertur-bacao, uma variacao, e passa a nao ser mais exatamente igual a u∗:

u(·) = u∗(·) + εu(·)

onde ε e um escalar arbitrario e u(·) e uma funcao arbitraria do tempo,definida em [t0 tf ]. Esta variacao na entrada afetara o estado, e, considerandoa linearidade do sistema, a trajetoria passara a ser x(·) = x∗(·) + εx(·). Emsımbolos:

u(·) = u∗(·) + εu(·) → x(·) = x∗(·) + εx(·)Mas isto significa que, ∀t ∈ [t0 tf ]:

x∗(t) + ε.x (t) = Ax∗(t) + εAx(t) +Bu∗(t) + εBu(t) (2.2)

Aplicando (2.1) a equacao dinamica relacionando o estado x(t) pode serdeduzida:

.x (t) = Ax(t) +Bu(t) (2.3)

Podemos supor que a condicao inicial permanece inalterada quando aentrada passa de u∗(·) para u(·), ou seja: x(t0) = x0 = x∗(t0). Conclui-seque x(t0) = 0 e, usando a expressao classica para sistemas lineares fixos:

x(t) =∫ t

t0φ(t, τ)Bu(τ) dτ =

∫ tf

t0φ(t, τ)Bu(τ) dτ (2.4)

onde a matriz de transicao de estados φ(t, τ) e dada pela exponencial ma-tricial e(t−τ)A. Como o nosso sistema e causal temos φ(t, τ) = 0 ∀τ > t e aintegracao pode ser encerrada em t ou em tf .

Page 22: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 17

Podemos agora usar esses resultados e calcular o valor assumido peloındice J para u = u∗ + εu e x = x∗ + εx:

J =∫ tf

t0

[

(x∗T (t) + εxT (t))R1(x∗(t) + εx(t))+

(u∗T (t) + εuT (t))R2(u∗(t) + εu(t))

]

dt+

(x∗T (tf) + εxT (tf))Pf (x∗(tf) + εx(tf ))

Desenvolvendo e reagrupando chega-se a

J =∫ tf

t0

[

x∗T (t)R1x∗(t) + u∗T (t)R2u

∗(t)]

dt+ x∗T (tf )Pfx∗(tf ) +

{

∫ tf

t0

[

xT (t)R1x∗(t) + uT (t)R2u

∗(t)]

dt+ xT (tf)Pfx∗(tf)

}

+

ε2{

∫ tf

t0

[

xT (t)R1x(t) + uT (t)R2u(t)]

dt+ xT (tf )Pf x(tf )

}

Ufa! que trabalheira. Para colocar um pouco de simplicidade nessemacico formalismo basta observar que, dando nomes pequenos para ex-pressoes grandes, podemos escrever J = aε2 + bε + c. E agora a tarefade minimizar J em funcao do parametro ε e bem simples, pois temos umfamiliar trinomio do segundo grau. Sabemos que o mınimo Jmin ocorre para2aε + b = 0 ou, equivalentemente, para ε = −b/2a, quando a > 0. Mas poroutro lado sabemos que Jmin = J∗ ocorre quando u = u∗, ou seja, ε = 0.Disto concluimos que

a > 0 e b = 0

e isto implica em

∫ tf

t0

[

xT (t)R1x∗(t) + uT (t)R2u

∗(t)]

dt+ xT (tf)Pfx∗(tf) = 0

Entrando com o valor encontrado anteriormente para x(t) na equacao(2.4) seremos levados a:

∫ tf

t0

[

∫ tf

t0uT (τ)BTφT (t, τ) dτ

]

R1x∗(t) dt+

∫ tf

t0uT (t)R2u

∗(t) dt

+

[

∫ tf

t0uT (τ)BTφT (tf , τ) dτ

]

Pfx∗(tf) = 0

Page 23: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 18

E tome de truques! Invertendo a ordem de integracao na primeira parcela:

∫ tf

t0

[

∫ tf

t0uT (τ)BTφT (t, τ)R1x

∗(t) dt

]

dτ +∫ tf

t0uT (t)R2u

∗(t) dt

+∫ tf

t0uT (τ)BTφT (tf , τ)Pfx

∗(tf ) dτ = 0

Mais um: trocando de posicao as variaveis t e τ no primeiro e no terceirotermos:

∫ tf

t0

[

∫ tf

t0uT (t)BTφT (τ, t)R1x

∗(τ) dτ

]

dt+∫ tf

t0uT (t)R2u

∗(t) dt

+∫ tf

t0uT (t)BTφT (tf , t)Pfx

∗(tf ) dt = 0

Agrupando os termos vem

∫ tf

t0uT (t)

{

BT

[

φT (tf , t)Pfx∗(tf ) +

∫ tf

t0φT (τ, t)R1x

∗(τ) dτ

]

+

R2u∗(t)} dt = 0

Ou, mais compactamente:

∫ tf

t0uT (t)

{

BTp(t) +R2u∗(t)

}

dt = 0 (2.5)

onde novamente usamos um sımbolo simples para designar uma expressaolonga:

p(t) = φT (tf , t)Pfx∗(tf ) +

∫ tf

t0φT (τ, t)R1x

∗(τ) dτ (2.6)

Para a integral (2.5) se anular e necessario que

BTp(t) +R2u∗(t) = 0 ∀t ∈ [t0 tf ]

Como R2 deve ser inversıvel (ela e positiva definida), podemos, finalmente,explicitar a entrada u∗(t)

u∗(t) = −R−12 BTp(t) ∀t ∈ [t0 tf ] (2.7)

Pela primeira vez encontramos uma expressao para u∗, mas a sua apli-cabilidade e problematica, pois ela esta condicionada ao conhecimento davariavel p, dada pela equacao (2.6), e, convenhamos, o aspecto desta relacaoe um tanto quanto intimidador. Um expediente muito usado para contornar

Page 24: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 19

dificuldades decorrentes de expressoes complicadas e deriva-las e tentar en-contrar uma equacao diferencial da qual elas sejam solucao. Derivando entao(2.6) em relacao ao tempo:

p(t) =d

dt[φT (tf , t)]Pfx

∗(tf ) +d

dt

∫ tf

t0φT (τ, t)R1x

∗(τ) dτ

Apos um desenvolvimento, que pouco acrescentaria as nossas argucidades,chegarıamos finalmente a uma forma elegante e compacta:

p(t) = −AT p(t)−R1x∗(t)

p(tf ) = Pfx∗(tf)

Percebe-se que p e a solucao de um SLIT de dimensao n, com entrada x∗

e cuja condicao de contorno e uma condicao terminal e nao inicial. Aindaesta tudo embolado: para alcancarmos o nosso objetivo u∗ precisamos de p,para conseguirmos este precisamos resolver a equacao acima, o que faremosapenas com o conhecimento de x∗; e neste ponto precisamos de u∗ . . . Comosair desta?

2.2 Equacoes Variacionais

Sendo u(t) = u∗(t) = −R−12 BTp(t), como deduzido acima, podemos reescre-

ver a equacao (2.1):

x∗(t) = Ax∗(t)−BR−12 BTp(t); x(t0) = x0 (2.8)

A variavel p e normalmente conhecida como variavel adjunta ou entaocoestado; a equacao diferencial que a origina pode ser apresentada como

p(t) = −R1x∗(t)−ATp(t); p(tf ) = Pfx

∗(tf) (2.9)

Podemos fundir estas ultimas equacoes em uma unica:

[

x∗(t)p(t)

]

=

[

A −BR−12 BT

−R1 −AT

] [

x∗(t)p(t)

]

(2.10)

Temos assim um sistema linear, fixo, autonomo, com dimensao 2n, quepode ser escrito em uma forma mais compacta:

{

xe(t) = Aexe(t)x∗(t0) = x0; p(tf ) = Pfx

∗(tf)

Page 25: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 20

onde o vetor xe(t) e a matriz Ae sao dados por:

xe(t) =

[

x∗(t)p(t)

]

; Ae =

[

A −BR−12 BT

−R1 −AT

]

A novidade e que temos agora condicoes de contorno hıbridas: iniciaise terminais. Note-se tambem que Ae e uma matriz Hamiltoniana (apendiceA, secao A.9). Sendo Θe(t, τ) a matriz de transicao de estados para estesistema expandido, podemos escrever a expressao geral

xe(t) = Θe(t, τ)xe(τ)

Considerando os casos τ = t0 e τ = tf temos expressoes para o estado ex-pandido xe em termos das condicoes iniciais e finais: xe(t) = Θe(t, t0)xe(t0) exe(t) = Θe(t, tf)xe(tf ). Particionando a matriz Θe(t, tf ) podemos desenvolveresta ultima equacao:

[

x∗(t)p(t)

]

=

[

θ11(t, tf) θ12(t, tf )θ21(t, tf) θ22(t, tf )

] [

x∗(tf )p(tf)

]

donde saem as equacoes individuais

x∗(t) = θ11(t, tf )x∗(tf ) + θ12(t, tf )p(tf )

p(t) = θ21(t, tf )x∗(tf ) + θ22(t, tf )p(tf )

Mas p(tf ) = Pfx∗(tf ), e podemos entao escrever

x∗(t) = [θ11(t, tf) + θ12(t, tf)Pf ]x∗(tf ) (2.11)

p(t) = [θ21(t, tf) + θ22(t, tf)Pf ]x∗(tf) (2.12)

Fazendo t = t0 na equacao (2.11) pode-se relacionar x∗(tf) e x∗(t0) = x0:

x∗(t0) = [θ11(t0, tf ) + θ12(t0, tf)Pf ]x∗(tf ) = x0

o que leva, apos substituicao na equacao (2.12), a

p(t) = [θ21(t, tf ) + θ22(t, tf )Pf ][θ11(t0, tf) + θ12(t0, tf )Pf ]−1x0

Esta expressao depende apenas de x0, (conhecido) e das matrizes θij ,particoes de Θe, que podem ser calculadas (Θe e a exponencial matricialassociada a matriz Ae). Tambem e preciso haver invertibilidade daquelebloquinho, e para garantir isto necessitarıamos que a matriz HamiltonianaAe apresentasse certas caracterısticas. Depois veremos mais detalhes sobre

Page 26: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 21

estes problemas; por enquanto suporemos que o bloco e inversıvel e podemosexprimir p(t) como acima. E assim podemos finalmente apresentar a solucao:

u∗(t) = −R−12 BT [θ21(t, tf)+ θ22(t, tf)Pf ][θ11(t0, tf)+ θ12(t0, tf )Pf ]

−1x0 (2.13)

Esta entrada otima acarretaria uma trajetoria otima descrita por

x∗(t) = [θ11(t, tf ) + θ12(t, tf )Pf ][θ11(t0, tf ) + θ12(t0, tf)Pf ]−1x0 (2.14)

A expressao para o ındice otimo J∗ e um pouco trabalhosa, sera analisadadepois. Pronto, eis aı uma solucao, uma funcao do tempo que, se calculadapreviamente e depois colocada como entrada, minimizaria o nosso criterio. Soha um inconveniente: ela e uma lei em malha aberta. Qualquer modificacaoem x0 ou em parametros do sistema e esta lei passa a ter seu funcionamentoameacado. Em termos praticos isto e ruim, afinal sabe-se que para controlareficientemente os sistemas do mundo real e necessario usar realimentacao, ouseja, controle em malha fechada. Mas e facil consertar as coisas: manipulandomais uma vez as equacoes (2.11) e (2.12) — substituindo t = tf em (2.11) ecolocando o resultado em (2.12) — serıamos levados a

p(t) = [θ21(t, tf ) + θ22(t, tf )Pf ][θ11(t, tf ) + θ12(t, tf )Pf ]−1x∗(t) (2.15)

Agora p(t) foi apresentado em termos de x∗(t) e nao mais em funcao dex0. Fazendo

θ21(t, tf ) + θ22(t, tf )Pf ][θ11(t, tf ) + θ12(t, tf )Pf ]−1 = P ∗(t) (2.16)

poderemos economizar na notacao e colocar p(t) = P ∗(t)x∗(t). Temos final-mente uma formula densa:

u∗(t) = −R−12 BTP ∗(t)x∗(t)

= F ∗(t)x∗(t)

Feito, a solucao pode ser expressa como uma realimentacao de estados! Oganho e variante no tempo, mas tudo bem, agora temos controle em malhafechada

Planta S

F ∗(t) �

-

x∗(t)

u∗(t)

Este fato e importante; a solucao otima pode ser implementada por meiode realimentacao de estados. A existencia ou nao de solucoes esta associadaa invertibilidade do bloco [θ11(t, tf ) + θ12(t, tf )Pf ] e a propriedades da matrizHamiltoniana Ae. Alguns detalhes serao vistos posteriormente.

Page 27: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 22

2.2.1 Em resumo:

Dado o sistema costumeiro

S{

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)

e o ındice quadratico

J = J(u) =∫ tf

t0[xT (t)R1x(t) + uT (t)R2u(t)] dt+ xT (tf )Pfx(tf )

com R1 ≥ 0, R2 > 0, Pf ≥ 0, o procedimento basico para minimizar J estaexposto a seguir:

1. Formar o sistema expandido xe(t) = Aexe(t) onde

Ae =

[

A −BR−12 BT

−R1 −AT

]

(2.17)

2. Encontrar e particionar a matriz de transicao de estados para o sistemaacima:

Θe(t, τ) = e(t−τ)Ae =

[

θ11(t, τ) θ12(t, τ)θ21(t, τ) θ22(t, τ)

]

(2.18)

3. Calcular P ∗(t) por meio da equacao (2.16):

P ∗(t) = [θ21(t, tf ) + θ22(t, tf )Pf ][θ11(t, tf ) + θ12(t, tf )Pf ]−1

4. A solucao em malha fechada e:

u∗(t) = F ∗(t)x∗(t) onde F ∗(t) = −R−12 BTP ∗(t) (2.19)

Para fixar os conceitos, vejamos um

Exemplo 2.2.1 — Estabilizacao da velocidadePodemos pensar em um motor como o dos exemplos do capıtulo passado,

com posicao da carga medida por θ e velocidade angular w. O objetivo agorae estabilizar w em torno de w0, partindo de t0 = 0, em tf = 1. Um modelomatematico para este sistema ja foi visto anteriormente:

x(t) = ax(t) + bv(t)

z(t) = x(t)

Page 28: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 23

onde x(t) = ω(t) − ω0, v(t) = u(t) + (a/b)ω0, a = −0, 5 e b = 150. Oproblema e minimizar

J = J(v) =∫ 1

0[z2(t) + rv2(t)] dt+ pz2(1)

onde os reais r e p sao positivos. Vejamos a solucao, passo a passo. Osistema expandido e:

[

x(t)p(t)

]

=

[

a −(b2/r)−1 −a

] [

x(t)p(t)

]

Calculando e particionando a matriz Θe(t, τ) = e(t−τ)Ae chegaremos a

θ11(t, τ) = (1/4γ)[

(2γ − 1)eγ(t−τ) + (2γ + 1)e−γ(t−τ)]

θ12(t, τ) = −(b2/2rγ)[

eγ(t−τ) − e−γ(t−τ)]

θ21(t, τ) = −(1/2γ)[

eγ(t−τ) − e−γ(t−τ)]

θ22(t, τ) = (1/4γ)[

(2γ + 1)eγ(t−τ) + (2γ − 1)e−γ(t−τ)]

onde γ =√

a2 + b2/r. As expressoes para a solucao em malha aberta podem

ser obtidas por substituicao destes valores nas equacoes(2.13) e (2.14):

{

v∗(t) = −(b/r) [θ21(t, 1) + pθ22(t, 1)] [θ11(0, 1) + pθ12(0, 1)]−1 x0

x∗(t) = [θ11(t, 1) + pθ12(t, 1)] [θ11(0, 1) + pθ12(0, 1)]−1 x0

As solucoes otimas dependerao dos parametros r e p; se eles sao conhe-cidos poderemos, (apos contas brabas!) encontrar a entrada otima em malhaaberta v∗ e trajetoria otima x∗. Vemos deste modo que e preciso enfrentaro problema de escolher os parametros de ponderacao r e p. O metodo detentativa e erro e sempre uma boa pedida, a ele entao! Em primeiro lugardevemos isolar o efeito dos parametros: fixamos um deles e analisamos ooutro.

1.) – Efeito do custo do controle para condicoes terminaisdesimportantes

Isto significa usar p = 0 nas formulas acima, resultando em:{

v∗(t) = −(b/r)θ21(t, 1)[θ11(0, 1)]−1x0

x∗(t) = θ11(t, 1)[θ11(0, 1)]−1x0

Substituindo os valores e plotando para r = 100, r = 1000 e r = 10000chega-se a

Page 29: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 24

-t

1.00.5

?v∗(t)10

5

6x∗(t)

100

50

r=100r=1000

r=10000

r=100

r=1000

r=10000

Alguns fatos se destacam. Para valores elevados do parametro r, ou seja,nas chamadas situacoes de “controle caro” terıamos

r ր v ց x∗ e fraco

mostrando que, quando a entrada e muito penalizada o desempenho sofre,x∗(·) e lento e impreciso. Ja em uma situacao de “controle barato”, ou seja,valores baixos de r,

r ց v ր x∗ e bom

e o desempenho melhora pois podemos usar entradas u com amplitudes gran-des. A partir deste ponto ja e possıvel concluir algo. Supondo que conhecemosa tensao maxima suportada pelo motor, poderemos limitar o valor de r. Parao caso deste exemplo, |V |max = 3, donde r ≥ 1000.

2.) – Efeito das condicoes terminais para custo fixo

Para r = cte = 1000 podemos plotar curvas de x∗(t) e v∗(t) semelhantesas precedentes, mas para diversos valores do parametro p. As curvas seraopraticamente coincidentes, e a influencia de p apenas se faz sentir no finaldo intervalo: para valores elevados de p notamos que as condicoes terminaismelhoram. O reverso da medalha, o preco a se pagar por esse benefıcio, sereflete no fato de que a amplitude de u tambem aumenta, mas pouca coisa,e mesmo assim esse aumento se verifica apenas nas proximidades de t = 1.

Page 30: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 25

Isto e otimo, porque significa que podemos melhorar o comportamentoterminal aumentando p e respeitando a restricao de voltagem maxima nomotor! Dependendo de quanto tolerarıamos de desvio em t = 1 podemosbalizar nossa escolha de p, sempre nos lembrando de verificar se tal valornao comprometeria demasiadamente as amplitudes da entrada u. Vamossupor que neste exemplo |x∗(tf )| < 1 esta bom. Para isto as curvas diriamque devemos usar p > 0.10

3.) – Solucao em Malha Fechada

A solucao apresentada ate agora e a de malha aberta. Ja vimos quese o problema envolver aplicacoes praticas, ela e pouco confiavel e deve-sepensar em substituı-la por estrategias com realimentacao. Podemos chegaraos mesmos resultados otimos acima usando uma lei de controle em malhafechada, do tipo u∗(t) = F ∗(t)x∗(t), visto na equacao (2.19). Para o casopresente:

F ∗(t) = −r−1bP ∗(t)

= −r−1b[θ21(t, 1) + pθ22(t, 1)][θ11(t, 1) + pθ12(t, 1)]−1

Um dos inconvenientes do metodo e que a solucao em malha fechada evariante no tempo. Mas o exemplo mostraria, pela elaboracao das curvaspara diversos valores dos parametros r e p, que esta variacao e pequena eapenas perto do fim do intervalo ela se manifesta: F ∗(t) e quase constante.Em particular, se fixarmos r = 1000 e p = 0.19 teremos

F ∗(t) ≈ F ∗ = cte. = 0, 03

E isto pode ajudar na determinacao de p, pois a facilidade de imple-mentacao de realimentacoes constantes as torna atraentes e desejaveis. Elogico que se houver muita exigencia a respeito dos valores terminais estaescolha de p pode nao servir.

Exemplo 2.2.2 — Problema com restricao terminal

x(t) =

[

0 10 0

]

x(t) +

[

01

]

u; x(0) =

[

ξ1ξ2

]

Nosso objetivo: em um tempo finito tf conduzir o estado ate a origem mi-nimizando a energia gasta. Estes requisitos podem ser reescritos: encontraru(·) tal que em tf > 0, tf finito tenhamos

x(tf ) = 0 e E = E(u) =∫ tf

0

1

2u2(t) dt seja minimizada

Page 31: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 26

A primeira restricao impede a aplicacao direta da teoria ja vista. Pre-cisamos contornar este obstaculo. Este problema e chamado de problemacom restricao terminal e a teoria desenvolvida se aplica a problemas comcondicoes terminais livres:

J = J(u) =∫ tf

t0[xT (t)R1x(t) + uT (t)R2u(t)] dt+ xT (tf )Pfx(tf )

onde Pf e uma medida da importancia do valor de x(tf ). Vamos resolver oPRLO para o caso R1 = 0 e considerando

Pf =

[

p 00 p

]

= pI

Se p → ∞ estamos penalizando infinitamente x(tf ) e conseguiremos mi-nimizar J apenas quando x(tf ) = 0, como desejamos. Facamos entao R1 =0, R2 = 1/2, Pf = pI. O sistema adjunto e:

xe(t) =

[

A −bR−12 bT

0 −AT

]

xe(t) =

0 1 0 00 0 0 −20 0 0 00 0 −1 0

xe(t)

para o qual:

θ(t, τ) = θ(t−τ) =

1 t−τ (t−τ)3/3 −(t−τ)2

0 1 (t−τ)2 −2(t−τ)0 0 1 00 0 −(t−τ) 1

donde tiramos

θ21(t, tf) = 0; θ22(t, tf ) =

[

1 0tf−t 1

]

e, como podemos assumir t0=0,

θ11(t0, tf ) =

[

1 −tf0 1

]

; θ12(t0, tf) =

[

−t3f /3 −t2ft2f 2tf

]

A expressao para o controle em malha aberta sera

u∗(t) = −[0 2]p

[

1 0tf−t 1

]{[

1 −tf0 1

]

+ p

[

−t3f /3 −t2ft2f 2tf

]}−1

x0

= 2[t−tf −1]

{

p−1

[

1 −tf0 1

]

+

[

−t3f /3 −t2ft2f 2tf

]}−1

x0

Page 32: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 27

Mas p → ∞, como supusemos, logo p−1 → 0; considerando ainda, parasimplificar as manipulacoes, que tf = 3, chega-se a

u∗(t) =2

3[t−3 −1]

[

2/3 1−1 −1

] [

ξ1ξ2

]

u∗(t) =2

3

{(

2ξ13

+ ξ2

)

t− ξ1 − 2ξ2

}

2.3 Busca de Caminhos Mais Simples

Esbocemos mais uma vez, em breves palavras, o caminho que temos trilhadopara chegar a solucao do PRLO. A partir do sistema expandido calculamosΘe(t, τ), a matriz de transicao de estados para Ae; apos particiona-la conve-nientemente obtemos P ∗(t), donde tiramos F ∗(t):

Ae → Θe(t, τ) → P ∗(t) → F ∗(t) → u∗(t)

A analise dos ultimos exemplos sugere que este caminho pode ser traba-lhoso e demorado, e que seria interessante evitar o calculo de P ∗(t) a partirde Θe(t, τ). Ou seja, procura-se uma maneira alternativa de se obter P ∗(t).Recordemos ainda uma vez a expressao (2.7), que fornece a solucao otima:u∗(t) = −R−1

2 BTp(t). O coestado pode ser obtido com o auxılio da expressao(2.15), resultando em

p(t) = P ∗(t)x∗(t) (2.20)

Derivando em relacao ao tempo, e abandonando temporariamente a no-tacao P ∗(t) em favor de P (t), mais simples e geral, vem

p(t) = P (t)x∗(t) + P (t)x∗(t) (2.21)

As equacoes variacionais sao

x∗(t) = Ax∗(t)−BR−12 BTp(t) (2.22)

p(t) = −R1x∗(t)−AT p(t) (2.23)

Entrando com (2.20) em (2.22) obteremos

x∗(t) = [A−BR−12 BTP (t)]x∗(t)

a qual, substituıda em (2.21), fornece

p(t) = [P (t) + P (t)A− P (t)BR−12 BTP (t)]x∗(t) (2.24)

Page 33: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 28

Entrando agora com (2.20) em (2.23) somos levados a

p(t) = [−R1−ATP (t)]x∗(t) (2.25)

Comparando estas duas ultimas equacoes, as de numeros (2.24) e (2.25),chegamos finalmente a

{

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)− R1

P (tf) = Pf

Esta e a famosıssima Equacao de Riccati Matricial, uma equacaodiferencial matricial com condicoes de contorno terminais, e nao iniciais. Re-solvendo-a terıamos o metodo alternativo que andavamos procurando paraa obtencao de P ∗(t). A equacao de Riccati tem esse nome por se tratar deuma generalizacao da equacao escalar estudada pelo matematico italiano domesmo nome:

d

dxy(x) + α(x)y(x) + β(x)y2(x) = γ(x)

Deste modo, a solucao do PRLO esta intimamente ligada a solucao daequacao de Riccati matricial, que passaremos a designar por ERM. Ja an-teriormente — para quem leu primeiro o apendice A, secao A.9, logico! —associaramos matrizes Hamiltonianas ao nome Riccati. As conexoes vao fi-cando mais claras. Se existir uma solucao u∗ para o PRLO entao ela pode serexpressa como u∗(t) = −R−1

2 BTp(t) = −R−12 BTP ∗(t)x∗(t) onde P ∗(t) e uma

solucao da ERM. Isto permite delimitar o universo dos possıveis candidatosa solucao do PRLO: o conjunto das solucoes da ERM. Aqui, mais uma vez,a matematica auxilia:

Teorema 2.3.1 A equacao de Riccati matricial com condicao terminal

{

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)− R1

P (tf) = Pf

sempre admite uma solucao unica, normalmente designada por P ∗(t).

Pronto, estamos feitos: existe um candidato unico para ser testado, eisto obviamente ira facilitar a tarefa de buscar a solucao. Ou a funcao u∗ =−R−1

2 BTP ∗(t)x∗(t) e a solucao minimizadora ou tal solucao nao existe. Nestenovo problema a matematica pode auxiliar, como sempre.

Page 34: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 29

Teorema 2.3.2 O PRLO, conforme formulado, sempre admite solucao, ouseja, certamente existe uma funcao u∗ tal que J(u∗) e mınimo.

Estes teoremas nao serao provados aqui. Mas deve ficar clara a sua enormeimportancia. Eles garantem a existencia de solucao para o PRLO, e ensinamcomo calcula-la. O processo todo pode ser sintetizado no seguinte algoritmo:

1. Seja P ∗(t) a solucao da ERM

{

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)− R1

P (tf) = Pf

2. F ∗(t) = −R−12 BTP ∗(t)

3. u∗(t) = F ∗(t)x(t)

Mostramos assim como a solucao do PRLO esta intimamente associadaa ERM. Percebemos deste modo a importancia desta equacao, que ja a fazmerecer um estudo um pouco mais detalhado.

2.4 Equacao de Riccati Matricial

Em primeiro lugar vamos reescreve-la, como se ja nao o tivessemos feitotantas vezes nestas ultimas linhas.

{

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)− R1

P (tf) = Pf

Transpondo membro a membro as igualdades acima e lembrando queR1, R2 e Pf sao matrizes simetricas teremos, apos os algebrismos de praxe:

{

P T (t) = −ATP T (t)− P T (t)A+ P T (t)BR−12 BTP T (t)− R1

P T (tf ) = Pf

Isto significa que se P (t) e solucao da ERM, P T (t) tambem o sera. Masa solucao e unica, logo

Teorema 2.4.1 A solucao P ∗(t) da ERM e simetrica:

P ∗(t) = P ∗T (t) ∀t ∈ [t0 tf ]

Page 35: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 30

Este fato ajudara na busca de solucoes para a ERM. Antes de entrarmosnestes topicos vejamos mais fatos gerais sobre ela.

Teorema 2.4.2 A solucao P ∗(t) da ERM e positiva semidefinida no inter-valo em estudo:

P ∗(t) ≥ 0 ∀t ∈ [t0 tf ]

Supondo que iniciamos o nosso processo em um instante generico t pode-mos definir o “custo parcial” como

Jp = Jp(t, u) =∫ tf

t[xT (τ)R1x(τ) + uT (τ)R2u(τ)] dτ + xT (tf )Pfx(tf )

A solucao P ∗(t) pode ser usada para calcular este ındice de desempenhotruncado:

Teorema 2.4.3 O controle otimo u∗(t) acarretara um custo parcial otimodado por

J∗p = J∗

p (t, u∗) = x∗T (t)P ∗(t)x∗(t)

Usando o teorema acima para t = t0 encontrarıamos que o ındice totalmınimo para o intervalo de trabalho [t0 tf ] e dado por:

J∗ = J(u∗) = Jp(t0, u∗) = xT

0 P∗(t0)x0

Ainda um fato geral antes de discutirmos a busca de solucoes para aERM. Sendo X uma matriz (n× n) podemos construir a seguinte equacao:

ATX +XA−XBR−12 BTX +R1 = 0 (2.26)

Como esta equacao pode ser obtida a partir da ERM ela recebe o nomede Equacao de Riccati Matricial Algebrica ou simplesmente ERMA. Efacil notar que se a matriz de ponderacao Pf for uma solucao para a ERMAentao a ERM admitira uma solucao constante P ∗(t) = cte = Pf . Como arecıproca tambem e verdadeira temos

Teorema 2.4.4 O PRLO admite uma solucao invariante no tempo se e so-mente se a matriz de ponderacao Pf e uma solucao para a ERMA:

F ∗(t) = F ∗ = cte ⇐⇒ ATPf + PfA− PfBR−12 BTPf +R1 = 0

Page 36: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 31

Pronto, eis aqui resultados com bastante utilidade, e que justificam algo javisto nos exercıcios: para determinadas escolhas das matrizes de ponderacaoa solucao pode se tornar mais simples.

Ja vimos (aquele de nos, sabios, que comecaram a ler estas notas peloapendice A) na secao A.9 como discutir a existencia de solucoes para umaERMA—analisando a matriz Hamiltoniana associada— e tambem como efe-tivamente obter uma solucao X atraves do subespaco espectral dos modosestaveis. Se a ERMA admite uma solucao P ∗ ≥ 0 e se Pf pode ser escolhidaigual a este valor entao a solucao do PRLO sera invariante no tempo. Ea volta tambem e valida: se existe uma solucao invariante no tempo entaoetc. . .

Exemplo 2.4.1 — Exemplo de ordem 1Para o sistema escalar x(t) = ax(t)+ bu(t); x(t0) = x0, sendo q ≥ 0, r >

0, p ≥ 0, minimizar

J = J(u) =∫ tf

0[qx2(t) + ru2(t)] dt+ px2(tf )

A solucao e: u∗ = −r−1bP ∗(t)x∗(t) onde P ∗(t) e solucao da ERM:

P (t) = −2aP (t) +b2

rP 2(t)− q; P (tf) = p

Isto admite solucao analıtica. Integrando por separacao de variaveis che-garıamos a

P ∗(t) = rβ + a+ (β − a)

p− r(a+ β)p− r(a− β)

e2β(t−tf )

1− p− r(a+ β)p− r(a− β)

e2β(t−tf )

onde β =√

a2 + q/r. Fixando tf = 1, q = 1, p = 0, a = −1, b = 1, x0 = 1,

podemos esbocar as curvas x(t), u(t), P ∗(t) parametrizadas em funcao docusto de controle r. Eis uma delas:

Page 37: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 32

-t

0.5 1.0

6P ∗(t).40

.20

r=1

r=0.2

r=0.02

P ∗(t) em funcao do parametro rA existencia de solucoes invariantes no tempo esta associada a ERMA:

b2

rP 2 − 2aP − q = 0

A raiz positiva deste trinomio e P = (ar +√a2r2 + qrb2)/b2 = P ∗. Se

este valor e atribuıdo ao peso terminal p entao a ERM admite uma solucaoconstante, e a lei otima em malha fechada e invariante no tempo:

u∗(t) = F ∗x∗(t) = − b

rP ∗x∗(t) = −

a +√

a2 + qb2/r

b

Usando a = −1, b = 1 e q = 1 pode-se avaliar a influencia do peso r nassolucoes:

u∗(t) = F ∗x∗(t) =1−

1 + 1/r

b

Plotando esta funcao e tambem x∗(t) para diversos valores de r:

Page 38: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 33

-t

0.5 1.0

6x∗(t)1.0

0.5

?u∗(t)-5.0

-2.5

r=1

r=0.2

r=0.02

r=1

r=0.2

r=0.02

Desempenho em funcao do parametro r

E poderıamos continuar trabalhando neste problema, vendo por exemploa viabilidade da escolha das matrizes de ponderacao etc.

Exemplo 2.4.2 — Estabilizacao da VelocidadeE o nosso conhecido de outros exemplos:

{

x(t) = ax(t) + bv(t)z(t) = x(t)

onde a = −0.5 e b = 150 e o objetivo e minimizar

J =∫ 1

0[z2(t) + rv2(t)] dt+ pz2(1)

A solucao e v∗(t) = −R−12 BTP ∗(t)x∗(t) = −(b/r)P ∗(t)x∗(t), onde P ∗(t)

e solucao da ERM

P (t) = −ATP (t)− P (t)A+ P (t)Br−1BTP (t)− 1

= b2

rP 2(t)− 2aP (t)− 1

P (1) = Pf = p

Page 39: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 2. SOLUCAO DO PROBLEMA DO REGULADOR 34

A solucao geral da ERM para um caso escalar como este pode ser vista noexemplo anterior. Para pesquisar a existencia de uma solucao F ∗(t) cons-tante basta estudar a ERMA: 0 = −aP − Pa+ Pbr−1bP − 1 ou, arrumandodireitinho,

P 2 − 2ar

b2P − r

b2= 0

cujas raızes sao facilmente encontradas. Como a solucao que nos interessadeve ser positiva definida escolheremos

P ∗ = ra+

a2 + b2/r

b2

Usando r = 1000 encontrarıamos P ∗ ≈ 0, 19. Isto significa que se fi-zermos Pf = P ∗ = 0, 19 teremos F ∗(t) = cte. Ja havıamos chegado a estamesma conclusao anteriormente, de uma maneira empırica.

Exemplo 2.4.3 — Ainda um exemploSeja o PRLO tradicional, com

x =

[

0 10 0

]

x+

[

01

]

u; R1 =

[

2 11 4

]

; R2 = 1/2; Pf =

[

1 00 2

]

O ındice a ser minimizado pode ser expresso como

J =∫ 3

0(2x2

1 + 2x1x2 + 4x22 +

1

2u2) dτ + x2

1(3) + 2x22(3)

Desenvolvendo a ERM para os elementos de P (t) teremos

p11(t) = 2p212(t)− 2 p11(3) = 1p12(t) = −p11(t) + 2p12(t)p22(t)− 1 p12(3) = 0p22(t) = −2p12(t) + 2p222(t)− 4 p22(3) = 2

E facil perceber que a solucao da ERM e trabalhosa e problematica. Sem-pre podemos resolve-la numericamente em um computador, fazendo uma in-tegracao de tf ate t0, de tras para a frente. A finalidade de Riccati era evitaros problemas de calculo da matriz Θe(t, τ). Bem, temos agora algo com pro-priedades teoricas interessantes e camaradas, mas na hora do vamos ver, nahora de calcular mesmo ainda ha inconvenientes.

2.5 Referencias

O presente capıtulo segue com alguma proximidade os desenvolvimentos de[6]. Este material tambem poderia ser encontrado em varias outras fontes.

Page 40: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Capıtulo 3

Horizonte de Tempo Infinito

Que acontece apos tf? Se o nosso interesse no sistema cessa, podemos des-liga-lo e esta tudo resolvido. Mas na maioria das situacoes continuamosprecisando controlar o sistema, agir sobre ele mesmo apos o instante final!Podemos aplicar novamente a teoria precedente para um outro intervalo detempo [tf , tf+∆]. Ou entao usar outras taticas, nao necessariamente otimas,para manter as variaveis fixas em determinados valores, ou proximas deles.Estas estrategias sao possıveis, mas parecem desnecessariamente complica-das, por causa da mudanca da lei de controle. Por que nao projetar uma unicalei de controle capaz de acionar o sistema de uma maneira otima ao longode um intervalo de tempo bastante grande? Em termos matematicos istosignifica reformular o PRLO usando tf →∞. Este novo problema se chama

Problema do Regulador Linear Otimo com Horizonte de Tempo Infinito ou,abreviadamente, PRLOHTI. Para sistematiza-lo, seja o sistema:

S{

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)

para o qual se deve minimizar o criterio I = I(u) = limtf→∞ J(tf , u) =

limtf→∞

{

∫ tf

t0[zT (t)Qz(t) + uT (t)Ru(t)] dt+ zT (tf )Pz(tf )

}

onde Q > 0 R > 0 P > 0

3.1 Discussao do Problema

Passaremos agora a analisar varios aspectos do PRLOHTI. E bastante sim-ples verificar que se limt→∞ u(t) 6= 0 entao a integral J(tf , u) do criterio acima

35

Page 41: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 36

cresce indefinidamente quando tf → ∞ e, obviamente, o problema de mini-mizar o ındice I(u) perde o sentido. O mesmo raciocınio se aplica para z(t)e assim somos levados a conclusao de que para o PRLOHTI ter sentido eabsolutamente imprescindıvel que as variaveis z(·) e u(·) tendam para zeroquando t→∞. Dirıamos isso de uma maneira mais rigorosa afirmando que:uma condicao necessaria para haver solucao para o PRLOHTI e

limt→∞

u(t) = limt→∞

z(t) = 0

E obvio que se x(t) → 0 quando t → ∞ entao z(t) → 0 tambem. Maspodemos ter z(t) → 0 mesmo quando x(t) → ∞, desde que haja mecanis-mos de inobservabilidade envolvidos. Em suma, deve haver relacoes entre asolucao deste problema e conceitos ja conhecidos como os de observabilidade,estabilidade, etc. Mais tarde veremos isto com mais detalhes.

Vejamos agora o efeito das condicoes terminais e uma nova formulacaopara o problema. Como z(t) deve forcosamente se anular quando t → ∞concluimos que limtf→∞ zT (tf )Pz(tf ) = 0. Isto siginifica que as condicoes

terminais nao afetam este problema e podem ser eliminadas do criterio. Epossıvel, assim, aperfeicoar a formulacao do PRLOHTI: dado o sistema

S

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)

minimizar o criterio

I = I(u) =∫ ∞

t0[zT (t)Qz(t) + uT (t)Ru(t)] dt

onde Q > 0 e R > 0. Ou entao, colocando z(t) = Dx(t), minimizar

I = I(u) =∫ ∞

t0[xT (t)R1x(t) + uT (t)R2u(t)] dt

onde R1 = DTQD ≥ 0 e R2 = R > 0.

3.2 Solucao Para o PRLOHTI

Deduzimos a partir de agora o que acontece a solucao tradicional do PRLOquando tf → ∞. E bom lembrar, usando resultados do capıtulo passado, quedevemos minimizar

J = J(tf , u) =∫ tf

t0[zT (t)Qz(t) + uT (t)Ru(t)] dt+ zT (tf )Pz(tf )

Page 42: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 37

A solucao e conhecida:

u∗(t) = F ∗(t)x∗(t) = −R−12 BTP ∗(t)x∗(t)

onde P ∗(t) e uma solucao positiva semidefinida da ERM.{

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)− R1

P (tf) = Pf

na qual usamos R1 = DTQD ≥ 0, R2 = R > 0 e Pf = DTPD ≥ 0.Aceita-se com naturalidade o fato de que a solucao do PRLO e sempre

dada por u∗(t) = −R−12 BTP ∗(t)x∗(t) = F ∗(t)x∗(t), mesmo quando tf cresce:

nao haveria razoes para esta estrutura mudar. Deste modo a solucao doPRLOHTI esta associada ao limite

limtf→∞

P ∗(t)

Ou seja, para conhecer o PRLOHTI precisamos conhecer o comporta-mento da equacao de Riccati matricial quando tf → ∞.

3.2.1 Solucao da ERM quando tf → ∞Que acontece com a solucao P ∗(·) da ERM quando tf → ∞? Tudo nos levaa crer que tal solucao continua existindo. Designando-a por P ∗

∗ (t) temos

P ∗∗ (t) = lim

tf→∞P ∗(t)

Alguns autores usam o nome “solucao em regime da ERM” mas isto podelevar a confusoes com “valor de regime da solucao da ERM” o qual e definido,quando existe, como limt→∞ P ∗(t) E bom deixar bem claro que quem estatendendo a∞ e o instante final do intervalo, tf , e nao a variavel independentet. O objetivo entao e o conhecimento de P ∗

∗ (t). Para ilustrar isso seja um

Exemplo 3.2.1 Seja a ERM P (t) = 2P (t) + 1rP 2(t)− 1; P (tf ) = p, obtida

de um exemplo anterior. A sua solucao analıtica e

P ∗(t) = rβ − 1 + (β + 1)

p+ r(1− β)p+ r(1 + β)

e2β(t−tf )

1− p+ r(1− β)p+ r(1 + β)

e2β(t−tf )

onde β =√

1 + 1/r. Como o interesse se restringe as influencias de tf e p

podemos simplificar fazendo r = 1/3 o que acarreta β = 2:

Page 43: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 38

P ∗(t) =1

3

1 + 33p− 13p+ 3e

4(t−tf )

1− 3p− 13p+ 3e

4(t−tf )

Pondo p = 0 o efeito de tf podera ser mais bem apreciado.

P ∗(t) =1− e4(t−tf )

3 + e4(t−tf )

Na figura abaixo esbocamos alguns graficos para diferentes valores de tf .

-t

5.0 10.0

6

0.1

0.2

0.3

0.4P ∗(t)

tf = 1 tf = 5 tf = 9

Efeito de tf na solucao da ERM

E imediato verificar que limtf→∞ e2β(t−tf ) = 0, donde, para este caso,

limtf→∞

P ∗(t) = P ∗∗ (t) = r(β − 1) = 1/3 ∀t ∈ [0∞)

3.2.2 Pequena Generalizacao

No exemplo anterior a solucao P ∗(t) convergia, quando tf → ∞, para uma“solucao de regime” P ∗

∗ (t) constante:

limtf→∞

P ∗(t) = P ∗∗ (t) = cte. = P ∗

∗ ∀t ∈ [t0 ∞)

Isto acontecera sempre? Vejamos. Sejam a ERM{

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)− R1

P (tf) = Pf

e a ERMA associada

Page 44: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 39

−ATX −XA+XBR−12 BTX − R1 = 0

Se X∗ e uma solucao positiva semidefinida da ERMA e se pudermosescolher P (tf) = Pf = X∗ ja sabemos que a solucao da ERM sera constante:P ∗(t) = X∗ ∀t ∈ [t0 tf ]. Ou seja, em algumas situacoes a solucao P ∗(t) daERM e uma constante que depende apenas da ERMA e, consequentemente,independe do instante terminal tf . Repetindo, se houver liberdade para seescolher a condicao terminal Pf , podemos fazer

Pf = solucao ≥ 0 da ERMA =⇒ P ∗(t) = Pf ∀t ∈ [t0 tf ] e, importante!, ∀ tf

Assim, desde que Pf possa ser escolhida a vontade, quando tf → ∞ asolucao da ERM tende a um valor constante que e solucao da ERMA:

limtf→∞

P ∗(t) = P ∗∗ (t) = cte. = solucao ≥ 0 da ERMA

Lembremo-nos de algo bem recente. Para que o PRLOHTI tenha sentidoprecisamos que limtf→∞ zT (tf )Pz(tf ) = 0. Mas sendo z = Dx isto pode serescrito como

limtf→∞

xT (tf )DTPDx(tf) = lim

tf→∞xT (tf )Pfx(tf ) = 0

Como, no limite, z(tf ) → 0 vemos que o valor de P e, consequentemente,o de Pf e irrelevante, e a solucao do PRLOHTI independe da condicao ter-minal Pf , Isto, alias, ja podia ser pressentido anteriormente, quando a novaformulacao do problema nao levava em conta essa matriz. Deste modo, se asolucao do PRLOHTI pode ser obtida da equacao de Riccati e se a condicaoterminal Pf e arbitraria sempre podemos fazer uma escolha inteligente dePf , uma que acarrete solucao constante.

A abordagem vista neste item e superficial, embora seja boa para explicare fazer entender os mecanismos envolvidos neste problema. Precisamos demais rigor teorico para validar as coisas. Por exemplo, quem garante que aERMA tenha solucao? E se o tiver, sera ela positiva semidefinida?

3.3 Um Pouco de Teoria

Temos constatado a existencia de inumeros vınculos entre as equacoes deRiccati —diferencial e algebrica— e as solucoes do Problema do ReguladorLinear Otimo, em horizonte de tempo finito ou infinito. Nas secoes 2.3 e 2.4

Page 45: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 40

do capıtulo anterior apresentamos alguns resultados basicos sobre a ERM.Passamos agora a listar uma serie de propriedades a respeito das solucoes deregime dessa equcao, e de seu relacionamento com a ERMA. Para isso, sejamo sistema usual

S

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)

com o criterio

J = J(tf , u) =∫ tf

t0[xT (t)R1x(t) + uT (t)R2u(t)] dt+ xT (tf)Pfx(tf )

onde R1 ≥ 0, R2 > 0, Pf ≥ 0 e a Equacao de Riccati matricial

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)−R1

P (tf ) = Pf

Seja ainda

limtf→∞

P ∗(t) = P ∗∗ (t) onde

P ∗(t) → solucao da ERM

P ∗∗ (t) → solucao de regime da ERM

Lema 3.3.1 Supondo Pf =0, a solucao P ∗(t) da ERM tende a uma solucaode regime constante se e somente se o sistema nao possui polos simultanea-mente instaveis, incontrolaveis e observaveis.

O fato de haver uma solucao de regime constante para a ERM e assimequivalente a inexistencia de modos instaveis e incontrolaveis que sejam sen-tidos pela saıda.

Lema 3.3.2 Se o sistema em estudo e estabilizavel e detetavel entao a so-lucao P ∗(t) da ERM tende a uma solucao de regime constante qualquer queseja a condicao terminal Pf ≥ 0:

< A,B,D > estabilizavel e detetavel =⇒ limtf→∞

P ∗(t) = P ∗∗ = cte. ∀Pf ≥ 0

Este resultado e mais geral do que o anterior, embora forneca uma con-dicao apenas suficiente. Que podemos dizer da volta, do sentido inverso, ouseja, que se pode garantir quando a solucao de regime e constante?

Page 46: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 41

Lema 3.3.3 Se a solucao P ∗(t) da ERM tende a uma solucao de regimeconstante P ∗

∗ entao esta P ∗∗ e uma solucao positiva semidefinida da ERMA:

limtf→∞

P ∗(t) = P ∗∗ = cte. =⇒ P ∗

∗ ≥ 0, e solucao da ERMA

Este lema fornece uma condicao suficiente para haver solucao para aERMA, mas esta condicao nao e muito pratica. Seria bom algo baseadonas matrizes < A,B,D >.

Lema 3.3.4 Se a solucao P ∗(t) da ERM tende a uma solucao de regimeconstante P ∗

∗ e se o sistema e estabilizavel e detetavel entao P ∗∗ sera a unica

solucao positiva semidefinida da ERMA:

limtf→∞ P ∗(t) = P ∗∗ = cte.

< A,B,D >

{

estabilizavele detetavel

⇒ P ∗∗ e a unica solucao PSD da ERMA

Agora, pela primeira vez, algo sobre a unicidade. Combinando os lemas3.3.2 e 3.3.4 podemos chegar a algo mais comodo:

Lema 3.3.5 Para haver uma unica solucao PSD da ERMA e suficiente queo sistema seja estabilizavel e detetavel.

< A,B,D > estabilizavel e detetavel =⇒ ∃| solucaoP ∗∗ ≥ 0 da ERMA

Bem mais simples. E conveniente lembrar que esta condicao e apenassuficiente: a ERMA pode ter solucao unica e < A,B,D > pode ser inestabi-lizavel ou indetetavel. Mais teoremas.

Lema 3.3.6 Se a solucao P ∗(t) da ERM tende a uma solucao de regimeconstante P ∗

∗ esta sera positiva definida se e somente se o sistema e comple-tamente observavel.

limtf→∞

P ∗(t) = P ∗∗ = cte. > 0 ⇐⇒ < A,D > e observavel

Todos os resultados acima se referem a propriedades da Equacao de Ric-cati, e em especial ao seu comportamento quando tf → ∞. Propriedadesespecıficas a respeito da ERMA podem ser encontradas na secao A.9 Tudoisto e muito interessante, e e basico para o que e mais importante para nos,o problema de Controle Otimo.

Page 47: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 42

3.4 Solucao para o PRLOHTI

Se P ∗(t) tende a uma solucao constante quando tf →∞ podemos esperar queF ∗ = −R−1

2 BTP ∗∗ seja uma solucao invariante no tempo para o PRLOHTI.

E assim e.

Teorema 3.4.1 Se a solucao P ∗(t) da ERM tende a uma solucao de regimeconstante P ∗

∗ entao a lei de controle

u = −R−12 BTP ∗

∗ x = F ∗∗ x

estabiliza o sistema de malha fechada se e somente se o sistema de malhaaberta < A,B,D > for estabilizavel e detetavel.

A+BF ∗∗ e estavelcom

F ∗∗ = R−1

2 BT limtf→∞ P ∗(t)

⇐⇒ < A,B,D > e

estabilizaveledetetavel

A partir deste resultado vemos que se a solucao da ERM tende a umafuncao constante podemos implementar uma realimentacao de estados u =F ∗∗ x a partir dela. Esta lei de controle sera estabilizadora sob condicoes

bastante precisas. Nada se falou ainda sobre minimizacao.

Teorema 3.4.2 Se o sistema < A,B,D > e estabilizavel e detetavel entaoa lei de controle u = F ∗

∗ x = −R−12 BTP ∗

∗ x minimiza o ındice∫ ∞

t0[zT (t)Qz(t) + uT (t)Pu(t)] dt

atribuindo-lhe o valor mınimo dado por xT0 P

∗∗ x0

Uma vez estabelecida a importancia de uma solucao de regime P ∗∗ (t)

da ERM que seja constante, e tempo de sistematizar os conhecimentos jaadquiridos. O roteiro para enfrentar um caso concreto e dado pelo

3.5 Algoritmo para Solucao do PRLOHTI

Supondo que < A,B,D > e estabilizavel e detetavel:

1. Calcule — usando, por exemplo os resultados da secao A.9 — a solucaoP ∗∗ para a ERMA:

−ATX −XA+XBR−12 BTX − R1 = 0

(P ∗∗ e unica, e P ∗

∗ ≥ 0)

Page 48: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 43

2. u∗ = F ∗∗ x

∗ = −R−12 BTP ∗

∗ x∗ e a solucao do PRLOHTI.

3. J∗ = xT0 P

∗∗ x0

Para ilustrar este algoritmo e bem chegada a hora de um

Exemplo 3.5.1 Seja o sistema dado por

x =

[

0 10 0

]

x+

[

01

]

u; z = [1 0]x

para o qual desejamos minimizar o ındice

J =∫ ∞

0

[

xT (t)R1x(t) + uT (t)R2u(t)]

dt

onde

R1 =

[

2 11 4

]

; e R2 = 1/2

Facilmente verificarıamos que este sistema e controlavel e observavel; deacordo com o algoritmo acima seja a ERMA (com o sinal trocado):

ATX +XA−XBR−12 BTX +R1 = 0

Lembrando a secao A.9 podemos encontrar a matriz Hamiltoniana asso-ciada:

H =

[

A −BR−12 BT

−R1 −AT

]

=

0 1 0 00 0 0 −2

−2 −1 0 0−1 −4 −1 0

Esta matriz possui autovalores reais nao nulos; seu subespaco dos modosestaveis poderia ser descrito pelos autovetores associados aos autovalores “es-taveis” de A:

X−(H) =

0, 2110 0, 4968−0, 5764 −0, 3637−0, 0565 0, 8605−0, 7874 −0, 1331

Seria simples verificar que H ∈ R e poderıamos obter a solucao daERMA:

X = Ric (H) =

[

−0, 0565 0, 8605−0, 7874 −0, 1331

] [

0, 2110 0, 4968−0, 5764 −0, 3637

]−1

Page 49: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 44

=

[

2, 4641 1, 00001, 0000 1.7321

]

Deste ponto a realimentacao de estados otima sai facilmente:

F ∗ = −R−12 BTX = [−2, 0000 − 3, 4641]

3.6 Que Acontece se a Condicao Falha?

A condicao de estabilizabilidade e detetabilidade de < A,B,D > e bastantesuave e razoavel. Se < A,B >, por exemplo, nao for estabilizavel, pouco sepode fazer por este caso. Minimizar entao, nem se fala. Se < A,B > forestabilizavel mas nao detetavel o problema aparecera na impossibilidade dese implementar a lei de controle. Entao, por estas razoes, a condicao deveser aceita com naturalidade. Se ela falha e porque e mesmo difıcil.

3.7 Controlabilidade e Observabilidade

OK, tudo bem, entao o sistema < A,B,D > e estabilizavel e detetavel. Maspode haver modos incontrolaveis e/ou inobservaveis (eles serao forcosamenteestaveis). Que acontece com eles? E logico que os modos incontrolaveis per-manecem imutaveis apos realimentacao de estado. Sem grandes agressoespodemos raciocinar que os modos inobservaveis, como nao afetam z, e con-sequentemente o ındice a ser minimizado, sao deixados exatamente no lugarem que estavam, pois esta e a tatica mais economica. Assim, a solucao otimau∗ = F ∗

∗ x∗ deixa fixos os modos incontrolaveis e/ou inobservaveis, atuando

apenas sobre as partes controlaveis e observaveis de < A,B,D >. E estaspartes observaveis e controlaveis, as partes que sao efetivamente manipula-das pela solucao otima, onde sao elas colocadas? Qual e a localizacao otimados polos no plano complexo C ? Logo logo veremos isso, antes porem . . .

3.8 Comentarios e Referencias

A aplicabilidade pratica do Problema do Regulador Linear Otimo com Ho-rizonte de Tempo Infinito e maior do que a do caso com Tempo Finito. Emquase todos os casos de interesse, desejamos acompanhar um dado sistemaao longo de um intervalo de tempo grande, durante o qual as variaveis se

Page 50: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 3. HORIZONTE DE TEMPO INFINITO 45

aproximam assintoticamente de 0. A modelagem do PRLOHTI se adaptamelhor a estas necessidades do que a do PRLO.

O material apresentado neste capıtulo tambem deve ser considerado clas-sico, e faz parte da grande maioria dos textos devotados a Controle Otimo. Emais facil encontrar consideracoes sobre o problema com horizonte de tempoinfinito do que sobre o caso finito. As obras mais consultadas para elaborareste capıtulo foram [6] e [1]

Page 51: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Capıtulo 4

Outros caminhos. . .

. . . podem levar a um mesmo lugar.A aplicabilidade pratica do Problema do Regulador Linear Otimo com

Horizonte de Tempo Infinito e maior do que a do caso com Tempo Finito.No capıtulo precedente chegamos aos resultados relativos ao PRLOHTI apartir de uma particularizacao das formulas gerais obtidas anteriormentepelo Calculo das Variacoes. A partir de agora deduziremos esses resultadosatraves de uma outra metodologia, o Princıpio do Maximo.

4.1 Referencias

Este capıtulo foi inspirado em [8]

46

Page 52: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Capıtulo 5

Propriedades da Solucao doPRLOHTI

Alguns aspectos importantes a respeito dos reguladores otimos ainda esperamresposta. Por exemplo, qual e a localizacao dos autovalores da malha fechadaapos a realimentacao otimizadora? qual e o efeito dos custos de controle sobreestes autovalores otimos? A importancia teorica e pratica destes topicos eindiscutıvel, e eles serao tratados com maior profundidade neste capıtulo.Comecaremos com um resumo da situacao, depois analisaremos com maisdetalhes o relacionamento das equacoes de Riccati com as solucoes otimas, efinalmente estudaremos a localizacao otima dos polos.

5.1 Retomando o pe

A solucao do problema do regulador em tempo finito e u∗(t) = −R−12 BT p∗(t),

que depende da trajetoria otima do coestado p(t). Lembrando que coestadoe estado sempre podem ser relacionados por p(t) = P ∗(t)x(t) chegarıamos a

u∗(t) = −R−12 BTP ∗(t)x∗(t)

que caracteriza a solucao otima como uma realimentacao de estados. Estadoe coestado podem ser obtidos da equacao variacional

[

x(t)p(t)

]

=

[

A −BR−12 BT

−R1 −AT

] [

x(t)p(t)

]

A solucao desta equacao homogenea dara origem as trajetorias otimas x∗(t)e p∗(t) desde que usemos as condicoes de contorno

x(t0) = x0 e p(tf ) = P ∗(tf)x(tf ) = Pfx(tf )

47

Page 53: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 48

O carater hıbrido destas condicoes de contorno — algumas variaveis saoiniciais, outras terminais — e o principal obstaculo do caminho. Isto e con-tornavel, conforme visto, mas para evitar estes inconvenientes das equacoesvariacionais podemos deduzir as solucoes a partir da equacao de Riccatti: amatriz P ∗(t) que relaciona as trajetorias do estado e do coestado e a solucaoda ERM

P (t) = −ATP (t)− P (t)A+ P (t)BR−12 BTP (t)−R1

P (tf ) = Pf

O fato de considerarmos um regulador em tempo infinito traz simpli-ficacoes: para o PRLHOTI, a solucao procurada e a “solucao de regime”

P ∗(t) = cte. = P ∗ ∀t

que sera a solucao positiva semidefinida da ERMA, a Equacao de RiccatiMatricial Algebrica associada:

ATX +XA−XBR−12 BTX +R1 = 0

Designando esta solucao por P ∗ ou mesmo apenas X , ao inves de P ∗∗

como antes, teremos p(t) = P ∗x(t) e a solucao do PRLOHTI pode ser obtidaatraves de simplificacao da equacao original:

u∗(t) = −R−12 BTP ∗x∗(t) = F ∗x∗(t)

A realimentacao de estado e agora fixa, ou invariante no tempo, o quesimplifica bastante a implementacao pratica.

5.2 Encontrando a solucao da ERMA

A equacao variacional pode ser representada de forma compacta

xe(t) = Aexe(t)

onde, para simplificar a notacao, usou-se

xe(t) =

[

x(t)p(t)

]

; Ae =

[

A −BR−12 BT

−R1 −AT

]

A matriz Ae e Hamiltoniana. Para uniformizar a notacao com a da secaoA.9 do Apendice A, consideremos S = −BR−1

2 BT e T = −R1:

Page 54: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 49

Ae =

[

A ST −AT

]

∈ H

Segundo a propriedade A.9.1, o polinomio caracterıstico de Ae, aqui de-signado por ∆(λ), e par, ou seja, satisfaz a seguinte propriedade

∆(λ) = ∆(−λ)

Vemos assim que o espectro de Ae e simetrico com relacao a origem doplano complexo: se λi e um autovalor de Ae certamente −λi tambem o sera.Neste ponto precisaremos relembrar a propriedade A.9.4, aqui reescrita paramaior comodidade:

Propriedade 5.2.1 Se H ∈ dom(Ric) e X = Ric(H), entaoa.) X e simetricab.) A+ SX e estavelc.) X e solucao da equacao de Riccati matricial algebrica

ATX +XA+XSX − T = 0

A consequencia pratica mais importante deste resultado e a maneira dese obter uma solucao para a ERMA. Quando a estrutura modal de Ae ecamarada, isto pode ser feito a partir do calculo dos autovetores associadosa autovalores estaveis. Se este caminho for problematico devemos fatorar opolinomio mınimo, conforme discutido na secao A.9.

Do ponto de vista teorico e preciso ressaltar a importancia do item (b).Com efeito, dizer que A+SX e estavel significa dizer que A−BR−1

2 BTX =A+BF ∗ e estavel e tem autovalores iguais aos autovalores estaveis da matrizHamiltoniana Ae. Este fato e suficientemente importante para merecer uma

Propriedade 5.2.2 Os autovalores do sistema de malha fechada otimo saoos autovalores estaveis da matriz variacional Ae.

Para sistematizar o corpo de conhecimentos ja desenvolvidos:

Algoritmo para o PRLOHTI

1. Contruir a matriz variacional

Ae =

[

A ST −AT

]

=

[

A −BR−12 BT

−R1 −AT

]

Page 55: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 50

2. Verificar se Ae ∈ R = dom (Ric)

3. Se sim, calcular uma base X− para o subespaco dos modos estaveisX−(Ae) e particiona-la em

X− =

[

X1

X2

]

4. Obter X = X2X−11 , solucao da ERMA

5. Sendo F ∗ = −R−12 BTX aplicar a lei de controle u∗ = F ∗x ao sistema.

6. Os autovalores otimos da malha fechada sao os autovalores estaveis deAe

5.3 Um caminho alternativo

Os aspectos basicos mais importantes, apresentados ao longo do texto, foramrecapitulados na secao anterior. Passamos agora a reapresentar uma partedesse material de maneira diferente, com um nıvel de detalhamento maiormas de modo ligeiramente menos geral. No restante desta secao usaremos ahipotese de que os autovalores de Ae sao distintos. Com perdas irrisorias degeneralidade esta hipotese simplificara os desenvolvimentos, pois permitiraexprimir os subespacos espectrais em termos dos autovetores, deixando assimtransparecer com mais clareza os fatos importantes. Como primeira aplicacaoredemonstraremos a propriedade A.9.4, com a hipotese adicional.

Demonstracao: Podemos ordenar o espectro de Ae, colocando em pri-meiro lugar os autovalores com parte real positiva:

λ(Ae) = {λ1, λ2, . . . , λn, λn+1, . . . , λ2n}

onde Re(λi) ≥ 0 ∀i = 1, 2, . . . , n e Re(λi) ≤ 0 ∀i = n+1, . . . , n.Se algum autovalor λj e imaginario puro (Re(λj) = 0), ele pode ser

colocado em qualquer uma das particoes; seu conjugado deve ser colocado naoutra. Sejam wi, i = 1, 2, . . . , 2n os autovetores associados aos autovaloresλi: Aewi = λiwi, i = 1, 2, . . . , 2n. Como por hipotese os λi sao distintos os wi

serao linearmente independentes e a matriz W = [wi · · · w2n] sera inversıvel.Efetuando a mundaca de bases xe(t) = Wxe(t) teremos

Ae = W−1AeW =

[

Λ⊕ 00 Λ⊖

]

, onde

Page 56: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 51

Λ⊕ =

λ1

λ2

. . .

λn

Λ⊖ =

λn+1

λn+2

. . .

λ2n

Se os autovalores tiverem sido ordenados de uma maneira simetrica tere-mos λi + λi+n = 0, ∀i = 1, 2, . . . , n e, obviamente

Λ⊕ = Λ; Λ⊖ = −Λ onde Λ =

λ1

λ2

. . .

λn

Particionando o vetor expandido xe como xe =

[

qIqII

]

teremos

qI = ΛqI e qII = −ΛqII

Por outro lado, xe = W−1xe, o que permite escrever[

qIqII

]

=

[

V11 V12

V21 V22

] [

xp

]

onde ja particionamos W−1 = V de maneira compatıvel. A variavel qI(t)pode ser obtida a partir de

qI(t) = V11x(t) + V12p(t)

= V11x(t) + V12P∗x(t)

= (V11 + V12P∗)x(t)

Se as condicoes iniciais foram colocadas corretamente o x(t) da expressaoacima deve ser substituıdo por x∗(t). Mas o controle otimo e sempre esta-bilizador, e assim x∗(t) → 0 quando t → ∞. Consequentemente qI(t) → 0quando t → ∞. Mas

qI(t) = e(t−t0)ΛqI(t0)

Como os autovalores de Λ tem partes reais positivas ou nulas, podemoster qI(t) → 0 apenas quando qI(t0) = 0 ou seja: (V11 + V12P

∗)x0 = 0. Todoeste arrazoado deve ser independente da condicao inicial x0 e assim podemoscolocar

V11 + V12P∗ = 0

Page 57: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 52

Usando outra linha de argumentacao provarıamos que V12 e inversıvel, eisto leva a

P ∗ = −V −112 V11

Pronto, eis aı um modo de exprimir P ∗ em termos dos blocos da ma-triz V = W−1. Se particionassemos tambem a matriz W dos autovetoresencontrarıamos

P ∗ = −V −112 V11 = W22W

−112

Se a matriz Ae for facilmente diagonalizavel as identidades acima podemser uteis para o calculo de P ∗. E sempre util ter em mente que todos estesaspectos ja foram vistos anteriormente, com uma abordagem mais geral,concisa e elegante. Para ver onde ficam os autovalores otimos, consideremosa solucao xe(t) da equacao variacional:

xe(t) = Wxe(t)

= We(t−t0)AeW−1x0e

Desenvolvendo:[

x∗(t)p∗(t)

]

= W

e(t−t0)Λ 0

0 e−(t−t0)Λ

[

V11 V12

V21 V22

] [

x0

P ∗x0

]

[

x∗(t)p∗(t)

]

=

[

W11 W12

W21 W22

]

e(t−t0)Λ 0

0 e−(t−t0)Λ

[

(V11 + V12P∗)x0

(V21 + V22P∗)x0

]

Como V11 + V12P∗ = 0 temos

x∗(t) = W12e−(t−t0)Λ(V21 + V22P

∗)x0

p∗(t) = W22e−(t−t0)Λ(V21 + V22P

∗)x0

Para t = t0 a primeira das igualdades acima se particulariza em

x∗(t0) = x0 = W12e0(V21 + V22P

∗)x0

Como isto deve ser verdadeiro ∀ x0, teremos V21 + V22P∗ = W−1

12 e pode-mos escrever, finalmente,

x∗(t) = W12e−(t−t0)ΛW−1

12 x0

Isto mostra claramente que os autovalores do sistema de malha fechadaotimo — os modos responsaveis pelo comportamento dinamico da trajetoria

Page 58: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 53

x∗(t) — sao exatamente os elementos de −Λ! Como o sistema de malhafechada otimo e sempre assintoticamente estavel concluimos que todos o au-tovalores de −Λ tem partes estritamente negativas e, consequentemente, quea matriz Ae nao possui autovalores no eixo imaginario. estes fatos podem serresumidos no

Teorema 5.3.1 Suponha que < A,B > e estabilizavel e que < D,A > edetetavel; suponha tambem que a matriz

Ae =

[

A −BR−12 BT

−R1 −AT

]

possui 2n autovalores distintos. Nestas condicoes:

1. se λ ∈ λ(Ae) entao −λ ∈ λ(Ae)

2. se λ ∈ λ(Ae) entao Re(λ) 6= 0

3. λ(A+BF ∗) ⊂ λ(Ae)

4. se Ae e diagonalizada como

Ae =

[

Λ 00 −Λ

]

= W−1AeW = V AeV−1

onde Λ engloba os autovalores com parte real positiva entao a solucaode regime da ERMA sera

P ∗ = −V −112 V11 = W22W

−112

5. a trajetoria otima do regulador sera

x∗(t) = W12e−(t−t0)ΛW−1

12 x0

Para concluir este enfoque,

Algoritmo para Solucao do PRLOHTI

1. Verificar se < A,B,D > e estabilizavel e detetavel

2. Supondo que sim, construir

Ae =

[

A −BR−12 BT

−R1 −AT

]

Page 59: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 54

3. Diagonaliza-la separando os modos instaveis dos estaveis:

W−1AeW =

[

Λ 00 −Λ

]

4. P ∗ = W22W−112

5. u∗ = F ∗x∗ = −R−12 BTP ∗x∗

Deve ficar bem claro que este algoritmo e absolutamente equivalente aoda secao anterior.

Exemplo 5.3.1 Seja o sistema

x(t) =

[

0 10 0

]

x(t) +

[

01

]

u(t); x(t0) = x0; z(t) = x(t)

com o objetivo de minimizar J = J(u) =∫∞0 [xT (t)R1x(t) + ru2(t)] dt, onde

R1 =

[

1 bb a

]

; a− b2 > 0 (para que R1 > 0); r = 1

A ERMA sera ATX +XA−XBR−12 BTX +R1 = 0. Usando os valores

dados somos levados a[

0 01 0

]

X +X

[

0 10 0

]

−X

[

0 00 1

]

X = −[

1 bb a

]

Solucao frontal da ERMA

Para este caso, razoavelmente simples, resolveremos a ERMA “na mar-ra”. A solucao positiva definida X sera da forma

X =

[

x11 x12

x12 x22

]

Entrando com isto na ERMA obteremos[

0 0x11 x12

]

+

[

0 x11

0 x12

]

−[

x122 x12x22

x12x22 x222

]

= −[

1 bb a

]

donde tiramos as equacoes

x122 = 1

2x12 − x222 = −a

x11 − x12x22 = −b

Page 60: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 55

que podem ser resolvidas facilmente, dando origem a

x12 = ±1x22 = ±

√a+ 2x12

x11 = −b+ x12x22

O teorema A.4.1, de Sylvester, garante que os menores principais de Xdevem ser positivos

{

x11 > 0x11x22 − x12

2 > 0

A segunda desigualdade acima pode se transformar em x11x22 > x122 = 1,

usando resultado imediatamente anterior. Como x11 > 0 temos trivialmenteque x22 > 1/x11 donde x22 > 0 tambem, e podemos escolher

x22 = +√a + 2x12

A tarefa agora e decidir sobre o sinal de x12. Vamos supor que x12 = −1.Com isto:

{

x22 =√a− 2

x11 = −b−√a− 2

Como X e uma matriz real devemos ter a − 2 ≥ 0, ou seja, a ≥ 2.Estamos em condicoes de estabelecer a seguinte cadeia logica:

x11x22 > 1 =⇒ −(b+√a− 2)

√a− 2 > 1

=⇒ b√a− 2 + (a− 2) < −1

=⇒ b√a− 2 < 1− a

=⇒ b < (1− a)/√a− 2

Mas (1−a) < 0, pois a ≥ 2. Isto implica que b < (1 − a)/(√a− 2 ) < 0.

Quadrando teremos

b2 >(a− 1)2

a− 2=

a2 − 2a+ 1

a− 2= a +

1

a− 2

Notemos para terminar (em boa hora!), que 1/(a−2) ≥ 0, porque a−2 ≥0. Mas isto significa que

b2 > a+1

a− 2≥ a

o que e um absurdo, pois R1 > 0 e consequentemente a−b2 > 0 e b2 < a. Esselongo e artificioso raciocınio chega finalmente a seu alvo, a determinacao deX, solucao da ERMA, em termos dos parametros de R1:

x12 = 1x22 =

√a+ 2

x11 = −b+√a+ 2

=⇒ X =

[

−b +√a+ 2 1

1√a+ 2

]

Page 61: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 56

Solucao por Diagonalizacao

Para evitar as delicadezas de um procedimento como este anterior, po-demos usar a teoria precedente e seus metodos “automatizados” para obtersolucoes da ERMA. Uma simples substituicao dos dados do problema forne-ceria a matriz

Ae =

0 1 0 00 0 0 −1

−1 −b 0 0−b −a −1 0

cujo polinomio caracterıstico e dado abaixo, juntamente com suas raızes

∆(λ) = det(λI−Ae) = λ4 − aλ2 + 1 =⇒ λ2 =

a+√a2 − 42 = k1

a−√a2 − 42 = k2

A partir daqui temos o espectro de Ae, seus autovetores e a matriz demudanca de bases W :

λ(Ae) = {√

k1,√

k2,−√

k1,−√

k2} = {λ1, λ2, λ3, λ4}

W =

1 1 1 1λ1 λ2 λ3 λ4

(λ13−aλ1−b) (λ2

3−aλ2−b) (λ33−aλ3−b) (λ4

3−aλ4−b)−λ1

2 −λ22 −λ3

2 −λ42

donde podemos extrair, lembrando a recente teoria, P ∗ = W22W−112 , resul-

tando

P ∗ =

[

λ33 − aλ3 − b λ4

3 − aλ4 − b−λ3

2 −λ42

] [

1 1λ3 λ4

]−1

=

[

−λ3λ4(λ3 + λ4) + b λ42 + λ4λ3 + λ3

2 − aλ3λ4 −(λ3 + λ4)

]

Pronto! Ufa . . . E so efetuar os calculos e teremos

X =

[

−b+√a + 2 1

1√a + 2

]

Page 62: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 57

como anteriormente, e logico. Qual dos dois metodos e mais simples? Parapegar a fera a unha, com a pura forca das nossas munhecas, ambos pare-cem desanimadoramente trabalhosos e a escolha mais razoavel seria pedirum computador, pois afinal e para isso mesmo que eles existem.

O controle otimo propriamente dito sera dado por u∗(t) = F ∗(t)x(t), onde

F ∗(t) = −R−12 BTX = [ −1 −

√a+ 2 ]

Com estes valores o sistema de malha fechada ficara

A+BF ∗ =

[

0 1−1 −

√a+ 2

]

com equacao caracterıstica e autovalores dados por

∆F (λ) = λ2 + (√a+ 2)λ+ 1 =⇒

λ1∗ = −

√a+ 2 +

√a− 2

2

λ2∗ = −

√a+ 2−

√a− 2

2

Discussao da Solucao

caso a = 0: isto significa nenhuma enfase na componente x2 = x1. Naoestamos interessados na derivada da saıda ou seja, a velocidade pode

ser alta. Os autovalores seriam −√2± j

√2

2e terıamos uma solucao os-

cilatoria.

caso a = 2: ja passamos a penalizar velocidades muito grandes, e os auto-valores serao −2±0

2= −1, reais e iguais significando amortecimento

crıtico. O sistema e mais lento mas oscila menos.

caso a > 2: agora e importante termos velocidades baixas. Os polos seraoreais e distintos e a resposta sera super amortecida, isto e, lenta mascom derivada baixa.

ausencia de b: tanto a realimentacao otima F ∗ quanto os autovalores oti-mos λ∗

i dependem apenas do parametro a. Isto significa que os ter-mos cruzados x1x2, ponderados pelo parametro b em R1, nao afetam asolucao otima. Fatos semelhantes acontecem com alguma frequencia, esao, possivelmente, os responsaveis por uma pratica bastante comum:o uso de matrizes de ponderacao diagonais.

Page 63: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 58

5.4 Que Acontece aos Polos?

Veremos agora um enfoque frequencial da teoria do Regulador Linear Qua-dratico. Por enfoque frequencial entendemos a analise dos aspectos relacio-nados as funcoes de transferencia e seus parametros. Seja entao o sistemausual

S

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)

Podemos tambem representa-lo por meio de

S

Z(s) = G(s)U(s) +G′(s)x0, onde

G(s) = D(sI −A)−1B, e G′(S) = D(SI −A)−1

Seja o PRLOHTI, onde, para Q > 0 e R > 0 devemos minimizar

J = J(u) =∫ ∞

t0[zT (t)Qz(t) + uT (t)Ru(t)] dt

Supondo que u∗(t) = F ∗x∗(t)+v(t) e a solucao otima, o sistema de malhafechada ficara

SF

x(t) = (A+BF ∗)x(t) +Bv(t); x(t0) = x0

z(t) = Dx(t)

ou entao

SF

Z(s) = GF (s)U(s) +G′F (s)x0, onde

GF (s) = D(sI − A− BF ∗)−1B, e G′(s) = D(sI −A−BF ∗)−1

Qual e a localizacao otima no plano complexo C para os autovalores de(A + BF ∗)? Ha lugares especiais para os polos da malha fechada? Come-caremos esta analise estudando a influencia das matrizes de ponderacao Qe R sobre o posicionamento otimo dos polos da malha fechada. Veremos asconsequencias acarretadas por controles “baratos” e “caros”.

Antes de prosseguir, um aspecto simplificador. Temos apenas duas ma-trizes de ponderacao: Q e R. A influencia relativa delas pode ser medidafixando o valor de uma e fazendo a outra variar. Assim podemos escolher

Q = I = fixa

R = rN onde r e um escalar variavel

Page 64: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 59

Isto significa que todas as componentes da saıda estao sendo igualmenteponderadas. Outras matrizes nao tao triviais poderiam ter sido escolhidasmas o algebrismo ficaria seriamente comprometido e as conclusoes qualita-tivas seriam praticamente identicas. A escolha R = rN significa que todosos elementos de R variarao proporcionalmente. Isto e uma hipotese razoavele simplificara bastante as coisas. Valores elevados de r significam “controlecaro” ou seja, os nıveis de u(·) devem ser mantidos baixos. Valores pequenospara r permitem grandes amplitudes da entrada, caracterizando o “controlebarato.”

Veremos agora a localizacao dos polos de malha fechada em funcao de r.Ja sabemos que os autovalores de A+BF ∗ serao os autovalores estaveis de Ae.Para calcular o polinomio caracterıstico λ(Ae) usarıamos desenvolvimentosanalogos aos feitos na secao A.9 do Apendice A, resultando em ∆e(s) =

det(sI −A)det(sI + A)det[

I − R−12 BT [(sI + A)T ]−1DTD(sI − A)−1B

]

Como sI + A = −I(−sI −A) e como

GT (s) = BT [(sI − A)−1]TDT = BT [(sI −A)T ]−1DT

vemos que:

∆e(s) = det(sI −A)det(−I)det(−sI − A)det[I +R−12 GT (−s)G(s)]

Finalmente, lembrando que det(sI − A) = ∆(s) e o polinomio carac-terıstico de A:

∆e(s) = (−1)n∆(s)∆(−s)det[

I +1

rN−1GT (−s)G(s)

]

As raızes estaveis deste polinomio sao os polos do regulador otimo. Vamossimplificar mais, considerando o caso monovariavel: G(s) e um escalar, oquociente entre os polinomios n(s) e d(s):

G(s) =n(s)

d(s)GT (−s) = n(−s)

d(−s)

Como N = 1 para o caso escalar ficaremos com

∆e(s) = (−1)nd(s)d(−s)[

1 +1

r

n(−s)d(−s)

n(s)

d(s)

]

= (−1)n{

d(s)d(−s) + 1

rn(−s)n(s)

}

Page 65: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 60

Supondo que

n(s) = k0∏p

i=1(s− νi)

d(s) =∏n

i=1(s− πi)

onde

k0 → ganho de G(s)νi → zeros de G(s)πi → polos de G(s)

teremos

n(−s) = k0(−1)pp∏

i=1

(s+ νi)

d(−s) = (−1)nn∏

i=1

(s+ πi)

e entao

∆e(s) = (−1)n{

(−1)nn∏

i=1

(s− πi)(s+ πi) +k20

r(−1)p

p∏

i=1

(s− νi)(s+ νi)

}

= (−1)2n{

n∏

i=1

(s− πi)(s+ πi) +k20

r(−1)p−n

p∏

i=1

(s− νi)(s+ νi)

}

Como (−1)2n = 1 e (−1)p−n = (−1)n−p temos que analisar as raızesestaveis do polinomio

∆e(s) =n∏

i=1

(s− πi)(s+ πi) +k20

r(−1)n−p

p∏

i=1

(s− νi)(s+ νi)

Isto pode ser escrito de outro modo, mais propıcio as tecnicas do metododo Lugar das Raızes:

1 + (−1)n−pK

∏pi=1(s− νi)(s+ νi)

∏ni=1(s− πi)(s+ πi)

= 0

Ja se pode tirar algumas conclusoes:

1. Quando K → 0 (r → ∞) as 2n raızes se aproximam dos polos πi e deseus negativos −πi.

2. Quando K → ∞ (r → 0), entao 2p das 2n raızes se aproximam doszeros νi e de seus negativos −νi

Page 66: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 61

3. Quando K → ∞ (r → 0), as 2n− 2p raızes restantes convergem paraassıntotas retas que se cruzam na origem e que fazem com o eixo realpositivo angulos de

jπn− p j = 0, 1, . . . , 2n− 2p− 1 para (n− p) ımpar

(j + 1/2)πn− p j = 0, 1, . . . , 2n− 2p− 1 para (n− p) par

4. Quando K → ∞ (r → 0), as 2n− 2p raızes estao a uma distancia da

origem dada por (k20r)

12(n−p) .

Uma simples aplicacao das regras basicas para construcao do Lugar dasRaızes permite o estabelecimento dos fatos acima.

Exemplo 5.4.1 Para o sistema com n = 3 e p = 1 dado pela matriz detransferencia G(s) = (s+ 1)/s(s− 2)(s+ 3) devemos considerar a equacao

1 + (−1)2K (s+ 1)(s− 1)

s(s− 2)(s+ 3)s(s+ 2)(s− 3)= 0

O tracado do Lugar das Raızes para este polinomio em termos do para-metro r = 1/K pode ser visto na figura a seguir:

-Re

× × e ×× e × ×

6Im

�����������������

���@

@@@@@@@@@@@@@@@@

@@@

-� - ��-r→0

r→∞

r→∞

Lugar das Raızes para o exemplo

Page 67: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 62

5.5 Resumo Teorico

Tendo em mente que os polos do regulador otimo sao os autovalores estaveisde Ae podemos resumir e legitimar as conclusoes atingidas acima. Para isso,seja o sistema monovariavel, estabilizavel e detetavel dado por

S

x(t) = Ax(t) + bu(t); x(t0) = x0

z(t) = dx(t)

ou entao por

G(s) = d(sI − A)−1b = k0

∏pi=1(s− νi)

∏ni=1(s− πi)

para o qual desejamos resolver o PRLOHTI, ou seja, para r > 0 minimizaro criterio

J =∫ ∞

0[z2(t) + ru2(t)] dt

Teorema 5.5.1 1. Quando r → ∞ os n polos do regulador otimo seaproximam dos valores π∗

i , i = 1, 2, . . . , n dados por

π∗i =

πi se Re(πi) ≤ 0

−πi se Re(πi) > 0

2. Quando r → 0, p dos n polos do regulador otimo se aproximam dosvalores ν∗

i , i = 1, 2, . . . , p onde

ν∗i =

νi se Re(νi) ≤ 0

−νi se Re(νi) > 0

3. Quando r → 0, os n−p polos restantes do regulador otimo aproximam-se assintoticamente de linhas retas que se interceptam na origem e quefazem com o eixo real positivo angulos de

± ℓπn− p, ℓ = 0, 1, 2, . . . para n− p ımpar

±(ℓ + 1/2)πn− p , ℓ = 0, 1, 2, . . . para n− p par

Estes polos longınquos distam da origem

Page 68: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 63

w0 =

(

k20

r

)1

2(n−p)

O posicionamento destes polos longınquos recebe o nome de Configu-racao de Butterworth de ordem (n− p) com raio w0

Na proxima figura vemos esbocos para as configuracoes de Butterworthde ordens 1, 2, 3, 4, 5.

ordem 1 ordem 2 ordem 3

ordem 4 ordem 5

@@

@@@

��

���

JJ

JJJ

HHHHHH

������

SS

SSS

��

���

bbbbbb

""""""

BBBBBB

������

Configuracoes de Butterworth

Para o caso de varias entradas e varias saıdas podemos chegar a conclusoesanalogas desde que definamos a contento polos e zeros de um sistema. Amaior complicacao aparece no comportamento dos polos longınquos, quandoterıamos configuracoes de Butterworth multiplas com raios distintos etc.

5.6 Discussao dos Resultados

5.6.1 Caso do Controle Barato, r pequeno.

Grandes amplitudes sao permitidas em u e por isso a resposta pode serrapida, ou seja, temos polos que podem se afastar bastante, podem se tornarlongıquos. Eles serao responsaveis pelos movimentos rapidos, pelas amplitu-des grandes em u. Mas nem todos os polos se afastam, alguns tendem aoszeros estaveis de G(s). Isto e interessante pois indica que o cancelamentode polos e zeros (no semiplano esquerdo!) esta embutido no mecanismo do

Page 69: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 64

regulador otimo. Seja por exemplo um sistema com G(s) = n(s)/d(s). Aposa realimentacao otima u = F ∗x+ v teremos

GF (s) =nF (s)

dF (s)=

n(s)

dF (s)=

∏pi=1(s− νi)

dF (s)

onde dF (s) e composta pelos autovalores de Ae.i upondo controle baratoteremos r → 0 e

dF (s) ≈p∏

i=1

(s− νi)n−p∏

i=1

(s− ηiw0)

onde

νi =

νi se Re(νi) ≤ 0

−νi se Re(νi) > 0

e os termos (s− ηiw0) representam os polos distantes.Supondo que o sistema de malha aberta e de defasagem (ou fase) mınima

teremos que todos os zeros deG(s) estarao localizados no semiplano esquerdo,ou seja, Re(νi) < 0, i = 1, 2, . . . , p e assim

GF (s) = T (s) ≈ nF (s)∏p

i=1(s− νi)∏n−p

i=1 (s− ηiw0)=

1∏n−p

i=1 (s− ηiw0)‘

Todos os zeros (estaveis) de G(s) sao cancelados pelo controle otimo. Amalha fechada passa a depender apenas dos polos distantes. O polinomio

n−p∏

i=1

(s− ηiw0)

e chamado de polinomio de Butterworth de ordem (n− p) e seus coeficientesdependem apenas de (n− p). Por exemplo, para

n− p = 1 teremos s+ 1n− p = 2 teremos s2 + 1, 414s+ 1n− p = 3 teremos s3 + 2s2 + 2s+ 1n− p = 4 teremos s4 + 2, 613s3 + 3, 414s2 + 2, 613s+ 1n− p = 5 teremos s5 + 3, 236s4 + 5, 236s3 + 5, 236s2 + 3, 236s+ 1

Se o sistema e de fase nao mınima, a funcao de transferencia de malhafechada T (s) contera fatores do tipo

s+ νis− νi

e os polos proximos afetarao a configuracao final, nao sendo cancelados todoscomo acontecia antes. Isto significa que a “velocidade” de sistemas de fasenao mınima esta limitada pelos polos proximos de origem.

Page 70: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 5. PROPRIEDADES DA SOLUCAO DO PRLOHTI 65

5.6.2 Caso do Controle Caro, r → ∞.

As amplitudes da entrada sao muito penalizados. Neste caso a melhor solucaoe deixar inalterados os polos estaveis de G(s) e trazer os instaveis ate suasimagens especulares. Intuitivamente poderıamos pensar que seria mais efici-ente, mais “barato” mexer nos polos instaveis apenas o suficiente para traze-los ate a regiao permitida, alocando-os bem proximos ao eixo imaginario, jano semiplano esquerdo. A teoria mostra que este palpite e falso.

E muito mais coisas ainda se poderiam dizer, o campo e vasto e fascinante.Paramos por aqui, com alguma pena. Mas o assunto se encontra em variase varias obras, e se os leitores e leitoras se sentirem motivados a procura-lasentao estas notas terao cumprido sua missao.

Page 71: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Capıtulo 6

Projeto Otimo de Observadores

Na teoria dos estimadores assintoticos de estado um aspecto e, normalmente,tratado com alguma superficialidade: a escolha dos polos. Sao feitos comen-tarios gerais no sentido de alocar os autovalores “o mais a esquerda possıvel”pois isso beneficiaria a rapidez de convergencia; os inconvenientes seriamproblemas de amplificacao de ruıdos e saturacao de componentes. Algumasregras empıricas sao fornecidas, como por exemplo: colocar os polos “de 5 a10 vezes mais a esquerda do que os polos escolhidos para a planta.”

Este importante problema mereceria um tratamento mais rigoroso e pre-ciso, e a teoria de Controle Otimo e, em particular, os resultados recemestudados do Problema do Regulador Linear Quadratico, sao sugestoes na-turais para a empreitada. Trataremos dela neste capıtulo, comecando comuma breve revisao sobre

6.1 Observadores Assintoticos de Estados

Supomos, como sempre, que o sistema que se quer controlar — a planta ouprocesso — admite o seguinte modelo linear e invariante no tempo:

S

x(t) = Ax(t) +Bu(t); x(t0) = x0

z(t) = Dx(t)y(t) = Cx(t)

onde x(t) ∈ IRn e o estado no instante t; u(t) ∈ IRm e a entrada em t; z(·)representa a combinacao das variaveis de estado que queremos controlar, comz(t) ∈ IRp e y(·) a combinacao das variaveis que podemos medir efetivamentee que deve ser usada para implementar a lei de controle; y(t) ∈ IRr.

A esta planta acoplaremos um sistema O, tambem linear e invariante notempo descrito por

66

Page 72: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 67

O

v(t) = Gv(t) +Hu(t) + Jy(t); v(t0) = v0

w(t) = Mv(t) +Ny(t)

onde v(t) ∈ IRo representa o estado deste sistema no instante t; as matrizesG,H, J,M e N terao dimensoes o× o, o×m, o× r, n× o e n× r, respecti-vamente. O diagrama de blocos seguinte permite visualizar a situacao:

-u S- z

y

H - m - ∫

+ M - m -+

H �

6

?

J

?-

-

?

N

?- v v w

Percebe-se que o sistema O funcionara como um estimador ou observadorassintotico do estado x(t) do sistema S se e somente se ε(t) → 0 quandot → ∞ onde a grandeza erro de estimacao e definida como

ε(t) = w(t)− x(t)

O resultado seguinte e classico da teoria dos sistema lineares:

Teorema 6.1.1 O sistema O e um observador assintotico do estado x(t) dosistema S se e somente se existir uma matriz T o× n, com o ≤ n tal que

TA−GT = JC (6.1)

TB = H (6.2)

MT +NC = In (6.3)

λ(G) ⊂ C− (6.4)

O projeto dos observadores se resume assim a resolver as equacaos matri-ciais acima, que sao chamadas de Relacoes Fundamentais dos Observadores,as RFO.

Uma possıvel solucao para as RFO seria escolher T = In, M = In eN = 0. Isto faz com que w = v ou seja, o proprio estado do observador

Page 73: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 68

estima o estado da planta; faz tambem com que a escolha de H seja direta:H = B. A equacao 6.1 se reduz a

A−G = JC

e o problema todo se resume a encontrar uma matriz J de tal modo que

λ(G) = λ(A− JC) ⊂ C−

Mas este e um problema bem conhecido, e se houver observabilidade (oumesmo detetabilidade) do par < CA > pode ser facilmente resolvido. Odiagrama de blocos abaixo mostra essa possıvel solucao:

-u S- z

y

B - m - ∫

+

A− JC

6

?

J

?- v v = w -

y

-

Seguindo regras simples de manipulacao de diagramas de blocos podemostransformar este em um outro, equivalente:

-u S- z

y

B - m - ∫

+

?

J

?- v v = w -

y

-

A �

JC

m+�

6

6

Prosseguindo com as manipulacoes chegarıamos a

Page 74: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 69

-u S- z

y

B - m - ∫

+

J

?- v v = w-

y − JCv

A

m+

6

C y = Cv-

-

6

?� e

Este e, muito possivelmente, o observador mais conhecido e estudado; elerecebe, as vezes, o nome de observador identidade. Note-se que ele e com-posto por uma copia identica da planta a qual se adiciona uma realimentacaodo erro e = y − y = Cx− Cv, cuja finalidade e forcar o sinal y a rastrear y.Isto explicaria a razao de v ser um bom substituto para x.

Esta interpretacao clara e intuitiva do mecanismo de funcionamento doobservador identidade e a responsavel pela sua popularidade. A grandemaioria dos textos sobre estimadores assintoticos usa-o para motivar as ex-plicacoes, e, nao raro, ele e o unico tipo de observador estudado.

E interessante notar que quando o ganho matricial J “aumenta” os auto-valores de G = A− JC sao empurrados para a esquerda no plano complexo,resultando em duas (pelo menos) consequencias:

1. o erro de estimacao ε(t) se aproxima de 0 mais rapidamente, o mesmoacontecendo com e(t);

2. o sinal y − JCv pode assumir valores elevados.

A primeira destas consequencias e benefica, significa uma maior rapidezde convergencia para o estimador, e isto e sempre desejado. Ja o fato deo sinal y − JCv crescer pode ser preocupador. Estes raciocınios mostramque a escolha do ganho J deve ser feita com certos cuidados. Como faze-lo?Ha certas diretrizes baseadas em consideracoes empıricas, mas sao vagas einsatisfatorias. Por que nao tentar algo mais profundo?

6.2 Problema do estimador aberto

Conforme visto acima, a estrutura de um observador identidade e compostade uma copia do modelo da planta mais uma realimentacao corretiva, e o seuprojeto se resume a determinacao da matriz de ganhos J .

Page 75: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 70

Para ajudar na escolha otima de J considere o seguinte estimador aberto:

-u S- z

y

B - m - ∫

+?

- v v = w-

u

A

m+

6

C y = Cv-

-

6

?� e

O problema agora e achar u(·) tal que o sinal e(·) seja regulado de maneiraotima. Isto signfica que e(t) → 0 de tal modo que o ındice

∫ ∞

0

[

eT (t)Qe(t) + uT (t)Ru(t)]

dt

onde Q > 0 e R > 0 seja minimizado.Mas e(t) = y(t)− y(t) = C(x(t)− w(t)) = −Cε(t), donde

eT (t)Qe(t) = εT (t)CTQCε(t) = εT (t)R1ε(t)

e o ındice pode ser reescrito:∫ ∞

0

[

εT (t)R1ε(t) + uT (t)Ru(t)]

dt

onde R1 = CTQC ≥ 0 e R > 0.Para que a teoria precedente possa ser aplicada devemos encontrar um

sistema para o qual ε(t) seja o estado e u seja a entrada. Vejamos:

ε = w − x = Aw +Bu+ u− Ax−Bu

= Aε+ u

Parece pronto. Seja entao o sistema

ε(t) = Aε(t) + u(t)

ε(0) = ε0 = w(0)− x(0)

para o qual desejamos encontrar uma entrada u(·) que minimiza o ındice

Page 76: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 71

∫ ∞

0

[

εT (t)R1ε(t) + uT (t)R2u(t)]

dt

onde R1 = CTQC ≥ 0 e R2 = R > 0.A solucao e conhecida:

u(t) = F ε(t) = −R−12 ITP ∗ε(t)

onde P ∗ ≥ 0 e a solucao da ERMA

ATX +XA−XR−12 X +R1 = 0

O conceito de estimador de estados exige que a entrada u seja expressaem termos do sinal e:

u(t) = Je(t) = −JCε(t)

donde concluımos queJC = −F

Ha um pequeno problema aqui! Como o sinal u “entra” na equacao de εatraves da matriz identidade I a solucao otima F sera uma matriz quadrada.Como F = −R−1

2 P ∗ o posto de F sera, muito provavelmente, completo, ouseja: ρ(F ) = n. Mas

ρ(JC) ≤ ρ(C) = r < n = ρ(F )

significando que, em geral, a equacao JC = −F nao pode ser satisfeita . . .

6.3 O verdadeiro problema

O impasse a que se chegou na secao anterior pode levar a conclusao de que seestava tentando resolver o problema errado. Pensemos novamente. Uma dasrazoes para se minimizar o ındice e manter as amplitudes do sinal u baixas,para “evitar saturacoes”.

E claro que uma estimacao mais rapida (sempre desejavel) implica emamplitudes elevadas para o sinal u = y−JCv, mas . . . qual seria o problemadisto? Este e um sinal interno, nao ha qualquer atuador fısico cuja capacidadeseria excedida. Este sinal sera, muito provavelmente, representado por bytesem um computador, e podera crescer sem perigo de saturacoes. Os perigosestao em outros lugares.

Page 77: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 72

O pior efeito possıvel de se aumentar a velocidade de convergencia e per-mitir que ruıdos presentes em y se propaguem por todo o sistema. Em outraspalavras, o aumento indiscriminado de J alargaria a banda de passagem doestimador, e os ruıdos de y deixariam de ser bloqueados; ou, pior, poderiamser amplificados ate contaminar todo o sistema e tirar a validade de quaisquersinais obtidos como resposta deste.

Ruıdos existem, sao inevitaveis: podem ser introduzidos pelos instrumen-tos de medida, podem estar presentes nos sinais de controle, podem entrarno sistema em qualquer outro ponto ou por qualquer outro meio. Assim, overdadeiro problema a se resolver, o problema de importancia pratica real, eo de se evitar a propagacao de ruıdos atraves da malha.

Consideremos entao uma situacao bastante geral, de um sistema S comentrada u, saıda yc e sujeito a acao de “outras entradas”

- S -u yc?

ξ

?

ν

Estamos considerando tipos diferente de “outras entradas”: o sımbolo νrepresenta os sinais espurios adicionados as variaveis de saıda pelos trans-dutores e recebe o nome de ruıdo de saıda ou de medida. O sımboloξ engloba todos os outros sinais indesejaveis e recebe o nome de ruıdo deentrada ou de sistema ou, simplesmente, disturbio. Suporemos que osruıdos, de qualquer tipo, sao aditivos, ou seja, um sinal limpo e somado a umruıdo para gerar um sinal contaminado. Para explicitar a natureza aditivade ν o diagrama acima pode ser mais detalhado:

- S - j+u y?

ξ

?

ν

-yc

O sinal y seria a saıda “pura” ao passo que yc e a saıda real ou conta-minada. O verdadeiro problema de se projetar um dispositivo pratico deestimacao e o de recuperar o estado x da planta, de uma maneira otima(em um sentido ainda a ser explicado), mesmo em presenca de ruıdos comcaracterısticas conhecidas.

Esta mesma situacao pode ser encarada em um outro contexto, onde es-

Page 78: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 73

tarıamos mais interessados em “limpar” o sinal yc. Dirıamos que o verdadeiroproblema de se projetar um dispositivo pratico de filtragem e o de recuperaras informacoes contidas na saıda y do sistema S acionado apenas por u (semξ), a partir do sinal real yc.

Os problemas do observador otimo e do filtro otimo tem relacoes profun-das, como veremos. A partir de agora, atencao apenas para o caso linear einvariante no tempo. As equacoes dinamicas sao:

S

x(t) = Ax(t) +Bu(t) +B′ξ(t)

yc(t) = Cx(t) + ν(t) = y(t) + ν(t)

O diagrama de blocos associado e

- B - j+ - ∫ - C - j+ -

A �

6

? ?

B′-

u

ξ

x y

ν

yc

Ha dois casos particulares de interesse. Quando B′ = B o sinal ξ tema mesma dimensao de u e teremos x = Ax + B(u + ξ), ou seja, o ruıdo ξcontamina diretamente a entrada, sendo chamado de ruıdo ou disturbio decomando ou de entrada. Quando B = I o sinal ξ tem dimensao n e afetadiretamente os estados. O diagrama abaixo ilustra estes casos.

- j+ -?u

ξ

B - . . .- B - j+ -?u

ξ

Seja entao um observador — do tipo identidade — acoplado a um sistemasujeito a acao de ruıdos, como ilustrado pelo proximo diagrama. As equacoesdinamicas sao

S

x = Ax+Bu+B′ξ

yc = Cx+ νO

v = Av +Bu+ J(Cx+ ν − Cv)

e = Cx+ ν − Cv

Page 79: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 74

-uB - j?+

6

B∫

J

v v = w-

A

j+

C y = Cv-

� e

- ∫x x -

A �

C - j+

-ξB′

? -yc

ν

- j+ -- ?

6

?

6

O projeto se resume a encontrar uma matriz J tal que λ(A− JC) ⊂ C−,o que obrigaria o erro de estimacao a se aproximar assintoticamente de zero:ε(t) → 0. Escrevendo as equacoes para o sistema expandido obteremos

S +O

[

]

=

[

A 00 A− JC

] [

]

+

[

B0

]

u+

[

B′

B′

]

ξ −[

0J

]

ν

e = [ 0 C ]

[

]

+ ν

Para perceber os efeitos dos ruıdos de maneira mais clara e interessanteencontrar uma descricao frequencial para o sistema acima: E(s) =

[ 0 C ]

[

sI − A 00 sI −G

]−1 {[

B0

]

u+

[

B′

B′

]

ξ −[

0J

]

ν

}

+ ν(s)

onde G = A− JC. Desenvolvendo mais chegarıamos a

E(s) = C(sI −G)−1B′ξ(s)− C(sI −G)−1Jν(s)− ν(s)

ou, mais compactamente, definindo as matrizes de transferencia Tξ(s) e Tν(s):

E(s) = Tξ(s)ξ(s) + ν(s)− Tν(s)ν(s)

Conforme “aumentamos” os ganhos J os autovalores de G = A − JC sedeslocam mais para a esquerda do plano complexo, tornando mais larga abanda de passagem das matrizes Tξ(s) e Tν(s).

Page 80: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 75

Suponhamos, para comecar, que os ruıdos ξ e ν sao, ambos, sinais com-postos apenas por frequencias baixas. Isto significa que eles atravessam ossistemas Tξ e Tν praticamente incolumes, sem sofrer distorcoes. A estruturado estimador garante que o ruıdo de medida ν nao contaminara o sinal eneste caso, pois ν(s)− Tν(s)ν(s) ≈ ν(s)− ν(s) = 0.

O raciocınio acima e independente de J , pois, qualquer que seja o espectrode G as bandas de passagem envolvidas sao suficientemente amplas paraconter os ruıdos de baixa frequencia. Em resumo:

Quando os ruıdos presentes sao de baixa frequencia, os ruıdos demedida ν serao filtrados e apenas os ruıdos de sistema ξ conta-minarao o sistema. E isto independe do projeto do estimador.

Suponhamos agora que os ruıdos ξ e ν sao, ambos, sinais compostosapenas por frequencias altas. Se o observador foi projetado com ganhosbaixos as bandas de passagem dos sistemas Tξ e Tν sao estreitas e bloquearaoambos os sinais. A estrutura do estimador garante que o ruıdo de medida νcontaminara o sinal e, pois Tξ(s)ξ(s)+ν(s)−Tν(s)ν(s) ≈ 0+ν(s)−0 = ν(s).

O raciocınio acima depende de J para o caso de ruıdos de alta frequencia:se o espectro de G e tal que as bandas de passagem envolvidas sao suficien-temente amplas para aceitar ξ(s) e ν(s) sem distorcoes, o ruıdo de medidaν(s) poderia ser bloqueado e o ruıdo de sistema poderia passar. Em resumo:

Quando os ruıdos presentes sao de alta frequencia o projeto doestimador tem importancia crucial. Para ganhos baixos de J ape-nas os ruıdos de medida ν contaminarao o sistema. Para ganhoselevados de J o quadro acima pode se inverter.

Este sao apenas casos basicos. Pode-se imaginar situacoes em que osruıdos tem naturezas diferentes, e as analises correspondentes deveriam serfeitas de acordo com as diretrizes acima. Pode-se ainda imaginar casos ondeos ruıdos tem caracterısticas desconhecidas: como proceder?

Um fato parece claro: projetar observadores levando em conta os ruıdospode se tornar algo muito dependente da natureza deles, algo problematico.Assim, deve haver outros caminhos que propiciem um tratamento mais sim-ples e direto ao projeto otimo de estimadores.

6.4 Estimadores e Filtros

Na secao anterior foi mencionada a ıntima relacao entre o projeto de esti-madores e o de filtros. Para enunciar o problema geral de filtragem, seja odiagrama:

Page 81: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 76

- S - j+u y?

ξ

?

ν

-yc F -

y

Devemos encontrar um filtro F capaz de gerar uma estimativa otima ypara o sinal y. Ou seja, o filtro deve anular os efeitos dos ruıdos ξ e ν.

Os filtros tradicionais podem cumprir esta missao, desde que os sinaissejam bem conhecidos, e seus espectros tenham caracterısticas bem determi-nadas. Quando, por exemplo, ξ e ν sao sinais de baixa frequencia o filtro Fdeve ter caracterısticas de passa-baixas; quando os ruıdos sao baseados emuma unica frequencia usa-se um filtro notch. E por aı vai.

Estas hipoteses sao limitadoras, os problemas reais podem ser bem maiscomplicados: os espectros dos sinais envolvidos — y, ξ e ν — podem se so-brepor, ou entao podem nao ser bem conhecidos. Temos aqui exatamente osmesmos inconvenientes apontados anteriormente para os estimadores: o usoda caracterizacao frequencial classica de sinais por meio dos seus espectrosnao se presta bem para o estudo de filtros ou de estimadores otimos.

Norbert Wiener, por volta de 1938, propos o uso de sinais estocasticospara caracterizar as grandezas envolvidas nestes problemas e conseguiu resol-ver o problema geral de filtragem, dando origem ao que se costuma chamarde filtro de Wiener: ele encontrou um filtro F , caracterizado por sua matrizde transferencia F (s) capaz de gerar uma estimativa otima de y.

Trinta anos depois Robert Kalman, trabalhando com variaveis de estadose com o conceito de sinais estocasticos, resolveu o problema do estimadorotimo. Ficou entao clara a identidade entre observadores e filtros: eles sao amesma coisa! Com efeito, se um observador recupera o estado x de maneiraotima, basta multiplicar por C e teremos uma estimativa otima para y. Onome usado para o estimador otimo pasou entao a ser: filtro de Kalman.

Page 82: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 77

6.5 Medias e correlacoes de sinais

6.5.1 Valor medio de um sinal

6.5.2 Valor medio quadratico de um sinal

6.5.3 Variancia de um sinal

6.5.4 Autocorrelacao de um sinal

6.5.5 Correlacao cruzada entre dois sinais

6.5.6 Densidade espectral de um sinal

6.6 Variaveis aleatorias

6.6.1 Probabilidades

6.6.2 Valor medio

6.6.3 Variancia

6.6.4 Covariancia entre x e y

6.6.5 Funcao distribuicao de probabilidade

6.6.6 Funcao densidade de probabilidade

6.6.7 Media

6.6.8 Valor medio quadratico

6.6.9 Variancia e covariancia

6.6.10 Distribuicao uniforme

6.6.11 Distribuicao normal

6.7 Processos aleatorios ou estocasticos

6.7.1 Ruıdo branco

6.7.2 Processo gaussiano

6.7.3 Processo estocastico estacionario

6.7.4 Processo estocastico ergodico

6.7.5 Sistemas Lineares

6.7.6 Matriz de autocorrelacao

6.8 Formulacao e solucao

Page 83: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 78

- S - j+u y?

ξ

?

ν

-yc

O -w?

-

O sinal ξ e um ruıdo branco com media 0 e autocorrelacao Q > 0; o sinalν e tambem um ruıdo branco, com media nula e autocorrelacao R > 0. Oerro de estimacao ε = x − w e um sinal tal que ε(t) ∈ IRn e que apresentaum erro medio quadratico dado por

e(t) =n∑

i=1

E[ε2i (t)]

O problema e projetar um estimador O que minimize o erro medio qua-dratico acima. A solucao e um observador identidade:

- S - j+u y?

ξ

?

ν

yc

?j+6

- B - j+ - ∫ - C -

-

y

J �

−?

A

6

v

A matriz de ganhos sera dada por

J = −PCTR−1

onde P e a solucao de uma equacao de Ricatti Matricial algebrica:

AP + PAT − PCTR−1CP +BQBT = 0

Page 84: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

CAPıTULO 6. PROJETO OTIMO DE OBSERVADORES 79

• E um observador de ordem completa

• E um problema de otimizacao dual do LQR

• E o famoso Filtro de Kalman

• E um estimador otimo e tambem um filtro, pois y e o resultado dafiltragem otima de y.

Iniciada em out/nov/85;tecada com poucos

detalhes a maisem set/out/88

porAfonso Celso Del Nero Gomes,

ajudado pelaAngela.Revista,ampliada

e ilustradaem jan/fev/mar/90.

Enriquecida em fins de 1991,e em outubro/novembro de 1996,

e em outubro de 1999,Finalmente pronta em . . . . . .

Logicamentetambem houve muita

ajudados queseguem:

Page 85: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Apendice A

Formas Quadraticas

Como sempre acontece, uma leve recordacao de ferramentas matematicase a melhor maneira de se iniciar novos estudos. Nesta secao apresentare-mos de maneira rapida, suscinta e geralmente sem provas, alguns resultadosmatematicos basicos que serao uteis para os desenvolvimentos posteriores.

A.1 Formas Lineares e Quadraticas

As ideias abaixo sao provavelmente conhecidas da maioria dos leitores.

Definicao A.1.1 Por Forma, Combinacao ou Funcional Linear dasvariaveis x1, x2, . . . , xn entenderemos a expressao

L(x1, x2, . . . , xn) = l1x1 + l2x2 + · · ·+ lnxn =n∑

i=1

lixi

onde, ∀i = 1, 2, . . . n, li ∈ IR (corpo dos reais).

Exemplo A.1.1L1 = x1 + x2 − x3

L2 = 0, 5x1 − 7x2 + 0x3 − x4

Lembrando as propriedades do produto matricial podemos escrever:

L(x1, x2, . . . , xn) = l1x1 + l2x2 + · · ·+ lnxn = [ l1 l2 · · · ln ]

x1

x2...xn

80

Page 86: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 81

Agrupando as variaveis xi e os coeficientes li nos vetores x e L, comoabaixo,

L =

l1l2...ln

x =

x1

x2...xn

podemos usar a compacta e economica notacao vetorial:

L(x1, x2, . . . , xn) = L(x) = LTx

onde o sımbolo LT denota a transposta da matrix L. Supondo que asvariaveis x1, x2, . . . , xn sao variaveis reais podemos encarar L(·) como umatransformacao linear

L : IRn −→ IRx 7→ L(x) = LTx

Dependendo dos valores das variaveis xi a forma linear L(x) pode assumirvalores positivos, negativos ou nulos. Deste modo podemos particionar IRn

em tres regioes: IRn = IRn⊕⋃

IRn⊖⋃

IRn0 para as quais

x ∈ IRn⊕ ⇐⇒ L(x) > 0

x ∈ IRn⊖ ⇐⇒ L(x) < 0

x ∈ IRn0 ⇐⇒ L(x) = 0

Exemplo A.1.2 Para a forma L(x) = x1 + x2 o plano e particionado comona figura abaixo. A regiao IRn

0 e sempre uma variedade linear: reta, plano,etc.

@@@@@@@@@@

-

6

IR2⊕

IR2⊖

x2

x1

IR20

Mas isto tudo e terreno muitıssimo conhecido, de usos e utilidades jasabidos, e bem sabidos (espera-se).

Page 87: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 82

Definicao A.1.2 Chamaremos de Forma ou Combinacao Quadraticadas variaveis x1, x2, . . . , xn a expressao

Q(x1, x2, . . . , xn) = q11x1x1 + q12x1x2 + · · ·+ qnnxnxn =n∑

i=1

n∑

j=1

qijxixj

onde, ∀i, j = 1, 2, . . . n, qij ∈ IR.

Exemplo A.1.3Q1 = x2

1 + x1x2 − 5x22

Q2 = x1x3 − x2x3 + 7x3x1 − x24

Para obter uma notacao alternativa compacta e elegante, como foi feito nocaso anterior, deve-se desenvolver a expressao da forma quadratica definidaacima e depois aplicar as regras do produto matricial. Ao trabalho.

Q(x1, x2, . . . , xn) = q11x21 + q12x1x2 + · · ·+ q1nx1xn +

q21x2x1 + q22x22 + · · ·+ q2nx2xn

...

+qn1xnx1 + qn2xnx2 + · · ·+ qnnx2n

Colocando em evidencia a variavel xi em cada uma das i linhas da ex-pressao acima teremos:

Q(x1, x2, . . . , xn) = x1(q11x1 + q12x2 + · · ·+ q1nxn) +

x2(q21x1 + q22x2 + · · ·+ q2nxn) +...

+xn(qn1x1 + qn2x2 + · · ·+ qnnxn)

Observando que as expressoes entre parenteses sao funcionais lineares dotipo Qix = [qi1 qi2 · · · qin]x onde x e o vetor com componentes xi podemosescrever

Q(x1, x2, . . . , xn) = [ x1 x2 · · · xn ]

q11 q12 · · · q1nq21 q22 · · · q2n...

......

qn1 qn2 · · · qnn

x1

x2...xn

E finalmente, chamando de Q a matriz quadrada trazida pelo desenvol-vimento acima, podemos finalizar escrevendo a procurada notacao vetorial:

Page 88: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 83

Q(x1, x2, . . . , xn) = Q(x) = xTQx

onde, como ja deve ter dado para perceber, o sımboloMT denota a transpostada matrix M .

Exemplo A.1.4

Q(x) = x21 + x1x2 + x2

2 = [ x1 x2 ]

[

1 10 1

] [

x1

x2

]

Lembrando que o produto de reais e comutativo temos x1x2 = x2x1 etambem podemos exprimir a forma acima de outra maneira:

Q(x) = x21 + x2x1 + x2

2 = [ x1 x2 ]

[

1 01 1

] [

x1

x2

]

Algo salta aos olhos no exemplo acima: o comportamento observado podeperfeitamente ser encontrado em outras situacoes. Isto sugere uma genera-lizacao, a qual, dada a sua trivialidade, sera apresentada sem provas:

Fato A.1.1 Uma forma quadratica Q(x) pode admitir varias representacoesmatriciais:

Q(x) = xTQ1x = xTQ2x = · · ·

E bom lembrar que, a partir disto:

xTQ1x = xTQ2x 6=⇒ Q1 = Q2

Prosseguindo, seja a forma quadratica:

Q(x) = q11x21 + · · ·+ qijxixj + · · ·+ qjixjxi + · · ·

Como estamos tratando de variaveis reais podemos escrever

qijxixj + qjixjxi =qij + qji

2xixj +

qij + qji2

xjxi

donde, chamando

sij = sji =qij + qji

2sii = qii sjj = qjj

teremosQ(x) = s11x

21 + · · ·+ sijxixj + · · ·+ sjixjxi + · · ·

Page 89: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 84

Propriedade A.1.1 A uma forma quadratica Q(x) pode-se associar umaunica representacao matricial xTSx onde S e uma matriz simetrica.

A prova de que a representacao simetrica e unica e razoavelmente simples.Vemos deste modo que dentre as infinitas representacoes matriciais para umadada forma quadratica ha sempre uma unica muito particular, envolvendouma matriz simetrica.

A.2 Sinal da Forma

A situacao agora e um pouco mais elaborada do que no caso das formaslineares, onde o espaco IRn sempre podia ser decomposto em tres regioes.Para as formas quadraticas a riqueza e maior, como pode ser visto no . . .

Exemplo A.2.1 Para a forma Q(x) = x21−x2

2 o plano e particionado comona figura abaixo.

@@@@@@@@@@�

���������

-

6

+

++

+

−−

−−

x2

x1

IR20

IR20

Para este exemplo a forma pode assumir valores positivos, negativos, ounulos dependendo de x.

As formas lineares tem sempre um comportamento como o do exemploacima: ha pontos x que as tornam positivas, ha pontos que as tornam nega-tivas e ha pontos que as anulam. As particoes IRn

⊕, IRn⊖, IR

n0 , do espaco IRn

sao sempre nao vazias. No caso das formas quadraticas podemos ter outrassituacoes. Consideremos por exemplo:

Q(x) = xT

[

1 00 1

]

x = x21 + x2

2

onde temos: Q(x) > 0 ∀x 6= 0 e Q(x) = 0 para x = 0. Da para perceber oseguinte

Fato A.2.1 Uma forma quadratica sempre se anula em x = 0:

Q(x) = 0 para x = 0

Page 90: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 85

Dependendo do comportamento da forma para x 6= 0 poderemos reco-nhecer varios casos:

Definicao A.2.1 A forma quadratica Q(x) e Identicamente Nula quandoQ(x)= 0 ∀x 6= 0 e escreveremos Q(x) ≡ 0.

Definicao A.2.2 A forma quadratica Q(x) e Positiva Definida quandoQ(x) > 0 ∀x 6= 0; escreveremos Q(x) > 0. Uma forma quadratica Q(x) eNegativa Definida quando Q(x) < 0 ∀x 6= 0; escreveremos Q(x) < 0.

Definicao A.2.3 A forma quadratica Q(x) e Positiva Semidefinida ou,semipositiva definida, quando Q(x) ≥ 0 ∀x 6= 0; escreveremos Q(x) ≥ 0.Uma forma quadratica Q(x) e Negativa Semidefinida quando Q(x) ≤0 ∀x 6= 0; escreveremos Q(x) ≤ 0.

Definicao A.2.4 A forma quadratica Q(x) e Indefinida quando nao seencaixar em uma das categorias acima.

A.3 Exercıcios

1. As formas abaixo sao do tipo xTQx. Classifica-las quanto ao sinal.Indicar, quando for o caso, as regioes IRn

⊕, IRn⊖ e IRn

0 .

(a) Q =

[

1 −1−1 0

]

(b) Q =

[

1 −1−1 1

]

(c) Q =

[

1 −1/2−1/2 1

]

(d) Q =

[

0 −1−1 0

]

(e) Q =

1 −1 0−1 1 10 1 0

2. Sendo M uma matriz quadrada qualquer mostrar que 12(M +MT ) sera

simetrica.

Page 91: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 86

A.4 Criterios de definicao

As formas quadraticas definidas e semidefinidas sao muito importantes emum sem numero de problemas, como teremos a oportunidade de ver. Destamaneira, devemos procurar metodos praticos para descobrir o sinal de umaforma quadratica.

Teorema A.4.1 (Sylvester) Uma forma Q(x) = xTSx , onde S e umamatriz simetrica, sera positiva definida se e somente se todos os seus menoresprincipais forem positivos:

Q(x) > 0 ⇐⇒ s11 > 0;

s11 s12s21 s22

> 0; · · ·

s11 · · · s1n...

...sn1 · · · snn

> 0;

Q(x) = xTSx sera negativa definida se e somente se −Q(x) for positivadefinida ou seja, os menores principais de S forem alternadamente positivose negativos:

Q(x) < 0 ⇐⇒ −Q(x) = xT (−S)x > 0

ou entao,

(menor de ordem k)(−1)k > 0, k = 1, 2, . . . n

Se nenhuma das condicoes for satisfeita a forma sera indefinida.

E bom notar que substituindo os sinais do teorema anterior por ≥ 0 naoencontraremos condicoes para o caso semidefinido. O proximo resultado,tambem classico, relaciona o sinal de uma forma com os autovalores da matrizsimetrica associada; mostra ainda um pouco da estrutura que tal matriz deveter.

Teorema A.4.2 Cada uma das condicoes seguintes e necessaria e suficientepara que a forma Q(x) = xTSx , onde S e uma matriz simetrica, seja positivadefinida:

1. Os autovalores de S sao reais e positivos.

2. E possıvel escrever S = CTC onde C e uma matriz com colunas line-armente independentes.

Embora os conceitos acima sejam definidos para formas quadraticas, comoa cada uma delas se pode associar uma unica matriz simetrica podemos falar,com abuso de linguagem, em matrizes simetricas positivas definidas, semide-finidas, etc. e, ao inves de escrevermos Q(x) > 0 ou S(x) > 0 poderıamostambem usar Q > 0 ou S > 0, etc.

Page 92: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 87

A.5 Normas, Metricas e “Tamanho”

Apesar de um espaco vetorial nao ser ordenado podemos classificar seus ve-tores de acordo com o “tamanho”. Para isso usamos as ideias de Norma ouModulo. Resumindo bastante uma teoria elaborada e bela, dirıamos que aNorma Euclidiana, ou simplesmente Norma de um vetor x ∈ IRn e dadapor:

‖x‖ = x21 + x2

2 + · · ·+ x2n

Isto significa que a norma pode ser expressa como uma forma quadratica:

‖x‖ = xTx = xT Ix

onde I simboliza a matriz identidade. Aplicando o teorema de Sylvester amatriz I verificarıamos trivialmente ser ela positiva definida, donde se concluique ‖x‖ = xTx > 0 ∀x ∈ IRn. Isto justifica a definicao de Modulo como

|x| =√

‖x‖ =√

x21 + x2

2 + · · ·+ x2n

Nas aplicacoes praticas os elementos dos vetores sao grandezas fısicas,e muitas vezes algumas destas grandezas sao mais importantes que outras.Assim, seria interessante uma medida que evidenciasse isto, ja que a normaatribui um peso igual as componentes do vetor, quando gostarıamos de privi-legiar algumas delas. Podemos associar a ideia de norma a media aritmeticasimples, e dizer que estamos interessados em algo parecido com uma mediaponderada. Em outras palavras, se o tamanho de um vetor nos interessa maisem algumas componentes, ou direcoes, do que em outras podemos atribuirpesos a essas direcoes usando xTDx onde os elementos da matriz diagonal Drefletiriam a importancia que se quer atribuir ou retirar dos componentes dex. De um modo mais geral temos o

Fato A.5.1 Toda forma Q(x) = xTSx onde S > 0 ou S ≥ 0 permite asso-ciar ao vetor x um escalar Q(x) que pode representar uma medida do “tama-nho” do vetor x, da sua “distancia” ate a origem. Dependendo da escolha deS pode-se medir esse “tamanho” com enfase especial em algumas direcoes.

Page 93: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 88

Consideremos agora uma funcao do tempodesignada por x(·) ou simplesmente x.Deve ficar claro que o sımbolo x(t)representa um numero real, ovalor assumido pela funcaox no instante t. Podemosvisualizar a situacao pormeio de um ponto semovendo sobre umatrajetoria no IRn

Usando uma formaquadratica e possıvel representar a funcao vetorial x(·) por meio da funcaoreal Q(·) = xT (·)Sx(·) onde S ≥ 0.

��

��

��

-

6rx(t0)

Desta maneira, a figura tridimensional acima poderia ser “substituıda”pelo grafico da funcao escalar

-

6Q(t)

t

E logico que nessa representacao unidimensional de algo multidimensi-onal alguma coisa se perdera, mas de uma maneira geral alguns aspectosimportantes permanecem. Por exemplo, se S > 0 podemos garantir que

x → 0 ⇐⇒ Q(x) → 0

Em resumo: sendo S > 0, a forma Q(x) = xTSx e uma maneira comodade representar x ∈ IRn por meio de um numero real. Informacoes a respeitoda evolucao do vetor x(t) no IRn podem ser obtidas pela analise do graficoda grandeza escalar Q(x) em funcao do tempo.

Exemplo A.5.1 Podemos ter alguma ideia do comportamento ao longo dotempo do vetor x(t) = [et e−t]

Tse analisarmos a funcao real dada pela forma

quadratica xT (t)x(t) = e2t + e−2t

- -

6 6

rx0

2

x2

x1 t

||x(t)||

Page 94: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 89

A.6 Exercıcios

1. Sendo x = Ax, tracar um grafico para xT (t)Qx(t). A partir destegrafico e possıvel dizer algo sobre a estabilidade do sistema? Use

A =

0 1 00 0 11 1 −1

, x(0) =

111

, Q =

1 1 01 0 00 0 1

2. Idem 1 para Q =

1 1 11 1 11 1 1

3. Seja a matriz simetrica Q > 0, com dimensao n × n. Sendo M umamatriz inversıvel, que se pode dizer de P = M−1QM? sera simetrica?e o seu sinal?

4. Seja a matriz simetrica Q > 0, com dimensao n × n. Sendo D umamatriz (r × n), com r < n, que se pode dizer de P = DQDT ? serasimetrica? e o seu sinal?

5. Idem 4 para r > n

6. Idem 4 para r = n

A.7 Visao Geometrica das Formas Quadrati-

cas

Lembremos que a operacao vTw pode representar o produto escalar entre osvetores v, w ∈ IRn. Mas o produto escalar pode ser expresso em termos dosmodulos dos vetores envolvidos e do angulo compreendido entre eles:

- v��������* w

θ vTw = |v| |w| cos θ

Desta maneira o produto escalar carrega informacoes a respeito da po-sicao relativa entre os dois vetores. Assim, se vTw = 0 sabemos que v e wsao ortogonais. Se vTw > 0 teremos que o modulo do angulo entre eles emenor do que π/2 e assim estes vetores “apontam na mesma direcao, estaoem um mesmo semiespaco”. Para vTw < 0 teremos cos θ negativo, θ > π/2

Page 95: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 90

e os vetores v e w “tentam seguir direcoes opostas”. A figura abaixo ilustrabem a situacao. Para um vetor v fixo temos tres possibilidades para w:

@@@@

@@@@

@@@@

@@

������

-@@@R

v

vTw > 0

vTw = 0

vTw < 0

vTw > 0 : mesma direcao, mesmo semiespaco

vTw = 0 : ortogonais

vTw > 0 : direcao oposta, semiespaco complementar

Com isto em mente a forma quadratica xTQx pode ser encarada como oproduto escalar entre x e Qx e assim xTQx mediria a deformacao angularcausada pela aplicacao de Q a x, a quantidade de rotacao sofrida por x atese obter Qx. Assim, se para uma dada transformacao linear A : IRn → IRn

temos xTAx > 0 ∀ x ∈ IRn isto significa que A e um mapa que “preservaa direcao”, ou seja um vetor x qualquer e sua imagem Ax estao sempre nomesmo semiplano. Se xTAx = 0 ∀ x ∈ IRn entao cada elemento x e girado deπ/2.

Neste ponto podemos estabelecer a relacao entre duas formas quadraticasiguais. Sejam Q1 e Q2 tais que xTQ1x = xTQ2x ∀ x ∈ IRn. ChamandoQ2 − Q1 = M temos xTQ1x = xT (Q1 + M)x = xTQ1x + xTMx, dondexTMx = 0 e M e ortogonal.

A.8 Miscelanea de Formulas

A colecao de resultados abaixo pode ser util em um grande numero de si-tuacoes. Eles virao sem provas. Os sımbolos A ≥ 0 ou A > 0 significam,como ja vimos, que a forma quadratica xTAx e positiva semidefinida oupositiva definida respectivamente.

Fato A.8.1 Seja C uma matriz m× n

A = CTC =⇒ A ≥ 0

Fato A.8.2 Seja C uma matriz m× n com rank (C) ≥ n

A = CTC =⇒ A > 0

Fato A.8.3 Seja C uma matriz n× n com det(C) 6= 0

A = CTC =⇒ A > 0

Page 96: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 91

Fato A.8.4 A ≥ B ⇐⇒ A− B ≥ 0

Fato A.8.5 A ≥ 0, B ≥ 0 ⇐⇒ A+B ≥ 0

Fato A.8.6 A ≥ 0, B ≥ 0 6⇐⇒ AB ≥ 0

Fato A.8.7 Sendo λ um autovalor generico de A (n× n):

A ≥ 0 =⇒ Re(λ) ≥ 0A > 0 =⇒ Re(λ) > 0A simetrica =⇒ λ ∈ IRA simetrica, A > 0 =⇒ λ ∈ IR, λ > 0

Fato A.8.8 Se A e simetrica seus autovetores sao ortogonais e assim:

A e simetrica =⇒ A=UTΛU onde U e unitaria (UTU=I) e Λ = diag(λi)

Definicao A.8.1 A raiz quadrada matricial simetrica de A ≥ 0, designadapor A1/2 ou

√A e tal que

√A√A = A e

√A = (

√A)T

Fato A.8.9√A = UTΛ1/2U . Como U e nao unica a raiz quadrada matricial

simetrica e tambem nao unica.

Fato A.8.10 A ≥ 0 e simetrica, B ≥ 0 e simetrica 6=⇒ AB ≥ 0

A ≥ 0 e simetrica, B ≥ 0 e simetrica 6=⇒ ABsimetrica

A ≥ 0 e simetrica, B ≥ 0 e simetrica =⇒ λ(AB) ∈ IR, λ(AB) ≥ 0

Fato A.8.11 Sendo λ o menor autovalor de uma matriz A ≥ 0 e simetricae λ o maior deles:

A ≥ 0 e simetrica =⇒ λ(A)|x|2 ≤ xTAx ≤ λ(A)|x|2, ∀x

Fato A.8.12 Podemos definir norma de uma matriz A como

‖A‖ = sup|x|=1

|Ax|

Com isto:A ≥ 0 e simetrica =⇒ ‖A‖ = λ(A)

A > 0 e simetrica =⇒ ‖A−1‖ = (λ(A))−1

Page 97: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 92

A.9 Matrizes Hamiltonianas

Sendo A (n × n) uma matriz real qualquer, S (n × n) e T (n × n) matrizesreais e simetricas, diremos que

[

A ST −AT

]

e uma Matriz Hamiltoniana. Nos desenvolvimentos posteriores teremosoportunidades de verificar a importancia destas matrizes. O conjunto detodas as matrizes Hamiltonianas sera designado por H:

H ={

H ∈ IR2n×2n | H e Hamiltoniana}

O espectro das matrizes Hamiltonianas e sempre simetrico com relacaoao eixo imaginario; isto significa que, se σ+ jω e um dos autovalores de umamatriz Hamiltoniana entao −σ + jω tambem sera um autovalor. Antes dedemonstrar esta propriedade apresentaremos dois resultados muito uteis nomanuseio de expressoes matriciais intrincadas.

Lema A.9.1 (Identidade de Sylvester) Sendo M e Q matrizes quadra-das, com M inversıvel, e N e P matrizes com dimensoes compatıveis temos:

[

M NP Q

]

=

[

M 0P I

] [

I M−1N0 Q− PM−1N

]

Esta identidade permitira fatorar matrizes particionadas em blocos. Suaprova e simples, bastando desenvolver o produto do lado direito. Para o quesegue, o sımbolo det(X) denotara o determinante da matriz X .

Lema A.9.2 Sendo B e C matrizes cujo produto e uma matriz quadrada,temos

det(I − BC) = det(I − CB)

A demostracao deste resultado ja e mais elaborada, e sera omitida. Pa-semos entao a

Propriedade A.9.1 O espectro de uma matriz Hamiltoniana e simetricocom relacao a origem do plano complexo.

Demonstracao: Como as Hamiltonianas sao matrizes reais, os seus es-pectros sao simetricos com relacao ao eixo real; querer que haja simetriatambem com relacao ao eixo imaginario significa dizer que se λ e autovalor

Page 98: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 93

de uma Hamiltoniana entao −λ tambem deve ser, ou seja, existe simetriacom relacao a origem do plano complexo. Seja entao H ∈ H para a qualcalculamos

λI −H =

[

λI − A −S−T λI + AT

]

=

[

λI − A 0−T I

] [

I −(λI −A)−1S0 (λI + AT )− T (λI − A)−1S

]

onde usamos a identidade de Sylvester. Chamando de ∆H(λ) o polinomiocaracterıstico de H , e passando a usar δ(λ) para denotar det(λI−A), temos:

∆H(λ) = det(λI −H)

= δ(λ) det{

(λI + AT )− T (λI − A)−1S}

= δ(λ) det(λI + AT ) det{

I − T (λI − A)−1S(λI + AT )−1}

onde colocamos em evidencia o termo λI+AT na segunda parcela do segundotermo. Mas λI + AT = λIT + AT = (λI + A)T , e ainda temos que a inversada transposta e a transposta da inversa. Com isto temos

∆H(λ) = δ(λ) det(λI + A) det{

I − T (λI − A)−1S[

(λI + A)−1]T}

= δ(λ) det(−I)δ(−λ) det{

I + T (λI − A)−1S[

(−λI − A)−1]T}

onde usamos a identidade λI+A = −I(−λI−A). Chamando agora o termo(λI − A)−1 de M(λ) temos:

∆H(λ) = (−1)nδ(λ)δ(−λ) det{

I + TM(λ)SMT (−λ)}

(A.1)

= (−1)nδ(λ)δ(−λ) det{

I +M(λ)SMT (−λ)T}

(A.2)

Nesta ultima passagem usamos o Lema A.9.2 acima. Notando finalmenteque det(I +X) = det(I +X)T = det(I +XT ) obtemos

∆H(λ) = (−1)nδ(λ)δ(−λ) det{

I + T TM(−λ)STMT (λ)}

= (−1)nδ(−λ)δ(λ) det{

I + TM(−λ)SMT (λ)}

pois T e S sao simetricas. Comparando esta expressao com a equacao A.1acima concluımos que ∆H(λ) = ∆H(−λ), completando a demonstracao.

Q.E.D.

Page 99: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 94

Polinomios p(λ) para os quais p(λ) = p(−λ) sao chamados de polinomiospares. Vemos assim que os polinomios caracterısticos das matrizes Hamil-tonianas sao pares. Antes de prosseguir, e para fixar os conceitos, vejamoso

Exemplo A.9.1 Considere as matrizes Hamiltonianas:

H1 =

0 1 0 00 0 0 −1

−1 0 0 00 −2 −1 0

H2 =

0 1 0 00 0 0 −1

−1 0 0 00 4, 25 −1 0

H3 =

0 1 0 00 0 0 −1

−1 0 0 00 −4, 25 −1 0

O calculo dos autovalores forneceria os seguintes espectros:

λ(H1) = {−1,−1, 1, 1} λ(H2) = {±0.5j,±2.0j}

λ(H3) = {−2.0,−0.5, 0.5, 2.0}que sao simetricos com relacao ao eixo imaginario, como deveriam.

Trataremos agora de dois importantes subespacos associados a uma ma-triz quadrada qualquer. Sendom(λ) o polinomio mınimo da matrizM (k×k),sempre podemos fatora-lo como

m(λ) = m−(λ)m+(λ)

onde as raızes dem−(λ) tem partes reais estritamente negativas e as dem+(λ)tem partes reais positivas ou nulas. Usando outra terminologia, dirıamosque m−(λ) tem suas raızes em C−, o semiplano esquerdo aberto do planocomplexo C , ao passo que m+(λ) tem as suas em C+, o semiplano direitofechado de C . Sendo X uma matriz real (m× n) denotaremos por ker(X) oseu espaco nulo (ou kernel, ou nucleo): ker(X) = {v ∈ IRn|Xv = 0}. E bemsabido que este conjunto e um subespaco vetorial de IRn.

Definicao A.9.1 Chamaremos de subespaco dos modos estaveis de M ,designado por X−(M), e subespaco dos modos instaveis de M , designadopor X+(M), as expressoes

X−(M) = kerm−(M) e X+(M) = kerm+(M)

Page 100: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 95

E um exercıcio simples de Algebra Linear demonstrar que cada um dossubespacos acima definidos e um subespaco invariante sob M , e que a somadireta deles fornece o espaco todo:

MX− ⊂ X− MX+ ⊂ X+ X− ⊕X+ = IRk

Estes subespacos sao chamados de subespacos espectrais e admitem umainterpretacao geometrica muito util. Considere o sistema autonomo

{

p(t) = Mp(t)p(0) = p0

O conjunto de todas as condicoes iniciais das quais partem trajetoriasque tendem assintoticamente a origem e precisamente X−(M). Deste modopoderıamos escrever

X−(M) ={

p0 ∈ IRk | limt→∞

(

e−Mtp0)

= 0}

e o nome subespaco dos modos estaveis fica justificado. Trajetorias originadasem X+(M) certamente tenderao a∞, mas neste caso nao poderemos exprimiresse subespaco de maneira analoga ao de X−(M). Os leitores sao convidadosa refletir sobre o assunto.

Quando M possui autovalores reais e distintos a obtencao dos subespacosespectrais acima e facilitada: os autovetores associados a autovalores em C−

formarao uma base para X−(M) e os autovetores instaveis, os de C+, seraouma base para X+(M). Se M apresenta uma estrutura mais complicadadeveremos utilizar as expressoes da definicao.

Exemplo A.9.2 Para a matriz H1 do exemplo anterior terıamos dificulda-des no calculo dos autovetores associados aos autovalores repetidos. Sendo ospolinomios caracterıstico e mınimo dados por ∆(λ) = m(λ) = (λ−1)2(λ+1)2

seria simples obter

m−(H1) = (H1 + I)2 =

1 2 0 −10 3 1 −2

−2 −1 1 01 −4 −2 −3

m+(H1) = (H1 − I)2 =

1 −2 0 −10 3 1 22 −1 1 01 4 2 3

Page 101: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 96

A partir destas matrizes a obtencao dos subespacos modais e simples:

X−(H1) = kerm−(H1) =

1 00 12 11 2

X+(H1) = kerm+(H1) =

1 00 1

−2 11 −2

O segundo caso do exemplo anterior e trivial:

X−(H2) = 0 e X+(H2) = IR4

Para a matriz H3 podemos calcular os subespacos espectrais ou pelos au-tovetores ou pelo polinomio mınimo. Encontrarıamos

X−(H3) = kerm−(H3) =

2 4−4 −21 8

−8 −1

X+(H3) = kerm+(H3) =

2 44 2

−1 −8−8 −1

Alem da interpretacao geometrica dos subespacos espectrais, vista acima,eles tambem permitem a obtencao de mais informacoes sobre os autovaloresdas matrizes Hamiltonianas:

Propriedade A.9.2 A matriz Hamiltoniana H nao possui autovalores sobreo eixo imaginario se e somente se dimX−(H) = dimX+(H) = n

A demonstracao da validade deste resultado e simples, e sera omitida. Deagora em diante sempre suporemos que λ(H) ∩ {jw} = φ ou, equivalente-mente, dimX−(H) = dimX+(H) = n.

Page 102: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 97

Dados os subespacos V,W ⊂ IR2n, quando V +W = IR2n e V ∩ W = 0diremos que eles sao complementares e escreveremos V ⊕W = IR2n. SendoV e W matrizes cujas colunas formam bases para V e W, respectivamente,a matriz [V W ] tera posto completo (= 2n) quando V e W forem com-plementares. Seja Xp ⊂ IR2n o subespaco gerado pelas colunas da matriz(2n× n)

[

0In

]

Matrizes Hamiltonianas para as quais X−(H) e Xp sao complementaresrecebem um nome especial — domınio de Riccati — por apresentarem propri-edades interessantes. Para entender estas propriedades, seja X− uma matriz(2n×n) cujas colunas formam uma base para X−(H); podemos particiona-laem

X− =

[

X1

X2

]

(A.3)

onde X1 e X2 sao matrizes (n× n). Se X−(H) e Xp forem complementares,entao a matriz X1 da particao acima sera inversıvel e poderemos consideraro produto X2X

−11 = X . Seja agora

K− =

[

K1

K2

]

outra matriz cujas colunas formam uma base para X−(H). Continuandoa supor complementaridade entre X−(H) e Xp temos que K1 e inversıvel.Mostraremos agora a relacao entre K = K2K

−11 e X = X2X

−11 . Considere a

matriz[

X1 K1

X2 K2

]

cujo posto e n; aplicando a identidade de Sylvester obtemos[

X1 K1

X2 K2

]

=

[

X1 0X2 I

] [

I X−11 K1

0 K2 −X2X−11 K1

]

Como o primeiro fator do segundo membro e inversıvel podemos escrever

[

I X−11 K1

0 K2 −X2X−11 K1

]

=

[

X1 0X2 I

]−1 [

X1 K1

X2 K2

]

donde concluimos que o posto da matriz do lado esquerdo deve ser ≤ n.Mas isto implica em K2 − X2X

−11 K1 = 0 ou seja, K2 = X2X

−11 K1 ou,

Page 103: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 98

finalmente, K = K2K−11 = X2X

−11 = X . O significado disto e que a matriz

X obtida pelo procedimento acima independe da particular base escolhidapara X−(H), sendo determinada unicamente por H .

Definicao A.9.2 O conjunto de todas as matrizes Hamiltonianas com au-tovalores fora do eixo imaginario e para as quais X−(H)⊕Xp = IR2n recebeo nome de Domınio de Riccati, simbolizado por R:

R ={

H ∈ H | λ(H) ∩ {jw} = φ e X−(H)⊕ Xp = IR2n}

Como demonstramos acima, a cada elemento H ∈ R podemos associaruma unica matriz X (n × n), que passaremos a designar por Ric(H), dadapor

X = Ric(H) = X2X−11 (A.4)

onde X2 e X1 sao obtidas a partir de uma base para X−(H) como indicadona equacao A.3. Usando uma linguagem mais formal poderıamos definir umafuncao, denominada Ric, entre R e o conjunto IRn×n de todas as matrizesquadradas reais n× n:

Ric : R −→ IRn×n

H 7−→ Ric(H) = X2X−11 = X

Desta maneira se justifica o nome domınio de Riccati para o conjunto R,e muitas vezes usamos o sımbolo dom(Ric) para designa-lo.

Exemplo A.9.3 Considere novamente as matrizes dos exemplos anteriores.Para o primeiro caso seria simples verificar que X−∩Xp = 0, donde H1 ∈ R.E mais:

Ric (H1) = X2 =

[

2 11 2

]

porque X1 = I. Por ter autovalores no eixo imaginario, H2 6∈ R. Para H3

deixamos as conclusoes aos leitores.

Dada a importancia do domınio de Riccati, haveria interesse em esta-belecer condicoes para que uma matriz Hamiltoniana H pertenca a R =dom(Ric), sem o calculo de uma base para X−(H). Isto pode ser feito pela

Propriedade A.9.3 Se H ∈ H nao tem autovalores no eixo imaginario, Se positiva semidefinida ou negativa semidefinida e < A, S > e estabilizavelentao H ∈ dom(Ric)

O proximo resultado explicita importantes propriedades de X = X2X−11 .

Page 104: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 99

Propriedade A.9.4 Se H ∈ dom(Ric) e X = Ric(H), entaoa.) X e simetricab.) A+ SX e estavelc.) X e solucao da equacao de Riccati matricial algebrica

ATX +XA+XSX − T = 0

Este resultado estabelece uma conexao entre as matrizes Hamiltonianas ea equacao de Riccati, de capital importancia na solucao de problemas linearesquadraticos, como se vera em breve.

Demonstracao: Como H pertence ao domınio de Riccati R, por hipo-tese, temos dimX−(H) = n e X−(H) ⊕ Xp = IR2n. Escolhendo uma basepara X−(H) como em A.3 teremos X1 inversıvel e X = X2X

−11 . Podemos

construir uma matriz (2n × 2n) inversıvel justapondo bases para X−(H) eXp:

Q =

[

X1 0X2 I

]

Uma transformacao de coordenadas conduz a uma matriz equivalente quepode ser particionada em blocos (n× n):

Q−1HQ =

[

H11 H12

H21 H22

]

(A.5)

Como o subespaco X−(H) e invariante sob H temos HX−(H) ⊂ X−(H)e a matriz acima apresenta importantes particularidades estruturais: o blocosuperior esquerdo representa o mapa induzido por H em X−(H), e o blocoinferior esquerdo e nulo. Ou seja, H21 = 0 e os autovalores de H11 estao emC−. Isto mostra que os n autovalores estaveis de H sao os autovalores deH11, que concentra assim toda a dinamica estavel de H . Usando a definicaode Q podemos explicitar os blocos Hij:

Q−1HQ =

[

H11 H12

H21 H22

]

=

[

X−11 0

−X I

] [

A ST −AT

] [

X1 0X2 I

]

(A.6)

Efetuando as multiplicacoes chegamos a

H11 = X−11 AX1 +X−1

1 SX2 (A.7)

H12 = X−11 S (A.8)

H21 = −XAX1 + TX1 −XSX2 − ATX2 (A.9)

H22 = −XS − AT (A.10)

Page 105: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE A. FORMAS QUADRATICAS 100

Lembrando que X2 = XX1 a equacao A.7 acima mostra que A + SX eequivalente a H11, sendo portanto estavel. A equacao A.9 fica

H21 = −XAX1 + TX1 −XSX2 − ATX2

= −XAX1 + TX1 −XSXX1 − ATXX1

= (−XA + T −XSX −ATX)X1

Mas X1 e inversıvel, e H21 = 0, donde segue que

ATX +XA+XSX = T

o que mostra claramente a validade do item (c). A simetria de X ficara paraos leitores. Q.E.D

Para terminar veremos as caraterısticas adicionais advindas de estruturasparticulares de T e de S:

Propriedade A.9.5 Se H ∈ H e da forma

[

A −BBT

−CTC −AT

]

com < A,B > estabilizavel e < C,A > detetavel, entaoa.) H ∈ dom(Ric)b.) X = Ric(H) ≥ 0c.) ker(X) ⊂ W = subespaco inobservavel de < C,A >

Uma consequencia desta propriedade e que ker(X) ⊂ W ⊂ ker(C), dondea equacao XM = CT sempre admite solucao para M . Outra consequencia:quando < C,A > e observavel teremos W = 0, logo ker(X) = 0 e X > 0.

A.10 Referencias

O material deste capıtulo pode ser considerado classico, e e encontravel emum grande numero de textos e artigos, como por exemplo [7], [3], [5], [8], e[2]. Muitos outros ha, mas estes foram os mais consultados.

Page 106: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Apendice B

Analise no IRn

B.1 Funcao Real de variavel vetorial

ou funcao real de varias variaveis reais:

f : IRn −→ IRx ∈ IRn 7→ y = f(x) ∈ IR

Quando n = 1 temos o conhecido caso “escalar”, ou seja, funcoes reais deuma unica variavel real:

f : IR −→ IRx ∈ IR 7→ y = f(x) ∈ IR

Exemplo B.1.1 f(x) = x2 + 2x− e−x, para x ∈ IRf(x1, x2) = x1x2 para x1, x2 ∈ IR

f(x1, x2, x3) = x31 + 3x1x2x3 + x3

2 +√

(x3) para x1, x2, x3 ∈ IR

Quando n = 1 a funcao pode ser visualizada por meio dos graficos tra-dicionais; quando n = 2 a funcao f se associa a superfıcies do IR3. Paradimensoes maiores a visualizacao fica prejudicada. No caso de n = 2 o usodas curvas de nıvel permite a analise no plano de uma superfıcie espacial efacilita as coisas.

Curva de nıvel ={

x ∈ IR2 | f(x) = c = cte.}

Exemplo B.1.2 f(x1, x2) = x1x2

f(x1, x2) = x21 + x2

2

101

Page 107: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 102

B.2 Continuidade e Derivadas

A funcao real de variavel vetorial f e contınua no ponto x0 quando

limx→x0

f(x) = f(x0)

ou entao, sem usar limites, quando

∀ǫ > 0 ∃δ > 0 | se ‖x− x0‖ < δ entao |f(x)− f(x0)| < ǫ

Em outras palavras, e possıvel chegar arbitrariamente proximo de f(x0)desde que cheguemos suficientemente perto de x0

B.3 Derivada: caso escalar

Dada a funcao

f : IR −→ IRx ∈ IR 7→ y = f(x) ∈ IR

chamaremos de primeira derivada, ou derivada primeira, ou gradientede f no ponto x0 ∈ IR ao limite

limh→0

f(x0 + h)− f(x0)

hEsta derivada e usualmente designada pelos sımbolos

f ′(x0) ou f (1)(x0) oudf

dx

x0

e e o valor numerico do coeficiente angular da reta tangente ao grafico de fno ponto (x0, f(x0)).

Definicao B.3.1 Dizemos que f e diferenciavel em x0 se f ′(x0) existe

Quando f e diferenciavel em um intervalo, ou seja, quando

∃f ′(x0) ∀x0 ∈ I ⊂ IR

podemos falar na funcao derivada:

f ′ : I −→ IRx ∈ IR 7→ y = f ′(x) ∈ IR

Exemplo B.3.1 Seja f definida por f(x) = x2

limh→0

f(x+ h)− f(x)

h= lim

h→0

x2 + 2xh + h2 − x2

h= lim

h→0

2xh + h2

h= 2x

Quando f ′ e diferenciavel em um intervalo podemos falar na funcao deri-vada segunda, f ′′ e daı por diante.

Page 108: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 103

B.3.1 Derivadas laterais

B.4 Derivada: caso vetorial

Dada a funcao

f : IRn −→ IRx ∈ IRn 7→ y = f(x) ∈ IR

chamaremos de primeira derivada parcial de f com relacao a xi no pontox0 ∈ IRn ao limite

limh→0

f(x01, x

02, . . . x0

i + h, . . . x0n)− f(x0)

h

Esta derivada e usualmente designada pelos sımbolos

f ′xi(x0) ou

∂f

∂xi

x0

Definicao B.4.1 Dizemos que f e diferenciavel em x0 quando

∂f

∂xi

x0

existe ∀i = 1, 2, . . . n

Quando f e diferenciavel em um intervalo, as derivadas parciais

∂f

∂x1,∂f

∂x2, . . .

∂f

∂xn

podem ser consideradas funcoes de x.O gradiente da funcao f no ponto x ∈ IRn e o vetor dado por

∂f∂x1

∂f∂x2...

∂f∂xn

= g(x) = ∇f(x) ∈ IRn

Exemplo B.4.1 Seja f definida por f(x) = f(x1, x2) = x1x2

∇f(x) =

[

x2

x1

]

Page 109: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 104

Definicao B.4.2 uma funcao e linear quando

f(x) = cTx+ b

onde c, b ∈ IRn.

O gradiente de uma funcao linear e dado trivialmente por ∇f(x) = c.

Exemplo B.4.2 A funcao f(x) = max{|x1|, |x2|} tem problemas nos can-tos.

B.5 Derivadas de ordem superior

Quando as derivadas parciais (∂f)/(∂x1) sao diferenciaveis podemos deriva-las novamente:

∂xj

(

∂f

∂xi

)

=∂2f

∂xi∂xj

A matriz n×n cujo elemento (i, j) e dado pela expressao acima e chamadade Hessiana de f :

∂2f∂x2

1. . . . . . ∂2f

∂x1∂xn

.... . .

∂2f∂x2

n

= ∇2f(x) = G(x)

As matrizes Hessianas sao sempre simetricas.

Exemplo B.5.1 A funcao quadratica f(x) = 12xTAx + bTx + c pode ser

derivada:

∇f(x) = Ax+ b, e ∇2f(x) = A

Uma funcao e suave ou “bem comportada” quando e contınua e suasderivadas tambem o sao. Nao existem “cantos” ou quebras abruptas decurvatura. Diz-se que uma funcao e de classe Ck se suas k primeiras derivadassao contınuas:

Ck ={

f | f, f (1), . . . f (k) sao contınuas}

Page 110: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 105

B.6 Funcoes Vetoriais de Variaveis Vetoriais

Dada a funcao

f : IRn −→ IRm

x ∈ IRn 7→ y = f(x) ∈ IRm

chamaremos de Jacobiana de f a matriz m× n de suas derivadas parciais.O elemento (i, j) da Jacobiana e

∂fi∂xj

B.7 Pontos Estacionarios e Extremos

Dizemos que xe ∈ IRn e um ponto estacionario da funcao f quando ogradiente se anula:

∇f(xe) = 0

Dizemos que x∗ ∈ IRn e um ponto de mınimo local forte da funcao fquando existe δ > 0 tal que

1. f(x) e definida ∀x tal que ‖x− x∗‖ < δ

2. f(x) < f(x∗) ∀x 6= x∗ tal que ‖x− x∗‖ < δ

Dizemos que x∗ ∈ IRn e um ponto de mınimo local fraco da funcao fquando existe δ > 0 tal que

1. f(x) e definida ∀x tal que ‖x− x∗‖ < δ

2. f(x) ≤ f(x∗) ∀x 6= x∗ tal que ‖x− x∗‖ < δ

3. x∗ nao e um mınimo local forte

Dizemos que x∗ ∈ IRn e um ponto de mınimo global da funcao fquando . . .

B.8 Otimizacao

Em uma relacao de causa e efeito, estamos sempre interessados em descobrirefeitos nobres ou especiais: quem os causa? como sao caracterizados? Estee um problema pratico muito comum. Para os seres humanos, os efeitosnobres ou especiais sao, em geral, os efeitos extremos: procura-se sempreefeitos maximos ou mınimos. Como em termos matematicos as relacoes decausa e efeito sao descritas por funcoes, percebe-se a enorme importancia doproblema de se otimizar funcoes, ou seja, de se encontrar os seus extremos.

Page 111: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 106

B.9 PGO — Problema Geral de Otimizacao

Desejamos minimizar uma funcao real de variavel vetorial, sendo que avariavel independente x ∈ IRn esta sujeita a determinadas restricoes, ouseja, deve pertencer a determinadas regioes do IRn. Este problema, tambemchamado de Problema de Minimizacao Nao Linear Com Restricoes,pode ser formulado como

minimizarf(x)x ∈ IRn

s.a.ci(x) = 0 i = 1, 2, . . . kci(x) ≥ 0 i = k + 1, . . . m

A funcao f(x) que se deseja minimizar e chamada de funcao objetivo.As k primeiras restricoes sao as restricoes de igualdade, e as outras, ob-viamente, sao as de desigualdade.

Quando o extremo procurado e um maximo, ou em outras palavras,quando se deseja maximizar uma funcao h(x), a mesma estrutura acimapode ser usada, desde que se use como funcao objetivo f(x) = −h(x).

B.10 Pontos Viaveis

Sao os pontos que satisfazem as restricoes. A Regiao Viavel, RV, e oconjunto destes pontos:

RV = {v ∈ IRn | ci(v) = 0∀i = 1, 2, . . . kecj(v) ≥ 0∀j = k + 1, . . . m}

Exemplo B.10.1 Queremos minimizar f(x1, x2) = x21x2 com as restricoes

{

x1 + x2 = 0x21 + x2

2 ≥ 0

B.11 Solucao do PGO

Quando nao existem restricoes, os mınimos globais ou locais de f sao assolucoes procuradas, mas quando as restricoes estao presentes os extremosda funcao objetivo podem nao ser as solucoes do PGO.

Page 112: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 107

A figura acima ilustra a situacao. Torna-se necessario definir o que seriamas solucoes do PGO em seu caso mais geral, com restricoes.

Definicao B.11.1 O ponto x∗ ∈ IRn e uma Solucao Local Forte do PGOquando existir um real δ > 0 tal que

f(x) e definida ∀x ∈ RV tal que ‖x− x∗‖ < δ

f(x) < f(x∗)∀x ∈ RV, x 6= x∗ tal que ‖x− x∗‖ < δ

Ainda podem existir solucoes fracas:

Definicao B.11.2 O ponto x∗ ∈ IRn e uma Solucao Local Fraca do PGOquando existir um real δ > 0 tal que

f(x) e definida ∀x ∈ RV tal que ‖x− x∗‖ < δ

f(x) ≤ f(x∗)∀x ∈ RV, x 6= x∗ tal que ‖x− x∗‖ < δ

x∗ nao e uma solucao local forte

A busca de solucoes do PGO baseada apenas nas definicoes acima pode serimpraticavel, a menos de casos muito especiais com Regioes Viaveis pequenas.Precisamos de mais teoria. Esta teoria passa a ser apresentada agora, apartir dos casos mais simples. De um modo geral ela se aplica quando asfuncoes objetivo e as restricoes sao suficientemente suaves. Entenderemosque uma funcao e suficientemente suave quando for diferenciavel pelo menosduas vezes.

B.12 Caso Escalar sem Restricoes

O Problema Geral de Otimizacao e particularizado para

minimizarf(x)x ∈ IR

ou seja, nao existem restricoes e assim as solucoes serao os mınimos “normais”da funcao escalar f .

Teorema B.12.1 Condicoes Necessarias de OtimalidadeSupondo f suficientemente suave e sendo x∗ ∈ IR um mınimo local de f

entao

Page 113: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 108

1. f ′(x∗) = 0

2. f ′′(x∗) ≥ 0

Este teorema diz que os mınimos locais de uma funcao sao pontos es-tacionarios dela, e alem disso a derivada segunda e nao negativa neles. Seprocuramos as solucoes do PGO, este resultado restringe o universo da buscaaos pontos estacionarios com segundas derivadas nao negativas. Para efeti-vamente garantir pontos deste universo solucionam o PGO precisamos deoutro resultado:

Teorema B.12.2 Condicoes Suficientes de OtimalidadeSupondo f suficientemente suave, seja x∗ ∈ IR tal que

1. f ′(x∗) = 0

2. f ′′(x∗) > 0

Entao x∗ sera um mınimo local forte de f .

Usando primeiramente as CNO (condicoes necessarias de otimalidade) edepois as CSO (condicoes suficientes de otimalidade) temos uma maneiraformal e correta de encontrar os mınimos de uma dada f . As demonstracoesdestes resultados podem ser feitas com o auxılio da expansao de f em seriede Taylor, e serao omitidas. Sao estes os teormas que legitimam a conhecidaassociacao entre mınimos e “derivar e igualar a zero”.

Quando f nao e suficientemente suave . . .

B.13 Caso Vetorial sem Restricoes

O Problema Geral de Otimizacao fica

minimizarf(x)x ∈ IRn

e os resultados basicos sao

Teorema B.13.1 Condicoes Necessarias de OtimalidadeSupondo f suficientemente suave e sendo x∗ ∈ IRn um mınimo local de f

entao

1. ∇f(x∗) = g(x∗) = 0

2. ∇2f(x∗) = G(x∗) ≥ 0

Page 114: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 109

Mais uma vez os mınimos locais sao pontos estacionarios de uma funcao,onde a derivada segunda e nao negativa. Como antes, as CNO restringem ouniverso da busca de solucoes, mas para garantir que pontos deste universoreduzido realmente solucionam o PGO precisamos das CSO:

Teorema B.13.2 Condicoes Suficientes de OtimalidadeSupondo f suficientemente suave, seja x∗ ∈ IRn tal que

1. ∇f(x∗) = 0

2. ∇2f(x∗) > 0

Entao x∗ sera um mınimo local forte de f .

Exemplo B.13.1 Sendo f(x) = x3 teremos f ′(x) = 3x2 e f ′′(x) = 6x, oque garante que x∗ = 0 e um ponto estacionario onde f ′′(x∗) ≥ 0, ou seja,satisfaz as CNO. Mas as CSO nao sao satisfeitas e este nao e um mınimode f , mas um ponto de inflexao.

Seja agora f(x1, x2) = x1x2. E facil calcular

∂f

∂x1

= x2;∂2f

∂x21

= 0;∂2f

∂x1∂x2

= 1

∂f

∂x2= x1;

∂2f

∂x22

= 0;∂2f

∂x2∂x1= 1

donde tiramos

∇f(x) = g(x1, x2) =

[

x2

x1

]

e ∇2f(x) = G(x1, x2) =

[

0 11 0

]

O ponto x∗ = [0 0]T e estacionario, pois anula o gradiente, mas a Hessi-ana G(x∗) e indefinida. Trata-se de um ponto de sela.

B.14 Funcoes Quadraticas

A funcao real de variavel vetorial q e chamada de quadratica quando

q(x) =1

2xTAx+ bTx

onde x, b ∈ IRn e A e uma matriz simetrica n× n.

Propriedade 1: O gradiente de uma funcao quadratica e dado por:

∇q(x) = Ax+ b

Page 115: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 110

Propriedade 2: A Hessiana de uma funcao quadratica e dada por:

∇2q(x) = A

Propriedade 3: Saindo de um ponto segundo uma direcao. Sendo x, p ∈IRn e α ∈ IR

q(x+ αp) = q(x) + αpT (Ax+ b) +1

2α2pTAp

Propriedade 4: Os pontos estacionarios de uma funcao quadratica sao:

∇q(x) = 0 ⇐⇒ Ax = −b

A demonstracao da validade destas propriedades sera omitida. A partirda ultima delas percebemos que quando a equacao Ax = −b nao admitirsolucoes a funcao nao tem pontos estacionarios nem mınimos, sendo portantoilimitada.

Propriedade 5: Comportamento de uma funcao quadratica perto de umponto estacionario. Seja um ponto x∗ tal que Ax∗ = −b:

q(x∗ + αp) = q(x∗) +1

2α2pTAp

Vemos que o comportamento de uma funcao quadratica nas vizinhancasde um ponto estcionario depende apenas da Hessiana A = ∇2q(x). ComoA e simetrica seus autovalores sao reais, e os autovetores associados formamuma base ortonormal. Vamos supor que “saımos” de um ponto estacionariox∗ ao longo de uma direcao dada pelo i-esimo autovetor de A: Usando apropriedade 5 com p = vi temos

q(x∗ + αvi) = q(x∗) +1

2α2λiv

Ti vi

= q(x∗) +1

2α2λi

donde vemos que

λi > 0 entao q e crescente com αλi < 0 entao q e decrescente com αλi = 0 entao q e constante e linear: q(x) = bTx

Page 116: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 111

Propriedade 6: Comportamento de uma funcao quadratica com Hessianapositiva definida. Supondo λi(A) > 0 ∀i = 1, 2, . . . n o ponto esta-cionario x∗ e o unico mınimo global da funcao.

Exemplo B.14.1 Seja a funcao quadratica

q(x) =1

2xT

[

5 33 2

]

x+ [−5, 5 − 3, 5]x

Como a Hessiana A e inversıvel o ponto estacionario e dado trivialmentepor

x∗ = −A−1b =

[

0, 51, 0

]

Os autovalores e autovetores de A sao

λ1 = 6, 85 → v1 =

[

−0, 85−0, 53

]

λ2 = 0, 15 → v2 =

[

0, 53−0, 85

]

A funcao tem um mınimo global em x∗ e suas curvas de nıvel sao elipsescujos eixos principais sao os autovetores da Hessiana.

Propriedade 7: Comportamento de uma funcao quadratica com Hessianapositiva semidefinida. Supondo λi(A) ≥ 0 ∀i = 1, 2, . . . n o pontoestacionario x∗, se existir, e um mınimo local fraco da funcao.

Exemplo B.14.2 Seja a funcao quadratica

q(x) =1

2xT

[

4 22 1

]

x+ [−4 − 2]x

A Hessiana A nao e inversıvel, e a equacao Ax∗ = −b admite infinitassolucoes dadas por

x∗ =

[

02

]

+ α

[

1−2

]

Cada um dos pontos desta reta no IR2 e um mınimo local fraco. Estareta e tambem a direcao dos autovetores associados ao autovalor λ1 = 0. Aooutro autovalor, λ2 = 5, associa-se a direcao [2 1]T . A superfıcie de q e dotipo calha.

Page 117: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 112

Propriedade 8: Comportamento de uma funcao quadratica com Hessianaindefinida. Supondo autovalores maiores, menores ou iguais a 0, oponto estacionario x∗ e ponto de sela.

Exemplo B.14.3 Seja a funcao quadratica

q(x) =1

2xT

[

3 −1−1 −8

]

x+ [−0, 5 8, 5]x

Como a Hessiana A e inversıvel o ponto estacionario e dado trivialmentepor

x∗ = −A−1b =

[

0, 51, 0

]

Os autovalores e autovetores de A sao

λ1 = 3, 09 → v1 =

[

−1, 00, 1

]

λ2 = −8, 09 → v2 =

[

−0, 1−1, 0

]

As curvas de nıvel sao hiperboles cujos eixos principais estao associadosaos autovetores da Hessiana.

B.15 Restricoes Lineares

Consideremos novamente o Problema Geral de Otimizacao:

minimizarf(x)x ∈ IRn

s.a.ci(x) = 0 i = 1, 2, . . . kci(x) ≥ 0 i = k + 1, . . . m

Quando as restricoes ci(x) sao funcoes lineares temos ci(x) = aTi (x) + βi,onde ai ∈ IRn e βi ∈ IR. As restricoes de igualdade ficam

aTi (x) + βi = 0 ⇐⇒ aTi (x) = −βi = bi

e as de desiguldade:

aTi (x) + βi ≥ 0 ⇐⇒ aTi (x) ≥ −βi = bi

Page 118: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 113

B.16 PGO com Restricoes Lineares de Igual-

dade

Temos o seguinte problema, abreviadamente chamado de PGORLI ou apenasORLI ou RLI:

minimizarf(x)x ∈ IRn

s.a.

Ax = b

onde A e uma matriz m × n cujas linhas sao as restricoes aTi e b ∈ IRm

tem como elementos os bi = −βi. Lembrando que x∗ e uma solucao do RLIquando:

1. e viavel, ou seja, Ax∗ = b, e

2. f(x∗) ≤ f(x) para qualquer vizinho viavel x de x∗.

percebemos a necessidade de um estudo inicial da regicao viavel RV. E sim-ples escrever

RV ={

v ∈ IRn | Av = b}

Dado um ponto viavel v ∈ RV, considere o problema de encontrar umadirecao ou vetor p tal que v+p ∈ RV. Em outras palavras, queremos condicoespara partir de e permanecer em RV. E facil deduzir que

v + p ∈ RV ⇐⇒ Ap = 0

Direcoes p tais que Ap = 0 sao chamadas de direcoes viaveis e sao asdirecoes que permitem que um movimento permaneca em RV.

Exemplo B.16.1 Seja um problema de minimizacao com uma restricao deigualdade c(x1, x2) = x1 + x2 = 1. A RV e a reta do IR2 cujos pontos sao[α 1 − α]T . Uma vez sobre esta reta, as direcoes viaveis sao dadas porx2 = −x1.

O conjunto de todas as direcoes viaveis e dado pelo espaco nulo ou nucleode A:

Z = ker A ={

p ∈ IRn | Ap = 0}

Page 119: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 114

Este conjunto e um subespaco vetorial do IRn, cuja dimensao supomosser t (note que a RV pode nao ter uma estrutura de subespaco). Sendo Zuma matriz t× n cujas colunas formam uma base para Z podemos exprimirde maneira geral uma direcao viavel qualquer

p = Zpz, onde pz ∈ IRn

Supondo que x∗ e uma solucao para o RLI, vamos calcular o valor dafuncao objetivo em um vizinho viavel. Para isto usaremos Taylor:

f(x∗ + ǫp) = f(x∗) + ǫpT∇f(x∗) +1

2ǫ2pT∇2f(x∗)p+ · · ·

= f(x∗) + ǫpTz ZTg(x∗) +

1

2ǫ2pTz Z

TG(x∗)Zpz + · · ·

Considerando valores pequenos de ǫ poderıamos estabelecer

Teorema B.16.1 Condicoes Necessarias de OtimalidadeSupondo f suficientemente suave e sendo x∗ ∈ IRn uma solucao local do

RLI, entao

1. Ax∗ = b

2. ZTg(x∗) = 0

3. ZTG(x∗)Z ≥ 0

A primeira das condicoes acima, bastante obvia, diz que as solucoes devemser viaveis. A condicao seguinte e a condicao do gradiente, ou de primeiraordem. A grandeza ZTg(x) e chamada de gradiente projetado de f emx. Pontos nos quais o gradiente projetado se anula sao chamados de pontosestacionarios com restricoes. Tambem neste caso com restricoes ha umgradiente que deve se anular. Raciocinemos. A matriz Z, por definicao, e talque AZ = 0 ou, equivalentemente, ZT AT = 0. Como o gradiente projetadose anula na solucao, devemos ter ZTg(x∗) = 0 o que garante que o gradiente“simples” g(x∗) e uma combinacao linear das colunas de AT :

ZTg(x∗) = 0 =⇒ AT

λ∗1

λ∗2...λ∗m

Os coeficientes λ∗i sao os multiplicadores de Lagrange. Estes multi-

plicadores permitem a formulacao do resultado acima de maneira diferente:

Page 120: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 115

Teorema B.16.2 Condicoes Necessarias de OtimalidadeSupondo f suficientemente suave e sendo x∗ ∈ IRn uma solucao local do

RLI, entao

1. Ax∗ = b

2. ∃λ∗ ∈ IRm | g(x∗) = ATλ∗

3. ZTG(x∗)Z ≥ 0

A terceira das condicoes do teorema e a condicao de segunda ordem, oucondicao da Hessiana. A grandeza ZTG(x∗)Z e a Hessiana projetada. Assimcomo antes, as condicoes necessarias permitem delimitar a busca de solucoesaos pontos que as satisfazem. Para garantir que um deste pontas seja mesmosolucao do RLI precisamos do

Teorema B.16.3 Condicoes Suficientes de OtimalidadeSupondo f suficientemente suave, seja x∗ ∈ IRn tal que

1. Ax∗ = b

2. ZTg(x∗) = 0 ou, equivalentemente, ∃λ∗ ∈ IRm | g(x∗) = ATλ∗

3. ZTG(x∗)Z > 0

Entao x∗ sera uma solucao local do RLI.

Exemplo B.16.2 Considere o RLI com

f(x) = 12xT

[

5 33 2

]

x+ [−5, 5 − 3, 5]x

s.a. : ax = [1 1]x = 1

Conforme visto anteriormente, a funcao objetivo f tem um mınimo globalem x∗ = [0, 5 1, 0]T e suas curvas de nıvel sao elipses cujos eixos principaissao os autovetores da Hessiana. Dada a encontrarıamos ZT = [1 − 1]; osgradientes normal e projetado sao

g(x) =

[

5 33 2

]

x+1

2

[

117

]

e ZTg(x) = [2 1]x+ 2

Lembrando que a restricao e o gradiente projetado devem se anular noponto estacionario chegamos a

Page 121: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 116

{

(1 1)x = 1(2 1)x = −2

ou

[

1 12 1

]

x =

[

1−2

]

cuja unica solucao e [−3 4]T . Aplicando as CSO neste candidato (basta apli-car a terceira delas, porque as outras automaticamente se verificam) temos

ZTG(x∗)Z = [1 − 1]

[

5 33 2

] [

1−1

]

= 1 > 0

donde se conclui que o ponto estacionario encontrado e uma solucao local.Seja agora o RLI com

f(x) = 12xT

[

4 22 1

]

x− [4 2]x

s.a. : ax = [1 − 1]x = 0

A funcao objetivo f e representada por uma superfıcie tipo calha e temseus mınimos locais na reta dada por

x∗ =

[

02

]

+ α

[

1−2

]

A matriz Z e os gradientes normal e projetado sao

Z =

[

11

]

; g(x) =

[

4 22 1

]

x−[

42

]

e ZTg(x) = [6 3]x− 6

Lembrando que a restricao e o gradiente projetado devem se anular noponto estacionario chegamos a

{

(1 −1)x = 0(6 3)x = 6

ou

[

1 −16 3

]

x =

[

06

]

cuja unica solucao e [2/3 2/3]T . Aplicando as CSO neste candidato (bastaaplicar a terceira delas, porque as outras automaticamente se verificam) te-mos

ZTG(x∗)Z = [1 1]

[

4 22 1

] [

11

]

= 9 > 0

donde se conclui que o ponto estacionario encontrado e uma solucao local.Seja agora o RLI com

Page 122: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 117

f(x) = 12xT

[

3 −1−1 −8

]

x+ 12[−1 17]x

s.a. : ax = [1 − 1]x = −1/2

A funcao objetivo f e caracterizada por um ponto de sela e nao admitemınimos ou maximos. A matriz Z e os gradientes normal e projetado sao

Z =

[

11

]

; g(x) =

[

3 −1−1 −8

]

x+1

2

[

−117

]

e ZTg(x) = [2 −9]x+8

Lembrando que a restricao e o gradiente projetado devem se anular noponto estacionario chegamos a

{

(1 −1)x = −1/2(2 −9)x = −8

ou

[

1 −12 −9

]

x =

[

−1/2−8

]

cuja unica solucao e [1/2 1]T , exatamente o ponto de sela anterior. Apli-cando as CSO neste candidato (basta aplicar a terceira delas, porque as outrasautomaticamente se verificam) temos

ZTG(x∗)Z = [1 1]

[

3 −1−1 −8

] [

11

]

= −7 < 0

Nao se pode concluir que este ponto seja uma solucao do problema. Narealidade ele soluciona o problema de se encontrar o maximo de f com asrestricoes dadas. Os leitores sao convidados a repetir estes calculos (destaultima f) para as seguintes restricoes:

1. [1 2]x = 3/2

2. [1 − 2]x = −3/2

3. [1 2]x = 0

B.17 PGO com Restricoes Lineares de Desi-

gualdade

Temos o seguinte problema, abreviadamente chamado de PGORLD ou ape-nas ORLD ou RLD:

Page 123: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 118

minimizarf(x)x ∈ IRn

s.a.Ax ≥ b

onde A e uma matriz m× n cujas linhas sao as restricoes aTi e b ∈ IRm temcomo elementos os bi.

B.17.1 Estudo da Regiao Viavel

...

Teorema B.17.1 Condicoes Necessarias de OtimalidadeSupondo f suficientemente suave e sendo x∗ ∈ IRn uma solucao local do

RLD, entao

1. Ax∗ ≥ b; Ax∗ = b

2. ∃λ∗ ∈ IRm | g(x∗) = ATλ∗

3. λ∗i ≥ 0, ∀i = 1, 2, . . . m

4. ZTG(x∗)Z ≥ 0

Teorema B.17.2 Condicoes Suficientes de OtimalidadeSupondo f suficientemente suave, seja x∗ ∈ IRn tal que

1. Ax∗ ≥ b; Ax∗ = b

2. ∃λ∗ ∈ IRm | g(x∗) = ATλ∗

3. λ∗i ≥ 0, ∀i = 1, 2, . . . m

4. ZTG(x∗)Z > 0

Entao x∗ sera uma solucao local do RLI.

Page 124: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 119

B.18 Programacao Linear

B.19 PGO com Restricoes Nao-Lineares de

Igualdade

Temos o seguinte problema, abreviadamente chamado de PGORNI ou apenasORNI ou RNI:

minimizarf(x)x ∈ IRn

s.a.ci(x) = 0; i = 1, 2, . . . t

...

Teorema B.19.1 Condicoes Necessarias de OtimalidadeSupondo f suficientemente suave e sendo x∗ ∈ IRn uma solucao local do

RNI, entao

1. C(x) = 0

2. ∃λ∗ ∈ IRm | g(x∗) = AT (x∗)λ∗

3. ZT (x∗)W (x∗, λ∗)Z(x∗) ≥ 0

Teorema B.19.2 Condicoes Suficientes de OtimalidadeSupondo f suficientemente suave, seja x∗ ∈ IRn tal que

1. C(x) = 0

2. ∃λ∗ ∈ IRm | g(x∗) = AT (x∗)λ∗

3. ZT (x∗)W (x∗, λ∗)Z(x∗) > 0

Entao x∗ sera uma solucao local do RNI.

Page 125: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 120

B.20 PGO com Restricoes Nao-Lineares de

Desigualdade

Temos o seguinte problema, abreviadamente chamado de PGORND ou ape-nas ORND ou RND:

minimizarf(x)x ∈ IRn

s.a.ci(x) ≥ 0; i = 1, 2, . . . m

...

Teorema B.20.1 Condicoes Necessarias de OtimalidadeSupondo f suficientemente suave e sendo x∗ ∈ IRn uma solucao local do

RND, entao

1. C(x∗) ≥ 0; C(x) = 0

2. ∃λ∗ ∈ IRm | g(x∗) = AT (x∗)λ∗

3. λ∗i ≥ 0; i = 1, 2, . . . t

4. ZT (x∗)W (x∗, λ∗)Z(x∗) ≥ 0

Teorema B.20.2 Condicoes Suficientes de OtimalidadeSupondo f suficientemente suave, seja x∗ ∈ IRn tal que

1. C(x∗) ≥ 0; C(x) = 0

2. ∃λ∗ ∈ IRm | g(x∗) = AT (x∗)λ∗

3. λ∗i > 0; i = 1, 2, . . . t

4. ZT (x∗)W (x∗, λ∗)Z(x∗) > 0

Entao x∗ sera uma solucao local do RNI.

Page 126: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 121

B.21 Metodos Numericos

B.22 Caso Escalar: Obtencao de Raızes

B.22.1 Metodo da Biseccao

B.22.2 Metodo de Newton

B.22.3 Metodo da Secante

ou da interpolacao linear.

Page 127: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 122

B.22.4 Metodo da Regula Falsa

B.22.5 Metodo de Interpolacoes Superiores

B.22.6 Metodo Geral dos Intervalos

B.22.7 Metodo Garantidos

B.23 Caso Escalar sem Restricoes: Obtencao

de mınimos

B.23.1 Busca de Fibonacci

B.23.2 Busca Aurea

B.23.3 Interpolacao Polinomial

B.23.4 Aproximacoes Cubicas

B.23.5 Metodos Garantidos

B.24 Caso Vetorial sem Restricoes: Obten-

cao de mınimos

B.24.1 Metodos de Busca Direta

B.24.2 Algoritmo do Politopo

B.24.3 Algoritmo U

B.24.4 Metodos dp Gradiente e da Derivada Segunda

B.24.5 Metodo de Newton

B.24.6 Metodos da Decomposicao Espectral

B.24.7 Metodos de Primeira Ordem

Newton discreto, Quase Newton.

Page 128: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

APENDICE B. ANALISE NO IRN 123

B.24.8 Metodos Nao Derivativos

B.24.9 Problema dos Mınimos Quadrados

Gauss-Newton, Levenberg-Marquardt, Quase Newton.

B.25 Referencias

O material deste capıtulo pode ser considerado classico, e e encontravel emum grande numero de textos e artigos, como por exemplo [7], [3], [5], [8], [2]e [4]. Muitos outros ha, mas estes foram os mais consultados.

Page 129: Controle Linear Quadr´atico - coep.ufrj.brnero/controtLQR.pdf · Controle Linear Quadr´atico Caso Determin´ıstico Notas de aula para um curso de Otimiza¸c˜ao e Controle Otimo´

Referencias Bibliograficas

[1] M. Athans and P. L. Falb. Optimal Control. McGraw-Hill, New York,1966.

[2] J. C. Doyle, K. Glover, P. P. Khargonekar, and B. A. Francis. Statespace solutions to standard h2 and h∞ control problems. IEEE Trans.Automat. Contr., AC-34(8):831 – 847, august 1989.

[3] B. A. Francis. A Course in H∞ Theory – Lecture Notes in Control andInfo. Sciences, Vol 88. Springer-Verlag, New York, 1987.

[4] Philip E. Gill, Walter Murray, and Margaret H. Wright. Practical Opti-mization. Academic Press, London, 1981.

[5] V. Kucera. A contribution to matrix quadratic equations. IEEE Trans.Automat. Contr., AC-17(3):344 – 347, 1972.

[6] H. Kwakernaak and R. Sivan. Linear Optimal Control Systems. WileyInterscience, New York, 1972.

[7] Strang. Linear Algebra and its Applications. 1980.

[8] W. M. Wonham. Linear Multivariable Control: a Geometric Approach.Springer-Verlag, New York, 1979.

124