um controlador dual subótimo com fator de peso variável no ... · ao meu orientador, professor...

89
UNIVERSIDADE DO RIO GRANDE DO NORTE FEDERAL UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO Um Controlador Dual Subótimo com Fator de Peso Variável no Tempo Aderson Jamier Santos Reis Orientador: Prof. Dr. André Laurindo Maitelli Tese de Doutorado apresentada ao Pro- grama de Pós-Graduação em Engenharia Elétrica e de Computação (PPgEEc) da UFRN (área de concentração: Automação e Sistemas) como parte dos requisitos para ob- tenção do título de Doutor em Ciências. Natal, RN, Junho de 2015 Número de ordem PPgEE: D141

Upload: donguyet

Post on 14-Dec-2018

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

UNIVERSIDADE DO RIO GRANDE DO NORTEFEDERAL

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

CENTRO DE TECNOLOGIA

PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E

DE COMPUTAÇÃO

Um Controlador Dual Subótimo com Fator dePeso Variável no Tempo

Aderson Jamier Santos Reis

Orientador: Prof. Dr. André Laurindo Maitelli

Tese de Doutorado apresentada ao Pro-grama de Pós-Graduação em EngenhariaElétrica e de Computação (PPgEEc) daUFRN (área de concentração: Automação eSistemas) como parte dos requisitos para ob-tenção do título de Doutor em Ciências.

Natal, RN, Junho de 2015Número de ordem PPgEE: D141

Page 2: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

UFRN / Biblioteca Central Zila MamedeCatalogação da Publicação na Fonte

Reis, Aderson Jamier Santos.Um controlador dual subótimo com fator de peso variável no tempo

/ Aderson Jamier Santos Reis. - Natal, RN, 2015.71 p.

Orientador: Prof. Dr. André Laurindo Maitelli.

Tese (Doutorado) - Universidade Federal do Rio Grande do Norte.Centro de Tecnologia. Programa de Pós-Graduação em Engenharia Elé-trica e de Computação.

1. Controle adaptativo - Tese. 2. Controle dual - Tese. 3. Controleestocástico - Tese. 4. Sistemas variantes no tempo - Tese. I. Maitelli,André Laurindo. II. Universidade Federal do Rio Grande do Norte. III.Título.

RN/UF/BCZM CDU 621.3

Page 3: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Um Controlador Dual Subótimo com Fator dePeso Variável no Tempo

Aderson Jamier Santos Reis

Tese de Doutorado aprovada em 12 de Junho de 2015 pela banca examinadora compostapelos seguintes membros:

Prof. Dr. André Laurindo Maitelli (orientador) . . . . . . . . . . . . . . . . . DCA/UFRN

Profa Dr. Oscar Gabriel Filho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . PETROBRAS

Profa Dr. Vicente Delgado Moreira, . . . . . . . . . . . . . . . . . . . . . . . . . . PETROBRAS

Prof. Dr. Carlos Eduardo Trabuco Dorea . . . . . . . . . . . . . . . . . . . . . . . DCA/UFRN

Prof. Dr. Fabio Meneghetti Ugulino de Araujo . . . . . . . . . . . . . . . . . DCA/UFRN

Page 4: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente
Page 5: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Agradecimentos

Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi-ança depositados em minha pessoa.

Aos colegas da sala de pesquisa C do Laboratório de Automação em Petróleo - LAUT,pelas críticas e sugestões.

À minha família, meu pai, minha mãe e minhas duas irmãs, pelo apoio durante toda estajornada.

À minha noiva Renata Pitta Barros pelo apoio nos momentos difíceis.

Ao CNPQ, pelo apoio financeiro.

Page 6: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente
Page 7: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Resumo

O presente trabalho insere-se no âmbito dos sistemas de controle duais adaptativos.O controle dual contempla uma solução ótima formulada para um problema na teoriade controle estocástico no qual envolve incertezas e variações de parâmetros no tempo.Este trabalho propõe uma modificação em um controlador dual subótimo para sistemasdiscretos no tempo. O controlador dual ótimo almeja um balanceamento ótimo que busca,ao mesmo tempo, manter um bom controle e obter pequenos erros de estimativas. O sinalde controle é calculado de maneira a minimizar a variação da saída do sistema com basenum valor de referência um passo adiante. A ideia deste controlador dual subótimo éadicionar termos simples na matriz de covariância dos parâmetros estimados dois passosadiante. Um algoritmo adaptativo é utilizado para o ajuste do parâmetro de projeto λ

a cada passo do sistema. O desempenho do controlador proposto é avaliado através dométodo de simulações Monte Carlo.

Palavras-chave: Controle adaptativo; controle dual; controle estocástico; sistemasvariantes no tempo.

Page 8: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente
Page 9: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Abstract

This work concerns a refinement of a suboptimal dual controller for discrete timesystems with stochastic parameters. The dual property means that the control signal ischosen so that estimation of the model parameters and regulation of the output signals areoptimally balanced. The control signal is computed in such a way so as to minimize thevariance of output around a reference value one step further, with the addition of terms inthe loss function. The idea is add simple terms depending on the covariance matrix of theparameter estimates two steps ahead. An algorithm is used for the adaptive adjustment ofthe adjustable parameter lambda, for each step of the way. The actual performance of theproposed controller is evaluated through a Monte Carlo simulations method.

Keywords: Adaptive control; dual control; stochastic control; time-varying systems.

Page 10: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente
Page 11: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Sumário

Figuras iii

Tabelas v

Lista de Símbolos e Abreviaturas vii

1 Introdução 11.1 Organização do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Embasamento Teórico - Controle Adaptativo dual 72.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2 Descrição do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2.1 O modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112.2.2 O critério . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.2.3 A estimação de parâmetros . . . . . . . . . . . . . . . . . . . . . 12

2.3 Controlador Equivalente à Certeza . . . . . . . . . . . . . . . . . . . . . 132.4 Controlador Cauteloso . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3 Controladores Duais Subótimos 173.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173.2 Controlador com sinal de perturbação . . . . . . . . . . . . . . . . . . . 173.3 Controlador com restrições . . . . . . . . . . . . . . . . . . . . . . . . . 183.4 Controlador dual subótimo ativo . . . . . . . . . . . . . . . . . . . . . . 183.5 Controlador dual subótimo ativo aproximado . . . . . . . . . . . . . . . 203.6 Controlador dual por inovações . . . . . . . . . . . . . . . . . . . . . . . 223.7 Controlador dual por bicritério . . . . . . . . . . . . . . . . . . . . . . . 223.8 Controlador multiestágios usando predição ótima aproximada . . . . . . . 233.9 Simulações - controladores duais subótimos . . . . . . . . . . . . . . . . 25

3.9.1 Sistema de primeira ordem . . . . . . . . . . . . . . . . . . . . . 253.9.2 Simulação - controlador equivalente à certeza . . . . . . . . . . . 263.9.3 Simulação - controlador cauteloso . . . . . . . . . . . . . . . . . 283.9.4 Simulação - controlador por restrições . . . . . . . . . . . . . . . 283.9.5 Simulação - controlador por inovações . . . . . . . . . . . . . . . 313.9.6 Simulação - controlador por bicritério . . . . . . . . . . . . . . . 323.9.7 Simulação - Controlador dual subótimo ativo aproximado . . . . 32

i

Page 12: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.9.8 Simulação Monte Carlo . . . . . . . . . . . . . . . . . . . . . . 353.10 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Controlador Proposto 374.1 Controlador dual subótimo com fator de peso λ variável . . . . . . . . . . 374.2 Avaliação de Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . 424.3 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5 Conclusão 655.1 Trabalhos Publicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.1.1 WSEAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 675.1.2 JCAE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Referências bibliográficas 69

ii

Page 13: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Lista de Figuras

2.1 Diagrama de blocos do Regulador Auto-Sintonizável. . . . . . . . . . . . 82.2 Diagrama de blocos de um controlador adaptativo por modelo de referência. 82.3 Sistema adaptativo de controle dual. . . . . . . . . . . . . . . . . . . . . 92.4 Organização das soluções combinadas do problema de identificação e

controle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3.1 Minimizações da abordagem do controlador dual por bicritério. . . . . . . 233.2 Simulação de uma realização do controlador equivalente à certeza. . . . . 273.3 Simulação de uma realização do controlador cauteloso. . . . . . . . . . . 293.4 Simulação de uma realização do controlador por restrições. . . . . . . . . 303.5 Simulação de uma realização do controlador dual subótimo por inovações. 313.6 Simulação de uma realização do controlador por bicritério. . . . . . . . . 333.7 Simulação de uma realização do controlador aproximado subótimo dual

ativo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

4.1 Realização típica do Exemplo 1 usando λ variável, contendo entrada,saída, perda acumulada, vetor lambda, parâmetro b real e estimado e va-riância de b. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.2 Mapa 3D do vetor lambda com 100 simulações - Exemplo 1. . . . . . . . 484.3 Sinal de entrada e sinal de saída de uma realização típica do sistema no

Exemplo 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494.4 Realização típica do Exemplo 2 contendo entrada, saída, perda acumu-

lada, vetor lambda, parâmetro b real e estimado e variância de b. . . . . . 514.5 Mapa 3D do vetor lambda com 100 simulações - exemplo 2. . . . . . . . 524.6 Saída acumulada e variância de b de uma realização típica do sistema no

Exemplo 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.7 Realização típica do Exemplo 3 contendo entrada, saída, saída acumu-

lada, vetor lambda, parâmetro b real e estimado e variância de b. . . . . . 544.8 Mapa 3D do vetor lambda com 100 simulações - Exemplo 3. . . . . . . . 554.9 Sinal de controle e sinal de saída de uma realização típica do sistema no

Exemplo 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.10 Realização típica do Exemplo 4 contendo entrada, saída, perda acumu-

lada, vetor lambda, parâmetro b real e estimado e variância de b. . . . . . 584.11 Sinal de entrada e sinal de saída de uma realização típica do sistema no

exemplo 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 594.12 Mapa 3D do vetor lambda com 100 simulações - Exemplo 4. . . . . . . . 59

iii

Page 14: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.13 Realização típica do Exemplo 5 contendo entrada, saída, perda acumu-lada, vetor lambda, parâmetro b real e estimado e variância de b. . . . . . 61

4.14 Sinal de entrada e parâmetro b real e estimado de uma realização típicado sistema no Exemplo 6. . . . . . . . . . . . . . . . . . . . . . . . . . . 63

4.15 Realização típica do Exemplo 6 contendo entrada, saída, saída acumu-lada, vetor lambda, parâmetro b real e estimado e variância de b. . . . . . 63

4.16 Mapa 3D do vetor lambda com 100 simulações - Exemplo 6. . . . . . . . 64

5.1 Página resumo do trabalho aceito no periódico WSEAS - Transactions onSystems and Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

5.2 Página resumo do trabalho aceito no periódico JCAE - Journal of Control,Automation and Electrical Systems . . . . . . . . . . . . . . . . . . . . . 68

iv

Page 15: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Lista de Tabelas

3.1 Os resultados da simulação de Monte Carlo para o sistema 3.30. . . . . . 35

4.1 Resultados da simulação - Exemplo 1. . . . . . . . . . . . . . . . . . . . 474.2 Comparação pareada entre controladores - Exemplo 1. . . . . . . . . . . 474.3 Resultados da simulação - Exemplo 2. . . . . . . . . . . . . . . . . . . . 504.4 Comparação pareada entre controladores - Exemplo 2. . . . . . . . . . . 504.5 Resultados da simulação - Exemplo 3. . . . . . . . . . . . . . . . . . . . 534.6 Comparação pareada entre controladores - Exemplo 3. . . . . . . . . . . 544.7 Resultados da simulação - Exemplo 4. . . . . . . . . . . . . . . . . . . . 574.8 Comparação pareada entre controladores - Exemplo 4. . . . . . . . . . . 574.9 Resultados da simulação - Exemplo 5. . . . . . . . . . . . . . . . . . . . 604.10 Comparação pareada entre controladores - Exemplo 5. . . . . . . . . . . 604.11 Resultados da simulação - Exemplo 6. . . . . . . . . . . . . . . . . . . . 624.12 Comparação pareada entre controladores - Exemplo 6. . . . . . . . . . . 62

v

Page 16: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

vi

Page 17: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Lista de Símbolos e Abreviaturas

V Perda média por passo

λ Peso ajustável dos controladores duais subótimos

σ Desvio padrão do ruído de medida e

θ(k) Vetor de entrada e saídas passadas até o instante ’k’

ARX AutoRegressive with eXternal input

ASOD Active Suboptimal Dual

BDC Bicriterion dual controller

Ck Matriz de covariância do ruído de parâmetros

CE Equivalência à Certeza

e(k) Ruído de medida no instante ’k’

IDC Innovations Dual Controller

JN Função de Custo do sistema de N estágios

MRAC Controlador Adaptativo por Modelo de Referência

P(b) Valor médio da variância de parâmetros

P(k) Matriz de covariância do erro de estimação no instante t

PRBS Pseudo-random binary sequences

sgn Função que obtém o sinal do valor numérico

ST R Regulador Auto-Sintonizável

u(k) Sinal de controle do sistema no instante ’k’

uca Controlador cauteloso

uce Controlador equivalente à certeza

uperturb Controlador com sinal de perturbação

vii

Page 18: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

v(k) Vetor de ruído do parâmetro

x(k) Vetor de parâmetros do sistema no instante ’k’

y(k) Saída do sistema no instante ’k’

θ(k) Vetor θ com o sinal de controle u(k−1) substituído por zero

ˆRMS Índice de desempenho do controlador

viii

Page 19: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Capítulo 1

Introdução

Em todos os sistemas de controle existem determinados graus de incerteza com res-peito ao processo a ser controlado. A estrutura e/ou os parâmetros do processo podemse modificar de maneira desconhecida. Existem diversas maneiras de lidar com os tiposde incertezas no processo. O sistema de realimentação em malha fechada já representa,de certo modo, uma ação contra as variações do processo. O projeto de controladoresrobustos com parâmetros fixos também pode ser uma alternativa contra as variações noprocesso. Um outro caminho para lidar com as incertezas é utilizar o controle adaptativo.

O controle adaptativo é uma estratégia de controle que utiliza as medições da entradae saída da planta para se adaptar às variações paramétricas e perturbações da planta. Wit-tenmark (1995) define o controle adaptativo como um controlador que pode modificarseu comportamento em resposta às mudanças na dinâmica do processo e em resposta aocaráter dos distúrbios. Existem diferentes tipos de controladores adaptativos de acordocom as informações do processo que são utilizadas bem como de acordo com a maneiracomo são manuseadas.

Para obter boas informações da planta é necessário perturbar o processo. Normal-mente, de acordo com o nível de perturbação no sistema uma melhor qualidade das in-formações do processo são obtidas. Por outro lado, as especificações do controlador emmalha fechada são tais que a saída do sistema deve variar o mínimo possível. Sendo assim,existe um conflito de interesses entre a coleta de informações do processo e a qualidadedo controle.

Algumas vezes é necessário controlar sistemas com parâmetros desconhecidos e va-riantes no tempo. Para realizar o controle desses sistemas é desejável um controladoradaptativo. Na maioria dos casos, os controladores adaptativos tratam da estimação e docontrole separadamente. Feldbaum (1960-61), entretanto, introduziu e discutiu em umasérie de quatro trabalhos uma nova abordagem para o sinal de controle adaptativo. Nessestrabalhos, o autor apresentou duas propriedades que o sinal de controle ótimo adaptativodeve assegurar: (i) a saída do sistema cautelosamente seguir o valor de referência de-sejado, e (ii) excitar a planta suficientemente para acelerar o processo de estimação deparâmetros. Assim, este tipo de controlador possui duas metas. Este compromisso entrecontrolar e excitar a planta resultou no conceito de controle dual.

Diversos controladores adaptativos não duais são utilizados atualmente de forma satis-fatória em muitas aplicações. O uso do controlador com características duais é vantajoso

Page 20: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

2 CAPÍTULO 1. INTRODUÇÃO

quando o horizonte de tempo for pequeno e quando as estimativas iniciais forem ruins.Alguns artigos sugerem que os sistemas no setor da economia são uma área com bastantepotencial para a aplicação dos controladores duais. Outra situação para a utilização docontrole dual é quando os parâmetros do processo variam muito rapidamente e/ou o ganhoalterna o seu sinal; essa é uma situação em que o processo possui uma não-linearidade e édesejado que o processo trabalhe próximo aos pontos extremos (WITTENMARK, 1995).

Em Feldbaum (1965) foi apresentada uma solução formal para o problema atravésdo uso de programação dinâmica. Entretanto, essa solução é intratável do ponto de vistanumérico e computacional em virtude do excesso de minimizações e cálculos de médias.Vale salientar que alguns casos simples foram resolvidos numericamente ou analitica-mente, como em Stemby (1976). Desde o trabalho de Feldbaum (1960-61), diversos pes-quisadores dedicaram-se ao problema do controle dual. Em virtude da complexidade dasolução ótima, houve uma necessidade em obter diferentes aproximações que resultassemem soluções subótimas com características duais.

Em geral, os controladores subótimos são divididos em dois grandes grupos: (i) aque-les baseados em aproximações do problema adaptativo ótimo dual; e (ii) aqueles baseadosna reformulação do problema para obter uma solução mais simples do sistema, mantendoas características duais. Essas abordagens são chamadas métodos implícitos e explícitos,respectivamente. Ao longo destes cinquenta anos de pesquisas nessa área, dezenas decontroladores duais subótimos foram concebidos. Inicialmente, as publicações tenderama analisar exemplos, desenvolver teorias e investigar possíveis soluções.

Jacobs e Hughes (1974) desenvolveram controladores duais subótimos através deminimização da função de custo sob certas restrições. As restrições foram utilizadas nointuito de garantir um certo nível de exatidão das estimativas dos parâmetros. Jacobs eHughes (1974) utilizaram restrições para o sinal de controle; Alster e Bélanger (1974)optaram por utilizar restrições na variância da estimação.

Em 1975, dois importantes trabalhos foram publicados na área: Wittenmark (1975b)e Wittenmark (1975a). O primeiro, é um survey que reúne dezenas de trabalhos sobrecontrole dual publicados até aquela publicação e consiste num bom referencial históricodas primeiras contribuições nessa área. O segundo retrata o controlador dual subótimoativo - ASOD. A idéia deste controlador consiste em adicionar um termo à função custode controle original, que reflete a qualidade da estimativa.

Milito e Cadorin (1982) apresentaram o controlador dual subótimo por inovações -IDC. Esse controlador criou uma lei dual subótima que busca um compromisso entre ocontrolador cauteloso e o controlador equivalente a certeza. O controlador cauteloso eo controlador equivalente a certeza não são controladores duais, porém são controlado-res precursores, uma vez que consistem em uma solução combinada de identificação econtrole.

Em Chan e Zarrop (1985) a abordagem por inovações tornou-se uma versão dual parao controle generalizado de variância mínima - GMV. Três anos mais tarde, em Radenkovic(1988), foi obtida a prova de estabilidade global e forte consistência dos controladoresduais baseados em inovações.

Em Wittenmark e Elevitch (1985) foi proposta uma simplificação do controlador apre-sentado em Wittenmark (1975a). O sinal de controle do ASOD é obtido somente através

Page 21: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3

de uma minimização numérica, em virtude da equação para a função de custo ser de quintaordem com respeito ao sinal de controle. Sendo assim, esse trabalho propôs uma substi-tuição da função de custo de quinta ordem por uma série quadrática, em que é possívelobter uma solução analítica para o sinal de controle.

Maitelli e Yoneyama (1994a) apresentaram o controlador subótimo dual de multiestá-gios usando preditores ótimos aproximados. Esse controlador minimiza o desvio da saídada planta em relação à referência M passos adiante no tempo. Esse controlador subó-timo dual pode ser interpretado como uma melhoria realizada no controlador adaptativopreditivo de M estágios.

Em Filatov e Unbehauen (1995a) e Filatov e Unbehauen (1995b) foi apresentada aabordagem bicriterial para o controle dual. Esse método consiste basicamente em realizarduas minimizações da função de custo para obter a lei de controle dual. Esse métodofoi estendido para praticamente todos os sistemas adaptativos de controle (FILATOV;UNBEHAUEN, 2000). Kral e Simandl (2011) propuseram e discutiram um controladordual preditivo para sistemas não lineares com incertezas baseado na abordagem bicriterial.

Nos últimos anos, a maioria dos trabalhos relacionados à área de controle dual foca-ram bastante em aplicações, análises comparativas de controladores duais e abordagensdo problema dual através de outras estratégias.

Cervin (1998) desenvolveu uma técnica com programação neural para cálculo de umcontrolador subótimo utilizando um algoritmo de iteração aproximada. Esse controladorobteve bons resultados para sistemas simples. Entretanto, a grande quantidade de parâ-metros de projeto a definir e o excesso de cálculos numéricos, inviabilizam essa técnicapara sistemas mais complexos ou realísticos.

Lee e Lee (2009) aplicaram uma estratégia baseada em programação dinâmica aproxi-mada (ADP) para o problema do controle adaptativo dual. A partir de políticas de controlesubótimas conhecidas, a abordagem por programação dinâmica aproximada pode derivaruma política de controle superior, a qual reduz a incerteza do parâmetro, levando a umamelhoria significativa de desempenho.

Flidr e Simandl (2013) apresentaram um novo controlador dual implícito para siste-mas estocásticos discretos lineares. A solução utiliza programação dinâmica e é utilizadauma regra de integração estocástica para determinar o sinal de controle.

Enquanto diversas soluções subótimas foram propostas e simuladas, a aplicação des-sas técnicas em processos industriais ainda é restrita. Em Ismail, Dumont e Backstrom(2003) foi implementado com sucesso um controlador dual subótimo na indústria de re-vestimento de papel. Foi a primeira vez que esse controlador foi aplicado a um processoindustrial multivariável. O controlador permaneceu em funcionamento por quatro meses,obteve uma melhoria na qualidade do processo e foi capaz de controlar o processo durantetodo o tempo proposto.

Bugeja, Fabri e Camilleri (2009) propuseram um controlador neuro-adaptativo pararealizar o controle dinâmico de robôs móveis não-holonômicos. Esse trabalho apresentounovos esquemas para o controle dual adaptativo neural e sua eficácia foi comprovada pormeio de simulações Monte Carlo para o problema de rastreamento de trajetória.

Neste trabalho é apresentada uma modificação no controlador dual subótimo ativo pro-posto por Wittenmark (1975a) e, posteriormente, simplificado por Wittenmark e Elevitch

Page 22: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4 CAPÍTULO 1. INTRODUÇÃO

(1985). Originalmente, existe um parâmetro de projeto λ (lambda ) associado à funçãof (P(k+2)) a qual pretende assegurar uma boa estimação de parâmetros. Entretanto, esseparâmetro é definido pelo usuário e a definição do valor apropriado para o mesmo é obtidoapós exaustivas simulações. Por este motivo, é proposto nesta tese um ajuste adaptativodo parâmetro λ a cada passo, a fim de melhorar o desempenho e a robustez do contro-lador. Foram utilizados exemplos apresentados na literatura para efeito de comparação esimulações Monte Carlo para avaliar o desempenho de todos os controladores propostos.

Page 23: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

1.1. ORGANIZAÇÃO DO TEXTO 5

1.1 Organização do TextoA presente tese se desenvolve em 5 capítulos, organizados conforme descrito a seguir.No capítulo dois são apresentados os aspectos do controlador dual, a formulação do

problema de controle e da estimação e a descrição do modelo e do critério de desempenho.Além disso, apresentam-se as estratégias de controle adaptativo mais difundidas na litera-tura especializada e suas limitações quando aplicadas a sistemas fortemente variantes notempo.

No capítulo três, destaca-se uma descrição dos controladores duais subótimos. É ex-posta uma série de controladores sugeridos na literatura a fim de solucionar o problemado controle dual. Ainda neste capítulo, mostram-se as simulações de vários controladoresduais apresentados no trabalho.

No capítulo quatro é apresentada a proposta desta tese, desde os problemas originaisencontrados até a solução proposta e as simulações do método para avaliar o desempenhodo controlador.

Por fim, no capítulo cinco, são expostas as considerações finais bem como as sugestõesde trabalho futuros.

Page 24: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

6 CAPÍTULO 1. INTRODUÇÃO

Page 25: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Capítulo 2

Embasamento Teórico - ControleAdaptativo dual

Um sistema de controle adaptativo consiste em um sistema de controle operando sobcondições de incerteza, em que o controlador fornece um desempenho desejado atravésda alteração de parâmetros e/ou estruturas, a fim de reduzir as incertezas e melhorar aconformidade do sistema desejado (FILATOV; UNBEHAUEN, 2004).

2.1 IntroduçãoO projeto de um controlador quando se conhecem o seu modelo matemático e todos

os seus parâmetros pode ser realizado utilizando-se as técnicas conhecidas da teoria decontrole determinístico.

Caso os parâmetros do sistema sejam invariantes no tempo, o controlador poderá terparâmetros fixos. O controlador PID, que pode ser sintonizado por métodos heurísticoscomo o de Ziegler e Nichols ou por métodos de otimização numérica, é um um exemplodeste tipo de controlador. Entretanto, se utilizarmos um controlador com parâmetros fixosem um sistema com parâmetros variáveis, o desempenho pode não ser satisfatório. Essasituação motivou o desenvolvimento de controladores adaptativos, ou seja, controladoresque alteram seus parâmetros conforme mudam as características físicas do sistema.

Nos primeiros anos da década de 1950, diferentes estruturas de controle adaptativoforam desenvolvidas para lidar com os processos com parâmetros desconhecidos ou va-riantes no tempo. Dentre esses, destacam-se o controlador adaptativo por modelo de re-ferência (MRAC) e o controlador auto-sintonizável (STR - Self Tunning Regulator) (ÅS-TRÖM; WITTENMARK, 1995). Ambos controladores possuem uma realimentação so-bre o desempenho do sistema de malha fechada.

A estrutura típica do regulador auto-ajustável é apresentada na Figura 2.1. O mesmopode ser visto como uma composição de laços. O laço interno consiste do processo e deum regulador de malha fechada. O laço externo ajusta os parâmetros do regulador atravésde um estimador de parâmetros recursivo e pelo projeto do controlador.

A estrutura básica do controlador adaptativo por modelo de referência (MRAC - Mo-del Reference Adaptive Control) é vista na Figura 2.2. O desempenho desejado é expressoem termos de um modelo de referência, a qual fornece a resposta desejada ao sinal de con-

Page 26: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

8 CAPÍTULO 2. EMBASAMENTO TEÓRICO - CONTROLE ADAPTATIVO DUAL

Figura 2.1: Diagrama de blocos do Regulador Auto-Sintonizável.

trole. O sistema também contém um laço de realimentação composto pelo processo e pelocontrolador. O erro é obtido pela diferença entre as saídas do sistema e do modelo de refe-rência. O regulador (controlador) contém parâmetros que são modificados baseados nesseerro.

Figura 2.2: Diagrama de blocos de um controlador adaptativo por modelo de referência.

As informações transferidas do estimador são somente as estimativas de parâmetrosdo processo. A incerteza sobre as estimativas dos parâmetros não são levadas em conside-ração. Esses tipos de controladores são conhecidos por utilizar o princípio da equivalênciaà certeza (CE). Os parâmetros do processo são estimados, utilizados e empregados comose estes correspondessem aos seus valores verdadeiros. Isto significa que as incertezassobre as estimativas dos parâmetros não são exploradas totalmente.

Caso as incertezas sejam grandes no início da estimativa ou caso os parâmetros doprocesso sejam variáveis no tempo, será necessário que a lei de controle leve em consi-deração tanto as estimativas dos parâmetros bem como as incertezas envolvidas. Assim,

Page 27: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

2.1. INTRODUÇÃO 9

percebe-se que essas estruturas de controle adaptativo não produzem controladores óti-mos.

A Figura 2.3 apresenta a estrutura genérica do controlador adaptativo dual. A ideiabásica é que a entrada do sistema desempenhe um papel dual: promover o aprendizadosobre o sistema e estabelecer boa regulação. Para garantir o aprendizado, a entrada intro-duz perturbações que rendam informações futuras sobre a dinâmica do sistema, e assimreduzam as incertezas. Para efetuar regulação, a entrada tenta manter a saída em um valordesejado. Na maioria dos casos estas duas regras são conflitantes e, então, o controla-dor deve estabelecer um compromisso ótimo entre aprendizado e regulação (MAITELLI,1994).

Figura 2.3: Sistema adaptativo de controle dual.

Feldbaum (1960-61) esteve entre os primeiros a perceber que o controlador adaptativoótimo deveria ser realmente um controlador dual. O controlador não deveria somentecontrolar o processo, mas também, às vezes, excitar o processo a fim de que melhoresestimativas pudessem ser obtidas e, assim, melhorar o desempenho a longo prazo. Atravésda programação dinâmica, é possível formular o controlador adaptativo dual ótimo.

O resultado é uma equação recursiva funcional, conhecida como equação de Bell-man. Essa equação é bastante complexa para resolver. Não existe solução analítica,exceto em casos triviais. Uma solução numérica requer uma grande carga computacionale torna-se impossível executar em problemas reais. O desenvolvimento, algumas análisese discussões da solução para o problema do controle ótimo dual podem ser encontradasem Veressinina Y. ; Wall (1999).

Apesar das dificuldades encontradas na solução ótima exata para o problema do con-trole dual, a ideia de um controlador com propriedade dual permaneceu bastante atraente.Por consequência, diversos controladores duais subótimos foram propostos. Os controla-dores duais subótimos necessitam ter características tanto de provocação como de cautela.A Figura 2.4 apresenta uma organização das diversas soluções de identificação e controleassociadas no contexto de controle adaptativo.

Page 28: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

10 CAPÍTULO 2. EMBASAMENTO TEÓRICO - CONTROLE ADAPTATIVO DUAL

Figura 2.4: Organização das soluções combinadas do problema de identificação e con-trole.

A primeira divisão ocorre entre os controladores não duais e os controladores duais.Os controladores não duais não realizam a provocação no sistema, logo o aprendizado éacidental ou passivo, ou seja, não existe um controle provocador (probing control) inten-cional. Os controladores equivalente à certeza são exemplos típicos dessa classe.

O outro tipo de controlador dessa classe é o controlador cauteloso. O controladorcauteloso é obtido a partir de uma modificação no controlador equivalente à certeza. Essecontrolador é obtido quando o horizonte de controle na função de custo é igual a um.Ambos controladores, equivalente à certeza e cauteloso, não tomam nenhuma ação com ointuito de melhorar a informação sobre os parâmetros desconhecidos. Na próxima seção,esses controladores serão especificados matematicamente.

Já os controladores duais abrangem os controladores duais ótimos e os controladoresduais subótimos. Os controladores duais subótimos buscam encontrar aproximações ououtras maneiras para alterar o controlador de tal modo que características duais sejam in-troduzidas. Basicamente, existem duas maneiras para conseguir esse objetivo: realizandovárias aproximações a partir do problema ótimo do controle dual ou reformulando o pro-blema de maneira que a solução mais simples possa ser calculada. As principais maneiraspara desenvolver controladores duais subótimos são:

1. Adicionar sinais de perturbação ao controlador cauteloso;2. Restringir a variância dos parâmetros estimados.3. Realizar aproximações da função de custo.4. Modificar a função de custo.5. Resolução numérica a partir de conjunto de parâmetros finitos.

A primeira técnica de obter um controlador dual subótimo é através da inserção inten-cional de um sinal de perturbação a fim de aumentar a excitação do processo e melhorar aprecisão das estimativas. Outra possibilidade são os controladores que definem suas leis

Page 29: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

2.2. DESCRIÇÃO DO PROBLEMA 11

de controle sob certas restrições. A intenção também é garantir um nível de precisão nasestimativas de parâmetros.

A terceira técnica busca realizar uma aproximação da função de custo. Essa aproxi-mação visa simplificar a função de custo de modo que as informações estejam disponíveismais facilmente. O penúltimo método pretende modificar a função de custo original adi-cionando termos simples que refletem a qualidade da estimativa futura. Por fim, a últimapossibilidade listada para obter controladores duais subótimos são através dos métodosnuméricos a partir da otimização da equação de Bellman.

2.2 Descrição do Problema

2.2.1 O modelo

Considere a classe de estrutura de modelos do tipo ARX (AutoRegressive with eXter-nal input), discreto no tempo e no formato de equação de diferenças:

y(k)+a1(k)y(k−1)+ · · ·+am(k)y(k−m) =

b1(k)u(k−1)+ · · ·+bn(k)u(k−n)+ e(k)(2.1)

em que y(k) ∈ ℜm é a saída do sistema, u(k) ∈ ℜn é a entrada e e(k) ∈ ℜ é o ruído. Asequência de ruído e(k) é um conjunto de variáveis aleatórias independentes com distri-buição gaussiana, média zero e desvio padrão σ. Além disso, é suposto que a sequência deruídos seja independente de y(k−1),y(k−2), ...,u(k−1),u(k−2), ...,a1(k),a2(k), ...,am(k),b1(k),b2(k), ...,bn(k)) e que b1(k) 6= 0 para todo instante k.

O vetor de parâmetros variantes no tempo:

x(k) = [a1(k) a2(k) · · · am(k) | b1(k) b2(k) · · · bn(k)]T (2.2)

é modelado por um processo Gauss-Markov, o qual satisfaz a equação de diferenças esto-cástica:

x(k+1) = Φx(k)+ν(k) (2.3)

em que Φ ∈ℜ(m+n)x(m+n) é uma matriz (m+n) por (m+n) conhecida e νk ∈ℜm+n, k =0,1,2, ...,N é o vetor de ruído do parâmetro. A sequência ν(k) é uma sequência de vetoresnormais independentes igualmente distribuídos com média zero e matriz de covariânciaCv. O estado inicial do sistema (2.3) é assumido ser normalmente distribuído com valormédio:

E x(0)= vm (2.4)

e covariância:covx(0),x(0)= R0 (2.5)

considera-se também que e(k) é independente de ν(k).O modelo do sistema (2.1) pode ser reescrito, numa forma compacta, como:

y(k) = θ(k)x(k)+ e(k) (2.6)

Page 30: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

12 CAPÍTULO 2. EMBASAMENTO TEÓRICO - CONTROLE ADAPTATIVO DUAL

em que:

θ(k) = [−y(k−1) − y(k−2) · · ·− y(k−m) | u(k−1) u(k−2) · · · u(k−n)] (2.7)

é o vetor de entradas e saídas passadas. Portanto, o modelo do sistema é definido pelasequações (2.3) e (2.6).

2.2.2 O critérioO propósito do controlador é, dado um sinal de referência yr(k), fazer com que a

saída do sistema y(k) siga o mais próximo possível em N passos de controle. O critériode controle quadrático a seguir é utilizado para quantificar o erro de rastreamento:

N

∑k=1

w(k)(y(k)− yr(k))2 (2.8)

em que w(k) é uma sequência de pesos que expressa uma decisão de quão importante sãoos erros iniciais e futuros. Para levar em consideração a influência da sequência de ruídose(k), é necessário o uso da esperança estocástica:

JN = E

(N

∑k=1

w(k)(y(k)− yr(k))2

)(2.9)

A equação (2.9) será o critério a partir do qual o desempenho de cada controladorserá avaliado. O controlador que apresentar os menores índices para esse critério seráconsiderada a melhor solução em controle.

O problema de projeto do controlador é formulado como sendo a seleção da sequênciade controles u(i), i= k, ...,k+N−1, que minimiza a função custo dada por (2.9) sujeita àsequações do sistema (2.3) e (2.6). O controle deve ser causal, ou seja, o sinal de controleno instante k, u(k), pode depender somente de medidas e controles atuais e passados.

Vale ressaltar que existem outros índices de critérios para avaliação desses controla-dores. A essência é semelhante em todos esses critérios. Em Lindoff, Holst e Wittenmark(1999), o valor RMS entre a saída e a referência é utilizado para avaliar o desempenhodos controladores.

ˆRMS =

√1

T −n+1

T

∑t=n

(y(k)− yr(k))2 (2.10)

em que T é o tamanho de cada simulação.

2.2.3 A estimação de parâmetrosPara a solução do problema de controle dual necessita-se avaliar a influência do si-

nal de controle nas saídas futuras, bem como estimar o comportamento dos parâmetrosestocásticos. O problema da estimação requer, dadas as medidas disponíveis, calcular adistribuição de probabilidade condicional dos parâmetros.

Page 31: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

2.3. CONTROLADOR EQUIVALENTE À CERTEZA 13

Teorema número 1 - Distribuição condicional dos estados

Considerando o modelo de variação dos parâmetros dado pela equação (2.3), com asaída definida pela equação (2.6), em que e(k) e v(k) são variáveis gaussianas indepen-dentes com média zero e covariâncias σ2 e Cv, respectivamente; temos que a distribuiçãocondicional de x(k), dado Ik−1, é gaussiana com média x(k) e matriz de covariância P(k),satisfazendo as seguintes equações de diferença, (MAYBECK, 1982).

x(k+1) = Φx(k)+K(k)(y(k)−θ(k)x(k))

P(k+1) =(Φ−K(k)θT (k)

)P(k)ΦT +Cv

K(k) = ΦP(k)θT (k)(θ(k)P(k)θT (k)+σ

2)−1(2.11)

com condições iniciais

x(0) = x0

P(0) = R0(2.12)

A distribuição de y(k), dado Ik−1, é também gaussiana com média:

y(k) = θ(k)x(k) (2.13)

e covariânciaσ

2y(k) = θ(k)P(k)θk(k)+σ

2 (2.14)

em que Ik−1 é o conjunto de medidas e controle passados, também chamado de conjuntoinformação, Ik, ou seja:

Ik = Y k0 ,U

k−10 ⊃ Ik−1 (2.15)

em queY k

i = y( j)kj=i e Uk

i = u( j)kj=i (2.16)

Prova: Em virtude do teorema acima ser idêntico ao teorema de filtro de Kalman, maisdetalhes da prova do teorema podem ser encontrados em livros tradicionais de controleestocástico, como em Chen (1985) e em Anderson e Moore (1979).

As estimativas dos parâmetros desconhecidos são obtidas pelas equações ordinárias deKalman. É importante salientar, entretanto, que a matriz P(k) não pode ser pré-computadaem virtude de depender da atual realização do vetor θ(k). No tempo k−1 o vetor θ(k) éconhecido e pode ser utilizado nas equações de estimação acima apresentadas.

2.3 Controlador Equivalente à Certeza

O controlador equivalente à certeza, introduzido na seção 2.1, juntamente com o con-trolador cauteloso, são os controladores precursores dos controladores duais subótimos.Nesse controlador, as estimativas x(k) são utilizadas para formular a lei de controle comose eles fossem os parâmetros verdadeiros. É o controlador de cálculo mais simples. A

Page 32: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

14 CAPÍTULO 2. EMBASAMENTO TEÓRICO - CONTROLE ADAPTATIVO DUAL

incerteza envolvida no processo de um único estágio é ignorada. A lei de controle podeser obtida através da malha de controle de realimentação ou através da minimização docritério (2.9) para N = 1.

uce(k) =yr(k)− θ(k)x(k)

b1(k)(2.17)

em queθ(k) = [−y(k−1) · · · − y(k−m) | 0 u(k−2) · · · u(k−n)] (2.18)

o vetor θ(k) é similar ao θ(k), exceto que u(k−1) é substituído por zero.O bom desempenho desse controlador está diretamente ligado a qualidade das estima-

tivas para as variáveis estimadas. Além disso, é necessário assegurar que b1 seja diferentede zero.

2.4 Controlador Cauteloso

O controlador cauteloso é aquele que minimiza a cada instante k o desvio da saída emrelação ao valor desejado apenas um passo adiante, ou seja, minimiza a função de custo(2.9) com N = 1. A minimização do controlador diverge bastante em complexidade casoa variável N seja maior do que 1.

J1 = E(y(k+1)− yr(k+1))2|Ik (2.19)

Segue do lema fundamental do controle estocástico (ÅSTRÖM; WITTENMARK, 1971),que

minu(k+ j−1)...u(kN−1)

E

N

∑i= j

(y(k+ i)− yr(k+ i))2

=

EIk+ j−1

(minE

N

∑i= j

(y(k+ i)− yr(k+ i))2 | Ik+ j−1

) (2.20)

O problema é determinar o sinal de controle u(k) que minimize a função de custo(2.19). A distribuição condicional de y(k+1), dado yk, é normal com valor médio

E(y(k+1) | yk) = θ(k+1)x(k+1) (2.21)

e covariância

cov(y(k+1),y(k+1) | yk) = θ(k+1)P(k+1)θ(k+1)T +σ2 (2.22)

Utilizando as equações (2.3) e (2.6) podemos escrever que:

E(y(k+1)− yr(k+1))2 | yk

= (θ(k+1)x(k+1)− yr(k+1))2+

+θ(k+1)P(t +1)θT (k+1)+σ2

(2.23)

Page 33: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

2.5. CONCLUSÃO 15

Definindo o vetorl = [0 0 . . .0|1 0 · · ·0] (2.24)

podemos escrever que:θ(k+1) = lu(k)+ θ(k+1) (2.25)

em que θ(k) é definido em (2.18)Substituindo (2.25) em (2.23), temos:

=(θ(k+1)x(k+1)+ b1(k+1)u(k)− yr(k+1)

)+

+θ(k+1)P(k+1)θT (k+1)+u2(k)pb1(k+1)+

+2u(k)lP(k+1)θT (k+1)+σ2

(2.26)

em que pb1 é a variância do parâmetro estimado b1. A equação (2.26) é quadrática emu(k) portanto, realizando a minimização em relação a u(k), obtemos o controlador um-passo-adiante, ou controlador cauteloso:

uca(k) =−θ(k+1)x(k+1)b1(k+1)+ lP(k+1)θT (k+1)− yr(k+1)b1(k+1)

b21(k+1)+ pb1

(2.27)

O controlador cauteloso mostrado na equação (2.27) difere do controlador equivalenteà certeza apresentado na equação (2.17) devido às incertezas dos parâmetros estimadosque agora são levadas em consideração. É possível reduzir o sinal de controle cautelosoao sinal de controle equivalente à certeza, desprezando as incertezas na equação (2.27),ou seja, fazendo P(k+1) = 0.

uce(k) =yr(k+1)− θ(k+1)x(k+1)

b21(k+1)

(2.28)

A magnitude do sinal de controle (2.27) diminuirá caso a variância do parâmetro esti-mado (pb1) aumente. Isso compromete a estimação dos parâmetros no próximo passo e avariância tende a aumentar ainda mais. Assim, o controlador entra em um círculo viciosoe a magnitude do sinal de controle torna-se muito pequena durante vários períodos detempo. Esse fenômeno é chamado de turn-off (ÅSTRÖM; WITTENMARK, 1995).

O desligamento do sinal ocorre geralmente quando o sinal de controle e o parâmetro bpossuem valores pequenos. Esse problema torna a aplicação do controlador inviável parasistemas de controle onde os parâmetros tenham variação rápida.

2.5 Conclusão

Esse capítulo apresentou o problema do controle dual. Além disto, este capítulo des-creveu o modelo ARX de um sistema clássico de controle adaptativo dual, bem como afunção de custo associada ao mesmo e as estimativas necessárias ao sistema. Por fim, fo-ram apresentados os dois controladores não duais que realizam as atividades de controle eidentificação combinadas. No capítulo seguinte serão apresentados os controladores duais

Page 34: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

16 CAPÍTULO 2. EMBASAMENTO TEÓRICO - CONTROLE ADAPTATIVO DUAL

subótimos.

Page 35: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Capítulo 3

Controladores Duais Subótimos

3.1 Introdução

Esse capítulo apresentará diferentes abordagens para soluções aproximadas referentesao problema do controle dual ótimo. O controlador dual ótimo é de uso prático limi-tado devido à grande carga computacional envolvida. Entretanto, a característica dual docontrolador de estabelecer um bom controle e, ao mesmo tempo, reduzir incertezas é degrande interesse. Essa característica não está presente no controlador cauteloso, pois amagnitude de seu sinal de controle decresce com o aumento das incertezas sobre as esti-mativas dos parâmetros, podendo levar ao fenômeno de desligamento do sinal de controle.Assim, muitos controladores subótimos foram desenvolvidos através de aproximações oureformulações do problema.

A simplicidade do controlador cauteloso e o fenômeno do turn-off motivaram algu-mas sugestões de controladores duais subótimos. Algumas dessas modificações serãodiscutidas nas seções seguintes. Posteriormente, outros controladores subótimos duaistambém serão abordados a fim de sintetizar, de maneira geral, as soluções existentes parao problema do controle dual ótimo.

3.2 Controlador com sinal de perturbação

O fenômeno de desligamento do sinal de controle ocorre devido à falta de excitação aosistema. Wieslander e Wittenmark (1971) sugeriram a adição de um sinal de perturbação,ruído branco ou sinais do tipo PRBS, a fim de aumentar a excitação do sistema e, con-sequentemente, aumentar a precisão das estimativas. A perturbação pode ser adicionadatodo o tempo ou somente quando a incerteza sobre os parâmetros exceder algum limite.O novo controlador terá o seguinte formato:

uperturb(k) = uca(k)+up(k) (3.1)

em que uca é o sinal de controle cauteloso e up é o sinal de perturbação adicionado in-tencionalmente. A adição de um sinal extra aumentará naturalmente a magnitude do sinalde controle, porém será possível melhorar o desempenho geral através de menores perdasnos passos futuros. A desvantagem dessa técnica consiste em não haver uma maneira

Page 36: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

18 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

sistemática de decidir o exato momento e a intensidade do sinal que deve ser adicionado.

3.3 Controlador com restriçõesOutra classe de controladores duais utilizam a expressão analítica simples do contro-

lador cauteloso (2.27) e obtém novas leis de controle através da minimização da funçãode custo com algumas restrições. Essas restrições são utilizadas para garantir um nívelde exatidão das estimativas de parâmetros e, consequentemente, evitar o desligamento dosinal de controle. As restrições se resumem, basicamente, à limitação do valor mínimo dosinal de controle e a limitação na variância dos parâmetros.

Jacobs e Hughes (1974) definiram um método de restrição onde um sinal cautelosoextra é adicionado caso o sinal de controle cauteloso original seja inferior a um sinallimitante:

u(k) =

ulimsign(uca) , se |uca|< |ulim|uca , se |uca| ≥ |ulim|

(3.2)

em que a função ulimsign() representa o sinal de controle máximo ou mínimo definidopelo usuário.

Alster e Bélanger (1974) definiram a minimização da função de custo sujeito à se-guinte restrição:

trP−1(k+2)≥M (3.3)

onde P−1 é a matriz de informação. A limitação em seu traço significa que a informaçãosobre os parâmetros é forçada a ser sempre maior que um valor estabelecido M.

Mosca, Rocchi e Zappa (1978) definiram uma abordagem similar a Alster e Bélanger(1974) para obter a lei de controle. Todavia, a restrição envolve as estimativas atuais dosparâmetros estimados:

pb1(k+2)≤

γb2

1(k+2) , se pb(k+1)≤ b21(k+1)

αpb , caso contrário(3.4)

em que γ e α são coeficientes lineares determinados pelo usuário.A vantagem dessas modificações consiste em que os controladores com características

duais são obtidos de uma maneira simples. Esses controladores (3.2), (3.3) e (3.4) nãoprevinem o desligamento do sinal, em virtude da lei de controle cautelosa ser modificadasomente próxima do fenômeno ocorrer. Por isso são chamados de controladores passi-vos. Além disso, esses controladores contém parâmetros que devem ser escolhidos pelousuário.

3.4 Controlador dual subótimo ativoO controlador dual subótimo ativo (ASOD) foi apresentado por Wittenmark (1975a) e

sua proposta consiste em adicionar um segundo termo na minimização da função de custo.Esse termo adicionado é uma função da matriz de variância dos parâmetros estimados e

Page 37: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.4. CONTROLADOR DUAL SUBÓTIMO ATIVO 19

reflete na qualidade da estimativa de parâmetros. Essa sugestão leva a função de custo a

Jasod = E(y(k+1)− yr(k+1))2 +λ f (P(k+2)|It

(3.5)

em que λ ∈ ℜ é um peso ajustável, entre 0 e 1, utilizado para agregar os funcionaisde custo do controle imediato e da estimação futura. A função f (·) deve ser positiva emonotonicamente crescente. O objetivo do termo adicional na função custo de um estágioé assegurar uma boa estimativa de parâmetros. Isso implica que os elementos da diagonalde P(k + 2) devem ser pequenos em magnitude. Caso a estimativa seja boa, ou seja ovalor da variância pb1 pequeno, então o controle não sofrerá o efeito de desligamentodo sinal, bem como haverá excitação ao sistema, garantindo uma boa estimativa para osoutros parâmetros.

Utilizando as fórmulas de estatística conhecidas, como em (2.23), e a equação deestimação da matriz de variância, seção (2.2.3), a função de custo (3.5) pode ser assimrepresentada:

minu(k)Jasod = min[(θ(k+1)x(k+1)− yr(k+1))2 +θ(k+1)P(k+1)θ(k+1)T+

+σ2]+λ f (φP(k+1)φT +Cv−φP(k+1)θ(k+1)T(

θ(k+1)P(k+1)θ(k+1)T +σ2)−1

θ(k+1)P(k+1)φT )(3.6)

em que a função f (·) é de livre escolha do projetista. A intenção desse termo adicional égarantir que os elementos da diagonal dessa matriz sejam os menores possíveis. Escolhasrazoáveis para a função f são:

f (P(k+2)) = pb0(k+2) (3.7)

ouf (P(k+2)) = tr(pb1(k+2)) (3.8)

ou

f (P(k+2)) = σ2 pb1(k+2)

pb1(k+1)(3.9)

A função de custo desse controlador (equação 3.6) possui a desvantagem de não serquadrática em u(k). Assim, não é possível obter uma expressão analítica dessa funçãopara obter a lei de controle através da minimização. O trabalho sugere uma minimizaçãonumérica.

O procedimento de busca do mínimo da função é facilitado em virtude de conheci-mento das propriedades da matriz de variância e da função de custo. A função de custodesse controlador é de quinta ordem. Portanto, a função possui um, dois ou três mínimoslocais. Assim, a busca pelo mínimo global não é tão trivial e é realizada em diferentesintervalos e usando as propriedades da matriz P de estimação.

A escolha do parâmetro λ de f P(k + 2), realizada pelo usuário, não é definida notrabalho. Maitelli e Yoneyama (1990) afirmam que a escolha desse parâmetro pode ser

Page 38: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

20 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

muito importante em alguns casos e utilizam um algoritmo adaptativo para determinaresse parâmetro.

3.5 Controlador dual subótimo ativo aproximado

O controlador subótimo dual ativo aproximado é baseado na mesma função de custodeterminada pelo controlador ASOD ( 3.5).

Jasod = E(y(k+1)− yr(k+1))2 +λ f (P(k+2)|Ik

Em geral não é possível minimizar esta função de custo analiticamente em virtude da

matriz P(k+2) ser um função não linear de u(k). Para evitar um procedimento iterativocom o objetivo de obter uma solução, uma aproximação em série foi proposta a fim deobter uma solução analítica. A partir de uma expansão em série da função de custo aoredor de um controle nominal e mantendo os termos de primeira e segunda ordem, serápossível obter uma expressão analítica para o sinal de controle.

A função de custo (3.6) pode ser reescrita da seguinte forma:

Jasda =[(

θ(k+1)+ lu(k))

x(k+1)− yr(k+1)]+(

θ(k+1)+ lu(k))

P(θ(k+1)+ lu(k)

)T+σ

2 +λL(u)(3.10)

em que

L(u) = σ2l[ΦP(k+1))Φ+R1+

ΦP(k+1)(θ(k+1)+ lu(k)

)T (θ(k+1)+ lu(k)

)P(k+1)T ΦT )(

θ(k+1)+ lu(k))

P(θ(k+1)+ lu(k)

)T+σ2

]lT ÷ lP(K +1)lT

= σ2

lR1lT +Φ2

b

[pb1[θ(k+1)P(k+1)θ(k+1)T +σ2]− [lP(k+1)θ(k+1)T ]2]

pb1u2 +2lP(k+1)θ(k+1)u(k)+ θ(k+1)P(k+1)θ(k+1)T +σ2

÷ lP(k+1)lT

(3.11)

Agora temos uma função de custo Jasda como uma função de u(k) somente, uma vezque θ(k+ 1) não é influenciado por u(k). A expansão em série no ponto unom fornece aaproximação

Jasda(u)≈Jasda(unom)+∂Jasda(unom)

∂u(u−unom)

+12

∂2Jasda(unom)

∂u2 (u−unom)2

(3.12)

Page 39: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.5. CONTROLADOR DUAL SUBÓTIMO ATIVO APROXIMADO 21

As derivadas parciais de Jasda são dadas por:

∂Jasda(unom)

∂u= 2

[(θ(k+1)x(k+1)+ b1u(k)− yr(k+1)

)b1 + lP(k+1)θ(k+1)T + pb1

]+λ

∂L∂u

∂2Jasda(unom)

∂u2 = 2(b2

1 + pb1)+λ

∂2L∂u2

(3.13)

Para facilitar a compreensão, introduz-se a notação

d1 = lP(k+1)θ(k+1)T

d2 = pb1(θ(k+1)P(k+1)θ(k+1)T +σ

2)−d21

(3.14)

As derivadas parciais da função L(u) são dadas por

∂L∂u

=−Φ2bd2

2(pb1u(k)+d1)(pb1u2 +2d1u(k)+ θ(k+1)P(k+1)θ(k+1)T +σ2

)2σ2

pb1

∂2L∂u2 = Φ

2bd2

6(pb1u(k)+d1)2−2d2(

pb1u2 +2d1u(k)+ θ(k+1)P(k+1)θ(k+1)T +σ2)3

σ2

pb1

(3.15)

Minimizando a expressão da segunda ordem de Taylor ( 3.12) temos

∂Jasda(u)∂u

≈2[(

θ(k+1)+ lunom)

x(k+1)− yr(k+1)]

b1 +d1 + pb1unom

+λ∂L(unom)

∂u+

[2(b2

1 + pb1)+λ

∂2L(unom)

∂u2

](u−unom)

(3.16)

Assim, temos a lei de controle por aproximação da função de custo

u∗ = unom−2[(

θ(k+1)+ lunom)

x(k+1)− yr(k+1)]

b1 +d1 + pb1unom+λ

∂L(unom)∂u

2(b2

1 + pb1)+λ

∂2L(unom)∂u2

(3.17)

O sinal de controle nominal precisa ser especificado apropriadamente na região dafunção de custo. A determinação do controle nominal é apresentada em Wittenmark eElevitch (1985).

Page 40: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

22 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

3.6 Controlador dual por inovações

Milito e Cadorin (1982) apresentaram o controlador dual por inovações. O controla-dor é caracterizado por tentar realizar o compromisso entre os dois controladores extremosnão duais: o controlador equivalente à certeza e o controlador cauteloso. A solução ana-lítica desse controlador mostra que a lei de controle é regulada por um parâmetro λ e estásituada entre esses dois controladores. O controlador dual por inovações é definido comoo controlador que minimiza

Jidc = E(y(k+1)− yr(k+1))2−λ(k+1)υ2(k+1)

(3.18)

em queυ(t +1) = y(t +1)− y(t +1) = y(t +1)−θ(t +1)x(t +1) (3.19)

e λ é o parâmetro de aprendizagem, designado pelo usuário, que reflete o grau de com-promisso entre o efeito de controle imediato e o efeito de aprendizagem do controlador.O valor do parâmetro λ pode variar entre os limites 0 e 1. A ideia deste controlador éatuar no sistema de acordo com a diferença entre a saída da planta real e a saída da plantaestimada um passo adiante no tempo.

Assim, o sinal de controle uidc(t) que minimiza a função de custo (3.18) é

uidc(t) =−θ(t +1)x(t +1)bb1 +(1−λ)IP(t +1)θT − yrbb1

b2b1 +(1−λ)pb1

(3.20)

É importante observar que é possível obter o controlador equivalente à certeza e ocontrolador cauteloso a partir desse controlador. Isso ocorre quando o valor de λ for,respectivamente, igual a 0 e 1.

3.7 Controlador dual por bicritério

A ideia básica do controlador dual por bicritério (BDC) consiste na minimização deduas funções de custo, que correspondem às duas metas do controlador dual. O métodoé baseado em duas minimizações sequenciais onde, primeiramente, é realizado a minimi-zação de acordo com (2.23), onde são obtidos os resultados do controlador cauteloso. Emseguida, uma segunda função de custo é minimizada

J =−E(

y(k+1)− b1(t)u(k))2 |Ik

(3.21)

onde, nessa segunda minimização, algumas restrições são utilizadas ao redor da primeiraminimização no seguinte formato

Ωt = uca(t)− f (Pk);uca + f (Pk) (3.22)

Essas restrições limitam a excitação simetricamente ao redor da ação de controle cau-

Page 41: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.8. CONTROLADOR MULTIESTÁGIOS USANDO PREDIÇÃO ÓTIMA APROXIMADA23

telosa. Assim, a lei de controle dual por bicritério pode ser assim definida

u(k) = uca(k)+ sgnuca(k)θ(k) (3.23)

em que

sign(x) =

1, se x ≥ 0−1, se x < 0

(3.24)

A otimização bicriterial realizada para formular o sinal de controle dual é retratada naFigura 3.1. O sinal de controle cauteloso minimiza a primeira função de custo (J1). Osinal de controle dual é obtido a partir da minimização da segunda função de custo (J2)de acordo com as magnitudes de excitação no domínio Ωt que representa a região ótimada primeira função de custo. Diferentemente de outros controladores duais explícitos,como por exemplo o controlador dual por inovações (3.7), o parâmetro θ(k) possui umainterpretação física clara: a importância das excitações. A partir das excitações no sistemaa lei controle obtida será definido apropriadamente.

Figura 3.1: Minimizações da abordagem do controlador dual por bicritério.

3.8 Controlador multiestágios usando predição ótima apro-ximada

Maitelli e Yoneyama (1994b) apresentaram um controlador dual subótimo de mul-tiestágios usando preditores ótimos aproximados, a qual minimiza o desvio da saída emrelação à referência M passos adiante no tempo. O sinal de controle é obtido utilizandopredições ótimas aproximadas substituindo as saídas futuras estimadas em virtude da ta-refa dispendiosa da avaliação de momentos de ordem superior.

Page 42: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

24 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

A função de custo a ser minimizada é dada por

V ′M = E

1M

M

∑i=1

((y′(k+ i)− yr(k+ i)

)2 | Ik)

(3.25)

em que y′(k+ i) é calculada a partir da saída y(k+ i), dada por

y(k+ i) = θ(k+ i)

i−1x(k+1)+i−1

∑j=1

Φ

j−1 (Γw(k+ i− j)+ v(k+ i− j))]

+ e(k+ i)

(3.26)

e

θ(k+ i) = [− y(k+ i−1) − y(k+ i−2) · · ·− y(k+1) − y(k+ i−m) |u(k−d + i) u(k−d + i−1) · · · u(k−d−n+ i+1)]

(3.27)

em que

θ(k+ i) = [− ypa(k+ i−1) − yp

a(k+ i−2) · · · − ypa(k+ i) − yp

a(k+ i−m) |u(k−d + i) u(k−d + i−1) · · · u(k−d−n+ i−1)]

(3.28)

ypa(k+ j) = θ(k+ j)

j−1x(k+1)+j−1

∑i=1

Φi−1

Γw(k+ j− i)

](3.29)

A ideia em se propor a função de custo (3.25) é a de que forçando o controlador aminimizar o desvio da saída em relação à referência vários passos adiante, o mesmo teráque investir também na estimação. Isto dará ao mesmo uma característica dual. Sãoutilizadas saídas aproximadas y′(k+ i) para substituir as saídas reais y(k+ i), porque énecessário realizar algumas aproximações com momentos de ordem superior.

Vale ressaltar algumas vantagens desse controlador. Primeiramente, o cálculo do sinalde controle requer um esforço computacional moderado para pequenos valores de N naequação da função de custo (2.9). Outra vantagem seria que o controlador não requera sintonia pelo usuário de parâmetros ajustáveis. Além disto, a solução analítica para osinal de controle dispensa algoritmos de minimização, onde esta tarefa requer um grandeesforço computacional principalmente para valores de N elevados. Por fim, podemosdizer que esse controlador tem um desempenho cada vez melhor à medida que o N dafunção de custo aumenta.

Page 43: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.9. SIMULAÇÕES - CONTROLADORES DUAIS SUBÓTIMOS 25

3.9 Simulações - controladores duais subótimosEssa seção apresenta um exemplo de solução do problema de controle dual para um

integrador com ganho variável no tempo. É avaliado o desempenho de alguns controlado-res duais apresentado nas seções anteriores. As simulações foram realizadas utilizando oprograma Matlab R©. O programa permite que sejam comparadas leis de controle diferen-tes utilizando a mesma sequência de ruídos. O programa foi desenvolvido de modo quediferentes sistemas, com parâmetros facilmente ajustáveis, possam ser simulados simul-taneamente. Sendo assim, foram realizados testes para diversas configurações de sistema.

O método estatístico de simulação Monte Carlo foi utilizado para auxiliar na deter-minação da solução no programa (MAK; MORTON; WOOD, 1999). A importância daincerteza nos modelos matemáticos é expressa no valor esperado da informação. Em si-tuações em que não se pode determinar precisamente o comportamento dos ruídos, bemcomo reunir mais informações sobre o futuro do sistema, é pertinente para os controlado-res conhecerem o comportamento do sistema em relação às mais diversas situações a queos problemas estocásticos se submetem (BIRGE, 1981).

3.9.1 Sistema de primeira ordemUtilizou-se um sistema de primeira ordem para comparar os seguintes controladores:

• Controlador equivalente à certeza• Controlador cauteloso• Controlador com restrições• Controlador aproximado dual ativo• Controlador dual por inovações• Controlador dual por bicritério

O processo a ser controlado é um sistema de primeira ordem com ganho variável notempo. O modelo possui a seguinte configuração

y(t)+a(t)y(t−1) = b(t)u(t−1)+ e(t) (3.30)

ondea(t +1) =−0.9 (3.31)

b(t +1) = 0.9b(t)+ v(t) (3.32)

Os ruídos e(t) e v(t) têm média zero e desvios padrões 0,5 e 1,0, respectivamente. Ovalor de referência é 1,0.

A simulação Monte Carlo é utilizada para comparar o desempenho desses controlado-res. São realizadas 300 simulações diferentes para cada controlador, onde cada simulaçãopossui 400 passos. Assim, são calculados a perda média por passo V e o desvio padrãoσv, dados por

V =1

300

300

∑i=1

Vi

(3.33)

Page 44: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

26 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

σv =

√1

300

300

∑i=1

(Vi−V )2 (3.34)

em que

Vi =1

400

400

∑j=1

(y(t + j)− yr(t + j))2 (3.35)

e o valor médio da variância do parâmetro b (pb) é dado por

pb =1

300

300

∑i=1

pbi

(3.36)

em que

pbi =1

400

400

∑j=1

pb0( j) (3.37)

Utilizou-se a mesma sequência de ruídos para todos os controladores, ou seja, paracada valor de i em (3.33), (3.34) e (3.36) estava associada uma sequência de ruídos, v(t)e e(t), k = 1, · · · ,400. Não existe relevância estatística em comparar os resultados dedois controladores onde os ruídos apresentam configurações distintas.É importante res-saltar também que a média obtida da Equação 3.33 e 3.34 mede a qualidade do controle,enquanto que a média obtida pela Equação 3.36 mede a qualidade na estimação dos parâ-metros.

Em cada simulação são observadas diversas características da planta, dentre estes: pa-râmetro real variante no tempo, parâmetro estimado variante no tempo, parâmetros fixos,entrada do sistema, saída da planta, perda acumulada, variância do parâmetro variantedo tempo, dentre outros. Os gráficos do parâmetro real e do parâmetro estimado serãosempre exibidos em conjunto devido ao efeito comparativo visual. Além disso, é válidoressaltar que o parâmetro real sempre será a linha uniforme preta e o parâmetro estimadoserá a linha pontilhada colorida.

3.9.2 Simulação - controlador equivalente à certezaA Figura 3.2 apresenta uma realização para o controlador não dual equivalente à cer-

teza (2.3). Apesar de não ser um controlador com características duais, serão expostos osresultados tanto desse como do controlador cauteloso, a fim de demonstrar os problemase a falta de dualidade dos mesmos.

Observa-se claramente que o controlador equivalente à certeza falha em tentar contro-lar o processo. O total de perda acumulada chega quase a ∑y2 = 1,5 ·107.

O início dos problemas no controle ocorrem no instante de tempo t = 14. Nesse ins-tante, a estimativa de parâmetro de b se aproxima bastante de zero por alguns instantes.Assim, o controle de sinal aumenta vertiginosamente em virtude do sistema consideraras estimativas como os parâmetros verdadeiros. É importante salientar que algumas res-trições já podem, e são, implementadas no controlador equivalente à certeza. É possívelrestringir o sinal de controle ou a saída do sistema a um valor fixo máximo. Porém,

Page 45: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.9. SIMULAÇÕES - CONTROLADORES DUAIS SUBÓTIMOS 27

Figura 3.2: Simulação de uma realização do controlador equivalente à certeza.

Page 46: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

28 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

definitivamente, ainda assim o controlador não representa uma solução subótima comcaracterísticas duais para o problema.

3.9.3 Simulação - controlador cauteloso

A Figura 3.3 apresenta outra realização para o controlador cauteloso (2.4). A simula-ção considera o mesmo ruído do sistema e da variação de parâmetro da realização anterior.Esse controlador sempre vai preferir controlar do que buscar excitar o sistema em con-junto (ação dual) em virtude dessa última precisar de pelo menos dois passos adiante parasurtir algum efeito.

Observa-se que este controlador é, de fato, bastante cauteloso. O sinal de controleé muito menor e a variância da saída também é menor em comparação ao controladorequivalente à certeza. O total de perda acumulada é significativamente menor, porémainda é alta.

É importante salientar o fenômeno de desligamento do sinal (turn-off ) o qual pode servisto claramente nos instantes t = 22, t = 115 e t = 312. Nesses instantes, a incertezado parâmetro é muito alta (P > 5) e o sinal de controle cauteloso tende à zero. Emconsequência, isso gera menos excitação e causa uma incerteza ainda maior. A estimativairá tender a zero e a saída a afastar-se, aumentando assim a perda acumulada do sistema.

3.9.4 Simulação - controlador por restrições

Os controladores duais com restrições foram umas das primeiras soluções subótimasencontradas. As restrições variam desde o sinal de controle até a matriz de variância con-forme foi comentado em (3.3). A Figura 3.4 apresenta os resultados de um controladorpor restrição da lei de controle para a mesma realização dos controladores anteriores, ouseja, com a mesma sequência de ruídos. Dentre os controladores por restrições apresen-tados, optamos pela implementação do controlador de Jacobs e Hughes (1974).

Este controlador utiliza uma restrição na atualização da lei de controle através de umlimite superior positivo e um limite inferior negativo. Em geral, o resultado dos con-troladores por restrições somente amenizam e evitam os incidentes apresentados pelocontrolador cauteloso sendo, portanto, chamados controladores passivos.

Neste controlador é possível observar melhoras significativas em diversos pontos dosistema. Primeiramente, o fenômeno de desligamento do sinal não acontece devido asrestrições. Em muitos momentos o sinal de controle trabalha como um relé alternando osinal de controle entre +lim(u(t))e− lim(u(t)).

Outro aspecto importante é a variância do parâmetro estimado. Em virtude dessalimitação do sinal de controle e, consequentemente, de menores valores de entrada e saídada planta, a estimação de parâmetros, mesmo com o ruído, terá valores bem menores emais exatos. Comparando com o controlador cauteloso e o controlador equivalente àcerteza, nota-se também que a perda acumulada já foi reduzida bastante. Uma sintoniadesses limites de acordo com o sistema e o ruído podem ainda melhorar os resultados.

Page 47: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.9. SIMULAÇÕES - CONTROLADORES DUAIS SUBÓTIMOS 29

Figura 3.3: Simulação de uma realização do controlador cauteloso.

Page 48: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

30 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

Figura 3.4: Simulação de uma realização do controlador por restrições.

Page 49: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.9. SIMULAÇÕES - CONTROLADORES DUAIS SUBÓTIMOS 31

3.9.5 Simulação - controlador por inovações

O controlador dual por inovações foi proposto por Milito e Cadorin (1982). A Fi-gura 3.5 apresenta os resultados do controlador para a mesma realização dos demais. Éimportante salientar que nesse controlador existe um parâmetro ajustável λ cujo valorinicial e ótimo é obtido a partir de conhecimento do sistema e/ou testes com a planta.

Nessa simulação o valor de λ foi 0,85, ou seja, um valor de λ próximo a 1 refleteum compromisso maior com o controlador equivalente à certeza. Foram realizados testescom diversos valores de λ entre 0 e 1 para analisar os resultados da entrada, da matriz devariância e das perdas acumuladas. Esses testes comprovaram a necessidade de exaustivassimulações a fim de identificar e calibrar um valor de λ mais propício para o sistema.

Figura 3.5: Simulação de uma realização do controlador dual subótimo por inovações.

Page 50: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

32 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

3.9.6 Simulação - controlador por bicritérioA Figura 3.6 apresenta os resultados da simulação para o controlador subótimo por

bicritério - BDC (3.7). Assim como os controladores anteriormente apresentados, essecontrolador possui a necessidade que algumas definições sejam realizadas por parte dousuário como por exemplo, uma função da matriz de variância necessária para definir ointervalo da segunda minimização realizada. Nesse exemplo, utilizamos a seguinte função

f (P) = ηtrace(P) (3.38)

onde η = 0,095 representa um parâmetro linear fixo também definido pelo usuário. Aescolha desse parâmetro, bem como da função utilizada, é bastante subjetiva e os seusvalores são calibrados melhor experimentalmente. Outra função também avaliada foi

f (P) =[η1trace(P)+η2

∥∥(λI +P)−1∥∥] (3.39)

onde η1, η2 e λ são maiores que zero e também definidos pelo usuário.

3.9.7 Simulação - Controlador dual subótimo ativo aproximadoA Figura 3.7 exibe os resultados do controlador para as mesmas condições dos con-

troladores anteriores. É válido ressaltar que esse controlador possui um parâmetro λ con-figurado pelo usuário. Não existe um procedimento para definir o valor ótimo para essavariável.

Nessa simulação o valor de λ foi de 0.5. Para este exemplo, esse controlador apre-sentou os melhores resultados com uma rápida execução, uma estimação boa e um bomcontrole do sistema.

Page 51: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.9. SIMULAÇÕES - CONTROLADORES DUAIS SUBÓTIMOS 33

Figura 3.6: Simulação de uma realização do controlador por bicritério.

Page 52: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

34 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

Figura 3.7: Simulação de uma realização do controlador aproximado subótimo dual ativo.

Page 53: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

3.10. CONCLUSÃO 35

3.9.8 Simulação Monte CarloOs resultados das 300 simulações são apresentadas na Tabela 3.1. A tabela contém os

cálculos da perda média por passo V , o desvio padrão σv e o valor médio da variância doparâmetro pb.

Esta tabela ilustra um indicativo do desempenho dos controladores analisados. Entre-tanto, esta tabela não constitui um argumento convincente para classificar e comparar doisou mais algoritmos a fim de determinar o melhor controlador. Existem testes estatísticos,como em Wenk e Bar-Shalom (1979) e Lindoff, Holst e Wittenmark (1999), que realizameste procedimento.

Tabela 3.1: Os resultados da simulação de Monte Carlo para o sistema 3.30.

Lei de Controle V σv pb

Cauteloso 2.8757 0.5884 4.4558Restrições 2.5078 0.4155 3.7508Inovações 1.6111 0.5194 2.7983Bicritério 2.5313 0.3932 3.0386

ASDA 0.7987 0.1724 2.0377

3.10 ConclusãoEsse capítulo sintetizou os principais controladores subótimos duais da literatura. Fo-

ram apresentadas algumas leis de controle obtidas para o problema de controle dual.Ainda neste capítulo foram apresentadas simulações dos controladores apresentados nessecapítulo para um integrador com ganho variável no tempo. No próximo capítulo é expostaa proposta de tese.

Page 54: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

36 CAPÍTULO 3. CONTROLADORES DUAIS SUBÓTIMOS

Page 55: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Capítulo 4

Controlador Proposto

Nos capítulos anteriores foram apresentados vários controladores duais subótimos queaproveitam a simplicidade do controlador cauteloso, adicionando limitações para o sinalde controle ou funções da qualidade da estimativa dos parâmetros. Tais controladorespossuem a vantagem que o sinal de controle pode ser facilmente calculado, entretantoseus algoritmos contêm parâmetros dependentes da aplicação e que devem ser escolhidospelo usuário.

O fator de peso λ presente na função de custo de algum controlador deve ser escolhidoantecipadamente. A escolha de um valor muito pequeno pode levar ao fenômeno dodesligamento do sinal de controle (turn-off), pois a estimação será pouco considerada. Jáa escolha de um valor muito elevado pode fazer com que o controlador invista muito naestimação e pouco na função básica que é a de controlar o sistema. A escolha de um λ

fixo adequado pode envolver exaustivas simulações do sistema.Neste capítulo apresentaremos o controlador dual subótimo com fator de peso variável

como uma alternativa simples e natural para simplificar a utilização e a eficiência docontrolador. É proposto um algoritmo adaptativo para realizar o cálculo do fator de pesoλ, a cada passo.

Em virtude da interferência das variáveis estocásticas no sistema (parâmetros e ruí-dos), o propósito do fator de peso variável é possibilitar que o controlador esteja suscetívela estas variações, a fim de realizar um melhor controle e uma melhor estimação. Os efei-tos destas alterações são analisados e discutidos. Finalmente, a formulação e o algoritmodo controlador dual subótimo com fator de peso variável para sistemas com parâmetrosestocásticos desconhecidos e variantes no tempo é deduzido.

4.1 Controlador dual subótimo com fator de peso λ va-riável

Esta tese sugere um controlador dual subótimo com um fator de peso λ variável como tempo, cuja função de custo é dada por:

JFPVASOD(uk) = E(y(k+1)− yr(k+1))2

+λ(k) f (P(k+2)|ϒk (4.1)

Page 56: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

38 CAPÍTULO 4. CONTROLADOR PROPOSTO

em que λ(k) consiste em um parâmetro definido a cada passo a fim de ponderar a exa-tidão dos parâmetros estimados. A função de custo (4.1) consiste em uma alteração nocontrolador ASOD proposto por Wittenmark (1975a), dado por (3.5).

A solução proposta pretende melhorar o desempenho do sistema minimizando a va-riância da saída um passo adiante e, ao mesmo tempo, garantir boas estimativas. Casoas estimativas geradas sejam boas, então o controlador proporcionará boas ações de con-trole. Porém, se as estimativas estiverem deficientes, o controlador precisa realizar umesforço para melhorar as estimativas no momento presente para melhorar o controle nospassos futuros.

A minimização da função de custo (4.1) é realizada mediante uma expansão serialde segunda ordem mantendo somente termos lineares e quadráticos em u(k), conformeproposto por Wittenmark e Elevitch (1985). Como o controlador possui um fator depeso variável, as variações proporcionadas pelas variáveis estocásticas serão levadas emconsideração a cada passo, a fim de balancear melhor a dualidade do controlador. Istoresultará em um controle global melhor, devido a característica dual no sinal de controlea cada passo ser proporcional a precisão do estimador. O sinal de controle deve sempreter um compromisso com um bom controle e uma boa estimação.

A estratégia do controlador proposto, resumidamente, consiste no cálculo, a cadapasso, de diversos sinais de controle u(k) associados a diferentes fatores de peso λ(k).A partir deste cálculo, ocorre uma seleção do sinal de controle mais adequado para aquelepasso. Um dos pontos mais importante no algoritmo resulta na maneira de descobrir qualfator de peso λ(k) concebeu o melhor sinal de controle naquele passo.

Inicialmente o controlador necessita definição dos fatores de peso λ associado ao sis-tema. Não existe um limite na quantidade de fatores lambdas criados. O desempenho emtermos de tempo de processamento do controlador pode ser prejudicado caso o número defatores lambdas seja excessivo. Por outro lado, quanto mais fatores de lambdas definidos,melhor será o ajuste do sinal de controle a cada passo.

Uma vez definido os fatores de peso, controlador realizará a cada passo os cálculospara obter um sinal de controle associado para cada fator de peso lambda. Ou seja, acada passo existirá um conjunto de N pares de fator de peso versus sinal de controle. Apartir desse conjunto, é definido uma estratégia para selecionar o sinal de controle maisadequado para aquele passo de modo que realize um bom controle no instante atual bemcomo excite a planta suficientemente para produzir boas estimativas e, consequentemente,um bom controle nos passos adiante.

A seleção do sinal de controle apropriado para cada instante k é basedo nas seguintesinformações: o vetor de estimação x(k+1), o vetor de ganho de Kalman K(k+1), a va-riância do vetor de parâmetros do ruído Cv(k) e o sinal de controle equivalente à certezauce(k). Ou seja, cada conjunto de fator de peso versus sinal de controle interpreta todosos quatro valores, a cada passo, a fim de selecionar o melhor sinal de controle. O vetor deestimação um passo adiante é mensurado, juntamente com o vetor de ganho de Kalmanum passo adiante, a fim de avaliar a proximidade da estimação em relação a origem. Amagnitude do ganho de Kalman é avaliada para a necessidade de modificação da estima-ção dois passos adiante no tempo. A variância do ruído funciona como uma referênciapara os limites mínimos e máximos dos parâmetros estimados. O sinal de controle equi-

Page 57: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.1. CONTROLADOR DUAL SUBÓTIMO COM FATOR DE PESO λ VARIÁVEL 39

valente à certeza, ou seja, o sinal de controle considerando que as variáveis estimadas sãoos valores corretos naquele passo é explorado na estratégia em algumas situações que aestimação pode ser muito penalizada pelo excesso de ruído no sistema.

λ(k) relacionado a

x(k+1)K(k+1)

Cv(k)uce(k)

em que

K(k+1) = ΦP(k+1)θT (k+1)[θ(k+1)P(k+1)θT (k+1)+σ

2]−1 (4.2)

uce(k) =yr(k+1)− θ(k)x(k+1)

b1(k+1)(4.3)

e

θ(k) = [−y(k−1) · · · − y(k−m)|0 u(k−2) · · · u(k−n)] (4.4)

b1(k) 6= 0

o sinal de controle equivalente à certeza foi equacionado para o caso de um parâmetrovariante no tempo. Caso haja mais parâmetros variantes no tempo na planta, o sinal decontrole equivalente à certeza resultará em outra equação.

A seleção do sinal de controle é detalhada a seguir desde a definição dos fatores depeso lambda até a seleção do sinal de controle ao final de cada passo. A cada passo aestratégia de seleção é reinicializada. Posteriormente, um Algoritmo será apresentadoresumindo todos esses passos em formato de uma sequência de instruções.

Definindo o vetor de fatores de pesos, temos

ϕλ(k) = [λ1(k) λ2(k) · · · λi(k)] (4.5)

A partir de cada fator de peso λi(k), um sinal de controle ui(k) é calculado, resultandoem um vetor de sinais de controle. Todas as variáveis para o cálculo do sinal de controlesão iguais com excessão do fator de peso lambda. A quantidade de elementos do vetor defator de peso é igual a quantidade de elementos no vetor de sinais de controle. O procedi-mento para o cálculo do sinal de controle é realizado conforme descrito em Wittenmarke Elevitch (1985) através de uma expansão em série da função de custo e a minimizaçãoem termos de u(k).

Uλ = [u1(k) u2(k) · · · ui(k)] (4.6)

A escolha do sinal de controle ui(k) influencia diretamente a função de custo atual

Page 58: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

40 CAPÍTULO 4. CONTROLADOR PROPOSTO

(4.1), bem como exerce influência na função de custo futura uma vez que o sinal decontrole ui(k) influencia no vetor de parâmetros θ(k+ 1), ao qual também interfere emx(k+2), P(k+2) e no θ(k+2) (ÅSTRÖM; WITTENMARK, 1971). Portanto, a seleçãodo sinal de controle ui(k) no instante atual a partir da avaliação das quatro informaçõesacima apresentadas levam em consideração o controle da planta do sistema atual, o con-trole da planta no instante futuro e a estimação dos parâmetros nos instantes futuros.

A seleção do sinal de controle ui(k) inicia a partir da análise do vetor de estimaçãox(k+ 1) e da variância do vetor de parâmetros do ruído Cv(k) . De acordo com o valorestimado dos parâmetros variantes no tempo, a estratégia de seleção do sinal de controleserá diferenciada. Existem duas maneiras para realizar a seleção do sinal de controlea cada passo. A estratégia a qual o sinal de controle será selecionado está diretamenterelacionado aos valores das estimações dos parâmetros variantes no tempo.

Com base no processo estocástico (2.6), sabemos que a distribuição condicional dey(k)|ϒ(k−1) é normal, com valor médio dado por

E[y(k)|ϒ(k−1)] = θ(k)x(k) (4.7)

e variância dada por

σ2y(k) = θ(k)P(k)θT (k)+σ

2 (4.8)

Além disso, tem se que a distribuição condicional de x(k+ 1)|ϒ(k−1) é normal, comvalor médio dado por

E[x(k+1)|ϒ(k−1)] = Φx(k) (4.9)

e variância dada por

cov [x(k+1), x(k+1)|ϒ(k−1)] =

K(k)[σ2 +θ(k)P(k)θT (k)]KT (k) (4.10)

Åström e Wittenmark (1971) afirmam que o valor mínimo para o critério quadráticoem sistemas variantes no tempo com parâmetros conhecidos é

minH

∑i=1

[y(k+ i)− yr]2 = H σ

2 (4.11)

Desta forma, tem se que o valor mínimo entre a saída da planta e a referência parasistemas variantes no tempo com parâmetros conhecidos é igual ao somatório do desviopadrão ao longo de todos os passos. Portanto, para os sistemas variantes no tempo comparâmetros desconhecidos, a saída acumulada resultará em um valor ainda maior.

Em virtude da presença de ruído nos parâmetros e na saída da planta, as estimativasdos parâmetros variantes no tempo com magnitude próxima a origem podem comprome-ter o resultado do cálculo do sinal de controle. Ou seja, caso a estimativa do parâmetroesteja com o valor próximo a zero e o ruído tenha um valor com magnitude maior que a

Page 59: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.1. CONTROLADOR DUAL SUBÓTIMO COM FATOR DE PESO λ VARIÁVEL 41

estimativa, é possível que o valor do ruído comprometa o valor da estimativa do parâmetroinclusive invertendo o sinal da estimativa.

Assim, definimos que os parâmetros variantes no tempo do vetor de estimação x(k+1)podem não ser sensíveis à mudanças nos parâmetros quando os seus respectivos valoresestão próximo à origem.

Considerando os parâmetros estimados variantes no tempo pertencentes ao vetor deestimação um passo adiante, estabelecemos que

∀ xi(k) ∈ x(k+1) e ∀ xi(k) 6= xi(k+1)

|xi(k)| ≤σv

2(4.12)

em que

x(k+1) =[a1(k), . . . , am(k)|b1(k), . . . , bn(k)

]= [x1(k), . . . , xm(k)|xn+1(k), . . . , xm+n(k)] (4.13)

Quando as estimativas dos parâmetros estiverem próximo à zero, a seleção do sinal decontrole apropriado será realizada de uma maneira e, quando as estimativas dos parâme-tros estiverem distantes da origem, a seleção do sinal de controle apropriado será feita deoutra maneira. O critério para distinguir o limite de proximidade da origem é baseado navariância do vetor de parâmetros do ruído.

Portanto, a maneira de selecionar o sinal de controle mais adequado no passo atual estádiretamente relacionada à condição estabelecida acima. Caso o vetor de estimação x(k+1) esteja entre os limites da condição (4.12), a seleção do sinal de controle é realizada combase no ganho de Kalman um passo adiante, pois isso provocará uma variação maior noparâmetro estimado dois passos a frente, com a consequente redução da incerteza sobreo mesmo. Caso a estimativa calculada esteja próxima da origem, o ideal é selecionar osinal de controle que possui o maior ganho de Kalman um passo adiante. Essa estratégiavisa reduzir o efeito negativo que o ruído exerce sob a estimativa no passo atual.

Caso o vetor de estimação x(k+1) não esteja satisfazendo a condição (4.12), ou seja,se os valores dos parâmetros estimados que variam com o tempo tiverem valor maior quea metade da variância do ruído do parâmetro (em módulo), significa um indicativo quea estimativas estão próximas dos valores verdadeiros dos parâmetros e, portanto, o sinalde controle mais apropriado será aquele que estiver mais próximo do sinal de controleequivalente à certeza.

A partir das definições (2.11) e do vetor de estimação atendendo a condição (4.12), osinal de controle ui(k) preferido será o sinal de controle que produzir um maior ganho novetor de estimação futuro (dois passos adiante no tempo), isto é

Introduzindo o vetor de ganhos

Kλ(k+1) = [K1(k+1) K2(k+1)· · · Ki(k+1)] (4.14)

Page 60: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

42 CAPÍTULO 4. CONTROLADOR PROPOSTO

em que

Ki(k+1) =ΦP(k+1)θT (k+1)

σ2y(k+1)

(4.15)

e

σ2y(k+1) = θ(k+1)P(k+1)θT (k+1)

+σ2 (4.16)

o vetor de ganhos possui a mesma dimensão do vetor de fator de peso. Cada elementodesse vetor de ganhos está associado a um fator de peso.

Seleciona-se o ganho de Kalman com maior valor absoluto no vetor de ganhos(4.14),

Kmax(k+1) = max|Kλ(k+1)| (4.17)

Consequentemente, seleciona-se o sinal de controle ui(k) ∈Uλ(k) (4.6) ao qual estáassociado com o maior ganho de Kalman Ki(k+1), ( 4.19).

Contudo, caso o vetor de estimação não obedeça a condição apresentada em (4.12), aseleção do sinal de controle ui(k) apropriado será realizado de acordo com um compara-tivo, em termos absolutos, com o sinal de controle equivalente a certeza, uce(k).

Considerando o vetor de entradas Uλ(k) (4.6) e o sinal de controle equivalente a cer-teza uce(k) (2.17), temos

Uλ(k)−uCE(k) = [(u1(k)−uCE(k)) (u2(k)−uCE(k)) · · · (ui(k)−uCE(k))] (4.18)

Assim, seleciona-se do vetor de entradas (4.18) o menor valor absoluto do vetor

min|Uλ(k)−uCE(k)| (4.19)

Por conseguinte, seleciona-se o sinal de controle ui(k) ∈Uλ(k) a qual está associadocom o termo que possui a menor diferença com o sinal de controle equivalente à certezano vetor (4.18). Esse sinal de controle representa nesse passo a entrada apropriada para osistema com o melhor controle e melhor estimação.

A seguir, o Algoritmo 1 resume a sequência de ações realizadas e apresentadas para aescolha do sinal de controle u(k), a cada passo.

4.2 Avaliação de ResultadosO desempenho do controlador dual subótimo com fator de peso λ variável proposto é

demonstrado através de seis cenários. O sistema utilizado no Exemplo 1 e no Exemplo2 tem sido frequentemente utilizado, conforme Maitelli e Yoneyama (1999) e Lindoff,

Page 61: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 43

Algorithm 1: Seleção do λ(k)Data: Vetor de fatores de peso ϕλ = [λ1(k) λ2(k) · · · λi(k)]Result: Um parâmetro λ(k) ∈ ϕλ

1 repeat2 forall the elementos do vetor ϕλ do3 calcule ui(k) ao qual minimiza V FPV

ASOD ; /* shown in (4.1) */4 end5 if |xi(k+1)| ≤ σvi

2 ∀xi variante no tempo then6 foreach ui(k) calculado do7 avaliar Ki(k+1);8 end9 Function selecionar o elemento máximo de (Ki(k+1)) : vetor;

10 begin11 retornar ui(k) associado ao Ki máximo;12 end13 else14 Calcular uCE(k);15 Function selecionar elemento mínimo de (rmin) : vetor;16 begin17 avaliar vetor Uλ(k)−uCE(k) ; /* shown in (4.18) */18 retornar ui(k) associado ao menor valor do vetor;19 end20 end21 return λi(k) associado a ui(k)22 until simulação parar;

Page 62: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

44 CAPÍTULO 4. CONTROLADOR PROPOSTO

Holst e Wittenmark (1999) , para avaliar o desempenho de diferentes controladores adap-tativos.

Todos os exemplos simulados foram testados com quatro controladores duais subóti-mos: o controlador proposto, o controlador dual por inovações apresentado por Militoe Cadorin (1982), o controlador ASOD apresentado por Wittenmark e Elevitch (1985)e o controlador de dois estágios com preditores ótimos apresentado por Maitelli e Yo-neyama (1994a). Em virtude dos testes no controlador de dois estágios com preditoresótimos terem sido realizados em um ambiente de programação diferente dos demais, osgráficos não serão apresentados nessa seção em virtude de não possuir um mesmo padrãode visualização dos gráficos.

A avaliação do desempenho dos controladores é realizada a partir de NS simulações,onde cada uma das simulações contém NP passos. Assim, a perda média por passo, a qualavalia a qualidade do controle, é dada por

V =1

NS

NS

∑j=1

1NP

[NP

∑i=1

(y(k+ i)− yr(k+1))2

](4.20)

e o desvio padrão da perda média por passo é dador por

σV =

√√√√√ 1NS

NS

∑j=1

(1

NP

[NP

∑i=1

(y(k+ i)− yr(k+1))2

]−V

)2 (4.21)

A qualidade da estimação pode ser medida através do valor médio da variância doparâmetro pbb dado por

Pbb =1

NS

NS

∑j=1

1NP

[NP

∑i=1

pbb(i)

](4.22)

As simulações podem apresentar resultados bastante distintos, o que pode dificultara definição da melhor solução subótima para cada exemplo. Sendo assim, para cadasimulação realizada, são realizadas comparações pareadas e testes de hipótese estatísticapara estabelecer uma classificação dos controladores.

Assumi-se que o sistema (2.6) está corretamente especificado e que as variáveis Φ, σ2

e Cv são completamente conhecidas. A fim de reduzir os graus de liberdade, foi assumidoque os parâmetros a são constantes, e que alguns ou todos os parâmetros b são variantesno tempo. Os seis sistemas a seguir foram simulados.

Exemplos 1 e 2

Um sistema de primeira ordem com um integrador e um ganho variante no tempo:

y(k) = a1(k)y(k−1)+b1(k)u(k−1)+ e(k) (4.23)

Page 63: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 45

em que

a1(k) = 1.0b1(k) = 0.95b1(k−1)+ v(k)

com yre f (k) = 0 no Exemplo 1 e yre f (k) = 10 no Exemplo 2.

Exemplo 3

Um sistema de primeira ordem com um ganho variante no tempo:

y(k) = a1(k)y(k−1)+b1(k)u(k−1)+ e(k) (4.24)

em que

a1(k) = 0.8b1(k) = 0.8b1(k−1)+ v(k)

O sinal de referência é definido como yre f (k) = 0.

Exemplo 4

Um sistema de primeira ordem com um ganho variante no tempo:

y(k) = a1(k)y(k−1)+b1(k)u(k−1)+ e(k) (4.25)

em que

a1(k) = 0.8b1(k) = 0.9b1(k−1)+ v(k)

O sinal de referência é definido como yre f (k) = 10.

Exemplo 5

Um sistema ARX (2,1):

y(k) = a1(k)y(k−1)+a2(k)y(k−2)+b1(k)u(k−1)+ e(k) (4.26)

em que

a1(k) = 1.7a2(k) = −0.7b1(k) = 0.95b1(k−1)+ v(k)

O sinal de referência é definido como yre f (k) = 0.

Page 64: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

46 CAPÍTULO 4. CONTROLADOR PROPOSTO

Exemplo 6

Um sistema ARX (2,2):

y(k) = a1(k)y(k−1)+a2(k)y(k−2)+b1(k)u(k−1)+b2(k)u(k−2)+ e(k) (4.27)

em que

a1(k+1) = −1.2a2(k+1) = 0.7b1(k+1) = 0.9b(k)+ v(k)b2(k+1) = 1

O sinal de referência é definido como yre f (k) = 0.Para cada exemplo, duzentas simulações Monte Carlo (NS = 200) foram realizadas,

onde cada simulação consiste de quatrocentos passos (NP = 400). Em todas as simu-lações, os ruídos e(k) e v(k) possuem valor médio e desvio padrão iguais a 0.5 e 1.0,respectivamente. A fase inicial da simulação para (k<20) é desprezado para evitar a in-fluência dos efeitos iniciais.

Dois dos três controladores duais subótimos utilizados nas simulações como compa-rativos possuem o fator de peso λ a definir. Em todos os exemplos, foi utilizado o valor deλ = 0.5 uma vez que este valor tem mostrado um bom equilíbrio entre a ação de controlee a estimação (WITTENMARK; ELEVITCH, 1985) e (MILITO; CADORIN, 1982). Ooutro controlador dual não necessita de nenhuma definição por parte do usuário.

O vetor de fator de peso ϕλ utilizado em todas as simulações é dado por

ϕλ(k) = [0.1 0.3 0.5 0.7 0.9] (4.28)

A Tabela 4.1 apresenta os dados obtidos do comportamento dos quatro controlado-res durante as 200 simulações para o Exemplo 1. São apresentados os dados de perdamédia por passo, desvio padrão e o valor médio da variância. A Tabela 4.2 apresenta osresultados da comparação pareada entre os controladores para o Exemplo 1. É realizadouma comparação entre todos os controladores simulados aos pares. Confrontam-se osresultados da perda média por passo entre controladores, dois a dois, para todas as simu-lações. Assim, é possível avaliar os resultados diretamente entre eles, conforme mostradona Tabela 4.2.

O controlador proposto neste trabalho obteve um perda média por passo menor que osdemais controladores. Além disso, a comparação pareada demonstrou que o controladorcom fator de peso λ variável obtém um perda média menor a cada simulação.

A Figura 4.1 apresenta os resultados de uma das duzentas simulações que foram exe-cutadas. É exposto o sinal de controle e a saída do sistema, bem como a estimação doparâmetro, a saída acumulada, a variância do parâmetro variante no tempo e o vetor λ.

A Figura 4.2 apresenta o comportamento do vetor λ ao longo de cem simulações doExemplo 1. Vale salientar que foram realizadas um total de duzentas simulações realiza-das e computadas porém, para uma melhor visualização, foram ilustrados somente cem

Page 65: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 47

Tabela 4.1: Resultados da simulação - Exemplo 1.Controlador V σV Pbb

ASOD λ = 0.5 0,8350 0,2077 2,3690IDC λ = 0.5 0,8952 0,2375 3,8957Dois estágios com predição 0,8534 0,2472 2,7454λ variável 0,7761 0,2472 2,7758

Tabela 4.2: Comparação pareada entre controladores - Exemplo 1.Controlador A Controlador B (A < B) de 200

λ variável ASOD λ = 0.5 141(70.5%)λ variável IDC λ = 0.5 150(75%)λ variável Dois estágios com predição 150(75%)ASOD λ = 0.5 Dois estágios com predição 160(80%)ASOD λ = 0.5 IDC λ = 0.5 121(60.5%)Dois estágios com predição IDC λ = 0.5 130(65%)

Figura 4.1: Realização típica do Exemplo 1 usando λ variável, contendo entrada, saída,perda acumulada, vetor lambda, parâmetro b real e estimado e variância de b.

Page 66: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

48 CAPÍTULO 4. CONTROLADOR PROPOSTO

simulações do vetor λ. É importante observar como a cada simulação o vetor realiza aseleção da variável λ de forma distinta, se adequando as condições do sistema.

A Digura 4.3 apresenta o sinal de entrada e o sinal de saída de três dos quatro contro-ladores utilizados para uma realização típica do conjunto total de simulações realizadaspara o Exemplo 1.

Figura 4.2: Mapa 3D do vetor lambda com 100 simulações - Exemplo 1.

Page 67: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 49

Figura 4.3: Sinal de entrada e sinal de saída de uma realização típica do sistema noExemplo 1.

Page 68: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

50 CAPÍTULO 4. CONTROLADOR PROPOSTO

As Tabelas 4.3 e 4.4 apresentam os resultados das duzentas simulações para o sis-tema do Exemplo 2 e os resultados da comparação pareada entre os quatro controladores,respectivamente.

A interpretação dos resultados é semelhante aos resultados do exemplo anterior, como controlador proposto demonstrando um bom desempenho. Um sinal de referência maior(yre f (k) = 10) não alterou o desempenho de nenhum dos quatro controladores. Nas du-zentas simulações realizadas, em mais de 70% das simulações o controlador propostoobteve perda média por passo menor. Todos os quatro controladores apresentaram umtempo de simulação bem rápido. É válido salientar que apesar do percentual na compa-ração pareada entre o controlador proposto e os controladores ASOD e IDC ser igual,isso não significa que os valores de perda média por passo no controlador proposto forammenores nas mesmas simulações.

Tabela 4.3: Resultados da simulação - Exemplo 2.Controlador V σV Pbb

ASOD λ = 0.5 0,8432 0,2648 3,4230IDC λ = 0.5 0,8684 0,2278 2,3300Dois estágios com predição 0,8602 0,2432 3,0151λ variável 0,7983 0,2336 2,4408

Tabela 4.4: Comparação pareada entre controladores - Exemplo 2.Controlador A Controlador B (A < B) de 200

λ variável ASOD λ = 0.5 144(72%)λ variável IDC λ = 0.5 144(72%)λ variável Dois estágios com predição 130(65%)ASOD λ = 0.5 Dois estágios com predição 135(67.5%)ASOD λ = 0.5 IDC λ = 0.5 106(53%)Dois estágios com predição IDC λ = 0.5 99(49.5%)

A Figura 4.4 apresenta uma realização típica do exemplo 2 contendo o sinal de en-trada, o sinal de saída da planta, a saída acumulada, o parâmetro b real e estimado, avariância do parâmetro b e o vetor λ.

A Figura 4.5 ilustra o comportamento do vetor λ ao longo das primeiras cem simula-ções do Exemplo 2. É possível observar como em cada simulação o algoritmo de seleçãoda variável λ e, consequentemente o sinal de controle, ocorre de maneira diferenciada.Esse comportamento demonstra o caráter adaptativo do algoritmo acerca das variáveisestocásticas do sistema.

A Figura 4.6 ilustra a saída acumulada e a variância do parâmetro b de três dos quatrocontroladores simulados em uma das duzentas realizações do Exemplo 2.

Page 69: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 51

Figura 4.4: Realização típica do Exemplo 2 contendo entrada, saída, perda acumulada,vetor lambda, parâmetro b real e estimado e variância de b.

Page 70: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

52 CAPÍTULO 4. CONTROLADOR PROPOSTO

Figura 4.5: Mapa 3D do vetor lambda com 100 simulações - exemplo 2.

Page 71: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 53

Figura 4.6: Saída acumulada e variância de b de uma realização típica do sistema noExemplo 2.

As Tabelas 4.5 e 4.6 apresentam os resultados das duzentas simulações para o sistemado Exemplo 3 e os resultados da comparação pareada entre os quatro controladores, res-pectivamente. Neste conjunto de simulações, o controlador proposto obteve resultadosmelhores que o controlador IDC e que o controlador de dois estágios com preditores óti-mos. Entretanto, o controlador proposto apresentou um desempenho um pouco inferiorao controlador ASOD.

Tabela 4.5: Resultados da simulação - Exemplo 3.Controlador V σV Pbb

ASOD λ = 0.5 0,6140 0,1043 1,7704IDC λ = 0.5 0,6749 0,0981 2,7543Dois estágios com predição 0,6582 0,1032 1,9151λ variável 0,6268 0,1097 1,7009

A Figura 4.7 apresenta uma simulação típica do exemplo três contendo o sinal deentrada, o sinal de saída da planta, a saída acumulada, o parâmetro b real e estimado,a variância do parâmetro b e o vetor λ. No Exemplo 3, a alteração dos parâmetros do

Page 72: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

54 CAPÍTULO 4. CONTROLADOR PROPOSTO

Tabela 4.6: Comparação pareada entre controladores - Exemplo 3.Controlador A Controlador B (A < B) de 200

λ variável ASOD λ = 0.5 96(48%)λ variável IDC λ = 0.5 140(70%)λ variável Dois estágios com predição 130(65%)ASOD λ = 0.5 Dois estágios com predição 120(60%)ASOD λ = 0.5 IDC λ = 0.5 159(79.5%)Dois estágios com predição IDC λ = 0.5 140(70%)

processo simulado é ilustrado nesta figura. Verifica-se um comportamento do controladorvalorizando bastante a estimação dos parâmetros. Este comportamento reflete diretamentedo sinal de controle calculado e na variância do parâmetro estocástico.

Figura 4.7: Realização típica do Exemplo 3 contendo entrada, saída, saída acumulada,vetor lambda, parâmetro b real e estimado e variância de b.

A Figura 4.8 contém o comportamento do vetor λ ao longo das primeiras cem simula-ções do Exemplo 3. É possível verificar que na maioria das simulações o algoritmo realizabastante esforço para realizar uma boa estimação a cada passo no intuito de ter conseguirrealizar um bom controle nos passos futuros. Entretanto, percebe-se pelos gráfico que não

Page 73: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 55

houve o êxito esperado.

Figura 4.8: Mapa 3D do vetor lambda com 100 simulações - Exemplo 3.

A Figura 4.9 apresenta o sinal de controle e o sinal de saída dos quatros controladoresem uma realização típica do conjunto de simulações do Exemplo 3. É importante salientara presença do fenômeno de desligamento de controle que ocorre no controlador IDC.Foram realizados novas simulações para esse sistema com um outro valor para a variávelde configuração λ. Dessa maneira, os resultados foram melhores e não houve mais ofenômeno do desligamento do sinal de controle.

Page 74: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

56 CAPÍTULO 4. CONTROLADOR PROPOSTO

Figura 4.9: Sinal de controle e sinal de saída de uma realização típica do sistema noExemplo 3.

Page 75: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 57

As Tabelas 4.7 e 4.8 apresentam os resultados das duzentas simulações para o sis-tema do Exemplo 4 e os resultados da comparação pareada entre os três controladores,respectivamente. A configuração dos parâmetros da planta juntamente com um sinal dereferência alto provoca comportamento similares dos quatro controladores.

Tabela 4.7: Resultados da simulação - Exemplo 4.Controlador V σV Pbb

ASOD λ = 0.5 13,9574 3,3079 1,2799IDC λ = 0.5 13,0008 3,5038 1,2929Dois estágios com predição 13,6457 3,4232 1,3451λ variável 13,9347 3,3794 1,2795

Tabela 4.8: Comparação pareada entre controladores - Exemplo 4.Controlador A Controlador B (A < B) de 200

λ variável ASOD λ = 0.5 107(53.5%)λ variável IDC λ = 0.5 97(48.5%)λ variável Dois estágios com predição 102(51%)ASOD λ = 0.5 Dois estágios com predição 106(53%)ASOD λ = 0.5 IDC λ = 0.5 88(44%)Dois estágios com predição IDC λ = 0.5 96(48%)

A Figura 4.10 apresenta uma simulação típica do Exemplo 4 contendo o sinal de en-trada, o sinal de saída da planta, a saída acumulada, o parâmetro b real e estimado, avariância do parâmetro b e o vetor λ. Nessa realização, o sinal de controle aparentementeapresenta o fenômeno de desligamento do sinal. Entretanto, analisando as demais variá-veis, verifica-se que o sinal de controle possui uma baixa magnitude em alguns intervalospor própria intenção do controlador.

A Figura 4.11 apresenta o sinal de controle e o saída da planta de três dos quatrocontroladores para uma realização do Exemplo 4. Verifica-se que os controladores duaissubótimos apresentam saída e sinal de controle bem próximos.

A Figura 4.12 ilustra o comportamento do vetor λ ao longo das primeiras cem simu-lações do Exemplo 4. É possível verificar que o algoritmo prioriza bastante valores de λ

baixo ou alto, enfatizando bastante o controle ou a estimação, respectivamente. A realiza-ção de um esforço muito grande na estimação compromete o desempenho do controladorproposto.

Page 76: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

58 CAPÍTULO 4. CONTROLADOR PROPOSTO

Figura 4.10: Realização típica do Exemplo 4 contendo entrada, saída, perda acumulada,vetor lambda, parâmetro b real e estimado e variância de b.

Page 77: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 59

Figura 4.11: Sinal de entrada e sinal de saída de uma realização típica do sistema noexemplo 4.

Figura 4.12: Mapa 3D do vetor lambda com 100 simulações - Exemplo 4.

Page 78: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

60 CAPÍTULO 4. CONTROLADOR PROPOSTO

As Tabelas 4.9 e 4.10 apresentam os resultados das duzentas simulações para o sis-tema do Exemplo 5 e os resultados da comparação pareada entre os três controladores,respectivamente. O controlador proposto apresentou resultados sutilmente melhores queos demais controladores.

Tabela 4.9: Resultados da simulação - Exemplo 5.Controlador V σV Pbb

ASOD λ = 0.5 7,2867 41,6008 1,9128IDC λ = 0.5 6,4900 14,4870 2,5223Dois estágios com predição 6,8457 33,4232 1,9451λ variável 6,2061 22,6932 1,9954

Tabela 4.10: Comparação pareada entre controladores - Exemplo 5.Controlador A Controlador B (A < B) de 200

λ variável ASOD λ = 0.5 104(52%)λ variável IDC λ = 0.5 124(62%)λ variável Dois estágios com predição 102(51%)ASOD λ = 0.5 Dois estágios com predição 110(55%)ASOD λ = 0.5 IDC λ = 0.5 114(57%)Dois estágios com predição IDC λ = 0.5 106(53%)

A Figura 4.13 apresenta uma simulação típica do Exemplo 5 contendo o sinal deentrada, o sinal de saída da planta, a saída acumulada, o parâmetro b real e estimado, avariância do parâmetro b e o vetor λ. A variância presente nesse exemplo provoca umesforço muito grande para o controlador manter a saída da planta próxima ao sinal dereferência. O controlador proposto realizou conforme previsto esforços de controle e deestimação de acordo com o desenvolvimento das variáveis da planta. Entretanto, comoas variáveis dessa realização são de alta magnitude, as variáveis estocásticas reproduzemvalores absolutos altos.

Page 79: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 61

Figura 4.13: Realização típica do Exemplo 5 contendo entrada, saída, perda acumulada,vetor lambda, parâmetro b real e estimado e variância de b.

Page 80: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

62 CAPÍTULO 4. CONTROLADOR PROPOSTO

As Tabelas 4.11 e 4.12 apresentam os resultados das duzentas simulações para o sis-tema do Exemplo 6 e os resultados da comparação pareada entre os quatro controladoressimulados, respectivamente. Neste conjunto de simulações, também ocorre o fenômenodo desligamento no controlador IDC. Portanto, os resultados na tabela referentes ao con-trolador IDC ficam comprometidos.

Assim como no Exemplo 4, foram realizadas novas simulações para o controladorIDC com outro parâmetro λ. Entretanto, desta vez, não foi possível obter um valor de λ

que evitasse o desligamento do sinal de controle.A Figura 4.14 apresenta o gráfico do sinal de controle e do parâmetro b real e esti-

mado. Verifica-se ainda que mediante o desligamento do sinal de controle, a estimaçãode parâmetros fica comprometida.

Tabela 4.11: Resultados da simulação - Exemplo 6.Controlador V σV Pbb

ASOD λ = 0.5 1,0013 0,2609 1,8259IDC λ = 0.5 2,0100 15,5785 3,3511Dois estágios com predição 0,9457 0,2132 1,9377λ variável 0,9754 0,1786 1,9789

Tabela 4.12: Comparação pareada entre controladores - Exemplo 6.Controlador A Controlador B (A < B) de 200

λ variável ASOD λ = 0.5 115(57.5%)λ variável IDC λ = 0.5 63(31.5%)λ variável Dois estágios com predição 85(42,5%)ASOD λ = 0.5 Dois estágios com predição 81(40,5%)ASOD λ = 0.5 IDC λ = 0.5 60(30%)Dois estágios com predição IDC λ = 0.5 70(35%)

A Figura 4.15 apresenta uma simulação típica do Exemplo 6 contendo o sinal deentrada, o sinal de saída da planta, a perda acumulada, o parâmetro b real e estimado, avariância do parâmetro b e o vetor λ. Apesar da realização de boas estimações ao longo detoda a simulação, o controlador tenta melhorar a estimação com o intuito de deixar a saídada planta mais próxima do sinal de referência. Nesse exemplo, os parâmetros da plantajuntamente com o ruído estocástico acentuado não permitem um controle mais efetivo dosistema.

A figura 5.2 ilustra o comportamento do vetor λ ao longo das primeiras cem simula-ções do Exemplo 6.

Page 81: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

4.2. AVALIAÇÃO DE RESULTADOS 63

Figura 4.14: Sinal de entrada e parâmetro b real e estimado de uma realização típica dosistema no Exemplo 6.

Figura 4.15: Realização típica do Exemplo 6 contendo entrada, saída, saída acumulada,vetor lambda, parâmetro b real e estimado e variância de b.

Page 82: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

64 CAPÍTULO 4. CONTROLADOR PROPOSTO

Figura 4.16: Mapa 3D do vetor lambda com 100 simulações - Exemplo 6.

4.3 ConclusãoEste capítulo apresentou o controlador dual subótimo proposto. Foi apresentado a

formulação e resolução do problema do controladores duais subótimos com fator de pesovariável. Ainda neste capítulo foram realizadas simulações a fim de demonstrar o desem-penho do controlador proposto. No próximo capítulo são apresentadas as conclusões dotrabalho bem como as perspectivas de trabalhos futuros relacionados ao tema.

Page 83: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Capítulo 5

Conclusão

O controlador adaptativo dual subótimo desenvolvido neste trabalho é aplicável comvantagem à sistemas que tenham parâmetros variantes no tempo. A ausência de umagrande variação nos parâmetros e/ou nos ruídos da planta torna os demais controladoresadaptativos, não duais, com um desempenho e com expressões mais simples para o sinalde controle, justificando o uso dos controladores duais subótimos.

O controlador apresentado no trabalho é o Controlador Dual Subótimo com Fator dePeso λ Variável no Tempo, que minimiza o desvio da saída em relação à referência umpasso adiante no tempo. O cálculo do sinal de controle, neste caso, requer os parâmetrosestimados 2 passos adiante no tempo juntamente com um fator de peso λ variável a cadapasso. Para atingir esse objetivo, um algoritmo adaptativo determina o fator de peso λ acada passo utilizando informações da planta e da estimação de parâmetros.

O desempenho do controlador com peso variável foi comparado com diversos con-troladores usando simulação Monte Carlo. O controlador alcançou bons desempenhossem requerer um grande esforço computacional nos exemplos simulados. O controladordemonstrou na teoria e nos testes um comportamento dual, ou seja, o controlador nãose importou somente com o controle imediato, mas também com a estimação futura dosparâmetros do sistema a fim de resultar em um melhor controle.

A análise dos resultados e das simulações mostra algumas propriedades interessantes.O controlador desenvolvido retira a necessidade de determinar um parâmetro lambda paracada sistema. Esta característica já constitui uma vantagem, uma vez que esse ajustepode ser crítico em alguns casos, requerendo exaustivas simulações que nem sempre sãopossíveis. O controlador tem a possibilidade de executar um melhor controle, bem comouma melhor estimação de parâmetros, de acordo com as características da planta e dasvariáveis estocásticas envolvidas.

O controlador apresentou um desempenho satisfatoriamente melhor do que o contro-lador dual por inovações proposto por Milito e Cadorin (1982), do que o controlador dualaproximado ativo concebido por Wittenmark e Elevitch (1985) e do que o controlador dedois estágios com preditores ótimos apresentado por Maitelli e Yoneyama (1994a) emalguns casos. Os Exemplos 1, 2 e 3 ilustram essa situação.

A utilização de uma equação para definição do fator de peso λ está sendo estudada.Isto tornaria o controlador mais adequado para aplicações em tempo real visto que otempo de processamento seria mais rápido. Como perspectivas de trabalhos, podemoscitar o uso de otimização não linear para minimização de funções de quinto grau em

Page 84: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

66 CAPÍTULO 5. CONCLUSÃO

diante.

Page 85: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

5.1. TRABALHOS PUBLICADOS 67

5.1 Trabalhos Publicados

O trabalho desenvolvido nesta tese de doutorado propiciou a publicação em dois pe-riódicos:

1. WSEAS Transactions on Systems and Control2. Journal of Control, Automation and Electrical Systems

5.1.1 WSEAS

Figura 5.1: Página resumo do trabalho aceito no periódico WSEAS - Transactions onSystems and Control

Page 86: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

68 CAPÍTULO 5. CONCLUSÃO

5.1.2 JCAE

Figura 5.2: Página resumo do trabalho aceito no periódico JCAE - Journal of Control,Automation and Electrical Systems

Page 87: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

Referências Bibliográficas

ALSTER, J.; BéLANGER, P. R. A technique for dual adaptive control. Automatica,v. 10, n. 6, p. 627 – 634, 1974.

ANDERSON, B.; MOORE, J. Optimal filtering. [S.l.]: Prentice-Hall, 1979. ISBN9780136381228.

ÅSTRÖM, K.; WITTENMARK, B. Adaptive control. [S.l.]: Addison-Wesley, 1995.ISBN 9780201558661.

ÅSTRÖM, K. J.; WITTENMARK, B. Problems of identification and control. Journal ofMathematical Analysis and Applications, Academic Press, v. 34, n. 1, p. 90–113, 1971.

BIRGE, J. THE VALUE OF THE STOCHASTIC SOLUTION IN STOCHASTIC LINEARPROGRAMS WITH FIXED RECOURSE. [S.l.: s.n.], 1981.

BUGEJA, M.; FABRI, S.; CAMILLERI, L. Dual adaptive dynamic control of mobilerobots using neural networks. Systems, Man, and Cybernetics, Part B: Cybernetics, IEEETransactions on, v. 39, n. 1, p. 129 –141, 2009.

CERVIN, A. Dual Control of an Integrator Using Neuro-Dynamic Programming.Dissertação (Mestrado) — Lund Institute of Technolog, address = Lund, Sweden, 1998.

CHAN, S. S.; ZARROP, M. B. A suboptimal dual controller for stochastic systems withunknown parameters. Int. J. Control, v. 41, p. 507–524, 1985.

CHEN, H. Recursive estimation and control for stochastic systems. [S.l.]: Wiley, 1985.ISBN 9780471815662.

FELDBAUM, A. A. Dual control theory. i–iv. Automation Remote Control, p.1240–1249, 1960–61.

FELDBAUM, A. A. Optimal Control Systems. New York: Academic Press, 1965.

FILATOV, N.; UNBEHAUEN, H. Adaptive predictive control policy for non-linearstochastic systems. IEEE Trans. Automatic Control, v. 40, p. 1943–1949, 1995.

FILATOV, N.; UNBEHAUEN, H. Synthesis of adaptive controllers using bicriterialoptimization and lyapunov functions. In World Scientific Series in Applicable Analysis,p. 435–445, 1995.

69

Page 88: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

70 REFERÊNCIAS BIBLIOGRÁFICAS

FILATOV, N.; UNBEHAUEN, H. Survey of adaptive dual control methods. IIEEE Proc.Control Theory and Appplications, v. 147, p. 118–128, 2000.

FILATOV, N.; UNBEHAUEN, H. Adaptive Dual Control: Theory and Applications.[S.l.]: Springer, 2004. ISBN 9783540213734.

FLIDR, M.; SIMANDL, M. Implicit dual controller based on stochastic integration rule.In: European Control Conference (ECC). [S.l.: s.n.], 2013. p. 896–901.

ISMAIL, A.; DUMONT, G.; BACKSTROM, J. Dual adaptive control of paper coating.Control Systems Technology, IEEE Transactions on, v. 11, n. 3, p. 289 – 309, 2003.

JACOBS, O.; HUGHES, D. Turn-off escape and probing in non-linear stochastic control.IFAC symposium on stochastic control, Budapest, 1974.

KRAL, L.; SIMANDL, M. Predictive dual control for nonlinear stochastic systemsmodelled by neural networks. In: Mediterranean Conference on Control Automation(MED). [S.l.: s.n.], 2011. p. 1277–1282.

LEE, J. M.; LEE, J. H. An approximate dynamic programming based approach to dualadaptive control. Journal of Process Control, v. 19, n. 5, p. 859 – 864, 2009. ISSN0959-1524.

LINDOFF, B.; HOLST, J.; WITTENMARK, B. Analysis of approximations of dualcontrol. International Journal of Adaptive Control and Signal Processing, John Wileyand Sons, Ltd., v. 13, n. 7, p. 593–620, 1999. ISSN 1099-1115.

MAITELLI, A.; YONEYAMA, T. A two-stage dual suboptimal controller for stochasticsystems using approximate moments. Automatica, v. 30, p. 1949–1954, 1994.

MAITELLI, A.; YONEYAMA, T. Two-stage suboptimal dual controller for systemswith stochastic parameters using optimal predictors. Control Theory and Applications,IEE Proceedings -, v. 141, n. 4, p. 255 –260, jul 1994. ISSN 1350-2379.

MAITELLI, A.; YONEYAMA, T. A multistage suboptimal dual controller using optimalpredictors. Automatic Control, IEEE Transactions on, v. 44, n. 5, p. 1002–1008, May1999.

MAITELLI, A. L. Controladores adaptativos duais utilizando preditores otimosaproximados. Tese (Doutorado) — ITA, São José dos Campos, SP, nov. 1994.

MAITELLI, A. L.; YONEYAMA, T. Um controlador adaptativo para sistemascom parâmetros estocásticos empregando dualidade. Anais do IV Congresso LatinoAmericano de Automática, Puebla, México, p. 119–123, 1990.

MAK, W.-K.; MORTON, D. P.; WOOD, R. Monte carlo bounding techniques fordetermining solution quality in stochastic programs. Operations Research Letters, v. 24,n. 1–2, p. 47 – 56, 1999. ISSN 0167-6377.

Page 89: Um Controlador Dual Subótimo com Fator de Peso Variável no ... · Ao meu orientador, professor Doutor André Maitelli, sou grato pela orientação e confi- ... Resumo O presente

REFERÊNCIAS BIBLIOGRÁFICAS 71

MAYBECK, P. Stochastic Models, Estimation and Control. [S.l.]: Academic Press,1982. ISBN 9780124807020.

MILITO, R. R. A. P.; CADORIN, D. An innovations approach to dual control. IEEETrans. Autom. Control, v. 21, p. 132–137, 1982.

MOSCA, E.; ROCCHI, S.; ZAPPA, G. A new dual active control algorithm. In:Decision and Control including the 17th Symposium on Adaptive Processes, 1978 IEEEConference on. [S.l.: s.n.], 1978. v. 17, p. 509 –512.

RADENKOVIC, M. Convergence of the generalized dual control algorithm. Int. J.Control, v. 47, p. 1419–1441, 1988.

STEMBY, J. A simple dual control problem with an analytical solution. IEEE Trans.Autom. Control., p. 840–844, 1976.

VERESSININA Y. ; WALL, D. Synergy and Duality of Identification and Control. [S.l.]:Taylor e Francis, 1999. ISBN 9780748407736.

WENK, C. J.; BAR-SHALOM, Y. A multiple model adaptive dual control algorithm forstochastic systems with unknown parameters. In: Decision and Control including theSymposium on Adaptive Processes, 1979 18th IEEE Conference on. [S.l.: s.n.], 1979.v. 18, p. 723 –730.

WIESLANDER, J.; WITTENMARK, B. An approach to adaptive control using real timeidentification. Automatica, Pergamon Press, Inc., v. 7, n. 2, p. 211–217, mar. 1971.

WITTENMARK, B. An active suboptimal dual controller for systems with stochasticparameters. Automatic Control Theory and Application, v. 3, n. 1, p. 13–19, 1975.

WITTENMARK, B. Stochastic adaptive control methods: A survey. Int J Control, v. 21,p. 705–730, 1975.

WITTENMARK, B. Adaptive dual control methods: An overview. In: In 5th IFACsymposium on Adaptive Systems in Control and Signal Processing. [S.l.: s.n.], 1995. p.67–72.

WITTENMARK, B.; ELEVITCH, C. An adaptive control algorithm with dual features.Proc. 7th IFAC Symp. on Identification and System Parameter Estimation, p. 587–891,1985.