dinÂmica nÃo modelada em um sistema de controle adaptativo ... · resumo— o controle adaptativo...

8
DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO BINÁRIO MULTIVARIÁVEL INCERTO PASSIVADO LIU HSU ,I VANKO YANQUE ,EDUARDO V. L. NUNES ,RAMON R. COSTA Programa de Eng. Elétrica, COPPE/Universidade Federal do Rio de Janeiro Emails: [liu, ivanko, eduardo, ramon]@coep.ufrj.br Abstract— The Binary Model Reference Adaptive Control (B-MRAC), proposed originally for SISO systems, is capable of preserving the most desirable properties of sliding modes control systems, with the advantage of having a continuous control signal. Recently, an extension of this controller for MIMO plants with uniform relative degree one was proposed, using a passifying multiplier designed so that a generalized passivity condition called WASPR is achieved. This allowed the application of the controller even when the system high frequency gain matrix is not symmetric so that the proposed control scheme is globally stable and guarantees convergence of the tracking error to zero. In this paper, the behavior of the passivated adaptive control system with an unmodeled dynamic is analyzed Keywords— Adaptive Control, Projection, Passivation, Sliding Mode Control. Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas SISO, é capaz de preservar as propriedades mais desejáveis de sistemas de controle por modos deslizantes, com a vantagem de possuir um sinal de controle contínuo. Recentemente, uma extensão deste controlador para plantas MIMO com grau relativo uniforme e unitário foi proposta, usando um multiplicador passivador projetado de forma que uma condição de passividade generalizada chamada WSPR seja obtida. Isto possibilitou a aplicabilidade do controlador mesmo que a matriz de ganho de alta frequência do sistema não seja simétrica, garantindo que o esquema de controle proposto possua estabilidade global e convergência do erro de rastreamento para zero. Neste artigo, o comportamento do sistema de controle adaptativo passivado frente a uma dinâmica não modelada é analisado. Palavras-chave— Controle Adaptativo, Projeção, Passivação, Controle por Modos Deslizantes. 1 Introdução Os sistemas de controle adaptativo podem apresen- tar um comportamento instável na presença de per- turbações (Rohrs et al., 1982), (Ioannou and Kokoto- vic, 1984a). Em (Ioannou and Kokotovi´ c, 1984b) uma modificação σ foi proposta para mitigar os efeitos de dinâmicas não modeladas, logo muitas variações da modificação σ foram propostas (Ortega and Yu, 1989). O método de controle adaptativo por modelo de referencia binário B-MRAC (Binary Model Reference Adaptive Control) para sistemas SISO (Single-input single-output) foi proposto em (Hsu and Costa, 1994), consiste basicamente no MRAC convencional com uma modificado σ dada pela projeção de parâmetros combinada com um ganho de adaptação suficiente- mente alto, com o qual consegue um bom comporta- mento transitório e robustez com respeito a dinâmicas não modeladas. O conceito clássico de passividade, quando apli- cado a sistemas multivariáveis, requer uma condição de simetria da matriz de ganho de alta frequência (High Frequency Gain - HFG), que dificilmente é sa- tisfeita por sistemas reais. Uma nova possibilidade para superar este problema surgiu recentemente em (Barkana et al., 2006; Hsu et al., 2011), com base em um conceito generalizado de passividade introduzida em (Fradkov, 2003), chamado WSPR em contraste com o conceito usual de passividade SPR (Strictly Po- sitive Real). Outro conceito de passividade, definido em (Barkana et al., 2006), que também é muito útil é o conceito WASPR (W-almost SPR), que é válido caso seja possível fazer com que a planta torne-se WSPR, por meio de uma realimentação de saída estática. Em (Hsu et al., 2011) mostrou-se que a condição necessá- ria e suficiente para que plantas de fase mínima com grau relativo um (n = 1) sejam WASPR é que a ma- triz de ganho de alta frequência, chamada K p , tenha forma de Jordan diagonal com autovalores reais e po- sitivos (Positive real Diagonal Jordan form - PDJ). Estes conceitos de passividade generalizada WSPR/WASPR foram usados para propor uma ex- tensão do controle B-MRAC para sistemas MIMO (Multiple-input multiple-output) em (Yanque et al., 2012), onde foi mostrado que as vantagens do controle por modos deslizantes, bom transitório e robustez, fo- ram atingidas. Neste artigo o desempenho do controlador B- MRAC MIMO passivado é analisado na presença de uma dinâmica não modelada. Os resultados das simu- lações mostram que o sistema de controle mantem-se estável e o erro de rastreamento fica de alguma forma pequeno quando a dinâmica não modelada é suficien- temente pequena. 2 Definição do Problema Considere uma planta linear, multivariável (MIMO) e invariante no tempo, perturbada por uma dinâmica não modelada, descrita por ˙ x p = A p x p + B p u + A 12 z, µ ˙ z = A 2 z + B 2 u y p = C p x p , (1) onde x p R n é o estado, u R m é a entrada, y p R m é a saída, z R m é o estado da dinâmica não modelada e µ> 0. As matrizes A p , B p e C p são Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 367

Upload: nguyenxuyen

Post on 27-Jan-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO BINÁRIOMULTIVARIÁVEL INCERTO PASSIVADO

LIU HSU∗, IVANKO YANQUE∗, EDUARDO V. L. NUNES∗, RAMON R. COSTA∗

∗Programa de Eng. Elétrica, COPPE/Universidade Federal do Rio de Janeiro

Emails: [liu, ivanko, eduardo, ramon]@coep.ufrj.br

Abstract— The Binary Model Reference Adaptive Control (B-MRAC), proposed originally for SISO systems, is capable ofpreserving the most desirable properties of sliding modes control systems, with the advantage of having a continuous controlsignal. Recently, an extension of this controller for MIMO plants with uniform relative degree one was proposed, using a passifyingmultiplier designed so that a generalized passivity condition called WASPR is achieved. This allowed the application of thecontroller even when the system high frequency gain matrix is not symmetric so that the proposed control scheme is globally stableand guarantees convergence of the tracking error to zero. In this paper, the behavior of the passivated adaptive control system withan unmodeled dynamic is analyzed

Keywords— Adaptive Control, Projection, Passivation, Sliding Mode Control.

Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas SISO,é capaz de preservar as propriedades mais desejáveis de sistemas de controle por modos deslizantes, com a vantagem de possuirum sinal de controle contínuo. Recentemente, uma extensão deste controlador para plantas MIMO com grau relativo uniformee unitário foi proposta, usando um multiplicador passivador projetado de forma que uma condição de passividade generalizadachamada WSPR seja obtida. Isto possibilitou a aplicabilidade do controlador mesmo que a matriz de ganho de alta frequência dosistema não seja simétrica, garantindo que o esquema de controle proposto possua estabilidade global e convergência do erro derastreamento para zero. Neste artigo, o comportamento do sistema de controle adaptativo passivado frente a uma dinâmica nãomodelada é analisado.

Palavras-chave— Controle Adaptativo, Projeção, Passivação, Controle por Modos Deslizantes.

1 Introdução

Os sistemas de controle adaptativo podem apresen-tar um comportamento instável na presença de per-turbações (Rohrs et al., 1982), (Ioannou and Kokoto-vic, 1984a). Em (Ioannou and Kokotovic, 1984b) umamodificação σ foi proposta para mitigar os efeitos dedinâmicas não modeladas, logo muitas variações damodificação σ foram propostas (Ortega and Yu, 1989).

O método de controle adaptativo por modelo dereferencia binário B-MRAC (Binary Model ReferenceAdaptive Control) para sistemas SISO (Single-inputsingle-output) foi proposto em (Hsu and Costa, 1994),consiste basicamente no MRAC convencional comuma modificado σ dada pela projeção de parâmetroscombinada com um ganho de adaptação suficiente-mente alto, com o qual consegue um bom comporta-mento transitório e robustez com respeito a dinâmicasnão modeladas.

O conceito clássico de passividade, quando apli-cado a sistemas multivariáveis, requer uma condiçãode simetria da matriz de ganho de alta frequência(High Frequency Gain - HFG), que dificilmente é sa-tisfeita por sistemas reais. Uma nova possibilidadepara superar este problema surgiu recentemente em(Barkana et al., 2006; Hsu et al., 2011), com base emum conceito generalizado de passividade introduzidaem (Fradkov, 2003), chamado WSPR em contrastecom o conceito usual de passividade SPR (Strictly Po-sitive Real). Outro conceito de passividade, definidoem (Barkana et al., 2006), que também é muito útil é oconceito WASPR (W-almost SPR), que é válido casoseja possível fazer com que a planta torne-se WSPR,por meio de uma realimentação de saída estática. Em

(Hsu et al., 2011) mostrou-se que a condição necessá-ria e suficiente para que plantas de fase mínima comgrau relativo um (n∗ = 1) sejam WASPR é que a ma-triz de ganho de alta frequência, chamada Kp, tenhaforma de Jordan diagonal com autovalores reais e po-sitivos (Positive real Diagonal Jordan form - PDJ).

Estes conceitos de passividade generalizadaWSPR/WASPR foram usados para propor uma ex-tensão do controle B-MRAC para sistemas MIMO(Multiple-input multiple-output) em (Yanque et al.,2012), onde foi mostrado que as vantagens do controlepor modos deslizantes, bom transitório e robustez, fo-ram atingidas.

Neste artigo o desempenho do controlador B-MRAC MIMO passivado é analisado na presença deuma dinâmica não modelada. Os resultados das simu-lações mostram que o sistema de controle mantem-seestável e o erro de rastreamento fica de alguma formapequeno quando a dinâmica não modelada é suficien-temente pequena.

2 Definição do Problema

Considere uma planta linear, multivariável (MIMO) einvariante no tempo, perturbada por uma dinâmica nãomodelada, descrita por

xp = Apxp +Bpu+A12z ,

µz = A2z +B2u

yp = Cpxp , (1)

onde xp ∈ Rn é o estado, u ∈ Rm é a entrada, yp ∈Rm é a saída, z ∈ Rm é o estado da dinâmica nãomodelada e µ > 0. As matrizes Ap, Bp e Cp são

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

367

Page 2: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

incertas. O modelo nominal da planta usado para oprojeto do controlador é dado por uma aproximaçãode ordem reduzida (obtida fazendo µ = 0), isto é

xp = Apxp +Bru , yp = Cpxp , (2)

onde Br = Bp −A12A2−1B2.

Assume-se que todos os parâmetros incertos per-tencem a um conjunto compacto Υ conhecido, deforma que os limitantes para as incertezas estejam dis-poníveis para o projeto do controlador. O modelo deentrada-saída correspondente é dado por

yp = G(s)u, G(s) = Cp(sI−Ap)−1Br .

Assume-se que as seguintes hipóteses sobre o sis-tema são satisfeitas:

(A1) A matriz de transferênciaG(s) é de fase mínimae tem posto completo.

(A2) A planta é controlável e observável.

(A3) O índice de observabilidade ν de G(s), ou umlimitante superior de ν, é conhecido.

(A4) G(s) tem grau relativo 1 (n∗ = 1), isto é,lims→∞ sG(s) = Kp, onde a matriz não singularKp é referida por matriz HFG.

(A5) A dinâmica não modelada é estável, i.e.Reλ(A2) < 0.

O objetivo é projetar uma lei de controle u tal queo erro de saída e = y − ym, tenda para zero assin-toticamente para condições iniciais arbitrárias, ondeym ∈ Rm é a saída do modelo de referência

ym = M(s) r , M(s)=diag

1

s+a, . . . ,

1

s+a

,

(3)

onde a>0 e r ∈ Rm é um sinal de referência arbitrá-rio, contínuo por partes e uniformemente limitado.

Quando a planta é conhecida, uma lei de con-trole que assegura o casamento entre o sistemaem malha fechada e M(s) é dada por u∗ =Θ∗Tω, onde a matriz de parâmetros é escrita comoΘ∗ =

[Θ∗Tu Θ∗T

y Θ∗T0 K∗T

Θ

]T, com Θ∗

u,Θ∗y ∈

Rm(ν−1)×m,Θ∗0,K

∗TΘ ∈ Rm×m e o vetor regressor

ω = [ωTu ωTy yTp rT ]T , wu, wy ∈ Rm(ν−1) é obtidopor meio de filtros de entrada e saída dados por:

ωu = ΨΛ−1u , ωy = ΨΛ−1yp , (4)

onde Ψ(s) = [Isν−2 Isν−3 · · · Is I]T ,Λ(s) = λ (s)I e λ(s) é um polinômio mônicoHurwitz de grau ν − 1. Considere a realização de (4),dada por

ωu = Φωu + Γu , ωy = Φωy + Γyp , (5)

As condições de casamento requerem que K∗TΘ =

K−1p .

A equação do erro pode ser desenvolvida se-guindo a abordagem usual para o SISO MRAC(Ioannou and Sun, 1996). Assim, como foi formuladoem (Costa and Hsu, 1991), a dinâmica do erro podeser descrita como

xe = Ac xe +BcKpu+ A12f, (6)µz = f, e = C0 xe,

onde xe = x − xm, xm é o estado do mo-delo, Ac = A0 + B0Θ∗T

r W0, Bc = B0K∗TΘ ,

A12 =[(A12A2

−1)T 0 0]T

, f = A2z + B2u,u = u − u∗,

A0 =

Ap 0 00 Φ 0

ΓCp 0 Φ

, B0 =

Br

Γ0

, C0 =

CTp

00

T

,

x =

xp

ωu

ωy

, W0 =

0 I 00 0 IC0 0 0

,Θ∗r =

Θ∗u

Θ∗y

Θ∗0

,note que (Ac, Bc, C0) é uma realização não mínima

de M(s) e Ac é Hurwitz uma vez que o modelo dereferência é BIBO estável. Portanto, a equação do erropode ser reescrita em forma de entrada-saída como

e = M(s)Kpu.

Como a planta é incerta, a matriz de parâmetros Θ∗

é desconhecida. Assim, pode-se considerar a seguinteparametrização de controle u = ΘTω, onde o parâ-metro Θ(t) é adaptado a fim de conseguir o objetivo.Estratégias para adaptar este parâmetro serão discuti-das adiante.

3 Passividade Generalizada (WSPR)

O lema de positividade real estabelece que o sistema

x = Ax+Bu, y = Cx, (7)

com x ∈ Rn, u ∈ Rm, y ∈ Rm é SPR se e somentese existirem matrizes simétricas e positivas definidasP e Q que satisfaçam

ATP + PA = −Q, PB = CT . (8)

De (8), temos que BTPB = BTCT = CB. As-sim, o sistema (7) só pode ser SPR se (Kp = CB)for simétrica e positiva definida (SPD). Esta condiçãoé dificilmente satisfeita por sistemas reais. Uma solu-ção para superar esta dificuldade foi recentemente pro-posta em (Barkana et al., 2006; Hsu et al., 2011), ex-plorando o conceito mais geral de passividade associ-ada com a condição WSPR, definida logo a seguir, emconjunto com a condição WASPR (“W-almost SPR")e alguns resultados básicos relacionados com tais con-dições.

Definição 1: [WSPR] (Barkana et al., 2006; Hsuet al., 2011) Um sistema linear invariante notempo com a realização A,B,C, onde A ∈ Rn×n,

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

368

Page 3: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

B ∈ Rn×m, e C ∈ Rm×n é dito como sendo W–Strictly-Passive (WSP) e sua função de transferên-cia C(sI − A)−1B é dita W–Strictly Positive Real(WSPR), se existirem matrizes simétricas e positivasdefinidas P , Q, e W tal que

ATP + PA = −Q, (9)

PB = CTW. (10)

Em (Hsu et al., 2011), observa-se que, ao contrá-rio da condição SPR, a equação (10) não requer maisa condição de simetria de CB, e sim a de W (CB).

Lema 1: (Barkana et al., 2006; Hsu et al., 2011)Dada uma matriz CB∈Rm×m, então existe uma ma-triz W = WT > 0, W ∈ Rm×m tal que W (CB) =(CB)T W > 0, se e somente se CB tem autovaloresreais e positivos e sua forma de Jordan é diagonal.

Definição 2: [WASPR (Barkana et al., 2006; Hsuet al., 2011)] Um sistema linear invariante no tempocom realização A,B,C, é dito WASPR se podeser feito WSPR através de uma realimentação está-tica de saída, i.e., se existe K ∈ Rm×m tal queC(sI −AK)−1B seja WSPR, com AK = A−BKC.

Teorema 1 (Teorema WASPR (Hsu et al., 2011))Todo sistema estritamente próprio e de fase mínimaA,B,C, com A ∈ Rn×n, B ∈ Rn×m, C ∈ Rm×n

e com função de transferência C(sI − A)−1B, podeser feito WSPR por meio de uma realimentação desaída (suficientemente grande), se e somente se Kp

possuir autovalores reais e positivos e sua forma deJordan for diagonal.

Em (Yanque et al., 2012) o conceito WSPR foiaplicado usando um multiplicador passivador de saídaL obtendo a equação do erro modificado

xe = AKxe +BcKpu+A12f,

µz = f, eL = LC0xe, (11)

ondeAK = Ac−BcKpKLC0, K é um ganho de rea-limentação de saída estática. O multiplicador passiva-dor L foi escolhido de modo que o sistema modificadoAK , BcKP , LC0 satisfaça a condição WASPR doTeorema 1.

A matrizL foi determinada assumindo que os me-nores principais de Kp são distintos de zero, usandouma fatoração LDU de Kp = LpDpUp, e escolhendouma matriz diagonal D0 com elementos diagonais po-sitivos e distintos, obtendo-se a matriz passivadora desaída L = D0(LpDp)

−1 que faz com que a matrizKp = LKp seja triangular superior com elementosdiagonais e autovalores reais positivos e distintos.

Assim, do Lema 1 existe uma matriz W tal queWLKp é SPD. Deste modo, é possível concluir que osistema do erro modificado

eL = LM(s)Kpu,

é WSPR, uma vez que M(s) = 1s+aI e LKp tem au-

tovalores positivos e reais e sua forma de Jordan é di-agonal. Assim, é possível fazer K = 0 e portantoAK = Ac neste caso.

4 Controle Adaptativo por Modelo de ReferênciaBinário (B-MRAC)

Em (Yanque et al., 2012) foi apresentada uma ver-são MIMO do controlador B-MRAC, onde ao invésde usar a matriz de parâmetros Θ ∈ RN×m e o vetorregressor ω ∈ RN , considera-se um vetor de parâme-tros modificado ϑ ∈ RNm e uma matriz regressoramodificada Ω ∈ RNm×m dados por

ϑ =

θ1...θm

, Ω =

ω. . .

ω

, (12)

onde θi corresponde à i-ésima coluna da matriz de pa-râmetros Θ, como foi definida na Seção 2.

A lei de adaptação MIMO B-MRAC é dada por

ϑ = −σϑ− γΩeL, (13)

σ =

0, se ∥ϑ∥ < Mϑ ou σeq < 0,σeq, se ∥ϑ∥ ≥Mϑ e σeq ≥ 0,

(14)

σeq =−γϑTΩeL∥ϑ∥2

, (15)

onde Mϑ > ∥ϑ∗∥ 1 e γ é o ganho de adaptação.Como no caso SISO, se ∥ϑ(0)∥ ≤ Mϑ, então segueque ∥ϑ(t)∥ ≤Mϑ, ∀t≥ 0. Doravante, assume-se que∥ϑ(0)∥≤Mϑ. Além disso, note que a lei de controle,previamente parametrizada em termos de Θ e ω podeser reescrita como

u = ΘTω = ΩTϑ. (16)

4.1 Análise de estabilidade do controlador B-MRAC

As propriedades de estabilidade e robustez do MIMOB-MRAC considerando uma dinâmica não modeladasão formalizadas no seguinte teorema.

Teorema 2 (Teorema de estabilidade do B-MRAC)Considere a planta (2) e o modelo de referência (3).Suponha que as hipóteses (A1)-(A5) sejam satisfeitas,com µ ∈ (0, µ] onde µ ∈ (0, 1) é suficientementepequeno. Considere o vetor ϵ =

[xTe

õzT

]Te o sistema do erro (11) com lei de adaptação dadapor (12)-(16) onde L é uma matriz passivadora.Assuma que ∥ϑ(0)∥ ≤ Mϑ sendo que a cons-tante Mϑ > ∥ϑ∗∥. Se µ ∈ (0, µ) onde µ > 0 ésuficientemente pequeno então

(i) ∥ϑ(t)∥ ≤Mϑ , ∀t ≥ 0;

1Como usualmente ϑ∗ não é único na parametrização MIMO,aqui Mϑ > ∥ϑ∗∥ significa Mϑ > ∥ϑm∗∥ onde ϑm∗ é o ϑ∗ denorma mínima.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

369

Page 4: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

(ii) ∥ϵ(t)∥2 ≤ c1e−λ1t∥ϵ(0)∥2 + O(γ−1) +

O(µ) , ∀t ≥ 0 e algumas constantes positivas c1e λ1;

(Prova: ver Apêndice)

4.2 Multiplicador passivador de entrada

Como outra possibilidade de passivação pode-se usarum multiplicador passivador triangular superior U deentrada (no lugar de L), de forma que o sistema mo-dificado AK , BcKPU , C0 satisfaça a condiçãoWASPR do Teorema 1. Nesse caso, a equação do erromodificado terá a forma

xe = AKxe +BcKpUu+A12f,

µz = f, e = C0xe, (17)

onde AK = Ac − BcKpUKC0, K é um ganhode realimentação de saída estática. Similarmente,uma matriz multiplicadora triangular superior U =(DpUp)

−1D0 pode ser obtida de forma que a matriz

Kp = KpU = LpDpUp(DpUp)−1D0 = LpD0

seja triangular inferior com elementos diagonais e au-tovalores positivos reais e distintos.

5 Aplicação do Controlador MIMO B-MRAC

Esta seção ilustra a aplicação do MIMO B-MRACconsiderando uma dinâmica não modelada para oproblema de servovisão de manipuladores planaresusando uma câmara fixa (planta) que não está cali-brada em relação ao espaço de trabalho do robô (Hsuet al., 2011).

Deseja-se controlar o robô para que a imagemdo efetuador rastreie a trajetória desejada no plano daimagem. O diagrama de blocos de controle é represen-tado na Fig. 1. A motivação para escolher este exem-plo é que a matriz HFG é essencialmente uma matrizde rotação, que não é simétrica com a exceção doscasos triviais. Além disso, os autovalores da matrizHFG são complexos (quando a orientação da câmara éϕ = 0), necessitando, assim, de um multiplicador depassivação para obter a condição WSPR.

Figura 1: Problema de rastreamento visual adaptativo comdinâmica não modelada

O problema de controle cartesiano nas coordena-das da imagem da câmara considerando uma dinâmicanão modelada é descrito por:

xc = Kp(ϕ)z, Kp(ϕ) =

[cos(ϕ) − sin(ϕ)sin(ϕ) cos(ϕ)

],

(18)

µz = −z + u (19)

onde xc ∈ R2 representa as coordenadas do efetuadorno plano da imagem, u ∈ R2 é a lei de controle carte-siana do robô, Kp ∈ R2×2 é a matriz de rotação querepresenta a relação entre o espaço imagem e o espaçode trabalho do robô (um fator de escala unitário é as-sumido). Pode-se verificar que o modelo nominal daplanta pode ser obtido fazendo µ = 0 como em (2),assim o modelo nominal da planta é dado por

xc = Kpu.

A trajetória desejada no plano da imagem é ge-rada pelo modelo de referência especificado por

xm = −ηxm + ηr(t),

onde a constante η é positiva e r ∈ R2 é um sinal dereferência arbitrário, contínuo por partes e uniforme-mente limitado.

Então, o objetivo é achar uma lei de controle u talque o erro de rastreamento e = xc−xm, tenda assinto-ticamente para zero para condições iniciais arbitrárias.

A equação do erro de rastreamento é dada por

e = −ηe+Kpu− ηω.

A lei de controle ideal é dada por u∗ = Θ∗Tω, ondeΘ∗T = Kp

−1η e ω = r − xc.No caso em que a matriz passivadora de entrada

U é usada, a equação de erro de rastreamento torna-se

e = −ηe+KpUu− ηω,

neste caso os parâmetros de controle ideais tornam-seΘ∗T = (KpU)

−1η.

5.1 Determinação da matriz passivadora L

Para tornar o sistema do erro WASPR é necessárioachar uma matriz constante tal que LKp (ou KpU )tenha autovalores reais e positivos em um intervaloaberto de incerteza de ϕ. Para esta finalidade, adota-seo procedimento proposto em (Hsu et al., 2011).

A decomposição LDU de Kp é dada por

Kp =

[c −ss c

]=

[1 0s/c 1

] [c 00 1/c

] [1 −s/c0 1

],

onde c = cos(ϕ), s = sin(ϕ) e

Lp =

[1 0s/c 1

]Dp =

[c 00 1/c

]Up =

[1 −s/c0 1

]

Definindo D0 = diagα, β e substituindo emL = D0(LpDp)

−1, para a matriz passivadora de saídaL tem-se

L =

[α/c 0−βs βc

],

da mesma forma, para a matriz passivadora de entradaU tem-se

U =

[α/c βs0 βc

].

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

370

Page 5: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

Pode-se avaliar L (ou U ) para alguns valores no-minais de ϕ, fixando β = 1 e permitindo que o parâ-metro α possa variar livremente. A tabela apresentadaem (Hsu et al., 2011) mostra as faixas de valores doângulo ϕ para as quais a condição WASPR é preser-vada com L (ou U ) calculado usando ϕ = ϕnom.

α (β = 1) ϕnom = 0 ϕnom = 45

α = 2 −18 < ϕ < 19 −27 < ϕ < 49

α = 5 −41 < ϕ < 41 −48 < ϕ < 60.1

α = 20 −64 < ϕ < 64 −71 < ϕ < 73

Tabela 1: Domínios de incerteza de ϕ para preservara condição WASPR.

Note que para o problema de servovisão apresen-tado os autovalores de LKp e deKpU são os mesmos,é por isso que a tabela pode-se usar indistintamente.

5.2 Simulações

Para realizar as simulações, considera-se que o ângulode orientação da câmara ϕ = −30, de forma que osautovalores de Kp são 0.86 ± 0.5i e as seguintescondições iniciais xc(0) =

[5 5

]T .O modelo e o sinal de referência são escolhidos

como λ = 1 e r(t) = [10 sin(3t) 10 sin(0.5t)]T . Noteque este sinal de referência é suficientemente rico paragarantir a convergência paramétrica.

Para o projeto do controlador utiliza-se o seguintevalor nominal para o ângulo da câmera ϕnom = 45,e as constantes α = 5, β = 1, para obter a matriz pas-sivadora L. Para ϕ = −30, os autovalores de LKp

são 5.46; 0.91 e a condição WASPR é satisfeita, i.e.LKp tem forma de Jordan diagonal e autovalores reaise positivos. Na lei de adaptação do B-MRAC escolhe-se MΘ = 3, que é um limitante superior da norma dovetor de parâmetros ideais

(∥Θ∗∥ =

√2), e a consi-

derada da dinâmica não modelada µ = 0.002.

5.2.1 Resultados com a estratégia MRAC conven-cional

O sistema de controle MRAC sem passivar não é ca-paz de garantir convergência do erro de rastreamentonem convergência dos parâmetros de controle e o si-nal de controle u apresenta picos e um desempenhotransitório insatisfatório (Fig. 2). No entanto, quandoo multiplicador de saída L é aplicado o sistema apre-senta um melhor comportamento, porém sem atingirum sinal de erro e aceitável e ainda com picos no sinalde controle u (Fig. 3).

5.2.2 Resultados com a estratégia B-MRAC

Quando a dinâmica não modelada não é considerada ocontrole B-MRAC passivado consegue convergênciaparamétrica em um tempo menor que o MRAC e errosde rastreamento menores no transitório com uma con-vergência mais rápida para zero (Fig. 4). O sistema de

0 5 10 15 20 25−10

0

10(a) Erros de rastreamento (e)

0 5 10 15 20 25−100

0

100(b) Sinais de controle da planta (u)

0 5 10 15 20 25−10

0

10

(c) Parâmetros adaptados

Figura 2: Controle MRAC sem passivação, γ = 0.5 e dinâ-mica não modelada (µ = 0.002).

0 5 10 15 20 25−5

0

5

10(a) Erros de rastreamento (e)

0 5 10 15 20 25−40

−20

0

20

40(b) Sinais de controle da planta (u)

0 5 10 15 20 25−10

0

10(c) Parâmetros adaptados

Figura 3: Controle MRAC com passivação L, γ = 0.5 edinâmica não modelada (µ = 0.002).

controle B-MRAC sem passivar também não é capazde garantir convergência do erro de rastreamento nemconvergência dos parâmetros de controle, porém o si-nal de controle u não apresenta picos e o erro de ras-treamento e é menor (Fig. 5). Mas quando o multipli-cador passivador de saída L (Fig. 6) é aplicado o chat-tering de controle é reduzido e o erro de rastreamentoe torna-se menor porém sem atingir convergência pa-ramétrica. Ao incrementar o ganho pode-se observarque o resultado é similar ao obtido com controle UVC(Yanque et al., 2012) (Fig. 7), e que melhora usando omultiplicador passivador (Fig. 8).

5.2.3 Resultados usando o multiplicador passiva-dor de entrada U

Os multiplicadores passivadores de entrada U e saídaL podem ser usados ser usados indistintamente para ocontrole sem dinâmica não modelada, atingindo resul-tados similares, mesmo com dinâmica não modelada(Fig. 9). Mas, neste caso, quando ganho de adaptaçãoé alto o sistema atinge um erro maior (Fig. 10). Istopode ser porque U modifica o sinal de controle u ob-

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

371

Page 6: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

0 5 10 15 20 25−1

0

1(a) Erros de rastreamento (e)

0 5 10 15 20 25−40

−20

0

20

40(b) Sinais de controle da planta (u)

0 5 10 15 20 25−4

−2

0

2

4(c) Parâmetros adaptados

Figura 4: Controle B-MRAC com passivação L e γ = 0.5.

0 5 10 15 20 25−5

0

5(a) Erros de rastreamento (e)

0 5 10 15 20 25−40

−20

0

20

40(b) Sinais de controle da planta (u)

0 5 10 15 20 25−4

−2

0

2

4(c) Parâmetros adaptados

Figura 5: Controle B-MRAC sem passivação, γ = 0.5 edinâmica não modelada (µ = 0.002).

tida pela lei de adaptação, e neste caso incrementa oefeito da dinâmica não modelada.

6 Conclusões

Neste artigo, o comportamento do controlador B-MRAC MIMO passivado frente a uma dinâmica nãomodelada foi analisado. Os resultados das simula-ções mostram que o desempenho do sistema de con-trole melhora aplicando a passivação, porém sem atin-gir convergência paramétrica. Verificou-se que comganhos altos o sistema com dinâmica não modeladatambém tende a se comportar como o controle veto-rial unitário (UVC), porém sem atingir um sinal decontrole continuo. O melhor desempenho da passiva-ção de saída L frente a de entrada U com ganhos altospode-se dever a que U modifica o sinal de controleu o qual pode incrementar o efeito da dinâmica nãomodelada e como consequência incrementar o erro derastreamento e.

0 5 10 15 20 25−1

0

1(a) Erros de rastreamento (e)

0 5 10 15 20 25−40

−20

0

20

40(b) Sinais de controle da planta (u)

0 5 10 15 20 25−4

−2

0

2

4(c) Parâmetros adaptados

Figura 6: Controle B-MRAC com passivação L, γ = 0.5 edinâmica não modelada (µ = 0.002).

0 5 10 15 20 25−1

0

1(a) Erros de rastreamento (e)

0 5 10 15 20 25−40

−20

0

20

40(b) Sinais de controle da planta (u)

0 5 10 15 20 25−4

−2

0

2

4(c) Parâmetros adaptados

Figura 7: Controle B-MRAC sem passivação, γ = 100 edinâmica não modelada (µ = 0.002).

Apêndice

Prova: A propriedade (i) é facilmente obtida considerando afunção de Lyapunov

2Vϑ = ϑTϑ = ∥ϑ∥2, (20)

a derivada temporal de (20) é dada por 2Vϑ = ϑTϑ + ϑT ϑ, e,substituindo (13) em (20) tem-se

2Vϑ = −2σϑTϑ− γ(ΩeL)Tϑ− γϑTΩeL.

Pode-se notar que ϑTΩeL é escalar e, portanto, igual a sua trans-posta. De (15) segue que

2Vϑ = −2σ∥ϑ∥2 + 2σeq∥ϑ∥2,

Vϑ = (σeq − σ)∥ϑ∥2 = 2(σeq − σ)Vϑ,

e (σeq − σ)≤ 0 para ∥ϑ∥≥Mϑ. Assim, o conjunto ∥ϑ∥≤Mϑ épositivamente invariante e portanto ϑT ϑ é uniformemente limitadopor uma constante.

Considere a seguinte candidata a função de Lyapunov

V =[xe µz

] [ P1 RT

R P2

] [xeµz

]+

1

γϑTWN ϑ,

(21)

onde WN ∈ RNm×Nm é positiva definida simétrica WN =WN

T > 0, pode ser reescrita como WN = W ⊗ IN , ondeW ∈ Rm×m é positiva definida simétrica W = WT > 0 eIN ∈ RN×N é a matriz identidade. A derivada temporal de V

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

372

Page 7: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

0 5 10 15 20 25−1

0

1(a) Erros de rastreamento (e)

0 5 10 15 20 25−40

−20

0

20

40(b) Sinais de controle da planta (u)

0 5 10 15 20 25−4

−2

0

2

4(c) Parâmetros adaptados

Figura 8: Controle B-MRAC com passivação L, γ = 100 edinâmica não modelada (µ = 0.002).

0 5 10 15 20 25−1

0

1(a) Erros de rastreamento (e)

0 5 10 15 20 25−40

−20

0

20

40(b) Sinais de controle da planta (u)

0 5 10 15 20 25−4

−2

0

2

4(c) Parâmetros adaptados

Figura 9: Controle B-MRAC com passivação U , γ = 0.5 edinâmica não modelada (µ = 0.002).

pode ser determinada da seguinte forma (para simplificar o cálculoos termos são separados).

V = v1 + v2 + v3 + v4, v1 = xTe Pxe,

v2 = xeTRTµz + µzTRxe,

v3 = µzTP2µz v4 =1

γϑTWN ϑ,

A derivada temporal de v1 é dada por

v1 = xTe P1xe + xTe P1xe, (22)

pode-se substituir (11) e (16) em (22), tem-se

v1 = xTe P1

(AKxe +BcKpΩ

T ϑ+ A12f)

+ (AKxe +BcKpΩT ϑ+ A12f)

TP1xe, (23)

substituindo (11) em (10), obtém-se P1BcKp = (LC0)TW .Logo substituindo em (23), tem-se

v1 = xTe (P1AK +AKTP1)xe + eTLWΩT ϑ

+ ϑTΩWeL + xTe P1A12f + fT AT12P1xe, (24)

substituindo (9) em (24), note que ϑTΩWeL e xTe P1A12f sãoescalares e iguais as suas transpostas, tem-se que

v1 = −xeTQ1xe + 2ϑTΩWeL + 2xTe P1A12f. (25)

A derivada temporal de v2 é dada por

v2 = xeTRTµz + xTe R

Tµz + µzTRxe + µzTRxe (26)

0 5 10 15 20 25−1

0

1(a) Erros de rastreamento (e)

0 5 10 15 20 25−200

0

200(b) Sinais de controle da planta (u)

0 5 10 15 20 25−4

−2

0

2

4(c) Parâmetros adaptados

Figura 10: Controle B-MRAC com passivação U , γ = 100e dinâmica não modelada (µ = 0.002).

substituindo (11) tem-se

v2 = 2xTe RT f + 2µzTRAKxe + 2µzTRBcKpu

+ 2µzTRA12A2z + 2µzTRA12B2u (27)

A derivada temporal de v3 é dada por

v3 = µzTP2µz + µzTP2µz, (28)

substituindo (11) em (28), tem-se

v3 = µ (A2z +B2u)T P2z + µzTP2 (A2z +B2u) ,

= −µzTQ2z + 2µzTP2B2u. (29)

A derivada temporal de v4 é dada por

v4 =1

γ

[˙ϑTWN ϑ+ ϑTWN

˙ϑ]. (30)

Como ϑ = ϑ − ϑ∗, tem-se que ˙ϑ = ϑ já que ϑ∗ tem valor cons-

tante. Assim, substituindo (13) em (30) segue que

v4 =1

γ

[(−ϑσ − γΩeL)

TWN ϑ+ ϑTWN (−ϑσ − γΩeL)],

= −σ

γϑTWN ϑ− eTLΩTWN ϑ−

σ

γϑTWNϑ− ϑTWNΩeL.

Pode-se notar que ϑTWN ϑ e ϑTWNΩeL são escalares e iguais assuas transpostas, e como ΩW =WNΩ, segue que

v4 = −2σ

γϑTWN ϑ− 2ϑTΩWeL. (31)

Assim, somando e simplificando (25), (27), (29) e (31) tem-se

V =− xeTQ1xe + 2xTe

(P1A12 +RT

)f

+ 2µzTR (AKxe +BcKpu) + 2µzT(RA12 + P2

)B2u

+ 2µzT[−1

2Q2 +RA12A2

]z − 2

σ

γϑTWN ϑ, (32)

pode-se escolher R = −AT12P para anular o termo(

P1A12 +RT)

(ver (Costa and Hsu, 1991)) e considerando queu = ΘT

r ω0 (xe + xm) +KTΘr, tem-se

V ≤− xeTQ1xe − µzTQ3z − 2

σ

γϑTWN ϑ

+ µzT (Q4xe +Q5xm +Q7r) , (33)

onde

Q4 = 2[RAK +RBcKpΘ

Tr ωo + (RA12 + P2)B2θ

Tr ω0

],

Q5 = Q4 − 2RAK

Q6 = 2[RBcKpK

Tθ + (RA12 + P2)B2K

]

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

373

Page 8: DINÂMICA NÃO MODELADA EM UM SISTEMA DE CONTROLE ADAPTATIVO ... · Resumo— O Controle Adaptativo por Modelo de Referência Binário (B-MRAC), proposto originalmente para sistemas

como Θr , xm e r são limitados, tem-se

V ≤− k1||xe||2 − µk2||z||2 + µk3||xe||||z||

+ µk4||z|| − 2σ

γϑTWN ϑ (34)

onde k1, k2, k3, k4 > 0, pode-se completar quadrados e fazer

µk3||xe||||z|| =− µ

(c1||z|| −

k3

2c1||xe||

)2

+ µc21||z||2 + µk234c21

||xe||2,

µk4||z|| =− µ

(c2||z|| −

k4

2c2

)2

+ µc22||z||2 + µk244c22

onde c1, c2 > 0, substituindo tem-se

V ≤−k1

2||xe||2 − µ

k2

2||z||2 −

(k1

2− µ

k234c21

)||xe||2

− µ

(k2

2− c21 − c22

)||z||2 − µ

(c1||z|| −

k3

2c1||xe||

)2

− µ

(c2||z|| −

k4

2c2

)2

+ µk244c22

− 2σ

γϑTWN ϑ, (35)

assumindo que µ <2k1c

21

k23

e k2 > 2(c21 + c22

)e como o termo

−2σγϑTWN ϑ é não positivo, tem-se

V ≤−k1

2||xe||2 − µ

k2

2||z||2 +O (µ) (36)

sendo O(µ) uma constante positiva da ordem de µ. É claro queexiste µ suficientemente pequeno tal que para todo µ ∈ (0, µ],

−k1

2||xe||2 − µ

k2

2||z||2 ≤− k5||ϵ||2

onde ϵ =[xTe

õzT

]T , entao

V ≤− ϵTQϵ+O (µ) (37)

Como a norma de ϑ é uniformemente limitada e considerandoµ ∈ (0, 1) , tem-se

V ≤ ϵTPϵ+O(γ−1) (38)

onde P =

[P1 RRT P2

], sendo O(γ−1) uma constante positiva

da ordem de γ−1.Usando as desigualdades de Rayleigh-Ritz, tem-se

V ≤ −λ1[V −O(γ−1)

]+O(µ), (39)

onde λ1 = λmin(Q)/λmax(P ) com os autovalores máximos emínimos das matrizes Q=QT > 0 e P = PT > 0 denotados porλmin(Q) e λmax(P ), respectivamente. Isto implica a propriedade(ii) por um lema de comparação para desigualdades diferenciais (verLema 3.4 de (Khalil, 2002)).

Referências

Barkana, I., Teixeira, M. C. M. and Hsu, L. (2006). Mitigation ofsymmetry condition in positive realness for adaptive control,Automatica 42(9): 1611–1616.

Costa, R. R. and Hsu, L. (1991). Unmodeled dynamics in adaptivecontrol revisited, Systems and Control Letters 16: 341–348.

Fradkov, A. L. (2003). Passification of non-square linear systemsand feedback Yakubovich-Kalman-Popov lemma, EuropeanJournal of Control 6(1): 573–582.

Hsu, L. and Costa, R. R. (1994). B-MRAC: Global exponential sta-bility with a new model reference adaptive controller based onbinary control theory, C-TAT - Control-Theory and AdvanceTechnology 10(4): 649–668. Special Issue on Sliding ModeControl (invited paper).

Hsu, L., Teixeira, M. C. M., Costa, R. R. and Assunçao, E. (2011).Necessary and sufficient condition for generalized passivity,passification and application to multivariable adaptive sys-tems, Proceedings of the 18th IFAC World Congress, Milan,pp. 3433–3438.

Ioannou, P. A. and Kokotovic, P. (1984a). Instability analysis andimprovement of robustness of adaptive control, Automatica20: 583–594.

Ioannou, P. and Kokotovic, P. (1984b). Robust redesign of adaptivecontrol, IEEE Transactions on Automatic Control 29: 202–211.

Ioannou, P. and Sun, K. (1996). Robust Adaptive Control, PrenticeHall.

Khalil, H. K. (2002). Nonlinear Systems, 3rd Edition, Prentice Hall,Inc.

Ortega, R. and Yu, T. (1989). Theoretical results on robustness ofdirect adaptive controllers, Automatica 25: 651–677.

Rohrs, C., Valavani, L., Athans, M. and Stein, G. (1982). Robust-ness of continuous-time adaptive control algorithms in the pre-sence of unmodeled dynamics, Inproceedings of the 21st Con-trol and Decition Conference, Florida, pp. 3–11.

Yanque, I., Nunes, E. V. L., Costa, R. R. and Hsu, L. (2012). BinaryMIMO MRAC using a passifying multiplier - a smoth transi-tion to sliding mode control, Inproceedings of the 2012 Ame-rican Control Conference, Fairmont Queen Elizabeth, Mon-tréal, Canada, pp. 1925–1930.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

374