controle de um pÊndulo invertido sobre uma … · adaptativo, chamado mfa (model-free adaptive)....

10
CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA PLATAFORMA MÓVEL UTILIZANDO PID E MFAC (MODEL-FREE ADAPTIVE CONTROL) Gabriel Vendramini 1 , Paulo Sérgio da Silva 2 1 DEE – FEB – UNESP, Bauru, Brasil, [email protected] 2 DEE – FEB – UNESP, Bauru, Brasil, [email protected] Resumo: O sistema de um pêndulo invertido, por apresentar características dinâmicas intrinsecamente instáveis, tem sido estudado como planta alvo para avaliar o desempenho de diferentes técnicas de controle. O presente trabalho apresenta a modelagem, a simulação e o controle de um sistema composto de um pêndulo invertido sobre uma plataforma móvel descrevendo trajetória unidimensional, em que o objetivo consiste em controlar duas variáveis simultaneamente: o deslocamento angular do pêndulo e o deslocamento linear da plataforma. Para isso, utiliza-se técnicas clássicas e desenvolve-se um controle inteligente adaptativo, chamado MFA (Model-Free Adaptive). Keywords: Pêndulo invertido móvel, sistema não-linear, controle adaptativo, MFAC (Model-Free Adaptive Control). 1. INTRODUÇÃO O problema do pêndulo invertido, apesar de se tratar um sistema mecânico bastante simples, representa várias situações práticas que podem ser analisadas a partir dos conceitos envolvidos em seu estudo. Particularmente, o conceito de pêndulo invertido móvel tem sido utilizado em várias aplicações como, por exemplo, veículo de transporte humano, o que futuramente pode se apresentar como alternativa de transporte automático para áreas urbanas [1], incluindo sua utilização por deficientes físicos. Além disso, estudos de robôs autônomos baseados nesse conceito têm sido realizados pela NASA, apresentando resultados significativos, como os encontrados em [2]. Segundo [3], o sistema do pêndulo invertido possui características dinâmicas intrinsecamente instáveis, o que possibilita o estudo de diversas arquiteturas e tipos de controladores, desde as clássicas até controladores híbridos e/ou baseados em Inteligência Artificial (IA), servindo assim, de sistema alvo para que tais técnicas possam ser colocadas à prova. No tocante ao controle clássico, os compensadores PID (Proporcional-Integral-Derivativo) ainda se apresentam como uma primeira alternativa para o controle de sistemas SISO (Single Input Single Output). No entanto, esses controladores se baseiam em modelos linearizados da planta a ser controlada, o que, segundo [4], pode representar perda de informações importantes para sistemas com altos níveis de exigências. Normalmente, tal controlador é projetado para trabalhar em certo ponto de operação (set point) através do ajuste de seus parâmetros (ganhos proporcional, integral e derivativo). Por conseguinte, se ocorrer mudanças que modifiquem o ponto de operação do sistema, como alteração da condição inicial, variações de parâmetros físicos da planta e perturbações externas, o controlador PID pode não mais apresentar desempenho satisfatório. Dessa forma, [5] destaca que a utilização de redes neurais é bastante promissora e atraente em casos que apresentam não-linearidade, incertezas, variações de parâmetros ou até mesmo quando se desconhece a dinâmica da planta. Nesse contexto, o controle adaptativo MFA (Model- Free Adaptive) apresentado em duas patentes por Cheng em [6] e [7], utiliza as redes neurais como elemento chave e tem se apresentado como uma nova tecnologia na área de controle e automação. O objetivo desse controlador é ajustar automaticamente seus parâmetros internos, ou seja, se adaptar continuamente, para garantir que o sistema opere com desempenho satisfatório em vários pontos de operação e sob diversas condições. Adicionalmente, apesar de ser baseado em uma RNA, [8] enfatizam que não há a necessidade de serem aplicados sinais de testes para um processo de treinamento antes da sua validação como em uma RNA convencional, ou seja, o controlador pode ser inserido diretamente em um processo em funcionamento. Contudo, apesar de se mostrar bastante promissora, a aplicação bem sucedida dessa tecnologia requer que sejam satisfeitas algumas condições. A primeira delas e a mais simples é que o sistema seja controlável. A segunda condição, de maior relevância, estabelece que a planta seja estável em malha aberta, o que não é muito comum em sistemas dinâmicos complexos não-lineares. Por esse motivo, [9] explica que no caso dessa condição não ser satisfeita, faz-se necessário inserir previamente algum tipo de controlador ou atuar de alguma maneira para garantir essa condição. Dessa forma, frente aos prós e contras do controle MFA, pode-se questionar a respeito da aplicabilidade dessa tecnologia. Ao mesmo tempo em que não é necessário nenhum processo de identificação e o controle possui fácil adaptação, tem-se um fator principal que limita sua vasta aplicação, que é a necessidade de estabilidade da planta em malha aberta. Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 405

Upload: duonghuong

Post on 19-Oct-2018

221 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

1

CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA PLATAFORMA MÓVEL

UTILIZANDO PID E MFAC (MODEL-FREE ADAPTIVE CONTROL)

Gabriel Vendramini 1, Paulo Sérgio da Silva

2

1 DEE – FEB – UNESP, Bauru, Brasil, [email protected]

2 DEE – FEB – UNESP, Bauru, Brasil, [email protected]

Resumo: O sistema de um pêndulo invertido, por apresentar características dinâmicas intrinsecamente instáveis, tem sido estudado como planta alvo para avaliar o desempenho de diferentes técnicas de controle. O presente trabalho apresenta a modelagem, a simulação e o controle de um sistema composto de um pêndulo invertido sobre uma plataforma móvel descrevendo trajetória unidimensional, em que o objetivo consiste em controlar duas variáveis simultaneamente: o deslocamento angular do pêndulo e o deslocamento linear da plataforma. Para isso, utiliza-se técnicas clássicas e desenvolve-se um controle inteligente adaptativo, chamado MFA (Model-Free Adaptive). Keywords: Pêndulo invertido móvel, sistema não-linear, controle adaptativo, MFAC (Model-Free Adaptive Control).

1. INTRODUÇÃO

O problema do pêndulo invertido, apesar de se tratar um sistema mecânico bastante simples, representa várias situações práticas que podem ser analisadas a partir dos conceitos envolvidos em seu estudo. Particularmente, o conceito de pêndulo invertido móvel tem sido utilizado em várias aplicações como, por exemplo, veículo de transporte humano, o que futuramente pode se apresentar como alternativa de transporte automático para áreas urbanas [1], incluindo sua utilização por deficientes físicos.

Além disso, estudos de robôs autônomos baseados nesse conceito têm sido realizados pela NASA, apresentando resultados significativos, como os encontrados em [2].

Segundo [3], o sistema do pêndulo invertido possui características dinâmicas intrinsecamente instáveis, o que possibilita o estudo de diversas arquiteturas e tipos de controladores, desde as clássicas até controladores híbridos e/ou baseados em Inteligência Artificial (IA), servindo assim, de sistema alvo para que tais técnicas possam ser colocadas à prova.

No tocante ao controle clássico, os compensadores PID (Proporcional-Integral-Derivativo) ainda se apresentam como uma primeira alternativa para o controle de sistemas SISO (Single Input Single Output). No entanto, esses controladores se baseiam em modelos linearizados da planta a ser controlada, o que, segundo [4], pode representar perda de informações importantes para sistemas com altos níveis de exigências.

Normalmente, tal controlador é projetado para trabalhar em certo ponto de operação (set point) através do ajuste de seus parâmetros (ganhos proporcional, integral e derivativo). Por conseguinte, se ocorrer mudanças que modifiquem o ponto de operação do sistema, como alteração da condição inicial, variações de parâmetros físicos da planta e perturbações externas, o controlador PID pode não mais apresentar desempenho satisfatório.

Dessa forma, [5] destaca que a utilização de redes neurais é bastante promissora e atraente em casos que apresentam não-linearidade, incertezas, variações de parâmetros ou até mesmo quando se desconhece a dinâmica da planta.

Nesse contexto, o controle adaptativo MFA (Model-

Free Adaptive) apresentado em duas patentes por Cheng em [6] e [7], utiliza as redes neurais como elemento chave e tem se apresentado como uma nova tecnologia na área de controle e automação. O objetivo desse controlador é ajustar automaticamente seus parâmetros internos, ou seja, se adaptar continuamente, para garantir que o sistema opere com desempenho satisfatório em vários pontos de operação e sob diversas condições. Adicionalmente, apesar de ser baseado em uma RNA, [8] enfatizam que não há a necessidade de serem aplicados sinais de testes para um processo de treinamento antes da sua validação como em uma RNA convencional, ou seja, o controlador pode ser inserido diretamente em um processo em funcionamento.

Contudo, apesar de se mostrar bastante promissora, a aplicação bem sucedida dessa tecnologia requer que sejam satisfeitas algumas condições. A primeira delas e a mais simples é que o sistema seja controlável. A segunda condição, de maior relevância, estabelece que a planta seja estável em malha aberta, o que não é muito comum em sistemas dinâmicos complexos não-lineares. Por esse motivo, [9] explica que no caso dessa condição não ser satisfeita, faz-se necessário inserir previamente algum tipo de controlador ou atuar de alguma maneira para garantir essa condição.

Dessa forma, frente aos prós e contras do controle MFA, pode-se questionar a respeito da aplicabilidade dessa tecnologia. Ao mesmo tempo em que não é necessário nenhum processo de identificação e o controle possui fácil adaptação, tem-se um fator principal que limita sua vasta aplicação, que é a necessidade de estabilidade da planta em malha aberta.

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 405

Page 2: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

Controle de um Pêndulo Invertido sobre uma Plataforma Móvel Utilizando PID e MFAC (Model-Free Adaptive Control) Gabriel Vendramini, Paulo Sérgio da Silva

2

2. OBJETIVO

Para o presente trabalho, o objetivo é a modelagem, simulação e controle de um sistema composto de um pêndulo invertido sobre uma plataforma móvel, que deve descrever uma trajetória unidimensional.

Como a planta em análise é instável, projeta-se inicialmente dois compensadores lineares PID para estabilizar previamente o sistema e em seguida, como enfoque principal, desenvolve-se um controle MFA adaptativo, o qual atua de maneira complementar.

Dessa forma, o objetivo é avaliar a resposta do sistema, submetido às técnicas de controle mencionadas, através de alguns critérios de desempenho pré-definidos, como tempos de pico e de assentamento. Além disso, o objetivo é verificar qual técnica (isolada ou em conjunto) apresenta melhor sensibilidade e robustez a variações de parâmetros e a condições iniciais que podem ocorrer no sistema.

3. MÉTODOS

Para desenvolver os algoritmos de controle e realizar as análises necessárias do sistema, faz-se uso do software MatLab e do seu ambiente de simulação Simulink.

O sistema proposto envolve uma plataforma com liberdade de movimento paralelo ao eixo x de um plano cartesiano. Sobre a plataforma, o pêndulo é fixado pela sua extremidade inferior em um ponto de articulação, obtendo assim, uma liberdade de movimento angular no plano xOy em torno desse ponto.

O deslocamento do conjunto para frente ou para trás é proporcionado pela intensidade e sentido de uma força, u(t), aplicada na direção do movimento, por um motor DC cujo eixo está acoplado à plataforma. Essa força também é responsável por manter o equilíbrio do pêndulo na posição vertical, contrabalanceando a sua dinâmica natural.

Com base em artigos de outros autores, particularmente os apresentados por [10] e [11], foram definidos os seguintes critérios de desempenho:

Pêndulo:

• tempo de assentamento máximo: 5s;

• máxima deflexão angular do pêndulo: 3º;

• tempo de pico máximo: 1s;

• coeficiente de amortecimento (ξ ) elevado, para se

evitar oscilações excessivas: 18,0 << ξ

Plataforma:

• tempo de assentamento máximo: 5s;

• erro máximo em regime: 2%.

3.1. Modelagem do Sistema

A estrutura e os parâmetros físicos do sistema do pêndulo invertido sobre uma plataforma móvel, propostos neste projeto, estão mostrados na Figura 1 e na Tabela 1.

Figura. 1. Sistema proposto

Onde:

Tabela 1. Dados do sistema proposto na Figura 1

Símbolo Descrição Valor CG Centro de gravidade do

pêndulo

l Distância entre uma extremidade e o centro de gravidade do pêndulo

0,3 m

M Massa da plataforma 0,8 kg

m Massa do pêndulo, uniformemente distribuída

0,2 kg

J Momento de inércia do pêndulo em relação ao CG

0,006 kg.m2

)(tu Força externa, contínua no tempo, aplicada pelo motor à plataforma

(N)

3.1.1. Modelo não-linear

Utilizando-se da mecânica Newtoniana, a modelagem do sistema resulta em um sistema de duas equações diferenciais:

( )

( )

2

2

( ) ( ) ( ( )) ( ) cos( ( )) ( ) ( )

( ) cos( ( )) ( ) ( ( )) ( )

M m x t u t mlsen t t ml t t bx t

J ml t ml t x t mglsen t c t

θ θ θ θ

θ θ θ θ

+ = − + −

+ = + −

(1)

Os parâmetros correspondentes ao sistema de equação (1) são apresentados na Tabela 2.

Tabela 2. Dados do sistema de equações (1).

Símbolo Descrição Valor

b Coeficiente de atrito entre plataforma e a superfície

0,15 N.s/m

c Coeficiente de atrito do entre pêndulo e seu eixo de fixação

0,002 N.m.s

g Aceleração da gravidade 9,81 m/s2

)(tθ Deslocamento angular do pêndulo

(rad)

)(tθ Velocidade angular do pêndulo

(rad/s)

)(tθ Aceleração angular do pêndulo

(rad/s2 )

)(tx Velocidade linear da plataforma

(m/s)

)(tx Aceleração linear da plataforma

(m/s2)

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 406

Page 3: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

3

3.1.2. Modelo linear

Como o intuito inicial consiste em projetar compensadores clássicos, faz-se necessário obter um modelo linearizado da planta. Dessa forma, assumindo que a mesma encontra-se na posição de equilíbrio estável desejado, em que a deflexão angular do pêndulo é muito pequena

( 0)( ≅tθ ), a linearização das equações diferenciais permite

obter as seguintes relações: )())(( ttsen θθ ≅ e

1))(cos( ≅tθ .

Dessa forma, o sistema de equações (1) se resume a:

( )( )

2 ( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

J ml t mlx t mgl t c t

M m x t u t ml t bx t

θ θ θ

θ

+ = + −

+ = + −

(2)

Aplicando a Transformada de Laplace ao sistema de equações diferenciais (2), é possível identificar duas funções em s da planta, convenientes para o estudo do sistema de controle:

bmglsmglabcsacabsa

sml

sU

s

−−+++=

])3([)]3()2([)1(

)(

)(

)(23

θ (3)

sbmglsmglabcsacabsa

mglscsa

sU

sX

)(])3([)]3()2([)1(

)()2(

)(

)(234

2

−−+++

−+=

(4)

Onde:

+=

+=

−++=

)(3

)(2

])())([(1

2

22

mMa

mlJa

mlmlJmMa

Com o intuito de tornar o estudo e o projeto mais

próximo do real, optou-se por utilizar um modelo de atuador, no caso, um motor DC para compor o sistema, sendo que este se mantém fixo durante todo o estudo.

3.2. Arquitetura do Sistema de Controle Proposto

A Figura 2 apresenta o sistema de controle proposto para o problema em questão, o qual é composto por duas malhas, uma para o controle do pêndulo (malha superior), por meio

de seu deslocamento angular )(tθ , e outra (malha inferior)

para controlar a posição linear da plataforma x(t).

Figura 2. Sistema de Controle proposto

Cada malha possui um sinal de realimentação (H1 e H2), que pode ser a própria saída ou uma função dela. No caso, a realimentação é tida como unitária.

O sistema ainda apresenta um sinal D(t) que representa a ação de distúrbios externos atuando como uma força aplicada à planta (pêndulo e plataforma).

A arquitetura apresentada é baseada nos artigos apresentados por [12] e [13], os quais utilizam uma malha de controle para cada saída desejada. Observa-se que o sinal de atuação de u(t) é regulado pela ação de dois compensadores atuando de forma conjunta.

3.3. Projeto dos Compensadores Lineares

Inicialmente utiliza-se dois compensadores lineares PID para o controle das duas variáveis de interesse, deslocamento angular e linear. No entanto, por se tratar de compensadores normalmente aplicados a sistemas SISO, a proposta de solução consiste em dividir o problema em dois subsistemas específicos de controle, um para cada saída desejada.

Inicialmente, analisa-se a malha superior para sintonizar o controlador 01 (C1), que é responsável pelo equilíbrio do pêndulo.

Figura 3. Malha para sintonia de C1

Após o ajuste de C1, ajusta-se o controlador 02 (C2),

responsável pelo deslocamento da plataforma )(tX , dada

uma trajetória de referência vttXr =)( , onde v é a

velocidade constante de deslocamento.

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 407

Page 4: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

Controle de um Pêndulo Invertido sobre uma Plataforma Móvel Utilizando PID e MFAC (Model-Free Adaptive Control) Gabriel Vendramini, Paulo Sérgio da Silva

4

Figura 4. Malha para sintonia de C2

Nota-se que o projeto de C2, designado para controlar a plataforma, está diretamente ligado à C1, pois a metodologia de solução propõe um encadeamento das ações, ou seja, primeiramente deve-se equilibrar o pêndulo e em seguida deslocar o conjunto a partir de uma referência. Dessa forma, a ação de controle final resulta em uma atuação conjunta dos dois compensadores.

Sendo assim, após diversos estudos e ajustes finos, encontrou-se, dentro das especificações pré-estabelecidas de desemenho, os seguintes controladores:

++= ss

sC )074,0(36,3

116,1)(1 (5)

s

ssC

)2,1(6,0)(2

+−= (6)

3.4. Desenvolvimento da Rede MFA

Em linhas gerais, o cerne da MFA consiste em uma rede neural artificial dinâmica, expandida para o processo em questão que necessita realizar uma ação de controle dado a realimentação de duas variáveis de interesse, constituindo assim um compensador MIMO (Multiple Input Multiple

Output).

3.4.1. Aspectos Gerais

Acerca de toda literatura científica e considerações empíricas que envolvem o uso de Redes Neurais Artificiais (RNAs) em problemas de controle e automação, é de extrema importância o estudo sobre o tipo mais adequado de rede neural que deve ser aplicada ao problema em questão.

Segundo [14] cita que é muito comum encontrar em trabalhos científicos o uso de redes neurais diretas e estáticas para solucionar problemas dinâmicos. Segundo o autor, esta abordagem causa dois inconvenientes: primeiramente, uma rede neural direta não consegue cobrir todos os diferentes estados de um sistema dinâmico, realizando um mapeamento dinâmico e, além disso, para cobrir todos os estados seria necessário utilizar uma rede direta muito grande, o que dificulta ou até impossibilita alcançar uma solução. De fato, as redes estáticas somente realizam um mapeamento estático, enquanto que os sistemas dinâmicos são sensitíveis à seqüência de apresentação.

Dessa forma, a utilização de uma rede neural, principalmente em problemas de controle, requer um estudo e um entendimento da dinâmica envolvida no sistema para que as ações de solução sejam direcionadas.

3.4.2. Arquitetura

Conforme citado anteriormente, como o sistema do pêndulo invertido é dinâmico, faz-se necessário a utilização de uma rede neural também dinâmica, pois estas permitem que características temporais do sistema sejam adicionadas e memorizadas.

Sendo assim, a maneira adotada para conferir memória e consequentemente dinamismo à rede neural é com a introdução de uma linha de atraso no tempo na entrada de uma rede direta, geralmente de multicamadas (MLP – Multi

Layer Perceptron). A Figura 5 mostra uma rede neural temporal TDNN

(Time Delay Neural Network), elemento principal da rede MFA.

Figura 5. Rede Neural Temporal

Onde a entrada x(n) que é sucessivamente atrasada no tempo pela estrutura z

-1 (atrasadores discretos).

Uma vez que o objetivo do projeto é controlar tanto a deflexão angular como o deslocamento linear, ou seja, o sistema de controle é do tipo MIMO, não é possível utilizar somente uma MFA no molde apresentado, a menos que sejam utilizadas duas MFAs, uma auxiliando cada controlador clássico e ao final sejam somados os dois sinais de controle.

Essa possibilidade de controle MIMO é apresentada nas patentes [6] e [7]. Contudo, nessa proposta as informações são processadas separadamente, ou seja, os pesos sinápticos das conexões não guardam informações das duas variáveis juntas, o que poderia ser mais interessante do ponto de vista de conhecimento distribuído e consequentemente robustez.

Dessa forma, criou-se uma configuração diferente, apresentada na Figura 6.

Figura 6. Arquitetura da Rede MFA

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 408

Page 5: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

5

Em suma, essa configuração permite que haja interligação entre as duas entradas, conferindo a toda rede informações combinadas das duas entradas. Nota-se que a rede MFA consiste em um controlador PI, em que os ganhos da parcela integral são constantemente ajustados a cada iteração n.

3.4.3. Algoritmo de Adaptação

Uma vantagem da utilização de uma MLP com atrasos é que podem ser utilizados, de maneira aproximada, os mesmos algoritmos utilizados no treinamento de uma RNA direta (estática). Dessa forma, o algoritmo apresentado é baseado no algoritmo descrito por Cheng, que consiste no algoritmo backpropagation. Contudo, algumas modificações foram acrescentadas com o intuito de melhorar o desempenho da rede.

Na primeira fase do algoritmo, cada elemento de

entrada do erro ( )(te ) é convertido em um sinal de erro

normalizado ( 1E ), através da unidade N(). Cada sinal de

erro normalizado flui através dos delays, constituindo um

conjunto de NE elementos discretos.

Como o papel da MFA neste sistema em particular é auxiliar um outro controlador, os erros não são inseridos diretamente na rede e, portanto, pode-se entender que

)()( nxne ii = . Além disso, como não se sabe a faixa de

valores em que a entrada da rede pode variar, pode-se entender o processo de normalização realizado como uma atenuação no sinal de entrada, como forma de garantir que a rede não sature no início de sua atuação, pois em outras situações os pesos são ajustados.

Dessa forma, cada elemento se conecta com todos os neurônios da camada seguinte através de uma matriz de

pesos sinapticos, com elementos ijw , sendo Ni ,...,1= e

Nj ,...,1= . Nota-se que é adicionado um valor de bias

constante em 1, resultando em um vetor jp dado por:

∑=

+=N

i

iijj nEnwnp1

1))(*)(()( (07)

Onde n denota a ésima

n iteração.

Uma vez calculado, esse vetor é filtrado por uma função

de ativação ϕ , da seguinte forma:

))(*(*)( npbanq jj ϕ= (08)

Novamente o processo se repete, ou seja, esses dados

resultantes são multiplicados por uma matriz de pesos jh .

No entanto, o valor de bias não é adicionado, resultando em:

= ∑

=

N

i

jj nqnhnr1

))(*)(()( ϕ (09)

Adicionalmente, o elemento )(nr passa por uma

segunda função de ativação ψ :

))(()( nrns ψ= (10)

Finalmente, a saída da rede é calculada da seguinte maneira:

)()()()( 21 nsneneny ++= (11)

Uma vez calculado o valor de saída na iteração n, inicia-se a segunda fase, na qual os pesos sinapticos são ajustados da seguinte forma:

∑=

−=∆N

k

kijjij nhnEnqnqnenSfbaw1

)(*)(*))(1(*)(*)(*)(***η

(12)

)(*)(*)(* nqnenSfh jj η=∆ (13)

Onde η é a taxa de aprendizado e )(nSf é uma

função que consiste no gradiente da saída do sistema y(n) em relação ao sinal de controle da MFA v(n), e representa a sensibilidade do processo em relação ao controle.

Teoricamente, tem-se que )(

)()(

nvny

nSf∂

∂= . No

entanto, segundo [6], uma vez que o processo é desconhecido, essa função também é. Isso é conhecido como “caixa preta” e deve ser resolvido para que o algoritmo se torne viável. Porém, segundo estudos realizados pelo autor da patente, se o sistema for estável em malha aberta, controlável e o tipo de ação de controle requerido não muda ao longo do sistema, a função Sf pode será substituída por uma constante diferente de zero, o que tornará o sistema estável, com sinais de atuação e saída limitados (BIBO – Bounded Input, Bounded Output).

Isso significa que, se o sistema satisfizer essas condições, não é necessário conhecimento de sua dinâmica, justificando o controle MFA sem obter o modelo do processo. Dessa forma, as equações de ajuste que realmente são utilizadas se resumem a:

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 409

Page 6: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

Controle de um Pêndulo Invertido sobre uma Plataforma Móvel Utilizando PID e MFAC (Model-Free Adaptive Control) Gabriel Vendramini, Paulo Sérgio da Silva

6

∑=

−=∆N

k

kijjij nhnEnqnqnebanw1

)(*)(*))(1(*)(*)(***)( η

(14)

)(*)(*)( nqnenh jj η=∆ (15)

Além desse ajuste, lança-se mão da utilização do momento, muito utilizado em algoritmos de aprendizado de

redes neurais. Este termo, representado por m , consiste em

uma porcentagem da atualização dos pesos (iteração n-1) anterior que é somado à atualização atual (iteração n). Dessa forma, adiciona-se respectivamente às equações anteriores os seguintes fatores:

)1(*)(' −∆=∆ nwmnw ijij (16)

)1(*)(' −∆=∆ nhmnh jj (17)

Destaca-se o valor do erro necessário para realizar a atualização dos pesos da rede. Como há dois erros, utiliza-se a média entre eles. Além disso, é importante observar que as funções de ativação utilizadas interferem nas equações de ajuste dos pesos e portanto devem ser cuidadosamente escolhidas. Neste trabalho, utilizou-se a função de ativação

ϕ como sendo a tipo sigmóide unipolar com 7159,1=a

e 3/2=b e a função ψ como sendo do tipo linear.

4. RESULTADOS

Inicialmente, apresenta-se as simulações do sistema controlado somente pelos compensadores clássicos. A Figura 10 apresenta o respectivo diagrama de blocos, no qual é utilizado o conjunto de equações não-lineares apresentadas em (1). O intuito de se utilizar essas equações é verificar a dinâmica de uma planta mais realista, descrita pelo modelo não-linear, compensada por controladores clássicos, os quais são baseados no modelo linearizado.

As Figuras de 7 a 9 apresentam as respostas do sistema (pêndulo e plataforma) em diferentes condições de operação.

Figura 7. Resposta a uma rampa de referência aplicada à plataforma

Figura 8. Resposta a um degrau de referência aplicado à plataforma

Figura 9. Resposta a um impulso de distúrbio aplicado em D(t) durante a trajetória

Dessa forma, verifica-se que o sistema apresentado cumpre sua função de descrever uma trajetória unidimensional, mantendo o pêndulo equilibrado na posição vertical.

No entanto, conforme estudos apresentados por [1], é possível utilizar um sistema baseado em um pêndulo invertido automático móvel para transporte urbano de pessoas. Neste caso, não se tem certeza de alguns parâmetros como altura, peso e centro de massa do ocupante.

Tendo em vista essa possível aplicação prática, verificou-se de que maneira o sistema se comporta quando se muda o peso e a altura (associados, respectivamente, ao peso e à altura do ocupante), mantendo, contudo, o seu centro de massa.

A Figura 11 apresenta a mesma situação da Figura 7, mas com as seguintes alterações nos parâmetros do pêndulo: massa m = 1,0 kg e metade do comprimento da haste l = 0,75 m.

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 410

Page 7: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

7

Figura 11. Resposta a uma rampa de referência aplicada à plataforma, com variação dos parâmetros do pêndulo

Adicionalmente, acrescentou-se um deslocamento angular inicial de 5º no pêndulo e verificou-se a resposta, apresentada na Figura 12.

Figura 12. Resposta a uma rampa de referência aplicada à plataforma, com variação dos parâmetros do pêndulo e na condição inicial de

deslocamento angular (5º)

Depois de obtidos os resultados do sistema somente controlado pelos compensadores lineares, avalia-se os mesmos desempenhos com o rede MFA inserida no sistema, e forma a atuar como controle auxiliar, uma vez que o sistema precisa ser estável para sua aplicação. A Figura 13 apresenta o diagrama de blocos do sistema e as Figuras de 14 a 16 apresentam as respostas do sistema (pêndulo e plataforma) em diferentes condições de operação

Figura 10. Diagrama de blocos do sistema simulado no ambiente Simulink com somente os compensadores clássicos

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 411

Page 8: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

Controle de um Pêndulo Invertido sobre uma Plataforma Móvel Utilizando PID e MFAC (Model-Free Adaptive Control) Gabriel Vendramini, Paulo Sérgio da Silva

8

Figura 14 – Resposta do sistema a uma rampa de referência aplicada à plataforma, com variação dos parâmetros do pêndulo

Figura 15 – Resposta do sistema a uma rampa de referência aplicada à plataform a, com variação dos parâmetros do pêndulo e na condição

inicial de deslocamento angular (5º)

Figura 16 – Resposta do sistema a uma rampa de referência aplicada à plataforma, com variação dos parâmetros do pêndulo e na condição

inicial de deslocamento angular (10º)

Além disso, outra variação dos parâmetros foi feita, da seguinte forma: altura do pêndulo: de 0,6 para 2,0 m e massa do pêndulo: de 0,2 para 1,2 kg. O resultado é apresentado na Figura 17.

Figura 13. Diagrama de blocos do sistema simulado no ambiente Simulink com a rede MFA

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 412

Page 9: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

9

Figura 17 – Resposta do sistema a uma rampa de referência aplicada à plataforma, com variação dos parâmetros do pêndulo e na condição

inicial de deslocamento angular (5º)

5. DISCUSSÃO

Inicialmente, no que diz respeito aos controladores clássicos, sabe-se que a utilização de controladores PID implica que um sistema de controle possua basicamente três condições: o sistema analisado deve ser do tipo SISO (Single Input Single Output), apresentar um ponto de operação (set-point) definido e possuir um modelo linear.

No entanto, para o problema estudado de um pêndulo invertido sobre uma plataforma móvel descrevendo trajetória unidimensional, apesar de o sistema estudado ser do tipo MIMO (Multiple Input Multiple Output), a metodologia adotada para o projeto dos controladores decompôs o problema total em dois subproblemas SISO interligados. Dentro das condições de projeto, os resultados mostraram que essa metodologia foi eficiente.

Numa primeira análise, as simulações do sistema indicaram que o objetivo de descrever uma trajetória unidimensional mantendo o pêndulo estável foi alcançado. A plataforma apresentou erro estacionário nulo e a deflexão angular, bem como o sobressinal, os tempos de assentamento e de pico do pêndulo, atenderam os critérios pré-estabelecidos.

Já numa segunda análise, verificou-se que o sistema de controle não é robusto somente controlado com PID e apresenta uma sensibilidade muito grande quando alguns parâmetros e as condições iniciais são alterados, e o set-

point é redefinido, não atingindo assim os critérios de desempenho pré-estabelecidos. Percebe-se que pelo menos os tempos de assentamento, sobressinal e amortecimento podem ser significativamente alterados quando se tem variações desse tipo.

Dessa forma, o objetivo da inserção da rede neural adaptativa foi que ela conseguisse responder de maneira adequada mesmo quando há variações de parâmetros da planta, o que se fez.

Através dos resultados apresentados, percebe-se que a MFA atuando como controlador auxiliar, mesmo em condições adversas daquelas projetadas, conferiu maior robustez à planta, como é mostrado nas Figuras 11 e 14, 12 e 15. O fato da MFA se apresentar neste projeto como controlador complementar se dá pelo motivo da planta ser instável e, nesta condição, somente o controlador MFA não é aplicável.

6. CONCLUSÃO

Conclui-se que a modelagem, a metodologia e o projeto dos controladores foram eficientes.

Em relação ao controle clássico, principalmente os compensadores PID, verificou-se que o processo de desenvolvimento requer que seja conhecido tanto o modelo quando os valores dos parâmetros correspondentes. Dessa forma, qualquer variação que possa ocorrer, como analisado anteriormente, requer uma nova análise.

Contudo, os resultados obtidos com a inserção da MFA foram totalmente satisfatórios, pois o controle MFA conseguiu ajustar a ação de controle mesmo quando os parâmetros da planta foram variados, o que não era possível somente com o controle clássico.

Isso mostra que estruturas adaptativas são eficazes e promissoras dentro do escopo de controle e automação de sistemas.

AGRADECIMENTOS

Os autores deste artigo expressam seus agradecimentos à FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo) pelo apoio e fomento concedidos à pesquisa, na forma de bolsa de Iniciação Científica.

REFERÊNCIAS

[1] Tirmant, H., Baloh, M., Vermeiren, L., Guerra, T. M. and Parent, M. (2002). B2, an alternative two wheeled vehicle for an automated urban transportation system. IEEE Intelligent Vehicle Symposium, 2: 594-603.

[2] Ambrose, R. O., Savely, R. T., Goza, S. M., et alii (2004). Mobile manipulation using NASA's Robonaut. IEEE Conference on Robotics and Automation, 2: 2104-2109.

[3] Miller III, W. T., Sutton, R. S. and Werbos, P. J. (1995). Neural Networks for Control.

[4] Drummond, A. D. C., Oliveira, K. C. D. and Bauchspiess, A. (1999). Estudo do Controle de Pêndulo Inverso sobre Carro utilizando Rede Neural de Base Radial. IV Brazilian Conference on Neural Networks, 320-325.

[5] Yoneyama, Y. e Nascimento Jr., C. L. (2000). Inteligência Artificial em Atomação e Controle, São

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 413

Page 10: CONTROLE DE UM PÊNDULO INVERTIDO SOBRE UMA … · adaptativo, chamado MFA (Model-Free Adaptive). da planta. ... Proceedings of the 9th Brazilian Conference on Dynamics Control and

Controle de um Pêndulo Invertido sobre uma Plataforma Móvel Utilizando PID e MFAC (Model-Free Adaptive Control) Gabriel Vendramini, Paulo Sérgio da Silva

10

Paulo: Edgard Blücher (co-edição FAPESP).

[6] Cheng, S. G. Model-free adaptive process control. Washington: United States Patent and Trademark Office of the United States Department of Commerce., 2000, Abril 25.

[7] Cheng, S. G. Model-free adaptive control for industrial processes. Washington: United States Patent and Trademark Office of the United States Department of Commerce., 2003, Abril 29.

[8] Hou, Z.; Huang, W. The model-free learning adaptive control of a class of SISO nonlinear systems. In: American Control Conference, 1997. Proceedings of the 1997. Anais... . v. 1, p.343-344 vol.1.

[9] Cheng. CyboSoft - MFA in Control, 2006. Disponível em <http://www.cybosoft.com>. Acessado em 15 Ago. 2009.

[10] Sultan, K. (2003). Inverted Pendulum: Analysis, Design and Implementation. IIEE Visionaries, 2003. Disponível em <http://anadrasis.web.auth.gr/pendulum/Inverted Pendulum.pdf>. Acessado em 07 jan. 2009.

[11] Carnegie Mellon. Control Tutorials for MATLAB and Simulink. Disponível em <http://www.engin.umich.edu/class/ctms/>. Acessado em 10 fev. 2009.

[12] Jung, S. and Kim, S. S. (2008). Control Experiment of a Wheel-Driven Mobile Inverted Pendulum Using Neural Network. IEEE Transactions on Control Systems Technology, 16: 297-303.

[13] Cho, H. and Jung, S. (2003). Neural network position tracking control of an inverted pendulum an X-Y table robot. IEEE/RSJ Conference on Intelligent Robots and Systems, 2: 1210-1215.

[14] Francheschi, A. S. M. D.; Barreto, J. M.; Roinsenberg, M. Desenvolvimento de Agentes Autônomos em gerência de Redes de Computadores. SBrT 2000 - XVIII Simpósio Brasileiro de Telecomunicações, 2000.

Proceedings of the 9th Brazilian Conference on Dynamics Control and their Applications Serra Negra, SP - ISSN 2178-3667 414