estimac˜ao de estados e parˆametros de um pˆendulo duplo

148
Universidade Federal de Minas Gerais Escola de Engenharia Programa de P´ os-Gradua¸ ao em Engenharia El´ etrica Laborat´ orio de Modelagem, An´ alise e Controle de Sistemas N˜ ao-Lineares Estima¸ ao de Estados e Parˆ ametros de um endulo Duplo Ca´ otico Disserta¸ c˜ao submetida ` a banca examinadora designada pelo Colegiado do Programa de os-Gradua¸c˜aoemEngenhariaEl´ etrica da Universidade Federal de Minas Gerais, como parte dos requisitos necess´arios ` a obten¸ c˜ao do grau de Mestre em Engenharia El´ etrica Edson Frederico de Aguiar Rezende Orientadores: Prof. Bruno Ot´avio Soares Teixeira, Dr. (UFMG) Prof. Leonardo Antˆonio Borges Tˆ orres, Dr. (UFMG) Belo Horizonte, Julho de 2011

Upload: others

Post on 23-Jul-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Universidade Federal de Minas Gerais

Escola de Engenharia

Programa de Pos-Graduacao em Engenharia Eletrica

Laboratorio de Modelagem, Analise e Controle de Sistemas Nao-Lineares

Estimacao de Estados e Parametros de umPendulo Duplo Caotico

Dissertacao submetida a banca examinadora

designada pelo Colegiado do Programa de

Pos-Graduacao em Engenharia Eletrica da

Universidade Federal de Minas Gerais, como

parte dos requisitos necessarios a obtencao

do grau de Mestre em Engenharia Eletrica

Edson Frederico de Aguiar Rezende

Orientadores:Prof. Bruno Otavio Soares Teixeira, Dr. (UFMG)

Prof. Leonardo Antonio Borges Torres, Dr. (UFMG)

Belo Horizonte, Julho de 2011

Page 2: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 3: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

i

Para tres grandes mulheres...

Polyane, minha amada,

Ana Maria, mae,

e Valeria, irma.

Page 4: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 5: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Resumo

A analise de sistemas dinamicos que apresentam comportamento caotico e um assunto

que atrai o interesse de muitos pesquisadores. Estudos relacionados a identificacao de sistemas

e a estimacao de estados sao importantes para que a dinamica de tais sistemas sejam bem

caracterizadas sob varios aspectos. Alem disso, estudos dessa natureza tornam-se desafiadores

principalmente por nao existir uma metodologia otima que possa ser aplicada a toda a classe

de sistemas caoticos.

Neste trabalho, investiga-se o pendulo duplo caotico existente no laboratorio de

Modelagem Analise e Controle de Sistemas Nao-Lineares do Departamento de Engenharia

Eletronica da Universidade Federal de Minas Gerais. Aplica-se uma ferramenta de filtragem

para sistemas nao lineares, chamada filtro de Kalman unscented, a fim de se obter estimativas

dos estados e de alguns parametros desse sistema de forma simultanea.

Sao conduzidos testes utilizando-se dados simulados e experimentais em que o desem-

penho do filtro e avaliado tanto para a estimacao so dos estados do modelo quanto para o caso

da estimacao conjunta de estados e parametros. Variando-se diversas condicoes do processo

de filtragem, como o tipo de medicoes e a esparcidade das medicoes, procura-se obter conhe-

cimento dos pontos fortes e fracos da ferramenta escolhida e em quais condicoes ela melhor se

adapta.

iii

Page 6: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 7: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Abstract

The analysis of dynamical systems that exhibit chaotic behavior is a subject that has

been attracting interests of many researchers. Studies related to system identification and

state estimation are important in order to achive a good characterization of the dynamics of

such systems on many aspects. Moreover, this kind of studies became challenging, essentially,

because there is no such an unified methodology to be applied to the whole class of chaotic

systems.

In this work, the chaotic double pendulum platform available at the laboratory of

Modeling, Analisys and Control of Nonlinear Systems from the Electronics Engineering De-

partment of the Federal University of Minas Gerais is investigated. We aim at applying

a nonlinear systems filtering tool, called unscented Kalman filter, to obtain simultaneously

state and some parameters estimates for this system simultaneously.

Experiments using simulated and experimental data are carried. The filter’s perfor-

mance is verified for the case of state estimation as well as for the case of joint state-and-

parameter estimation. Several conditions concerning the filtering process, such as the type of

measured states and measurement sparsity, are tested and the filters strengths and weaknesses

are studied for this application.

v

Page 8: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 9: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Agradecimentos

Cumprir este trabalho foi uma tarefa difıcil, porem, de muito valor pessoal. Acredito

que os estudos de base cientıfica ajudam o homem a perceber melhor outras belezas da vida.

Estudar sobre dinamicas nao-lineares, em especial, o caos, muitas vezes me levou a reparar

que nossas vidas estao organizadas sobre essas bases. A imagem que temos de nos mesmos e

do proximo seriam como os modelos matematicos. Muitas vezes usamos esses modelos para

prever uma proxima atitude ou para estimar pensamentos e desejos nossos ou alheios.

Pequenos erros na vida podem nos conduzir a caminhos muito diferentes. Mas com

este trabalho aprendi que, se quisermos manter proximos do nosso estado ideal para o qual

fomos projetados, proximos da nossa alma, proximos daquilo que Deus sonhou para nos,

mesmo que tenhamos um modelo sobre nos mesmos imperfeito, por meio de uma apropriada

assimilacao de dados, podemos conseguir isso. E existem fontes de dados que nos ajudam. A

Bıblia, nossos amigos, nossa historia e a beleza da natureza.

Gostaria muito de agradecer a Deus pelo dom da vida! Agradeco aos meus orienta-

dores, professores Bruno Teixeira e Leonardo Torres, pela compreensao e pelos ensinamentos.

Alem disso, agradeco ao Leo por ter me dado boas vindas ao mestrado ajudando-me a de-

senvolver a proposta de trabalho. E, em especial ao Bruno, com o qual me mantive mais

proximo, por exigir que eu melhorasse a escrita do texto e pela paciencia em ver meus erros.

Agradeco a um dos membros da banca de defesa, o professor Luıs Aguirre, por me

apoiar em um dos momentos mais difıceis do mestrado quando achei que iria desistir. Nao so

pelo apoio mas tambem pelas conversas de cunho espiritual.

Agradeco a minha famılia, minha mae, Ana Maria, minha irma, Valeria, e minha

docura, Polyane, que precisou suportar meus momentos de estresse e de abdicacao de afazeres

domesticos como arrumar o quarto, tirar o monte de artigos e livros da mesa, fazer a barba e

lavar o carro. Obrigado pelo apoio de voces! Agradeco ao meu tio, Antonio, pelas oracoes.

Agradeco, tambem, a Coordenacao de Aperfeicoamento de Pesquisa de Nıvel Superior

vii

Page 10: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

viii

(CAPES), pela concessao de bolsa de mestrado, e a Fundacao de Amparo a Pesquisa de Minas

Gerais (FAPEMIG), pelo apoio financeiro.

Page 11: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Conteudo

Lista de Tabelas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii

Lista de Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xix

1 Introducao 1

1.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Relevancia e Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Estrutura da Dissertacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Estimacao de Estados de Sistemas Nao-Lineares 7

2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Formulacao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.3 Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4 Estimadores de Estado para Sistemas Nao-Lineares . . . . . . . . . . . . . . . . 11

2.4.1 Filtro de Kalman Estendido . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4.2 Filtro de Kalman Unscented . . . . . . . . . . . . . . . . . . . . . . . . 12

2.5 Estimacao de Estados com Restricoes para Sistemas Nao-Lineares . . . . . . . 14

2.5.1 Filtro de Kalman Unscented com Restricoes de Intervalo . . . . . . . . . 15

2.6 Estimacao Conjunta de Estados e Parametros . . . . . . . . . . . . . . . . . . . 16

3 Descricao do Sistema 21

3.1 Plataforma Experimental do Pendulo Duplo . . . . . . . . . . . . . . . . . . . . 21

3.1.1 O Aparato Mecanico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.1.2 Subsistema de Medicao . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1.3 Subsistema de Acionamento . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.1.4 Subsistema de Interface e Coleta de Dados . . . . . . . . . . . . . . . . 26

3.2 Modelagem Fenomenologica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

ix

Page 12: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

x

3.2.1 Modelagem sem Forcas . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.2 Modelagem com Forcas . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

3.2.3 Modelagem Completa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.3 Caracterizacao Dinamica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.3.1 O Caos e a Imprevisibilidade . . . . . . . . . . . . . . . . . . . . . . . . 41

4 Medicao dos Angulos do Pendulo usando Processamento de Imagens 45

4.1 Definicao do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2 Parametrizacao de Imagens Digitais . . . . . . . . . . . . . . . . . . . . . . . . 47

4.3 Metodos de Processamento de Imagem . . . . . . . . . . . . . . . . . . . . . . . 51

4.3.1 Realce da Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.3.2 Segmentacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.4 Algoritmo de Processamento de Imagem Implementado . . . . . . . . . . . . . 58

5 Questoes Praticas de Implementacao 61

5.1 Verificacoes Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.1.1 Analise Estatica e Dinamica do Sensor de Velocidade Angular . . . . . . 62

5.1.2 Obtencao de Estimativas Iniciais para os Coeficientes de Atrito . . . . . 65

5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kal-

man . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.2.1 Utilizando Estimadores de Tempo Discreto para Estimar Estados de um

Sistema Modelado por Equacoes Diferenciais . . . . . . . . . . . . . . . 66

5.2.2 Multiplas Taxas de Amostragem . . . . . . . . . . . . . . . . . . . . . . 68

5.2.3 Restricao Intervalar na Posicao Angular . . . . . . . . . . . . . . . . . . 69

5.2.4 Simetria da Matriz de Covariancia . . . . . . . . . . . . . . . . . . . . . 71

5.3 Avaliacao de Desempenho de Estimadores de Estado . . . . . . . . . . . . . . . 73

5.4 Sintonia de Estimadores de Estado . . . . . . . . . . . . . . . . . . . . . . . . . 76

6 Resultados 83

6.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

6.2 Resultados Simulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

6.2.1 Efeito dos Tipos de Medicoes . . . . . . . . . . . . . . . . . . . . . . . . 86

6.2.2 Efeito do Nıvel de Ruıdo . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

6.2.3 Efeito da Taxa de Amostragem . . . . . . . . . . . . . . . . . . . . . . . 90

Page 13: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

xi

6.2.4 Estimacao Conjunta de Estados e Parametros . . . . . . . . . . . . . . . 93

6.3 Resultados Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

6.3.1 Estimacao de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

6.3.2 Estimacao Conjunta de Estados e Parametros . . . . . . . . . . . . . . . 104

7 Conclusoes e Propostas de Continuidade 111

7.1 Discussao e Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

7.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

Referencias Bibliograficas 115

Page 14: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 15: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Lista de Tabelas

3.1 Caracterısticas gerais da camera DR2-03S2M/C-EX-CS . . . . . . . . . . . . . 25

3.2 Resumo do funcionamento do sistema de acionamento . . . . . . . . . . . . . . 26

3.3 Parametros do modelo do pendulo duplo . . . . . . . . . . . . . . . . . . . . . . 38

5.1 Parametros do modelo de simulacao e predicao do Pendulo Duplo utilizados

nos testes simulados e experimentais . . . . . . . . . . . . . . . . . . . . . . . . 72

6.1 Sumario das condicoes possıveis de serem variadas nos testes . . . . . . . . . . 86

6.2 Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes

para estimacao conjunta de estados e parametros do pendulo duplo caotico

para quatro casos diferentes de nıvel de ruıdo nas observacoes . . . . . . . . . . 98

6.3 Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes

para estimacao conjunta de estados e parametros do pendulo duplo caotico

para quatro casos diferentes de nıvel de ruıdo nas observacoes . . . . . . . . . . 99

xiii

Page 16: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 17: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Lista de Figuras

1.1 Visao geral da proposta de trabalho . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Diagrama do algoritmo computacional desenvolvido . . . . . . . . . . . . . . . 6

3.1 Representacao da bancada de estudos . . . . . . . . . . . . . . . . . . . . . . . 22

3.2 O aparato mecanico do pendulo duplo . . . . . . . . . . . . . . . . . . . . . . . 23

3.3 Camera digital utilizada no sistema de medicao baseado em visao computacional 25

3.4 Sensor de limiar, S2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.5 Interface grafica para aquisicao da velocidade angular da haste 1 . . . . . . . . 27

3.6 Ilustracao da montagem do aparato que contem a camera que faz a filmagem

do movimento do pendulo duplo caotico . . . . . . . . . . . . . . . . . . . . . . 28

3.7 Arquivos gerados pelo sistema de sincronismo de dados experimentais . . . . . 29

3.8 Diagrama esquematico do pendulo duplo experimental para o caso conservativo 31

3.9 Diagrama de corpo livre das hastes do pendulo duplo . . . . . . . . . . . . . . . 36

3.10 Simulacao livre do modelo do pendulo duplo . . . . . . . . . . . . . . . . . . . . 39

3.11 Retrato de fases da haste 1 com dados simulados . . . . . . . . . . . . . . . . . 41

3.12 Retrato de fases da haste 2 com dados simulados . . . . . . . . . . . . . . . . . 41

3.13 Mostra da sensibilidade a condicoes iniciais exibida pelo modelo do pendulo duplo 42

4.1 Imagem amostrada de um vıdeo produzido pela camera digital utilizada para

o sensoriamento do movimento das hastes do pendulo duplo . . . . . . . . . . . 46

4.2 Representacao da imagem digital como uma matriz . . . . . . . . . . . . . . . . 48

4.3 Ilustracao hipotetica de um processo de formacao de imagem digital a partir

da imagem natural de um objeto . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.4 Componentes da percepcao visual segundo os modelos de cor HSI e RGB . . . 50

4.5 Formacao de uma imagem no modelo de cor RGB . . . . . . . . . . . . . . . . 50

4.6 Etapas de realce da imagem do pendulo duplo . . . . . . . . . . . . . . . . . . . 53

xv

Page 18: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

xvi

4.7 Histogramas antes e pos filtragem da imagem digital do pendulo duplo . . . . . 54

4.8 Histogramas antes e pos realce de contraste da imagem digital do pendulo duplo 55

4.9 Decomposicao de imagem nas camadas I1, I2 e I3 . . . . . . . . . . . . . . . . 56

4.10 Superfıcie gerada pela intensidade da componente I2 avaliada em cada ponto

da imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.11 Imagem segmentada por meio de uma funcao de limiar . . . . . . . . . . . . . . 57

4.12 Superfıcie de similaridade gerada pelo calculo da distancia euclidiana no espaco

I1I2I3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.13 Superfıcie de similaridade segmentada por uma funcao de limiar . . . . . . . . 58

4.14 Fluxograma do algoritmo de processamento de imagens . . . . . . . . . . . . . 59

4.15 Serie temporal experimental produzida pelo algoritmo de processamento de

imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.1 Series temporais da velocidade angular da haste 1 . . . . . . . . . . . . . . . . . 62

5.2 Retrato de fases construıdos com dados das medicoes, amostradas em 25 ms,

da velocidade angular e da posicao angular da haste 1 . . . . . . . . . . . . . . 64

5.3 Series temporais da velocidade angular da haste 1 . . . . . . . . . . . . . . . . . 64

5.4 Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 1 65

5.5 Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 2 66

5.6 Representacao da disponibilidade de medicoes do pendulo duplo, pelos sensores,

ao longo do tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.7 Esquema do estimador utilizado para tratar o caso de multiplas frequencias de

amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

5.8 Estados do pendulo duplo estimados pelo UKF em um caso em que apenas a

velocidade angular da haste 1 e medida, sem ruıdo, e nao e feita a conversao

nas estimativas dos estados das posicoes angulares para a faixa [−180, + 180] 70

5.9 Estimativas da posicao angular da haste 2 do pendulo duplo medindo-se apenas

a velocidade angular da haste 1, sem ruıdo . . . . . . . . . . . . . . . . . . . . . 71

5.10 Aproximacao da PDF nao-Gaussiana por PDFs Gaussianas . . . . . . . . . . . 75

5.11 Caso ideal de estimacao de estados do pendulo simples nao linear utilizando o

UKF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

Page 19: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

xvii

5.12 Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF

em que a matriz de covariancia do ruıdo de processo e conhecida e a matriz de

covariancia do ruıdo de medicao corresponde a 0,001 Rk . . . . . . . . . . . . . 80

5.13 Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF

em que a matriz de covariancia do ruıdo de medicao e conhecida e a matriz de

covariancia do ruıdo de processo corresponde a 0,001 Qk−1 . . . . . . . . . . . . 81

5.14 Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF

em que as matrizes de covariancia dos ruıdos de medicao e de processo sao

desconhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

6.1 Comparacao do erro de estimacao dos estados θ1,θ1,θ2 e θ2 estimados pelo

UFK-π e IUKF. E medida apenas a velocidade angular da haste 1 com ruıdo

tal que SNRθ1≈ 26dB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

6.2 Efeito da inclusao da medicao das posicoes angulares para os estimadores . . . 88

6.3 Comparacao do ındice RMSE da estimacao dos estados do pendulo duplo, ao

se utilizar o UKF-π, para sete casos diferentes de configuracao do vetor de

medicao yk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

6.4 Comparacao do ındice RMSE da estimacao dos estados do pendulo duplo, ao se

utilizar o IUKF, para sete casos diferentes de configuracao do vetor de medicao

yk. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

6.5 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro

UKF-π para dois nıveis diferentes de ruıdo nos dados da posicao angular . . . . 91

6.6 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro

IUKF para dois nıveis diferentes de ruıdo nos dados da posicao angular . . . . 91

6.7 Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20

realizacoes para estimacao dos estados do pendulo duplo caotico a partir da

medicao de θ1, θ1 e θ2 sob diferentes nıveis de ruıdo. . . . . . . . . . . . . . . . 92

6.8 Medias do ındice RMSE normalizados para uma simulacao Monte-Carlo com

20 realizacoes para estimacao dos estados do pendulo duplo caotico a partir da

medicao de θ1 e θ2 sob diferentes nıveis de ruıdo . . . . . . . . . . . . . . . . . 92

6.9 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro

UKF-π para duas taxas diferentes de aquisicao de dados da posicao angular . . 93

Page 20: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

xviii

6.10 Erro da estimacao do estado nao medido, θ2, resultado da estimacao do filtro

IUKF para duas taxas diferentes de aquisicao de dados da posicao angular . . . 94

6.11 Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20

realizacoes para estimacao dos estados do pendulo duplo caotico a partir da

medicao de θ1, θ1 e θ2 sob diferentes taxas de amostragem. . . . . . . . . . . . 94

6.12 Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20

realizacoes para estimacao dos estados do pendulo duplo caotico a partir da

medicao de θ1 e θ2 sob diferentes taxas de amostragem. . . . . . . . . . . . . . 95

6.13 Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com

dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo

com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida . . . . . 96

6.14 Resultado, do IUKF, para estimacao conjunta de estados e parametros, com

dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo

com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida . . . . . 97

6.15 Erro de estimacao dos dois parametros estimados, b1 e b2 e do estado nao

medido, θ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

6.16 Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas do

pendulo duplo, para diferentes relacoes sinal-ruıdo das medicoes das posicoes

angulares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

6.17 Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas

do pendulo duplo, para diferentes taxas de aquisicao das posicoes angulares. . . 100

6.18 Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do

sistema. Sao utilizados dados simulados, medindo-se as posicoes angulares a

uma taxa de 20 Hz e ruıdo com desvio padrao σθ = 2 . A velocidade angular

da haste 1 e medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.19 Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do

sistema. Sao utilizados dados simulados, medindo-se as posicoes angulares a

uma taxa de 20 Hz e ruıdo com desvio padrao σθ = 2 . A velocidade angular

da haste 1 e medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

6.20 Comparacao do sinal de inovacao do UFK-π e IUKF para o caso experimental

de estimacao de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

6.21 Retrato de fases da haste 1 e da haste 2 construıdo com os estados estimados

pelo IUKF a partir de dados experimentais coletados do pendulo duplo . . . . . 105

Page 21: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

xix

6.22 Estimativas das velocidades angulares, dadas pelo UKF-π a partir de dados

experimentais sob duas condicoes . . . . . . . . . . . . . . . . . . . . . . . . . . 106

6.23 Estimativas das velocidades angulares, dadas pelo IUKF a partir de dados

experimentais sib duas condicoes . . . . . . . . . . . . . . . . . . . . . . . . . . 106

6.24 Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com

dados experimentais, medindo-se, alem da velocidade angular da haste 1, as

posicoes angulares a uma taxa de 40 Hz . . . . . . . . . . . . . . . . . . . . . . 107

6.25 Resultado, do IUKF, para estimacao conjunta de estados e parametros, com

dados experimentais, medindo-se, alem da velocidade angular da haste 1, as

posicoes angulares a uma taxa de 40 Hz . . . . . . . . . . . . . . . . . . . . . . 108

6.26 Comparacao do sinal de inovacao do UFK-π e IUKF para o caso experimental

de estimacao conjunta de estados e parametros . . . . . . . . . . . . . . . . . . 109

Page 22: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 23: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Lista de Sımbolos e Abreviacoes

Sımbolos

N: conjunto de numeros inteiros nao negativos;

Z: conjunto de numeros inteiros;

R: conjunto de numeros reais;

∈: e um elemento de;

,: igual por definicao;

0n×m: matriz de zeros n×m;

1n×m: matriz unitaria n×m;

In: matriz identidade n× n;

AT: transposta de A;

A−1: inversa de A;

A1/2: raız quadrada de Cholesky de A;

A(i,j): elemento (i,j) de A;

E[·]: esperanca matematica;

σx: desvio padrao da variavel aleatoria x;

f : modelo de processo, ou modelo dinamico, nao-linear;

h: mapa de medicao, ou modelo de observacao, nao-linear;

k: ındice de tempo-discreto;

xk: vetor de estados;

yk: vetor de observacoes ou vetor de saıdas medidas;

wk−1: vetor de ruıdo de processo;

νk: vetor de ruıdo de medicao;

xxi

Page 24: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

xxii

Ak−1,Ck: matrizes do modelo linear em espaco de estados;

Ak−1,Ck: Jacobianas do modelo linear em espaco de estados;

Qk−1: matriz de covariancia do ruıdo de processo;

Rk: matriz de covariancia do ruıdo de medicao;

xk|k−1: estimativa de estado na predicao;

xk|k: estimativa de estado na assimilacao de dados;

xk−1|k−1:

ρ(x|y): funcao densidade de probabilidade condicional de x dado y;

ρ(xk|y1, · · · , yk): densidade de estado a posteriori ;

P xxk|k−1: matriz de covariancia do erro de predicao;

P xxk|k: matriz de covariancia do erro de assimilacao de dados;

P yyk|k−1: matriz de covariancia de inovacao;

P xyk|k−1: matriz de covariancia cruzada;

Kk: ganho de Kalman no instante k;

X|,‖|‖: j-esima coluna da matriz de pontos sigma X‖|‖;

γ(m),γ(c): vetor de pesos para o calculo da estimativa de estado e covariancia do erro;

ΨUT: funcao da transformacao unscented que produz X‖|‖, γ(m) e γ(c);

Abreviacoes

KF: Filtro de Kalman;

EKF: Filtro de Kalman Estendido;

EKF2: Filtro de Kalman Estendido de 2 Ordem;

CKF: Filtro de Kalman Cubature;

UKF: Filtro de Kalman Unscented ;

IUKF: Filtro de Kalman Unscented com Restricoes de Intervalo;

PDF: Funcao Densidade de Probabilidade;

RMSE: Raız do Erro Medio Quadratico;

UT: Transformada Unscented ;

MAP: Maxima a Posteriori;

ML: Maxima Verossimilhanca;

MEV: Mınima Variancia;

Page 25: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Capıtulo 1

Introducao

“Como sempre acontece no sertao,os profetas da chuva foram os primeiros a ler o mau pressagio nas

sutilezas da propria natureza: formigas que em pleno mes de marco nao mudam formigueiro para

longe das margens de rios e acudes, aranhas que insistem em tecer fios rentes ao solo, rolinhas que ao

por os ovos trocam o galho mais alto da arvore por ninhos junto ao chao. Para a sabedoria matuta,

sinais inconfundıveis da destida.”

Lira Neto, em Padre Cıcero

1.1 Motivacao

O estudo do caos tem seu inıcio no final do seculo XIX, por Poincare, e uma das

primeiras publicacoes sobre o assunto foi feita por Edward Lorenz, ja na decada de 1960.

Lorenz trabalhava na tentativa de prever as condicoes meteorologicas para um perıodo de

tempo nao muito curto quando, ao truncar o valor da condicao inicial da sua simulacao,

percebeu que os resultados saıram completamente diferentes. De fato, tal sensibilidade e a

caracterıstica prima dos sistemas, posteriormente chamados, caoticos (Monteiro, 2006).

Investigar as propriedades dos sistemas caoticos e seus potenciais de aplicacao em

varios ramos da engenharia, como controle, comunicacao e processamento de sinais, e algo de

interesse para comunidades matematicas, fısicas e de engenharia (Richard, 1992).

O ponto de partida para tais estudos e a analise das series temporais geradas pelos

sistemas caoticos (Xiaolin e Guangrui, 1998). Segundo Abarbanel e colaboradores (1993), na

analise de dados de sistemas caoticos, tendo uma unica serie temporal observada do sistema,

surgem quatro tarefas importantes: (1) construir modelos (identificacao de sistemas), (2)

reconstruir o espaco de fases (ou espaco de estados), (3) separar o sinal do ruıdo (reducao

de ruıdo) e (4) classificar o sinal (calculo de invariantes dinamicos). Essas analises requerem

metodos nao-lineares de processamento de sinais.

Page 26: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

2 1 Introducao

Tanto para a modelagem quanto para a reconstrucao do espaco de fases e para o

calculo dos invariantes dinamicos, a reducao de ruıdo desempenha um papel essencial (Grass-

berger et al., 1993; Aguirre e Billings, 1995). A escolha do metodo para reducao de ruıdo

tambem e um fator decisivo. Por exemplo, a dimensao de Lyapunov calculada a partir de

series temporais ruidosas pode ficar comprometida se for utilizado o filtro linear de resposta ao

impulso infinita (Salapaka et al., 1997). Grassberger e colaboradores (1993) revisam metodos

de reducao de ruıdo baseados em coordenadas de atraso. Schreiber (1993) propoe um metodo

de reducao de ruıdo, para series temporais curtas, de baixo consumo de tempo de execucao e

memoria. Ele tambem baseia-se em coordenadas de atraso e faz uma observacao de que tanto

valores passados quanto futuros das coordenadas sao utilizados. Alternativamente, a reducao

de ruıdo pode ser feita por algum metodo de filtragem, que, por outro lado, nao requer o

uso de dados futuros. Aguirre e Billings (1995) utilizam um filtro nao-linear, baseado em um

modelo de predicao, para auxiliar no problema de identificacao de modelos a partir de dados

obtidos de um sistema caotico. Walker e Mess (1996) apresentam uma solucao para a reducao

de ruıdo de sistemas caoticos baseado no filtro de Kalman, que tambem utiliza um modelo de

predicao.

A vantagem da filtragem baseada em modelo e que ela pode, em muitos casos, resolver,

simultanteamente, o problema de identificacao de sistema e o da filtragem do ruıdo da serie

observada e o desafio se torna ainda maior quando nao e possıvel medir todos os componentes

de estado do modelo (Aguirre et al., 2005; Sitz et al., 2002; Voss et al., 2004).

Um cuidado com os metodos de filtragem para sistemas nao-lineares e que muitos deles

foram derivados de outros que trabalham muito bem para sistemas lineares. Por isso, ao serem

aplicados a sistemas fortemente nao-lineares, podem nao produzir resultados satisfatorios,

tornando o desafio maior ainda (Evensen, 1997).

Um metodo que tem demonstrado muito potencial como estimador, simultaneo, de

estados e parametros de sistemas nao-lineares e o filtro de Kalman unscented (UKF) (Sitz

et al., 2004; Merwe et al., 2004). Motivado pelos resultados promissores do UKF para sis-

temas nao-lineares, pretende-se, neste trabalho, responder a seguinte questao levantada por

So e colaboradores (1994) no inıcio do seu trabalho: “...digamos que se tenha um sistema

mecanico consistindo de alavancas interconectadas, engrenagens, molas, etc., e esse sistema

esta comportando caoticamente sobre um atrator de dimensao nao tao alta. E possıvel deduzir

a posicao de todas as partes do sistema a partir da observacao da serie temporal da posicao

de apenas uma das alavancas?”.

Page 27: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

1.2 Relevancia e Justificativa 3

No caso deste trabalho, o sistema mecanico e o pendulo duplo da plataforma experi-

mental localizada no laboratorio de Modelagem Analise e Controle de Sistemas Nao-Lineares

(MACSIN) da UFMG.

1.2 Relevancia e Justificativa

Desde a verificacao de Lorenz, mencionada na Secao 1.1, o comportamento caotico

de sistemas fısicos tem sido extensivamente analisado (de Paula et al., 2006). Um exemplo

de sistema fısico que pode exibir comportamento caotico e tem atraıdo bastante atencao dos

pesquisadores, instigando tanto estudos tecnologicos quanto cientıficos, e o pendulo nao-linear.

A analise de bifurcacao e do caos em um pendulo nao-linear experimental ja foi relatada em

alguns estudos (de Paula et al., 2006). Alias, o interesse no estudo do pendulo e antigo e,

durante a historia das ciencias naturais, muitos estudos foram empenhados analisando a sua

dinamica (Awrejcewicz et al., 2007), principalmente com relacao a fenomenos oscilatorios.

O pendulo e uma construcao mecanica simples que esta associada com a medicao de

tempo, dispositivos de estabilizacao, aplicacoes de balıstica (de Paula et al., 2006). Pode-

se utiliza-lo, tambem, para modelar o comportamento de bracos roboticos flexıveis (pendulo

duplo) (Kiyoumarsi et al., 2007) e tambem o sistema de eixo-de-manivelas do pistao de um

motor de combustao monocilındrico (pendulo triplo) (Awrejcewicz et al., 2007). Alem disso,

o pendulo serve como modelo de teste na area de controle automatico (Liu e Hu, 2010).

O Laboratorio MACSIN da UFMG possui uma plataforma experimental de um pen-

dulo duplo que foi construıda por Firmo (2007) durante a realizacao de seu trabalho de

mestrado. Utilizando apenas a informacao de uma variavel de estado, a saber, a velocidade

angular da haste acoplada ao motor, Firmo (2007) tambem caracterizou a dinamica desse

pendulo, calculando alguns invariantes dinamicos a fim de mostrar que o aparato mecanico e

capaz de exibir comportamento caotico.

A fim de se disponibilizar um conjunto maior de dados da plataforma experimental

do pendulo duplo do Laboratorio MACSIN, da UFMG, este trabalho propoe-se a implementar

um estimador recursivo de estados e parametros empregando a metodologia da filtragem de

Kalman unscented.

A vantagem de se ter estimativas de todos os estados do sistema e que, como mostra

Letellier e colaboradores (2006), determinadas variaveis de estado apresentam maior grau

informativo sobre a dinamica de um sistema considerado do que outras. Com isso, pretende-

Page 28: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4 1 Introducao

se aumentar a possibilidades de estudos sobre a dinamica caotica do mesmo, estudos de

modelagem e de controle. Alem disso, como apontado na Secao 1.1, por meio da filtragem

reduz-se o ruıdo das series observadas melhorando a estimacao das invariantes dinamicas de um

sistema. Portanto, uma outra relevancia deste trabalho e que os resultados apresentados no

trabalho de Firmo (2007) podem ser refeitos a partir das series temporais filtradas fornecidas

pelo algoritmo desenvolvido neste trabalho a fim de se obter resultados mais precisos.

Um outro aspecto importante deste trabalho e a possibilidade de se estimar parame-

tros do sistema ao mesmo tempo em que se estimam os seus estados, o que recebe o nome de

estimacao conjunta. A estimacao conjunta e um tema de muita importancia e o seu uso traz

benefıcios em diversos tipos de aplicacoes. Uma delas e o manipulador robotico, para o qual,

a estimacao conjunta promove aumento do grau de agilidade e adaptabilidade do sistema a

condicoes de incerteza (Blauer e Belanger, 1987). Parametros tıpicos de serem estimados em

manipuladore roboticos sao os coeficientes de atrito nas juntas dos bracos. Considerando a

analogia que se pode fazer entre o pendulo duplo com as estruturas dos manipuladores roboti-

cos, e de interesse deste trabalho utilizar o mecanismo da estimacao conjunta para estimar

os coeficientes de atrito das juntas do pendulo, fazendo-se, assim, merecimento a analogia

pretendida. Com relacao a estimacao de parametros, sabe-se ainda que, em particular, os

coeficientes de atrito sao valores positivos. Para incorporar esse tipo de conhecimento a priori

na estimacao pode-se utilizar uma versao do UKF para casos com restricoes nas estimativas,

por exemplo, o UKF Intervalar(IUKF).

Por ultimo, destaca-se, neste trabalho, a utilizacao de uma camera digital como sensor

das posicoes angulares das hastes do pendulo. Cameras de vıdeos digitais sao os sensores mais

comuns utilizados em robos autonomos devido a fatores como custo, confiabilidade e facilidade

de uso (Smith e Singh, 2006). E com a utilizacao desse sensor, inclui-se um numero maior de

medicoes do sistema, ao inves de ter-se apenas a medicao da velocidade angular da primeira

haste do pendulo. Isto possibilita o aumento da confianca das estimativas produzidas pelo

filtro.

1.3 Objetivos

Os objetivos deste trabalho sao:

⋄ Implementar computacionalmente os algoritmos UKF e IUKF para a estimacao conjunta

de estados e parametros,

Page 29: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

1.3 Objetivos 5

⋄ Realizar uma implementacao que seja possıvel receber medicoes de fontes sensoras com

taxas de amostragem diferentes,

⋄ Desenvolver um sensor para as posicoes angulares das hastes do pendulo duplo baseado

em visao computacional,

⋄ Testar os filtros implementados para a estimacao conjunta de estados e parametros do

pendulo duplo com dados simulados e experimentais,

⋄ Verificar a viabilidade de se utilizar as medicoes das posicoes angulares providas pelo

sensor baseado em visao computacional,

⋄ Verificar o desempenho dos filtros.

A Figura 1.1 ilustra a proposta do trabalho. Medicoes coletadas do pendulo duplo

sao armazenadas em um registro. Em seguida, um algorimto computacional processa as

informacoes coletadas produzindo estimativas dos estados do sistema, estimativas de certos

parametros do sistema e, tambem, uma versao filtrada das medicoes coletadas1.

Sistema

Caótico

Registro

Algoritmo

Computacional

off-line

medições filtradas

registro dos estados do sistema

parâmetros físicos estimados

(coeficientes de atrito)

medições

características,

propriedades?

sob qual

critério??

Figura 1.1: Visao geral da proposta deste trabalho. Um algoritmo computacional processa dadoscoletados de um pendulo caotico. Tal processamento e avaliado segundo criterios de de-sempenho.

Essas estimativas sao obtidas sob o paradigma da filtragem Bayesiana por meio do

filtro de Kalman unscented (UKF). Como mostra a Figura 1.2, o UKF assimila dados de

fontes de informacoes diferentes, recebidas do modelo de predicao e dos sensores, promovendo

uma solucao sub-otima para o problema da estimacao.

1Observe, no entanto, que os filtros recursivos usados permitem a aplicacao em sistemas de tempo-real,dependendo do hardware utilizado e do software implementado.

Page 30: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6 1 Introducao

informação

de sensor analógico

amostrado

(série temporal)

informações

visual da câmera digital

(vídeo "stream")

Processamento

de Imagem

Estimador

UKF

modelo

(Ts)

(Tpa)

(série temporal)

medições filtradas

registro dos estados do sistema

parâmetros físicos estimados

(coeficientes de atrito)

registro

Algoritmo Computacional offlinecaracterísticas

do sinal?

Figura 1.2: Diagrama do algoritmo computacional desenvolvido. Os principais blocos sao o do esti-mador e o do processamento de imagem. O estimador, baseado em modelo, recebe duasseries temporais com taxas de amostragem diferentes.

1.4 Estrutura da Dissertacao

Esta dissertacao esta organizada da seguinte maneira. No Capıtulo 2, sao conhecidas

as formulacoes matematicas dos problemas de estimacao de estados e estimacao conjunta

de estados e parametros para sistemas nao lineares. O filtro de Kalman unscented, que e o

estimador escolhido para a proposta de trabalho, e apresentado, apos uma breve revisao do

filtro de Kalman para sistemas lineares.

No Capıtulo 3, apresenta-se os componentes principais da plataforma experimental

estudada e e derivado o modelo de Lagrange para o pendulo duplo dessa plataforma. Uma

breve discussao sobre a caracterıstica caotica do pendulo e feita no final do capıtulo.

No Capıtulo 4 o desenvolvimento do sensor baseado em visao computacional, utilizado

para prover medicoes das posicoes angulares do pendulo, e apresentado.

Questoes preliminares, importantes para o caso em estudo, tais como, verificacoes ex-

perimentais e aspectos praticos da implementacao dos algoritmos, sao levantadas no Capıtulo

5.

O Capıtulo 6 e dedicado aos resultados de testes, sob diversas condicoes, de estimacao

de estados e parametros conduzidos com dados simulados e experimentais. Valida-se a escolha

do filtro de Kalman unscented como um estimador adequado para a plataforma estudada.

E, por fim, no Capıtulo 7 sao apresentados os comentarios finais sobre o trabalho e

sugestoes de trabalhos futuros.

Page 31: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Capıtulo 2

Estimacao de Estados de Sistemas Nao-Lineares

“Durante um dos primeiros testes de bomba atomica, Enrico Fermi supostamente deixou cair um

pouco de sobras de papel enquanto a onda de choque passava e estimou a forca da explosao a partir do

movimento das sobras enquanto elas caiam.”

Lawrence Weinstein e John A. Adam,[ Weinstein e Adam (2008), pagina xiv ]

“Nao ha lei contra combinar ideias...nos nao temos uma boa teoria quantitativa que nos diga quando

o EKF (ou qualquer outro tipo de aproximacao) funcionaria bem em uma dada aplicacao. Essa

lacuna e uma situacao escandalosa que se estende por mais de quatro decadas depois da invencao do

filtro de Kalman”

Fred Daum (2005)

2.1 Introducao

Neste capıtulo, na Secao 2.2, e apresentada a formulacao matematica do problema

de estimacao de estados para sistemas nao-lineares autonomos. Em seguida, sao apresentadas

algumas ferramentas matematicas recursivas que resolvem esse problema de maneira sub-

otima. Inicia-se, na Secao 2.3, a revisao pelo filtro de Kalman (KF) que, apesar de nao tratar

o caso nao-linear, produz a solucao otima para o caso linear e Gaussiano e introduz o conceito

de dividir a solucao do problema em duas etapas: predicao e correcao. O KF tornou-se a base

para o desenvolvimento de algoritmos nao-lineares tambem estudados neste capıtulo, a saber:

o filtro de Kalman estendido (EKF) (Secao 2.4.1) e o fitro de Kalman unscented (UKF) (Secao

2.4.2). Enquanto o primeiro baseia-se numa aproximacao linear do modelo do sistema para

propagar a media e covariancia do vetor de estados, o segundo baseia-se em um procedimento

numerico para aproximar a media e covariancia do vetor de estados apos o mesmo sofrer a

transformacao nao-linear do modelo do sistema. Na Secao 2.5, apresenta-se uma versao do

Page 32: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

8 2 Estimacao de Estados de Sistemas Nao-Lineares

algoritmo do filtro de Kalman unscented, o filtro IUKF, que trata o caso em que os estados

a serem estimados devem obedecer a uma restricao intervalar. Em seguida, na Secao 2.6,

mostra-se como e possıvel utilizar um estimador de estados para estimar, conjuntamente,

parametros do sistema.

2.2 Formulacao do Problema

Considere o seguinte sistema dinamico nao-linear autonomo de tempo discreto:

xk = f(xk−1, k − 1) + wk−1, (2.1)

yk = h(xk, k) + νk, (2.2)

em que f : Rn × Z → Rn e o modelo de processo, xk ∈ R

n e o vetor de estados e yk ∈Rm e o vetor de saıdas medidas. Alem disso, os termos aditivos wk−1 e νk tem natureza

estocastica e representam incertezas no modelo de processo e na precisao das variaveis medidas,

respectivamente. Neste trabalho, por simplicidade, assume-se que ambos tenham distribuicao

Gaussiana com media nula e matrizes de covariancia Qk−1 e Rk, respectivamente, e que sejam

sequencias mutuamente independentes.

Com base no modelo do sistema dado pelas equacoes (2.1)-(2.2), o problema de esti-

macao de estados e o de estimar o vetor de estados xk, segundo algum criterio de optimalidade,

dado um conjunto de observacoes do vetor yk e o proprio modelo. Alem disso, o problema

de estimacao recebe tres classificacoes dependendo da disponibilidade (ou do uso) de infor-

macoes passadas, presentes ou futuras das medicoes yk com relacao ao instante k em que se

calcula uma estimativa para xk. Se para o calculo dessa estimativa forem utilizadas apenas

informacoes passadas, classifica-se o problema de estimacao como um problema de predicao.

Porem, se a observacao no instante k tambem for utilizada, tem-se um problema de filtragem.

E, caso se tenham informacoes antes e apos o instante k considerado, tem-se um problema

de suavizacao. Nesta dissertacao, e tratado o problema de filtragem. Assim, denota-se por

xk|k ∈ Rn a estimativa de estado realizada pelo filtro.

Sob o paradigma da filtragem Bayesiana1, a solucao completa do problema de fil-

tragem e dada pela funcao de densidade de probabilidade (PDF) condicional ρ(xk|y1, · · · , yk),tambem chamada de densidade de estado a posteriori, que e a densidade de probabilidade

do vetor de estados xk modificada pelo conhecimento das medicoes passadas y1, · · · , yk−1 e

Page 33: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

2.3 Filtro de Kalman 9

presente yk (Teixeira, 2008; Arasaratnam e Haykin, 2009). Segundo o criterio do maximo

a posteriori (MAP: do ingles, maximum a posteriori), a estimativa otima xk|k e escolhida

de forma a maximizar ρ(xk|y1, · · · , yk). Outros criterios, por exemplo, envolvem encontrar a

maxima verossimilhanca (ML: do ingles, maximum likelihood) (Dempster et al., 1977; Meng

e Rubin, 1993; Papadopoulos e Wornell, 1995; Ziman et al., 2005; Bagchi e ten Brummel-

huis, 1990) ou minimizar a variancia do erro de estimacao (MEV: do ingles, minimum error

variance) (Rhodes, 1971; Zhai et al., 2004; Drake, 1996).

A solucao Bayesiana ainda promove uma forma de tratar o problema de filtragem de

forma recursiva, na qual a densidade de estado a posteriori no instante (k − 1) e atualizada

com o recebimento de uma medicao y no instante k. Essa atualizacao e feita em duas etapas:

predicao e correcao. O desenvolvimento matematico dessas duas etapas utilizam o modelo do

sistema dado pelas equacoes (2.1)-(2.2) e a regra de Bayes, como pode ser visto em (Teixeira,

2008; Arasaratnam e Haykin, 2009).

Entretanto, resolver as equacoes da solucao Bayesiana pode se tornar impraticavel

devido a presenca de integrais multi-dimensionais (Jazwinski, 1970; Arasaratnam e Haykin,

2009). Uma das excecoes e o caso de sistemas lineares com incertezas Gaussianas. A solucao

para este caso foi estudada por Kalman (1960) e deu origem ao filtro de Kalman (KF) que e

revisado a seguir.

2.3 Filtro de Kalman

Supondo um caso ideal em que o modelo do sistema seja completamente conhecido e

descrito por (2.1)-(2.2) e que nao ha ruıdo, e ainda, que a condicao inicial x0 seja exatamente

conhecida, o problema de estimacao seria simplesmente resolvido pela simulacao livre do

modelo f . A motivacao para o desenvolvimento do filtro de Kalman vem das incertezas

presentes em casos praticos, a saber: erro na estimativa inicial e os ruıdos de processo wk−1

e de observacao νk.

O filtro de Kalman (KF) considera um modelo linear

xk = Ak−1xk−1 + wk−1, (2.3)

yk = Ckxk + νk, (2.4)

1Outras abordagens para solucionar o problema de filtragem nao linear sao apresentadas por Davis (1981)e Gertner (1978)

Page 34: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

10 2 Estimacao de Estados de Sistemas Nao-Lineares

em que Ak−1 ∈ Rn×n e Ck ∈ R

m×n sao conhecidas. Para o caso linear, assumindo que x0,

wk−1 e νk sejam Gaussianos, a PDF das variaveis xk e yk tambem sao Gaussianas. E bem

conhecido que isso simplifica o tratamento do problema uma vez que as variaveis aleatorias

Gaussianas sao descritas por dois momentos apenas: a media e a covariancia (Maybeck, 1979).

Tanto pelo criterio de mınima variancia (MV) como pelo criterio de maximo a posteri-

ori (MAP), a melhor estimativa de xk e a media da PDF ρ(xk|y1, · · · , yk). Para recursivamente

calcular a estimativa de estado xk|k, o KF utiliza uma etapa de predicao na qual o modelo

dinamico do sistema e usado para propagar a estimativa a priori xk−1|k−1 e a covariancia

associada P xxk−1|k−1 , E

[

(xk−1 − xk−1|k−1)(xk−1 − xk−1|k−1)T]

, e, em seguida, uma etapa de

assimilacao de dados na qual a informacao das medicoes yk e assimilada pelas estimativas

produzindo a estimativa a posteriori xk|k cuja covariancia e P xxk|k.

A etapa de predicao do KF e dada por

xk|k−1 = Ak−1xk−1|k−1, (2.5)

P xxk|k−1 = Ak−1P

xxk|k−1A

Tk−1 +Qk−1, (2.6)

yk|k−1 = Ckxk|k−1, (2.7)

P yyk|k−1 = CkP

xxk|k−1C

Tk +Rk, (2.8)

P xyk|k−1 = P xx

k|k−1CTk , (2.9)

em que P xxk|k−1 , E

[

(xk − xk|k−1)(xk − xk|k−1)T]

, P yyk|k−1 , E

[

(yk − yk|k−1)(yk − yk|k−1)T]

e

P xyk|k−1 , E

[

(xk − xk|k−1)(yk − yk|k−1)T]

. A etapa de assimilacao de dados e dada por

Kk = P xyk|k−1(P

yyk|k−1)

−1, (2.10)

xk|k = xk|k−1 +Kk(yk − yk|k−1), (2.11)

P xxk|k = P xx

k|k−1 −KkPyyk|k−1K

Tk , (2.12)

em que Kk ∈ Rn×m e a matriz do ganho de Kalman. A notacao xk|l indica uma estimativa

de xk no tempo k baseada em informacao disponıvel ate e incluindo o tempo l. Alem disso,

xj,k|k e o j-esimo elemento do vetor xk|k, enquanto P xx(i,j),k|k e o elemento (i,j) da matriz P xx

k|k.

Page 35: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

2.4 Estimadores de Estado para Sistemas Nao-Lineares 11

2.4 Estimadores de Estado para Sistemas Nao-Lineares

Em contrapartida ao caso linear em que existe uma solucao otima dada pelo KF que

minimiza a variancia do erro de estimacao, para o caso nao-linear, existem estimadores oti-

mos apenas para casos particulares (Daum, 2005). Como se sabe, o criterio para a solucao

exata do problema de estimacao e a representacao exata da PDF condicional ρ(xk|yk, · · · ,y1).Para sistemas nao-lineares, tal PDF necessita, a princıpio, de um conjunto infinito de parame-

tros para ser representada, o que implicaria infinitos parametros para serem atualizados (ou

propagados) pelo estimador. Nesse caso, busca-se um estimador que melhor se aproxima, por

exemplo, da solucao teorica de mınima variancia. Ha metodos que exploram aproximacoes

por meio da linearizacao do modelo em torno da estimativa corrente, como o caso do fil-

tro de Kalman estendido (EKF) (Simon, 2006; Anderson e Moore, 1979; Jazwinski, 1970),

e outros que trabalham com aproximacoes da distribuicao de probabilidade como o filtro de

partıculas (Djuric et al., 2003; Abdallah et al., 2008; Doucet et al., 2000), o aproximador por

soma de gaussiana (Alspach e Sorenson, 1972), e o filtro de Kalman unscented (UKF)(Julier e

Uhlmann, 1997; Merwe et al., 2004; Sitz et al., 2004; Teixeira, 2008). A seguir, metodologias

para o caso nao-linear sao apresentadas.

2.4.1 Filtro de Kalman Estendido

O EKF e proposto segundo a abordagem de aproximacao das funcoes f e h que

descrevem o sistema dinamico em estudo. Assume-se que tais funcoes sejam diferenciaveis,

o que significa que elas possuem expansao em serie de Taylor. No entanto, existem metodos

alternativos para sistemas com dinamicas nao-diferenciaveis, causadas, por exemplo, pela

ocorrencia da funcao absoluto (Chandrasekar et al., 2007).

O princıpio basico do EKF e, a cada passo k, expandir as funcoes nao-lineares f e h

em torno da estimativa atual e truncar a serie apos o primeiro termo. Fazendo isso, obtem-se

a etapa de predicao do EKF que e dada por

xk|k−1 = f(xk−1|k−1, k − 1), (2.13)

P xxk|k−1 = Ak−1P

xxk|k−1A

Tk−1 +Qk−1, (2.14)

yk|k−1 = h(xk|k−1,k), (2.15)

P yyk|k−1 = CkP

xxk|k−1C

Tk +Rk, (2.16)

P xyk|k−1 = P xx

k|k−1CTk , (2.17)

Page 36: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

12 2 Estimacao de Estados de Sistemas Nao-Lineares

em que as matrizes Jacobianas de f e h sao avaliadas nas estimativas de estado mais recentes

como

Ak−1 ,∂f

∂xk−1

xk−1|k−1,k−1

, (2.18)

Ck ,∂h

∂xk

xk|k−1,k

, (2.19)

(2.20)

ao passo que a etapa de assimilacao e dada por (2.10)-(2.12).

Uma alternativa ao EKF, conhecida como filtro de segunda ordem (EKF2), e apresen-

tada por Richard (1992) e Norgaard e colaboradores (2000), e truncar o primeiro e segundo

termo da expansao em serie de Taylor das funcoes f e h.

2.4.2 Filtro de Kalman Unscented

O cerne do desenvolvimento do UKF e a transformacao unscented (UT) (Julier e

Uhlmann, 1997; Julier et al., 2000). A UT aproxima a media y ∈ Rm e covariancia P yy ∈

Rm×m do vetor de variaveis aleatorias y obtido da transformacao nao-linear y = h(x), na

qual x ∈ Rn e um vetor de variaveis aleatorias com media x e covariancia P xx ∈ R

n×n, am-

bas assumidamente conhecidas. Essa transformacao nao faz uso de metodos de linearizacao

analıticos ou numericos. Ela esta baseada na escolha determinıstica de um conjunto repre-

sentativo de 2n + 1 pontos Xj ∈ Rn, j = 0, · · · ,2n, chamados de pontos sigma, os quais, por

definicao, satisfazem

2n∑

j=0

γ(m)j Xj = x (2.21)

2n∑

j=0

γ(c)j [Xj − x][Xj − x]T = P xx (2.22)

com os pesos γ , [γ0 γ1 · · · γ2n] ∈ R2n+1, tais que

∑2nj=0 γj = 1, dados por

γ(m)0 ,

λ

n+ λ, γ

(c)0 ,

λ

(n+ λ)+ 1− α2 + β, (2.23)

γ(m)j = γ

(c)j ,

1

2(n+ λ), j = 1, · · · ,2n, (2.24)

Page 37: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

2.4 Estimadores de Estado para Sistemas Nao-Lineares 13

em que λ , α2(n+ κ)− n, κ e β sao parametros de escala. Se x tem distribuicao Gaussiana,

β = 2 e o valor otimo. Ja α determina a dispersao dos pontos sigmas ao redor da media xk.

A matriz de pontos-sigmas X , [X0 X1 · · · X2n] ∈ Rn×2n+1 e escolhida como

X = x11×(2n+1) +√n+ λ[0n×1 (P xx)1/2 − (P xx)1/2], (2.25)

em que (P xx)1/2 e a raiz quadrada de Cholesky de P xx. Por simplicidade de notacao, as

equacoes (2.23)-(2.25) sao condensadas na funcao ΨUT dada por

[γ(m),γ(c),X ] , ΨUT(x,Pxx,n,λ). (2.26)

Propagando cada ponto sigma por meio de h, tem-se

Yj = h(Xj), j = 0, · · · ,2n, (2.27)

tal que a media e covariancia de y sao aproximadas por

y =2n∑

j=0

γ(m)j Yj (2.28)

P yy =2n∑

j=0

γ(c)j [Yj − y][Yj − y]

T. (2.29)

Para se chegar as equacoes do filtro UKF, utiliza-se (2.28) para obter aproximacoes

para xk|k−1 e yk|k−1, que no KF sao dadas por (2.5) e (2.7), e para produzir aproximacoes para

P xxk|k−1, P

yyk|k−1 e P xy

k|k−1, que no KF sao dadas respectivamente por (2.6),(2.8)-(2.9), utiliza-se

(2.29).

Assim, a etapa de predicao do UKF e dada por (Simon, 2006)

[γ(m),γ(c),Xk−1|k−1] = ΨUT(xk−1|k−1,Pxxk−1|k−1,n,λ), (2.30)

Xj,k|k−1 = f(Xj,k−1|k−1,k − 1), j = 0, · · · ,2n, (2.31)

xk|k−1 =2n∑

j=0

γ(m)j Xj,k|k−1, (2.32)

P xxk|k−1 =

2n∑

j=0

γ(c)j [Xj,k|k−1 − xk|k−1][Xj,k|k−1 − xk|k−1]

T+Qk−1, (2.33)

Xk|k−1 = ΨUT(xk|k−1,Pxxk|k−1), (2.34)

Page 38: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

14 2 Estimacao de Estados de Sistemas Nao-Lineares

Yj,k|k−1 = h(Xj,k|k−1,k), j = 0, · · · ,2n, (2.35)

yk|k−1 =2n∑

j=0

γ(m)j Yj,k|k−1, (2.36)

P yyk|k−1 =

2n∑

j=0

γ(c)j [Yj,k|k−1 − yk|k−1][Yj,k|k−1 − yk|k−1]

T+Rk, (2.37)

P xyk|k−1 =

2n∑

j=0

γ(c)j [Xj,k|k−1 − xk|k−1][Yj,k|k−1 − yk|k−1]

T. (2.38)

Observe que em (2.34), os pontos sigma sao regenerados, e, como os pesos γ(m) e γ(c), a

princıpio, nao mudam, nao e necessario passar os argumentos n e λ para a funcao ΨUT. Esse

passo pode ser omitido se os ruıdos wk−1 e νk forem incluıdos no vetor de estados, eliminando,

assim, Qk−1 e Rk das equacoes (2.33) e (2.37), respectivamente, como se ve em (Simon, 2006)

e (Teixeira, 2008). A etapa de assimilacao de dados do UKF e semelhante a do KF e e dada

por (2.10)-(2.12).

Arasaratnam e Haykin (2009) apresentam o UKF sob maior rigor teorico resultando

no que eles nomeiam de filtro de Kalman cubature (CKF). O CKF e um caso especial do UKF

quando o parametro λ dos pontos sigma e igualado a zero.

2.5 Estimacao de Estados com Restricoes para Sistemas Nao-

Lineares

Quando o vetor de estados a ser estimado deve obedecer a algum tipo de restricao, o

problema de estimacao, descrito na Secao 2.2, se transforma em um problema de estimacao

com restricao. Tal restricao e considerada uma informacao a priori.

Um caso de restricao e aquele no qual o vetor de estados deve satisfazer, para todo

k ≥ 0, a desigualdade intervalar do tipo

dk ≤ xk ≤ ek, (2.39)

em que dk ∈ Rn e ek ∈ R

n sao assumidamente conhecidos e, para j = 1, · · · ,n, dj,k < ej,k.

Alem disso, se xj,k e ilimitado a esquerda, dj,k = −∞, e, se xj,k e ilimitado a direita, ej,k = ∞.

Retomando o criterio da maxima a posteriori da abordagem de filtragem Bayesiana,

mencionada na Secao 2.2, o problema de estimacao de estados com restricao intervalar e o de

maximizar ρ(xk|y1, · · · , yk) sujeito a (2.39).

Page 39: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

2.5 Estimacao de Estados com Restricoes para Sistemas Nao-Lineares 15

Na secao seguinte, e revisto o algoritmo do filtro de Kalman unscented intervalar

(IUKF), que e um dos algoritmos baseados no UKF que trata esse problema de forma sub-

otima. Referencias de estudo para o IUKF e outros algoritmos sao os trabalhos de Teixeira e

colaboradores (2010, 2009); Teixeira (2008).

2.5.1 Filtro de Kalman Unscented com Restricoes de Intervalo

O IUKF surge da abordagem de projecao dos pontos sigma na hipersuperfıcie definida

pelas restricoes de desigualdade (Teixeira et al., 2010). Ao inves da transformacao unscented,

apresentada na Secao 2.4.2, o IUKF utiliza a transformacao unscented com restricoes inter-

valares (ICUT), na etapa de predicao, para reforcar (2.39).

A ICUT gera pontos sigma que satisfazem

dk ≤ Xj,k ≤ ek, j = 0, · · · ,2n. (2.40)

Diferentemente de (2.25), Xj,k e escolhido como

Xk = xk11×(2n+1) + [0n×1 ζ1,kcol1[(Pxxk )1/2] · · · ζn,kcoln[(P xx

k )1/2]

−ζn+1,kcoln+1[(Pxxk )1/2] · · · − ζ2n,kcol2n[(P

xxk )1/2]] (2.41)

em que, para i = 1, · · · ,n e j = 1, · · · ,2n,

ζj,k , min(colj(Θ)), (2.42)

Θ(i,j) ,

√n+ λ, se S(i,j) = 0

min

(√n+ λ,

ei,k−xi,k

S(i,j)

)

, se S(i,j) > 0

min

(√n+ λ,

di,k−xi,k

S(i,j)

)

, se S(i,j) < 0

(2.43)

S ,

[

(P xxk )1/2 − (P xx

k )1/2]

(2.44)

com vetor de pesos γk ∈ R2n+1, para j = 1, · · · ,2n,

γ0,k , bk, γj,k , akζj,k + bk, j = 1, · · · ,2n (2.45)

Page 40: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

16 2 Estimacao de Estados de Sistemas Nao-Lineares

que satisfazem∑2n

j=0 γj,k = 1, em que

ak ,2λ− 1

2(n+ λ)(∑2n

j=1 ζj,k − (2n+ 1)√n+ λ)

, (2.46)

bk ,1

2(n+ λ)− 2λ− 1

2(√n+ λ)(

∑2nj=1 ζj,k − (2n+ 1)

√n+ λ)

, (2.47)

Por simplicidade, as equacoes (2.41)-(2.47) sao condensadas na funcao ΨICUT dada por

[γk,Xk] = ΨICUT(xk,Pxxk ,dk,ek,n,λ), (2.48)

A etapa de predicao do IUKF (Teixeira et al., 2009) e dada por

[γk−1,Xk−1|k−1] = ΨICUT(xk,Pxxk ,dk,ek,n,λ), (2.49)

Xj,k|k−1 = f(Xj,k−1|k−1,k − 1), j = 0, · · · ,2n, (2.50)

xk|k−1 =

2n∑

j=0

γ(m)j Xj,k|k−1, (2.51)

P xxk|k−1 =

2n∑

j=0

γ(c)j [Xj,k|k−1 − xk|k−1][Xj,k|k−1 − xk|k−1]

T+Qk−1, (2.52)

Xk|k−1 = ΨICUT(xk,Pxxk ,dk,ek,n,λ), (2.53)

Yj,k|k−1 = h(Xj,k|k−1,k), j = 0, · · · ,2n, (2.54)

yk|k−1 =2n∑

j=0

γ(m)j Yj,k|k−1, (2.55)

P yyk|k−1 =

2n∑

j=0

γ(c)j [Yj,k|k−1 − yk|k−1][Yj,k|k−1 − yk|k−1]

T+Rk, (2.56)

P xyk|k−1 =

2n∑

j=0

γ(c)j [Xj,k|k−1 − xk|k−1][Yj,k|k−1 − yk|k−1]

T. (2.57)

A etapa de assimilacao de dados do IUKF e dada por (2.10)-(2.12), semelhantemente

ao UKF e ao KF.

2.6 Estimacao Conjunta de Estados e Parametros

O problema formulado na Secao 2.2 considera que os parametros do modelo f sao

conhecidos. Entretanto, em muitos casos, parte desses parametros sao desconhecidos e, ainda,

Page 41: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

2.6 Estimacao Conjunta de Estados e Parametros 17

nao podem ser medidos, por isso, precisam ser estimados a partir de medicoes indiretas. Exem-

plos da importancia da estimacao de parametros (Soroush, 1998) sao vistas na monitoracao

do coeficiente global de transferencia de calor e a taxa reacao-calor em reatores quımicos alta-

mente exotermicos; parametros de superfıcie em uma tarefa executada por um manipulador

robotico (Blauer e Belanger, 1987); forcas no pneu de um veıculo (Ray, 1995); parametros de

elasticidade e ativacao em sistemas biomecanicos (Moireau et al., 2008).

Para reformular o problema de estimacao de estados, incluindo tambem parametros

a serem estimados, a equacao (2.1) deve ser substituıda por

xk = f(xk−1, pk−1, k − 1) + wk−1, (2.58)

pk = pk−1 + wpk−1. (2.59)

em que, a equacao (2.59), introduzida na formulacao do problema, corresponde ao modelo de

evolucao dos parametros, expressa por meio de um processo random walk, pk ∈ Rnp e o vetor

de parametros a ser estimado e wpk ∈ R

np corresponde a ruıdo branco, Gaussiano, de media

nula, com matriz de covariancia Qpk−1 ∈ R

np×np .

Neste trabalho, e discutido como os parametros podem ser estimados via estimadores

recusivos de estados, como os apresentados nas Secoes 2.3 e 2.4. O estimador recursivo

permite, ainda, a obtencao de estimacao online dos parametros, ou seja, novas estimativas de

parametros sao produzidas “imediatamente” apos a apresentacao de um vetor de observacoes

(Togneri e Deng, 2003). Como apontado por Soroush (1998), existem outros metodos para a

estimacao online de parametros, a saber:

⋄ metodos baseados na estrutura “predicao-erro”;

⋄ estimacao de parametros via otimizacao online (Xiaolin e Guangrui, 1998);

⋄ estimacao de parametros via inversao de modelo;

⋄ estimacao de parametros via balanco de massa-energia (metodos calorimetricos).

Alem disso, os estimadores recursivos de estados podem ser empregados em duas

abordagens possıveis: a dual (Nelson e Stear, 1976; Wan et al., 1999) e a conjunta (Moireau

et al., 2008; Cox, 1964; Voss et al., 2004; Blauer e Belanger, 1987). Em ambas, os estados

e parametros do modelo sao estimados simultaneamente. A diferenca esta no fato de que a

abordagem dual requer que a representacao em espaco de estados do modelo de processo e

Page 42: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

18 2 Estimacao de Estados de Sistemas Nao-Lineares

do modelo de evolucao dos parametros seja separada, enquanto que, na abordagem conjunta,

um vetor de estados conjunto concatena o vetor formado puramente de estados e o vetor

de parametros formando uma unica representacao em espaco de estados (Wan et al., 1999).

Pela configuracao da abordagem dual, e possıvel utilizar dois tipos diferentes de filtro para a

solucao do problema: um para estimar os parametros a partir dos estados atuais (por exemplo,

o KF), e o segundo para estimar os estados com os parametros previamente estimados (por

exemplo, o UKF). Por outro lado, na abordagem conjunta, um unico filtro e utilizado para

ambas as tarefas.

A abordagem adotada neste trabalho e a conjunta, e, para desenvolve-la, consideram-

se os parametros como se fossem estados “virtuais” e define-se uma versao conjunta do vetor

de estados como xk , [xTk pT

k ]T em que xk ∈ R

n, n = n+np. Com isso, a equacao, em espaco

de estados, de xk e dada por

xk = f(xk−1, pk−1, k − 1) + wk−1, (2.60)

em que

f(xk−1,pk−1, k − 1) ,

f(xk−1,pk−1, k − 1)

pk−1

e wk−1 ,

wk−1

wpk−1

, (2.61)

e o ruıdo de processo wk−1 possui matriz de covariancia conjunta

Qk−1 ,

Qk−1 0n×np

0np×n Qpk−1

. (2.62)

A matriz de covariancia do erro da equacao de estados tambem e estendida para

Pk|k ,

P xxk|k P xp

k|k

P pxk|k P pp

k|k

, (2.63)

em que P ppk|k e a covariancia do erro de estimacao dos parametros. Observe que a abordagem

dual modela os acoplamentos entre a dinamica do processo e dos parametros por meio de P xpk|k.

Mulder e colaboradores (1999) alertam para o procedimento de se adicionar parame-

tros desconhecidos. Segundo os autores, deve-se tomar cuidado em nao se adicionar muitos

Page 43: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

2.6 Estimacao Conjunta de Estados e Parametros 19

parametros, com o risco de se conduzir a componentes nao-reconstrutıveis no vetor de estados

aumentados. Quando um parametro e modelado como uma constante, a covariancia do filtro

de Kalman para esse parametro convergira para zero e isso provocara a convergencia da matriz

de ganho, K, para zero tambem, e, depois de um certo perıodo de tempo, o filtro comecara a

ignorar as observacoes. O autor recomenda adicionar-se algum ruıdo artificial pela utilizacao

do modelo de Markov ao inves de um parametro constante, desde que, dessa forma, tanto

a matriz de covariancia quanto o ganho nao convirjam a zero. A equacao de evolucao dos

parametros, (2.59), pode ser considerada um tipo de modelo de Markov.

Page 44: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 45: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Capıtulo 3

Descricao do Sistema

“Nao errei em meus calculos; todos esses sofrimentos nao foram em vao. Senti, afinal, que estava

livre. A correia pendia, em pedacos, de meu corpo. Mas o movimento do pendulo ja se realizava sobre

o meu peito. Tanto a sarja da minha roupa, como a camisa que vestia ja haviam sido cortadas. O

pendulo oscilou ainda por duas vezes, e uma dor aguda me penetrou todos os nervos.”

Edgard Allan Poe, em O poco e o pendulo

“Todo coracao em caos traz uma estrela cintilante.”

Nietzsche

3.1 Plataforma Experimental do Pendulo Duplo

Plataformas experimentais sao recursos que agregam valor em estudos que buscam

avaliar a robustez de uma ferramenta matematica. Awrejcewicz e colaboradores (2007) uti-

lizam uma plataforma experimental para analisar a dinamica de um pendulo triplo excitado

por uma onda quadrada. Liu e Hu (2010), buscando aprofundar o conhecimento sobre os

efeitos de filtros digitais em sistemas mecanicos controlados, realizam testes em uma pla-

taforma experimental de um pendulo duplo sobre um carrinho de translacao. Christini e

colaboradores (1996) testam uma tecnica de estabilizacao de sistemas caoticos, especifica-

mente, o metodo de controle local, em uma plataforma experimental de um pendulo duplo.

Franca e Savi (2001) conduzem uma serie de analises experimentais sobre um pendulo nao-

linear excitado para avaliar a dinamica caotica nesse sistema. Wang e colaboradores (2008)

utilizam uma plataforma experimental com um pendulo invertido sobre uma carrinho para

implementar uma estrategia de controle hıbrido com o auxılio de uma camera. E, em um

outro trabalho, essa plataforma e modificada para que o pendulo mova sobre uma mesa, e,

sobre esse sistema com tres graus de liberdade, e implementado um sistema de controle de

Page 46: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

22 3 Descricao do Sistema

trajetoria (Wang et al., 2010).

A plataforma experimental utilizada neste trabalho foi construıda por Firmo (2007)

durante seu trabalho de mestrado no qual ele investigou, com dados experimentais, o oscilador

autonomo construıdo. Ela e constituıda de um aparato mecanico, um subsistema de aciona-

mento, um subsistema de medicao e um subsistema de interface e coleta de dados. A Figura

3.1 mostra um esquema da bancada, com a plataforma do pendulo duplo, que esta instalada

no laboratorio de Modelagem Analise e Controle de Sistemas Nao-Lineares (MACSIN) do

Departamento de Engenharia Eletronica da Universidade Federal de Minas Gerais.

Figura 3.1: Representacao da bancada de estudos do laboratorio MACSIN do Departamento de Enge-nharia Eletronica da Universidade Federal de Minas Gerais com a plataforma experimentaldo pendulo duplo, utilizada para a realizacao deste trabalho de mestrado.

A seguir, sao detalhadas as partes que compoem a plataforma experimental do pen-

dulo duplo.

3.1.1 O Aparato Mecanico

O aparato mecanico e composto por um pendulo duplo, formado por duas hastes, um

motor de corrente contınua (CC) e um suporte, conforme mostra a Figura 3.2.

A haste 1 do pendulo duplo e formada por duas barras de alumınio (densidade ρ =

2,7Kg/m3) de dimensoes 0,27m × 0,032m × 0,0006m e a haste 2 e formada por uma barra,

tambem de alumınio, de dimensoes 0,216m× 0,032m× 0,013m.

Page 47: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.1 Plataforma Experimental do Pendulo Duplo 23

SensorSensor

Motor CC

Pêndulo Duplo

Haste 1

Haste 2

rolamento de esferas,

Ponto J

Ponto O

Suporte com rolamentos de esferas

Figura 3.2: O aparato mecanico do pendulo duplo. Fonte: (Firmo, 2007)

O eixo que une as duas barras da haste 1 tambem serve para suportar a haste 2,

no ponto J , por meio de um rolamento de esfera. Assim, a haste 2 pode executar um giro

completo passando por entre as barras da haste 1.

O eixo que liga a haste 1 ao suporte de fixacao e suportado por dois rolamentos de

esferas. Este eixo esta acoplado ao eixo do motor CC, garantindo, dessa forma, a transmissao

do torque do motor ao pendulo duplo.

O momento de inercia do sistema mecanico e a combinacao do momento de inercia

das hastes com o momento de inercia do motor, Mm. O valor de Mm, encontrado apos

experimentos por Firmo e colaboradores (2007), e Mm = 22× 10−6kg.m2.

As fontes de amortecimento consideradas nesse aparato sao o atrito viscoso linear

e o atrito seco (ou atrito de Coulomb) que ocorrem nos rolamentos de sustentacao e nos

rolamentos do motor. Como apontam Horton e colaboradores (2008), essa e a maneira mais

apropriada de modelar a dissipacao de energia para uma vasta variedade de sistemas. Outras

formas possıveis incluem o efeito de Stribeck, friccao de variacao de estado (do ingles, slip-stick

motion) e o modelo de Dahl (Wit et al., 1995).

Page 48: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

24 3 Descricao do Sistema

Considera-se que todas as forcas de atrito sao aplicadas nos pontos O e J (Firmo

et al., 2007). No ponto O, o coeficiente de atrito viscoso total e denotado por b1, e o atrito de

Coulomb e representado por b2. No ponto J , o coeficiente de atrito viscoso total e denotado

por b3, e o atrito de Coulomb e representado por b4.

3.1.2 Subsistema de Medicao

Medicao da Velocidade Angular da Haste 1

O sensor S1, acoplado diretamente ao eixo do motor CC, e uma pequena maquina CC

de imas permanentes, funcionando como taco-gerador, em que a velocidade angular de seu

eixo produz uma tensao de −5 V a 5 V em seus terminais de saıda, proporcional a velocidade

da haste 1 do pendulo duplo, θ1.

Medicao das Posicoes Angulares das Hastes 1 e 2

Para prover informacao sobres as posicoes angulares, θ1 e θ2, do pendulo, propoe-se,

neste trabalho, um sensor baseado em visao computacional. Portanto, tal sensor nao estava

disponıvel na plataforma experimental utilizada por Firmo (2007).

Esse sensor e formado por uma camera digital (ver Figura 3.3) e um sistema de

processamento digital de imagens (SPDI). A camera e instalada sobre um tripe de apoio

posicionado a uma distancia aproximada de 2 metros do pendulo duplo, como ilustra a Figura

3.1, e fornece imagens digitais que, posteriormente, sao processadas pelo SPDI, produzindo

estimativas das posicoes angulares.

A camera utilizada e uma DragonFlyExpress, modelo DX-BW/COL-XX, da fabri-

cante Point Grey. Os dados tecnicos estao descritos na Tabela 3.1. O Capıtulo 4 trata do

SPDI.

3.1.3 Subsistema de Acionamento

O motor CC possui alimentacao de campo ,Vf , e de armadura, Va, independentes.

Trata-se de um motor de 100W, do mesmo tipo dos utilizados em maquinas de costura, oper-

arando em corrente contınua (Firmo, 2007). Ele e responsavel por aplicar o torque necessario

para manter o pendulo duplo em movimento, compensando a dissipacao de energia pelas fontes

de atrito. Tal torque tem uma caracterıstica muito importante no sistema do pendulo duplo.

O torque e especialmente definido para ser uma funcao dos estados do proprio sistema,

Page 49: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.1 Plataforma Experimental do Pendulo Duplo 25

Figura 3.3: Camera digital DragonFly2, modelo DR2-03S2M/C-EX-CS, da fabricante Point Grey.Utilizada no sistema de medicao das posicoes angulares baseado em visao computacional.

Tabela 3.1: Caracterısticas gerais da camera DR2-03S2M/C-EX-CS, da fabricante Point Grey.

Propriedade Min. Max.

Brilho 0,0 % 0,0 %

Exposicao −7,58 EV 2,41 EV

Nitidez 0 4095

Matiz −180,0 de 179,91 de

Saturacao 0,00 % 399,90 %

Gama 0,5 4,0

Iris 0 256

Obturador 0,02 ms 16,66 ms

Ganho −6 dB 30 dB

Quadros por Segundo 1,875 FPS 200 FPS

a saber, da posicao angular da haste 1, θ1, e da velocidade angular da haste 1, θ1. Dessa forma,

o sistema global permanece autonomo, ou seja, nenhuma excitacao externa explicitamente

dependente do tempo e aplicada (Firmo et al., 2007).

O mecanismo do torque e o seguinte: quando a posicao angular da haste 1 do pendulo

duplo estiver dentro de uma regiao definida por |θ1| < γ, em que γ e o angulo limite, o motor

e acionado, com o valor fixo da tensao de armadura Va, de forma a produzir um torque no

sentido de giro atual da haste 1, ou seja, o torque deve favorecer o movimento da haste 1

quando ela estiver nessa regiao especificada.

O sensor S2, instalado no eixo principal, capta quando a haste 1 do pendulo entra

Page 50: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

26 3 Descricao do Sistema

e sai da fronteira γ. Esse sensor, mostrado na Figura 3.4, e composto de 2 pecas: um disco

semi-aberto e um fotosensor. O disco semi-aberto tem uma secao angular aberta equivalente a

2γ que permite a passagem de luz que e recebida pelo fotosensor. Ao receber luz o fotosensor

gera um sinal de nıvel logico 1.

Figura 3.4: Sensor S2. Fonte: (Firmo, 2007)

O sinal do sensor S2 e combinado com o sinal do sensor de velocidade S1 para coman-

dar o circuito de acionamento do motor, chamado ponte H. A ponte H define um dos possıveis

estados do motor, em funcao do seu comando: desligado, ligado no sentido-horario ou ligado

no sentido anti-horario. Essa funcionalidade torna a ponte H apropriada para a funcao torque

desejada. A Tabela 3.2 resume o funcionamento do sistema de acionamento.

Tabela 3.2: Quadro com o resumo do sistema de acionamento. O torque e uma funcao dosproprios estados do sistema e sempre contribui para o sentido do movimento do pendulo.

Sensor S1 Sensor S2 Resposta da ponte H Torque

sinal (+) 0 motor desligado 0

sinal (-) 0 motor desligado 0

sinal (+) 1 motor ligado sentido horario positivo (contribuindo)

sinal (-) 1 motor ligado sentindo anti-horario negativo (contribuindo)

3.1.4 Subsistema de Interface e Coleta de Dados

Uma interface grafica, ilustrada na Figura 3.5, desenvolvida por Thums (2008), per-

mite ao usuario da plataforma experimental definir a tensao de armadura Va do motor CC,

monitorar a velocidade da haste 1 do pendulo duplo e armazena-la em um arquivo de dados.

Ela esta instalada no computador da bancada.

O dispositivo que gerencia a comunicacao com a interface do usuario e coordena a

Page 51: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.1 Plataforma Experimental do Pendulo Duplo 27

Figura 3.5: Interface grafica para o usuario ajustar a tensao de armadura do motor CC e coletar dadosda velocidade angular da haste 1 em experimentos com o pendulo duplo.

operacao dos demais circuitos da plataforma e o microcontrolador PIC18F4550 da Microchip.

O microcontrolador troca dados com a interface do usuario via interface de comunicacao USB.

E, tambem, pela USB que os circuitos eletronicos sao alimentados, o que e possıvel devido ao

baixo consumo de corrente desses dispositivos.

Ao receber o comando “Inicia Aquisicao” do usuario via interface grafica, o microcon-

trolador converte a referencia de tensao de armadura definida pelo usuario, que pode estar

na faixa 0V a 30V, para um valor de 0V a 5V que corresponde a razao cıclica do modulador

PWM responsavel por alimentar a ponte H do circuito de acionamento.

Para monitorar a velocidade angular da haste 1, o sinal de tensao produzido pelo

sensor S1 e amostrado pelo microcontrolador. A amostragem ocorre numa frequencia de 1kHz

e converte a faixa de tensao de −5 V a 5 V do sinal de S1 para a escala de velocidade, cuja

unidade e rad/s. Os valores amostrados sao armazenados temporariamente em um registro

do microcontrolador que a cada 1 segundo sao enviados a interface grafica que, por sua vez,

exibe os dados na tela e armazena-os em arquivo para posterior analise.

O desenvolvimento da interface com o usuario e restrito apenas a monitoracao e ao

armazenamento da velocidade angular da haste 1. Com a atual inclusao do sensor baseado em

Page 52: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

28 3 Descricao do Sistema

visao computacional, com o SPDI, torna-se necessaria uma solucao para agrupar, de forma

sincronizada, os dados provenientes dessas duas fontes de informacao de forma a gerar um

unico arquivo de dados.

A solucao encontrada para tornar possıvel o sincronismo das informacoes e posicionar

um LED“pisca-pisca”no campo de visao da camera cujo instante do disparo inicial e o mesmo

em que se incia a aquisicao de dados da interface grafica. E, a cada 1 segundo, o LED pisca,

mudando seu estado de aceso para apagado, ou vice-versa. A Figura 3.6 ilustra o molde

instalado no corpo da camera com o LED de sincronismo.

Ao incluir o processamento visual do estado do LED no SPDI, uma informacao extra

(1 “um” para LED aceso, e 0 “zero” para LED apagado) e gerada e torna-se parte do arquivo

de dados que contem a medicao das posicoes angulares.

Figura 3.6: Ilustracao da montagem do aparato que contem a camera que faz a filmagem do movimentodo pendulo duplo caotico. As figuras (a) e (b) sao esquematicas, mostrando os componentesprincipais da imagem coletada. Em (a) tem-se um quadro no qual o LED de sincronismoesta acesso. Em (b), o LED de sincronismo esta apagado. O LED de sincronismo operadurante 1 segundo em cada estado.

A Figura 3.7 ilustra o processo de fusao dos dois arquivos de dados. O mecanismo

utilizado para essa fusao ocorre da seguinte maneira. A primeira linha do arquivo 1, das

velocidades angulares, corresponde a primeira linha do arquivo 2, das posicoes angulares, em

que a informacao extra, do estado do LED, e equivalente a 1 (um). Essas duas linhas sao

combinadas formando, assim, a primeira linha do arquivo 3, dos dados sincronizados.

Para gerar as proximas linhas, utiliza-se a razao da amostragem com que foram

Page 53: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.1 Plataforma Experimental do Pendulo Duplo 29

gerados os arquivos 1 e 2. As linhas do arquivo 1 correspondem a amostragem de 1kHz. E

as linhas do arquivo 2 correspondem a taxa de aquisicao de quadros da camera, que pode ser

de 2Hz, 20Hz, ou outro valor qualquer que seja divisor de 1000Hz. Suponha que a taxa de

aquisicao da camera e de 20Hz. Nesse caso, a cada 50 linhas (1000/20 = 50) do arquivo 1

copiadas para o arquivo 3, combina-se uma linha do arquivo 1 com uma do arquivo 2. Toda

vez que se atingir 1000 linhas copiadas do arquivo 1 para o arquivo 3, o que corresponde a

1 segundo de historico, obrigatoriamente, a linha do arquivo 2 que sera combinada com a

linha do arquivo 1 e a proxima da sequencia que tem uma mudanca no estado do LED de

sincronismo, o que esta relacionado com a frequencia de pisca do mesmo. Isso e util porque nao

se tem garantia de que as imagens capturadas pela camera seja exatamente o valor ajustado.

As colunas do arquivo 3, correspondentes as posicoes angulares, sao identificadas por

“NaN” sempre que nao houver combinacao de uma linha do arquivo 1 com uma linha do

arquivo 2.

Arquivo#1 Arquivo#2

Arquivo#3

Figura 3.7: Arquivos gerados pelo sistema. O arquivo 1 e gerado pelo sistema de aquisicao de dadosvia USB e contem dados da velocidade da haste 1. O arquivo 2 e gerado pelo processamentodas imagens do pendulo duplo e contem dados das posicoes angulares das duas hastes edo estado do LED de sincronismo. O arquivo 3 e obtido apos fundir a informacao dosarquivos 1 e 2, essa fusao e um tipo de sincronismo governado pelo estado do LED e pelainformacao da taxa de quadros por segundo da filmagem do pendulo.

Page 54: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

30 3 Descricao do Sistema

3.2 Modelagem Fenomenologica

A modelagem fenomenologica busca derivar as equacoes diferenciais que governam a

dinamica de um sistema. Para isso, no caso de sistemas mecanicos, utilizam-se, basicamente,

a aplicacao das leis de Newton ou metodos baseados na energia do sistema (Kelly, 2000).

Firmo (2007) deriva as equacoes diferenciais do pendulo duplo aplicando as leis de

Newton do equilıbrio das forcas e momentos angulares. Entretanto o formato das equacoes

resultantes nao e do tipo que usualmente se encontra, por exemplo, na literatura relacionada

ao movimento de bracos roboticos. Por outro lado, as equacoes de Lagrange, que combinam

consideracoes do metodo de energia com o conceito de trabalho virtual, sao mais recomendadas

para a maioria dos sistemas mecanicos que possuem varios graus de liberdade de movimento

(Inman, 2001). Para exemplificar, recomenda-se o trabalho de Kiyoumarsi e colaboradores

(2007), no qual os autores apresentam o desenvolvimento matematico completo, utilizando a

abordagem de Lagrange, para obter as equacoes dinamicas de um pendulo duplo configurado

para ser um esquema simplificado de um braco robotico flexıvel. Liu e Hu (2010) tambem

utilizam as equacoes de Lagrange para, “facilmente” (segundo o proprio autor), chegar a

equacao dinamica na forma matricial de um pendulo duplo que se move sobre um carrinho.

Outros trabalhos que apresentam a equacao do movimento na forma de Lagrange para sistemas

de pendulo sao (Bortoff, 1996) e (Awrejcewicz et al., 2007). E, a tıtulo de informacao, ha

trabalhos na area de identificacao de coeficientes de atrito baseados no conceito de Lagrange,

do balanco de energias (Liang, 2007; Feeny, 2009; Mann e Khasawneh, 2009).

Na tentativa de encontrar um modelo para o pendulo duplo experimental facilmente

descrito por equacoes matriciais em espaco de estados, opta-se por remodelar o sistema uti-

lizando a abordagem Lagrangiana, que esta no contexto dos metodos baseados na conservacao

da energia.

3.2.1 Modelagem sem Forcas

O diagrama do pendulo duplo da plataforma experimental e apresentado na Figura

3.8. Nesse diagrama, o pendulo esta representado como um sistema conservativo, nao apare-

cendo as forcas dissipativas nem as forcas externas, a fim de simplificar o desenvolvimento das

equacoes. Mais adiante, sao introduzidas as parcelas, por agora, omitidas.

Ainda com relacao ao diagrama, as setas indicam o movimento de rotacao das partes.

As massas m1 e m2 das hastes estao concentradas no centro de massa das mesmas e ficam

Page 55: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.2 Modelagem Fenomenologica 31

a uma distancia l1 e l2 dos seus respectivos eixos de rotacao. Considerando que as hastes

possuem distribuicao homogena de massa, essas distancias sao dadas por Li/2, em que L e o

comprimento da haste i.

Figura 3.8: Diagrama esquematico do pendulo duplo experimental para o caso conservativo.

Para deduzir a equacao do movimento do pendulo duplo da plataforma experimental

deste trabalho comeca-se pela definicao do Lagrangiano, L, de um sistema dinamico, dado

por

L = T − V, (3.1)

em que T e a energia cinetica e V e a energia potencial, ambas avaliadas em um instante de

tempo qualquer.

Pode-se expressar o Lagrangiano como funcao de coordenadas generalizadas e suas

respectivas derivadas. Portanto, o proximo passo e a escolha das coordenadas generalizadas.

Como o pendulo duplo e um sistema com 2-graus de liberdade (2-DOF), ele possui um con-

junto de 2 varaveis cineticamente independentes que descrevem completamente o movimento

das suas partıculas (Kelly, 2000), a saber, as variaveis θ1 e θ2. Esse conjunto e chamado

de coordenadas generalizadas. Dessa forma, expressa-se o lagrangiano como L(θ1,θ2,θ1,θ2).

Page 56: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

32 3 Descricao do Sistema

Define-se a equacao de Lagrange para um sistema conservativo como

d

dt

(

∂L

∂θi

)

− ∂L

∂θi= 0, i = 1,2. (3.2)

A energia potencial total do sistema, V , e dada por

V = V1 + V2, (3.3)

em que, V1 e V2 sao as energias potenciais da haste 1 e da haste 2, respectivamente, dadas por

V1 = −m1gl1cos(θ1), (3.4)

V2 = −m2g(L1cosθ1 + l2cosθ2). (3.5)

A energia cinetica total do sistema, T , e dada por

T = T1 + T2 + Tm, (3.6)

em que, T1 e T2 sao as energias cineticas da haste 1 e da haste 2, respectivamente, e Tm e a

energia cinetica rotacional do motor. Elas sao, respectivamente, dadas por

T1 =1

2m1l1

2θ21 +1

2Jm1θ

21, (3.7)

T2 =1

2m2l2

2θ22 +1

2m2L1

2θ21 +m2L1l2θ1θ2cos(θ1 − θ2) +1

2Jm2θ

22, (3.8)

Tm =1

2Mmθ21, (3.9)

em que Jmi e o momento de inercia da haste i, calculado como li2mi, e Mm e o momento de

inercia do motor C.C.

Substituindo as equacoes (3.4)-(3.5) em (3.3), e (3.7)-(3.9) em (3.6), obtem-se o la-

grangiano do pendulo duplo como

L =1

2Mmθ21 +

1

2m1l1

2θ21 +1

2Jm1θ

21 +

1

2m2l2

2θ22 +1

2m2L1

2θ21 (3.10)

+m2L1l2θ1θ2cos(θ1 − θ2) +1

2Jm2θ

22 +m1gl1cos(θ1) +m2g(L1cosθ1 + l2cosθ2).

Page 57: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.2 Modelagem Fenomenologica 33

Para calcular a equacao (3.2) para a coordenada θ1, seguem as seguintes derivadas

∂L

∂θ1= Mmθ1 + Jm1θ1 +m1l1

2θ1 +m2L12θ1 +m2L1l2θ2cos(θ1 − θ2), (3.11)

d

dt

(

∂L

∂θ1

)

= Mmθ1 + Jm1θ1 +m1l12θ1 +m2L1

2θ1 (3.12)

+m2L1l2θ2cos(θ1 − θ2)− sen(θ1 − θ2)m2L1l2θ2(θ1 − θ2),

∂L

∂θ1= −gl1m1sen(θ1)− gL1m2sen(θ1)−m2L1l2θ1θ2sen(θ1 − θ2), (3.13)

o que resulta em

[Mm + Jm1 + m1l12 +m2L1

2]θ1 +m2L1l2cos(θ1 − θ2)θ2 (3.14)

+m2L1l2sen(θ1 − θ2)θ22 + gm1l1sen(θ1) + gm2L1sen(θ1) = 0

E para a coordenada θ2, seguem as seguintes derivadas

∂L

∂θ2= Jm2θ2 +m2l2

2θ2 +m2L1l2θ1cos(θ1 − θ2), (3.15)

d

dt

(

∂L

∂θ2

)

= m2l22θ2 +m2L1l2θ1cos(θ1 − θ2)− (3.16)

−sen(θ1 − θ2)m2L1l2θ1(θ1 − θ2),

∂L

∂θ2= −m2gl2sen(θ2)−m2L1l2θ1θ2sen(θ1 − θ2), (3.17)

que resultam em

[Jm2 +m2l22]θ2 + m2L1l2cos(θ1 − θ2)θ1 (3.18)

−m2L1l2sen(θ1 − θ2)θ21 + gm2l2sen(θ2) = 0

Representando (3.14) e (3.18) na forma matricial, obtem-se a equacao dinamica do

pendulo duplo conservativo

M(θ)θ + Γ(θ,θ)θ + p(θ) = 0, (3.19)

Page 58: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

34 3 Descricao do Sistema

em que

M(θ) =

Mm + Jm1 +m1l12 +m2L1

2 m2L1l2cos(θ1 − θ2)

m2L1l2cos(θ1 − θ2) Jm2 +m2l22

,

Γ(θ,θ) = m2L1l2sen(θ1 − θ2)

12 θ2 θ2 − 1

2 θ1

12 θ2 − θ1 −1

2 θ1

,

p(θ) =

gm1l1sen(θ1) + gm2L1sen(θ1)

gm2l2sen(θ2)

. (3.20)

3.2.2 Modelagem com Forcas

Para avancar com a abordagem Lagrangiana no tratamento do caso de um sistema

sob a influencia de forcas externas nao conservativas, como e o presente caso, utiliza-se o

conceito de trabalho virtual, δW , dado por

δW =2

i=1

Qi δθi, (3.21)

em que Qi sao as forcas generalizadas e δθi sao os deslocamentos virtuais que sao pequenos

deslocamentos realizados sob a acao do trabalho δW das forcas nao conservativas Qi. Com a

inclusao do trabalho virtual, a equacao de Lagrange e dada por

d

dt

(

∂L

∂θi

)

− ∂L

∂θi= Qi. (3.22)

As forcas nao-conservativas que atuam no pendulo duplo sao o atrito de Coulomb e

o atrito viscoso, na regiao das articulacoes, bem como a forca externa aplicada pelo motor

acoplado a haste 1.

O atrito viscoso, fv, ou amortecimento viscoso, e expresso por

fv = cθ, (3.23)

em que a constante de proporcionalidade c e chamada de coeficiente de amortecimento. O

Page 59: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.2 Modelagem Fenomenologica 35

atrito seco, fc, ou de Coulomb, tem a forma

fc =

−µN, θ > 0

0, θ = 0

µN, θ < 0

, (3.24)

em que N e a forca normal e µ e o coeficiente de atrito deslizante (do ingles,slip motion).

Note que a definicao da forca de atrito para θ = 0 nao e necessaria, pois essa singularidade

no movimento, na qual o objeto fica paralisado, ou emperrado (do ingles,stick motion), nao e

considerada (Liang e Feeny, 2004). A equacao (3.24) pode ser escrita na forma reduzida como

fc = b sinal(θ), (3.25)

em que b e o coeficiente de Coulomb.

Conforme Liang (2007), modelos de amortecimento nao-linear quadraticos podem ser

empregados no lugar de (3.25). Em (de Paula et al., 2006), por exemplo, o atrito de Coulomb

e suavizado pelo uso da funcao arctan.

Finalmente, a fonte de energia provem do torque externo gerado pelo motor que e

dado por

fe = ktia, (3.26)

em que kt e a constante de torque do motor e ia e a corrente de armadura do motor e e dada

por

ia =g(θ1)

(

Vasinal(θ1)−Ksθ1

)

Ra, (3.27)

em que g(θ1) modela a excitacao do motor como

g(θ1) ,

0 se, |θ1| ≥ γ,

1 se, |θ1| < γ,

(3.28)

o qual exerce um torque proporcional a corrente de armadura ia, caso o modulo da posicao

angular da haste 1 seja inferior ao limiar γ. Por simplicidade, a dinamica de ia nao e consid-

Page 60: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

36 3 Descricao do Sistema

erada em (3.27). Essa aproximacao e razoavel haja vista que a dinamica eletrica do motor

C.C. e desprezıvel quando comparada a dinamica do aparato mecanico.

A Figura 3.9 mostra o diagrama de corpo livre das hastes do pendulo duplo, exibindo

as forcas dissipativas e externas (desconsiderando a forca peso que ja foi contabilizada no caso

conservativo) que atuam nos pontos de articulacao O e J .

Ponto O

Ponto J

Ponto J

Figura 3.9: Diagrama de corpo livre das hastes do pendulo duplo.

Com base na Figura 3.9, a contribuicao das forcas (3.23),(3.25) e (3.26) nos desloca-

mentos virtuais δθ1 e δθ2 e expressa, conforme (3.21), por

δW = −(b1θ1 + b3sinal(θ1))δθ1 + (b2(θ2 − θ1) + b4sinal(θ2 − θ1))δθ1 + (3.29)

+feδθ1 − (b2(θ2 − θ1) + b4sinal(θ2 − θ1))δθ2,

logo, as forcas generalizadas que atuam em cada haste sao dadas por

Q1 = −(b1θ1 + b3sinal(θ1)) + (b2(θ2 − θ1) + b4sinal(θ2 − θ1)) + fe, (3.30)

Q2 = −(b2(θ2 − θ1) + b4sinal(θ2 − θ1)). (3.31)

Escrevendo (3.30)-(3.31) na forma matricial, tem-se

Q = −B1θ − F (θ)B2 + Fe. (3.32)

Page 61: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.3 Caracterizacao Dinamica 37

em que

B1 =

b1 + b2 −b2

−b2 b2

, B2 =

b3

b4

,

F (θ) =

sinal(θ1) −sinal(θ2 − θ1)

0 sinal(θ2 − θ1)

, Fe =

fe

0

, (3.33)

3.2.3 Modelagem Completa

Finalmente, ao combinar a equacao (3.32) com as equacoes (3.19) e (3.22), obtem-se

as equacoes dinamicas do pendulo duplo, amortecido e excitado, na abordagem Lagrangiana

como

M(θ)θ + Γ(θ,θ)θ +B1θ + F (θ)B2 + p(θ) = Fe, (3.34)

ou, alternativamente,

θ =

θ1

θ2

= M(θ)−1(Fe − Γ(θ,θ)θ −B1θ − F (θ)B2 − p(θ)). (3.35)

Para escrever a equacao dinamica do pendulo duplo em espaco de estados, define-se

o vetor de estados x , [θ1 θ2 θ1 θ2]T. Utilizando (3.35), encontra-se

x =

θ1

θ2

θ1

θ2

=

θ1

θ2

M(θ)−1(Fe − Γ(θ,θ)θ −B1θ − F (θ)B2 − p(θ))

(3.36)

Observe que (3.36) esta na forma (5.3) com w(t) = 0.

A Figura 3.10 mostra uma simulacao, com duracao de 10 segundos, do modelo (3.36)

com os parametros da Tabela 3.3 e condicoes iniciais x0 = [0 − 90 − 573/s 0/s].

3.3 Caracterizacao Dinamica

A simulacao do modelo (3.36) do pendulo duplo da bancada experimental, ilustrada

na Figura 3.10, mostra series temporais com oscilacoes irregulares, aparentemente aperiodicas,

Page 62: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

38 3 Descricao do Sistema

Tabela 3.3: Parametros do modelo do pendulo duplo.

Par. Valor Unidade Descricao

L1 0,273 m comprimento da haste 1

L2 0,216 m comprimento da haste 2

l1 0,158 m raio de giracao da haste 1

l2 0,125 m raio de giracao da haste 2

m1 0,297 kg massa da haste 1

m2 0,235 kg massa da haste 2

Jm1 74,14× 10−4 kgm2 momento inercia da haste 1

Jm2 36,71× 10−4 kgm2 momento inercia da haste 2

Mm 22× 10−6 kgm2 momento inercia do motor

b1 0,0010 Nm /rad coeficiente de amortecimento da junta 1

b2 0,000015 Nm /rad coeficiente de amortecimento da junta 2

b3 0,0010 Nm /rad coeficiente de Coulomb da junta 1

b4 0,00015 Nm /rad coeficiente de Coulomb da junta 2

g 9,81 m/s2 acelacao da gravidade

Ra 32 Ω resistencia da armadura do motor

La 30 mH indutancia da armadura do motor

Kt 0,0358 Nm/A constante de torque do motor

Ks 0,0358 V/rad/s constante de velocidade do motor

γ π/3 rad limiar de acionamento do motor

Va 19,0 volts tensao de armadura do motor

dos quatro estados do sistema. Series temporais com essas caracterısticas podem se originar

do caos determinıstico, de processos estocasticos ou de processos multi-periodicos, sendo que

esse ultimo se enquadra na classe dos processos regulares (Fiedler-Ferrara e Prado, 2009).

A possibilidade de que os sinais da Figura 3.10 sejam estocasticos e descartada, pois

esses sinais, como se sabe, foram gerados deterministicamente pelas equacoes diferenciais

(3.36), sem a presenca de ruıdo.

Por outro lado, a possibilidade de se tratar de caos determinıstico e possıvel pois o

sistema dinamico do pendulo duplo estudado obedece a um dos criterios para ser considerado

um sistema capaz de exibir comportamento caotico, que e possuir o mınimo de tres dimensoes

(Fiedler-Ferrara e Prado, 2009). No caso, o modelo do pendulo duplo define um sistema de

quatro dimensoes. Qi e colaboradores (2005) apresentam e analisam um sistema contınuo

autonomo caotico de quatro dimensoes.

A analise espectral, que e um dos metodos classicos de analise de sistemas, nao permite

distinguir processos regulares daqueles caoticos. Quando o processo regular e quasi-periodico

ou multi-periodico os picos de frequencia sao tao proximos que o espectro de frequencia que

se tem e praticamente contınuo assim como o espectro de frequencia de um sinal caotico

Page 63: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.3 Caracterizacao Dinamica 39

0s 5s 10s−180

−90

0

90

180

(a)θ 1

( ° )

t(s)

0s 5s 10s−1145

−570

0

570

1145 (b)

θ 1• (°

/s)

t(s)

0s 5s 10s−2000

−1000

0180

(c)

θ 2 (

° )

t(s)

0s 5s 10s−2865

−1432

0

1432

2865 (d)

θ 2• (°

/s)

t(s)

Figura 3.10: Simulacao livre do modelo do pendulo duplo. Em (a), a posicao angular da haste 1, θ1.Em (b), a velocidade angular da haste 1, θ1. Em (c), a posicao angular da haste 2, θ2, e,em (c), a velocidade angular da haste 2, θ2.

(Fiedler-Ferrara e Prado, 2009). E, portanto, necessario avaliar os invariantes dinamicos para

garantir a identificacao do caos em sistemas fısicos.

Abarbanel e colaboradores (1993) elaborou uma revisao bastante completa das fer-

ramentas para analise de dinamica nao-linear e como caracterizar o comportamento caotico

observada em sistemas fısicos. Ressalta-se aqui “sistemas fısicos” pelo fato de que, na maioria

dos casos, nao se sabe as equacoes que governam tais sistemas, impedindo procedimentos

analıticos, como o calculo da matriz Jacobiana, por exemplo. O que, em geral se considera, e

que ha disponıvel apenas a medicao direta de um dos estados do sistema fısico. Felizmente, e

possıvel determinar as invariantes dinamicas por meio de uma unica serie temporal.

Ha uma serie de estudos de caracterizacao do caos em sistemas mecanicos. Rifai e

colaboradores (2007) utiliza curvas de nıvel geradas por expoentes de Lyapunov para estu-

dar as caracterısticas da bacia de atracao de um pendulo massa-mola. A bacia de atracao

fornece entendimento sobre como o sistema se move em direcao a um conjunto invariante

do espaco de estados. Franca e Savi (2001) utilizam, alem dos expoentes de Lyapunov, a

dimensao do atrator e mapas de Poincare para diferenciar o movimento periodico do caotico

em um pendulo nao-linear experimental. Blazejcyk e Kapitaniak (1998) analisam o fenomeno

Page 64: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

40 3 Descricao do Sistema

da multi-estabilidade em um oscilador massa-mola com impacto. A multi-estabildade e car-

acterizada pela co-existencia de diferentes atratores caoticos para um mesmo conjunto de

parametros, e a condicao incial e que definira para qual atrator o sistema caminhara.

Com relacao ao pendulo estudado, Firmo (2007) conduziu uma serie de analises

numericas e experimentais para caracterizar sua dinamica. Essas analises incluem: analise

espectral, a reconstrucao do espaco de fases, estimativas do expoente de Lyapunov e da di-

mensao de correlacao do atrator. Todas essas analises foram feitas a partir da serie temporal

da velocidade angular da haste 1 e foi utilizado o pacote de algoritmos para analise nao-linear

de series temporais, TISEAN (Hegger et al., 1999). Como resultado, Firmo (2007) conclui

que o pendulo duplo e capaz de exibir dinamica caotica.

O parametro de bifurcacao e a tensao de armadura do motor, Va, embora os coefi-

cientes de atrito tambem possam conduzir o sistema ao caos. Veja, por exmeplo, os trabalhos

de Hinrichs e colaboradores (1997) e Feeny e Moon (1993) que abordam o efeito do atrito em

sistemas mecanicos com comportamento caotico.

Neste trabalho, nao sao calculados invariantes dinamicos para o novo modelo derivado,

(3.36), visto que o que diferencia esse modelo daquele apresentado por Firmo (2007) e a abor-

dagem utilizada para deriva-los. As propriedades principais do pendulo duplo experimental

sao consideradas em ambos os modelos. Mas, a fim de verificar quao semelhantes eles sao, do

ponto de vista estrutural, constroem-se os retratos de fases, a partir de dados simulados, para

os dois modelos com os mesmos parametros da Tabela 3.3. A Figura 3.11, com os retratos de

fases da haste 1, mostra que o novo modelo derivado sob a abordagem Lagrangiana parece ser

uma versao achatada do retrato de fases da mesma haste obtido para o modelo utilizado por

Firmo (2007). Verifica-se tambem, nos retratos de fases da haste 2, Figura 3.12, a presenca

caracterıstica de uma faixa central nestes retratos que tem a forma de um anel. Porem, a

largura do anel, no retrato de fases do modelo utilizado por Firmo (2007), e maior que a

apresentada no retrato de fases para o novo modelo derivado neste trabalho. Em suma, pode-

se perceber que o modelo segundo a abordagem Lagrangiana representa um pendulo duplo

cujas hastes oscilam com maior amplitude, porem com menos velocidade, em comparacao ao

modelo construıdo por Firmo (2007).

A proxima secao descreve uma das caracterısticas dos sistemas ditos caoticos que e a

imprevisibilidade.

Page 65: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.3 Caracterizacao Dinamica 41

−3 −2 −1 0 1 2 3−30

−20

−10

0

10

20

30 (b)

θ 1• (r

ad/s

)θ1 (rad)

−3 −2 −1 0 1 2 3−30

−20

−10

0

10

20

30 (a)

θ 1• (r

ad/s

)

θ1 (rad)

Figura 3.11: Retrato de fases da haste 1. Em (a), o retrato obtido da simulacao do modelo dado pelasequacoes de Lagrange, derivado neste trabalho. Em (b), o retrato obtido pela simulacao domodelo de Firmo (2007), em que se utiliza a abordagem das Leis de Newton de equilıbriode forcas e momento.

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

1−80

−60

−40

−20

0

20

40

60

80

cos(θ2)

(a)

sen(θ2• )

θ 2• (ra

d/s)

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

1−80

−60

−40

−20

0

20

40

60

80

cos(θ2)

(b)

sen(θ2• )

θ 2• (ra

d/s)

Figura 3.12: Retrato de fases da haste 2. Em (a), o retrato obtido da simulacao do modelo dado pelasequacoes de Lagrange, derivado neste trabalho. Em (b), o retrato obtido pela simulacao domodelo de Firmo (2007), em que se utiliza a abordagem das Leis de Newton de equilıbriode forcas e momento.

3.3.1 O Caos e a Imprevisibilidade

A principal caracterıstica da dinamica caotica determinıstica e a dependencia sensi-

tiva as condicoes iniciais. A essa caracterıstica estao associados os atratores estranhos e a

imprevisibilidade.

Page 66: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

42 3 Descricao do Sistema

Veja a Figura 3.13. Ela mostra a simulacao do modelo do pendulo duplo partindo de

condicoes iniciais muito proximas. Entretanto, pode-se observar que as trajetorias seguidas

por cada uma delas divergem em um prazo curto do tempo. Esse prazo de tempo e funcao

nao somente do erro na condicao inicial, mas, tambem, da condicao inicial em si, como aponta

Palmer (2000).

0 5 10 15−200

0

200 (a)

θ 1(

° )

t(s)

0 5 10 15−1145

−570

0

570

1145 (b)

θ 1• (°

/s)

t(s)

0 5 10 15−200

0

200 (c)

θ 2 (

° )

t(s)

0 5 10 15−2865

−1432

0

1432

2865 (d)

θ 2• (°

/s)

t(s)

Figura 3.13: Sensibilidade a condicoes iniciais exibida pelo modelo do pendulo duplo. A curva azulpartiu da condicao inicial [θ1 θ2 θ1 θ2]

T = [0,99π 0 0 0]T. A curva vermelha partiu dacondicao incial [0,9888π 0 0 0]T. Perceba que a diferenca de θ1, entre os dois casos, emuito pequena.

Um aspecto interessante da previsao em sistemas caoticos e esse: a condicao inicial

afeta a taxa com que o erro inicial de predicao cresce. Isso ocorre porque a divergencia das

trajetorias, ao longo do tempo, sao mais ou menos expressivas dependendo da regiao do atrator

Page 67: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

3.3 Caracterizacao Dinamica 43

caotico que o sistema se encontra. A divergencia media local de orbitas e avaliada por meio

do caculo do expoente de Lyapunov. Portanto, outra relacao acerca do perıodo de tempo em

que se faz previsoes precisas e que ele e inversamente proporcional ao maximo expoente de

Lyapunov (Aguirre e Billings, 1994). Segundo Abarbanel e colaboradores (1993), a entropia

de Kolmogorov-Sinai fornece uma declaracao precisa a respeito dos limites de previsibilidade

de um sistema nao-linear.

Outro fator que prejudica a previsibilidade e a incerteza na formulacao do modelo do

sistema (Palmer, 2000). De fato, um bom modelo de predicao nao deve ser apenas confiavel, no

sentido de se ajustar a um conjunto de dados, mas tambem deve ser representativo (Abarbanel

et al., 1990; Aguirre e Billings, 1994).

O fenomeno da imprevisibilidade e de muita importancia para esse trabalho ja que

os estimadores recurssivos baseados no KF possuem uma etapa de predicao.

Propagar incertezas em um modelo que apresenta comportamento caotico nao e uma

tarefa simples visto que a PDF da incerteza inicial evolui para distribuicoes multi-modais

complicadas, de alta ordem. O artigo de Khalil e colaboradores (2009) mostra a transicao de

uma PDF inicialmente uniforme para situacoes com e sem ruıdo. Kapitaniak (1990) mostra

que ha uma analogia entre a transicao da PDF e o diagrama de bifurcacao de sistemas de-

terminısticos. Dependendo do passo de integracao do modelo, uma variavel Gaussiana pode

se descaracterizar completamente, podendo afetar o desempenho do estimador que considera

apenas os dois momentos principais (media e covariancia).

Page 68: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 69: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Capıtulo 4

Medicao dos Angulos do Pendulo usando

Processamento de Imagens

Socrates - Dessa forma, tais homens nao atribuirao realidade senao as sombras dos objetos

fabricados?

Glauco - Assim tera de ser.

Platao, A Republica, v. II p. 105 a 109

4.1 Definicao do Problema

Por meio de uma camera digital (ver Secao 3.1.2), e obtida uma imagem de entrada,

do pendulo duplo, no modelo de cor RGB (ver Secao 4.2) e resolucao de 640× 480 pixels. A

Figura 4.1 ilustra a imagem de entrada mencionada.

Objetiva-se obter uma estimativa dos angulos θ1 e θ2 formados pelas hastes do pendulo

duplo utilizando metodos de processamento de imagem. Para facilitar a tarefa e aumentar a

precisao das estimativas, sao fixados tres cırculos, com componente de cor proxima damagenta,

na estrutura do pendulo. Esse artifıcio e, de forma semelhante, adotada em outros trabalhos

(Wenzel et al., 2000; Tu e Ho, 2010; Teeple et al., 2009). Wang e colaboradores (2008) e

Wang e colaboradores (2010) optam por colocar um LED infra–vermelho na extremidade do

pendulo, enquanto que Espinoza-Quesada e Ramos-Velasco (2006) nao utilizam nenhum tipo

de auxılio.

Alem dos cırculos, e de interesse do sistema de processamento de imagem definir o

estado, aceso ou apagado, do LED de sincronismo (ver Secao 3.1.4), cuja cor, predominante-

mente, alterna entre o verde claro (quando aceso) e o verde escuro (quando apagado).

A excecao dos cırculos e do LED, os demais elementos da imagem, como a mesa, a

Page 70: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

46 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

estante e as hastes do pendulo, sao considerados plano de fundo.

Figura 4.1: Imagem amostrada de um vıdeo produzido pela camera digital utilizada para o senso-riamento do movimento das hastes do pendulo duplo. Essa imagem e gerada no padraode cor RGB com resolucao de 640 × 480 pixels. Repare a existencia de tres marcas decor homogenea (proxima da magenta) na estrutura do pendulo e de um LED verde nocanto superior esquerdo. Tais artefatos sao utilizados pelo algoritmo de processamento deimagem apresentado da Secao 4.4.

Os cırculos coloridos, por estarem fixados a haste do pendulo, se movimentam, ocu-

pando diferentes posicoes a cada quadro de imagem obtido pela camera. Por outro lado, o

LED permanece fixo na regiao superior esquerda do quadro de imagem. Dessa forma, co-

existem duas regioes de interesse (ROI, do ingles region of interest). A primeira ROI, cujos

limites sao dinamicos, contem os tres cırculos que se movimentam; e a segunda tem limites

estaticos e engloba o espaco na imagem ocupado pelo LED.

Para inferir os valores dos angulos θ1 e θ2, e necessario localizar as centroides dos

cırculos fixados as hastes. Defina os centroides, C1, C2, e C3, como

Ci(k) = (xi(k), yi(k)), i = 1,2,3, (4.1)

em que i denota o ındice do cırculo, k ∈ N, tal que k ≤ L, e a ordem ocupada pela imagem

na sequencia das L imagens produzidas pelo vıdeo, xi e yi sao as coordenadas cartesianas da

centroide do cırculo i. O cırculo 1 (i = 1) e aquele fixado no rolamento do eixo que liga a

haste 1 ao suporte, o cırculo 2 (i = 2) esta localizado no rolamento do eixo que une a haste 1

com a haste 2, e o cırculo 3 (i = 3) esta localizado na extrema ponta da haste 2.

Page 71: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4.2 Parametrizacao de Imagens Digitais 47

Dessa forma, calculam-se as estimativas da seguinte maneira

θ1 =

0, se x2 = x1 e y2 > y1,

π, se x2 = x1 e y2 < y1,

π2 sinal(x2 − x1), se y2 = y1,

π2 + sinal(y1 − y2)

[

π2 − arctan

(

x2−x1|y2−y1|

)]

, caso contrario,

(4.2)

θ2 =

0, se x3 = x2 e y3 > y2,

π, se x3 = x2 e y3 < y2,

π2 sinal(x3 − x2), se y3 = y2,

θ1 − sinal(θ1)π, se a haste 2 estiver dentro da haste 1,

π2 + sinal(y2 − y3)

[

π2 − arctan

(

x3−x2|y3−y2|

)]

, caso contrario.

(4.3)

A proxima secao traz alguns dos fundamentos principais sobre processamento de

imagem digital para que, na secao subsequente, os metodos de processamento de imagem,

implementados pelo algoritmo de processamento de imagem, sejam introduzidos.

4.2 Parametrizacao de Imagens Digitais

Uma imagem, em geral, pode ser descrita por uma funcao bi-dimensional, g(x,y),

em que (x,y) denotam as coordenadas espaciais e g(x,y) corresponde a um valor do espaco

caracterıstico, Γ, da imagem no ponto (x,y) (Pal e Pal, 1993). Tal espaco caracterıstico

depende do tipo da fonte de iluminacao e do dispositivo que visualiza a cena (Gonzalez e

Woods, 2002). Alem disso, se, para formar a imagem, ocorrer um processo no qual tanto o

espaco de coordenadas, (x,y), quanto o valor caracterıstico, g(x,y), forem digitalizados, tal

imagem resultante e uma imagem digital (Pal e Pal, 1993).

Uma imagem digital, portanto, pode ser definida por um numero finito de matrizes

Gi ∈ DM×Ni em que M × N definem o tamanho da imagem tal que 0 ≤ x ≤ (M − 1) e

0 ≤ y ≤ (N − 1), e Di = d1, d2, · · · ,dI, dj ∈ Z, j = 1, · · · ,I e o conjunto de nıveis discretos

do espaco caracterıstico Γ. E i = 1, · · · ,l e o ındice da camada da imagem tal que l = 1, para

imagens monocromaticas e, em geral, l = 3 para imagens em cores.

Page 72: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

48 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

Note que uma imagem digital pode ser matematicamente representada por uma ma-

triz com M ×N pontos, sendo que, cada ponto, ou elemento da figura, recebe o nome de pixel

(Gonzalez e Woods, 2002). A Figura 4.2 mostra a distribuicao dos pixels de uma imagem e a

convencao que se utiliza para localiza-los.

Figura 4.2: Representacao da imagem digital como um conjunto de pontos dispostos em linhas e col-unas, assim como uma matriz. Cada ponto, ou elemento da matriz, e chamado pixel.

Para compreender, de forma simplificada, um processo de formacao de imagem digital,

tem-se o exemplo ilustrativo da Figura 4.3. Em geral, a formacao da imagem digital e dividida

em etapas de aquisicao, amostragem e quantizacao. Neste exemplo, a aquisicao ocorre pela

projecao do objeto na superfıcie retangular que faz o papel de um sensor, Figura 4.3-(a). Essa

superfıcie sensora contem subdivisoes identicas, e, assim, e feita a amostragem espacial da

imagem do objeto.

Agora, considera-se, por simplicidade, que cada elemento sensor seja sensıvel ao seu

grau de preenchimento. Portanto, o espaco de caracterısticas e definido por um unico compo-

nente, nesse caso, o grau de preenchimento da projecao da imagem no sensor. Em seguida, a

etapa de quantizacao associa a resposta de cada elemento a um dos quatro nıveis de quanti-

zacao pre-estabelecidos (conforme Figura 4.3b), promovendo, dessa forma, a digitalizacao do

valor caracterıstico naquela regiao e finalizando a formacao da imagem digital.

A imagem digital deste exemplo pode ser visualizada em um monitor monocromatico

que transforma o valor do pixel em uma nıvel de cinza, Figura 4.3-(c).

O espaco de caracterısticas e que permite distinguir uma imagem monocromatica

Page 73: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4.2 Parametrizacao de Imagens Digitais 49

2 - preenchimento

intermediário

3 - pouco

preenchido

1 - totalmente

preenchido

23 1

(a) (b) (c)

4 4 4 4 4 4 4 4 1 2 4 4

4 4 4 4 4 4 4 4 1 2 4 4

4 4 4 4 4 4 4 3 1 2 4 4

4 4 4 4 4 4 4 2 1 1 4 4

4 4 4 4 4 2 1 1 1 2 4 4

4 4 4 4 2 1 1 2 3 4 4 4

4 4 2 1 1 1 4 4 4 4 4 4

2 1 1 1 2 4 4 4 4 4 4 4

2 1 1 2 4 4 4 4 4 4 4 4

3 2 2 4 4 4 4 4 4 4 4 4

4 - não

preenchido4

Figura 4.3: Ilustracao hipotetica de um processo de formacao de imagem digital, a partir da imagemnatural de um objeto, para exemplificar, simplificadamente, as etapas de: (a) amostragem,e (b) quantizacao. O conjunto discreto de valores caracterısticos formado pelos elementostotalmente preenchido, preenchimento intermediario, pouco preenchido e nao preenchido,sao numerados de 1 a 4, respectivamente, pela etapa de quantizacao. A parte (c) destafigura representa a visualizacao da imagem digital em escala de cinza.

de uma imagem em cores. No caso da imagem monocromatica, o espaco de caracterıstica

e formado apenas pela informacao da intensidade luminosa, ou brilho; e o conjunto discreto

caracterıstico, D = 0,1, · · · ,255, por exemplo, e comumente chamado de escala de cinza, em

que 0 corresponde ao preto e o valor maximo (nesse caso 255) ao branco.

Para produzir as imagens em cores, outros atributos da fonte luminosa, alem do brilho,

sao utilizados, como, por exemplo, a cor e a saturacao. A cor e a caracterıstica associado ao

espectro de frequencia visual, e a saturacao e uma medida da quantidade de branco de uma

cor. Esses tres atributos, ou componentes do espaco caracterıstico Γ, brilho, cor e saturacao,

chamado de modelo de cor HSI, permitem distinguir uma cor de outra.

Tres outros componentes alternativos foram derivados pela forma como o sistema

visual humando distingue as cores. Como se sabe, as celulas sensoras do sistema visual

humano sao sensıveis aos estımulos na banda de frequencia do vermelho, do azul e do verde.

A partir disso, foi criado o modelo de cor RGB, do ingles Red (vermelho), Green (verde) e

Blue (azul).

A Figura 4.4 e um diagrama que mostra os componentes da percepcao visual e mostra

a relacao entre os modelos de cor HSI e RGB.

Para obter imagens em cores, muitas cameras utilizam sensores sensıveis aos tres estı-

mulos, R, G e B. Sobre cada canal sensorial, sao executadas as tres etapas basicas da formacao

da imagem digital (aquisicao, amostragem e quantizacao) resultando em tres matrizes, ou tres

Page 74: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

50 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

Brilho

Branco

Preto

SaturaçãoCor

BG

R

Figura 4.4: Componentes da percepcao visual. Aqui, dois modelos de cor sao mostrados simultanea-mente para que se observe a relacao entre os dois. O modelo de cor HSI e formado pelascomponentes: cor (H), saturacao (S) e brilho, ou intensidade, (I). E o modelo de cor RGBe caracterizado pelos tres estımulos de cor: vermelho (R), verde (G) e azul (B). Fonte:(Pratt, 2001).

camadas. A Figura 4.5 ilustra esse processo.

R

G

B

Monitor

RGB

Figura 4.5: Esquema de formacao (ou decomposicao) de uma imagem no modelo de cor RGB dado pelacombinacao de tres camadas monocromaticas correspondentes a cada um dos estımulos.

Cada pixel possui quatro vizinhos verticais e horizontais cujas coordenadas sao (x+

1,y),(x − 1,y),(x,y + 1) e (x,y − 1). Esse conjunto de pontos e denotado por V4(p). Outros

vizinhos estao localizados na diagonal, nas coordenadas (x+1,y+1),(x+1,y−1),(x−1,y+1)

e (x−1,y−1), e sao denotados por VD(p). No total, um pixel possui 8 vizinhos, exceto aqueles

casos em que o pixel de referencia esta localizado nas bordas da imagem.

Page 75: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4.3 Metodos de Processamento de Imagem 51

4.3 Metodos de Processamento de Imagem

4.3.1 Realce da Imagem

As tecnicas de realce de imagem sao usadas para melhorar a aparencia visual de

uma imagem ou converte-la para um formato que simplifique a analise a ser feita por um

sistema computadorizado ou pelo sistema visual humano (Pratt, 2001; Huang et al., 2006;

Kaiqi et al., 2005). Como aponta Cheng e Shi (2004), o realce da imagem e uma das questoes

mais importantes em aplicacoes menos complexas de processamento de imagem.

O objetivo desejado ao aplicar uma tecnica de realce varia conforme a aplicacao.

Para o realce de textura, em que o objetivo e enaltecer detalhes tais como bordas e linhas, os

metodos de realce podem ser agrupados, segundo Huang e colaboradores (2006), como aqueles

baseados na reducao de ruıdo (filtragem) ou aqueles baseados em contraste. Quanto ao ultimo

tipo, eles recebem diferentes classificacoes por parte de outros autores. Kaiqi e colaboradores

(2005) classificam as tecnicas de realce de imagem baseada em contraste segundo o tipo de

operador utilizado, podendo ser espacialmente uniforme ou espacialmente nao-uniforme. E,

Cheng e Shi (2004), dividem tais tecnicas entre local ou global.

Os metodos de filtragem propoem reduzir o ruıdo sem degradar os detalhes presentes

na imagem. A filtragem linear, tambem conhecida como filtragem de media, e uma operacao

de vizinhanca que trabalha com os valores dos pixels na imagem alvo, I, e com o valor

correspondente de uma sub-imagem, Imsk, que tem a mesma dimensao que a da vizinhanca

considerada, chamada de mascara. Os valores dos pixels da mascara sao os coeficientes do

filtro. Em geral, a filtragem linear de uma imagem I de tamanho M ×N com uma mascara

de filtragem Imsk de tamanho m× n e dada pela expressao:

Ifilt(c,r) =

a∑

t=−a

b∑

s=−b

Imsk(s,t)I(c+ t, r + s), (4.4)

em que a = (m−1)/2 e b = (n−1)/2. Para filtrar uma imagem completamente, essa equacao

deve ser aplicada para c = 0,1,2, · · · ,M − 1 e r = 0,1,2, · · · ,N − 1.

O processo de filtragem consiste simplesmente em movimentar a mascara do filtro

sobre a imagem alvo e, a partir disso, recalcular novos valores para cada pixel da imagem

alvo. No caso do filtro de media, a cada ponto (c,r) da imagem alvo, calcula-se o novo

valor correspondente na imagem filtrada usando uma relacao predefinida dada pela soma de

produtos dos coeficientes do filtro com o pixel correspondente na imagem alvo na area coberta

Page 76: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

52 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

pela mascara do filtro. Porem, o filtro de media tem o efeito indesejado de borrar alguns

detalhes da imagem, como as bordas (Gonzalez e Woods, 2002). Uma alternativa e o uso do

filtro nao-linear, como por exemplo, o filtro de mediana, que e um dos mais conhecidos por

preservar bem os detalhes da imagem, alem de suprimir ruıdos impulsivos. Ko e Lee (1991)

apresenta duas extensoes do filtro de mediana, que sao o filtro de mediana com ponderacao

central (CWM) e o filtro de mediana com ponderacao central adaptativa (ACWM), sendo que

o ultimo exibe bons resultados tambem na supressao de ruıdos multiplicativos.

Os metodos de contraste, por enfatizar os conteudos de alta frequencia da imagem

a fim de evidenciar os detalhes, lidam com a questao da sensibilidade ao ruıdo e com os

problema de sobre-contraste, que e a elevacao do contraste em regioes que ja possuiam um

alto contraste, e de distorcao da imagem (Polesel et al., 2000).

Naik e Murthy (2003) apresentam um metodo de contraste para imagens em cores

que mantem a coloracao inalterada. Tal metodo consiste em aplicar uma transformacao aos

tres componentes de cor do RGB normalizados, (c1,c2,c3), por um mesmo fator de escala,

α, de modo que os novos valores dos componentes de cor sao dados por ci = αci, em que

ci ∈ [0, 1]. Para encontrar α, utiliza-se a funcao de realce frealce expressa por

frealce(z) =

δ1 + (m− δ1)(z−δ1m−δ1

)n , δ1 ≤ z ≤ m,

δ2 + (δ2 −m)( δ2−zδ2−m)n , m ≤ z ≤ δ2,

(4.5)

em que m e n sao duas constantes, z, frealce, ∈ [δ1 δ2]. No nosso caso, z = c1 + c2 + c3.

Sabendo-se que ci ∈ [0, 1] , o maior valor possıvel para z, representado por δ2, e 3. De forma

semelhante, o menor valor para z, representado por δ1, e 0. Logo, δ1 = 0 e δ2 = 3. A partir

de z e da equacao (4.5), calcula-se

α(z) =frealce(z)

z. (4.6)

Caso se verifique que α > 1, a transformacao deve ser feita no espaco de cor CMY .

O espaco CMY , cuja sigla corresponde as cores ciano, magenta e amarelo, respectivamente,

e o complemento do espaco de cor RGB. Para realizar a mudanca de espaco de cores RGB

para CMY , substitui-se z por u, em que u = d1+ d2+ d3, e di = 1− ci. Apos essa conversao,

calcula-se a transformacao nos componentes de cor CMY , por meio de di = αdi. Em seguida,

eles sao convertidos de volta para RGB.

Page 77: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4.3 Metodos de Processamento de Imagem 53

Aplicando os metodos de filtragem de media e de contraste, acima mencionados, na

imagem original do pendulo duplo exibida na Figura 4.1, obtem-se a sequencia de resultados

mostrado na Figura 4.6. Para auxiliar na analise, o histograma das imagens, que exibe a

distribuicao de pixels com o mesmo valor de intensidade, e colocado (ver Figuras 4.7 e 4.8). A

informacao procurada, que sao os tres cırculos de cor magenta, esta localizada nos picos que

aparecem na faixa de 50 a 100 do eixo de intensidade dos histogramas das Figuras 4.7a-c. Os

histogramas das Figuras 4.7d-f mostram o efeito suavizador do filtro de media pela eliminacao

de picos estreitos. Esse condicionamento ajuda o algorimto de processamento de imagens

a nao indentificar falsas regioes. O efeito do contraste, visto pelos histogramas das Figuras

4.8d-f, e o de deslocar, para direita, a faixa onde aparecem a informacao de interesse na figura

original para a faixa de 100 a 150 na figura realcada. Isso provoca um isolamento da faixa de

interesse facilitando a etapa de segmentacao do algoritmo de processamento de imagem que

sera descrita a seguir. Uma desvantagem do contraste e o aparecimento de picos indesejados,

como se observa na faixa de 200 a 250 do eixo de intensidade do histograma.

(a) (b) (c)

Figura 4.6: Etapas de realce da imagem do pendulo duplo. A imagem original (a), e inicialmentefiltrada, figura (b), por um filtro de media cuja mascara tem tamanho 3× 3. Em seguida(c), um realce de contraste, com a propriedade de preservar a coloracao da imagem, eaplicado.

4.3.2 Segmentacao

O processo de segmentacao consiste em particionar um conjunto A em subconjuntos

(regioes), S1, · · · ,Sn, conectados, porem, que nao se interceptam. Cada regiao e homogenea

e a uniao de duas regioes nao vizinhas tambem e homogenea. Formalmente, a segmentacao e

descrita por (Pal e Pal, 1993; Cheng et al., 2001)

n⋃

i=1

Si = A e Si ∩ Sj = , para i 6= j, (4.7)

Page 78: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

54 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (a)

R

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (d)

R

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (b)

G

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (e)

G

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (c)

B

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (f)

B

Figura 4.7: Em (a)- (c), histograma das camadas R,G,B, respectivamente, da imagem original. E de(d)- (f), histograma das camadas R,G,B, respectivamente, da imagem filtrada.

tal que o predicado de homogeniedade P (Si) = verdadeiro para todas as regioes Si e P (Si ∩Sj) = falso, quando i 6= j e Si e Sj sao vizinhos. O predicado de homogeniedade e um criterio

baseado em alguma caracterıstica discriminante do pixel, como o nıvel de cinza.

De fato, as tecnicas de segmentacao para imagens monocromaticas foram as primeiras

a serem trabalhadas. Dentre elas estao a segmentacao por deteccao de limiar (thresholdind),

segmentacao por formacao de agrupamentos (clusters), segmentacao baseada em regiao, seg-

mentacao baseada em teoria nebulosa, segmentacao baseada em redes neurais, segmentacao

por relaxacao, e segmentacao por superfıcie. O trabalho de Pal e Pal (1993) fornece uma boa

revisao dos principais metodos.

As abordagens mencionadas utilizam o conceito de predicado de homogeniedade,

porem, pode-se realizar a segmentacao, diferentemente, via deteccao de descontinuidades no

nıvel de cinza ao percorrer os pixels da imagem. Segundo Pal e Pal (1993), resultados mais

significativos podem ser obtidos ao fundir os dois conceitos.

Grande parte das metodologias para segmentacao de imagens monocromaticas podem

ser extendidas para imagens em cores (Cheng et al., 2001). Para isso, por exemplo, basta

aplicar o metodo para cada componente de cor e combinar os resultados, de alguma maneira,

para obter o resultado final (Cheng et al., 2002).

Imagens em cores tem a vantagem de fornecer informacao adicional a intensidade se

comparada com imagens em escala de cinza. Tal informacao e a informacao de cor, dada pelo

espaco de cores sob o qual a imagem e formada (Cheng et al., 2001). Portanto a escolha de

Page 79: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4.3 Metodos de Processamento de Imagem 55

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (a)

R

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (d)

R

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (b)

G

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (e)

G

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (c)

B

0 50 100 150 200 2500

1

2

3

4

5x 10

−3 (f)

B

Figura 4.8: Em (a)- (c), histograma das camadas R,G,B, respectivamente, da imagem original. Ede (d)- (f), histograma das camadas R,G,B, respectivamente, da imagem realcada emcontraste.

um espaco de cores efetivo, com alto poder discriminante, e essencial (Ohta et al., 1980).

Apos um estudo comparativo, na qual 100 tipos diferentes de caracterısticas de cor

foram testadas, Ohta e colaboradores (1980) encontrou um espaco de cores, denominado

I1I2I3, com essa propriedade discriminante, muito util para um esquema de segmentacao.

Esse espaco e calculado a partir do espaco de cores RGB da seguinte forma

I1 =R+G+B

3,

I2 =R−B

2,

I3 =2G−R−B

4. (4.8)

note que o espaco I1I2I3 e uma transformacao linear do espaco RGB. Isso e interessante,

pois, normalmente, como alternativa as desvantagens do espaco RGB, recorre-se a alguma

transformacao nao-linear.

A Figura 4.9 e o resultado da decomposicao da imagem do penculo realcada, Figura

4.6-(c), nos tres componentes I1, I2, e I3, apos a mesma ser transformada pelas equacoes (4.8).

Observe que a componente I2, Figura 4.9(b), praticamente segmentou as regioes ref-

erentes os cırculos de cor magenta da imagem original da Figura 4.1. O grafico de superfıcie,

cujo valor de superfıcie equivale ao nıvel de intensidade, da Figura 4.10, mostra os picos de

Page 80: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

56 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

(a) (b) (c)

Figura 4.9: Decomposicao da imagem realcada, Figura 4.6-(c), nos componentes (a) I1, (b) I2 e (c)I3, do espaco de cor definido por Ohta e colaboradores (1980).

intensidade correspondentes a tais regioes, para melhor visualizacao.

Figura 4.10: Superfıcie gerada pela intensidade da componente I2 avaliada em cada ponto da imagem.

Aplicando a funcao de limiar da forma

g(x,y) =

1, se f(x,y) ≥ T,

0, se f(x,y) < T,

(4.9)

a esta imagem, em que T = 0,3, obtem-se a imagem segmentada da Figura 4.11.

Uma outra maneira de alcancar esse resultado e utilizar todos os tres componentes de

Page 81: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4.3 Metodos de Processamento de Imagem 57

x

y

Figura 4.11: Imagem da Figura 4.9(b) segmentada pela funcao de limiar g(x,y). Cada pixel e classifi-cado como 1 ou 0.

cor da imagem. Para isso, define-se um predicado de homogeniedade baseado na similaridade

de cor. Essa maneira e muito utilizada em esquemas de segmentacao de cor, principalmente

na abordagem de segmentacao por regiao, como os esquemas de crescimento de regiao (region

growing), separacao de regiao (region splitting) e fusao de regiao (region merging). O uso de

similaridade de cor pode ser utilizado em qualquer modelo de cor, embora modelos de cor

sensıveis a variacao de luminosidade, sombras, e textura, como e o caso do modelo RGB,

dificulte seu uso (Cheng et al., 2001).

A similaridade de cor entre dois pixels, p1 e p2, pode ser medida pela distancia

euclidiana, Dp1,p2 , entre eles no espaco de cor que os define Gonzalez e Woods (2002). Supondo

que o espaco de cor seja o I1I2I3, tem-se que

Dp1,p2 =√

(I1,p1 − I1,p2)2 + (I2,p1 − I2,p2)

2 + (I3,p1 − I3,p2)2. (4.10)

Calculando (4.10) para todos os pixels da imagem da Figura 4.6-(c), descritos no

espaco I1I2I3 , em que p1 e o pixel no ponto (x,y) e p2 corresponde a cor a ser segmentada,

que e a cor magenta convertida de RGB para I1I2I3, obtem-se a superfıcie de similaridade

mostrada na Figura 4.12.

Aplicando a funcao de limiar da forma

g(x,y) =

1, se f(x,y) ≤ T,

0, se f(x,y) >, T

(4.11)

a esta imagem, em que T = 0,05, obtem a imagem segmentada da Figura 4.13.

Page 82: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

58 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

Figura 4.12: Superfıcie de similaridade gerada pelo calculo da distancia euclidiana, no espaco I1I2I3,entre cada pixel da imagem realcada e o valor do pixel de referencia para segmentacao.

x

y

Figura 4.13: Imagem da Figura 4.6(c) segmentada pela funcao de limiar g(x,y) aplicada a superfıciede similaridade da Figura 4.12. Cada pixel e classificado como 1 ou 0

4.4 Algoritmo de Processamento de Imagem Implementado

O algoritmo de processamento de imagem desenvolvido foi escrito e testado no ambi-

ente Matlab utilizando uma ferramenta de processamento de imagem chamada Image Pocess-

ing Toolbox, versao 7.0.

Os arquivos de vıdeo do movimento do pendulo sao gerados pela camera (ver Secao

3.1.2) no formato “.avi”, utilizando o padrao de compressao de dados (codec), “DIVX”. A

Image Pocessing Toolbox disponibiliza uma funcao de leitura de vıdeos, chamada mmreader,

capaz de ler o formato “.avi” e de acessar o descompressor de dados adequado, neste caso, um

descompressor para “DIVX”, desde que ele esteja instalado no sistema do computador.

O vıdeo, entao, e lido e armazenado em um conjunto de L matrizes tri-dimensionais,

em que L e o numero total de quadros do vıdeo e cada dimensao da matriz e uma camada no

Page 83: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

4.4 Algoritmo de Processamento de Imagem Implementado 59

formato RGB. O valor de cada elemento da matriz, ou pixel, varia entre 0 e 255.

O fluxograma do algoritmo e mostrado na Figura 4.14. A entrada do algoritmo e a

matriz de camadas RGB.

As etapas de filtragem e realce sao feitas, conforme mostra a Secao 4.3.1, utilizando

os metodos de filtragem de media e o metodo de Naik e Murthy (2003), respectivamente.

Para a segmentacao, opta-se por segmentar o componente I2 da imagem RGB con-

vertida em I1I2I3, conforme mostra a Secao 4.3.2, pela equacao de transformacao (4.8). Nao

se utiliza o criterio de similaridade de cor pois o mesmo aumentaria o custo computacional

alem de ser mais sensıvel ao limiar de corte utilizado para segmentar a cor.

Uma funcao da Image Pocessing Toolbox, capaz de localizar as centroides e encontrar

a area de um conjunto de pixels, de mesmo valor, conectados, e aplicada a imagem segmentada

para retornar as centroides C1, C2 e C3 (ver equacao (4.1)). Em seguida, as equacoes (4.2)-

(4.3) sao aplicadas para obter as estimativas de θ1 e θ2, respectivamente, finalizando o objetivo

do algoritmo.

I Imagem3,RGB

ROI 480 x 640

Ifilt

Ienh

Filtro de Média Máscara 3x3

Xbin I2 < Limiar

Localiza os pontos

Num. Pontos == 3 ?

Estima os ângulos

Define a região de interesse :

Etapa 1 de Realce (Filtragem) :

: Etapa 2 de Segmentacão

(Corte de Limiar)

[r g b]= [R G B]/255;Normaliza as componentes RGB :

Funcão contrasteEtapa 2 de Realce (Contraste) :

Início

I conversão (Ienh)3,I1 I2 I3Etapa 1 de Segmentacao

(Converte o modelo de cor) :

Limiar := 0,22

I2 I3,I2normaliza( )

Sim

Num. Pontos == 2 ?

Sim

ROI == 480 x 640 ?Sim

Não

Limiar == 0,30 ?

Sim

Aumenta a ROI

Limiar := Limiar + 0,02

Não

Não

I Imagem3,RGB

Figura 4.14: Fluxograma do algoritmo de processamento de imagens. A informacao de entrada e umaimagem e o algoritmo retorna os angulos θ1 e θ2 formado pelas hastes do pendulo.

O resultado do algoritmo de processamento de imagem para um vıdeo do pendulo

obtido a uma taxa de 20Hz, com um total de 280 imagens (ou quadros) e mostrado na Figura

Page 84: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

60 4 Medicao dos Angulos do Pendulo usando Processamento de Imagens

4.15. As imagens desse vıdeo, em particular, apresenta muita variacao de intensidade de uma

para outra, e o algoritmo mostra-se bastante robusto nesse aspecto.

1 2 3 4 5 6 7 8 9 10 11 12 13 14

−90

0

90

(a)

θ 1(

° )

t(s)

1 2 3 4 5 6 7 8 9 10 11 12 13 14

−180

−90

0

90

180

(b)

θ 2 (

° )

t(s)

Figura 4.15: Serie temporal experimental produzida pelo algoritmo de processamento de imagem.

Page 85: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Capıtulo 5

Questoes Praticas de Implementacao

Algumas questoes preliminares, importantes para o caso em estudo, sao vistas nas

secoes 5.1 e 5.2. A primeira delas trata de verificacoes experimentais que motivam uma

pequena alteracao no modelo do pendulo duplo, usado na etapa de predicao do filtro, de-

senvolvido no Capıtulo 3. Alem disso, na Secao 5.1 sugere-se investigar o caso do estimador

utilizar apenas as medicoes das posicoes angulares. A Secao 5.2 discute alguns aspectos prati-

cos da implementacao do estimador, como, por exemplo, a maneira de se utilizar o modelo

de tempo contınuo do pendulo duplo no estimador de tempo discreto e a questao do compor-

tamento numerico do filtro durante a execucao. Na Secao 5.3, apresenta-se as metricas de

desempenho utilizadas pra avaliar o filtro e, por fim, na Secao 5.4 discute-se sobre a sintonia

do filtro que esta diretamente relacionada com o bom desempenho do mesmo.

5.1 Verificacoes Experimentais

A analise experimental, de sistemas mecanicos, e geralmente complexa (de Paula

et al., 2006). Assim, na tentativa de se obter bons resultados experimentais, em problemas

de estimacao de estados, e importante que os sinais estejam bem condicionados e que os

parametros do modelo estejam proximos dos valores verdadeiros. Nesse sentido, esta secao

trata inicialmente do procedimento de condicionamento do sinal de velocidade angular da

haste 1. Em seguida, trata-se de como obter estimativas iniciais para os coeficientes de atrito

viscoso e de Coulomb do modelo do pendulo duplo. Isso pode contribuir para a estimacao

recursiva de tais parametros.

Page 86: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

62 5 Questoes Praticas de Implementacao

5.1.1 Analise Estatica e Dinamica do Sensor de Velocidade Angular

A calibracao do sensor de velocidade angular da haste 1 pode ser feita com base na

derivada aproximada do sinal de posicao angular medido pelo sistema de processamento de

imagem digital. Nesse caso, o sensor de visao computacional assume o papel de padrao. A

derivada aproximada e a diferenca entre a posicao no instante k e a posicao no instante k− 1

dividida pelo intervalo de amostragem. O procedimento de calibracao consiste simplesmente

em ajustar o ganho do sinal do sensor de velocidade. A Figura 5.1 compara o sinal de

velocidade obtido por meio do sinal de posicao angular da haste 1, conforme explicado, com

o sinal do sensor de velocidade antes e apos um ajuste manual de ganho igual a 15.

0 2 4 6 8 10 12 14 16 18 20−1000

−500

0

500

1000(a)

θ 1• (°

/s)

(s)

0 2 4 6 8 10 12 14 16 18 20−1000

−500

0

500

1000(b)

θ 1• (°

/s)

(s)

Figura 5.1: Series temporais da velocidade angular da haste 1. A serie com linha vermelha tracejada (--) e obtida pela direfenciacao da serie da posicao angular da haste 1 produzida pelo sensorde visao computacional. A serie com linha azul contınua (-) e gerada pelo sensor inercial, otaco gerador, acoplado a haste 1. No grafico (a) tem-se o sinal do sensor inercial conformecoletado pelo sistema de aquisicao. No grafico (b), o sinal de velocidade esta corrigido peloaumento em amplitude.

Uma caracterıstica do sensor S1, nao tratada por Firmo (2007), e a sua dinamica. Em

um ensaio de laboratorio, utilizando um osciloscopio digital, por meio do qual registravam-

se dados do experimento, recolheu-se a haste 2, em 180, de forma a formar um pendulo

simples. Entao, abandonou-se o pendulo simples do ponto mais alto e, com o auxılio das

maos, interrompeu-se o seu movimento, abruptamente, quando este passou por 90. Nesse

momento, a tensao fornecida pelo sensor caiu exponencialmente. A constante de tempo de

decaimento registrada e de aproximadamente 140ms. Tal resultado nao e esperado, desde que,

Page 87: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.1 Verificacoes Experimentais 63

interrompendo-se o movimento do eixo do motor do sensor S1 nao ha geracao de forca contra-

eletromotriz ocasionando, por sua vez, a queda instantanea para zero da tensao nos terminais

do motor. A menos que, por exemplo, os terminais do motor nao estivesse aberto. De fato,

e possıvel observar que dentro da carcaca do sensor S1 existe um pequeno circuito eletronico.

Tal circuito esta acoplado de modo que seria necessario destruir o sensor para remove-lo. De

qualquer forma, o importante e que esse circuito acrescenta uma certa dinamica, indesejada

para a aplicacao como sensor de velocidade, ao sensor S1.

Deseja-se, portanto, verificar o que a dinamica do sensor S1 que produz o sinal de

velocidade angular da haste 1, pode alterar na analise da dinamica do pendulo duplo se tal

sinal for utilizado. Utiliza-se graficos de retrato de fases para fazer as observacoes. Nos casos

que sao apresentados a seguir, as medicoes sao obtidas a cada intervalo de 25 ms. Num

primeiro caso, utilizando-se medicoes das componentes θ1 e θ1, gera-se o retrato de fases da

haste 1 mostrado na Figura 5.2a. Este, portanto, e o retrato de fases sob a influencia do

sensor de velocidade S1. A fim de eliminar a influencia do sensor S1, num segundo caso, e

tracado outro retrato de fases a partir, somente, da medicao da componente θ1. Neste caso,

por meio do calculo da derivada aproximada de θ1, obtem-se a componente θ1 do retrato

de fases. Produz-se, assim, a Figura 5.2b1. Observa-se que ha, realmente, diferenca no

formato do retrato de fases apresentado nos dois casos. Curiosamente, ao filtrar o sinal da

velocidade angular, obtido pela derivada da posicao angular, com um filtro cuja constante de

tempo e de 140 ms (a mesma constante de tempo verificada na queda exponencial do sinal do

sensor S1 discutida anteriormente), obtem-se o retrato de fases da Figura 5.2c. Esse retrato e

visualmente semelhante ao da Figura 5.2a. Isso sugere que ha um filtro associado ao motor.

Esse filtro, muito provavelmente, e implementado pelo circuito eletronico visto, internamente,

na carcaca do motor do sensor S1, conforme discutido anteriormente.

A Figura 5.3 mostra as series temporais do sinal de velocidade filtrado, utilizado para

tracar o retrato de fases da Figura 5.2b, e do sinal de velocidade medido pelo sensor S1.

Observe a proximidade das series.

Portanto, o sinal do sensor S1 descaracteriza o retrato de fases da haste 1 podendo

conduzir a analises erroneas sobre a dinamica caotica do pendulo duplo. Devido a esse resul-

tado, e sugerido que se experimente estimar os estados do pendulo duplo a partir, somente, das

medicoes angulares obtidas pelo sensor baseado em visao computacional. Outra possibilidade

1Repare a semelhanca do retrato de fases da Figura 5.2b com o retrato de fases obtido na simulacao domodelo, sob a abordagem de Lagrange, da Figura 3.11a. Isso sugere que o o modelo de Lagrange representamelhor a dinamica do pendulo duplo do que o modelo utilizado por Firmo (2007), 3.11b.

Page 88: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

64 5 Questoes Praticas de Implementacao

−3 −2 −1 0 321−30

−20

−10

0

10

20

30(a)

θ 1• (r

ad/s

)

θ1 (rad)−3 −2 −1 0 1 2 3

−30

−20

−10

0

10

20

30(b)

θ 1• (r

ad/s

)

θ1 (rad)

−3 −2 −1 0 1 2 3−30

−20

−10

0

10

20

30(c)

θ 1• (r

ad/s

)

θ1 (rad)

Figura 5.2: Retrato de fases construıdos com dados das medicoes, amostradas em 25 ms, da velocidadeangular e da posicao angular da haste 1. Em (a), utilizam-se dados diretos dos sensoresinercial e visual. Em (b), a componente θ1 e obtida pela diferenciacao dos dados do sensorvisual, eixo θ1. Em (c), tem-se os dados de θ1 usados em (b) filtrados por um filtro deprimeira ordem com constante de tempo de 140 ms.

0 500 1000 1500−1000

−800

−600

−400

−200

0

200

400

600

800

1000

θ 1• (°

/s)

(s)

Figura 5.3: Series temporais da velocidade angular da haste 1. A linha vermelha tracejada (- -) eo sinal da velocidade angular conforme coletado pelo sistema de aquisicao de dados. Alinha azul contınua (-) e obtida pela diferenciacao da serie de posicao angular da haste 1,produzida pelo sensor visual, avancada em 4 passos e filtrada, sem seguida, por um filtrode primeira ordem com constante de tempo de 140 ms.

seria incluir a dinamica do sensor no modelo do sistema.

Page 89: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.1 Verificacoes Experimentais 65

5.1.2 Obtencao de Estimativas Iniciais para os Coeficientes de Atrito

Para obter estimativas iniciais para os coeficiente de atrito do pendulo duplo, realizam-

se dois experimentos controlados com as hastes do pendulo. Em tais experimentos, elimina-se

a presenca de forcas de excitacao e desacopla-se o movimento de uma haste com a outra. No

primeiro experimento, a haste 2 e recolhida para dentro da haste 1 formando, assim, uma

unica haste cujo valor da massa e a soma de m1 com m2. No segundo experimento, a haste 1

e segurada, com o auxılio das maos, permitindo, assim, apenas o movimento da haste 2. Em

ambos os experimentos o motor permanece desligado.

Desse modo, a lei fısica que governa o sistema e a de um pendulo simples amortecido

sem excitacao e que tem a vantagem de ter um conjunto de parametros reduzido em relacao ao

modelo do pendulo duplo com excitacao realimentada, que e o caso real. Nota-se que, apesar

de se reduzir o numero de parametros, os coeficientes de atrito nao mudam em funcao da

nova configuracao. As equacoes diferenciais do movimento do pendulo no primeiro e segundo

experimentos sao dadas, respectivamente, por

θ1 = − 1

Mm + Jm +ml21

(

gml1sen(θ1) + b1θ1 + b3sinal(θ1))

, (5.1)

θ2 = − 1

Jm2 +m2l22

(

gm2l2sen(θ2) + b2θ2 + b4sinal(θ2))

. (5.2)

Com o auxılio do sistema de processamento de imagens, a trajetoria das hastes, nos

experimentos, sao captadas com um intervalo de amostragem de 25ms. As figuras 5.4 e 5.5

mostram o sinal medido e a curva ajustada para os dois casos.

0 200 400 600 800 1000 1200 1400−100

−50

0

50

100

θ 1 (

° )

(s)

Figura 5.4: Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 1 no qual amesma e abandonada da posicao inicial de 90. A haste 2 e mantida recolhida dentro dahaste 1. A curva vermelha e o sinal produzido pelo sensor visual. A curva azul e a curvaajustada para a equacao (5.1).

As curvas sao ajustadas por meio de inspecao visual e, dessa maneira, encontram-se

Page 90: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

66 5 Questoes Praticas de Implementacao

0 500 1000 1500 2000 2500 3000 3500−100

−50

0

50

100

θ 1 (

° )

(s)

Figura 5.5: Oscilacoes amortecidas, sem excitacao, do experimento realizado com a haste 2 no qual amesma e abandonada da posicao inicial de −90. A curva vermelha e o sinal produzidopelo sensor visual. A curva azul e a curva ajustada para a equacao (5.2).

b1 = 0,0004 Nm/rad, b2 = 0,000108 Nm/rad, b3 = 0,0038 Nm/rad e b4 = 0,00018 Nm/rad.

Uma constatacao importante e a de que o valor das distancias l1 e l2 iguais a um terco do

comprimento das respectivas hastes, ou seja, l1 = L1/3 e l2 = L2/3, levam a uma melhor

aproximacao da curva real do que ao se utilizar l1 = L1/2 e l2 = L2/2, conforme previsto

no modelo apresentado na Secao 3.2. O valor de l1 e l2 esta relacionado, por uma relacao

proporcional inversa, com a frequencia das oscilacoes.

5.2 Consideracoes Praticas de Implementacao dos Algoritmos

de Filtragem de Kalman

5.2.1 Utilizando Estimadores de Tempo Discreto para Estimar Estados de

um Sistema Modelado por Equacoes Diferenciais

Na pratica, a maior parte dos sistemas de interesse sao de tempo contınuo. Quando

o modelo de processo for de tempo contınuo e as observacoes forem amostradas, recorre-se a

filtros do tipo contınuo-discreto (Athans et al., 1968; Sarkka, 2007; Sharma e Parthasarathy,

2008), tambem chamados de estimadores de tempo contınuo com medicoes amostradas. Eles

utilizam a estrutura recursiva dos estimadores de tempo discreto para a etapa de assimilacao de

dados, porem permitem avaliar a propagacao da media e covariancia dos estados no intervalo

entre observacoes.

Este e o caso deste trabalho. O modelo do pendulo duplo esta modelado por meio de

equacoes diferenciais numa representacao em espaco de estados, conforme se ve na equacao

(3.36), caracterizando um modelo contınuo. Deste sistema modelado pelas equacoes diferen-

cias, obtem-se medicoes amostradas da velocidade angular da haste 1 e das posicoes angulares

Page 91: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kalman 67

de ambas as hastes. As taxas de amostragem do sistema sao diferentes dependendo do tipo de

medicao. A velocidade angular e medida a uma taxa Ts correspondente a 5ms. As posicoes

angulares sao medidas a uma taxa Tpa que pode ser ajustada para 25, 50, 100 ou 200 ms.

Como gerenciar essas multiplas taxas de amostragem esta descrito na Secao 5.2.2. O que de

fato importa e que se deseja obter estimativas do pendulo duplo na mesma taxa de aquisicao

da velocidade angular, Ts, ou seja, deseja-se estimativas em intervalos de tempo discreto, k,

de modo que xk = x(Tsk). Os filtros apresentados nas secoes 2.3, 2.4.1 e 2.4.2 sao adequa-

dos para resolverem esse problema de estimacao em tempo discreto, considerando que ele faz

referencia a sistema dinamico de tempo discreto conforme descrito na Secao 2.2. O que se

torna necessario, entao, e transformar a representacao contınua do modelo (Sitz et al., 2004)

x(t) = g(x(t), t) + w(t), (5.3)

em uma versao discreta do tipo (2.1) para que se possam obter as propagacoes de media

um passo a frente conforme exigido pela formulacao do filtro de Kalman. Na equacao (5.3),

g : Rn × R → Rn e w(t) e uma parcela estocastica com distribuicao Gaussiana com media

nula e matriz de covariancia Q(t),

Para isso calcula-se

xk = xk−1 +

∫ kTs

(k−1)Ts

(g(x(t), t) + w(t))dt. (5.4)

em que xk−1 , x(Ts(k−1)) e w(t)dt = dΦ = Φ(Tsk)−Φ(Ts(k−1)), onde dΦ e um incremento

Browniano (Khalil et al., 2009). O processo de discretizacao transforma a parcela w(t) em√Tsǫk−1, em que ǫk−1 e uma variavel Gaussiana de media nula e matriz de covariancia Ek−1 =

TsQ(t).

Neste trabalho, resolver a integral da equacao 5.4 explicitamente e difıcil. Portanto,

ela e resolvida numericamente, por meio do algoritmo de Runge-Kutta de 4-ordem com passo

fixo de integracao de 1ms. Assume-se w(t) constante ao longo do intervalo de integracao

[(k − 1)Ts, kTs]. Esse procedimento server tanto para gerar a predicao um passo a frente do

estimador como para produzir os dados de simulacao.

Ressalta-se que o modelo contınuo nao foi discretizado explicitamente por meio do

calculo das Jacobianas, por exemplo. Portanto, essa forma de tratar o problema e impropria

para o EKF. O UKF, por outro lado, e flexıvel, pois o mesmo necessita apenas das realizacoes

Page 92: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

68 5 Questoes Praticas de Implementacao

numericas de xk, nao definindo a maneira de se obte-las.

5.2.2 Multiplas Taxas de Amostragem

Retomando o que esta exposto na Secao 5.2.1, este trabalho trata de se utilizar

estimadores recursivos de tempo discreto para um sistema de tempo contınuo com medicoes

amostradas. Entretanto, uma particularidade ocorre com relacao a amostragem das medicoes,

pois as mesmas sao amostradas em taxas diferentes. Duas fontes de dados coexistem. Uma

fonte inercial, que e o sensor de velocidade da haste 1, fornece amostras a cada 5 ms; e, uma

outra fonte, do tipo visual, que e o sensor baseado em visao computacional, fornece amostras

das posicoes angulares das hastes 1 e 2 a cada 25 ms. Para a ultima tambem sao avaliados os

casos em que a amostragem ocorre a 50, 100 e 200 ms.

A questao que surge e como fundir a informacao dessas duas fontes de informacao

no esquema do estimador. Armesto e colaboradores (2008) abordam essa questao em seu

trabalho utilizando o conceito do vetor de medicao yk com tamanho variavel no tempo. Nessa

tecnica, sao adicionadas ao vetor yk somente as medicoes disponıveis. Em decorrencia do fato

de yk variar seu tamanho, a matriz Ck (para o caso de modelo linear de observacao) e o ruıdo

de medicao νk, veja (2.3), tambem sofrem a variacao de tamanho. A Figura 5.6 ilustra como

o vetor yk pode variar em funcao das medicoes disponıveis do pendulo duplo.

Figura 5.6: Representacao da disponibilidade de medicoes do pendulo duplo, pelos sensores, ao longodo tempo. O marca circular preta representa a informacao da velocidade angular disponi-bilizada pelo sensor inercial, acoplado ao eixo da haste 1. A marca circular azul representaa posicao angular da haste 1 e 2 disponibilizada pelo sensor visual. Em funcao da disponi-bilizade, o vetor de medicoes yk e formado. As medicoes das posicoes angulares podem serobtidas a intervalos de tempo (Tpa), multiplos de 5 ms. Tpa permanece constante durantetoda a execucao do filtro. Assume-se que os dois sensores estao sincronizados.

Com isso, o esquema do estimador adotado e como aquele exibido no diagrama da

Page 93: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kalman 69

Figura 5.7. O ciclo de predicao-assimilacao ocorre a cada 5 ms, seguindo a frequencia de

amostragem do sinal de velocidade angular da haste 1. Note que, quando o vetor de medicoes

estiver vazio, a etapa de assimilacao nao e realizada. Essa situacao pode ocorrer caso haja

uma falha nos sistemas de medicao.

Predicão

Assimilacão

Medicão

Monta vetor

e a matriz

S

N

Figura 5.7: Esquema do estimador utilizado para tratar o caso de multiplas frequencias de amostrageme que, ainda, estao sujeitos a instantes em que nao ha disponibilidade de informacao desensores, yk ∈ .

5.2.3 Restricao Intervalar na Posicao Angular

O modelo de simulacao e o modelo de predicao, utilizado pelo filtro na etapa de

predicao, utilizam as mesmas equacoes do modelo dinamico (3.36) cujos parametros sao ajus-

tados conforme a Tabela 5.1 que definem o pendulo duplo em um regime de movimento

caotico.

Alem de serem utilizados em momentos diferentes, ha outra diferenca entre os modelos

de simulacao e de predicao. O modelo de simulacao gera os dados das posicoes angulares dentro

da faixa [−180, + 180] enquanto que o modelo de predicao nao faz esse condicionamento

nos dados. O proposito do modelo de simulacao ser assim e para corresponder aos dados

das posicoes angulares amostrados do sistema experimental pelo sensor baseado em visao

computacional, que por sua vez, produz valores na faixa [−180, + 180]. Por outro lado,

o modelo de predicao nao realiza a conversao de valores θ1 e θ2 pois ele e utilizado por um

estimador baseado na geracao de pontos-sigmas, que, como visto na Secao 2.4.2, sao pontos

espalhados em torno de uma media. Caso o modelo de predicao faca o mesmo que o modelo

de simulacao, a matriz de covariancia do erro de estimacao, P xxk|k, se torna incoerente quando

a media dos estados θ1 e θ2 estiverem proximas das fronteiras −180 e +180.

A Figura 5.8 ilustra a situacao adversa provocada pelas caracterıstics dos modelos

de simulacao e de predicao discutidas anteriormente. Neste exemplo, utiliza-se o filtro UKF,

Page 94: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

70 5 Questoes Praticas de Implementacao

com as mesmas equacoes apresentadas na Secao 2.4.2, para estimar os estados do pendulo

duplo utilizando a medicao, sem ruıdo, da velocidade angular da haste 1. Observe que as

estimativas de θ2 (Figura 5.8c), em varios instantes, por exemplo, em t = 0,5s ou em t = 3,0s,

saltam da faixa [−180, + 180], porem, sem comprometer as estimativas do outro estado,

que, por sinal, sao boas. Acredita-se que isso ocorra, mesmo na ausencia de ruıdo na medicao,

em funcao de imprecisoes numericas do filtro implementado em computador.

2.5 5 7.5 10

−180

−90

0

90

180

(a)

θ 1(

° )

t(s)

2.5 5 7.5 10

−180

−90

0

90

180

(b)

θ 2 (

° )

t(s)

Figura 5.8: Estados (a)–(b) do pendulo duplo estimados pelo UKF em um caso em que apenas avelocidade angular da haste 1 e medida, sem ruıdo, e nao e feita a conversao nas estimativasdos estados das posicoes angulares para a faixa [−180, + 180].A linha solida vermelha(–)corresponde ao valor verdadeiro do estado e a linha solida azul (–) corresponde a estimativado filtro UKF.

Para evitar que as estimativas relacionadas as posicoes angulares do pendulo, em

especial θ2, saem da faixa [−180, + 180], duas solucoes sao investigadas

1. converter a media das estimativas das posicoes angulares, xi,k|k−1 e xi,k|k, para i = 1,2,

ao longo da execucao do UKF, para a faixa [−180, + 180];

2. utilizar um estimador com restricoes como o IUKF, apresentado na Secao 2.5.1;

A primeira solucao produz o UKF-π, nomeado assim para remeter a conversao que se

faz nas medias. Para se chegar ao UKF-π, basta executar o Algoritmo 1 no inıcio da rotina do

filtro, sobre o vetor de estados xk−1|k−1, e apos a equacao (2.32), sobre o vetor da estimativa

de estados a priori xk|k−1.

Page 95: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.2 Consideracoes Praticas de Implementacao dos Algoritmos de Filtragem de Kalman 71

if PosicaoAngular 6= π then

PosicaoAngular = RestoDaDivisao(PosicaoAngular+π2π ) - π ;

else

PosicaoAngular = PosicaoAngular ;end

Algoritmo 1: Algoritmo da Conversao-π

A Figura 5.9 mostra o resultado das duas solucoes propostas que sao utililzadas ao

longo dos experimentos.

2.5 5 7.5 10

−180

−90

0

90

180

(a)

θ 2 (

° )

t(s)

2.5 5 7.5 10

−180

−90

0

90

180

(b)

θ 2 (

° )

t(s)

Figura 5.9: Estimativas da posicao angular da haste 2 do pendulo duplo estimados medindo-se apenasa velocidade angular da haste 1, sem ruıdo. Em (a), mostra-se o resultado do UKF-πque realiza uma conversao nas estimativas dos estados das posicoes angulares para a faixa[−180, + 180]. E em (b), o resultado do IUKF que utiliza a transformada unscentedcom restricao intervalar. A linha solida vermelha(–) corresponde ao valor verdadeiro doestado e a linha solida azul (–) corresponde a estimativa do filtro.

5.2.4 Simetria da Matriz de Covariancia

A implementacao computacional do filtro exige, em certos casos, alguns artifıcios para

se obter uma execucao numerica robusta do mesmo. Um exemplo de problema encontrado e

aquele em que a matriz de covariancia dos estados, P xxk|k, se modifica ao longo das iteracoes e,

em certo momento, deixa de ser simetrica, quebrando, assim, uma das caracterısticas, imposta

pela definicao do filtro de Kalman, a essa matriz. A causa desse problema esta associada ao

fato de nao ser possıvel computacionalmente atingir a precisao aritmetica infinita necessaria

para calcular o ganho de do filtro de Kalman (Farrell, 2009).

Page 96: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

72 5 Questoes Praticas de Implementacao

Tabela 5.1: Parametros do modelo de simulacao e predicao do Pendulo Duplo utilizados nostestes simulados e experimentais.

Par. Valor Unidade Descricao

L1 0,273 m comprimento da haste 1

L2 0,216 m comprimento da haste 2

l1 0,091 m raio de giracao da haste 1

l2 0,072 m raio de giracao da haste 2

m1 0,297 kg massa da haste 1

m2 0,235 kg massa da haste 2

Jm1 24,60× 10−4 kgm2 momento inercia da haste 1

Jm2 12,18× 10−4 kgm2 momento inercia da haste 2

Mm 22× 10−6 kgm2 momento inercia do motor

b1 0,0004 Nm /rad coeficiente de amortecimento da junta 1

b2 0,000108 Nm /rad coeficiente de amortecimento da junta 2

b3 0,0038 Nm /rad coeficiente de Coulomb da junta 1

b4 0,00018 Nm /rad coeficiente de Coulomb da junta 2

g 9,81 m/s2 acelacao da gravidade

Ra 32 Ω resistencia da armadura do motor

La 30 mH indutancia da armadura do motor

Kt 0,0358 Nm/A constante de torque do motor

Ks 0,0358 V/rad/s constante de velocidade do motor

γ π/3 rad limiar de acionamento do motor

Va 19,0 volts tensao de armadura do motor

Para contornar esses problemas, neste trabalho, adotam-se tres medidas. A primeira

delas e ajustar a escala dos estados de modo que todos variem dentro de uma faixa proxima

(Mariani e Ghisi, 2007). Originalmente, tem-se que

−90 ≤ θi ≤ +90 , i = 1,2

−1000 /s ≤ θ1 ≤ +1000 /s,

−1600 /s ≤ θ2 ≤ +1600 /s,

0 Nm/rad ≤ b1 ≤ 0,002 Nm/rad,

0 Nm/rad ≤ b2 ≤ 0,001 Nm/rad,

(5.5)

Page 97: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.3 Avaliacao de Desempenho de Estimadores de Estado 73

Apos um ajuste de escala, a nova faixa de variacao e

−π rad ≤ θi ≤ +π rad, i = 1,2

−1,8 rad/0,1s ≤ θ1 ≤ +1,8 rad/0,1s,

−2,8 rad/0,1s ≤ θ2 ≤ +2,8 rad/0,1s,

0 Nmm/rad ≤ b1 ≤ 2 Nmm/rad,

0 Nmm/rad ≤ b2 ≤ 1 Nmm/rad,

(5.6)

A segunda medida adotada, altera a maneira de como P xxk|k e calculada, na etapa de

assimilacao de dados, pela equacao (2.12). A nova maneira, conhecida como forma de Joseph,

produz uma matriz de covariancia simetrica (Farrell, 2009) e e dada por

P xxk|k = (I −KkCk)P

xxk|k−1(I −KkCk)

T −KkRkKTk , (5.7)

para o caso em que o modelo de observacao e linear.

O terceiro artifıcio e forcar a simetria da matriz P xxk−1|k−1 da seguinte forma

P xxk−1|k−1 =

1

2

(

P xxk−1|k−1 +

(

P xxk−1|k−1

)T)

. (5.8)

5.3 Avaliacao de Desempenho de Estimadores de Estado

E de interesse avaliar o desempenho de um estimador em, basicamente, dois cenarios.

O primeiro e aquele no qual o estimador e comparado com outros estimadores para um mesmo

caso de aplicacao com condicoes semelhantes, e outro e aquele no qual o mesmo estimador e

avaliado sob diferentes condicoes. Por exemplo, Lefebvre e colaboradores (2004) comparara

o desempenho de tres algoritmos de filtragem nao-linear para tratar modelos de medicao

nao-lineares. Xue-Dong e Zhi-Huan (2008) comparam tres versoes generalizadas do EKF,

UKF e GPF para filtar series caoticas com ruıdo multiplicativo. Finalmente, Chandrasekar

e colaboradores (2007) comparam o EKF e o UKF na filtragem de sinais de sistemas com

dinamica nao-diferenciavel.

Para comparar ou avaliar o desempenho de um estimador nao-linear, utilizam-se

metricas de desempenho. Diferentes tipos de metricas sao usadas na literatura. Richard

Page 98: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

74 5 Questoes Praticas de Implementacao

(1992) mede o desempenho do EKF, aplicado em tres tipos de mapas caoticos, por meio da

melhora na relacao sinal-ruıdo de cada componente de estado, considerando como ruıdo inicial

o erro entre o valor verdadeiro do estado e a medicao, o ruıdo final como o erro de estimacao,

e o sinal como a variancia da componente de estado. Para sistemas caoticos, o retrato de fases

produzido pelas componentes estimadas e utilizado em alguns trabalhos (Sitz et al., 2004,

2002; Aguirre et al., 2005). A propria comparacao visual entre as series temporais dos valores

verdadeiros e estimados dos estados e um recurso comumente utilizado (Khalil et al., 2009;

Armesto et al., 2008; Ray, 1995; Wheeler e Packard, 2009; Togneri e Deng, 2003). Outro

fator de desempenho importante para avaliar as questoes de viabilidade do uso do filtro em

aplicacoes reais e o processamento computacional consumido pelo mesmo, geralmente medido

pelo tempo gasto para executar o processamento de uma janela de dados especıfica (Togneri

e Deng, 2003; Teixeira et al., 2009, 2008; Armesto et al., 2008).

A analise do erro de estimacao, em simulacoes, e a maneira mais utilizada nos tra-

balhos sobre estimacao para medir o desempenho dos algoritmos, e serve para indicar quao

precisas sao as estimativas. Alguns autores apresentam o erro, em cada iteracao, em escala

logarıtmica (Teixeira et al., 2008; So et al., 1994; Xue-Dong e Zhi-Huan, 2008; Chandrasekar

et al., 2007). O erro medio quadratico (MSE) tambem e utilizado em varios trabalhos (Merwe

et al., 2000; Armesto et al., 2008; Wan et al., 1999; Kurian e Puthusserypady, 2006).

Neste trabalho, a analise do erro de estimacao e feita por meio do ındice RMSE que

produz uma medida combinada da polarizacao e variancia das estimativas do filtro (Arasarat-

nam e Haykin, 2009). Ele e calculado para cada componente de estado, xi, sobre uma quan-

tidade c de simulacoes Monte Carlo e e dado por

RMSEi ,1

c

c∑

j=1

1

kf − k0 + 1

kf∑

k=k0

(xi,k − xi,k|k,j)2

, (5.9)

em que xi,k e o valor verdadeiro do estado, xi,k|k,j e o valor estimado do estado na j-

esima simulacao, e [ko,kf ] define o intervalo de tempo considerado. Tal intervalo e escolhido

desconsiderando-se transiente inicial.

Ainda com relacao ao erro de estimacao, vale dizer que as metricas baseadas nele,

como as apresentadas ate agora, obviamente, so podem ser utilizadas em simulacao, onde

o valor verdadeiro de estado e conhecido. Quando esse nao for o caso, e o filtro estiver

processando dados experimentais, mede-se o desempenho do mesmo por meio do erro de

Page 99: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.3 Avaliacao de Desempenho de Estimadores de Estado 75

inovacao dado por

ηk|k−1 , yk − yk|k−1. (5.10)

Um outro criterio de desempenho, muito importante, principalmente quando se trata

de filtros Gaussianos aplicados a sistemas cuja PDF dos estados e nao-Gaussiana, e a repre-

sentatividade das estimativas. Segundo Lefebvre e colaboradores (2004), esse criterio pode

ser dividido em duas questoes: consistencia e conteudo informativo das estimativas. Duas es-

timativas podem ser consistentes, embora uma delas possa ser mais informativa que a outra.

A Figura 5.10 ilustra isso.

Figura 5.10: Aproximacao da PDF nao-Gaussiana p(xk,Zi) por tres PDFs Gaussianasp1(xk,Zi),p2(xk,Zi) e p3(xk,Zi). A PDF e consistente se a sua media estiver dentrodo domınio de probabilidade da PDF verdadeira. p3(xk,Zi) e a unica nao consistente.p1(xk,Zi) e mais informativa que p2(xk,Zi). Fonte: (Lefebvre et al., 2004)

Uma medida de desempenho do filtro para indicar tanto a consistencia quanto o con-

teudo informativo das estimativas produzidas e matriz de covariancia do erro de estimacao P xxk|k

(Arasaratnam e Haykin, 2009). Diz-se que a estimativa de estado e consistente se satisfazer a

desigualdade

−α√

diag(P xxk|k) ≤ xk − xk|k ≤ α

diag(P xxk|k), k ∈ [k0, kf ], (5.11)

Page 100: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

76 5 Questoes Praticas de Implementacao

em que α > 0 e o fator de confianca. Geralmente, escolhe-se α = 3, para o qual a confianca

indicada e de 99,7% (Teixeira, 2008).

5.4 Sintonia de Estimadores de Estado

E importante observar que as matrizes de covariancia Qk−1 e Rk, assumidas conhe-

cidas na formulacao do problema, sao utilizadas na etapa de predicao do KF. Entretanto, em

casos praticos, tais matrizes, nem sempre, sao completamente conhecidas. A sintonia do filtro

surge nesse contexto e esta secao dedica-se a esse assunto.

Para melhorar o desempenho do filtro e necessario sintoniza-lo. Sintonizar o filtro

KF consiste em selecionar valores numericos apropriados para as matrizes de covariancia

Qk−1 e Rk (Blauer e Belanger, 1987). Existem tecnicas para estimar tais ruıdos dinamicos

e observacionais, respectivamente, como se pode ver em Orrell (2005) e em Heald e Stark

(2000), ambos demonstrados para sistemas dinamicos caoticos.

Uma alternativa ao uso dessas tecnicas e o ajuste por tentativa e erro. Nesta abor-

dagem, deve-se levar em conta que o efeito da sintonia depende dos valores relativos entre

Qk−1 e Rk. Por isso, a ideia e fixar um valor para Rk, basendo-se, por exemplo, nos erros

das medicoes obtidos de ensaios de precisao nos sensores. Por simplicidade, geralmente Rk e

ajustada como uma matriz diagonal, ou seja, assume-se que as incertezas nas medicoes sejam

independentes, embora o conhecimento da correlacao cruzada reduza a taxa de falsas assimi-

lacoes (Smith e Singh, 2006). Em seguida, ajusta-se o valor de Qk−1 para tornar o filtro“mais”

ou “menos” aberto. Um filtro aberto tende a reduzir o erro de estimacao rapidamente, porem

com muitas variacoes transientes. Aqui, tambem por simplicidade, define-se Qk−1 como uma

matriz diagonal para controlar a convergencia de cada estado do filtro (Blauer e Belanger,

1987).

Uma referencia para o ajuste de Qk−1 e a distancia entre a curva do erro de estimacao,

ek = xk−xk|k, e a curva do intervalo de confianca, definido na Secao 5.3 como ±3√

diag(P xxk|k).

Se o intervalo de confianca da estimativa de um certo estado estiver muito proximo do valor

do erro de estimacao do mesmo, ao aumentar a variancia do ruıdo de processo relacionada a

tal estado, e provocado um afastamento entre o intervalo de confianca e o erro de estimacao.

Portanto, uma maneira de determinar a sintonia da matriz de covariancia Qk−1, assumindo

que Rk ja esta determinada, e

1. Defina um valor incial Qk−1 muito baixo, por exemplo, 10−9In < Qk−1 < 10−5In.

Page 101: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.4 Sintonia de Estimadores de Estado 77

2. Proceda a execucao da estimacao.

3. Para cada estado, compare o erro de estimacao com o intervalo de confianca.

4. Caso o erro esteja ultrapassando o intervalo de confianca, aumente a variancia relativa

aquele estado.

5. Caso o intervalo de confianca esteja muito afastado da curva do erro, diminua a variancia

relativa aquele estado.

6. Repita os passos 2 a 5 ate que a curva do erro de estimacao esteja dentro dos limites de

confianca com um espacamento adequado.

Outros parametros de sintonia do filtro KF sao os valores iniciais das estimativas,

x0|0, e sua respectiva matriz de covariancia P xx0|0, que reflete a confianca que se tem nela.

Sabe-se que um alto P xx0|0 produz transientes iniciais altos e rapida convergencia, e um baixo

P xx0|0 produz efeito contrario.

Para ilustrar os efeitos da sintonia por tentativa e erro, e dado um exemplo de esti-

macao de estados para um pendulo simples nao-linear.

Exemplo de Sintonia do Filtro UKF

Considere que o sistema de um pendulo simples nao-linear possui modelos de processo

e de observacao dados, respectivamente, por

x1(t)

x2(t)

=

x2(t)

−(g/l) sen(x1(t))

+ w(t), (5.12)

e

yk = [1 0]

x1(Tk)

x2(Tk)

+ νk. (5.13)

em que x1 e a posicao angular, x2 e a velocidade angular, g = 9,81 m/s2 correspondente a

aceleracao da gravidade, l = 27,3 cm e o comprimento da haste, w ∈ R2 e o ruıdo de processo

cuja matriz de covariancia e Qk−1 = diag(0,007 0,007), e νk e o ruıdo na medicao cuja matriz

de covariancia e Rk = 0,1. Observe que apenas um dos estados e medido.

Deseja-se investigar como sao afetadas as estimativas do filtro UKF se o mesmo

utilizar matrizes de covariancia dos ruıdos tais como ρQQk−1 e ρRRk, em que ρQ e ρR sao os

Page 102: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

78 5 Questoes Praticas de Implementacao

pesos que modificam os valores verdadeiros das respectivas matrizes de covariancia de ruıdo.

Como referencia, o caso ideal em que as matrizes Qk−1 e Rk sao exatamente conhecidas, ou

seja, ρQ = ρR = 1, e a estimativa inicial e exatamente o valor verdadeiro dos estados neste

instante, obtem-se os resultados da Figura 5.11. As figuras 5.12, 5.13 e 5.14 ilustram os casos

em que ha erro na sintonia das matrizes de covariancia utilizadas pelo filtro. Se o fator de

imprecisao ρR for igual a 0,01, significa que o filtro considera que o ruıdo da medicao tem

desvio padrao 10 vezes menor que o real, ou seja, que, do ponto-de-vista do filtro, a medicao

recebida e 10 vezes mais confiavel do que ela realmente e. Essa imprecisao se faz refletir na

inconsistencia da estimativa do estado diretamente associada a essa medicao que e a posicao

angular do pendulo (ver Figura 5.12). Note que, em termos de consistencia, a inovacao foi a

menos prejudicada em todos os casos apresentados.

De forma analoga, se o fator de imprecisao ρQ for igual a 100, significa que o modelo

de predicao e 10 vezes mais incerto do que ele realmente e, ou seja, que, para o UKF, o modelo

que ele possui nao e muito informativo, e, por isso, as medicoes devem ser mais confiaveis em

detrimento desse modelo. Isso reflete na matriz de covariancia das estimativas de estado e

abre um espaco para o filtro compensar o ruıdo de medicao no erro de estimacao dos estados,

como se pode ver na Figura 5.14.

Page 103: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.4 Sintonia de Estimadores de Estado 79

0 1 2 3 4−150

−100

−50

0

50

100

150

Real x Estimativa − Estado x1 − ρ

Q = 1, ρ

R =1

s

grau

s

0 1 2 3 4−400

−300

−200

−100

0

100

200

300

400

Real x Estimativa − Estado x2 − ρ

Q = 1, ρ

R =1

s

grau

s/s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Real x Estimativa − Medição y − ρQ

= 1, ρR

=1

s

grau

s

0 1 2 3 4−60

−40

−20

0

20

40

60

Erro de estimação − Estado x1 − ρ

Q = 1, ρ

R =1

s

grau

s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Erro de estimação − Estado x2 − ρ

Q = 1, ρ

R =1

s

grau

s/s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Erro de inovação − Medição y − ρQ

= 1, ρR

=1

s

grau

s

Figura 5.11: Caso ideal de estimacao de estados do pendulo simples nao linear utilizando o UKF. Asmatrizes de covariancia dos ruıdos de processo e medicao, respectivamente Qk−1 e Rk,sao conhecidas. A linha solida grossa vermelha(–) indica o valor verdadeiro do estado eda medicao (no caso do grafico (c)). A linha solida grossa azul(–) indica o valor estimadodo estado e da medicao( no caso do grafico (c)). A linha solida fina vermelha (–) e oerro de estimacao da componente i e erro de inovacao (no caso do grafico (f)) limitado

pelo intervalo de confianca ±3√

diagPxx(i,i),k |k (e ±3

diagPyy

k |k no caso do grafico (f))

indicados pela linha tracejada azul (–).

Page 104: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

80 5 Questoes Praticas de Implementacao

0 1 2 3 4−150

−100

−50

0

50

100

150

200

Real x Estimativa − Estado x1 − ρ

Q = 1, ρ

R =0.01

s

grau

s

0 1 2 3 4−400

−300

−200

−100

0

100

200

300

400

Real x Estimativa − Estado x2 − ρ

Q = 1, ρ

R =0.01

s

grau

s/s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Real x Estimativa − Medição y − ρQ

= 1, ρR

=0.01

s

grau

s

0 1 2 3 4−50

0

50

Erro de estimação − Estado x1 − ρ

Q = 1, ρ

R =0.01

s

grau

s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Erro de estimação − Estado x2 − ρ

Q = 1, ρ

R =0.01

s

grau

s/s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Erro de inovação − Medição y − ρQ

= 1, ρR

=0.01

s

grau

s

Figura 5.12: Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF em que amatriz de covariancia do ruıdo de processo, Qk−1, e conhecida e a matriz de covarianciado ruıdo de medicao corresponde a 0,001 Rk. A linha solida grossa vermelha(–) indica ovalor verdadeiro do estado e da medicao (no caso do grafico (c)). A linha solida grossaazul(–) indica o valor estimado do estado e da medicao( no caso do grafico (c)). A linhasolida fina vermelha (–) e o erro de estimacao da componente i e erro de inovacao (no caso

do grafico (f)) limitado pelo intervalo de confianca ±3√

diagPxx(i,i),k |k (e ±3

diagPyy

k |kno caso do grafico (f)) indicados pela linha tracejada azul (–).

Page 105: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

5.4 Sintonia de Estimadores de Estado 81

0 1 2 3 4−150

−100

−50

0

50

100

150

Real x Estimativa − Estado x1 − ρ

Q = 0.01, ρ

R =1

s

grau

s

0 1 2 3 4−600

−400

−200

0

200

400

Real x Estimativa − Estado x2 − ρ

Q = 0.01, ρ

R =1

s

grau

s/s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Real x Estimativa − Medição y − ρQ

= 0.01, ρR

=1

s

grau

s

0 1 2 3 4−60

−40

−20

0

20

40

60

Erro de estimação − Estado x1 − ρ

Q = 0.01, ρ

R =1

s

grau

s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Erro de estimação − Estado x2 − ρ

Q = 0.01, ρ

R =1

s

grau

s/s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Erro de inovação − Medição y − ρQ

= 0.01, ρR

=1

s

grau

s

Figura 5.13: Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF em que amatriz de covariancia do ruıdo de medicao,Rk, e conhecida e a matriz de covariancia doruıdo de processo corresponde a 0,001 Qk−1. A linha solida grossa vermelha(–) indica ovalor verdadeiro do estado e da medicao (no caso do grafico (c)). A linha solida grossaazul(–) indica o valor estimado do estado e da medicao( no caso do grafico (c)). A linhasolida fina vermelha (–) e o erro de estimacao da componente i e erro de inovacao (no caso

do grafico (f)) limitado pelo intervalo de confianca ±3√

diagPxx(i,i),k |k (e ±3

diagPyy

k |kno caso do grafico (f)) indicados pela linha tracejada azul (–).

Page 106: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

82 5 Questoes Praticas de Implementacao

0 1 2 3 4−150

−100

−50

0

50

100

150

Real x Estimativa − Estado x1 − ρ

Q = 100, ρ

R =100

s

grau

s

0 1 2 3 4−300

−200

−100

0

100

200

300

400

Real x Estimativa − Estado x2 − ρ

Q = 100, ρ

R =100

s

grau

s/s

0 1 2 3 4−200

−150

−100

−50

0

50

100

150

200

Real x Estimativa − Medição y − ρQ

= 100, ρR

=100

s

grau

s

0 1 2 3 4−300

−200

−100

0

100

200

300

Erro de estimação − Estado x1 − ρ

Q = 100, ρ

R =100

s

grau

s

0 1 2 3 4−1500

−1000

−500

0

500

1000

1500

Erro de estimação − Estado x2 − ρ

Q = 100, ρ

R =100

s

grau

s/s

0 1 2 3 4−1000

−500

0

500

1000

Erro de inovação − Medição y − ρQ

= 100, ρR

=100

s

grau

s

Figura 5.14: Caso de estimacao de estados do pendulo simples nao linear utilizando o UKF em que asmatrizes de covariancia dos ruıdos de medicao,Rk, e de processo, Qk−1, sao desconhecidase correspondem a 100 Rk e 100 Qk−1, respectivamente. A linha solida grossa vermelha(–) indica o valor verdadeiro do estado e da medicao (no caso do grafico (c)). A linhasolida grossa azul(–) indica o valor estimado do estado e da medicao( no caso do grafico(c)). A linha solida fina vermelha (–) e o erro de estimacao da componente i e erro de

inovacao (no caso do grafico (f)) limitado pelo intervalo de confianca ±3√

diagPxx(i,i),k |k

(e ±3√

diagPyy

k |k no caso do grafico (f)) indicados pela linha tracejada azul (–).

Page 107: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Capıtulo 6

Resultados

6.1 Introducao

Neste capıtulo, os algoritmos UKF e IUKF sao usados para estimacao de estados e

parametros do pendulo duplo caotico apresentado no Capıtulo 3.

No campo da estimacao nao-linear, exemplos de fatores complicadores sao o grau de

nao-linearidade do sistema, a incerteza da condicao inicial, a esparsidade das medicoes e o

nıvel de ruıdo das medicoes (Majji et al., 2010). Teixeira e colaboradores (2005) conduzem

um estudo simulado de recontrucao da trajetoria de uma aeronave, utilizando o filtro UKF, e

observa um decaimento do desempenho a medida que a relacao sinal-ruıdo diminui. Khalil e

colaboradores (2009) comparam, em simulacao, o desempenho de tres estimadores de estados

para o oscilador de Duffing quando e variada a taxa de amostragem das medicoes. Como

esperado, os autores observam que o aumento da esparsidade dos dados diminui o desempenho

dos estimadores.

No caso deste trabalho, considerar os efeitos da variacao na taxa de amostragem

das imagens, e, por conseguinte, das posicoes angulares, e importante para se preparar para

situacoes em que tanto o hardware (a camera digital) quanto o sistema de processamento de

imagem impoe restricoes de velocidade. A velocidade do sistema de processamento de imagem

e um criterio fundamental para evoluir para um estimador de estados do pendulo duplo em

tempo real.

E muito comum, tambem, que nem todos os estados do sistema observado possam ser

medidos. Isso leva ao chamado problema de estimacao a partir de medicoes incompletas, ou,

problema de estimacao com componentes (ou variaveis) nao observadas (ou desconhecidas)

(Aguirre et al., 2005; Sitz et al., 2002). So e colaboradores (1994) propoem reconstruir o

vetor de estados de um rotor duplo, que apresenta dinamica caotica, a partir da medicao de

Page 108: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

84 6 Resultados

apenas um dos quatro estados deste sistema. Assim, e testado o desempenho da reconstrucao

para varias configuracoes do vetor de medicoes. De fato, como mostra o estudo de Letellier

e colaboradores (2006), a escolha da variavel medida influencia a habilidade de se extrair

informacao dinamica de um sistema nao-linear. Tal analise e feita para um problema de

reconstrucao de atrator mas pode ser estendida para o problema de estimacao de estados.

Na tentativa de cobrir os principais aspectos que influenciam o desempenho da esti-

macao, neste trabalho, sao realizados testes para diferentes:

⋄ tipos de medicoes, ou seja, qual e o conjunto de variaveis do sistema medido,

⋄ nıvel do ruıdo nos dados,

⋄ taxa de amostragem dos sinais de medicao.

Sao investigados varios casos com base na variacao dessas condicoes. O desempenho do filtro

e avaliado em cada caso, primeiramente para dados simulados, e, num segundo momento, para

dados experimentais.

Tambem sao apresentados resultados, com dados simulados e experimentais, da esti-

macao conjunta de estados e parametros, a saber, os coeficientes de amortecimento viscoso,

b1 e b2, da junta 1 e da junta 2 do pendulo, respectivamente. Tal problema de estimacao

de parametros tem interessante aplicacoes de cunho pratico. Uma delas e a verificacao da

qualidade de outro pendulo construıdo usando as mesmas dimensoes e orientacoes de projeto.

Outra seria para o prognostico de quando se deve realizar uma manutencao preventiva do

equipamento, visto que o coeficiente de amortecimento pode refletir um desgaste na junta. Os

indicadores de desempenho para avaliar a qualidade das estimativas estao descritos na Secao

5.3.

6.2 Resultados Simulados

Nesta secao, sao apresentados resultados da estimacao de estados e estimacao con-

junta de estados e parametros realizadas pelo UKF-π e pelo IUKF com dados simulados.

Por se tratar de simulacao, o ruıdo de processo e nulo, pois o modelo que gera os dados e o

mesmo utilizado na etapa de predicao dos filtros, salva as consideracoes feitas na Secao 5.2.

Entretanto, a matriz de covariancia do ruıdo de processo, Qk−1, e ajustada com um valor nao

nulo durante a estimacao para para ajudar na convergencia e consistencia das estimativas. O

valor ajustado e especıfico para cada teste e segue os procedimentos de sintonia descritos na

Page 109: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 85

Secao 5.4. Alem disso, e aceitavel que os filtros sejam sintonizados com valores diferentes das

matrizes de covariancia do ruıdo de processo. Portanto, e adotada a simbologia QUKF−πk−1 para

denotar a matriz de covariancia usada pelo UKF-π, e, de forma semelhante, para o IUKF,

adota-se QIUKFk−1 .

A matriz de covariancia do erro de medicao, Rk, e assumida conhecida, ja que a var-

iancia, σ2ν , do ruıdo νk adicionado na observacao dos estados e escolhida. A sua definicao e es-

colhida em funcao dos valores das observacoes yk. Considerando que nao ha medicao da veloci-

dade angular da haste 2, a forma maxima da matriz Rk, quando yk = [θ1(kT ) θ2(kT ) θ1(kT )],

e Rk = diag(

σθ12, σθ2

2, σθ12)

.

Denominando por ydk o sinal desejado, que e o sinal da observacao dos estados sem

o ruıdo aditivo, uma forma de quantificar a influencia do ruıdo νk no sinal medido yk e por

meio da relacao sinal-ruıdo (do ingles, signal-to-noise ratio (SNR)) dada por

SNR (dB) = 20 logσyd

σν(6.1)

em que σyd e a dispersao media (desvio padrao amostral) do sinal sem ruıdo e σν e o desvio

padrao do ruıdo de medicao.

A condicao inicial das simulacoes e x0 = [90 0 0/s 0/s]T. A estimativa inicial

x0|0 e ajustada aqui de forma determinıstica para que se possa controlar o efeito do erro da

estimativa inicial nos testes. Ela e definida como

x0|0,i = x0,i +√

P xx0|0,(i,i), (6.2)

em que i e o ındice do estado e P xx0|0 e a covariancia do erro da estimativa inicial que e escolhida

como

P xx0|0 = diag

(

(10 )2, (10 )2, (50 /s)2, (50 /s)2)

. (6.3)

Porem, essa medida e utilizada apenas em testes isolados. Quando for o caso das

simulacoes de Monte Carlo, x0|0 e definido de forma aleatoria por

x0|0,i = x0,i + δi, (6.4)

Page 110: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

86 6 Resultados

tal que δ e uma parcela gerada aleatoriamente como

δi ∼ N(0,√

P xx0|0,(i,i)). (6.5)

Na estimacao conjunta de estados e parametros, ajusta-se, tambem, a matriz de

covariancia do erro da estimativa inicial dos parametros, P pp0|0, como

P pp0|0 = diag

(

(0,005 Nm/rad)2, (0,005 Nm/rad)2)

(6.6)

sendo que a estimativa inicial e p0|0 = [0,00045 Nm/rad 0,00015 Nm/rad]T, de acordo com as

estimativas iniciais obtidas na Secao 5.1.2.

As restricoes impostas as estimativas do IUKF sao as mesmas das equacoes (5.6).

A Tabela 6.1 contem um sumario do que e possıvel variar nos experimentos simulados.

Tabela 6.1: Sumario das condicoes possıveis de serem variadas nos testes.

Caso 1 Caso 2 Caso 3 Caso 4 Caso 5 Caso 6 Caso 7

Tipos de medicao yk = θ1 yk = [θ1 θ1] yk = [θ2 θ1] yk = [θ1 θ2 θ1] yk = [θ1 θ2] yk = [θ1] yk = [θ2]

Relacao sinal-ruıdo1 ≈ 50 dB ≈ 30 dB ≈ 25 dB ≈ 18 dB ≈ 12 dB - -

Taxa de Amostragem2(Tpa) 40fps 20fps 4fps 2fps - - -1 Ruıdo sera adicionado aos sinais das posicoes angulares, quando os mesmos estiverem disponıveis.2 Somente quando as posicoes angulares estiverem disponıveis.

6.2.1 Efeito dos Tipos de Medicoes

Novamente com relacao a Figura 5.9, observe que, apos um rapido transiente, e

possıvel, tanto com o UKF-π como com o IUKF, obter boas estimativas da posicao angular da

haste 2 que nao e medida. Esse resultado tem significado para a questao da observabilidade do

sistema e, por meio dele, e sugerido que o sistema e observavel quando yk = [θ1]. Entretanto,

e importante que o desempenho dos filtros seja analisado em condicoes ruidosas, alias, uma

das funcionalidades dos mesmos e a de reduzir ruıdos de medicao.

Conforme verificado por Firmo (2007), o sinal de velocidade gerado pelo sensor

acoplado a haste 1 possui uma relacao sinal-ruıdo de aproximadamente 54dB. Nessas condicoes,

os filtros conseguem manter uma boa qualidade das estimativas de todos os estados. Entre-

tanto, quando a relacao sinal-ruıdo atinge o nıvel de 26dB, o filtro IUKF passa a apresentar

divergencia em certas regioes, como sugere a Figura 6.1.

Para melhorar a qualidade das estimativas, introduz-se a medicao da posicoes an-

Page 111: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 87

0s 5s 10s 15s 20s10

−2

10−1

100

101

102

103

(a)

log(

e θ 1,k|k

( ° ))

0s 5s 10s 15s 20s10

−2

10−1

100

101

102

103

(b)

log(

e θ 1• ,k|k

(m

/s))

0s 5s 10s 15s 20s10

−2

10−1

100

101

102

103

(c)

log(

e θ 2,k|k

( ° ))

0s 5s 10s 15s 20s10

−2

10−1

100

101

102

103

(d)

log(

e θ 2• ,k|k

(m

/s))

Figura 6.1: Comparacao do erro de estimacao dos estados (a)θ1, (b)θ1, (c)θ2 e (d)θ2 estimados pelo

UFK-π e IUKF. E medida apenas a velocidade angular da haste 1 com ruıdo tal queSNRθ1

≈ 26dB. O erro esta em escala logarıtmica para facilitar a comparacao. O errode estimacao dos estados dado pelo UKF-π esta indicado pela linha solida (–) vermelha.

Tal erro e limitado pelo intervalo de confianca ±3√

diagPxx(i,i),k |k, indicado pela linha

tracejada azul (- -). O erro de estimacao dos estados ao se utilizar o IUKF esta indicado pela

linha solida (–) bege. Tal erro e limitado pelo intervalo de confianca ±3√

diagPxx(i,i),k |k,

indicado pela linha tracejada rosa (- -).

gulares das hastes. Assim aumenta-se a quantidade de informacao que o filtro utiliza para

calcular suas estimativas. O efeito estabilizante disso e ilustrado na Figura 6.2.

A fim de saber sobre a contribuicao dada pela medicao de outras componentes de

estado, investiga-se, tambem, o resultado dos estimadores para outras configuracoes do vetor

de observacoes yk, em especial aquele caso em que apenas as medicoes das posicoes angulares

estejam disponıveis. Isso porque, como levantado na Secao 5.1.1, o sinal da velocidade angular,

disponibilizado na bancada experimental do pendulo duplo, e uma versao filtrada da velocidade

real, e, sendo assim, deve-se testar de antemao a viabilidade dele ser descartado.

As Figuras 6.3 e 6.4 mostram quais os casos testados para a configuracao de yk e os

respectivos erros medios de estimacao ao se realizar um conjunto de 5 simulacoes de estimacao

de estados utilizando-se o UKF-π e o IUKF, respectivamente. As matrizes de covariancia sao

ajustadas para QUKF−πk−1 = 10−12 diag

(

1, 1, 104, 104)

e QIUKFk−1 = 10−8 diag

(

102, 1, 104, 104)

.

Considera-se o desvio padrao associado as medicoes das posicoes angulares, σθ, igual a 0,2.

Mantem-se o nıvel de ruıdo no sinal da velocidade angular como o mesmo que provoca insta-

bilidade no IUKF, ou seja, SNRθ1≈ 26dB.

Page 112: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

88 6 Resultados

10s 15s 20s−2865

−1432

0

1432

(a)

θ 2• (°

/s)

t(s)

10s 15s 20s−2865

−1432

0

1432

2865 (b)

θ 2• (°

/s)

t(s)

Figura 6.2: Efeito da inclusao da medicao das posicoes angulares para os estimadores. Nos graficos (a) e(b), a linha tracejada (- -) vermelha representa o estado real da velocidade angular da haste2 (variavel de estado nao medida). A linha solida (–) bege indica a estimativa do estadodada pelo UKF-π e a linha traco-ponto (-.-) azul representa a estimativa do estado dada

pelo IUKF. E considerado, no grafico (a), somente a medicao de θ1 com SNRθ1≈ 26dB.

No grafico (b), e considerada a inclusao das medicoes de θ1 e θ2 com ruıdo aditivo cujodesvio padrao e de 0,2.

O perfil das barras e diferente para os dois filtros avaliados. Isso mostra que a alteracao

que configuracao do vetor de medicao provoca no desempenho do filtro e funcao tambem do

tipo do filtro. Observe, por exemplo, que o desempenho do UKF-π melhora bastante quando

somente a medicao da posicao angular da haste 2 esta disponıvel. O mesmo nao ocorre com

o IUKF. A analise do IUKF mostra que quanto mais se mede, melhor sao os resultados (veja

as barras do caso 4 na Figura 6.4). Por outro lado, a analise dos resultados do UKF-π mostra

que a questao nao e somente a de se medir mais, mas que ha certas componentes de estados

que contribuem mais nos resultados do que outras. De fato, percebe-se, em ambos os filtros,

que incluir a medicao a respeito de outra haste melhora consideravelmente os resultados.

Isso pode ser visto ao se comparar o caso 2 com o caso 5. No geral, o UKF-π mostra-se um

melhor estimador, comparado ao IUKF, nas condicoes do teste, pelo fato dos indices atingirem

menores valores.

Devido aos bons resultados alcancados medindo-se apenas as posicoes angulares, nos

testes seguintes sao considerados tanto o caso do vetor yk = [θ1 θ1 θ2] quanto yk = [θ1 θ2].

Page 113: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 89

Figura 6.3: Grafico em barras, em escala logarıtmica, comparando o ındice RMSE da estimacao dosestados do pendulo duplo, ao se utilizar o UKF-π, para sete casos diferentes de configuracaodo vetor de medicao yk.

Figura 6.4: Grafico em barras, em escala logarıtmica, comparando o ındice RMSE da estimacao dosestados do pendulo duplo, ao se utilizar o IUKF, para sete casos diferentes de configuracaodo vetor de medicao yk.

6.2.2 Efeito do Nıvel de Ruıdo

Conforme menciona a Secao 6.2.1, a inclusao das medicoes das posicoes angulares

ajuda a estabilizar os resultados dos filtros, principalmente no caso do IUKF. Para responder

a questao de ate que ponto tais medicoes apresentam uma contribuicao significativa, e inter-

essante investigar o desempenho dos filtros com relacao ao nıvel de ruıdo em tais medicoes.

Para isto, e introduzida uma constante, ρ, que representa o nıvel de ruıdo na obser-

Page 114: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

90 6 Resultados

vacao das posicoes angulares. Essa constante multiplica o desvio padrao mınimo considerado

para o ruıdo de medicao da posicao angular que e σθ1 = σθ2 = 0,2. Dessa forma, a matriz

Rk se torna Rk = ρ2diag(

σθ12, σθ2

2, σθ12/ρ2

)

.

Note que se mantem o sinal da velocidade angular da haste 1 com nıvel constante de

ruıdo que, nos experimentos, equivale a σθ1 = 15/s.

As figuras 6.5-6.6 contrastam dois nıveis de ruıdo, ρ = 10 e ρ = 100, na estimacao

pelos filtros UKF-π e IUKF, respectivamente. A taxa de aquisicao de imagens consider-

ada e de 40 fps. As covariancias do ruıdo de processo sao mantidas equivalentes as uti-

lizadas nos testes da Secao 6.2.1, ou seja, QUKF−πk−1 = 10−12 diag

(

1, 1, 104, 104)

e QIUKFk−1 =

10−8 diag(

102, 1, 104, 104)

.

Observa-se que o UKF-π mantem as estimativas consistentes ao longo das simulacoes,

enquanto que o IUKF apresenta momentos de inconsistencia acompanhados de um alto erro de

estimacao. Para ambos os filtros, nota-se, tambem, um aumento na incerteza das estimativas.

Interessante verificar que os intervalos de confianca evoluem de forma diferente nos dois filtros.

No IUKF, o intervalo de confianca e mais regular e elevado ao mesmo tempo. Por outro lado,

no UKF-π, o intervalo de confianca apresenta maior capacidade de acompanhar o erro de

estimacao e, em media, e menor que aquele produzido pelo IUKF.

Sao testados outros nıveis de ruıdo intermediarios por meio de simulacoes Monte

Carlo, a saber ρ = 20, 50. Considera-se, tambem verificar o desempenho dos filtros para duas

composicoes diferentes do vetor de observacao, yk = [θ1 θ1 θ2] e yk = [θ1 θ2]. As Figuras

6.7-6.8 contem os ındices de desempenho da estimacao para este teste.

Com base nestas figuras, observa-se que o UKF-π e melhor que o IUKF para o caso de

se utililzar as 3 medicoes yk = [θ1 θ1 θ2]. Alem disso, nota-se que para uma relacao sinal-ruıdo

inferior a 30dB, os erros de estimacao aumentam bastante.

6.2.3 Efeito da Taxa de Amostragem

Ainda com relacao ao estudo da inclusao das medicoes das posicoes angulares, nesta

secao avalia-se o comportamento dos filtros com relacao a esparsidade das leituras de posicoes

angulares.

Mantendo um nıvel de ruıdo, ρ = 10, nas medicoes das posicoes angulares, o que

representa um desvio padrao igual a 2, e preservando o ruıdo nas medicoes das velocidades

angulares tal que SNRθ1= 26dB, compara-se, nao somente a questao da esparsidade tempo-

ral das observacoes, como tambem, duas configuracoes do vetor de observacao: no primeiro

Page 115: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 91

0s 5s 10s 15s

100

101

102

103

e θ 2• ,k|k

(m

/s)

Figura 6.5: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro UKF-π para dois nıveis diferentes de ruıdo nos dados daposicao angular. A linha solida (–) bege ocorre quando a relacao sinal-ruıdo e de aproxi-madamente 30 dB e a linha solida (–) vermelha ocorre quando tal relacao diminui paraaproximadamente 12 dB. Nos dois casos, os erros de estimacao possuem como referencia

a linha do intervalo de confianca, ±3√

diagP44

(4,4),k |k, indicado pela linha tracejada (- -)

rosa e linha tracejada (- -) azul, respectivamente.

0s 5s 10s 15s

100

101

102

103

(d)

e θ 2• ,k|k

(m

/s)

Figura 6.6: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro IUKF para dois nıveis diferentes de ruıdo nos dados daposicao angular. A linha solida (–) bege ocorre quando a relacao sinal-ruıdo e de aproxi-madamente 30 dB e a linha solida (–) vermelha ocorre quando tal relacao diminui paraaproximadamente 12 dB. Nos dois casos, os erros de estimacao possuem como referencia

a linha do intervalo de confianca, ±3√

diagP44

(4,4),k |k, indicado pela linha tracejada (- -)

rosa e linha tracejada (- -) azul, respectivamente.

Page 116: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

92 6 Resultados

Figura 6.7: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1, θ1 e θ2. Saosimulados cinco casos diferentes de nıvel de ruıdo nas observacoes das posicoes angulares.Em (a), mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.

Figura 6.8: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1 e θ2. Saosimulados cinco casos diferentes de nıvel de ruıdo nas observacoes das posicoes angulares.Em (a), mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.

momento, yk = [θ1 θ1 θ2] (ver figuras 6.9(a) e 6.10(a)), e, no segundo momento, yk = [θ1 θ2]

(ver figuras 6.9(b) e 6.10(b)).

Importante notar que, quando se mede apenas as posicoes angulares, resultados ruins

ocorrem caso se eleve o intervalo de amostragem Tpa para alem de 150ms, principalmente ao

se tratar do IUKF. Por outro lado, se forem utilizadas as medicoes da velocidade angular,

pode-se conseguir boas estimativas mesmo com Tpa = 500ms.

O problema da divergencia ainda afeta o filtro IUKF sendo que o tempo de duracao

aumenta quando se aumenta a esparsidade das medicoes. O UKF-π tambem diverge, em

certos momentos, quando se utilza apenas as medicoes das posicoes angulares.

Simulacoes Monte Carlo sao executadas para testar outras taxas de aquisicao das

Page 117: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 93

0s 5s 10s 15s 20s 25s10

−1

100

101

102

103

104

105

(a)

log(

e θ 2• ,k|k

(m

/s))

0s 5s 10s 15s 20s 25s10

−1

100

101

102

103

104

105

(b)

log(

e θ 2• ,k|k

(m

/s))

Figura 6.9: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro UKF-π para duas taxas diferentes de aquisicao de dadosda posicao angular. A linha solida (–) vermelha ocorre quando a taxa de aquisicao e de20 Hz e a linha solida (–) bege ocorre quando tal taxa diminui para 2 Hz, no grafico (a),e para 3,5 Hz, no caso (b). Nos dois casos, os erros de estimacao possuem como referencia

a linha do intervalo de confianca, ±3√

diagP44

(4,4),k |k, indicado pela linha tracejada (- -)

azul e linha tracejada (- -) rosa, respectivamente. O grafico (a) obtem-se para o caso dovetor de observacao yk = [θ1 θ1 θ2]. E, em (b), exclui-se a velocidade angular da haste 1.

posicoes angulares, sao eles, Tpa = 50ms (20fps), Tpa = 250ms (4fps) e Tpa = 500ms (2fps).

Os resultados sao mostrados nas Figuras 6.11-6.12. Novamente, nota-se que o UKF-π sobressai

ao IUKF. Interessante notar que, utilizando-se apenas as medicoes das posicoes angulares, os

filtros produzem resultados razoaveis para um intervalo de amostragem de ate 50ms. No caso

do UKF-π e possıvel estender esse intervalo ate 250ms. Isso traz uma informacao quantitativa

sobre a previsibilidade do pendulo duplo caotico.

6.2.4 Estimacao Conjunta de Estados e Parametros

Conforme discutido na Secao 2.6, e possıvel utilizar o UKF-π ou o IUKF para esti-

mar alguns parametros do modelo do sistema em observacao. A Tabela 5.1, contem todos

os parametros, e seus respectivos valores, do modelo do pendulo duplo caotico obtido pela

modelagem fenomenologica, conforme descrito na Secao 3.2.

Alguns dos parametros do pendulo duplo, alem de serem facilmente determinados

experimentalmente, variam muito pouco com o passar do tempo, como, por exemplo, as

massas e os comprimentos das hastes. Parametros, como os coeficientes de atrito, alem de

variarem com o tempo de uso da plataforma, dificilmente dispoe de instrumentos capazes de

Page 118: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

94 6 Resultados

0s 5s 10s 15s 20s 25s10

−1

100

101

102

103

104

(a)

log(

e θ 2• ,k|k

(m

/s))

0s 5s 10s 15s 20s 25s10

−1

100

101

102

103

104

(b)

log(

e θ 2• ,k|k

(m

/s))

Figura 6.10: Erro logarıtmico, indicado pelas linhas solidas, da estimacao do estado nao medido, θ2,resultado da estimacao do filtro IUKF para duas taxas diferentes de aquisicao de dadosda posicao angular. A linha solida (–) vermelha ocorre quando a taxa de aquisicao e de20 Hz e a linha solida (–) bege ocorre quando tal taxa diminui para 2 Hz, no grafico (a), epara 3,5 Hz, no caso (b). Nos dois casos, os erros de estimacao possuem como referencia

a linha do intervalo de confianca, ±3√

diagP44

(4,4),k |k, indicado pela linha tracejada (- -)

azul e linha tracejada (- -) rosa, respectivamente. O grafico (a) obtem-se para o caso dovetor de observacao yk = [θ1 θ1 θ2]. E, em (b), exclui-se a velocidade angular da haste 1.

Figura 6.11: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1, θ1 e θ2.Sao simulados quatro casos diferentes de taxa de amostragem das posicoes angulares. Em(a), mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.

mensura-los. Alem disso, a resposta do sistema e sensıvel a esses parametro.

Diante disso, e interessante um teste no qual estimam-se os coeficientes de atrito das

juntas do pendulo. Por simplicidade e por grau de significancia, apenas os coeficientes de

atrito viscoso, b1 e b2, sao estimados. Portanto, o vetor de parametros a sendo estimados e

Page 119: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 95

Figura 6.12: Medias do ındice RMSE normalizado para uma simulacao Monte-Carlo com 20 realizacoespara estimacao dos estados do pendulo duplo caotico a partir da medicao de θ1 e θ2. Saosimulados quatro casos diferentes de taxa de amostragem das posicoes angulares. Em (a),mostram-se os resultados do UKF-π, e, em (b), os resultados do IUKF.

pk = [b1,k b2,k]T, cujo valor verdadeiro e p = [0,0004Nm/rad 0,000108Nm/rad]T.

Para a realizacao das simulacoes, utilizam-se as medicoes das posicoes angulares e da

velocidade angular da haste 1. As posicoes angulares sao obtidas a cada 50ms e ajusta-se um

desvio padrao do ruıdo de suas medicao igual a 2, ou seja, ρ = 10. A velocidade angular

e mantida sob uma relacao sinal-ruıdo igual a 26dB. A estimativa inicial dos parametros e

escolhida como p0|0 = [0,00045Nm/rad 0,00015Nm/rad]T com a covariancia inicial associada

P pp0|0 = diag

(

(0,005Nm/rad)2, (0,005Nm/rad)2)

. As covariancias do ruıdo de processo sao

reajustadas para QUKF−πk−1 = QIUKF

k−1 = 10−4 diag(

10−2, 10−4, 1, 1)

e as covariancias do ruıdo

de processo associada a evolucao dos parametros sao ajustadas como QUKF−πp,k−1 = QIUKF

p,k−1 =

10−5 diag (1, 1).

As figuras 6.13 e 6.14 mostram os graficos de estimacao dos parametros usando o

UKF-π e o IUKF, respectivamente. A Figura 6.15 mostra os erros de estimacao e a confianca

das estimativas ao longo da simulacao. Com base nessas figuras, percebe-se que os dois filtros

apresentaram erro de estimacao semelhante para a velocidade angular da haste 2, inclusive os

momentos de inconsistencia nas estimativas desse estado parecem ser os mesmos para os dois

filtros. Porem, o IUKF mostra-se mais robusto com relacao as estimativas dos parametros

comparado ao UKF-π. Alem de mais robusto, o IUKF apresenta menor erro medio e menor

grau de incerteza nas estimativas dos parametros. Isso pode ser devido as restricoes impostas

ao filtro que forca o mesmo a nao sair de uma determinada faixa de variacao esperada para

os valores dos parametros. O UKF-π, por nao sofrer de tal restricao, compensa grande parte

do erro de estimacao dos estados nas estimativas dos parametros.

Page 120: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

96 6 Resultados

Apesar do IUKF nao convergir para os valores verdadeiros dos parametros, ele con-

verge para valores muito proximos.

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4

−3

−2

−1

0

1

2

3

4x 10

−3 (a)

b 1 (N

m/r

ad)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4

−3

−2

−1

0

1

2

3

4x 10

−3 (b)

b 2 (N

m/r

ad)

Figura 6.13: Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com dadossimulados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo com desviopadrao σθ = 2 . A velocidade angular da haste 1 e medida. Em (a) e (b), as linhasgrossas pretas (–) indicam o valor verdadeiro dos dois coeficientes b1 e b2, respectivamente.As linhas solidas azuis (–) mostram o resultado obtido da estimacao conjunta de de taisparametros , e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes para

mais e para menos (±3√

diagPpp

k |k) dos parametros estimados.

A Tabela 6.2 contem os resultados do erro medio da estimacao conjunta para difer-

entes nıveis de ruıdo nas medicoes. Os mesmos tipos de ındices sao apresentados na Tabela

6.3, porem para o caso de diferentes taxas de aquisicao da posicao angular. A analise destas

tabelas sugere que o sinal ruidoso da velocidade angular da haste 1, cuja relacao sinal-ruıdo

esta ajustada em 26dB, nao contribui efetivamente para as estimativas dos parametros visto

que os valores de desempenho nao sofrem variacoes significativas quando tal sinal esta pre-

sente. Por isso, recomenda-se que o sinal da velocidade angular tenha nıvel de contaminacao de

ruıdo tal que a relacao sinal-ruıdo seja superior a 26dB para que as estimativas dos parametros

sejam melhores.

Os diagramas das figuras 6.16 e 6.17 mostram os valores medios dos parametros

obtidos nestas simulacoes. Percebe-se que o IUKF produz estimativas mais proximas dos

valores reais. Alem disso, o UKF apresenta grande dificuldade em estimar o coeficiente de

Page 121: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 97

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4

−3

−2

−1

0

1

2

3

4x 10

−3 (a)

b 1 (N

m/r

ad)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−4

−3

−2

−1

0

1

2

3

4x 10

−3 (b)

b 2 (N

m/r

ad)

Figura 6.14: Resultado, do IUKF, para estimacao conjunta de estados e parametros, com dados simu-lados, medindo-se as posicoes angulares a uma taxa de 20 Hz e ruıdo com desvio padraoσθ = 2 . A velocidade angular da haste 1 e medida. Em (a) e (b), as linhas grossas pretas(–) indicam o valor verdadeiro dos dois coeficientes b1 e b2, respectivamente. As linhassolidas azuis (–) mostram o resultado obtido da estimacao conjunta de de tais parametros, e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes para mais e para

menos (±3√

diagPpp

k |k) dos parametros estimados.

atrito viscoso da junta 2, b2.

Page 122: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

98 6 Resultados

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s

10−6

10−4

10−2

100

(a)

log(

e b 1,k|k

(N

m/r

ad))

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s

10−6

10−4

10−2

100

(b)

log(

e b 2,k|k

(N

m/r

ad))

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s

10−4

10−2

100

102

104

(c)

log(

e θ 2• ,k|k

(m

/s))

Figura 6.15: Erro de estimacao, em escala logarıtmica, dos dois parametros estimados, (a)b1 e (b)b2,e do estado nao medido (c)θ2, referentes aos graficos das figuras 6.13 e 6.14. Os errossao indicados por linhas solidas (–) vermelhas, no caso do UKF-π, e por linhas solidas(–) bege, no caso do IUKF. Os erros de estimacao possuem como referencia a linha do

intervalo de confianca, ±3√

diagP44

(i,i),k |k, indicado pela linha tracejada (- -) azul, no

caso do UKF-π, e linha tracejada (- -) rosa, no caso do IUKF.

Tabela 6.2: Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes paraestimacao conjunta de estados e parametros do pendulo duplo caotico para quatro casosdiferentes de nıvel de ruıdo nas observacoes.

SNRθ2 (/s) b1 (Nm/rad) b2 (Nm/rad)

UKF-π IUKF UKF-π IUKF UKF-π IUKF

yk = [θ1 θ1 θ2]T

50 dB (ρ = 1) 316,81 244,27 0,0024 0,000065 0,00056 0,000158

30 dB (ρ = 10) 283,90 222,50 0,0026 0,000109 0,000754 0,000094

25 dB (ρ = 20) 243,32 403,27 0,0038 0,000049 0,0014 0,000094

18 dB (ρ = 50) 282,32 391,00 0,0118 0,00011 0,0036 0,000126

12 dB (ρ = 100) 341,58 435,36 0,0079 0,000082 0,0041 0,000157

yk = [θ1 θ2]T

50 dB (ρ = 1) 62,77 594,94 0,0059 0,000519 0,0014 0,000155

30 dB (ρ = 10) 643,1 480,76 0,0028 0,000357 0,0027 0,000178

25 dB (ρ = 20) 727,33 495,87 0,0117 0,000233 0,0125 0,000267

18 dB (ρ = 50) 767,33 740,36 0,0293 0,000249 0,0237 0,000257

12 dB (ρ = 100) 748,59 769,31 0,0265 0,000263 0,0265 0,000271

Page 123: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 99

Tabela 6.3: Media do ındice RMSE para uma simulacao Monte-Carlo com 5 realizacoes paraestimacao conjunta de estados e parametros do pendulo duplo caotico para quatro casosdiferentes de nıvel de ruıdo nas observacoes.

Tpaθ2 (/s) b1 (Nm/rad) b2 (Nm/rad)

UKF-π IUKF UKF-π IUKF UKF-π IUKF

yk = [θ1 θ1 θ2]T

25 ms (40 fps) 338,98 278,70 0,0028 0,000103 0,000611 0,000136

50 ms (20 fps) 163,71 546,34 0,0014 0,000187 0,000465 0,000134

250 ms (4 fps) 352,25 457,16 0,0051 0,000077 0,0015 0,000139

500 ms (2 fps) 319,42 343,31 0,0083 0,000148 0,0031 0,000067

yk = [θ1 θ2]T

25 ms (40 fps) 40,86 576,71 0,000222 0,000549 0,000064 0,000239

50 ms (20 fps) 885,41 809,40 0,000275 0,000472 0,000917 0,000229

250 ms (4 fps) 1769,9 1027,0 0,0124 0,000328 0,0112 0,000134

500 ms (2 fps) 1632,6 1141,1 0,0034 0,000325 0,0030 0,000133

Figura 6.16: Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas do penduloduplo, para diferentes relacoes sinal-ruıdo das medicoes das posicoes angulares. E medidaa velocidade angular da haste 1. Em cada eixo do grafico, e marcado o valor medio doparametro estimado apos simulacao Monte-Carlo com 5 realizacoes. Os pontos marcadossao ligados formando, assim, um polıgono. O polıgono com os valores reais e o pentagonode linha solida (–) preta. O polıgono obtido pelo UKF-π e formado pela linha solida (–)cinza escuro, e o polıgono obtido pelo IUKF e formado pela linha tracejada (- -) cinzaclaro. Em (a), mostra-se o diagrama do atrito viscoso da junta 1, b1. E, em (b), oresultado para o atrito viscoso da junta 2, b2.

Para finalizar os teste de estimacao conjunta de parametros e estados, avalia-se a

Page 124: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

100 6 Resultados

Figura 6.17: Diagramas de estimacao dos coeficientes de atrito viscoso, b1 e b2, das juntas do penduloduplo, para diferentes taxas de aquisicao das posicoes angulares. E medida a velocidadeangular da haste 1. Em cada eixo do grafico, e marcado o valor medio do parametroestimado apos simulacao Monte-Carlo com 5 realizacoes. Os pontos marcados sao ligadosformando, assim, um polıgono. O polıgono com os valores reais e o quadrado de linhasolida (–) preta. O polıgono obtido pelo UKF-π e formado pela linha solida (–) cinzaescuro, e o polıgono obtido pelo IUKF e formado pela linha tracejada (- -) cinza claro.Em (a), mostra-se o diagrama do atrito viscoso da junta 1, b1. E, em (b), o resultadopara o atrito viscoso da junta 2, b2.

capacidade dos filtros UKF-π e IUKF para rastrear mudanca nos valores dos parametros

do sistema. Para isso, simula-se um caso em que a junta 2 passa, a partir de determinado

momento, a apresentar amortecimento viscoso bem elevado, tal que b2 = 0,005Nm/rad. Com

esse valor de amortecimento, a haste oscila em regime periodico. Os resultados sao mostrados

nas Figuras 6.18 e 6.19. Observa-se que o resultado nao e satisfatorio. O esforco dos filtros

em acompanhar a mudanca do parametro e pouco. Interessante que o IUKF, apos o degrau

no coeficiente no coeficiente de atrito viscoso da junta 2, tende a convergir a estimativa do

coeficiente de atrito viscoso da junta 1 em direcao ao valor real deste parametro.

Page 125: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.2 Resultados Simulados 101

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−5

0

5x 10

−3 (a)

b 1 (N

m/r

ad)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s

0

1

2

3

4

5

6x 10

−3 (b)

b 2 (N

m/r

ad)

Figura 6.18: Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do sistema.Sao utilizados dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz eruıdo com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida. Em (a)e (b), as linhas grossas pretas (–) indicam o valor verdadeiro dos dois coeficientes b1 eb2, respectivamente. As linhas solidas azuis (–) mostram o resultado obtido da estimacaoconjunta de de tais parametros , e as linhas pontilhadas vermelhas(− · −) indicam tres

desvios padroes para mais e para menos (±3√

diagPpp

k |k) dos parametros estimados.

Page 126: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

102 6 Resultados

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s−2

0

2

4

6

8

10x 10

−4 (a)

b 1 (N

m/r

ad)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s 55s 60s 65s 70s 75s 80s

0

1

2

3

4

5

6x 10

−3 (b)

b 2 (N

m/r

ad)

Figura 6.19: Resultado, do UKF-π, para o teste de rastrear mudanca no parametro b2 do sistema.Sao utilizados dados simulados, medindo-se as posicoes angulares a uma taxa de 20 Hz eruıdo com desvio padrao σθ = 2 . A velocidade angular da haste 1 e medida. Em (a)e (b), as linhas grossas pretas (–) indicam o valor verdadeiro dos dois coeficientes b1 eb2, respectivamente. As linhas solidas azuis (–) mostram o resultado obtido da estimacaoconjunta de de tais parametros , e as linhas pontilhadas vermelhas(− · −) indicam tres

desvios padroes para mais e para menos (±3√

diagPpp

k |k) dos parametros estimados.

Page 127: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.3 Resultados Experimentais 103

6.3 Resultados Experimentais

A seguir, utilizam-se dados experimentais coletados da plataforma do pendulo duplo

por meio do Subsistema de Interface e Coleta de Dados descrito na Secao 3.1.4.

Diferentemente dos testes com dados simulados, a matriz de covariancia do ruıdo,

Rk, nao possui o valor exato das variancias dos ruıdos das medicoes. Quanto mais proximo

a covariancia Rk estiver dos valores verdadeiros, melhor e. A variancia do ruıdo do sinal de

velocidade angular e encontrada utilizando a informacao presente no trabalho de Firmo (2007)

de que a relacao sinal-ruıdo deste sinal e de aproximadamente 54dB. Simulando o modelo

do pendulo duplo por 100 segundos, observa-se que a dispersao media da velocidade angular

e 362,4/s. Por meio da equacao (6.1), encontra-se, entao, o desvio padrao do ruıdo como

0,72/s . Com relacao ao ruıdo do sensor baseado em visao computacional, nao se dispoe de

um metodo para determina-lo. Considera-se que o desvio padrao das medicoes angulares e de

2, por observacao dos dados com o pendulo parado. A matrizes de covariancia dos erros de

processo, QUKF−πk−1 e QIUKF

k−1 , sao ajustada de forma a ajudar na convergencia e consistencia

das estimativas.

Num primeiro momento, realiza-se a estimacao dos estados e, em seguida, sao esti-

mados, conjuntamente, estados e parametros.

6.3.1 Estimacao de Estados

Como descrito na Secao 5.3, em casos experimentais, utiliza-se o sinal de inovacao

para avaliar o desempenho dos filtros uma vez que nao se conhece os valores verdadeiros

dos estados. A Figura 6.20 mostra os erros de inovacao das medicoes da velocidade angular

da haste 1 e da posicao angular da haste 2 produzidos pelos filtros UKF-π e IUKF durante

50 segundos de estimacao com dados experimentais. Observe que os erros estao dentro do

intervalo de confianca, demonstrando, assim, que as estimativas estao consistentes.

Nesse experimento, as covariancias do ruıdo de processo sao ajustadas comoQUKF−πk−1 =

diag (0,025, 0,0025, 0,25, 0,0005) e QIUKFk−1 = diag (0,025, 0,0025, 0,25, 0,004). As posicoes

angulares sao obtidas a taxa de 20Hz.

As figuras 6.21(a) e 6.21(b) mostram o retrato de fases contruıdo com as estimativas

obtidas no experimento. Percebe-se que a Figura 6.21(a) se assemelha com a Figura 5.2(a).

A fim de remover o efeito da dinamica do sensor de velocidade, refaz-se o teste

utilizando-se somente as medicoes das posicoes angulares. Com isso, obtem-se os retratos

Page 128: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

104 6 Resultados

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s

−150

−100

−50

0

50

100

150

(a)

η θ 1• ,k|k

(° /s

)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s−400

−300

−200

−100

0

100

200

300

400(b)

η θ 2,k|k

( ° )

Figura 6.20: Comparacao do erro de inovacao do UFK-π e IUKF para o caso experimental de estimacaode estados. Em (a), tem-se o erro de inovacao da velocidade angular da haste 1 e, em(b), tem-se o erro de inovacao para a posicao angular da haste 2. Os erros sao indicadospela cor vermelha, no caso do UKF-π, e pela cor bege, no caso do IUKF. O intervalo de

confianca ±3√

diagPyy

(i,i),k |k, onde i e o ındice da medicao, esta indicado em azul, para

o caso do UKF-π, e indicado em rosa, para o caso do IUKF.

de fase exibidos nas figuras 6.21(c) e 6.21(d). Neste caso, a Figura 6.21(c) se assemelha a

Figura 3.11, que, de fato, aproxima-se mais da dinamica exibida pelo modelo do pendulo

duplo.

No entanto, retirar a medicao da velocidade angular tem efeito prejudicial nas es-

timativas do UKF-π, como mostra a Figura 6.22. Nota-se, no intervalo de 20 a 21s, fortes

oscilacoes nas estimativas das velocidades angulares. O mesmo nao ocorre com o IUKF que,

como se ve na Figura 6.23, manteve estimativas suaves mesmo com a remocao da velocidade

angular do conjunto das variaveis medidas.

6.3.2 Estimacao Conjunta de Estados e Parametros

No experimento da estimacao conjunta, deseja-se estimar os mesmos parametros es-

timados na Secao 6.2.4, porem, a partir de dados experimentais. Outra diferenca deste teste

com o teste da Secao 6.2.4 e que o ruıdo associado a medicao da velocidade angular e mais

baixo (SNR ≈ 54dB) e o intervalo de aquisicao das posicoes angulares, Tpa, e mais curto,

25ms. Apesar das condicoes parecerem melhores, lembra-se que a medicao experimental da

velocidade angular contem informacao da dinamica do sensor, que nao e levada em conta pelo

modelo de predicao do filtro.

As figuras 6.24 e 6.25 mostram os graficos de estimacao dos parametros usando o UKF-

Page 129: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.3 Resultados Experimentais 105

−3 −2 −1 0 1 2 3−30

−20

−10

0

10

20

30 (a)

θ 1• (ra

d/s)

θ1(rad) −1−0.5

00.5

1

−1

−0.5

0

0.5

1

−50

0

50

cos(θ2)

(b)

sen(θ2• )

θ 2• (ra

d/s)

−3 −2 −1 0 1 2 3−30

−20

−10

0

10

20

30 (c)

θ 1• (ra

d/s)

θ1(rad)−1

−0.50

0.51

−1−0.5

00.5

1

−50

0

50

cos(θ2)

(d)

sen(θ2• )

θ 2• (ra

d/s)

Figura 6.21: Retrato de fases da haste 1, (a) e (c), e da haste 2, (b) e (d), construıdo com os estadosestimados pelo IUKF a partir de dados experimentais coletados do pendulo duplo. Em (a)e (b), as estimativas sao geradas medindo-se as posicoes angulares e a velocidade angularda haste 1. Em (c) e (d), medem-se apenas as posicoes angulares para obter os retratosde fases.

π e o IUKF, respectivamente. E a Figura 6.26 mostra os sinais de inovacao ao longo do teste.

Os valores medios dos parametros estimados sao b1 = −0,02Nm/rad e b2 = 0,025Nm/rad

para o UKF-π; e b1 = 0,0005Nm/rad e b2 = 0,0003Nm/rad para o IUKF. Novamente, o IUKF

apresenta-se melhor que o UKF-π para o problema da estimacao conjunta. Alem disso, nota-

se uma semelhanca na trajetoria seguida pelas estimativas dos parametros com os resultados

da Secao 6.2.4, para o caso do IUKF. O UKF-π gera estimativas de parametros com valores

negativos durante intervalos de tempo apreciaveis, o que nao e adequado para o sistema sendo

identificado.

Page 130: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

106 6 Resultados

20s 25s 30s−1145

−570

0

570

1145 (b)

θ 1• (°

/s)

t(s)

20s 25s 30s−2865

−1432

0

1432

2865 (d)

θ 2• (°

/s)

t(s)

Figura 6.22: Estimativas das velocidades angulares, dadas pelo UKF-π a partir de dados experimentais.Sao consideradas duas situacoes. A primeira em que a velocidade angular da haste 1 foiutilizada pelo filtro. Nesse caso as estimativas sao indicadas pela linha solida (–) azul.E, num segundo momento, nao se utiliza a velocidade angular da haste 1. Nesse caso asestimativas sao indicadas pela linha tracejada (–) rosa.

20s 25s 30s−1145

−570

0

570

1145 (a)

θ 1• (°

/s)

t(s)

20s 25s 30s−2865

−1432

0

1432

2865 (b)

θ 2• (°

/s)

t(s)

Figura 6.23: Estimativas das velocidades angulares, dadas pelo IUKF a partir de dados experimentais.Sao consideradas duas situacoes. A primeira em que a velocidade angular da haste 1 foiutilizada pelo filtro. Nesse caso as estimativas sao indicadas pela linha solida (–) azul.E, num segundo momento, nao se utiliza a velocidade angular da haste 1. Nesse caso asestimativas sao indicadas pela linha tracejada (–) rosa.

Page 131: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.3 Resultados Experimentais 107

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s

−0.03

−0.02

−0.01

0

0.01

0.02

(a)

b 1 (N

m/r

ad)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s−0.02

−0.01

0

0.01

0.02

0.03

(b)

b 2 (N

m/r

ad)

Figura 6.24: Resultado, do UKF-π, para estimacao conjunta de estados e parametros, com dadosexperimentais, medindo-se, alem da velocidade angular da haste 1, as posicoes angularesa uma taxa de 40 Hz. Em (a), (b), e (c), as linhas grossas pretas (–) indicam o valordos tres coeficientes b1, b2 e kt, respectivamente, do modelo do pendulo duplo obtido em5.1.2. As linhas solidas azuis (–) mostram o resultado obtido da estimacao conjunta de detais parametros , e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes

para mais e para menos (±3√

diagPpp

k |k) dos parametros estimados.

Page 132: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

108 6 Resultados

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s−0.02

−0.015

−0.01

−0.005

0

0.005

0.01

0.015

0.02 (a)

b 1 (N

m/r

ad)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s 50s

−0.015

−0.01

−0.005

0

0.005

0.01

0.015

0.02 (b)

b 2 (N

m/r

ad)

Figura 6.25: Resultado, do IUKF, para estimacao conjunta de estados e parametros, com dados ex-perimentais, medindo-se, alem da velocidade angular da haste 1, as posicoes angulares auma taxa de 40 Hz. Em (a), (b), e (c), as linhas grossas pretas (–) indicam o valor dostres coeficientes b1, b2 e kt, respectivamente, do modelo do pendulo duplo obtido em 5.1.2.As linhas solidas azuis (–) mostram o resultado obtido da estimacao conjunta de de taisparametros , e as linhas pontilhadas vermelhas(− · −) indicam tres desvios padroes para

mais e para menos (±3√

diagPpp

k |k) dos parametros estimados.

Page 133: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

6.3 Resultados Experimentais 109

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s−200

−150

−100

−50

0

50

100

150

200(a)

η θ 1• ,k|k

(° /s

)

0s 5s 10s 15s 20s 25s 30s 35s 40s 45s−500

0

500(b)

η θ 2,k|k

( ° )

Figura 6.26: Comparacao do erro de inovacao do UFK-π e IUKF para o caso experimental de estimacaoconjunta de estados e parametros apresentados nas figuras 6.26-6.24, respectivamente.Em (a), tem-se o erro de inovacao da velocidade angular da haste 1 e, em (b), tem-seo erro de inovacao para a posicao angular da haste 2. Os erros sao indicados pela corvermelha, no caso do UKF-π, e pela cor bege, no caso do IUKF. O intervalo de confianca

±3√

diagPyy

(i,i),k |k, onde i e o ındice da medicao, esta indicado em azul, para o caso do

UKF-π, e indicado em rosa, para o caso do IUKF.

Page 134: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 135: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Capıtulo 7

Conclusoes e Propostas de Continuidade

“Ainda que eu falasse a lıngua dos anjos e dos homens, se nao tivesse amor, eu nada seria.”

Apostolo Paulo

7.1 Discussao e Conclusoes

Este trabalho cumpre os objetivos que foram propostos. Parte dos resultados aqui

apresentados encontra-se em (Rezende et al., 2010).

Implementam-se os algoritmos de filtragem de Kalman para sistemas nao-lineares

baseados na abordagem por pontos sigma, a saber, o filtro de Kalman unscented (UKF)

e o filtro de Kalman unscented intervalar (IUKF), para estimacao conjunta de estados e

parametros de um pendulo duplo caotico experimental. Esse ultimo filtro, o IUKF, contempla

uma maneira de acresentar informacao a priori, sobre os estados, escrita na forma de intervalos.

No caso do pendulo, um tipo de informacao a priori e que a posicao angular das hastes oscila

dentro da faixa [−π,π].

Os filtros implementados sao capazes de tratar dados de fontes sensoras recebidos em

diferentes intervalos de amostragem desde que sejam sıncronas. Para o caso deste trabalho,

tais intervalos de amostragem devem ser multiplos de 5ms, mas, esse parametro pode ser

alterado para outras aplicacoes.

Deriva-se, tambem, um modelo para o pendulo duplo da plataforma experimental

estudada utilizando-se a abordagem de Lagrange. Tal modelo apresenta mais claramente as

parcelas conservativas e nao-conservativas que compoe o sistema em contrapartida ao modelo

derivado segundo as equacoes de Newton.

Aplica-se os filtros UKF e IUKF na estimacao de estados e parametros do pendulo

duplo caotico usando, inicialmente, dados simulados e, por ulitmo, dados experimentais. Um

Page 136: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

112 7 Conclusoes e Propostas de Continuidade

recurso para coletar experimentalmente dados da velocidade angular da haste 1 ja estava

disponıvel antes mesmo da realizacao deste trabalho. Porem, para ser posıvel medir as posicoes

angulares, desenvolveu-se um sensor baseado em visao computacional.

As condicoes que produzem efeito na qualidade das estimativas e que foram avaliadas,

com dados simulados, sao os tipos de medicoes, o nıvel de ruıdo nas medicoes e a esparcidade

das medicoes. Sobre essas condicoes, os filtros apresentam desempenhos diferentes, embora

fique claro que o aumeto do ruıdo e o aumento da esparcidade tendem a piorar o resultado

de ambos os filtros. Na estimacao puramente de estados, o UKF-π mostra-se melhor que o

IUKF. Porem, no caso da estimacao conjunta de estados e parametros, o IUKF se mostra

melhor que o UKF-π.

E possıvel estimar os quatro estados do sistema por meio da medicao de uma variavel

de estado, por exemplo, a velocidade angular da haste 1, que e aquela que apresenta a maior

taxa de disponibilidade para o filtro, 200Hz. Porem, deve-se observar a questao do ruıdo.

O que se sabe e que, para estimacao de estados com dados experimentais, utilizar somente

a velocidade angular da haste 1 nao e aconselhavel ja que a medicao da mesma contem

informacao dinamica do sensor, que, por sua vez, nao e considerada no processo de filtragem.

Como foi visto, acrescentar as medicoes das posicoes angulares melhora consideravel-

mente o desempenho do filtro principalmente se existir ao menos uma medicao a respeito de

cada uma das duas hastes, como por exemplo, se se medir a velocidade angular da haste 1 e a

posicao angular da haste 2. Para evitar a contra-indicacao de se utilizar a velocidade angular

da haste 1, para dados experimentais, verificou-se a possibilidade da estimacao utlizando-se

somente medicoes das posicoes angulares. Os resultados nessa configuracao sao bons e muito

uteis para o caso da caracterizacao dinamica do sistema. Porem, sofre do fator limitante

que e a taxa de processamento do sensor baseado em visao computacional cujo valor maximo

alcancado neste trabalho foi de 40Hz.

O modelo matematico tambem e um fator crucial na questao do desempenho do filtro

para dados experimentais apesar de que, neste trabalho, por se ter um conhecimento razoavel

a respeito das equacoes que governam o sistema, acredita-se que o modelo nao seja uma fonte

de muita incerteza. Alem disso, por se tratar de um modelo baseado na fısica do processo, a

estimacao de alguns de seus parametros e algo bem interessante devido ao apelo fısico. Neste

trabalho, obteve-se bons resultados na estimacao dos coeficientes de atrito viscoso das duas

juntas do pendulo duplo utilizando-se o filtro IUKF.

Page 137: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

7.2 Trabalhos Futuros 113

7.2 Trabalhos Futuros

Uma das dificuldades deste trabalho foi com relacao a sintonia das matrizes de covari-

ancia do ruıdo de processo e de medicao. Para o caso experimental, nao se dispos de metodos

precisos de estimacao dessas matrizes. Um estudo interessante seria obter valores para essas

matrizes sem ser por tentativa e erro.

Outra questao importante e com relacao ao sensor da velocidade angular da haste

1. Seria bastante util uma forma de realizar a medicao dessa velocidade com um sensor de

dinamica mais rapida.

Acredita-se que, para dar extensao a este trabalho para a area de controle, seria

necessario implementar um estimador capaz de trabalhar on-line. Para isso, um grande esforco

com relacao ao sistema de processamento de imagem e programacao em tempo real deve ser

feito.

Page 138: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo
Page 139: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Bibliografia

Abarbanel, H. D. I., Brown, R., e Kadtke, J. B. (1990). Prediction in chaotic nonlinear

systems: Methods for time series with broadband fourier spectra. Physical Review A,

41 (4), 1782–1807.

Abarbanel, H. D. I., Brown, R., Sidorowich, J. J., e Tsimring, L. Sh. (1993). The analysis of

observed chaotic data in physical systems. Reviews of Modern Physics, 65 (4), 1331–1392.

Abdallah, F., Gning, A., e Bonnifait, P. (2008). Box particle filtering for nonlinear state

estimation using interval analysis. Automatica, 44 (3), 807–815.

Aguirre, L. A. e Billings, S. A. (1994). Validating identified nonlinear models with chaotic

dynamics. International Journal of Bifurcation and Chaos, 4 (1), 109–125.

Aguirre, L. A., Teixeira, B. O. S., e Torres, L. A. B. (2005). Using data-driven discrete-time

models and the unscented Kalman filter to estimate unobserved variables of nonlinear

systems. Physical Review E, 72 (2),1–12.

Aguirre, L. A. e Billings, S. A. (1995). Identification of models for chaotic systems from

noisy data: implications for performance and nonlinear filtering. Physica D: Nonlinear

Phenomena, 85 (1–2), 239–258.

Alspach, D. L. e Sorenson, H. W. (1972). Nonlinear bayesian estimation using gaussian sum

approximations. IEEE Transactions on Automatic Control, 17 (4), 439–448.

Anderson, B. D. O. e Moore, J. B. (1979). Optimal Filtering (1 ed.). Information and Systems

Science Series. New Jersey: Prentice Hall, Inc.

Arasaratnam, I. e Haykin, S. (2009). Cubature kalman filters. IEEE Transactions on Auto-

matic Control, 54 (6), 1254–1269.

Page 140: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

116 Referencias Bibliograficas

Armesto, L., Tornero, J., e Vincze, M. (2008). On multi-rate fusion for non-linear sampled-

data systems: Application to a 6D tracking system. Robotics and Autonomous Systems,

56 (8), 706–715.

Athans, M., Wishner, R. P., e Bertolini, A. (1968). Suboptimal state estimation for

Continuous-Time nonlinear systems from discrete noisy measurements. IEEE Trans-

actions on Automatic Control, 13 (5), 504–514.

Awrejcewicz, J., Kudra, G., e Wasilewski, G. (2007). Experimental and numerical investi-

gation of chaotic regions in the triple physical pendulum. Nonlinear Dynamics, 50 (4),

755–766.

Bagchi, A. e ten Brummelhuis, P. (1990). Simultaneous ML estimation of state and parameters

for hyperbolic systems with noisy boundary conditions. In Proceedings of the IEEE

Conference on Decision and Control, 1, 222–224, Honolulu , Hawaii.

Blauer, M. e Belanger, P. R. (1987). State and parameter estimation for robotic manipulators

using force measurements. IEEE Transactions on Automatic Control, 32 (12), 1055–1066.

Blazejcyk, B. e Kapitaniak, T. (1998). Co-existing attractors of impact oscillator. Chaos,

Solitons and Fractals, 9 (8), 1439–1443.

Bortoff, S. A. Robust Swing-Up control for a rotational double pendulum. In Proceedings of

the 13th IFAC World Congress, (pp. 413–418)., San Francisco, California.

Chandrasekar, J., Ridley, A. J., e Bernstein, D. S. (2007). A comparison of the extended and

unscented Kalman filters for Discrete-Time systems with nondifferentiable dynamics. In

Proceedings of the 2007 American Control Conference, (pp. 4431–4436)., New York City,

USA.

Cheng, H. D., Jiang, X. H., Sun, Y., e Wang, J. (2001). Color image segmentation: advances

and prospects. Pattern Recognition, 34 (12), 2259–2281.

Cheng, H. D., Jiang, X. H., e Wang, J. (2002). Color image segmentation based on homogram

thresholding and region merging. Pattern Recognition, 35 (2), 373–393.

Cheng, H. D. e Shi, X. J. (2004). A simple and effective histogram equalization approach to

image enhancement. Digital Signal Processing: A Review Journal, 14 (2), 158–170.

Page 141: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Referencias Bibliograficas 117

Christini, D. J., Collins, J. J., e Linsay, P. S. (1996). Experimental control of high-dimensional

chaos: The driven double pendulum. Physical Review E, 54 (5), 4824–4827.

Cox, H. (1964). On the estimation of state variables and parameters for noisy dynamic

systems. IEEE Transactions on Automatic Control, 9 (1), 5–12.

Daum, F. (2005). Nonlinear filters: Beyond the Kalman filter. IEEE Aerospace and Electronic

Systems Magazine, 20 (8), 57–69.

Davis, M. (1981). New approach to filtering for nonlinear systems. IEE Proceedings D Control

Theory and Applications, 128 (5), 166–172.

de Paula, A. S., Savi, M. A., e Pereira-Pinto, F. H. I. (2006). Chaos and transient chaos in

an experimental nonlinear pendulum. Journal of Sound and Vibration, 294 (3), 585–595.

Dempster, A., Laird, N., e Rubin, D. (1977). Maximum likelihood from incomplete data via

the EM algorithm. Journal of the Royal Statistical Society, 39 (1), 1–38.

Djuric, P. M., Kotecha, J. H., Zhang, J., Huang, Y., Ghirmai, T., Bugallo, M. F., e Mıguez,

J. (2003). Particle filtering. IEEE Signal Processing Magazine, 20 (5), 19–38.

Doucet, A., Godsill, S., e Andrieu, C. (2000). On sequential monte carlo sampling methods

for bayesian filtering. Statistics and Computing, 10 (3), 197–208.

Drake, D. (1996). Minimum mean square error estimation for a class of chaotic systems.

Espinoza-Quesada, E. S. e Ramos-Velasco, L. (2006). Vision based control of an underactu-

ated system using a reduced observer. In Proceedings of the Electronics, Robotics and

Automotive Mechanics Conference, CERMA 2006, 1 , 9–14.

Evensen, G. (1997). Advanced data assimilation for strongly nonlinear dynamics. Monthly

Weather Review, 125 (6), 1342–1354.

Farrell, J. A. (2009). Aided Navigation: GPS with high rate sensors (International Edition

ed.). Taiwan: McGraw-Hill.

Feeny, B. F. (2009). Estimating damping parameters in multi-degree-of-freedom vibration

systems by balancing energy. Journal of Vibration and Acoustics, 131 (4), 041005–041014.

Feeny, B. F. e Moon, F. C. (1993). Bifurcation sequences of a coulomb friction oscillator.

Nonlinear Dynamics, 4 (1), 25–37.

Page 142: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

118 Referencias Bibliograficas

Fiedler-Ferrara, N. e Prado, C. (2009). Caos, Uma Introducao (Second ed.). Sao Paulo, Brasil:

Edgard Blucher.

Firmo, D. (2007). Construcao e Caracterizacao de um Pendulo Duplo Caotico. Disertacao de

Mestrado, Programa de Pos-Graduacao em Engenharia Eletrica, Universidade Federal de

Minas Gerais.

Firmo, D., Torres, L., e Nepomuceno, E. (2007). Simulation and dynamical characterization of

an active mechanical chaotic double pendulum. In Procedings of COBEM 2007, Brasılia,

DF, Brazil. ABCM.

Franca, L. e Savi, M. (2001). Distinguishing periodic and chaotic time series obtained from

an experimental nonlinear pendulum. Nonlinear Dynamics, 26 (3), 253–271.

Gertner, I. (1978). An alternative approach to nonlinear filtering. Stochastic Processes and

their Applications, 7 (3), 231–246.

Gonzalez, R. e Woods, R. (2002). Digital Image Processing (Second ed.). Prentice Hall, Inc.

Grassberger, P., Hegger, R., Kantz, H., e Schaffrath, C. (1993). On noise reduction methods

for chaotic data. Chaos, 3 (2), 127–141.

Heald, J. P. M. e Stark, J. (2000). Estimation of noise levels for models of chaotic dynamical

systems. Physical Review Letters, 84 (11), 2366–2369.

Hegger, R., Kantz, H., e Schreiber, T. (1999). Practical implementation of nonlinear time

series methods: The TISEAN. Chaos, 9 (2), 413–435.

Hinrichs, N., Oestreich, M., e Popp, K. (1997). Dynamics of oscillators with impact and

friction. Chaos, Solitons and Fractals, 8 (4), 535–558.

Horton, B., Wiercigroch, M., e Xu, X. (2008). Transient tumbling chaos and damping iden-

tification for parametric pendulum. Philosophical Transactions of The Royal Society,

366 (1866), 767–784.

Huang, K.-Q., Wang, Q., e Wu, Z.-Y. (2006). Natural color image enhancement and evaluation

algorithm based on human visual system. Computer Vision and Image Understanding,

103 (1), 52–63.

Inman, D. J. (2001). Engineering Vibrations (2 ed.). New Jersey, USA: Prentice-Hall.

Page 143: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Referencias Bibliograficas 119

Jazwinski, A. H. (1970). Stochastic processes and Filtering Theory (1 ed.). New York: Aca-

demic Press, Inc.

Julier, S. e Uhlmann, J. (1997). A new extension of the Kalman filter to nonlinear systems.

In International Symposium on Aerospace/Defense Sensing, Simulation and Controls, 3 ,

26–37.

Julier, S., Uhlmann, J., e Durrant-Whyte, H. (2000). A new method for the nonlinear trans-

formation of means and covariances in filters and estimators. IEEE Transactions on

Automatic Control, 45 (3), 477–482.

Kaiqi, H., Zhenyang, W., e Qiao, W. (2005). Image enhancement based on the statistics of

visual representation. Image and Vision Computing, 23 (1), 51–57.

Kalman, R. (1960). A new approach to linear filtering and prediction problems. Transactions

of the ASME - Journal of Basic Engineering, 82, 35–45.

Kapitaniak, T. (1990). Chaos in systems with noise (Second ed.). Singapore: World Scientific.

Kelly, S. G. (2000). Fundamentals of Mechanical Vibrations (2 ed.). Singapore: McGraw-Hill.

Khalil, M., Sarkar, A., e Adhikari, S. (2009). Nonlinear filters for chaotic oscillatory systems.

Nonlinear Dynamics, 55 (1–2), 113–137.

Kiyoumarsi, A., Ataei, M., e Ashrafi, R. (2007). The mathematical modeling of a Double-

Pendulum system as a physical model of flexible arm robot. (pp. 1900–1904)., Guangzhou,

China.

Ko, S.-J. e Lee, Y. H. (1991). Center weighted median filters and their applications to image

enhancement. IEEE Transactions on Circuits and Systems, 38 (9), 984–993.

Kurian, A. P. e Puthusserypady, S. (2006). Unscented Kalman filter and particle filter for

chaotic synchronization. In Proceedings of IEEE Asia-Pacific Conference on Circuits and

Systems, 1830–1834.

Lefebvre, T., Bruyninckx, H., e Schutter, J. (2004). Kalman filters for non-linear systems: a

comparison of performance. International Journal of Control, 77 (7), 639–653.

Letellier, C., Aguirre, L., e Maquet, J. (2006). How the choice of the observable may influence

the analysis of nonlinear dynamical systems. Communications in Nonlinear Science and

Numerical Simulation, 11 (5), 555–576.

Page 144: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

120 Referencias Bibliograficas

Liang, J. (2007). Damping estimation via energy-dissipation method. Journal of Sound and

Vibration, 307 (1–2), 349–364.

Liang, J. e Feeny, B. F. (2004). Identifying coulomb and viscous friction in forced dual-damped

oscillators. Journal of Vibration and Acoustics, 126 (1), 118–125.

Liu, B. e Hu, H. (2010). Group delay induced instabilities and hopf bifurcations, of a controlled

double pendulum. International Journal of Non-Linear Mechanics, 45 (4), 442–452.

Majji, M., Junkins, J. L., e Turner, J. D. (2010). A perturbation method for estimation of

dynamic systems. Nonlinear Dynamics, 60 (3), 303–325.

Mann, B. P. e Khasawneh, F. A. (2009). An energy-balance approach for oscillator parameter

identification. Journal of Sound and Vibration, 321 (1–2), 65–78.

Mariani, S. e Ghisi, A. (2007). Unscented Kalman filtering for nonlinear structural dynamics.

Nonlinear Dynamics, 49 (1–2), 131–150.

Maybeck, P. (1979). Introduction. In Stochastic models, estimation and control, volume I (pp.

1–16). Lodon: Academic Press, Inc.

Meng, X. e Rubin, D. (1993). Maximum likelihood estimation via the ECM algorithm: A

general framework. Biometrika, 80 (2), 267–278.

Merwe, R., Freitas, N., Doucet, A., e Wan, E. (2000). The unscented particle filter. Relatorio

Tecnico, Departamento de Engenharia da Universidade de Cambridge, 1–45.

Merwe, R., Wan, E., e Julier, S. (2004). Sigma-Point Kalman filters for nonlinear estimation

and Sensor-Fusion - applications to integrated navigation -. Technical report, American

Institute of Aeronautics and Astronautics.

Moireau, P., Chapelle, D., e Tallec, P. (2008). Joint state and parameter estimation for

distributed mechanical systems. Computer methods in applied mechanics and engineering,

197, 659–677.

Monteiro, L. (2006). Sistemas Dinamicos (2 ed.). Sao Paulo, Brasil: Livraria da Fısica.

Mulder, J., Chu, Q., Sridhar, J., Breeman, J., e Laban, M. (1999). Non-linear aircraft flight

path reconstruction review and new advances. Progress in Aerospace Sciences, 35 (7),

673–726.

Page 145: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Referencias Bibliograficas 121

Naik, S. K. e Murthy, C. A. (2003). Hue-preserving color image enhancement without gamut

problem. IEEE Transactions on Image Processing, 12 (12), 1591–1598.

Nelson, L. e Stear, E. (1976). The simultaneous On-Line estimation of parameters and states

in linear systems. IEEE Transactions on Automatic Control, 21 (1), 94–98.

Norgaard, M., Poulsen, N., e Ravn, O. (2000). Advances in Derivative-Free state estimation

for nonlinear systems. Technical IMM-REP-1998-15, Technical University of Denmark,

Lyngby, Denmark.

Ohta, Y.-I., Kanade, T., e Sakai, T. (1980). Color information for region segmentation.

Computer Graphics and Image Processing, 13 (3), 222–241.

Orrell, D. (2005). Filtering chaos: A technique to estimate dynamical and observational noise

in nonlinear systems. International Journal of Bifurcation and Chaos, 15 (1), 99–107.

Pal, N. R. e Pal, S. K. (1993). A review on image segmentation techniques. Pattern Recogni-

tion, 26 (9), 1277–1294.

Palmer, T. N. (2000). Predicting uncertainty in forecasts of weather and climate. Reports on

Progress in Physics, 63 (2), 71–116.

Papadopoulos, H. e Wornell, G. (1995). Maximum-Likelihood estimation of a class of chaotic

signals. IEEE Transactions on Information Theory, 41 (1), 312–317.

Polesel, A., Ramponi, G., e Mathews, V. J. (2000). Image enhancement via adaptive unsharp

masking. IEEE Transactions on Image Processing, 9 (3), 505–510.

Pratt, W. (2001). Digital Image Processing: PIKS Inside (Third ed.). John Wiley e Sons,

Inc.

Qi, G., Du, S., Chen, G., Chen, Z., e Yuan, Z. (2005). On a four-dimensional chaotic system.

Chaos, Solitons and Fractals, 23 (5), 1671–1682.

Ray, L. R. (1995). Nonlinear state and tire force estimation for advanced vehicle control.

IEEE Transactions on Control System Technology, 3 (1), 117–124.

Rezende, E. F. A., Teixeira, B. O. S., e Torres, L. A. B. (2010). Estimacao de estados

e parametros de um pendulo duplo caotico. Anais do XVIII Congresso Brasileiro de

Automatica, (pp. 810–817)., Bonito, MS, Brasil.

Page 146: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

122 Referencias Bibliograficas

Rhodes, I. (1971). A tutorial introduction to estimation and filtering. IEEE Transactions on

Automatic Control, 16 (6), 688–706.

Richard, M. (1992). Probabilistic state estimation with Discrete-Time chaotic systems. Tech-

nical RLE Technical Report no. 571, Massachusetts Institute of Technology, Research

Laboratory of Electronics.

Rifai, K. E., Haller, G., e Bajaj, A. K. (2007). Global dynamics of an autoparametric spring

mass pendulum system. Nonlinear Dynamics, 49 (1–2), 105–116.

Salapaka, S., Dahleh, M., e Giarre, L. (1997). Filtering of nonlinear chaotic time-series with

noise. In Proceedings of the 36th Conference on Decision e Control, (pp. 1669–1671).,

San Diego, California, USA.

Sarkka, S. (2007). On unscented kalman filtering for state estimation of Continuous-Time

nonlinear systems. IEEE Transactions on Automatic Control, 52 (9), 1631–1641.

Schreiber, T. (1993). Extremely simple nonlinear noise-reduction method. Physical Review

E, 47 (4), 2401–2404.

Sharma, S. N. e Parthasarathy, H. (2008). A two-body continuous-discrete filter. Nonlinear

Dynamics, 51 (1–2), 155–170.

Simon, D. (2006). Optimal State Estimation (1 ed.). New Jersey: John Wiley e Sons,Inc.

Sitz, A., Schwarz, U., e Kurths, J. (2004). The unscented Kalman filter, a powerful tool for

data analysis. International Journal of Bifurcation and Chaos, 14 (6), 2093–2105.

Sitz, A., Schwarz, U., Kurths, J., e Voss, H. (2002). Estimation of parameters and unobserved

components for nonlinear systems from noisy time series. Physical Review, 66 (016210),

9.

Smith, D. e Singh, S. (2006). Approaches to Multi-Sensor data fusion in targeting tracking:

A survey. IEEE Transactions on Knowledge and Data Engineering, 18 (2), 1696–1710.

So, P., Ott, E., e Dayawansa, W. P. (1994). Observing chaos: Deducing and tracking the

state of a chaotic system from limited observation. Physical Review E, 49 (4), 2650–2660.

Soroush, M. (1998). State and parameter estimation and their application in process control.

Computers e Chemical Engineering, 23 (2), 229–245.

Page 147: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

Referencias Bibliograficas 123

Teeple, T., Castaneta, M., Deluzio, K., e Bryant, T. (2009). Pendulum-based method for

determining the temporal accuracy of digital video-based motion capture systems. Gait

e Posture, 29 (2), 349–353.

Teixeira, B. O. S. (2008). Estimacao de Estados com Restricoes para Sistemas Dinamicos

Lineares e Nao-Lineares. Tese de Doutorado, Programa de Pos-Graduacao em Engenharia

Eletrica, Universidade Federal de Minas Gerais.

Teixeira, B. O. S., Torres, L. A. B., e Aguirre, L. A. (2010). Filtragem de Kalman com restri-

coes para sistemas Nao-Lineares: revisao e novos resultados. Sba Controle e Automacao,

21 (2), 127–146.

Teixeira, B. O. S., Torres, L. A. B., Aguirre, L. A., e Bernstein, D. S. (2009). On unscented

Kalman filtering with state interval constraints. Journal of Process Control, 20 (1), 45–57.

Teixeira, B. O. S., Torres, L. A. B., Oliveira, P. H. A. O., e Aguirre, L. A. (2005). Flight

path reconstruction using the unscented Kalman filter algorithm. In Procedings of 18th

International Congress of Mechanical Engineering, Ouro Preto, MG.

Teixeira, B. O. S., Santillo, M. A., Erwin, R. S., e Bernstein, D. S. (2008). Spacecraft tracking

using Sampled-Data Kalman filters. IEEE Control Systems Magazine, 28 (4), 78–94.

Thums, G. D. (2008). Construcao e implementacao de um pendulo duplo caotico. Relatorio

Final de Atividades de Iniciacao Cientıfica, Programa PI BIC/CNPQ, Departamento de

Engenharia Eletronica, Universidade Federal de Minas Gerais.

Togneri, R. e Deng, L. (2003). Joint state and parameter estimation for a Target-Directed

nonlinear dynamic system model. IEEE Transactions on Signal Processing, 51 (12), 3061–

3070.

Tu, Y.-W. e Ho, M.-T. (2010). Design and implementation of dsp and fpga-based robust visual

servoing control of an inverted pendulum. In Procedings of the 2010 IEEE International

Conference on Control Applications, (pp. 83–88)., Yokohama, Japan.

Voss, H., Timmer, J., e Kurths, J. (2004). Nonlinear dynamical system identification from

uncertain and indirect measurements. International Journal of Bifurcation and Chaos,

14 (6), 1905–1933.

Page 148: Estimac˜ao de Estados e Parˆametros de um Pˆendulo Duplo

124 Referencias Bibliograficas

Walker, D. M. e Mess, A. I. (1996). Noise reduction of chaotic systems by Kalman filtering

and by shadowing. International Journal of Bifurcation and Chaos in Applied Sciences

and Engineering, 7 (3), 769–779.

Wan, E., Merwe, R., e Nelson, A. (1999). Dual estimation and the unscented transformation.

Technical report, Oregon Graduate Institute of Science e Technology, Portland, Oregon.

Wang, H., Chamroo, A., Vasseur, C., e Koncar, V. (2008). Hybrid control for vision based

cart-inverted pendulum system. In 2008 American Control Conference, (pp. 3845–3850).,

Seattle, Washington, USA. AACC.

Wang, H., Chamroo, A., Vasseur, C., Koncar, V., e Christov, N. (2010). Modelling and

trajectory tracking control of a 2-dof vision based inverted pendulum. Control Engineering

and Applied Informatics, 12 (3), 59–66.

Weinstein, L. e Adam, J. A. (2008). Guesstimation: solving the world’s problems on the back

of a cocktail napkin (1 ed.). New Jersey, Princeton: Princeton University Press.

Wenzel, L., Vazquez, N., Nair, D., e Jamal, R. (2000). Computer vision based inverted

pendulum. IEEE Instrumentation and Measurement Technology Conference, 3 , 1319–

1323.

Wheeler, T. e Packard, A. (2009). An extension of Sigma-Point Kalman filtering using nonli-

near estimator bases. (pp. 1861–1864)., Hyatt Regency Riverfront, St. Louis, MO, USA.

Wit, C. C., Olsson, H., Astrom, K. J., e Lischinsky, P. (1995). A new model for control of

systems with friction. IEEE Transactions on Automatic Control, 40 (3), 419–425.

Xiaolin, R. e Guangrui, H. (1998). Parameter estimation and filtering for chaotic time series

by steepest descent. In Proceedings of ICSP ’98, (pp. 217–220).

Xue-Dong, W. e Zhi-Huan, S. (2008). GEKF, GUKF and GGPF based prediction of chaotic

time-series with additive and multiplicative noises. Chinese Physics, 17 (9), 3241–3246.

Zhai, T., Yaz, E., e Ruan, H. (2004). Minimum variance estimator design for systems with

quadratic nonlinearities. In Proceedings of 2004 IEEE Electro/Information Technology

Conference, (pp. 183–189).

Ziman, M., Plesch, M., Buzek, V., e Stelmachovic, P. (2005). Process reconstruction: From

unphysical to physical maps via maximum likelihood. Physical Review, 72, 5.