introdução à teoria de controle e programação dinâmica

Upload: james-silva

Post on 21-Jul-2015

312 views

Category:

Documents


0 download

TRANSCRIPT

steuer2008/3/11pageiiiiiiiiConte udo1 Introdu cao 11.1 Apresenta c ao dos Sistemas de Controle . . . . . . . . . . . 11.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2.1 Aquecimento de um Quarto. . . . . . . . . . . . . 51.2.2 Um Problema de Controle Discreto . . . . . . . . . 71.2.3 Um Problema de Tempo Mnimo . . . . . . . . . . 111.2.4 Lan camento de um Foguete . . . . . . . . . . . . . 121.2.5 Equilbrio de um Bast ao. . . . . . . . . . . . . . . 131.2.6 Concentra c ao de Chumbo no Corpo Humano . . . 161.2.7 A Braquistocrona . . . . . . . . . . . . . . . . . . . 181.2.8 Um Problema de ControleOtimo. . . . . . . . . . 21Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 Observabilidade 262.1 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . 262.2 Subespa co n ao Observavel . . . . . . . . . . . . . . . . . . 332.3 Reconstru c ao de Estados . . . . . . . . . . . . . . . . . . . 35Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 373 Controlabilidade 393.1 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . 393.2 Controlabilidade e Observabilidade . . . . . . . . . . . . . 423.3 Sistemas de Controle Aut onomos . . . . . . . . . . . . . . 443.4 Forma Normal dos Sistemas Aut onomos . . . . . . . . . . 473.5 Controlabilidade e EstrategiasOtimas . . . . . . . . . . . 513.6 Atingibilidade de Estados com Restri c oes de Controle . . 543.7 Princpio do BangBang e Problemas de Tempo Mnimo. 603.8 Controlabilidade de Sistemas Lineares Discretos . . . . . . 65Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 67steuer2008/3/11pageiiiiiiiiCONTEUDO4 Estabilidade 714.1 Conceito e Exemplos . . . . . . . . . . . . . . . . . . . . . 714.2 Estabilidade de Sistemas Lineares . . . . . . . . . . . . . . 754.3 Criterio de RouthHurwitz . . . . . . . . . . . . . . . . . 784.4 Perturba c ao de Sistemas Lineares . . . . . . . . . . . . . . 814.5 Metodo de Lyapunov. . . . . . . . . . . . . . . . . . . . . 874.6 Equa c ao Matricial de Lyapunov . . . . . . . . . . . . . . . 924.7 Estabilidade de Sistemas Lineares Discretos . . . . . . . . 96Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 985 Estabiliza cao 1015.1 Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . 1025.2 Coloca c ao de Polos. . . . . . . . . . . . . . . . . . . . . . 1055.3 Observador Din amico . . . . . . . . . . . . . . . . . . . . 1095.4 Estabiliza c ao por Realimenta c ao de Sada . . . . . . . . . 1145.5 Pontos de Opera c ao . . . . . . . . . . . . . . . . . . . . . 116Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 1196 Identica caodeParametros 1206.1 Controle Automatico. . . . . . . . . . . . . . . . . . . . . 1206.2 Identicabilidade . . . . . . . . . . . . . . . . . . . . . . . 1216.3 Identica c ao Adaptativa: Introdu c ao. . . . . . . . . . . . 1266.4 Identica c ao Adaptativa: Estabilidade . . . . . . . . . . . 131Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 1377 CalculoVariacional 1387.1 Problemas Variacionais e Convexidade . . . . . . . . . . . 1397.2 Lemas de du BoisReymond e Lagrange . . . . . . . . . . 1457.3 Equa c ao de EulerLagrange . . . . . . . . . . . . . . . . . 1477.4 Extremais Diferenciaveis por Partes . . . . . . . . . . . . 1567.5 Problemas Vetoriais . . . . . . . . . . . . . . . . . . . . . 164Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 1658 PrincpiosVariacionaisnaMecanica 1688.1 Mec anica Newtoniana . . . . . . . . . . . . . . . . . . . . 1688.2 Teoremas Conservativos em Sistemas Fechados . . . . . . 1778.3 Mec anica Lagrangeana. . . . . . . . . . . . . . . . . . . . 1788.4 Mec anica Hamiltoniana . . . . . . . . . . . . . . . . . . . 183Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 189steuer2008/3/11pageiiiiiiiiCONTEUDO9 CalculoVariacionaleControleOtimo 1929.1 O que e ControleOtimo . . . . . . . . . . . . . . . . . . . 1929.2 Problemas Variacionais com Restri c ao . . . . . . . . . . . 1949.3 Extremais Singulares e TrajetoriasOtimas . . . . . . . . . 2029.4 ControleOtimo e Convexidade: condi c oes sucientes . . . 2079.5 ControleOtimo e Convexidade: condi c oes necessarias . . 211Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 21310 PrincpiodoMaximo 21610.1Problemas com Horizonte Finito . . . . . . . . . . . . . . 21710.2Problemas com Horizonte Innito . . . . . . . . . . . . . . 22210.3Aplica c oes do Princpio do Maximo . . . . . . . . . . . . . 226Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 24211 Programa caoDinamicaDiscreta 24411.1Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . 24411.2Problema do Caminho Simples . . . . . . . . . . . . . . . 24611.3Problema da Substitui c ao de Equipamento . . . . . . . . 25111.4Problema do Caixeiro Viajante . . . . . . . . . . . . . . . 25311.5Problema Linear-Quadratico Discreto . . . . . . . . . . . 25611.6Problema de Decis oes Consecutivas. . . . . . . . . . . . . 260Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 26512 Programa caoDinamicaContnua 26812.1Fun c ao ValorOtimo . . . . . . . . . . . . . . . . . . . . . 26812.2Princpio de Bellman. . . . . . . . . . . . . . . . . . . . . 27412.3Equa c ao de HamiltonJakobiBellman. . . . . . . . . . . 27612.4Problema de Controle Linear-Quadratico . . . . . . . . . . 285Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 29413 Solu c oesViscosaseFun caoValor 29913.1Solu c oes Viscosas de EDPs . . . . . . . . . . . . . . . . . 29913.2Formula de HopfLax . . . . . . . . . . . . . . . . . . . . 30713.3Fun c ao Valor como Solu c ao Viscosa de HJB. . . . . . . . 31213.4Princpio do Maximo. . . . . . . . . . . . . . . . . . . . . 31713.5Unicidade de Solu c oes Viscosas . . . . . . . . . . . . . . . 323Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 328steuer2008/3/11pageiiiiiiiiCONTEUDOApendiceA:Equa c oesDiferenciaisOrdinarias 329A.1 Exponencial de uma Matriz . . . . . . . . . . . . . . . . . 329A.2 Sistemas Lineares Aut onomos . . . . . . . . . . . . . . . . 331A.3 Sistemas Lineares n ao Aut onomos . . . . . . . . . . . . . 336A.4 Sistemas n ao Lineares: existencia e unicidade . . . . . . . 342A.5 Sistemas n ao Lineares: dependencia contnua . . . . . . . 347A.6 Metodo de Shooting . . . . . . . . . . . . . . . . . . . . . 350Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . 353ApendiceB:Demonstra caodoPrincpiodoMaximo 356B.1 Otimiza c ao Innita. . . . . . . . . . . . . . . . . . . . . . 356B.1.1 Um Problema Abstrato de Otimiza c ao. . . . . . . 357B.1.2 Lineariza c ao do Problema de Otimiza c ao . . . . . 359B.1.3 Condi c oes Necessarias para o Problema Abstrato. 367B.2 Um Problema Auxiliar. . . . . . . . . . . . . . . . . . . . 370B.3 Condi c oes Necessarias para Otimalidade . . . . . . . . . . 379ListadeSmbolos 383Bibliograa 385IndiceRemissivo 393steuer2008/3/11pageiiiiiiiiListadeFiguras1.1 Estrategia de controle de malha aberta . . . . . . . . . . . 31.2 Estrategia de controle de malha fechada . . . . . . . . . . 31.3 Equilbrio de um bast ao . . . . . . . . . . . . . . . . . . . 141.4 Cicloide: solu c ao do problema da Braquistocrona . . . . 203.1 Piloto automatico para controle de altitude . . . . . . . . 704.1 Campo vetorial com pontos de equilbrio de diferente na-tureza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 744.2 Campovetorial compontodeequilbrioatrativoporemn ao estavel . . . . . . . . . . . . . . . . . . . . . . . . . . 764.3 Pontodeequilbrioassintoticamenteestavel(xtt + 2xt +sin x = 0) . . . . . . . . . . . . . . . . . . . . . . . . . . . 844.4 Ponto de equilbrio n ao estavel (xtt + 2xt + sin x = 0). . . 854.5Orbita do atrator de Lorenz. . . . . . . . . . . . . . . . . 877.1 Curva admissvel unindo os pontosPeQ. . . . . . . . . . 1537.2 Constru c ao da fun c aog no Teorema 144 . . . . . . . . . 1598.1 A corda sob tens ao. . . . . . . . . . . . . . . . . . . . . . 1818.2 Um perl de potencial . . . . . . . . . . . . . . . . . . . . 1919.1 Condi c ao de transversalidade e fun c oes admissveis . . . . 1959.2 Trajetoria admissvel que intercepta o extremal singular . 2059.3 Trajetoria admissvelque n ao intercepta o extremal sin-gular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2069.4 Condi c ao de transversalidade para a Braquistocrona . . . 21310.1Algoritmodometododeshootingparasistemahamilto-niano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221steuer2008/3/11pageiiiiiiiiLISTADEFIGURAS10.2Tempomnimo: trajetoriascorrespondentesacontrolesextremos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23010.3Tempomnimo: trajetoriascorrespondentesacontrolesconstantes. . . . . . . . . . . . . . . . . . . . . . . . . . . 23010.4Tempo mnimo: uma trajetoria otima generica . . . . . . 23110.5Alunissagem: condi c oesiniciaisparaumcontroleotimoespecial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23310.6Alunissagem: trajetorias otimas . . . . . . . . . . . . . . . 23411.1Mapa da cidade com ruas de m ao unica. . . . . . . . . . 24611.2Cidade projetada sobre sistema de coordenadas. . . . . . 24911.3Grafo para o problema do caminho mais curto. . . . . . . 267B.1 Cones tangenciaisC(x) eT(C, x). . . . . . . . . . . . . . 359steuer2008/3/11pageiiiiiiiiPrefacioAinten c aodopresentemanuscritoeapresentar, deformaintro-dutoria, diversosaspectosrelacionados`ateoriadecontrole. Agamadeaplica c oesdestateoriaebastanteampla, permitindoaabordagemdeproblemasatuais(veja,e.g.,[KIF],[SHB],[SFG])oriundosdedife-rentes areas do conhecimento,tais como matematica,fsica,economia,engenhariaedemaiscienciasaplicadas. Otextopossui comoumadesuasprincipaiscaractersticasotratamentoformal, dopontodevistamatematico, dosresultadosapresentados. Paralelamente`aintrodu c aode conceitos e discuss ao de resultados teoricos, e dada enfase `a analise deexemplos correspondentes, motivados por problemas praticos. A op c aopor esse tipo de abordagem visa n ao somente permitir uma melhor com-preens ao dos resultados teoricos, como tambem ilustrar de forma deta-lhada o vasto espectro de aplica c oes da teoria tratada neste manuscrito.Otexto e, emsuaquasetotalidade, autocontido. Oleitorfamilia-rizadocomconceitosde algebralinearean alisereal n aodeveterdi-culdades em acompanhar o manuscrito. Um pre-requisito essencial paraacompreens aodoconte udoediscutidonoprimeiroapendice. Trata-sedateoriadeequa c oesdiferenciaisordin arias(ouEDOs). Umavezquetaisresultadoss aoutilizadosaolongodetodootexto, oobjetivoprincipal deste apendice e familiarizar o leitor com a nota c ao utilizada.Tendo em vista os pre-requisitos acima descritos, sugere-se a utiliza c aodomanuscritopor alunos de ultimoanodegradua c aoemcursos deciencias exatas.Emalgumas poucas sec c oes, s aoutilizados duranteodesenvolvi-mento conceitos matematicos menos elementares, a saber: fundamentosdeteoriadamedidaedean alisefuncional (especialmenteespa cosdefun c oes e topologias correspondentes). Nestes casos os conceitos ou re-sultadosutilizadoss aosemprediscutidosemnotasderodapee, alemsteuer2008/3/11pageiiiiiiiiPREFACIOdisso, s ao fornecidas referencias bibliogracas correspondentes. O leitordevecaratentoparticularmenteaosseguintestrechosdomanuscrito:nos captulos sobre controlabilidade e sobre controle otimo s ao utiliza-dosalgunsconceitoselementaresdeteoriademedidaeintegra c aodeLebesgue; nas sec c oes sobrecontroles restritos esobreatingibilidadeno captulo de controlabilidade s ao utilizados resultados e deni c oes es-peccos de analise funcional.A op c ao pela utiliza c ao de tais ferramentas matem aticas se justicapelaimport ancia, dentrodateoriadecontrole, dosresultadosquepo-dem ser demonstrados como decorrencia de sua aplica c ao (e.g., princpiodoBangBang; convexidade e compacidade de conjuntos de estadosatingveiscomcontrolesrestritos; princpiodomaximoparacontrolesLebesgue integraveis).Naescolhados temas abordados, buscamos oequilbrioentre osmeios(argumentosmatematicos, eventualmenten aoelementares)eosns(resultadosdateoriadecontrole). Tal tarefasemostroun aotri-vial, diante do fato de tratar-se de um texto introdutorio e da teoria emquest aopossuirdiversasvertentes. Aabordagemdeoutrosresultadosrelevantes (e.g., problemasH; controles impulsivos) foi sacricada emprol deste compromisso entre meios e ns. Os autores creem que o mate-rial abordado no manuscrito coloca o leitor a par do desenvolvimento dateoria de controle, alem de fornecer diversas informa c oes sobre o estadoda arte dos atuais temas de pesquisa.VisaogeraldomanuscritoO manuscrito se divide em tres partes, cada uma das quais trata se-paradamente de um aspecto relevante da teoria de controle. Na primeiraparte s ao discutidos resultados que permitem a analise da maioria dosproblemas tecnologicos oriundos da engenharia (regulagem, estabiliza- c ao, . . . ). As duas ultimas partes do manuscrito tem ambas como obje-tivo,analisarproblemasdecontroleotimo. Entretanto,asabordagensdiscutidas nestas partes seguem caminhos bastante distintos. A Parte IIse destina a analisar problemas de otimiza c ao de desempenho (contro-leotimo)esuacorrela c aocomoclassicoc alculovariacional ecomamec anica Hamiltoniana. Na Parte III e discutida a rela c ao existente en-tresolu c oesdedistintosproblemaspertencentesaumamesmafamliade problemas de controle otimo (programa c ao din amica).steuer2008/3/11pageiiiiiiiiPREFACIOA primeira parte do texto e iniciada com a apresenta c ao, na formade exemplos, de diferentes aspectos da teoria de controle. Na seq uencias ao abordados os conceitos de controlabilidade,observabilidade e esta-bilidade, assim como suas inter-rela c oes. Esta parte e concluida com adiscuss aodedoisproblemascruciaisemaplica c oestecnologicas(veja,e.g., [An]), asaber: aestabiliza c aodesistemaseareconstru c ao(ouidentica c ao) de par ametros.Emsuasegundaparte, omanuscritotratadosproblemasdecon-trole otimo. A abordagem e conduzida atraves de uma incurs ao inicialpelo c alculodevaria c oes. No que diz respeito `as condi c oes necessariaspara otimalidade,a extens ao `a teoria de controle otimo dos resultadosclassicos do calculo variacional e, no ponto de vista dos autores, o modomaisnatural parasecompreenderomecanismodefuncionamentodetais condi c oes. Naseq uencia, discutimos comocondi c oes necessariasparaotimalidades aoformuladasnocontextodamec anicaHamiltoni-ana (equa c ao de HamiltonJacobi). O objetivo principal desta parte domanuscrito e colocar em evidencia a rela c ao entre a equa c ao de EulerLagrangeeoprincpiodom aximo. Porserextremamentetecnica, ademonstra c ao do princpio do maximo e apresentada no Apendice B.A terceira parte do texto trata da metodologia denominada de pro-grama c ao din amica, que objetiva encontrar solu c oes para problemas decontrole otimo atraves da resolu c ao de uma equa c ao diferencial parcial,asaber: aequa c aodeHamiltonJacobiBellman(ouHJB).Asolu c aodestaequa c ao edenominadafun c aovaloreestaintrinsecamenterela-cionadacomoproblemaoriginal de controle otimo. Recentemente,muito tem sido feito pelo lado analtico da caracteriza c ao das solu c oes daequa c ao HJB. Este e um topico bastante atual de pesquisa, tendo ren-didoaumdeseusfundadores(P.L.Lions)amedalhaFieldsem1996.Nestesentidoo ultimocaptulodestaparte edestinadoaoestudodassolu c oes de viscosidade de equa c oes diferenciais parciais e da caracteri-za c ao da fun c ao valor como solu c ao viscosa da equa c ao HJB.Descri caodetalhadadoconte udoNo Captulo 1 e apresentada, atraves da analise de exemplos, uma in-trodu c ao `a teoria. Em cada exemplo s ao discutidos e ilustrados conceitosbasicos, ao mesmo tempo que e apresentada uma diferente aplica c ao dateoriadecontrole. Amaiorpartedestasaplica c oesediscutidanova-steuer2008/3/11pageiiiiiiiiPREFACIOmenteemdetalhesaolongodotexto. Dentreosexemplosabordadosdestacamos: aquecimentodeumquarto(equa c aodeEulerLagrangeecalculovariacional); problemadecontrolediscreto(multiplicadoresde Lagrange); problema de tempo mnimo (solu c oes tipo BangBang);equilbriodeumbast ao(estabiliza c aodesistemas); concentra c aodechumbonocorpo(reconstru c aodepar ametros); problemadecontroleotimo (princpio do maximo de Pontryagin).No Captulo 2 discutimos o conceito de observabilidade de sistemaslineares de controle.E feita a distin c ao entre os estados observaveis, n aoobservaveis e detectaveis. Na ultima sec c ao e apresentada uma tecnicade reconstru c ao de estados a partir de observa c oes.OCaptulo3sedestinaainvestigaroconceitodecontrolabilidadedesistemas. Sistemaslineareseaut onomoss aoanalisadosseparada-mente. Discutimosarela c aoentreacontrolabilidadedeumsistemalinear e a observabilidade do seu sistema adjunto. Apresentamos aindao teorema de Kalman (forma normal) para sistemas lineares aut onomos.Analisamos propriedades topologicas de conjuntos de estados atingveis,quando o problema de controle e considerado com controladores restri-tos. O princpio do BangBang e sua rela c ao com os problemas de tempomnimo s ao tambem investigados. A ultima sec c ao trata do controle desistemas discretos.No Captulo 4 e discutida a estabilidade de sistemas din amicos. In-troduzimosoconceitodepontosdeequilbrioestaveiseapresentamoscriterios de estabilidade para sistemas lineares. Criterios algebricos paraestabilidade(comoocriteriodeHurwitz)s aotratadosemumasec c aoa parte. S ao analisados ainda sistemas obtidos por perturba c oes de sis-temas lineares estaveis. S ao discutidos o criterio de estabilidade de Lya-punoveaequa c aomatricial deLyapunov, umacondi c aonecessariaesuciente para determina c ao de estabilidade. Na ultima sec c ao e abor-dado o criterio de Lyapunov para sistemas discretos.No Captulo 5 e analisada uma aplica c ao classica da teoria de con-trole, a saber: a estabiliza c ao de sistemas.E feito uso da teoria desen-volvida nos captulos anteriores a m de tratar este que e, sem sombra ded uvida, um dos problemas mais importantes relacionado com aplica c oes`aengenharia. Abordamosaestabiliza c aoporrealimenta c aodeestado(state feedback) para sistemas lineares assim como uma quest ao quanti-tativa relacionada a estabiliza c ao por realimenta c ao de estado.E ana-lisado ainda o engenhoso metodo proposto por Luenberger (observadorsteuer2008/3/11pageiiiiiiiiPREFACIOdin amico), que permite simultaneamente a reconstru c ao de estados e es-tabiliza c ao do sistema. Consideramos tambem o problema de estabilizarsistemas utilizando realimenta c ao de sada (output feedback). Na ultimasec c ao s ao tratados sistemas com pontos de opera c ao desconhecidos.No Captulo 6 tratamos uma segunda aplica c ao relevante da teoriadecontrole, adenominadaidentica c aodepar ametros. Estudamosoproblemadedeterminarpar ametrosdesconhecidosdeumsistemadecontrole, apartirdecertaquantidadedeexperimentos, nosquaiss aoconhecidosaentrada(input) easada(output) dosistema. Inicial-mente s ao formalizadas deni c oes relevantes. Na seq uencia s ao discuti-dos metodos iterativos de identica c ao.Ocaptulo7introduzocalculovariacional classico. Naprimeirasec c aos aoobtidas, sobhipotesesadicionaisdeconvexidade, condi c oesnecessarias e sucientes para otimalidade de um extremal. Na seq uencias aoapresentadosolemadeduBoisReymond, odesenvolvimentodaequa c ao de EulerLagrange e a obten c ao de diferentes tipos de condi c oesnaturaisdecontorno. S aoconsideradosaindaproblemasvariacionaisqueadmitemsolu c oesdiferenciaveisporpartesededuzidascondi c oesnecessarias para otimalidade (equa c ao de EulerLagrange e condi c ao deWeierstrassErdmann). Na ultimasec c ao,osresultadosanterioress aoestendidos a problemas vetoriais.NoCaptulo8discutimosaabordagemvariacionalparaproblemasdamec anica. Naseq uenciaapresentamososformalismosrelacionadosas mec anicas Newtoniana, LagrangeanaeHamiltoniana. Oobjetivoprincipal docaptuloeaobten c aodeumainterpreta c aofsicaparaaequa c ao de HamiltonJacobi.No Captulo 9 e apresentada uma analogia entre os problemasvariacionais e os problemas de controle otimo. Inicialmente s ao tratadosproblemas variacionais sujeitos a restri c oes transversais, lagrangeanas eisoperimetricas, e obtidas as correspondentes condi c oes necessarias paraotimalidade. Aanalogiacomosproblemasdecontroleefeitaatravesde exemplos. Na seq uencia consideramos problemas variacionais que ad-mitem a existencia de extremais singulares. Neste caso osproblemas de controle correspondentes possuem solu c ao do tipo BangSingularBang. Analisamos aindacondi c oes sucientes paraotimali-dade de estrategias de controle, sob hipoteses adicionais de convexidadeda hamiltoniana. Ainda utilizando hipoteses de convexidade, e demons-trada na ultima sec c ao uma vers ao simplicada do princpio do maximo.steuer2008/3/11pageiiiiiiiiPREFACIONoCaptulo10e formuladooprincpiodomaximode Pontrya-gin. Trata-se de um conjunto de condi c oes necessarias para otimalidadedeproblemasdecontroleque, emsuanatureza, muitoseassemelha`aequa c ao de EulerLagrange. Uma demonstra c ao do princpio do maximoe apresentada no apendice B. Nas tres primeiras sec c oes analisamos vari-antes do princpio do maximo para problemas com horizonte nito, comhorizonte innito e para problemas impulsivos. Na ultima sec c ao s ao re-solvidos varios problemas atraves da utiliza c ao do princpio do maximo.NoCaptulo11apresentamososconceitosbasicosdaprograma c aodin amica para problemas discretos (tempo discreto). Atraves da analisede diversos exemplos, s ao introduzidas a fun c ao valor, a equa c ao de oti-malidade e as condi c oes de contorno correspondentes. Entre os exemplosmaisimportantesest aoocaixeiroviajante; din amicalinearcomcustoquadratico; decis oes consecutivas.NoCaptulo12apresentamos aformacontnua daprograma c aodin amica.Enfase e dada `a obten c ao da equa c ao da equa c ao de EulerLagrange, ao princpio de otimalidade de Bellman e a teoremas sobre aregularidade da fun c ao valor.NoCaptulo13eintroduzidooconceitodesolu c oesviscosasparaequa c aoHJB. AformuladeHopfLax eobtidaapartirdaanalisedeuma famlia particular de problemas de controle otimo.E vericado ofatodafun c aovalorserumasolu c aoviscosadaequa c aoHJBe, sobcondi c oes especiais, provamos um resultado de unicidade.Sugest oesparaUtilizacaodomanuscritoO manuscrito, na forma em que se apresenta, pode ser coberto inte-gralmente em dois cursos de um semestre (carga horaria de quatro horaspor semana).E ainda possvel preparar, com base no manuscrito, dife-rentes cursos de um semestre (novamente de quatro horas por semana),com os seguintes enfoques:i) Partes I, II e Apendices: curso de teoria de controle.ii) Partes II, III e Apendice B: curso de controle otimo e programa c aodin amica.iii) Captulos1a5, 7, 9, 10, 12: vers aoreduzidadocursodedoissemestres; ademonstra c aonoApendiceBpodeserapresentadapelos alunos na forma de seminarios.steuer2008/3/11pageiiiiiiiiPREFACIOSobreaconfeccaodomanuscritoO projeto de elabora c ao do presente manuscrito iniciou-se com a con-fec c ao das notas para o minicurso T opicos em teoria de controle, apresen-tado durante o XXII CNMAC (Santos, 1999) por A. Leit ao. Posterior-mente, essas notas foram acrescidas das notas de aula dos cursos Teoriade controle A e B (ministrados pelo mesmo autor em 1998 na UFSC). Alinha mestra destes cursos foi por sua vez fortemente inuenciada pelasdisciplinasSteuerungstheorieeVariationsrechnung, ministradasporJ.Baumeister na Goethe Universitat em 1995 e 1996 respectivamente. Acomposi c ao das diferentes notas de aula de ambos os autores deu orgemao presente material.On umerodeproblemas eaplica c oes quepodemser tratados nocontexto da teoria de controle vem crescendo de forma consideravel nas ultimas decadas, o que pode ser comprovado pelo n umero cada vez maiordegruposdepesquisaeperiodicosespecializadosnestaarea. Talfatopodeserinterpretadocomoumreexodasnecessidadesdasociedademoderna, quecadavezmaispriorizaaexecu c aodetarefasdeformaprecisa e eciente. Inserida neste contexto esta a proposta do presentemanuscrito, que pretende servir como orienta c ao inicial a todos os quedesejem ingressar nesta interessante e promissora area.Johann Baumeister Frankfurt am MainAntonio Leit ao Florianopolissteuer2008/3/11pageiiiiiiiisteuer2008/3/11page 1iiiiiiiiCaptulo1IntroducaoO objetivo deste captulo e apresentar ao leitor a teoria de controleatraves da analise de algumas de suas aplica c oes mais relevantes. Comeste intuito s ao introduzidos na Sec c ao 1.1 alguns conceitos elementares,essenciais para a formula c ao dos problemas de controle. Na Sec c ao 1.2s aoabordadosdiferentesproblemasnocontextodateoriadecontrole,fornecendoassimumaideiadaversatilidadedaaplica c aodestateoria.Osexemplosmaisrelevantesapresentadosnestasec c aos aoposterior-mente abordados ao longo do texto.1.1 ApresentacaodosSistemasdeControleConsidereafamliadeproblemasemqueumdeterminadon umerode variaveis que dependem do tempox1(t), . . . , xn(t) tem sua evolu c aodescrita por uma equa c ao da forma(1.1) x =F(t, x),onde F: RRnRne uma fun c ao conhecida que descreve a din amicadaevolu c aoex(t)=(x1(t), . . . , xn(t)) Rneovetordevari aveisdeestado, cujascomponentess aoasquantidadesquedesejamosacompa-nhar. Tais variaveis representam, no instante de tempot, as condi c oesnasquaisseencontraoprocessoqueestasendomodelado. Aseguir eapresentado um exemplo ilustrativo.steuer2008/3/11page 2iiiiiiii2 [CAP.1: INTRODUCAOExemplo1(Deslocamentodeumcorpo). Para representar o co-nhecido problema de deslocamento da cinematica utilizamos o seguintemodelo:t : tempo;m : massa do corpo;x(t) : velocidade no tempot; x(t) : acelera c ao no tempot;T(t) : for ca exercida sobre o corpo no tempot.Observe que a lei de Newton nos fornece a equa c ao x(t) =1mT(t),que e uma caso particular da equa c ao (1.1) 2Se consideramos a possibilidade de exercer inuencia sobre oladodireitodosistema(1.1)atravesdaescolhadospar ametroslivresu1(t), . . . , um(t), a equa c ao (1.1) toma a forma(1.2) x =F(t, x, u),ondeu(t)=(u1(t), . . . , um(t)) Rmechamadovetordevari aveisdecontrole ou ainda entrada do sistema.Umimportantecasoparticular corresponde`asitua c aoemqueadin amica do sistema (1.2) e linear tanto na variavel de estadox quantona variavel de controleu. Temos assim os sistemas de controle lineares(1.3) x =A(t) x+B(t) u(t),ondeA(t) Rn,neB(t) Rn,m, para todot. Muitas vezes considera-seque a evolu c ao do sistema (1.2) pode ser acompanhada somente atravesde um vetory(t) = (y1(t), . . . ,yp(t)) Rp, que depende da variavel deestadox e e denominado sada do sistema. Se a fun c ao que descreve adependencia dey em rela c ao ax e linear emx, temos(1.4) y(t) =C(t) x(t),ondeC(t) Rp,n, para todot. O caso particularC(t) Icorresponde`a situa c ao em que e possvel conhecer a variavel de estadox em todosos instantes de tempo.Observe que, ao escolher estrategias de controle diferentes, estamosalterandoadin amicadosistemade formatambemdiferenciada. Aprincpio, e possvel distinguir entre dois tipos de escolha para estrategiade controle:steuer2008/3/11page 3iiiiiiii[SEC.1.1: APRESENTACAODOSSISTEMASDECONTROLE 3Bt ( ) x As x s Bs u s ds + ( ) ( ) + ( ) ( )00t u t ( )x t ( )Ct ( )y t ( )Figura 1.1: Estrategia de controle de malha aberta para sistemas linearesUma estrategiau e escolhida apriori e levada a cabo sem consi-derar a sada do sistema. Em outras palavras, a sada do sisteman aoinui naescolhadaentradadomesmo. Esteeochamadocontrole de malha aberta (open-loop control), que e esquematizadona Figura 1.1;A escolha da estrategia de controle e feita de acordo com a sada(ouestado)dosistema. Nessecasotemosumcontroledemalhafechada (closed-loop control) ou controle de realimenta c ao de sada(ou estado); veja Figura 1.2.Observa cao2. Alguns autores denominamoprimeiroproblemadecontrole, eosegundoderegulagem. Aregulagem emaiscomplexadeser implementada, uma vez que s ao necessarios: i) Coletar informa c oesa respeito da sada (ou do estado) do sistema; ii) Escolher, a partir dasada, uma entradau do sistema. 2Nos dois exemplos a seguir apresentamos situa c oes espec cas, nasquais as diferentes estrategias de controle podem ser aplicadas.Bt ( ) x As x s Bs u s ds + ( ) ( ) + ( ) ( )00t u t ( )x t ( )Ct ( )y t ( )Kt ( )Figura 1.2: Estrategia de controle de malha fechada para sistemas lineares. Aa c ao de realimenta c ao e descrita aqui poru(t) = K(t)y(t), comK(t) Rm,pExemplo3(Aquecimentodeumquarto). Considereoproblemade aquecer um quarto, casa, etc. . . podemos identicar os dois tipos deestrategia: No problema de controle, a estrategia de aquecimento e escolhidadependendo da hora do dia e epoca do ano. A estrategia e periodica. Na regulagem, a estrategia de aquecimento e escolhida de acordocom a temperatura do quarto,com a temperatura exterior e com umatemperatura de referencia.steuer2008/3/11page 4iiiiiiii4 [CAP.1: INTRODUCAOA regulagem pode compensar interferencias (janela aberta, atraso namudan ca das esta c oes, . . . ), enquanto que o controle n ao. 2Exemplo 4 (Enchimento de um reservat orio dagua).Censidere oseguinte modelo para representar a varia c ao do nvel de um reservatoriodaguat : tempo;I(t) : uxo de agua que entra no reservatorio no tempot;x(t) : quantidade de agua no reservatotio no tempot;y(t) : altura do nvel da agua no tempot;u(t) : abertura da torneira para entrada de agua no tempot.Supondo queI(t) = c1u(t) ey(t) = c2x(t) temos: x =I(t) =c1u(t) ou x(t) =x(0) +_t0c1u(s) ds.Note que o reservatorio estara cheio quando x(t) = xmax ou y(t) = ymax.Denimos, usando apenas a eurstica, a seguinte estrategia:1) Medir no tempot a saday(t);2) Testar sey(t) = ymax;3) Abrir ou fechar a torneira;4) Voltar ao item 1);Note que usamos apenas dois valores extremos do controlador, que cor-respondem`atorneiratotalmenteabertaoutotalmentefechada. Taiscontroles pertencem a uma famlia especial (controles de BangBang) es ao analizados mais detalhadamente no Captulo 3. 2Observa cao5. Afun c aoquepermitecalcularasadayapartirdaentrada u e denominada fun c ao de transferencia. A seguir, relacionamosalgumas formas especiais desta fun c ao para sistemas com entrada e sadaescalar, i.e. y(t), u(t) R, para todot.Transferencia proporcional: y(t) = ku(t);Transferencia integral: y(t) = y0 +k_t0 u(s)ds;1Transferencia diferencial: y(t) = kut(t);Transferencia de tempo morto: y(t) = ku(t );1NoExemplo1temosy(t) = x(t) = x0 + 1/m_t0F(s)ds.steuer2008/3/11page 5iiiiiiii[SEC.1.2: EXEMPLOS 5Sistemas de controle com entrada e sada escalar s ao tambem conhecidospela abrevia c ao SISO (single-input single-output). Note que a estrategiade realimenta c ao ilustrada na Figura 1.2 e a generaliza c ao para o casovetorial da transferencia proporcional. 2Paraterminaressadiscuss aoinicial eimportantechamaraten c aopara dois conceitos extremamente importantes na teoria de controle ques aoosdecontrolabilidadeeobservabilidadedeumsistema. Informal-mentedizemos queumsistemadecontroleecontrol avel quandoforpossvel encontrar uma estrategia de controle u que leve o estado iniciala um estado nal desejado. Por outro lado, dizemos que um sistema decontrole e observ avel quando for possvel reconstruir o estado inicialx0apartirdasadaydosistema. Osconceitosacimas aoabordadosemdetalhes nos Captulos 2 e 3 respectivamente.1.2 ExemplosOsexemplosaseguirtemoobjetivodeilustrarosdiferentestiposdeaplica c oesquepodemsertratadasatravesdateoriadecontroleeao mesmo tempo de apresentar as ferramentas matematicas necessariaspara investiga c ao dos problemas.1.2.1 AquecimentodeumQuartoTratamosdoproblemademanterumquartoaquecidoduranteumdeterminadotempo, deformaqueaenergiagastanoprocessosejaamenor possvel. Para este m denominamost : tempo pertencente ao intervalo [0, T] comT> 0;w(t) : temperatura do quarto;w0: temperatura do quarto no tempot = 0 ;c : temperatura constante fora do quarto;z(t) : diferen ca de temperatura entre o quarto e o exte-rior;z0 := w0 c : diferen ca de temperatura no tempot = 0;u(t) : taxa de varia c ao do calor inserido.Naformula c aodomodelo, supomos avaria c aode temperaturapro-porcional tanto`atemperaturaexterior, quantoaenergiautilizadanomecanismo de controle. Temos assim:(1.5) zt=a z +b u(t),steuer2008/3/11page 6iiiiiiii6 [CAP.1: INTRODUCAOondea, bs aoconstantespositivasquedescrevemafsicadoproblema(isolamento do quarto, . . . ).Como objetivo denimos que a temperatura inicial z0deve evoluir ateatemperaturaz(T)=zTnonal dotempoT. Nesseprocessodeveser gasto o mnimo de energia possvel, sendo que o gasto de energia edescrito pela fun c ao objetivo(1.6) J(u) :=12_T0u2(t) dt.Podemos ent aoformular oproblemadeencontrar umaestrategiadecontrole da seguinte forma:___Minimizar J(u)sujeito `azt = az +bu; z(0) = 0, z(T) = zT.Na formula c ao acima,deixamos em aberto que tipo de controle e con-sideradoadmissvel (u C0([0, T]), L2([0, T]), L([0, T]), . . . )econ-seq uentemente que tipo de solu c ao admitimos para a equa c ao diferencial(1.5).Esseproblema eparticularmenteinteressante, poissedeixainserirno contexto do c alculo das varia c oes. Observe que resolvendo (1.5) parau e substituindo na fun c ao objetivo em (1.6) obtemos___Minimizar I(z) := _T0L(t, z(t), zt(t)) dtsujeito `az(0) = 0, z(T) = zTondeL(t, z(t), zt(t))=b2(zt(t) + az(t)). Porsimplicidade, tomamosz0=0. Dateoriadocalculodasvaria c oes, sabemosqueumasolu c aodoproblemavariacional acimaprecisasatisfazeraequa c aodeEulerLagrange(1.7)Lz ddtLzt=0.Em nosso problema particular, a Equa c ao diferencial de Euler se escreve(1.8) ztta2z =0,steuer2008/3/11page 7iiiiiiii[SEC.1.2: EXEMPLOS 7para a qual conhecemos as solu c oes linearmente independentessinh(at), cosh(at).Dacondi c aodecontornoz(0)=0, exclumosasolu c aocosh(at). Daoutra condi c ao de contornoz(T) = zT, obtemos a solu c ao(1.9) z(t) =zTsinh(aT)1sinh(at), t [0, T],que n ao depende do par ametro b. Obtemos ent ao a estrategia de controleotimo(1.10) u(t) =zTa b1sinh(aT)1eat, t [0, T].Note que sofoi possvel encontrar ocontrole otimoutilizandoaequa c ao de EulerLagrange. Veremos no exemplo a seguir outro metodode analisar este mesmo problema.1.2.2 UmProblemadeControleDiscretoAnalisamos um modelo discreto (tempo discreto) para o qual e poss-vel determinarcondi c oesnecessariasparasolu c aodoproblema. Paratanto, utilizamos um resultado sobre condi c oes necessarias para um ex-tremal no contexto de espa cos de dimens ao nita. Considere a equa c aode diferen cas escalar:(1.11) yk+1=fk(yk, uk), k = 0, . . . , N 1e as condi c oes de contorno(1.12) y0=y0, yN= yN.A fun c ao objetivo e dada por(1.13) J(y, u) :=N1

k=0lk(yk, uk),onde as fun c oeslk, k = 0, . . . , N 1 s ao dadas. Consideramos ent ao oproblema de otimiza c ao_Minimizar J(y, u)sujeito `a (1.11), (1.12).steuer2008/3/11page 8iiiiiiii8 [CAP.1: INTRODUCAOAs variaveis do problema de minimiza c ao s ao os vetores:u =(u0, . . . , uN1) RN, y =(y1, . . . , yN1) RN1.Supondo agora que as fun c oes fk, lk envolvidas no problema s ao sucien-temente diferenciaveis,podemos utilizar o teorema dos MultiplicadoresdeLagrangeparadeduzircondi c oesnecessariasparadetermina c aodeum extremal. Tal lema e apresentado a seguir:Lema: (Multiplicadores deLagrange)SejaURnabertoeasfun c oesF: U R eG : U Rmcontinuamente diferenci aveis emU,ondem 0 o carro deve estar parado em frente a uma paredeque dista uma unidade da orgem.x(T) =1, x(T) =0.Supomos ainda que as a c oes de controle s ao limitadas por(1.28) [u(t)[ 1, t [0, T].O objetivo a ser atingido e:Encontrar um controle u, que desloque o carro conforme des-crito acima no menor tempoTpossvel.A solu c ao e:T =2, u(t) =_+1 , 0 t < 11 , 1 t 2Observe que a trajetoria x obtida a partir de u satisfaz as condi c oesde contorno do problema. Mais tarde provaremos que u eTs ao de fatootimos. OsmultiplicadoresdeLagrangeutilizadosnoExemplo1.2.2n ao s ao aplicaveis aqui (caso discretizassemos o sistema), pois o temponal n aoexadoapriori. Aestrategia useenquadranoschamadoscontroladoresBangBang, ondeocontroleassumesomenteosvaloresextremos permitidos.Caso a restri c ao (1.28) n ao seja fornecida, o problema n ao mais pos-sui solu c ao. Basta observar queTn = 2/n eun(t) :=_+n2, 0 t < 1/nn2, 1/n t 1/ns aoestrategiasadmissveiselimnTn=0. Portanto, n aoexisteumaestrategia otima.4Adependenciaemrela c aoaotempotdavari avel deestadon aoerepresentadanaequa c aodiferencial.steuer2008/3/11page 12iiiiiiii12 [CAP.1: INTRODUCAO1.2.4 LancamentodeumFogueteConsidere o seguinte problema:Um foguete deve ser lan cado do solo na vertical e deve, a par-tir de uma estrategia de consumo de combustvel, alcan car amaior altitude possvel.Para estudar este problema tomamos:t : tempo;m(t) : massa do foguete;v(t) : velocidade do foguete;I(t) : impulso do foguete.Fazemos agora a seguinte hipotese fsica:(1.29)Taxa de varia c ao do impulso = Soma das for cas agindo sobre o corpo.A partir da lei fsica P= mv, temos no intervalo innitesimal de tempo[t, t + t]:Massa Velocidade Impulsot m v mvt + t m+ m v + v (m+ m)(v + v)Supondoquecombustveldemassa m(poism< 0) e,depoisdequeimado, expelidocomvelocidadev0, temosqueoimpulsototal notempot + t e dado pormv +v0 m+mv.Portanto, a varia c ao do impulso no intervalo innitesimal [t, t + t] elimt0mv+v0m+mvt=m v+v0 m.Da hipotese em (1.29) conclumos ent ao(1.30) m v +v0 m=mG(h)D(v, h),ondem, v, h : massa, velocidade e altura do foguete respectivamente;G(h) : for ca da gravidade;D(v, h) : resistencia do ar.steuer2008/3/11page 13iiiiiiii[SEC.1.2: EXEMPLOS 13SupondoagoraqueG(h) =c1h2, D(v, h) =c2v2ehequepodemoscontrolar o empuxou := v0 m, obtemos o seguinte sistema:h = v (1.31) m = v10u(t) (1.32) v = m1[u(t) D(v, h)] G(h) (1.33)Supomos ainda que o empuxo e limitado, ou seja(1.34) 0u(t) umax.Note que o tempo nal Tn ao e fornecido e que as condi c oes de contornos ao:(1.35) h(0) =0, v(0) =0, m(0) =m0, m(T) =mT,onde mTe a massa do foguete sem combustvel e m0 a massa do fogueteabastecido. O problema de encontrar a trajetotia otima pode ent ao serescrito como:___Maximizar h(t)sujeito `a(1.31), (1.32), (1.33), (1.34), (1.35)Fazendo hipoteses adequadas sobre G e D, e possvel garantir a existen-cia de uma solu c ao da forma (BangSingularBang)u(t) :=___umax, t [0, t1] (0, umax) , t (t1, t2)0 , t [t2, T],ondet1, t2 dependem dem0,mT,D,G,umax.1.2.5 EquilbriodeumBastaoConsidere um bast ao sem massa, de comprimento unitario, que pos-sui em sua extremidade superior uma massa pontual m. A extremidadeinferior pode ser deslocada ao longo do eixox e a acelera c ao correspon-dente a este deslocamento corresponde ao controle. Sejam assim:steuer2008/3/11page 14iiiiiiii14 [CAP.1: INTRODUCAOEx

cmgE

FFigura 1.3: Equilbrio de um bast aot : tempot > 0;(t) : posi c ao da base do bast ao ;u(t) : acelera c ao (horizontal) da base do bast ao;(t) : angulo entre o bast ao e o eixo vertical;(x(t), y(t)) : coordenada do ponto de massam.Observe quea posi c ao derepouso = 0 n ao e estavel,nosentidoqueumdeslocamentoinnitesimaldopontodeequilbrioprovocaaquedadobast ao.5Nesteexemploestudamoscomoestabilizarosistemanaposi c ao de repouso usando uma estrategia de controle de realimenta c aodo tipou = G().Analisamos inicialmente o modelo. Sobre a massam agem a gravi-dade e uma for caF(na dire c ao do bast ao) provocada pelo movimentoda base do mesmo (veja Figura 1.3). Temos ent ao:Somatorio das for cas na dire c aox: F sin()Somatorio das for cas na dire c aoy: F cos() mgSupondoquetratamosapenasdeslocamentospequenosdaposi c aoderepouso = 0, fazemos as hipoteses simplicadoras:(1.36) sin() , cos() 1, y 1, y 0.Da lei de Newton sabemos quem y =F(t)mg, m x =F(t) (t),o que implica emF(t) = mg e m x = mg(t).Da geometria do problema e das hipoteses em (1.36) temos aindax(t) =(t) +(t).5Umaan aliserigorosasobreanaturezadospontosdeequilbriodeumsistemadin amicoeapresentadanoCaptulo4.steuer2008/3/11page 15iiiiiiii[SEC.1.2: EXEMPLOS 15Observando que(t) = u(t), obtemos dessa ultima equa c ao(1.37) =g u(t).Reescrevendo (1.37) na forma de sistema, obtemos z1= z1 z2= gz1 u(t)Podemos agora vericar que a posi c ao de repouso e de fato instavel. Osautovalores da matrizA:=_0 1g 0_do sistema s ao g. Da obtemos a matriz fundamental Zdo sistema z = Az:Z(t) =_egtg egtgegtg egtg_.Um sistema fundamenal de solu c oes e obtido das colunas de Z(t) e pode-mosobservarqueumadassolu c oescresceexponencialmente, compro-vando assim a instabilidade do sistema. Tentamos agora escolher umaestrategia de controle adequada para estabilizar o sistema.1atentativadecontrolederealimenta cao:u := k(t) = kz1,ondek R. De (1.37) obtemos o sistema z =A1z com A1=_0 1g +k 0_.OsautovaloresdamatrizA1s ao g +k. Deondeconclumosque,parak< g, os autovalores s ao imaginarios puros e as solu c oes corres-pondentes s ao oscila c oes n ao amortecidas; parak> g, os autovaloress ao reais e um deles e positivo, portanto a solu c ao correspondente a esteautovalor cresce de forma exponencial; parak = g, as solu c oes s ao dotipo polinomial e novamente n ao limitadas.Portanto, n ao e possvel alcan car com estrategias de controle do tipok a situa c aolimtz(t) =0,steuer2008/3/11page 16iiiiiiii16 [CAP.1: INTRODUCAOo que torna inviavel a estabiliza c ao do sistema.2atentativadecontrolederealimenta cao:u =k1k2 =k1z1k2z2,ondek1, k2 R. De (1.37), obtemos o sistema z =A2z com A2=_0 1g +k1k2_.OsautovaloresdamatrizA2s aok2/2 _k22/4 +g +k1. Escolhendopor exemplok2 = 2 ek1 = g 1, obtemos os autovalores1 = 2 =1. A equa c ao diferencial resultante+2 + =0possui as solu c oes linearmente independentes(t) =et, (t) =t et,provandoassimqueaestrategiau(t) =2z1 + (1 +g)z2estabilizaosistema.Para maiores detalhes sobre este problema, tambem denominado dependulo invertido, consulte [So], Captulo 3.1.2.6 ConcentracaodeChumbonoCorpoHumanoO modelo utilizado para aproximar o problema em quest ao e o mo-delo de compartimentos. Tal abordagem consiste em descrever o objetode estudo (corpo humano) como uma serie de compartimentos que inte-ragem entre si, trocando a subst ancia que desejamos analisar (chumbo).Obviamente essa tecnica e bastante maleavel e permite modelar diferen-tes tipos de processos fsicos, biologicos, qumicos, etc . . .Neste exemplo tratamos uma importante aplica c ao da teoria de con-trole, a qual esta relacionada com a teoria de problemas inversos. Trata-sedareconstru c aodepar ametros, istoe, ocontroleeutilizadoparaidenticaradin amicadosistema, que eaprincpiodesconhecida. Talproblema e investigado em detalhes no Captulo 6.steuer2008/3/11page 17iiiiiiii[SEC.1.2: EXEMPLOS 17Consideramosnestaabordagemummodelosimplescomapenas3compartimentos: Sangue, Tecido e Esqueleto. Denimos ent ao:t : tempot > 0;mi: massa do compartimentoi;ci(t) : concentra c ao de chumbo no compartimentoi;qi(t) : quantidade de chumbo no compartimentoi.Temos assimqi(t) =mici(t), i = 1, 2, 3.A din amica da troca e descrita por(1.38) q =f(q) +I(t),ondeq:=(q1, q2, q3), f (desconhecida)descreveataxadetroca, Ieum vetor de entrada. Supondo a din amica linear, i.e., a taxa de troca eproporcional a diferen ca de concentra c ao, obtemos: f(q) = Aq(A umamatriz).SupomosaindaI constanteequeexisteumpontodeequilbrio qpara o sistema (1.38), i.e., q =f( q) + I= 0. Nesta situa c ao e possveldescobrir a din amica do sistema. Suponha que introduzimos chumbo nosistema com taxa b(t) R3. A concentra c ao q +x da subst ancia satisfazent ao x = q + x =f( q +x) +I +b(t).Supondo quex e pequeno em rela c ao a q, temos x =fq( q) x+O((x q)2) +I +b(t)=fq( q) x+b(t) +r(t),onde r(t) R3possui componentes pequenas. Comofq( q) = A, obtemoso sistema(1.39) x =Ax+b(t).A matriz desconhecidaA deve ser identicada. Um metodo de realizartal identica c ao e o seguinte:Fixe a taxabeme ca em intervalosdetempoperiodicosa concentra c aoxi(t)/miou a raz aoxi(t)/ qi(caso qseja co-nhecido);Formeassimumconjuntodeequa c oesquepermitacal-cular os coecientes deA.steuer2008/3/11page 18iiiiiiii18 [CAP.1: INTRODUCAOOutro problema inverso relacionado `a teoria de controle (otimo) e aidentica c ao de coecientes na equa c ao de EulerLagrange. Tal proble-ma n ao e abordado neste manuscrito. O leitor interessado deve consultar[Lei].1.2.7 ABraquist ocronaO calculo das varia c oes teve seu desenvolvimento inicial em grandeparte devido ao problema que discutimos nesta sec c ao. Em 1696, Johann(John ou Jean) Bernoulli formulou o seguinte problema:6SejamP0eP1doispontosdadossobreumplanovertical.Deve ser encontrada uma curva unindo esses dois pontos desorte que um ponto de massa m partindo de P0 que a percorrasob a inuencia somente de seu pr oprio peso, alcanceP1nomenortempopossvel. Considereaindaavelocidadeinicialv0dada.Tal problema e conhecido como Braquist ocrona (do grego brachystos mnimo, chronos tempo). A m de obter uma formula c ao matematicaconveniente, restringimo-nos `aanalise de curvas que s aogracos defun c oes. Portanto, atrajetoriadopontopodeser descritapor umafun c aoy:[x0, x1] R, ondeP0=(x0, y0)eP1=(x1, y1). SejaTotempo para se percorrer a trajetoria, l o comprimento de arco de y, s(t)o comprimento de arco percorrido no tempot [0, T] eV (t) o valor davelocidade (tangencial) no tempot. Temos ent aodsdt(t) =V (t), t [0, T].Denotandoamudan cadevariaveispor s=S(t), temosojacobianodS/dt(t) = V (t) de onde segueT =_T0dt =_l0dsV (S1(s))=_l0dsW(s),6Tal problemafoi formuladooriginalmenteporGalileoem1638, queacreditavaserasolu c aodoproblemaumarcodecircunferencia. Outrosmatem aticosdaepocacomoLeibniz, Jakob(James ouJacques) Bernoulli eNewtonseinteressarampeloproblema,quefoipropostoporJohannBernoullinaformadeumdesao. Paramaisdetalheshist oricosconsulte[Gol].steuer2008/3/11page 19iiiiiiii[SEC.1.2: EXEMPLOS 19onde W(s) := V (s1(s)). Denindo agora s := l(x) =_xx0(1+yt(x)2)1/2dxe v(x) :=W(l(x)) velocidade parametrizada emx parax [x0, x1],obtemosT =_l0dsW(s)=_x1x0(1 +yt(x)2)1/2v(x)dx.Usando agora a lei de conserva c ao de energia (energia cinetica + energiapotencial = cte.)temosmv(x)22mgy(x) =mv202mgy0,ondeg e a constante gravitacional. Note que o eixo verticaly e tomadoorientado na dire c ao da for ca gravitacional. Denindo a constantec :=2gy0 v20, obtemos a express aoT =_x1x0(1 +yt(x)2)1/2(2gy(x) c)1/2dx,quenospermiteexplicitarotempodepercursoTemfun c aodapara-metriza c ao (x, y(x)) da curva. Podemos ainda escreverT =I(y) :=_x1x0L(x, y(x), yt(x)) dx,onde L(x, y, p) :=(1+p22gy+c)1/2, obtendoassimumproblematpicodocalculo das varia c oes.Omais importante neste problema s ao os metodos usados pararesolve-lo, que constituem o surgimento do calculo das varia c oes tal qualconhecemos hoje. A solu c ao e a curva denominada cicloide (veja Figu-ra 1.4), que possui a seguinte parametriza c ao: : [0, 1] (b +a( + sin ), a(1 + cos )) R2,onde os par ametros a, b s ao determinados pelas condi c oes (0) =(x0, y0),(1) = (x1, y1).JohannBernoulli baseousuaargumenta c aonoent aorecemdivul-gadoprincpioderefra c aodeFermat(1662). Considereummeiocon-stitudopordiversascamadashomogeneasdedensidadesdiferenteseseparadaspelasretashorizontaisy=y. Emcadacamaday 0 e a taxa de juros anual. Suponha que o custo desteuer2008/3/11page 25iiiiiiiiEXERCICIOS 25investimento do capital ao longo dos anosk = 0, . . . , Ne descrito pelafun c aoC(u) :=cN1

k=0u2k,ondeu = (u0, . . . , uN). Encontre uma poltica otima de investimentouparaN= 10,x10 = 100000,r = 7.1.5. Considereumcircuitocomumresistor(deresistenciaR)eumcapacitor (de capacit anciaC). Sejamu(t) a tens ao, y(t) a intensidadeda corrente eletrica eq(t) a carga eletrica no tempot. Temos ent ao asseguintes hipoteses fsicas: y(t) e igual `a varia c ao temporal deq(t); a diferen ca de potencial no capacitor e igual aq(t)/C; a diferen ca de potencial no resistor e igual aRy(t); a lei de Kirchho vigora: a voltagem aplicada no circuito e igual aosomatorio das diferen cas de potencial no circuito.Obtenha uma equa c ao diferencial para q e resolva-a, obtendo q em fun c aodeu eq(0) = q0.1.6. Aequa c aodiferencial () x =K, onde K,=0, descrevefen omenosdacinematica(e.g., naquedalivre: = 1e K=g, aconstantegravitacional). Apartirdosistema x=v, v=K(ondexeodeslocamentoevavelocidade), obtemosaequa c ao () dv/dx =(K)/v. Resolva a equa c ao diferencial () e esboce o graco das solu c oesno plano (x, v) para o caso particular = 1.1.7.Considere a equa c ao diferencial () do Exerccio 1.6 com a seguinteestrategia de realimenta c ao:K=K(x) =_ b, x > 0b, x < 0.Dada uma condi c ao inicial (x0, v0) e uma condi c ao nal (x1, v1), encontreuma trajetoria correspondente que as una.(Sugest ao: utilize o esbo co das trajetorias feito no Exerccio 1.6.)steuer2008/3/11page 26iiiiiiiiCaptulo2ObservabilidadeNeste captulo analisamos o problema de adquirir informa c oes sobreoestadopresentedeumsistemaapartirdaobserva c aodasadadosistemaemtempospassados. Conseguimosassimclassicaroespa codeestadosemcomponentesobservaveis, n aoobservaveisedetectaveis(para esta ultima e necessaria uma analise do comportamento assintoticodas variaveis de estado). Devido a sua simplicidade, os sistemas linearesaut onomos s ao estudados separadamente. Na ultima sec c ao e apresen-tada uma tecnica de reconstru c ao de estados a partir de observa c oes. Arela c ao existente entre os conceitos de observabilidade e controlabilidadee analisada no captulo seguinte.2.1 SistemasLinearesConsidere o seguinte sistema linear de controle:(2.1)_zt= A(t) z +B(t) uy = C(t) zonde as variaveis possuem a seguinte interpreta c ao:z : [t0, t1] Rn: vetor das variaveis de estado;u : [t0, t1] Rm: vetor das variaveis de controle (entrada);y : [t0, t1] Rl: vetor de observa c ao (sada).Os operadoresA : [t0, t1] Rnn, B : [t0, t1] Rnme C : [t0, t1] Rlnsteuer2008/3/11page 27iiiiiiii[SEC.2.1: SISTEMASLINEARES 27s aosupostoscontnuosemseusdomniosdedeni c ao. Osistemadecontrole linear (2.1) e denominado abreviadamente por (A, B, C). Se asfun c oesmatriciaisA, B, Cn aodependemexplicitamentedotempo,osistema de controle e dito aut onomo;caso contrario,o sistema e deno-minado n ao aut onomo.Considere inicialmente a seguinte quest ao: dado um sistema de con-trole(A, B, C), emquecircunst anciasepossvel apartirdoconheci-mento da entrada do sistemau : [t0, t1] Rme de sua saday : [t0, t1] Rl,reconstruiroestadoinicial z0:=z(t0) Rn. Umavezconhecidoovetorz0, e possvel substituir o controle dadou na equa c ao diferencialem (2.1) e calcular as variaveis de estadoz(t) em qualquer instante detempot [t0, t1].Comoestrategiasdecontroleadmissveisconsideramosasfun c oesL1([t0, t1]; Rm). Conforme resultados do Captulo A, temos que:y(t) = C(t) A(t, t0) z0+y1(t),y1(t) =_t1t0C(t) A(t, s) B(s) u(s) ds, t [t0, t1].Note que,conhecida a entradau,a fun c aoy1pode ser calculada apriori, independente do fato de conhecermos (ou n ao) a condi c ao inicialz0. Portanto, a determina c ao dez0a partir do par (y, u) e equivalente`a determina c ao dez0 a partir da diferen cay y1, a qual corresponde `asada do sistema homogeneozt=A(t) z.Istosignicaque, paraestudaradetermina c aodoestadoinicial z0deum sistema linear, basta concentrarmo-nos em sistemas homogeneos daforma:(2.2) zt=A(t) z, y =C(t) z,os quais representamos pela nota c ao abreviada (A, , C). Estamos agoraem condi c oes de formalizar o conceito de observabilidade, discutido noCaptulo 1.steuer2008/3/11page 28iiiiiiii28 [CAP.2: OBSERVABILIDADEDeni cao6. Osistema(A, , C)edenominadoobserv avel em[t0, t1]quando para toda fun c aoz C1([t0, t1]; Rn) a condi c aozt(t) =A(t) z(t), C(t) z(t) =0, t [t0, t1],implicar emz(t0) = 0. 2Em outras palavras, a observabilidade do sistema (A, , C) e equiva-lente ao fato da aplica c ao linearG : Rn C([t0, t1]; Rn)z0 C() A(, t0) z0ser injetiva. No teorema a seguir analisamos uma forma equivalente dedenir a observabilidade de um sistema.Teorema7. As seguintes arma c oes s ao equivalentes:a) O sistema (A, , C) e observ avel em [t0, t1];b) A matrizW(t0, t1) :=_t1t0A(t, t0)C(t)C(t) A(t, t0) dte positiva denida.Demonstra c ao: (a) =(b) Suponhaque W(t0, t1)n aoepositivadenida. Porconstru c ao, amatrizW(t0, t1) esimetricae, alemdisto,satisfaz: x, W(t0, t1)x) 0, x Rn. (por que?).Logo, existe z0 Rn0 tal que z0, W(t0, t1)z0) = 0. Denindo agora afun c aoz() := A(; t0)z0, temos que esta fun c ao e solu c ao do problemade valor inicialzt = A(t)z, z(t0) = z0. Alem disso,z satisfaz_t1t0[C(t) z(t)[2dt =_t1t0[C(t)A(t, t0)z0[2dt=_t1t0C(t)A(t, t0)z0,C(t)A(t, t0)z0) dt=_t1t0z0, A(t, t0)C(t)C(t)A(t, t0)z0) dt= z0,W(t0, t1)z0) =0.Encontramos assim uma fun c aoz satisfazendoC(t) z(t)=0, t [t0, t1] e z(t0)=z0,=0,steuer2008/3/11page 29iiiiiiii[SEC.2.1: SISTEMASLINEARES 29o que contradiz a hipotese do sistema ser observavel.(b) = (a) Suponha que para alguma fun c aoz tenhamoszt(t) =A(t) z(t), C(t) z(t) =0, t [t0, t1].Logo, temosz = (; t0)z0, ondez0 := z(t0) ez0, W(t0, t1) z0) =_t1t0C(t)z(t),C(t)z(t)) dt =0.Da hipotese deW(t0, t1) ser positiva denida, segue z0 = 0.Os sistemas de controle lineares com matrizes invariantes no tempo(aut onomos) representam um importante caso especial que e tratado noteorema a seguir. No texto que segue adotamos a nota c ao: Dada umamatrizM,representamos por Po(M),Ke(M),Im(M) respectivamenteo posto, o n ucleo e a imagem deM(para detalhes veja [Gan]).Teorema8. Seja(A, , C)umsistemadecontroleaut onomo. Asse-guintes armativas s ao equivalentes:a) (A, , C) e observ avel em [0, T] para todoT> 0;b) (A, , C) e observ avel em [0, T] para algumT> 0;c) A MatrizWT:=_T0eAsCCeAsds e n ao singular para algumT> 0;d) A MatrixWT:=_T0eAsCCeAsds e n ao singular para todoT> 0;e) Po(C[AC[ . . . [(A)n1C) = n;1f )n1

k=0Ke(CAk) = 0.Demonstra c ao: a) = b) Nada a fazer.b)=c) Seja T >0escolhidodeacordocomb). Tome z0 Rnedena a fun c ao z(t) :=eAtz0 parat R. A identidadez0, WTz0) =_T0[C z(s)[2dseobtidacomonademonstra c aodoTeorema7. Estaidentidadeeahipotese de observabilidade do sistema (A, , C) no intervalo [0, T] impli-cam emz0 = 0.1AmatrizM0=(C[AC[ . . . [(A)n1C)echamadamatrizdeobserva c aodositema(A, , C).steuer2008/3/11page 30iiiiiiii30 [CAP.2: OBSERVABILIDADEc)=d) Seja T >0escolhidodeacordocomc)esejaT >0. DaIdentidadez0, WTz0) =_T0[C z(s)[2ds,temos que z0, WTz0) = 0 implica ema(t) :=C eAtz0=0, t [0, T].Da segue que(2.3) a(k)(0) =C Akz0=0, k = 0, 1, . . .Portanto,C Akskz0=0, k = 0, 1, . . . , s [0, T].Esta ultima igualdade implica emz0, WTz0) =_T0[C eAtz0[2ds =_T0[

k=01k! CAkskz0[2ds =0.A escolha deTimplica por m emz0 = 0.d) = e) Suponha por contradi c ao que Po(C[AC[ . . . [(A)n1C) 0 qualquer.Exemplo9. Consideramos um modelo para representar o movimentode um satelite articial de massa unitaria orbitando a Terra. Denindoas variaveis:r : altura da orbita;0 : velocidade angular;u1: empuxo radial dos motores;u2: empuxo tangencial dos motores;2: constante gravitacional (2= g);o sistema de equa c oes que descreve o fen omeno e:(2.5)_ r =02r2r2+u10 = 20 rr2+r1u22Veriqueque k(t) =n1

j=0tjj!+

j=ntj(j)kj!.steuer2008/3/11page 32iiiiiiii32 [CAP.2: OBSERVABILIDADENote que a solu c ao deste sistema parau1 = u2 = 0 e dada porr(t) = 1e 0(t) = t. Portanto, ao denirmos as variaveis normalizadasz1 := r 1, z2 := z1t = r, z3 := 0 t, z4 := z3t =0 ,estamos estudando perturba c oes desta solu c ao, a qual representa a orbitalivre (controleu = 0) do satelite. Reescrevendo o sistema a partir dasnovas variaveisz1, . . . , z4, temos(2.6)___z1t= z2z2t= (z4 +)2(z1 + 1)2(z1 + 1)2+u1z3t= z4z4t= 2(z4 +)z2z1 + 1+u2z1 + 1Linearizando agora o sistema (2.6) no pontoz1=z2=z3=z4=u1=u2=0,obtemos o novo sistemazt=Az +Bu,onde as matrizesA eBs ao dadas por:A =____0 1 0 0320 0 20 0 0 10 2 0 0____e B =____0 01 00 00 1____.Sesupomosquetantovaria c oesnoraiodaorbita, quantono angulopodemsermedidas, ent aoasvariaveis z1ez3s aoconhecidas. Nessecaso, o vetor de observa c aoy satisfaz:y =C z onde C =_1 0 0 00 0 1 0_.A matriz de observa c ao, dada por M0 := (C[ . . . [(A)n1C), se escreveneste caso comoM0 =____1 0 0 0 . . . 0 0 1 0 . . . 0 1 0 0 . . . 0 0 0 1 . . . ____Temos assim que a condi c ao Po(M0) = 4 = n e vericada, garantindo aobservabilidade do sistema. 2steuer2008/3/11page 33iiiiiiii[SEC.2.2: SUBESPACONAOOBSERVAVEL 332.2 SubespaconaoObservavelConsideramos novamente o sistema aut onomo (A, , C). Como ja foidiscutidonasec c aoanterior, aobservabilidadedestesistema eequiva-lente `a injetividade da aplica c ao linearG : Rn C([t0, t1]; Rn)z0 C A(, t0) z0.Este fato motiva a seguinte deni c ao:Deni cao10. O n ucleo da aplica c aoG denida acima e denominadosubespa co n ao observ avel do sistema (A, , C). 2Exemplo 11.A deni c ao acima pode ser ilustrada pelo sistema (A, , C)com matrizesA =_1 00 1_, C =_0 1 _.Note que nenhuma condi c ao inicial da formaz0 = ( 0) R2pode serobservada. A matriz M0 := (C[AC) e dada porM0 =_0 01 1_.2O Exemplo 11 sugere ainda uma rela c ao entre o subespa co n ao ob-servavel e Im(M0). Este fato ca claro no teorema a seguir.Teorema 12. Seja o sistema aut onomo (A, , C) e NRno seusubespa con aoobserv avel. Podemosent aorepresentar Ndaseguinteforma:N =n1

k=0Ke(CAk).Demonstra c ao: Note que, sez0 N, ent aoC A(, t0) z0 0 em [0, T].Portanto,C Akz0=_dkdtkC eA(tt0)z0_t=t0=0, k = 0, 1, . . . .Logo,z0 Ke(CAk), k = 0, . . . , n 1, provando queN

Ke(CAk).Reciprocamente, sez0 Ke(CAk), repetimosaargumenta c aofeitasteuer2008/3/11page 34iiiiiiii34 [CAP.2: OBSERVABILIDADEna demonstra c ao da parted) = e) do Teorema 8 e conclumos quez0, WTz0) =_T0[C eAtz0[2dt =0,provando assim quez0 N.Observa cao 13.Por ser o n ucleo de uma aplica c ao linear, o subespa con ao observavel e um subespa co vetorial do Rn. Alem disso, s ao validasas seguintes arma c oes:N Ke(C) ;A(N) N, i.e. Ne invariante porA;N=

S Rn[S Ke(C), A(S) N, i.e.Ne o maior subespa co deKe(C), que e invariante porA.As propriedades acima s ao de facil verica c ao e deixadas como exerccio.2Se um determinado sistema (A, , C) n ao e observavel (em [t0, t1] paratodo t1> t0), podemos ainda assim indagar sobre a observabilidade dassolu c oes que n ao decaem, i.e. aquelas que satisfazemlimtz(t) ,= 0.Tais solu c oes correspondem aos auto-valores deA com parte real posi-tiva. Amdeanalisarmelhorestaquest ao, fazemosaseguintecons-tru c ao: SejapAopolin omiocaractersticodamatrizA. Sejaaindaadecomposi c aopA() =p+()p(),ondeospolin omios p+eps aoescolhidosdeformaapossuirrazesrespectivamenteem C[Re() 0e C[Re() 0 tal que|eAt|c et, t > 0.Temos desta forma que|V (t)|c2|C|2_0e2tdt < M, t > 0.b) = a) Seja C um autovalor de A com Re() 0 e u o autovetorcorrespondente. Por hipotese existeM> 0 tal queu, V (t) u) =_t0e2Re()s[Cu[2ds t1> 0,encontreosvaloresdeaebparaosquais epossveldeterminar o estadoinicial z0a partirdasobserva c oesy(t1)ey(t2).2.3. Considere o sistema (A, , C) comA=_0 1t2t1_, C = _0 1 _.Calcule a matriz de transi c ao do sistema zt = Az. Mostre que (A, , C) eobservavel.steuer2008/3/11page 38iiiiiiii38 EXERCICIOS2.4. Considere um modelo de compartimentos (veja Sec c ao 1.2.6) des-crito pelo sistema (A, B, C), comA=__a1b10a1(a2 +b1) b20 a2b2__, B=__001__, C= _1 0 0 _.Verique a observabilidade do sistema.2.5. Demonstre as arma c oes feitas na Observa c ao 13.2.6. Considere o sistema (A, , C) comA=_ 2 01 1_, C = _0 1 _.a) Mostre que o sistema e observavel.b) Exiba um n ucleo de reconstru c ao para o sistema.steuer2008/3/11page 39iiiiiiiiCaptulo3ControlabilidadeNestecaptuloestudamosprioritariamenteoproblemadedetermi-nar como e quando um estado especco pode ser atingido por um sis-tema a partir da escolha de uma estrategia de controle apropriada. NaSec c ao 3.2 estudamos a rela c ao existente entre os conceitos de observa-bilidadeecontrolabilidadedesistemaslineares. NoSec c ao3.5encon-tramos a solu c ao de uma famlia especial de problemas de controle otimoassociadoscomsistemaslinearesaut onomos. NaSec c ao3.6tratamosdacontrolabilidadedesistemascomrestri c oesnavariaveldecontrole.NaSec c ao3.7analisamosumafamliaparticulardeproblemas, cujassolu c oes s ao os controles denominados BangBang.3.1 SistemasLinearesConsideramos um sistema linear de controle da forma (A, B, C)zt= A(t) z +B(t) u (3.1)y = C(t) z (3.2)ondeas variaveis z, ye upossuem, comonaSec c ao2.1, aseguinteinterpreta c ao:z : [t0, t1] Rn: vetor das variaveis de estado;u : [t0, t1] Rm: vetor das variaveis de controle (entrada);y : [t0, t1] Rl: vetor de observa c ao (sada).Oefeitodas variaveis decontrolesobreadin amicadosistemaemodelado unicamente na equa c ao (3.1), sendo desnecessario considerar asteuer2008/3/11page 40iiiiiiii40 [CAP.3: CONTROLABILIDADEequa c ao de observa c ao y = C(t)z. Adotamos assim a nota c ao abreviada(A, B) para representar o sistema de controle descrito nas equa c oes (3.1),(3.2).A menos que se arme o contrario, as fun c oes matriciaisA : [t0, t1] Rn,n, B : [t0, t1] Rn,ms aoconsideradascontnuasnestecaptulo. Amatrizdetransi c aodosistema zt=A(t)z (vejaDeni c ao256)erepresentadapor A(, ).Como controles admissveis consideramos as fun c oes1u L1([t0, t1]; Rm).Podemosagoraintroduzirformalmenteoconceitodecontrolabilidade,mencionado no Captulo 1.Deni cao 19. O sistema (A, B) e dito control avel em [t0, t1]quando, paratodopardeestadosz0, z1 Rn, existeumcontroleu L1([t0, t1]; Rm) de forma que a solu c aoz do problema de valor inicialzt=A(t) z +B(t) u(t), z(t0) =z0satisfaz tambem a condi c ao de contornoz(t1) = z1. 2Observa cao 20.Quando a fun c aou L1([t0, t1]; Rm) controla a evolu- c ao do estado z a partir do estado inicial z0 Rnate o estado nal z1 Rnatraves da din amica zt = A(t)z +B(t)u(t), conforme a Deni c ao 19,usamos a nota c ao abreviada(t0, z0)u (t1, z1).2Observa cao21. NotequeoTeorema258garantequeumcontroleusatisfaz(t0, z0)u(t1, z1),se e somente sez1=A(t1, t0) z0+_t1t0A(t1, s) B(s) u(s) ds.21Oespa codasfun c oeslocalmenteintegr aveisde[0, )emRmedenidoporL1loc([0, ); Rm) := |u L1([t0, t1]; Rm)paratodos0 t0 t1< .Por deni c ao, toda fun c ao uL1([t0, t1]; Rm) possui uma exten c ao trivial uL1loc([0, ); Rm).steuer2008/3/11page 41iiiiiiii[SEC.3.1: SISTEMASLINEARES 41Existem ainda outras formas equivalentes de se denir a controlabi-lidade de sistemas lineares. Este e o resultado do teorema a seguir.Teorema 22. Dado o sistema linear de controle (A, B), s ao equivalentesas seguintes arma c oes:a) O sistema (A, B) e control avel em [t0, t1];b) Paratodo z1Rnexisteumafun c ao uL1([t0, t1]; Rm) satis-fazendo:(t0, 0)u(t1, z1) ;c) Paratodo z0Rnexisteumafun c ao uL1([t0, t1]; Rm) satis-fazendo:(t0, z0)u(t1, 0) ;Demonstra c ao: As implica c oes a) = b) e a) = c) s ao imediatas. Asdemais implica c oes decorrem basicamente da Observa c ao 21. De fato,b) = a) Sejamz0, z1 Rn. Escolhau L1([t0, t1]; Rm) tal que(t0, 0)u(t1, z1 A(t1, t0)z0).Logo,z1A(t1, t0) z0=A(t1, t0) 0 +_t1t0A(t1, s) B(s) u(s) dse portanto (t0, z0)u (t1, z1).c) = a) Sejamz0, z1 Rn. Escolhau L1([t0, t1]; Rm) tal que(t0, z0 A(t1, t0)1z1)u(t1, 0).Logo,0 =A(t1, t0)(z0A(t1, t0)1z1) +_t1t0A(t1, s) B(s) u(s) ds,provando que (t0, z0)u (t1, z1).Observa cao23. Apropriedadedescritanoitemc)doTeorema22 eusualmente denominada na literatura por controlabilidade ao zero. 2Uma analise sobre controlabilidade (assim como observabilidade) desistemas de controle n ao lineares pode ser encontrada em [LeMa]. En-tretanto, osautoresconsideramsomentesistemasdecontroledotipoaut onomo.steuer2008/3/11page 42iiiiiiii42 [CAP.3: CONTROLABILIDADE3.2 ControlabilidadeeObservabilidadeExisteumfortecompromissoentreacontrolabilidadedosistema(A, B) e a observabilidade do sistema (A, , B). A investiga c ao dessefato e o objeto de analise discutido nesta sec c ao.Teorema 24. Dado o sistema linear de controle (A, B), s ao equivalentesas arma c oes:a) (A, B) e control avel em [t0, t1];b) N ao existe nenhumz1 Rn0 que satisfa caB(t) A(t1, t)z1=0,t [t1, t0].c) A matriz Z(t0, t1):= _t1t0A(t1, t)B(t)B(t)A(t1, t)dt e n ao sin-gular;d) (A, , B) e observ avel em [t0, t1].Demonstra c ao: a) = b) Seja z1 Rn. Escolha u L1([t0, t1]; Rm) talque(t0, 0)u(t1, z1).Temos, portanto, que[z1[2= z1,z1) =z1,_t1t0A(t1, t)B(t)u(t) dt)=_t1t0B(t)A(t1, t)z1,u(t)) dt.Logo, se z1 Rn0, temosobrigatoriamente B(t)A(t1, t)z1 ,0em[t0, t1].b) c) Desuadeni c aoemc), segueque Z(t0, t1)esemidenidapositiva. Seja agora z1 Rn0. Temos ent aoz1,Z(t0, t1)z1) =_t1t0[B(t) A(t1, t)z1[2dt.Logo, sez1 Rn0, a hipotese emb) implica em z1, Z(t0, t1)z1) ,= 0,provandoc).Reciprocamente, de c) temos que B(t)A(t1, t)z10sse z1=0.Provando assimb).steuer2008/3/11page 43iiiiiiii[SEC.3.2: CONTROLABILIDADEEOBSERVABILIDADE 43c) = a) Sejaz1 Rn. A existencia de Z(t0, t1)1e garantida porc).Dena agorau poru(t) :=B(t) A(t1, t)Z(t0, t1)1z1, t [t0, t1].Temos ent aoA(t1, t0) 0 +_t1t0A(t1, s) B(s) u(s) ds ==_t1t0A(t1, s) B(s) B(s) A(t1, s)Z(t0, t1)1z1ds= Z(t0, t1) Z(t0, t1)1z1=z1.OargumentodaObserva c ao21implicaem(t0, 0)u (t1, z1). Aar-ma c ao ema) segue por m do Teorema 22.c) d) ConformedemonstradonaSec c ao2.3, arela c aoentreasmatrizesdetransi c aoA(t0, t)eA(t, t0)dossistemas zt=A(t)zewt = A(t)w respectivamente, e dada porA(t, t0) :=A(t0, t).SejaW(t0, t1) a matriz de observa c ao do sistema (A, , B) (veja Teo-rema 7) dada porW(t0, t1) =_t1t0A(t, t0)B(t) B(t) A(t, t0) dt=_t1t0A(t0, t) B(t) B(t) A(t0, t)dt=_t1t0A(t0, t1) A(t1, t) B(t) B(t) A(t1, t) A(t0, t1)dt= A(t0, t1) Z(t0, t1) A(t0, t1).Portanto, W(t0, t1) e singular se e somente se Z(t0, t1) o for. O resultadodesejadosegueagoradoTeorema7, oqual garanteque(A, , B)eobservavel em [t0, t1] se e somente seW(t0, t1) e positiva denida.Observa cao25. Nademonstra c aodaimplica c ao c)=a)noTeo-rema24,construimosumcontroleespecial u,quelevaoestadoinicialz0 = 0 em um estado nal z1 Rnarbitrario, i.e.(t0, 0)u(t1, z1) para u(t) :=B(t) A(t1, t)Z(t0, t1)1z1.2steuer2008/3/11page 44iiiiiiii44 [CAP.3: CONTROLABILIDADE3.3 SistemasdeControleAut onomosCasoasmatrizes A, Bdosistemadecontrole(A, B)sejamcons-tantes, este sistema e denominado sistema linear aut onomo de controle.Neste caso, dispomos da seguinte caracteriza c ao de controlabilidade:Teorema 26. Seja (A, B) um sistema de controle aut onomo. S ao equi-valentes as arma c oes:a) (A, B) e control avel em [0, T] para todoT> 0;b) (A, B) e control avel em [0, T] para algumT> 0;c) A matriz WT:=_T0eAsBBeAsds e n ao singular para um T> 0;d) A matriz WT:=_T0eAsBBeAsds e n ao singular para todo T>0;e) Po(B[AB[ . . . [An1B) = n.Demonstra c ao: Oteorema segue imediatamente dos Teoremas 8e 24.Observa cao27. Apropriedadedescritanoiteme) doTeorema26e usualmente denominada na literatura por criterio de Kalman(1963). 2Deni cao28. Umsistemaaut onomo(A, B), paraoqual acondi c aodepostoe)doTeorema26esatisfeita, edenominadocompletamentecontrol avel (veja [So, Captulo 3]). 2Exemplo29. Considereoproblemadoosciladorharm onicodescritopela equa c ao diferencial: x+x =u.Podemos reescrever a equa c ao acima na forma_ z1= z2 z2= u z1que e obtida quando denimos z1 = x e z2 = xt. Escrevendo na formade sistema, temoszt=Az + Bu, onde A =_0 11 0_, B =_01_e z =_z1z2_.steuer2008/3/11page 45iiiiiiii[SEC.3.3: SISTEMASDECONTROLEAUTONOMOS 45ComoPo (B[AB) =Po_0 11 0_=2,podemosconcluirque(A, B) econtrolavel. Notequen aofoifeitane-nhuma restri c ao `as variaveis de controle. 2Exemplo30. Consideremosnovamenteomovimentodeumsatelitearticial de massa unitaria orbitando a Terra. No Exemplo 9 deduzimosuma aproxima c ao linear para o modelo que representa o fen omeno, quee a equa c aozt=Az +Bu,ondeA =____0 1 0 0320 0 20 0 0 10 2 0 0____, B =____0 01 00 00 1____.Neste caso temos:Po (B[AB[A2B[A3B) =Po____0 0 1 0 . . . 1 0 0 2 . . . 0 0 0 1 . . . 0 1 2 0 . . . ____=4.Deondeconclumosqueosistemalinearizado econtrolavel (em[0, T]paraTt aopequenoquantosequeira). Suponhaagoraquedispomosapenas do empuxo radial para controlar a orbita do satelite. Neste casoa matrizBse tornaB=____0100____e obtemosPo (B[AB[A2B[A3B) =Po____0 1 0 21 0 200 0 2 00 2 0 23____=3.Conclumos portanto, que nestasitua c aoosisteman aomais e con-trolavel.steuer2008/3/11page 46iiiiiiii46 [CAP.3: CONTROLABILIDADEAlternativamente, suponhaqueapenasoempuxotangencialestejadisponvel para realizar corre c oes na orbita. A matrizBse tornaB=____0001____e obtemosPo (B[AB[A2B[A3B) =Po____0 0 2 00 2 0 230 1 0 421 0 420____=4.Sendo assim, nesta situa c ao o sistema e novamente controlavel. 2Exemplo31. Considere o sistema (A, B) gerado pela EDO de ordemnx(n)+n1

i=0i+1x(i)=u.Temos assimA =________0 1 00 0 1

00 0 112n________, B =________0

1________.Um calculo simples mostra que o sistema e controlavel (verique!). 2O proximo lema nos permite analisar a quest ao da controlabilidadequandotemosperturba c oesdeumsistemaaut onomototalmentecon-trolavel.Lema32. Seja(A, B) umsistemaaut onomototalmentecontrol avel.Ent ao, paratodamatrizF Rm,n, osistema(A + BF, B)tambemetotalmente control avel.Demonstra c ao: SejaF Rm,n. Dacontrolabilidadede(A, B)seguequePo(B[AB[[An1B) =n.steuer2008/3/11page 47iiiiiiii[SEC.3.4: FORMANORMALDOSSISTEMASAUTONOMOS 47Note ainda que(B[[(A+BF)n1B) =(B[[An1B)Q,onde Q =I + N Rnm,nmeNe uma matriz nilpotente,i.e. Nk= 0para algumk N.A forma exata deNe irrelevante e pode ser calculada recursivamente.2O importante e que da identidadeQ =I + Npodemos concluir que amatrizQ e n ao singular (verique!)e portantoPo (B[(A+BF)B[[(A+BF)n1B) =n.Provando que (A+BF, B) e controlavel.3.4 FormaNormaldosSistemasAut onomosOs sistemas aut onomos de controle possuem ainda a caracterstica depoder ser reescritos em uma sistema especial, denominada forma normal(deKalman). Avantagem equenaformanormalosistemapodeserdividido em 4 blocos, sendo possvel identicar os sub-sistemas: controlavel e observavel; controlavel e n ao observavel; n ao controlavel e observavel; n ao controlavel e n ao observavel.Teorema 33. Seja (A, B, C) um sistema de controle aut onomo.Ent aoexisteumamatrizn aosingular PRn,n, demodoqueosis-tema ( A,B,C), com matrizesA = PAP1,B = PB,C = CP1, e daforma(3.3)A=____A11A12A13A140A220A240 0A33A340 0 0A44____,B=____B1B200____,C=_0C20C4_.2Paran = 3temos:Q=__I FB FAB + (FB)2I FBI__.steuer2008/3/11page 48iiiiiiii48 [CAP.3: CONTROLABILIDADETemos ainda que o sub-sistema(3.4)__A11A120A22_,_B1B2__e control avel e o sub-sistema(3.5)__A22A240A44_,_C2C4__e observ avel.Demonstra c ao: Come camos denindo os subespa cosUeVde RnporU :=Im(B)+AIm(B)++An1Im(B), V :=n1

k=0Ke(CAk).Dividimos a prova nos seguintes pasos:(1) A(V ) V ;(2) A(U) U;(3) constru c ao da matrizP;(4) verica c ao de (3.3);(5) controlabilidade de (3.4);(6) observabilidade de (3.5).(1) Sejaz Ve denax = Az. Logo,CAkx = CAk+1z = 0, parak =0, . . . , n2. Do teorema de Caley-Hamilton, temos Ann1

k=0kAk= 0.De onde conclumos queC An1x =C Anz =n1

k=0k C Akz =0.Provamos assim que CAkx = 0, parak = 0, . . . , n 1, i.e. x V .(2) Sejaz U. Logo, existem vetoresuk Rmtais quez =n1

k=0AkBuk.steuer2008/3/11page 49iiiiiiii[SEC.3.4: FORMANORMALDOSSISTEMASAUTONOMOS 49Dena agora x =Az. Utilizando novamente o teorema de Caley-Hamilton, temosx =n1

k=0Ak+1Buk= AnBun1+n1

k=1AkBuk1=_n1

k=0kAk_Bun1+n1

k=1AkBuk1= 0Bun1+n1

k=1AkB(kun1 +uk1)inU.(3) Primeiro decompomos o Rnna soma diretaRn=X1 X2 X3 X4,onde X1 = U V ; X2 e tal que X1X2 = U; X3 e tal que X1X3 = VeX4 = RnX1 X2 X3. Escolha agora uma base w1, . . . , wnpara oRn, que seja composta por bases para os espa cosX1, X2, X3, X4. Isto eX1=Span w1, . . . , wd1, X2=Span wd1+1, . . . , wd1+d2,X3=Span wd1+d2+1, . . . , wd1+d2+d3,X4=Span wd1+d2+d3+1, . . . , wn(onded1 + d2 + d3 + d4=n). DenaagoraamatrizPatravesdatransforma c ao linearP: RnRn; Pwk= ek, 1 k n.(4) A identidadeAP= PA e (2) implicam que os blocosA31,A32,A41eA42s ao identicamente nulos. A identidadeAP=PA e (1) implicamque os blocosA21,A23,A41 eA43 s ao identicamente nulos.Sejambj Rn,j = 1, . . . , m os vetores coluna deB. Como Im(B) U,ent aobj X1 X2 e, portanto,P bj=d1+d2

k=1k P wk=d1+d2

k=1k ek.steuer2008/3/11page 50iiiiiiii50 [CAP.3: CONTROLABILIDADEDecorreent aoqueosblocosB3eB4s aoidenticamentenulos. ComoV Ke(C), ent aoCx = 0, x X1 X3. DeC =CPsegue agora queCek= 0 parak = 1, . . . , d1, d1 +d2 + 1, . . . , d1 +d2 +d3. Portanto, osblocosC1 eC3 s ao identicamente nulos.(5) Sejak := dimU= d1 +d2. Logo,B= Im(U) +A Im(U) ++Ak1Im(U).3Temos ent aoPo__B1B2_ [[_A11A120A22_k1_B1B2__= Po ( B[[ Ak1 B)= Po (B[[Ak1B)= dimU =k.A controlabilidade de (3.4) segue agora do Teorema 8.(6) Sejak:=dim(X2 X4)=d2 + d4. Logo, V = k1j=0Ke(CAj).4SejaaindaM0amatrizdeobserva c aodosub-sistema(3.5)(conformeTeorema 8). Temos ent aoIm(M0)=Im_____( C2[C4)...( C2[C4)_A22A240A44_k1_____=Im___C...C Ak1___=Im___C...CAk1___.3Istoeconseq uenciadaseguinteimplica c ao:AjIm(B) Im(U) + +Aj1Im(U) =AiIm(B) Im(U) + +Aj1Im(U),i j.4Estefatoseguedaimplica c ao:Ke(CAj1) Ke(CAj) = Ke(CAj) Ke(CAj+1) =V Ke(CAj+1).steuer2008/3/11page 51iiiiiiii[SEC.3.5: CONTROLABILIDADEEESTRATEGIASOTIMAS 51De onde conclumos quePo(M0) =n dimKe___C...CAk1___=n dimV =n dim(X1 X3) = k.Logo,dimIm(M0) =dimIm(M0) =keaobservabilidadedosistemaem (3.5) segue do Teorema 26.3.5 ControlabilidadeeEstrategiasOtimasAinda investigando a controlabilidade de sistemas aut onomos, vemosa seguir que e possvel encontrar uma estrategia de controle que leve oestado (0, z0) no estado (T, z1) e que seja otima em um sentido particular.Teorema34. Seja(A, B)umsitemadecontroleaut onomoeT>0.Dena a matrizVT:=_T0eAsBBeAsds. S ao verdadeiras as seguintesarma c oes:a) O controle(3.6) u(t) :=BeA(Tt)VT1(eATz0 z1), t [0, T]satisfaz a propriedade(3.7) (0, z0)u(T, z1).b) Entre todos os controles admissveis u que satisfazem (3.7), u e aqueleque minimiza o funcional quadr aticoJ(u) =_T0[u(t)[2dte o valor mnimo atingido porJe(3.8) J( u) =_T0[ u(t)[2dt =VT1(eATz0 z1), (eATz0 z1)).Demonstra c ao: Para vericara) note que a matriz de transi c ao de umsistema aut onomo e dada por A(t, s) = eA(ts). Temos portantosteuer2008/3/11page 52iiiiiiii52 [CAP.3: CONTROLABILIDADEA(T, 0) z0+_T0A(T, s) B u(s) ds == eATz0_T0eA(Ts)BBeA(Ts)VT1(eATz0 z1) ds= eATz0__T0eAsBBeAsds_VT1(eATz0 z1)= eATz0VTVT1(eATz0 z1) =z1.Logo,a) segue da Observa c ao 21. A equa c ao (3.8) segue por sua vez de_T0[ u(t)[2dt =_T0[BeA(Ts)VT1(eATz0 z1)[2ds= _T0eA(Ts)BBeA(Ts)VT1(eATz0 z1) ds,VT1(eATz0 z1))= VTVT1(eATz0 z1),VT1(eATz0 z1))= VT1(eATz0 z1), (eATz0 z1)).Provemos agorab). Sejau L1([0, T]; Rm) um controle qualquer satis-fazendo(3.7). PodemossuporsemperdadegeneralidadequeJ(u)=_T0[u(t)[2dt < .5Temos ent ao_T0u(s), u(s)) ds = _T0u(s),BeA(Ts)VT1(eATz0 z1)) ds= _T0eA(Ts)Bu(s) ds,VT1(eATz0 z1))= (eATz0 z1),VT1(eATz0 z1)).(Na ultima passagem utilizamos a Observa c ao 21.)Acabamos de provar,portanto, que(3.9)_T0u(s), u(s)) ds =_T0 u(s), u(s)) ds.5Essa hip otese garante que u L2([0, T]; Rm). Note que (3.8) tambem implica em u L2([0, T]; Rm).steuer2008/3/11page 53iiiiiiii[SEC.3.5: CONTROLABILIDADEEESTRATEGIASOTIMAS 53Note porem que o produto interno , no espa coL2([0, T]; Rm) edenido por f,g =_T0f(s),g(s)) ds, f, g L2([0, T]; Rm).Logo, (3.9) e equivalente a u, u = u, u . Temos da que u, u + u u, u u = 2 u, u + u, u 2 u, u = u, u ,o que implica em_T0[u(t)[2dt =_T0[ u(t)[2dt +_T0[u(t) u(t)[2dt.O itemb) segue desta ultima identidade, completando a demonstra c ao.Observa cao35. O Teorema 34 pode ser interpretado como:Aestrategiadecontrole udenidaem(3.6)esolu c aodoproblema de controle otimo:___Minimizar_T0[u(t)[2dtsujeito au L2([0, T]; Rm) ;zt=Az +u ; z(0) = z0, z(T) = z1.2Exemplo 36.Considere a equa c ao x = u. Do Exemplo 31, sabemos queo sistema de controle associado e completamente controlavel. Tratamosagora do seguinte problema:Dado T> 0, encontre um controle u que leve o estado inicialx(0) = x0, x(0) = x1 no estado nalx(T) = x(T) = 0.OTeorema34nosforneceumareceita(umtantoquantotrabalhosa)para encontraru. A solu c ao e: u(t) =12T3(x0T22+x1T23x1tT2tx1), t [0, T].2steuer2008/3/11page 54iiiiiiii54 [CAP.3: CONTROLABILIDADE3.6 Atingibilidade de Estados comRestric oesdeControleUm problema importante que surge em diversas aplica c oes praticaseaqueleemqueconsideramosrestri c oes`asvariaveisdecontrole. Sobessascondi c oeseimportantesaberquaisestadospodemseratingidosem um determinado intervalo de tempo. Consideramos novamente umsistema linear da forma (A, B):(3.10) zt=A(t) z +B(t) u,onde as fun c oes matriciaisA : [t0, t1] Rn,n, B : [t0, t1] Rn,ms ao supostas contnuas. Impomos agora a seguinte restri c ao `as variaveisde controle:As estrategias (ou a c oes) de controle precisam ser escolhidasapartirdeumconjuntoxadoapriori. Seja Rmoconjuntoaoqual esta restrita a escolha das estrategias de controle. Denominamos conjunto de controle (ou de a c oes) e a partir da denimos o conjunto6Uad() :=u L1([t0, t1]; Rm) [u(t) q.s. em[t0, t1],que e chamado conjunto dos controles admissveis.Deni cao37. Sejaz0 Rn. O subconjunto do Rndenido porR(; t0, z0, t1) := z1Rn[ (t0, z0)u (t1, z1) para algumu Uad()e denominado conjunto atingvel porz0. 2Pelo que vimos ate agora, podemos garantir que R(; t0, z0, t1) = Rnquando=Rme(A, B)econtrolavel em[t0, t1]. Analisamosnestasec c ao o caso em que e um subconjunto proprio de Rm.Teorema38. Sejam, Uad(), R(; t0, z0, t1)osconjuntosdenidosacima. Se e convexo e compacto, ent aoR(; t0, z0, t1) tambem e con-vexo e compacto para todoz0 Rn.6Nota c ao: q.s. eabrevia c aodequase sempreesignicaquedeterminadapro-priedadesevericaexceptoporumconjuntodemedida(deLebesgue)nula.steuer2008/3/11page 55iiiiiiii[SEC.3.6: ATINGIBILIDADEDEESTADOSCOMRESTRIC OESDECONTROLE 55Demonstra c ao: Seja A(, ) a matriz de transi c ao do sistema. Temosent ao(3.11)R(; t0, z0, t1)=z1[z1=A(t1, t0) z0 +_t1t0A(t1, s) B(s) u(s) ds, u Uad().Logo, acompacidadedeeacontinuidadedasfun c oes A() e B()implicam na limita c ao do conjuntoR(; t0, z0, t1). Provamos agora queR(; t0, z0, t1) e fechado. Sejay =limlyl, ondeyl R(; t0, z0, t1) paratodol N. Logo,yl=A(t1, t0) z0+_t1t0A(t1, s) B(s) ul(s) ds, ul Uad(), l N.Como e limitado, ent ao (ul)lNe uma seq uencia limitada emL1([t0, t1]; Rm) e, portanto, possui uma subseq uencia fracamente conver-gente.7Suponha, sem perda de generalidade, que (ul)lNe fracamenteconvergente. Ent ao existe u L1([t0, t1]; Rm), tal queliml_t1t0w(t),ul(t)) dt =_t1t0w(t),u(t)) dt,paratodow L([t0, t1]; Rm). Como efechado,temosqueUad()tambemefechado.8Ecomoeconvexo, verica-sefacilmentequeUad() tambem e convexo. SendoUad() convexo e fechado, um resul-tadoconhecidodaanalisefuncional garantequeUad()efracamentefechado. Deondeconclumosque u Uad(). Portanto, paratodo7Dizemos que a seq uencia xnconverge fraco para x no espa co vetorial normado X(nota-sexnwx)quandof(xn) f(x)paratodofuncionallinearlimitadof X

.Aconclus aodotextosegue de umconhecidoteoremadaan alise funcional: (vejademonstra c aoem[Gr,Captulo3]ou[Leig,Captulo5]):Teorema:[BanachAlaoglu]Emtodoespa codeBanach(dedimens aonitaoun ao)abolaunit ariaefracamentecompacta.8Aqui usamosofatodaconvergenciafracaemL1([t0, t1]; Rm)deumaseq uenciaimplicarnaconvergenciapontualdeumasubseq uenciaquasesempre.steuer2008/3/11page 56iiiiiiii56 [CAP.3: CONTROLABILIDADEv Rntemos quev, y) = limlv,yl)= limlv, A(t1, t0)z0) +_t1t0v, A(t1, s)B(s)ul(s)) ds= v, A(t1, t0)z0) + liml_t1t0B(s)A(t1, s)v,ul(s)) ds= v, A(t1, t0)z0) +_t1t0B(s)A(t1, s)v,u(s)) ds= v, A(t1, t0)z0+_t1t0A(t1, s)B(s)u(s) ds).De onde conclumos quey =A(t1, t0) z0+_t1t0A(t1, s) B(s) u(s) ds R(; t0, z0, t1).Provando assim que R(; t0, z0, t1) e fechado. O teorema de Heine-Borelgarante que, em Rn, ser compacto e equivalente a ser simultaneamentefechadoelimitado, portanto R(; t0, z0, t1) ecompacto. Aconvexi-dadedeR(; t0, z0, t1)seguedarepresenta c aoamdeseuselementosem (3.11) e da convexidade de .Exemplo39. Considere o sistema (A, B) com matrizesA=_a 00 a_, B=_1 00 1_.O sistema (A, B) e totalmente controlavel,pois Po(B[AB) = 2. Logo,R(R2; 0, z0, T) =R2paratodoz0R2. Escolhaagora=uR2[ [u[ r, z0=0et0=0. Comoasolu c aodosistemapossui arepresenta c aoz(t) =_t0ea(ts)u(s) ds,podemos concluir que:Sea > 0, ent aoR(; t0, z0, t1) = z R2[ [z[ ra1(eat11). Logo,_T>0R(; 0, z0, T) =R2.steuer2008/3/11page 57iiiiiiii[SEC.3.6: ATINGIBILIDADEDEESTADOSCOMRESTRIC OESDECONTROLE 57Se a < 0, ent ao R(; t0, z0, t1) = z R2[ [z[ r[a[1(1eat1). Logo,_T>0R(; 0, z0, T) =z R2[ [z[ [a[1r.2Esteexemplomostraqueainvestiga c aodofatodeumdetermi-nado estado, emparticular o estado z =0, pertencer ao conjuntoR(; t0, z0, t1) paraalgumt1>t0erelevantenoquedizrespeito`acontrolabilidadedeumsistema. Estaquest ao eespecialmenteinteres-sante quando observamos que 0 pode ser considerado como estado ideala ser atingido.Deni cao 40.Dado Rm, o sistema aut onomo (A, B) e denominadocontrol avel ao zero emz0 quando0 R(; z0) :=_T>0R(; 0, z0, T).2Nolemaaseguirdiscutimoscondi c oessucientesparaobtermosacontrolabilidade ao zero de sistemas de controle aut onomos.Lema41. Seja(A, B)umsistemadecontroleaut onomo, totalmentecontrol avel e Rm. Se 0 e um ponto interior de , ent ao para todoT> 0existeumavizinhan caV de0em Rntal que 0 R(; 0, z0, T)para todoz0 V .9Demonstra c ao: SejaT >0e VT:= _T0eAsBBeAsds. Denau L1([0, T]; Rm), conforme o Teorema 34, poru(t) :=BeA(Tt)VT1eATz0, t [0, T].Este mesmo teorema nos garante que (0, z0)u (T, 0). Como a aplica c ao[0, T] t etA Rn,ne contnua e [0, T] compacto, ent ao existe umaconstantem > 0 tal que[u(s)[ m[z0[ para todo [0, T] e todoz0 Rn.Como 0 Int(), existe R > 0 tal queBR(0) . Denindo = Rm1e V =B(0), temosque [u(s)[ m=R, t [0, T], z0 V , i.e.u(s) , t [0, T],z0 V , provando o teorema.9Adotamosaseguintenota c ao: y Rmeumpontointeriordequandoexister >0tal que Br(0) := |v Rm[ [v[ r . UmconjuntoV edenominadovizinhan cadey Rmquandoexister> 0talque Br(0) V .steuer2008/3/11page 58iiiiiiii58 [CAP.3: CONTROLABILIDADENo teorema a seguir analisamos a rela c ao entre a controlabilidade deum sistema aut onomo e os autovalores da matriz do sistema.Teorema42. Seja(A, B)umsistemaaut onomoe Rmlimitado.S ao v alidas as arma c oes:a) Se0eumpontointeriorde, osistema(A, B)ecompletamentecontrol avel e existem constantesm 0 e> 0 tais que(3.12) |eAt|met, t [0, ),ent ao 0 R(; z0) para todoz0 Rn;b) Seamatriz Apossui umautovalorcompartereal positiva, ent aoexiste z0 Rntal que 0 , R(; z0).Demonstra c ao: Provamosprimeiroa). SejaT1>0. OLema41nosgarante a existencia de uma vizinhan ca W de 0 tal que0 R(; 0, w0, T1)para todow0 W. De (3.12) temos que, para todoz0 Rn, existe umT2(sucientemente grande) tal queeAT2z0 W. Denaw0 := eAT2z0eescolha a estrategiau L1([0, T1]; Rm) de forma que(0, w0)u(T1, 0).Note agora que o controle u denido por u(t) :=_0 , 0 t T2u(t T2) , T2 t T2 +T1satisfaz (0, z0) u (T1 +T2, 0).Provamos agorab). Seja = + ium autovalor deAcom> 0 ew = w1 +iw2 o autovetor correspondente. Temos ent aoAw1+iAw2=(+i)(w1+iw2), [w1[ +[w2[ ,= 0e portantoAw1=w1w2, Aw2=w1 +w2.Tome x Rnsatisfazendo q :=x, w1)2+ x, w2)2,= 0 e sejau L1loc([0, ); Rm). A partir da solu c ao z do sistemazt = Az +Bu(t),z(0) = x, denimos a fun c aov(t) :=z(t),w1)2+z(t),w2)2, t [0, )steuer2008/3/11page 59iiiiiiii[SEC.3.6: ATINGIBILIDADEDEESTADOSCOMRESTRIC OESDECONTROLE 59e obtemos parat 0 a estimativavt(t) = 2(zt(t),w1) z(t),w1) +zt(t),w2) z(t),w2))= 2(z(t),Aw1) z(t),w1) +z(t),Aw2) z(t),w2))+ 2(Bu(t),w1) z(t),w1) +Bu(t),w2) z(t),w2))=: I1(t) +I2(t).Da deni c ao dew1, w2obtemos agoraI1(t) = 2v(t). Como e limi-tado, temos ainda[I2(t)[2= 4(Bu(t),w1) z(t),w1) +Bu(t),w2) z(t),w2))2 8(c1z(t),w1)2+c2z(t),w2)2) c2[v(t)[2, t 0,onde a constantec independe deu ex. Logo,[I2(t)[ c_v(t), t 0.Podemos ent ao armar quevt(t) (v(t)), t 0,onde (s) := 2s cs,s R. Como(s) > 0 paras > (c2)2=: s0,temos quev e monotona crescente caso a escolha dex satisfa cav(0)>s0.10Nestecasoaestrategiaun aopoderasatisfazer(0, x)u(T, 0)para nenhumT> 0. Comou L1loc([0, ); Rm) foi escolhido de formaarbitraria, conclumos que para estex certamente 0 ,R(; x). O casoreal = 0 e demonstrado de forma analoga.Note que a condi c ao imposta em (3.12) no Teorema 42 e equivalentea exigir que a matrizA possua apenas autovalores negativos.Exemplo43. Considere o sistema de controle obtido da EDOz(n)+n1

j=0aj z(j)=u.Como sabemos, este sistema e totalmente controlavel se tomamos = R(vejaExemplo31). Escolhaagoracomoconjuntodecontrole:=[, ] R. Caso o polin omio caracterstico do sistema acima possuaapenas razes com parte real negativa, podemos concluir que o sistemade controle associado a EDO e controlavel ao zero. 210Sen aoforesseocaso, podemossempresubstituirxporumm ultiploseuade-quado,umavezquece(eportantoc0)independemdex.steuer2008/3/11page 60iiiiiiii60 [CAP.3: CONTROLABILIDADE3.7 Princpio do BangBang e Problemas deTempoMnimoComonasec c aoanterior, continuamos discutindoproblemas comrestri c ao `as variaveis de controle. Estamos particularmente interessadosna classica c ao dos problemas que s ao solucionados por controles do tipoBangBang,i.e. controlesu Uad()quesatisfazemu(t) quasesempre.Considere o sistema escalar de controle(3.13) zt=A(t)z +b(t)u, z(t0) =z0,com fun c oes matriciaisA C([t0, t1]; Rn,n), b C([t0, t1]; Rn). O con-junto dos controles admissveis eUad() :=u : [t0, t1] R [u mensuravel; u(t) q.s.,onde Rmeconvexoecompacto. ComovimosnaSec c aoA.3, asolu c ao do sistema (3.13) e dada porz(t) =Z(t)Z1(t0)z0+Z(t)_tt0Z1(s)b(s)u(s) ds, t [t0, t1].Denindo agora o conjuntoS(; t0, t) :=__tt0Z1(s)b(s)u(s) ds [u Uad()_ Rn,temos queR(; t0, z0, t) = Z(t)z0 +Z(t)S(; t0, t), ou aindaS(; t0, t) =Z1(t)R(; t0, z0, t) z0.Portanto,z0 R(; t0, z0, t) se e somente se [Z1(t)z z0] S(; t0, t).Seguindo a nota c ao da Sec c ao 3.6, denimos o conjunto dos controlesde BangBangUbb() := u Uad() [u(t) q.s.e o conjunto dos estados atingveis por esse tipo de estrategia de controleRbb(; t0, z0, t) := z1Rn[ (t0, z0)u (t1, z1) para algumuUbb().Antesdeformularoresultadoprincipal destasec c ao, necessitamosdeum lema auxiliar um tanto quanto tecnico.steuer2008/3/11page 61iiiiiiii[SEC.3.7: PRINCIPIODOBANGBANGEPROBLEMASDETEMPOMINIMO 61Lema44. Dadot [t0, t1], a aplica c aoI : L([t0, t]; R) u _tt0Z1(s)b(s)u(s) ds Rne linear e contnua, quando denida entre Uad(), com a topologia fraca,e o Rn, com topologia usual.Demonstra c ao: Alinearidade segue imediatamente dadeni c aodeI. Paraprovaracontinuidade, usamososeguintefato:11emUad(),unw u se e somente se_tt0y(s)un(s) ds_tt0y(s)u(s) ds, y L1([t0, t]; R).ComoZ1(s)b(s) L1([t0, t]; R), o lema ca provado.Apresentamos aseguir oresultadoconhecidonaliteraturacomoprincpio do BangBang.Teorema 45. Para qualquer t [t0, t1], temos R(; t0, z0, t) =Rbb(; t0, z0, t).Demonstra c ao: ObviamenteRbb(; t0, z0, t) R(; t0, z0, t). Para pro-var a inclus ao contraria e suciente vericar que, para todo z S(; t0, t),existe u Ubb()tal quez=I( u). Defato, dadoz R(; t0, z0, t),denimos z := Z1(t)zZ1(t0)z0 S(; t0, t). Logo, existe u Ubb()tal que z = I( u), de onde segue quez =Z(t)Z1(t0)z0 +Z(t) z =A(t, t0)z0 +_tt0A(t, s)b(s) u(s) ds,provando quez Rbb(; t0, z0, t).Seja portantoz S(; t0, t). Dena o conjuntoMcomo a imageminversa dez porI, isto e,M:=I1(z) Uad() =u Uad() [I(u) = z.Meosubconjuntodoscontrolesadmissveisquegarantemainclus aodez emS(; t0, t). Basta provar ent ao que existe u M Ubb().11Tal fato se justica pela topologia fraca ser metriz avel em subconjuntos limitadosdeL([t0, t]; R).steuer2008/3/11page 62iiiiiiii62 [CAP.3: CONTROLABILIDADENotequeS(; t0, t)econvexoecompactoporserumatransla c aoamde R(; t0, z0, t)(vejaTeorema38). OLema44garanteent aoqueM L([t0, t], R)ecompactoeconvexonatopologiafraca. Oteorema de KreinMilman nos permite concluir que Mpossui um pontoextremo,12que denominamos u. Provamos a seguir que u(t) q.s.em [t0, t].Da hipotese, segue que e um intervalo do tipo [a, b], com a, b < .Suponha por contradi c ao que u(t) , = a, b q.s. em [t0, t]. Ent ao,existeE [a, b] de medida (de Lebesgue) positiva tal que u(s) (a, b),para todos E. Denindo agoraEk:=s E [ u(s) (a +k1, b k1), k = 1, 2, . . .temos E = k=1Ek. Logo, ao menos um dos Ek possui medida positiva,de modo que existe > 0 eF Ede medida n ao nula tais que u(s) (a +, b ), s F.Como a medida deFe positiva, temos que Dim[L(F; R)] = . Logo,a aplica c aoIF: L(F; R) v _FZ1(s)b(s)v(s) ds Rnn aopodeser injetiva(por que?). Portanto, epossvel escolher vL(F; R) comv Ke(IF) ev , 0 emF. Estendendo trivialmentev aointervalo [t0, t], obtemos v :=_v(s), s F0, s [t0, t]/F,quesatisfazI( v) =0. Dividindo(senecessario)porumaconstante,temos [ v(s)[ 1 q.s. em [t0, t]. Logo, a u(s) v(s) b q.s., de modoque u v Uad(). A linearidade de I implica em I( u v) = I( u) = z,provando que u v M. Entretanto, isso contradiz o fato de u ser umponto extremo deM, pois u =12( u + v)+12( u v).12Umpontoedenominadoextremodeumconjuntoquandon aopodeserescritocomocombina c aolinearconvexadedoisoutrospontosdoconjunto. ParadetalhessobreoteoremadeKreinMilmanconsulte[Heu].steuer2008/3/11page 63iiiiiiii[SEC.3.7: PRINCIPIODOBANGBANGEPROBLEMASDETEMPOMINIMO 63Naseq uenciaanalisamos umafamliaparticular deproblemas decontroleotimo, quetemcomocaractersticaofatodafun c aoobjetivodepender unicamente do tempo nal. Tais problemas s ao denominadosproblemas de tempo mnimo (veja [HeLa], [Leig]).Dadas as fun c oes matriciaisA C([t0, ); Rn,n),b C([t0, ); Rn)e R convexo e compacto, considere o seguinte problema de controleescalar:(PTmin)___Minimizar t1sujeito azt=A(t)z +b(t)u(t) ;z(t0)=z0, z(t1)=z1 ; u Uad() ;onde z0, z1Rns aodadoseoconjuntodoscontrolesadmissveisedenido porUad() :=u L1loc([t0, ); R) [u(t) q.s.,Observe que o tempo nalt1n ao e xado e diferentes controles ad-missveispodematingiracondi c aodecontornonalemdiferentesin-tervalos de tempo. Este e um problema especial de controle otimo comtempo nal variavel, em que a fun c ao fun c ao objetivo _t1t0f(t, z, zt) dt eda formaf 1.A m de garantir a existencia de solu c oes para o problema (PTmin)(veja o Teorema 46), fazemos a seguinte hipotese sobre a controlabilidadedo sistema (A, B):H) Existemt1 t0eu Uad() tais que a trajetoria correspondentezusatisfazzu(t1) = z1.NotequeahipoteseH)garantequeoconjuntolimitadoinferiormenteT denido porT :=t1 t0 [ u Uad() comzu(t1) = z1e n ao vazio. O candidato natural `a solu c ao de (PTmin) e formado pelopar (t, u), onde t := inft1 T e u e o controle correspondente.Teorema46. Seahip oteseH) ev alida,ent aoexisteumcontrolead-missvel u Uad() tal que o estado correspondente z satisfaz z(t) = z1,onde t := inft1 T .steuer2008/3/11page 64iiiiiiii64 [CAP.3: CONTROLABILIDADEDemonstra c ao: Seja tn uma seq uencia minimal, i.e. t