Prévia do material em texto
INSTITUTO MILITAR DE ENGENHARIA CAP LEONARDO OLIVEIRA DE ARAÚJO IDENTIFICAÇÃO E CONTROLE DE ALGUMAS CLASSES DE SISTEMAS NÃO-ESTACIONÁRIOS Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para obtenção do título de Mestre em Ciências em Engenharia Elétrica. Orientador: Paulo César Pellanda, Dr. ENSAE Co-orientador: Roberto Ades, Dr PUC-Rio Rio de Janeiro 2006 c2006 INSTITUTO MILITAR DE ENGENHARIA Praça General Tibúrcio, 80-Praia Vermelha Rio de Janeiro-RJ CEP 22290-270 Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de arquivamento. É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliote- cas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem finalidade comercial e que seja feita a referência bibliográfica completa. Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es) e do(s) orientador(es). A663 Araújo, Leonardo Oliveira de Identificação e Controle de Algumas Classes de Sistemas Não-estacionários / Leonardo Oliveira de Araújo. - Rio de Janeiro : Instituto Militar de Engenharia, 2006. 146 p.: il, graf., tab. Dissertação (mestrado) - Instituto Militar de Engenharia- Rio de Janeiro, 2006. 1. Sistemas, identificação e controle. 2. Sistemas não- estacionários. I. Título. II. Instituto Militar de Engen- haria. CDD 621.319 2 INSTITUTO MILITAR DE ENGENHARIA CAP LEONARDO OLIVEIRA DE ARAÚJO IDENTIFICAÇÃO E CONTROLE DE ALGUMAS CLASSES DE SISTEMAS NÃO-ESTACIONÁRIOS Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para obtenção do título de Mestre em Ciências em Engenharia Elétrica. Orientador: Paulo César Pellanda, Dr. ENSAE Co-orientador: Roberto Ades, Dr PUC-Rio Aprovada em 31 de Janeiro de 2006 pela seguinte Banca Examinadora: Paulo César Pellanda, Dr. ENSAE do IME - Presidente Roberto Ades, Dr PUC-Rio do IME Geraldo Magela Pinheiro Gomes, Dr. ENSAE do IME Mario Cesar Mello Massa de Campos, Dr. ECP do CENPES Rio de Janeiro 2006 3 Àquele que é causa unívoca de todas as coisas, cha- mado por muitos nomes em tempos, locais e cul- turas diferentes: O Grande Arquiteto do Universo. 4 AGRADECIMENTOS Aos amigos e orientadores, Maj Paulo César Pellanda e Maj Roberto Ades, exemplos de dedicação, compromisso e notório saber, que sacrificaram inúmeras horas de lazer familiar para possibilitar a existência deste trabalho. Ao amigo Maj Juraci Ferreira Galdino pelas efetivas e claras orientações prestadas, ultrapassando os limites de sua área de atuação científica específica, que possibilitou uma abordagem de maior magnitude nesta dissertação. Ao professor Marcelo Vieira Corrêa que contribuiu significativamente com elucidações e arquivos de simulação para comparação de resultados sempre que solicitado, além de permitir a exploração da tese de doutorado de sua autoria. Ao Cel Ney Bruno por sua colaboração na modelagem do sistema do levitador mag- nético, do qual é o idealizador. À minha esposa, Rosane da Penha Andrade Araújo, pela compreensão e apoio du- rante este período de extrema dedicação e aplicação ao estudos no qual fiquei envolvido. Ao meu pai, José Alfredo de Araújo, e ao meu tio, Marlanfe Tavares Oliveira, pelos sábios conselhos que me conduziram a este momento. Ao Exército Brasileiro, em especial ao Instituto Militar de Engenharia, por esse investimento tão significativo. "Filho meu, não desprezes a instrução de tua mãe nem o ensinamento de teu pai, ouça os teus maiores porque isto será uma coroa grandiosa para tua cabeça." Provérbio, 1, 8 5 SUMÁRIO LISTA DE ILUSTRAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 LISTA DE SÍMBOLOS E ABREVIATURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.1 Contexto e Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.2 Objetivos da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2 FUNDAMENTOS TEÓRICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.2 Projeção Estável e Instável de uma Realização . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.3 Redução de Ordem por Truncamento Balanceado . . . . . . . . . . . . . . . . . . . . . . . . 27 2.4 Sistemas LPV e Quasi -LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.4.1 Modelagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.4.2 Análise de Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.5 Interpolação de Controladores Robustos de Estrutura Estimação-Controle . . 36 2.5.1 Formulação do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.5.2 Estrutura Estimação-Controle Equivalente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.5.3 Restrições Para a Seleção de Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.5.4 Parâmetro de Youla Dinâmico × Estático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.5.5 Continuação dos Subespaços Invariantes Selecionados . . . . . . . . . . . . . . . . . . . . 55 3 CONTRIBUIÇÕES PARA A IDENTIFICAÇÃO DE SISTEMAS 62 3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.2 Representações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 3.3 Identificação de Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.3.1 Identificação usando Amostras Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.3.2 Identificação usando a Resposta em Freqüência . . . . . . . . . . . . . . . . . . . . . . . . . . 67 3.4 Identificação de Sistemas quasi -LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.4.1 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 6 4 ESCALONAMENTO DE GANHOS EM ESTRUTURAS DO TIPO ESTIMAÇÃO-CONTROLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.2 Escolha Sistemática dos Modelos de Síntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 4.2.1 Definição das Faixas de Linearização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 4.2.2 Transição entre Faixas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.3 Escalonamento de Ganhos por Imposição da Dinâmica de Malha Fechada . . . 81 4.3.1 Considerações sobre a Modelagem Não-Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 4.3.2 Controlador e Observador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . 83 4.3.3 Controlabilidade e Observabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 4.3.4 Ajuste do Rastreamento e do Ponto de Operação . . . . . . . . . . . . . . . . . . . . . . . . 85 4.4 Escalonamento de Ganhos por Cancelamento de Não-Linearidades . . . . . . . . . 86 4.4.1 Modelagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 4.4.2 Cancelamento das Não-Linearidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5 APLICAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 5.1 Identificação de Modelos Lineares usando a Resposta Discreta no Tempo . . . 89 5.2 Identificação de Modelos Lineares usando a Resposta em Freqüência . . . . . . . 99 5.3 Identificação Quasi -LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5.4 Controle de um Míssil Ar-Ar via Continuação de Subespaços Invariantes . . . . 112 5.5 Controle de um Sistema de Levitação Magnética por Técnicas de Escalonamento de Ganhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 6 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 6.1 Contribuições para a Identificação de Sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . 126 6.2 Contribuições para o Controle por Escalonamento de Ganhos . . . . . . . . . . . . . 127 6.3 Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 7 REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 8 APÊNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 8.1 Apêndice 1: Modelo do Míssil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 8.2 Apêndice 2: Modelos Lineares Identificados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 8.3 Apêndice 3: Linearização do Modelo de um Levitador Magnético . . . . . . . . . . 145 7 LISTA DE ILUSTRAÇÕES FIG.2.1 Sistemas em malha fechada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 FIG.2.2 Parametrização de Youla e a estrutura estimação-controle . . . . . . . . . . . . 40 FIG.4.1 Curva f(x) e sua linearização em x = 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 FIG.4.2 Curva f(x) e suas linearizações em x = 6: intervalo 4 ≤ x ≤ 8. . . . . . . . . 78 FIG.4.3 Erros nos processos de linearização. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 FIG.4.4 Transição entre faixas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 FIG.5.1 Sinal v aplicado as plantas físicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 FIG.5.2 Resposta em freqüência (módulo e fase) da dinâmica da planta . . . . . . . . 90 FIG.5.3 Curvas de respostas ao degrau para: planta e modelo. Curva de erro entre as respostas do modelo e da planta: (A) Gm11(z), (B) Gm12(z), (C) Gm13(z) e (D) Gm14(z). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 FIG.5.4 Curvas de respostas ao degrau para: planta e modelo. Curva de erro entre as respostas do modelo e da planta: (A) Gr15(z), (B) Gr16(z), (C) Gm17(z) e (D) Gm18(z). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 FIG.5.5 Resposta em freqüência (módulo e fase) da dinâmica da planta . . . . . . . . 95 FIG.5.6 Curvas de respostas ao degrau para: planta e modelo. Curva de erro entre as respostas do modelo e da planta: (A) Gr21(z), (B) Gr22(z) e (C) Gr23(z). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 FIG.5.7 Curvas de respostas ao sinal v para: planta e modelo. Curva de erro entre as respostas medida e estimada: Gr24(z) . . . . . . . . . . . . . . . . . . 98 FIG.5.8 Resposta em freqüência (módulo e fase): comparação entre a planta e o modelo Gr32(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 FIG.5.9 Resposta em freqüência (módulo e fase): comparação entre a planta e o modelo Gm42(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 FIG.5.10 Resposta em freqüência (módulo e fase): comparação entre a planta e o modelo Gr52(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 FIG.5.11 Resposta em freqüência (módulo e fase): comparação entre a planta e o modelo Gm62(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 FIG.5.12 Resposta em freqüência: comparação das amostras com os valores fornecidos pelo modelo Gm72(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 8 FIG.5.13 Resposta em freqüência. Comparação das amostras com os valores fornecidos pelos modelos (A) Gm81(s), (B) Gr82(s) e (C) Gr83(s). . . . . . . . . 107 FIG.5.14 Entrada para validação do modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 FIG.5.15 Resposta da planta não-linear e do modelo identificado quasi -LPV de um míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 FIG.5.16 Resposta da planta não-linear e do modelo identificado quasi -LPV de um míssil entre 35s e 45s de vôo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 FIG.5.17 Estrutura de controle para o exemplo do míssil . . . . . . . . . . . . . . . . . . . . . . 113 FIG.5.18 Resposta ao degrau do sistema linearizado em malha fechada em três pontos de operação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 FIG.5.19 Resposta do sistema não-linear em malha fechada para três tipos de interpolação de controladores - aceleração . . . . . . . . . . . . . . . . . . . . . . . 119 FIG.5.20 Resposta do sistema não-linear em malha fechada para três tipos de interpolação de controladores - aceleração: ampliação de parte da FIG. 5.19. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 FIG.5.21 Resposta do sistema não-linear em malha fechada para três tipos de interpolação de controladores - ângulo de ataque . . . . . . . . . . . . . . . . . 120 FIG.5.22 Resposta do sistema não-linear em malha fechada para três tipos de interpolação de controladores - ângulo de ataque: ampliação de parte da FIG. 5.22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 FIG.5.23 Resposta do sistema não-linear em malha fechada para três tipos de interpolação de controladores - sinal de controle δc . . . . . . . . . . . . . . . 121 FIG.5.24 Resposta do sistema não-linear em malha fechada para três tipos de interpolação de controladores - sinal de controle δc: ampliação de parte da FIG. 5.23 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 FIG.5.25 Comparação das saídas controladas com o sinal de referência. . . . . . . . . . 123 FIG.5.26 Comparação entre os sinais de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 FIG.8.1 Diagrama físico do míssil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 FIG.8.2 Sistema de levitação magnética de uma esfera de aço . . . . . . . . . . . . . . . . . 145 FIG.8.3 Valores medidos experimentalmente em laboratório: f(N) × x(mm)× i(A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 9 LISTA DE TABELAS TAB.5.1 Dados referentes aos modelos identificados de GM1(s) . . . . . . . . . . . . . . . . 91 TAB.5.2 Valores dos coeficientes da FT contínua da planta utilizada . . . . . . . . . . . 94 TAB.5.3 Valores dos coeficientesda FT discreta da planta utilizada . . . . . . . . . . . . 94 TAB.5.4 Dados referentes aos modelos identificados . . . . . . . . . . . . . . . . . . . . . . . . . . 95 TAB.5.5 Custos referentes aos modelos identificados . . . . . . . . . . . . . . . . . . . . . . . . . 96 TAB.5.6 Valores da função custo da FT GM3(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 TAB.5.7 Valores da função custo da FT GM4(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 TAB.5.8 Valores da função custo da FT GM5(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 TAB.5.9 Valores da função custo da FT GM6(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 TAB.5.10 Valores da função custo da FT GM7(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 TAB.5.11 Valores dos coeficientes da FT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 TAB.5.12 Comparativo de custos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 TAB.5.13 Parâmetros do filtro W(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 TAB.5.14 Ganhos do controlador e do estimador aumentado . . . . . . . . . . . . . . . . . . 117 TAB.5.15 Pólos em malha fechada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 TAB.5.16 Distribuição dos pólos em malha fechada . . . . . . . . . . . . . . . . . . . . . . . . . . 118 TAB.8.1 Valores dos coeficientes da FT Gm21(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 TAB.8.2 Valores dos coeficientes da FT Gr21(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 TAB.8.3 Valores dos coeficientes da FT Gm22(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 TAB.8.4 Valores dos coeficientes da FT Gr22(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 TAB.8.5 Valores dos coeficientes da FT Gm23(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 TAB.8.6 Valores dos coeficientes da FT Gr23(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 TAB.8.7 Valores dos coeficientes da FT Gm24(z) = Gr24(z) . . . . . . . . . . . . . . . . . . . . . 142 TAB.8.8 Valores dos coeficientes da FT Gm81(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 TAB.8.9 Valores dos coeficientes da FT Gm82(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 TAB.8.10 Valores dos coeficientes da FT Gr82(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 TAB.8.11 Valores dos coeficientes da FT Gm83(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 TAB.8.12 Valores dos coeficientes da FT Gr83(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 TAB.8.13 Diferenças entre as curvas do gráfico força × deslocamento (não- linear) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 10 LISTA DE SÍMBOLOS E ABREVIATURAS R - conjunto dos números reais C - conjunto dos números complexos Rn - conjunto dos vetores reais de dimensão n Rm×n - conjunto das matrizes reais m× n j - índice ou j= √−1 ∈ e ∈ - pertence e não pertence , - por definição ≈ e ∼= - aproximadamente igual a × - produto cartesiano ∃ - existe ∀ - para todo | - tal que → - tendendo a =⇒ - implica em co - envelope convexo: para Si ∈ Rm×n, i = 1, 2, ..., N, co{S1, S2, ...SN} , { ∑N i=1 αiSi : αi ≥ 0, ∑N i=1 αi = 1} |α| - valor absoluto de α ∈ R ou de α ∈ C spec(M) - espectro da matriz M ∈ Rn×n : {λi(M) : i = 1, ..., n} Re(α) - parte real de α ∈ C In - matriz indentidade n× n MT - transposta da matriz M M−1 - inversa da matriz M M † - pseudo-inversa, ou inversa de Penrose-Moore, da matriz M σ(M) - valor singular máximo σ(M) - valor singular mínimo de M ‖α‖2 - Norma 2 de α ∈ Cn x(t) - vetor de sinais contínuos, onde para ∀t, x ∈ Rn x(k) - sinal x ∈ Rn no instante (discreto) k s - variável de Laplace z - variável da transformada Z para os sistemas discretos w - freqüência em rad/s θ(t) - variável de interpolação 11 G(z) = A B C D realização em espaço de estados da função de transferência discreta G(z) = C(zI − A)−1B + D G(s) = A B C D realização em espaço de estados da função de transferência con- tínua G(s) = C(sI − A)−1B + D 12 SIGLAS LTI Linear Invariante no Tempo LTV Linear Variante no Tempo LPV Linear a Parâmetros Variáveis LFT Transformação Linear Fracionária (do inglês Linear Fractional Transformation) LMI Desigualdade Matricial Linear LQG Gaussiano Quadrático Linear LQ Quadrático Linear FT Função de Transferência PRCBI Parameter Robust Control by Bayesian Identification TF Transformada de Fourier DFT Transformada discreta de Fourier (do inglês Discrete Fourier Transform) FFT Transformada rápida de Fourier (do inglês fast Fourier transform) NARMAX Modelo não-linear auto-regressivo, de média móvel com entradas exógenas (do inglês nonlinear autoregressive moving average model with exogenous input) 13 RESUMO Esta dissertação apresenta a identificação e o controle de uma classe de sistemas dinâmicos não-estacionários com representação quasi-LPV. Técnicas de identificação são definidas e simuladas. Três metodologias do tipo escalonamento de ganhos clássico são desenvolvidas. As duas primeiras técnicas de identificação exploradas são lineares. Uma fornece como resultado uma função de transferência discreta e a outra resulta em uma função de transferência contínua. A terceira técnica permite a identificação de sistemas dinâmicos quasi -LPV e depende de uma identificação preliminar de pontos de operação do sistema. Esta última metodologia é aplicada com sucesso na identificação de um modelo não-linear realista de um míssil ar-ar. Em relação às técnicas de controle, a primeira contribuição do trabalho é possibi- litar uma escolha sistemática da família de modelos de síntese de controladores LTI a ser interpolada, para uma planta não-linear. A segunda técnica apresentada utiliza uma abordagem quasi -LPV para modelar o sistema. Através de uma realimentação de esta- dos estimados, o objetivo é fixar os autovalores de matriz dinâmica de malha fechada. A terceira metodologia busca o cancelamento do comportamento não-linear de uma mode- lagem restrita de sistemas não-estacionários. Os resultados das simulações não-lineares indicam a eficiência das técnicas apresenta- das para a identificação e o controle de sistemas dinâmicos não-estacionários que possuam representação quasi-LPV. 14 ABSTRACT This dissertation deals with the identification and the control of nonlinear dynamical systems having a quasi-LPV representation. Techniques for identification are given and simulated. Three methodologies of classic gain scheduling are developed. The two first identification techniques are linear. One of them obtains a discrete transfer function as a solution and the other one results in a continuous transfer func- tion. The third method allows the identification of quasi-LPV dynamical systems and is dependent of a set of LTI plant known a priori. This technique is applied to the identification of a realistic nonlinear model of an air-to-air missile. As a with regard to control technique, the first contribution is a method systematic choice of a set of LTI controller synthesis models to be scheduled for a nonlinear plant. The second technique use a quasi-LPV description of a system. The objetive is to fix the eigenvalues of the closed-loop dynamic matrix by using a parameter dependent state feedback law. The third control method aims to cancel nonlinearities for a restricted nonlinear plants state feedback. The nonlinear simulation results indicate that the techniques presented in this work are efficient for the identification and the control of nonlinear dynamical systems having a quasi-LPV representation. 15 1 INTRODUÇÃO 1.1 CONTEXTO E MOTIVAÇÃO O desenvolvimento da engenhariade controle está intrinsecamente ligada à constru- ção e análise de modelos que visam reproduzir, o mais fielmente possível, comportamentos observados na natureza. Tais modelos possibilitam validar teorias e mostrar o funciona- mento da dinâmica observada. Nos estudos de átomos, do sistema nervoso humano ou de uma galáxia, por exemplo, modelos são fundamentais e indispensáveis. Dentre os diversos modelos usados no decorrer da história da humanidade, o mo- delo matemático destaca-se no atual contexto científico. Este modelo é definido por um conjunto de equações diferenciais (tempo contínuo) ou equações de diferenças (tempo discreto) que descrevem a dinâmica de uma planta física a ele relacionado. A complexi- dade da modelagem, de forma geral, aumenta a medida que o nível de precisão requerida na representação das dinâmicas envolvidas é maior. Os modelos matemáticos permitem correlacionar causas e efeitos (AGUIRRE, 2000a), possibilitando a análise dos dados observados. Porém, a modelagem exata e precisa de toda a física de uma planta é de altíssima complexidade, senão impossível. No entanto, dentro de tolerâncias pré-estabelecidas para cada caso, um modelo que tenha sucesso na reprodução do comportamento de uma planta estudada é fundamental na engenharia, em particular para as técnicas de controle. Um sistema dinâmico tem sua análise feita geralmente nos domínios do tempo e da freqüência. Por esse motivo, os métodos de identificação de plantas podem ser divididos em (LJUNG, 1987): • Métodos Paramétricos; • Métodos Não-Paramétricos; • Métodos no Domínio da Freqüência. A técnica paramétrica assume que a estrutura do modelo do sistema é conhecida com base nas leis físicas que regem a sua dinâmica, embora os parâmetros sejam considerados desconhecidos. Por outro lado, a técnica não-paramétrica é necessária quando a estrutura do modelo matemático não está disponível. O resultado dessa técnica não é um modelo 16 matemático, mas uma representação gráfica que caracteriza a dinâmica do sistema em estudo (AGUIRRE, 2004). Por último, as técnicas no domínio da freqüência geram modelos que mostram a evolução da dinâmica identificada nesse domínio, utilizando a transformada de Fourier (HOUGEN, 1972). Há ainda a possibilidade de se aplicar outras transformadas que possibilitem a iden- tificação do sistema dinâmico analisado. Como exemplo, pode ser citada a identificação utilizando a transformada Wavelets que é descrita em (COCA, 1995a,b, 1996a; BAKSHI, 1993), que são trabalhos precursores no desenvolvimento dessa técnica. Portanto, a mo- delagem no domínio da freqüência é uma particularidade de uma modelagem no domínio de uma determinada transformada. Por serem mais simples, os modelos lineares foram fundamentais no desenvolvimento de técnicas de identificação. Em contraste com a complexidade apresentada pelos mo- delos não-lineares, o uso de modelos lineares é justificável (BILLINGS, 1980) pela sua simplicidade, facilidade de obtenção e por possuírem um amplo ferramental matemático na engenharia de controle. Esses modelos podem ser empregados em faixas operativas restritas, ou seja, próximos dos pontos de operação onde o modelo foi validado. A necessidade de obtenção de modelos mais precisos do comportamento de sis- temas dinâmicos levou a uma modelagem que considera faixas mais amplas de operação (BILLINGS, 1980). Em conseqüência, as equações obtidas nessa nova modelagem con- sideram as não-linearidades dos modelos. Aponta-se ainda a dificuldade de identificar os sistemas não-lineares e a impossibilidade da indicação de uma técnica que seja capaz de apresentar soluções gerais aceitáveis. O desenvolvimento dos modernos computadores e a disponibilização de um amplo ferramental matemático são aliados poderosos na mani- pulação e análise dos dados medidos em plantas dessa natureza. Em (CORRÊA, 2001), são ressaltados os estudos feitos na década de oitenta sobre a identificação de sistemas dinâmicos não-lineares, dando particular atenção às técnicas de representação NARMAX (do inglês Nonlinear Autoregressive Moving Average Model with Exogenous Input) polinomial (LEONTARITIS, 1985), NARMAX racional (BILLINGS, 1989) e redes neurais (NARENDA, 1990). Na década seguinte, aquele mesmo autor cita diversos trabalhos de identificação de plantas com modelos não-lineares1, bem como apresenta as motivações e técnicas empregadas nos trabalhos desenvolvidos. Neste contexto, o uso de informações a priori é enfatizada, pois provoca o surgimento 1Ver (BILLINGS, 1989; VALLVERDU, 1992; NOSHIRO, 1993; PRÖLL, 1994; JANG, 1994; ?; CU- BILLOS, 1997; GENÇAY, 1997; TSOI, 1999) . 17 de uma nova classificação de modelagem. Segundo (CORRÊA, 2001), dependendo do nível e/ou tipo de informação utilizada a priori, as técnicas de obtenção de modelos passam a ser classificadas como (HERBERT, 1993; SJÖBERG, 1995; BOHLIN, 1995): • modelagem caixa-branca; • modelagem caixa-cinza; • modelagem caixa-preta. A modelagem caixa-branca, segundo (GARCIA, 1997), engloba os casos onde os dados de entrada e saída do sistema são dispensáveis, pois o comportamento da dinâmica do sistema é equacionado a partir do conhecimento da estrutura da planta. Nesse caso, os parâmetros envolvidos possuem um significado físico. A modelagem caixa-preta, por sua vez, é atribuída quando os modelos são gerados baseando-se exclusivamente na análise das relações entre entradas e saídas do sistema dinâmico. Nesse contexto, não há informações a priori, uma vez que a estrutura da planta é ignorada. Vantagens e desvantagens são apontadas em ambos os tipos de modelagens, como pode ser visto em (POTTMANN, 1998) e (TIKHONOV, 1977) para caixas-brancas e caixas-pretas, respectivamente. Entre esses dois casos extremos, a modelagem caixa-cinza agrega parte de ambos os tipos: usa a relação entre entrada(s) e saída(s) medidas e informações a priori. Segundo (JORGENSEN, 1995) essa modelagem é definida como: “a ciência de construção de modelos que incorpora conhecimento a priori do sistema com um certo grau de incerteza na seleção da estrutura da representação”. Em (SJÖBERG, 1995), a modelagem em caixa-cinza é dividida em: • Modelagem física: quando o modelo é determinado pelo conhecimento da estrutura do sistema e sua dinâmica física/química, sendo estimados apenas os parâmetros, ou parte destes, com o uso de medições; • Modelagem semi-física: quando as informações medidas são usadas para sugerir combinações não-lineares entre os sinais medidos, sendo que a escolha da estrutura do modelo é fruto da análise destas informações. Nota-se que na modelagem física, o modelo parametrizado e a modelagem caixa- branca têm definições semelhantes. Sendo assim, as demais definições da classificação podem ser entendidas como modelagem caixa-cinza. As vantagens da modelagem caixa-cinza são relacionadas em (CORRÊA, 2001), com base em trabalhos de outros autores, enfatizando: 18 • os prováveis benefícios no projeto de controladores avançados que necessitam da descrição adequada dos processos; • o uso de informações a priori, que diminui efetivamente o número de parâmetros a serem estimados, tornando o problema melhor condicionado com modelos menos incertos, mesmo com relativa escassez de dados; • a possibilidade do uso da informação a priori, pode vir a se tornar um meio para escolha diante das diversas possibilidades de representações matemáticas na mode- lagem de sistemas dinâmicos não-lineares. Em (GOLDFREY, 1986; AGUIRRE, 2000b,a; CORRÊA, 2001), é evidenciado que trabalhos em caixa-preta se mostram bem caracterizados localmente, mesmo que a planta física identificada seja não-linear. A incorporação de informações a priori possibilita que o modelo tenha uma faixa de correspondência, em relação à planta, mais abrangente, com pouca perda de precisão e melhora a medida que toda a faixa de trabalho é excitada pela entrada. Por fim, é dado ênfase ao papel das informações a priori na seleção de representaçõesmatemáticas para o processo de modelagem. Um outro desafio deste estudo é usar técnicas de controle já consagradas ou aqui desenvolvidas para controlar as plantas cujo modelos apresentem não-linearidades ou sejam lineares a parâmetros variáveis. Um sistema linear pode ser considerado variante no tempo ou não-estacionário − Linear a Parâmetros Variantes (LPV) ou Linear Variante no Tempo (LTV, do inglês Linear Time Variant) − quando um ou mais parâmetros do seu modelo variam ampla- mente com o tempo e não podem ser considerados como parâmetros incertos. Muitas vezes, os sistemas não-lineares comumente encontrados na prática podem ser tratados como sistemas lineares não-estacionários. Tradicionalmente, o controle de sistemas não-estacionários é realizado, na prática, pelo uso de técnicas de escalonamento de ganhos (ou interpolação de controladores2). O principal objetivo desses métodos é controlar um sistema que evolui num amplo domínio de funcionamento, para o qual as técnicas de controle robusto Linear Invariante no Tempo (LTI, do inglês Linear Time Invariant) se mostram ineficazes. Além de permitirem a incorporação de propriedades de robustez em estabilidade face às incertezas do sistema, 2O termo em inglês gain-scheduling costuma ser traduzido para a língua portuguesa como “tabela- mento de ganho” ou “escalonamento de ganho”. Neste trabalho é adotada a expressão “escalonamento de ganho”. Para a tradução da palavra scheduling, é adotada a palavra “interpolação” ou “escalonamento”. 19 os controladores interpolados possuem outra característica favorável importante que é a adaptação em tempo real do seu comportamento dinâmico, segundo a evolução dos parâmetros (endógenos ou exógenos) que caracterizam as condições de funcionamento do sistema. Essas técnicas ampliam o alcance dos métodos clássicos de controle robusto LTI, que consideram somente as características lineares locais e condições particulares de funcionamento do sistema. Este benefício da estratégia de controle por escalonamento de ganhos é uma conseqüência da explícita utilização de informações adicionais importantes oriundas da medida dos parâmetros variantes. O escalonamento de ganhos é uma técnica bastante eficaz no controle de sistemas não-estacionários. Desde as primeiras publicações sobre o assunto, há cerca de trinta anos atrás, essa técnica tem sido aplicada em várias áreas. Apesar dessa prática ter se difundido em larga escala, só recentemente o interesse teórico sobre ganhos escalonados para sistemas LPV e sistemas não-lineares têm aumentado significativamente (SHAMMA, 1990; SHAHRUZ, 1992; KAMLER, 1995). O desenvolvimento de novos métodos de interpolação de controladores tem desper- tado grande interesse na comunidade científica pela ampla diversidade de suas aplicações e pelo surgimento de técnicas modernas de controle robusto. Contudo, os métodos mais utilizados no meio industrial são aqueles chamamos de “clássicos”, “convencionais” ou “tradicionais”. Eles se baseiam em um conjunto de modelos LTI obtidos a partir da fi- xação do parâmetro variante de um modelo originalmente LPV ou LTV por linearização de um modelo não-linear em torno de uma família de pontos de operação3. Um con- junto de técnicas de controle linear (LQG, PRLQG, PRCBI, H2, H∞, síntese µ , etc., e suas variantes) está, então, disponível para o projeto de uma família de controladores LTI que ofereçam um compromisso razoável entre o desempenho e a robustez em esta- bilidade em torno das condições de funcionamento dadas. Quanto as estratégias para a interpolação, elas variam bastante segundo o método de síntese linear e a estrutura dos controladores LTI escolhidos e são, na maioria das vezes, intuitivas e baseadas em uma diretiva heurística principal: os controladores lineares são supostos suficientemente próxi- mos para permitir transições suaves e para assimilar os comportamentos não-estacionários provenientes das não-linearidades do sistema. A interpolação é baseada na medida de um parâmetro que define os pontos de ope- ração do sistema acarretando o ajuste da FT (Função de Transferência) que modela o 3Ver (SHAMMA, 1990; RUGH, 1991; KELLET, 1991; REICHERT, 1992; HYDER, 1993; NICHOLS, 1993; KAMLER, 1995; LAWRENCE, 1995; STILWELL, 1997) . 20 sistema ou dos elementos das matrizes A,B,C e D do modelo em espaço de estado. Entre as estratégias de interpolação mais utilizadas, encontram-se aquelas que atuam sobre os coeficientes de funções de transferência (NICHOLS, 1993), ou sobre os coeficientes de realizações de estado (KELLET, 1991; HYDER, 1993), ou ainda, quando se tratar de um conjunto de controladores lineares robustos H2 ou H∞, soluções de equações de Ric- cati (REICHERT, 1992). O controlador interpolado convencional é, então, um sistema não-estacionário (LPV ou não-linear), obtido por interpolação (linear, fuzzy, ou outra qualquer) de controladores LTI em relação às variáveis de interpolação. A interpolação clássica de controladores apresenta dificuldades teóricas no que se refere à estabilidade e ao desempenho durante as transições entre os controladores locais, em parte devido à forte dependência do comportamento do sistema global em relação à estratégia de interpolação utilizada. Além disso, as etapas de síntese dos controladores e a formulação da lei de interpolação são conduzidas separadamente, o que não garante que o sistema não-estacionário em malha fechada seja estável e que o desempenho apre- sentado em torno dos pontos de projeto prevaleçam de uma forma global. Simulações exaustivas, inclusive simulações hardware-in-the-loop, são em geral efetuadas para avaliar o comportamento do sistema controlado em regime não-estacionário. Devido a estas dificuldades, poucos resultados teóricos em escalonamento de ganhos convencionais têm sido publicados. Em (SHAHRUZ, 1992), um algoritmo para interpo- lação linear de ganhos por realimentação de estados é proposto. Em (STILWELL, 2000), os autores apresentam dois métodos para interpolação de controladores por escalona- mento de ganhos: o primeiro apresenta fatores coprimos de funções de transferências e o segundo é baseado na descrição em espaço de estado. Em (STILWELL, 1999), os ganhos de realimentação e de observação de estados são interpolados no contexto do escalona- mento de ganhos. Essas técnicas garantem, com certo grau de conservadorismo e sob restrição de variação lenta do parâmetro, a estabilidade exponencial local do sistema em malha fechada. Atualmente, a interpolação de controladores é também tratada no contexto do con- trole LPV (LU, 1992; BECKER, 1993; PACKARD, 1994; LU, 1995; BECKER, 1995; APKARIAN, 1995a,b; WU, 1996; SCHERER, 1996; APKARIAN, 1998a,b; KAJIWARA, 1999; TUAN, 1999), onde funções de Lyapunov são utilizadas para definir a estabilidade e o desempenho para uma larga faixa de variação do parâmetro. Na verdade os ter- mos “controle LPV” ou “interpolação LPV” são utilizados para designar as técnicas de interpolação de controladores onde as necessidades práticas da interpolação, ou seja, a 21 estabilidade e o desempenho, são satisfeitos de uma forma sistemática dentro de um con- texto de otimização convexa sob restrições do tipo Desigualdade Matricial Linear (LMI - do inglês Linear Matrix Inequality). Os métodos de interpolação LPV distinguem-se das técnicas de interpolação, mais pela sua maneira sistemática de tratar o problema, do que pelo seu objetivo. Do ponto de vista conceitual, a interpolação do tipo LPV é, no entanto, muito diferente, já que as questões relacionadas à estabilidade e ao desempenho em tempo variante são considera- das diretamente na síntese dos controladores LPV. A tarefa mais exigente consiste em resolver problemas de otimização do tipo LMI. Isso é relativamente fácil utilizando-se os códigos de programação semi-definida disponíveis atualmente. Trata-se, na realidade, de uma extensão dos métodos de controle robusto LTI, do tipo H2 e H∞, aos sistemas não- estacionáriosLPV ou quasi -LPV. Em suma, as técnicas LPV são igualmente aplicáveis a modelos por natureza LTV ou LPV, a modelos linearizados (parametrizados por va- riáveis de interpolação) ou a modelos quasi -LPV. Estas vantagens explicam o repentino interesse nos últimos anos por esse tipo de técnica (BECKER, 1993; PACKARD, 1994; APKARIAN, 1995a; SCHERER, 1996; KAJIWARA, 1999). Apesar dos esforços e desenvolvimentos teóricos recentes, alguns problemas delicados persistem, não apenas na interpolação convencional, mas também na interpolação LPV. Percebe-se que, entre as raras técnicas clássicas que garantem teoricamente a estabilidade não-estacionária, uma boa parte é essencialmente baseada na interpolação de matrizes de estado ou de ganhos de estruturas estimação-controle (observer-based structures) de controladores LTI ótimos robustos ou de controladores ótimos LQ (Quadrático Linear) ou LQG (Gaussiano Quadrático Linear). Uma dificuldade importante reside no fato que o comportamento dinâmico dos controladores interpolados depende de uma forma crítica das representações de estado adotadas para a família de controladores lineares projetados sobre um conjunto de pontos de operação. Assim, as primeiras questões que se apresentam são: • Como escolher um conjunto de bases no espaço de estado que conduza a realizações de controladores locais apropriados para a interpolação? • Qual o melhor conjunto de pontos de operação sob a ótica da interpolação? Em relação às técnicas LPV, algumas são potencialmente muito conservadoras, pois utilizam funções de Lyapunov independentes dos parâmetros do sistema, toleram taxas 22 arbitrárias de variação desses parâmetros e exigem classes específicas e restritivas de repre- sentações LPV (LU, 1992; BECKER, 1993; APKARIAN, 1995a,b; LU, 1995; SCHERER, 1996; APKARIAN, 2000; PELLANDA, 2002a). Outras, ao contrário, utilizam funções de Lyapunov dependentes dos parâmetros, consideram limites realistas da taxa de variação dos parâmetros e toleram uma dependência paramétrica geral do sistema (BECKER, 1995; WU, 1996; APKARIAN, 1998a,b; TUAN, 1999). Estas são muito pouco conser- vadoras, mas introduzem uma grande complexidade na implementação do controlador interpolado. Esta dissertação aborda o estudo, o aprimoramento e o desenvolvimento de técnicas de escalonamento de ganhos clássicas, com uma orientação particular para o caso da realimentação de estados e da estrutura estimação-controle, aplicáveis em diversas áreas no campo da engenharia de controle. Um enfoque especial é também dado ao desen- volvimento de novos algoritmos de identificação do tipo caixa-preta aplicáveis a sistemas lineares e do tipo caixa-cinza aplicáveis a sistemas não-lineares. 1.2 OBJETIVOS DA DISSERTAÇÃO Os objetivos deste trabalho são: a) Desenvolver novos algoritmos de identificação dos tipos caixa-preta e caixa-cinza, para sistemas lineares e não-lineares (quasi -LPV), baseados no emprego de amostras discretas dos sinais de entrada e saída da planta física nos domínios do tempo e da freqüência; b) Aprimorar a metodologia de escalonamento de ganhos clássico desenvolvido em (PELLANDA, 2001) de modo a equipá-lo com um método de escolha sistemática de um conjunto de pontos de síntese, a fim de aproximar o modelo não-linear da planta em toda uma faixa de operação; c) Desenvolver novas metodologias clássicas de escalonamento de ganhos baseadas na realimentação de estados e na estrutura estimação-controle para algumas classes de sistemas não-estacionários. 1.3 ORGANIZAÇÃO DA DISSERTAÇÃO Além desta introdução, a dissertação está organizada em mais 6 capítulos, além de um apêndice: 23 • O Capítulo 2 recorda os principais fundamentos que permitem entender o desen- volvimento das contribuições desta dissertação. • O Capítulo 3 apresenta as contribuições deste trabalho para a identificação de sistemas. São apresentadas três novas metodologias baseadas na buscas de um modelo que minimize um custo quadrático representativo do erro de estimação. Duas delas são apropriadas para a identificação de modelos LTI e a outra é aplicável a uma classe de sistemas não-lineares, fornecendo modelos não-estacionários do tipo quasi -LPV. Todas as técnicas desenvolvidas apresentam solução analítica ao problema de minimização do erro de estimação. • O Capítulo 4 apresenta o processo de escalonamento de ganhos desenvolvido em (PELLANDA, 2001) e propõe um método de escolha sistemática de um conjunto de pontos de síntese que melhor aproxime o modelo não-linear da planta em toda uma faixa de operação sendo, portanto, mais apropriado para o escalonamento de ganhos. Apresenta também duas novas metodologias clássicas de escalonamento de ganhos baseadas na realimentação de estados e na estrutura estimação-controle. • No Capítulo 5 são ilustradas as técnicas apresentadas nos Capítulos 3 e 4 através de diversas aplicações numéricas. • O Capítulo 6 traz as conclusões tiradas a partir dos resultados obtidos ao longo deste trabalho e aponta algumas perspectivas futuras. • No Capítulo 7 são apresentadas as referências bibliográficas. • No Apêndice encontram-se os modelos utilizados e identificados no Capítulo 5. 24 2 FUNDAMENTOS TEÓRICOS 2.1 INTRODUÇÃO Neste capítulo são revistos alguns fundamentos teóricos e propriedades necessárias para o entendimento dos trabalhos apresentados nos capítulos posteriores. A aplicação das técnicas de identificação linear proposta nesta dissertação em plan- tas físicas estáveis podem gerar modelos que apresentem pólos instáveis. Nestes casos, também são gerados zeros localizados no plano s sobre esses pólos ou muito próximos deles, acarretando um modelo de ordem não-mínima. Porém, como é sabido que as funções identificadas são estáveis, torna-se interessante decompor o modelo identificado na soma de suas partes estável e antiestável (ou instável), ignorando esta última e apli- cando à primeira uma redução de ordem por truncamento balanceado. Assim, elimina-se o problema da ordem não-mínima causado pela parte instável e se obtém um modelo final estável de ordem reduzida. As Seções 2.2 e 2.3 apresentam o suporte teórico dessas operações. Na Seção 2.4 discute-se os conceitos sobre sistemas LPV e quasi -LPV, úteis para o entendimento das técnicas propostas na Seção 3.4 e no Capítulo 4, que tratam, res- pectivamente, da identificação e do controle por escalonamento de ganhos de sistemas não-estacionários. Por fim, a Seção 2.5 apresenta uma metodologia de interpolação clássica de contro- ladores dinâmicos predeterminados sob a forma estimação-controle (PELLANDA, 2000, 2001, 2002b), onde os ganhos de realimentação e de estimação de estado são os parâme- tros interpolados. Contudo, sabe-se que uma dificuldade da interpolação clássica é o fato do comportamento dinâmico dos controladores interpolados depender fortemente das re- presentações de estado adotadas para a família de controladores LTI projetados sobre o conjunto de pontos de operação escolhido. A técnica apresentada uma seqüência de trans- formações de similaridade a serem aplicadas à família original de controladores robustos determinados a priori, de forma que o conjunto de controladores obtidos, equivalentes aos primeiros do ponto de vista entrada-saída, tenha uma estrutura coerente, fisicamente in- terpretável e de fácil interpolação. Depois da transformação, os controladores apresentam uma estrutura do tipo estimação-controle, o que facilita a interpolação e a implementação em tempo variante. O método pode ser aplicado em controladores discretos ou contínuos, 25 de ordem completa ou aumentada e, em particular, aos projetados através de técnicas de controle robusto H2, H∞ e síntese µ, cuja interpolação é, em geral, de difícil obtenção sem perdas consideráveis de desempenho. 2.2 PROJEÇÃO ESTÁVEL E INSTÁVEL DE UMA REALIZAÇÃO Seja G(s) o modelo obtido, descrito pela seguinte realização de estado G(s) = A B C D (2.1) onde A ∈ Rn×n, B ∈ Rn×p, C ∈ Rq×n eD ∈ Rq×p. Este modelo pode ser reescrito como G(s) = G(s)+ + G(s)− (2.2) onde G(s)+ e G(s)− correspondem, respectivamente, às projeções de G(s) nos semi-planos da direita e esquerda do plano s. Definindo as matrizes destas realizações, G(s)+ e G(s)−, como G(s)− = A11 B1 C1 D (2.3) e G(s)+ = A22 B2 C2 0 (2.4) pode-se afirmar que: G(s) = G(s)+ + G(s)− = A11 0 0 A22 B1 B2 C1 C2 D = Ā B̄ C̄ D (2.5) onde A11 ∈ Rk×k e as demais matrizes são de dimensões compatíveis sendo k o número de autovalores estáveis. Definindo P ∈ Rn×n como a matriz de transformação de similaridade tal que P−1AP = Ā, P−1B = B̄, CP = C̄ (2.6) o problema de encontrar a decomposição desejada é resolvido ao se calcular P . 26 Aplicando uma decomposição de Schur na matriz A [ A11 A12 0 A22 ] = UT AU = T (2.7) onde UT U = I e T é a matriz triangular superior que possui os autovalores da matriz A em sua diagonal com estes dispostos em ordem crescente, e sendo X uma matriz de dimensões compatíveis tal que Ā = [ I1 −X 0 I2 ][ A11 A12 0 A22 ][ I1 X 0 I2 ] = [ A11 A12 −XA22 0 A22 ][ I1 X 0 I2 ] Ā = [ A11 A11X −XA22 + A12 0 A22 ] (2.8) chega-se a: A11X −XA22 + A12 = 0 (2.9) O problema se reduz, ao cálculo de uma solução X para a equação de Lyapunov em (2.9). Adotando-se a seguinte partição: U = [ U1 U2 ] , de forma que U1 ∈ Rk×k, pode-se reescrever o produto matricial P−1AP na forma [ I1 −X 0 I2 ][ UT1 UT2 ] A [ U1 U2 ] [ I1 X 0 I2 ] = [ UT1 −XUT2 UT2 ] A [ U1 U1X + U2 ] = P−1AP (2.10) Assim, tem-se também: [ B1 B2 ] = [ UT1 −XUT2 UT2 ] B = [ (UT1 −XUT2 )B UT2 B ] (2.11) e [ C1 C2 ] = C [ U1 U1X + U2 ] = [ CU1 C(U1X + U2) ] (2.12) o que define completamente a projeção estável G(s)− do modelo inicialmente identificado G(s). 2.3 REDUÇÃO DE ORDEM POR TRUNCAMENTO BALANCEADO Seja Gke(s), a parte estável, de ordem k, do modelo identificado G(s). O ajuste do modelo Gke(s) aos dados fornecidos pelo sistema real pode acarretar uma ordem maior 27 que a necessária (k∗ = k−r). Uma função estimada não deve possuir uma ordem tão ele- vada a ponto de acrescentar redundâncias, nem tão baixa a ponto de perder informações relevantes. A resposta em freqüência pode ser utilizada para comparar o grau de proxi- midade entre o sistema real e o modelo obtido, permitindo avaliar se a ordem do modelo é compatível. Caso um modelo tenha sido encontrado com um valor de k elevado, existe a possibilidade de se aplicar uma técnica para redução de sua ordem. Ou seja, pode se encontrar um novo modelo de ordem reduzida, Gk−re (s), que preserve o ajuste anterior de acordo com algum critério. O modelo final Gk−re (s) deve ser parcimonioso. De acordo com (SKOGESTAD, 1997), uma realização balanceada é uma realização assintoticamente estável, na qual os Gramianos de controlabilidade e observabilidade são iguais e também são diagonais. Considerando a seguinte realização estável de G(s): G(s) = A B C D (2.13) A realização em (2.13) é denominada balanceada se as soluções para as seguintes equações de Lyapunov: AP + PAT + BBT = 0 AT Q + QA + CT C = 0 (2.14) são tais que: P = Q = diag(σ1, σ2, . . . , σk) , Σ, onde σ1 ≥ σ2 ≥ σ3 ≥ . . . ≥ σk ≥ 0. Os Gramianos de controlabilidade e observabilidade, respectivamente P e Q são definidos por: P , ∫∞ 0 eAtBBT eA T tdt Q , ∫∞ 0 eA T tCT CeAtdt (2.15) Neste caso ∑ é dito Gramiano de G(s). Os σi são denominados de valores singulares de Hankel de G(s), sendo definidos por (2.16): σi , λ 1 2 i (PQ) (2.16) onde {λi ; i = 1, . . . , k} são os autovalores de A. Cada valor σi está associado a um estado xi da realização balanceada do sistema. O valor σi se constitui numa medida da contribuição que o estado xi tem no comportamento de entrada e saída do sistema. Em resumo, se σi >> σi+1, então o estado xi afeta o comportamento de entrada e saída para o sistema muito mais do que xi+1, permitindo calcular uma estimativa de erro em um modelo reduzido onde os r estados {xi+1, . . . , xk} tenham sido descartados. A implementação para obtenção de modelos de ordem reduzida foi feita a partir da função balmr do Matlab. 28 2.4 SISTEMAS LPV E QUASI -LPV 2.4.1 MODELAGEM Uma classe importante de sistemas dinâmicos não-estacionários pode ser represen- tada por um conjunto de equações diferenciais não-lineares de ordem qualquer. Para uma escolha apropriada dos vetores das variáveis de estado x(t) ∈ Rn, de entrada u(t) ∈ Rm e de saída y(t) ∈ Rp, pode-se freqüentemente obter um modelo não-linear em relação aos estados, mas linear em relação à entrada, que implique em uma equação matricial diferencial de primeira ordem e uma equação matricial algébrica: ẋ(t) = A(θx, θp)x + B(θx, θp)u y(t) = C(θx, θp)x + D(θx, θp)u (2.17) As funções matriciais reais A(.), B(.), C(.) e D(.) são supostas contínuas e limi- tadas, de dimensões compatíveis com as dimensões dos sinais e definem completamente a dinâmica do sistema. Este tem uma característica não-linear e não-estacionária originada pelas variáveis θx e θp: • θx(x(t)) ∈ Rr1 é uma variável endógena, ou seja, que depende da dinâmica interna do sistema e que o torna não-linear; • θp(x(t)) ∈ Rr2 é um parâmetro exógeno, ou seja, que evolui no tempo de forma independente da dinâmica interna do sistema. Na síntese de controladores dentro da técnica de escalonamento clássico de ganhos, a primeira etapa corresponde a obtenção de uma descrição linear aproximada do sistema não-linear (2.17) que envolve um conjunto conveniente das variáveis de interpolação θ(t). A maneira mais utilizada na prática consiste em: • obter, via uma linearização Jacobiana clássica do modelo (2.17) em torno de um conjunto de pontos de equilíbrio x(i)0 (u (i) 0 ), i = 1, 2, ..., um modelo linearizado: ẋ = A(θi)x + B(θi)u y = C(θi)x + D(θi)u parametrizado por θi(t) = [ θ(x (i) 0 ) θp(t) ] ∈ Rr, r = r1 + r2; 29 • definir uma trajetória nominal de x0(t) para o sistema e, supondo que θx(t) e dθx(t)/dt são limitadas e independentes de x0(t) e dx0(t)/dt, derivar um modelo do tipo LPV ẋ = A(θ)x + B(θ)u y = C(θ)x + D(θ)u (2.18) onde o parâmetro e sua taxa de variação evoluem em domínios compactos, θ(t) ∈ DΘ ⊂ Rr, θ̇(t) ∈ DΘd ⊂ Rr,∀t; • eventualmente, escolher uma trajetória θ(t) ←− θ0(t) ou “congelar” o parâmetro em um ponto dado θ(t) ←− θ0(t), para obter, respectivamente, um modelo LTV ou LTI. Nota-se que apesar das funções matriciais A(.), B(.), ... terem representações análo- gas, em geral são diferentes daquelas que constam em (2.17). Uma outra forma mais recente e mais direta de se chegar a um modelo similar àquele de (2.18), a partir (2.17), consiste simplesmente em ignorar a etapa de linearização. Escolhendo convenientemente a função θx(x(t)), reescreve-se o modelo numa forma onde os termos não-lineares possam ser redefinido por um parâmetro variante unicamente em função do tempo θx(t). De forma similar ao caso anterior, considera-se que as trajetórias desse parâmetro são limitadas e independentes das trajetórias de x(t), o que desconecta as funções matriciais A(.), B(.), ... do espaço de estados. Ele é então incluído na variável de interpolação, juntamente com o parâmetro θp(t): θ = [ θx(t) θp(t) ] (2.19) Isso quer dizer que certos estados, ou funções dos estados, são classificados como variáveis exógenas em certas partes do modelo, enquanto que em outras permanecem como variáveis endógenas. Esta hipótese leva a um certo conservadorismo, mais ou menos importante, na etapa de síntese dos controladores. Nesse caso particular, o modelo (2.18) é denominado quasi -LPV. Se uma lei de interpolação é satisfatória para todas as trajetórias no domínio DΘ × DΘd , ela é igualmente satisfatória para as trajetórias realistas dos estados que interferem em θ. Contudo, o conservadorismo introduzido pela modelagem quasi -LPV é tão menos desprezível quanto maior o número de estados implicados no parâmetro. Considerando, por exemplo, o sistema não-linearẋ1 = sen(x1) + x2, ẋ2 = x1x2 + u 30 Uma representação quasi -LPV é ẋ = A(x)x + Bu = [ sen(x1)/x1 1 x2 0 ] x + [ 0 1 ] u com x1 6= 0 e θx(x) = x , [x1 x2]T . Esta representação é certamente mais conservadora do que a seguinte: ẋ = A(x)x + Bu = [ sen(x1)/x1 1 0 x1 ] x + [ 0 1 ] u onde o parâmetro θx(x) é inteiramente definido por somente uma variável de estado (θx(x) = x1) e, em conseqüência, a dimensão do espaço que pode incluir as trajetórias não-realistas é menor. Enfim, um sistema pode ainda ser, pela sua própria natureza, LPV ou LTV e nenhuma aproximação ou linearização suplementar é necessária para construir o modelo (2.18). O modelo LPV ou quasi -LPV (2.18) tolera uma dependência paramétrica bastante geral, que engloba a maior parte das situações práticas. Esta propriedade requer a uti- lização e o desenvolvimento de metodologias sofisticadas e complexas de análise e síntese de leis de controle por escalonamento de ganho. No entanto, duas outras classes mais restritivas de modelos LPV, obtidas da forma mais geral (2.18), são as vezes admissíveis e mais adaptadas a certos métodos específicos de controle LPV. Embora estes modelos não sejam diretamente utilizados neste trabalho, eles são apresentados a seguir. Uma dessas classes refere-se aos modelos do tipo Transformação Linear Fracionária (LFT, do inglês Linear Fractional Transformation). Uma dependência LFT do sistema (2.18) em relação ao parâmetro θ(t) é definido como [ A(θ) B(θ) C(θ) D(θ) ] , [ A B2 C2 D22 ] + [ Bθ D2θ ] ∆(θ)(I −Dθθ∆(θ))−1 [ Cθ Dθ2 ] (2.20) onde ∆(θ) é uma função matricial linear em θ. Este é suposto pertencente a um domínio politópico PΘ , co{Θ1, Θ2, ..., ΘL} (2.21) onde Θi com i = 1, 2, ..., L designam os vértices do politopo PΘ. Tais modelos exigem, em geral, hipóteses que simplifiquem sua obtenção, o que pode levar a um certo conser- vadorismo. A outra classe de representação LPV é a dos modelos politópicos. Se a função matricial 31 S(θ) , [ A(θ) B(θ) C(θ) D(θ) ] é afim em θ = [θ1, θ2, ..., θr]T , isto é, S(θ) = S0 + ∑r l=1 θlSl e as componentes escalares θl, l = 1, 2, ..., r, evoluem (por hipótese) independentemente num domínio limitado DΘ que é um subconjunto do domínio politópico (2.21), DΘ ⊆ PΘ, então o modelo admite um representação politópica S(θ) = co{S1, ..., SL} = co{S(Θ1), ..., S(ΘL)} (2.22) Este modelo não carrega nenhum conservadorismo se a condiçãoDΘ = PΘ é satisfeita. Ao contrário, se PΘ representa um recobrimento politópico de DΘ o modelo é fortemente conservador. Nenhuma atenção especial é dedicada à este tipo de representação neste estudo. 2.4.2 ANÁLISE DE ESTABILIDADE O critério de estabilidade por meio da localização dos autovalores da matriz de dinâmica A para sistemas LTI não é suficiente para sistemas LPV. De fato, pode-se mostrar, por exemplos simples, que mesmo quando todos os componentes da família de sistemas LTI obtidos pelo congelamento do parâmetro são estáveis, ainda assim o sistema LPV pode ser instável. Ou seja, para o sistema LPV ẋ(t) = A(θ(t))x(t) + B(θ(t))u(t) y(t) = C(θ(t))x(t) + D(θ(t))u(t), ∀θ ∈ PΘ (2.23) onde A ∈ Rn×n, D ∈ Rp×m e PΘ é o domínio de variação paramétrica, a condição Re(λi(A(θ))) < 0, i = 1, ...n, ∀θ ∈ PΘ (2.24) não é suficiente para que se infira a estabilidade. Apesar disso, existe uma noção intuitiva de que se a variação do parâmetro for suficientemente lenta, a estabilidade do conjunto de sistemas LTI implica a estabilidade do sistema LPV. Nesse contexto se insere o teorema a seguir. Teorema 2.1. (DESOER, 1975) O sistema LPV 2.23 é globalmente estável se as condições seguintes forem válidas: 32 • Re(λi(A(θ))) < 0, i = 1, ...n, ∀θ ∈ PΘ, • ∃α > 0 suficientemente pequeno tal que ‖ d dt θ(t)‖ < α, ∀t ≥ 0, ∀θ ∈ PΘ. Ainda que o Teorema 2.1 mostre que, sob condição de variação lenta do parâmetro, a estabilidade do sistema LPV pode ser determinada a partir da estabilidade LTI, ele não indica qual é o valor α que caracteriza a velocidade dessa variação. Assim, do ponto de vista prático, não se costuma inferir sobre a estabilidade de um sistema LPV pela estabilidade LTI. Faz-se, então, necessária a utilização de uma teoria mais abrangente, como a teoria de estabilidade de Lyapunov (VIDYASAGAR, 1978; KHALIL, 1996). A teoria de Lyapunov é bastante geral, de maneira que são abordados nesta seção apenas alguns pontos básicos mais interessantes para o contexto deste estudo. Seja o sistema autônomo geral ẋ = f(x, t), x ∈ Rn, t ≥ t0 x(t0) = x0 (2.25) Supõe-se que sejam válidas as hipóteses de existência e unicidade para a solução do sistema de equações diferenciais que regem o sistema (2.25). Além disso, supõe-se que x0 = 0 seja um ponto de equilíbrio para o sistema4, ou seja, ∀t ≥ t0, f(0, t) = 0 Definição 2.1 (Estabilidade Assintótica Uniforme (Global)). A trajetória de equi- líbrio x ≡ 0 é dita uniformemente assintoticamente estável se: • ∀² > 0, ∃δ(²) tal que t ≥ t0 ≥ 0, ‖x(t0)‖ < δ ⇒ ‖x(t)‖ < ², • ∃c > 0 | ∀‖x(t0)‖ < c, x(t) → 0 quando t →∞, sendo que ∀² > 0,∃T (c) | ∀t > t0 + T , ‖x(t)‖ < ². Se essas condições forem verificadas para c → ∞, então a trajetória de equilíbrio x ≡ 0 é dita globalmente uniformemente assintoticamente estável. Definição 2.2 (Estabilidade Exponencial (Global)). A trajetória de equilíbrio x ≡ 0 é dita (globalmente) exponencialmente estável se: • as condições de estabilidade assintótica uniforme (global) forem verificadas, • ∃λ > 0 tal que ∀‖x(t0)‖ < c, ∃M(x(t0)) tal que t ≥ t0 ⇒ ‖x(t)‖ ≤ Me−λt O teorema a seguir é central na teoria de Lyapunov. 4Essa hipótese não é restritiva, sendo satisfeita por simples translação (VIDYASAGAR, 1978, p.132). 33 Teorema 2.2. (VIDYASAGAR, 1978) O sistema (2.25) é globalmente uniformemente assintoticamente estável se existe uma função continuamente diferenciável, V (t, x), definida sobre R+ × Rn com valores em R, tal que, para todo x ∈ Rn e todo t positivo: α1(‖x‖) ≤ V (t, x) ≤ α2(‖x‖) (2.26) ∂V ∂t + ∂V ∂x f(t, x) ≤ −α3(‖x‖) (2.27) onde α1, α2 e α3 são funções definidas sobre R+ com valores em R+, contínuas, estrita- mente crescentes, não limitadas e nulas na origem. O primeiro membro de (2.27), que representa a derivada temporal de V , é chamado de derivada de V ao longo das trajetórias do sistema (2.25) e é definido como V̇ (t, x) := dV dt = ∂V ∂t + ∂V ∂x dx dt = ∂V ∂t + ∂V ∂x f (2.28) Pode-se notar que, pelo Teorema 2.2, V (t, 0) = 0 para todo t > 0. O teorema a seguir é uma variação do Teorema 2.2. Ele faz uma extensão para funções V que sejam continuamente diferenciáveis por partes. Por outro lado, ele particulariza as funções αi para αi(‖x‖) = λi‖x‖c, λi > 0, c > 0 (2.29) Além disso, V passa a ser função apenas de x. Teorema 2.3. (PETTERSSON, 1997) O sistema (2.25) é globalmente exponencialmente estável se existe uma função continuamente diferenciável por partes, V (x), definida sobre Rn com valores em R, tal que, para todo x ∈ Rn e todo t positivo: λ1‖x‖c ≤ V (x) ≤ λ2‖x‖c (2.30) V̇ (x) ≤ −λ3‖x‖c (2.31) com λ1, λ2, λ3 estritamente positivas e reais. A função V que atende as condições dos Teoremas 2.2 e 2.3 é chamada de função de Lyapunov. Essa função pode ser vista como uma medida generalizada da energia do sistema. Existe uma idéia intuitiva por trás dos Teoremas 2.2 e 2.3 de que o sistema será estável se a energia do sistema (ou a função V ) for decrescente ao longo de todas as trajetórias desse sistema. Embora não esteja explicito, a estabilidade exponencial global garante a estabilidade de um ponto de vista entrada/saída (KHALIL, 1996). 34 Vale destacar que, embora o Teorema 2.3 aponte para a estabilidade do sistema (2.25) caso seja possível encontrar uma função de Lyapunov para esse sistema, ele não indica como fazê-lo. Seja, agora, a particularização do sistema autônomo (2.25) para o caso LPV ẋ = A(θ)x, x ∈ Rn, t ≥ t0 x(t0) = x0 (2.32) Para analisar a estabilidade desse sistema, será utilizada uma função de Lyapunov V (θ, x) quadráticaV (θ, x) = xT P (θ)x (2.33) com P (θ) simétrica. Isso porque, para sistemas lineares, a estabilidade assintótica uni- forme pode ser inferida, por meio do Teorema 2.3, utilizando-se uma função de Lya- punov quadrática (VIDYASAGAR, 1978, p.183). Uma outra característica importante dos sistemas lineares é que a estabilidade assintótica uniforme é equivalente à estabilidade exponencial (VIDYASAGAR, 1978, p.170). Para a função de Lyapunov dependente do parâmetro, V (θ, x), a derivada ao longo das trajetórias é obtida por V̇ (θ, x) = ∂V ∂θ dθ dt + ∂V ∂x dx dt (2.34) Segundo o Teorema 2.3, para que V seja uma função de Lyapunov e, conseqüente- mente, o sistema seja estável, ela deve satisfazer V (θ, x) > 0, V̇ (θ, x) < 0, x 6= 0 V (θ, 0) = 0 e V̇ (θ, 0) = 0 (2.35) A primeira restrição é satisfeita quando a matriz P (θ) é positiva definida P (θ) = P (θ)T > 0,∀θ ∈ PΘ (2.36) A segunda implica, de acordo com (2.34), em xT ∂P (θ) ∂θ dθ dt x + xT P (θ)(A(θ)x) + (xT AT (θ))P (θ)x = xT [∂P (θ) ∂θ dθ dt + P (θ)A(θ) + AT (θ)P (θ)]x < 0 (2.37) que é satisfeito quando ∂P (θ) ∂θ dθ dt + P (θ)A(θ) + AT (θ)P (θ) < 0, ∀θ ∈ PΘ (2.38) 35 Assim, se for possível determinar uma matriz P dependente de θ e positiva definida tal que a inequação matricial parametrizada (2.38) seja satisfeita, então V (θ, x) será uma função de Lyapunov e o sistema (2.32) será estável. A inequação matricial (2.38) é uma Desigualdade Linear Matricial Parametrizada, ou PLMI (do inglês Parametrized Linear Matrix Inequality). Como o parâmetro θ é uma função contínua do tempo, a PLMI tem que ser satisfeita para todos os infinitos valores de θ. Para sistemas LTI basta considerar a matriz P constante, de forma que o problema de análise de estabilidade se reduz a determinar uma matriz P = P T > 0 tal que PA + AT P < 0 (2.39) A LMI (2.39) é condição necessária e suficiente para que a parte real dos pólos do sistema LTI seja negativa (VIDYASAGAR, 1978; KAILATH, 1980). 2.5 INTERPOLAÇÃO DE CONTROLADORES ROBUSTOS DE ESTRUTURA ESTIMAÇÃO-CONTROLE No contexto do escalonamento de ganhos clássico, se os controladores lineares a serem interpolados forem muito diferentes em pontos de operação vizinhos, uma variação rápida é introduzida artificialmente na dinâmica de malha fechada, o que pode produzir um efeito desestabilizante ou uma perda de desempenho. Então, para se obter um comportamento desejável na interpolação de controladores lineares, estes devem obrigatoriamente ter estruturas compatíveis. Isto se torna crítico quando os dados são interpolados numa abordagem em espaço de estado, pois o comportamento dinâmico do controlador escalonado pode depender forte- mente das realizações adotadas para a família de controladores lineares projetada para o conjunto escolhido de pontos de operação. Este fato é ilustrado em (LEITH, 1998a; STILWELL, 1999, 2000). Em (STILWELL, 1999, 2000) os autores apresentam justifica- tivas teóricas e condições suficientes para a alocação de controladores LTI de modo que a estabilidade a tempo variante sempre exista5. Também apresentam condições (conser- vadoras) para o cálculo de um limitante superior para a taxa de variação do parâmetro de escalonamento, de forma que a estabilidade a tempo variante esteja assegurada. In- felizmente, no contexto de interpolação em espaço de estado, esses métodos são restritos a controladores de ordem completa, ou seja, de mesma ordem da planta. Além disso, as 5Ver também (?STILWELL, 1997) e os exemplos numéricos apresentados. 36 condições de estabilidade e desempenho são verificadas a posteriori, o que não elimina o algo grau de empirismo na escolha dos pontos de operação. Esses resultados mostram claramente que uma transição satisfatória depende não somente da “distância” entre os pontos de operação, mas também da “proximidade” en- tre os coeficientes dos respectivos controladores LTI. Deve-se notar que a interpolação desses coeficientes representa também uma variação paramétrica para o sistema em malha fechada e quanto maior a diferença entre eles para pontos vizinhos, maior será a sua taxa de variação, o que prejudica a estabilidade a tempo variante. Mesmo supondo que o conjunto de pontos de operação seja apropriadamente esco- lhido, projetar um conjunto correspondente de controladores de modo a favorecer uma interpolação suave, não é uma questão de fácil solução no contexto das técnicas clássi- cas de escalonamento de ganhos, especialmente quando se trata de técnicas de controle robusto dos tipos H2, H∞ e síntese µ. No caso particular da estrutura controlador- observador, a interpolação dos ganhos de controle e de estimação é mais intuitiva, apesar desses ganhos não serem as únicas variáveis a serem interpoladas. Os coeficientes do controlador também dependem dos dados da realização do modelo do sistema a controlar e devem evoluir de forma consistente com a sua dinâmica. Isto é, variações significativas ou não-linearidades da planta devem ser adequadamente compensadas pelo ajuste do controlador. Nesta seção, são apresentadas as técnicas propostas em (PELLANDA, 2000, 2001, 2002b) para o cálculo de realizações equivalentes do tipo estimação-controle de um con- junto de controladores estabilizantes arbitrários associados a um dado conjunto de pontos de operação de um sistema. A família resultante de controladores de estrutura estimação- controle pode ser interpolada mais facilmente. Apesar dessas técnicas serem gerais, de modo a simplificar a apresentação, os casos dos controladores não estritamente próprios e a tempo discreto são aqui omitidos, mas também a estes são aplicáveis tal metodologia. Na literatura de controle pode-se encontrar várias expressões freqüentemente uti- lizadas como termos equivalentes para “controlador de estrutura estimação-controle”: observer-based structure, observer state (feedback) controller, LQG (form) controller, estimator-controller structure (or form), observer-controller structure, state estimator- state feedback structure, entre outras. 37 2.5.1 FORMULAÇÃO DO PROBLEMA A definição a seguir é necessária para a compreensão do problema a ser proposto nesta seção. Definição 2.3 (Controlador de estrutura estimação-controle). (ZHOU, 1996) Dada uma realização (A,B,C) de um sistema qualquer, com (A,B) estabilizável e (C,A) detectável, então existem matrizes Kc e Kf tais que os autovalores de A−BKc e A−KfC são estáveis. O controlador definido por u = K(s)y, onde K(s) = A−BKc −KfC Kf −Kc 0 (2.40) é chamado de “controlador de estrutura estimação-controle”. Considere os sistemas em malha fechada descritos na FIG. 2.1, onde G(s) = [ G11(s) G12(s) G21(s) G22(s) ] (2.41) e P (s) = [ P11(s) P12(s) P21(s) P22(s) ] (2.42) são, respectivamente, o modelo de síntese nominal e aumentado. O sinal r é o sinal de referência e os sinais w, e, z e y são, respectivamente, a entrada exógena, o controle, a saída controlada e a saída medida de P (s). + ( ) s P ( ) s G ( ) s W o ( ) s W i ( ) s K w r e y z u + ( ) s P ( ) s J w r e y z u ( ) s Q 1 y 1 u ( ) s K e (a) Controlador original (b) Controlador equivalent (a) - Controlador original (b) - Controlador equivalente FIG. 2.1: Sistemas em malha fechada O modelo nominal G22(s), suposto estritamente próprio sem perda de generalidade, é definido pela representação estabilizável e detectável: G22(s) = A B C 0 (2.43) 38 com A ∈ Rn×n, B ∈ Rn×m e C ∈ Rp×n. Supõem-se também que o sistema aumentado P22(s) = Ap Bp Cp 0 (2.44) com spec(Ap) ⊇ spec(A), é estabilizável e detectável e incorpora algumas dinâmicas fictícias suplementares, notadamente as ponderações frequenciais e/ou os multiplicadores dinâmicos estáveis Wi(s) e Wo(s). O sistema G22(s) corresponde à dinâmica física6 que se deseja estabilizar através de um controlador de estrutura estimação-controle. O modelo P22(s) se distingue de G22(s) pela possível presença de modos não-observáveispor y e/ou não-controláveis por e. Mesmo que esses dois sistemas sejam equivalentes do ponto de vista entrada-saída, neste capítulo, as notações (2.43) e (2.44) serão mantidas a fim de possibilitar a distinção entre as dinâmicas física e aumentada. Como já foi salientado anteriormente, não existe perda de generalidade ao se supor que D = 0. De fato, se D 6= 0, é fácil formular um problema equivalente com D = 0 aplicando-se uma transformação linear fracionária apropriada ao controlador. Supondo que K(s) seja um controlador para G22(s) com D = 0. Para um sistema em que D 6= 0, o respectivo controlador pode ser reescrito como: K(s) (I + DK(s))−1 (2.45) O problema tratado nesta seção pode ser definido como: Dados os sistemas G22(s) e P22(s) e um controlador estabilizante original (Figure 2.1-(a)) K(s) = [ AK BK CK DK ] (2.46) onde AK ∈ RnK×nK , nK ≥ n, DK ∈ Rm×p e BK , CK são matrizes reais de dimensões compatíveis, calcular uma transformação de similaridade, T , tal que o controlador Ke(s) = [ T−1AKT T−1BK CKT DK ] (2.47) equivalente a (2.46) do ponto de vista entrada-saída, apresente uma es- trutura explicitamente separada (FIG. 2.1-(b)) e que J11(s) tenha uma es- trutura estimação-controle em relação ao sistema físico G22(s) (FIG. 2.2). O esquema mostrado na FIG. 2.2 explicita a estrutura procurada. Trata-se, portanto, de buscar, através do cálculo de T , um controlador equivalente Ke(s) que apresente uma 6Eventualmente incluindo a dinâmica dos atuadores e dos sensores. 39 + ( ) s P ( ) s G ( ) s W o ( ) s W i w r e y z u 1 y 1 u -K c + C + + B + A ( ) s Q _ K f x ( ) s J ^ x ^ . FIG. 2.2: Parametrização de Youla e a estrutura estimação-controle estrutura do tipo LFT inferior em relação ao parâmetro de Youla Q(s) ∈ RH∞: Ke(s) = J11(s) + J12(s)Q(s) [I + J22(s)Q(s)] −1 J21(s) onde os coeficientes J11(s), J12(s), J21(s), J22(s) são os elementos da matriz transferência entre [yT yT1 ]T e [uT uT1 ]T J(s) := [ J11(s) J12(s) J21(s) J22(s) ] = A−BKc −KfC Kf B −Kc 0 Im×m −C Ip×p 0 (2.48) Os ganhos Kc, Kf são escolhidos tais que A − BKc e A − KfC sejam estáveis7. A representação de estado de J11(s) é a mesma vista em (2.40), com x̂ sendo uma estimativa assintótica dos reais estados x de G22(s). O erro x− x̂ tende a 0 quando o tempo t tende a infinito, para entradas exógenas nulas (w = 0). Adotando a notação Q(s) = Aq Bq Cq Dq (2.49) para uma realização mínima de Q, onde Aq ∈ Rnq , nq = nK − n e Bq, Cq, Dq têm 7É importante notar que essas restrições de estabilidade são sempre satisfeitas se existe uma tal matriz T , isto é, se a equivalência entre (2.46) e (2.47) for assegurada. 40 dimensões compatíveis, obtém-se Ke(s) = A−BKc −KfC −BDqC BCq Kf + BDq −BqC Aq Bq −(Kc + DqC) Cq Dq (2.50) Assim, a função de transferência entre r e y pode ser escrita como Try(s) = (I −G22Ke)−1G22 = A + BDqC −B(Kc + DqC) BCq B (Kf + BDq)C A−BKc −KfC −BDqC BCq 0 BqC −BqC Aq 0 C 0 0 0 (2.51) O vetor de estados de (2.51) contém os estados do sistema (ou estados físicos), os estados do observador e os estados do parâmetro de Youla: [xT x̂T xTq ]T . Por abuso de linguagem, neste trabalho as representações de estado de J(s) e de Ke(s), expressas por (2.48) e (2.50), são igualmente chamadas de controladores de estru- tura estimação-controle. Para facilitar a interpretação da dinâmica de malha fechada, aplica-se à (2.51) a seguinte transformação de similaridade: x xq x̂− x = I 0 0 0 0 I −I I 0 x x̂ xq (2.52) A nova representação de estado em malha fechada (2.53) inclui o erro de estimação do estado físico, x̂− x, no vetor de estados: Try(s) = A−BKc BCq −B(Kc + DqC) B 0 Aq −BqC 0 0 0 A−KfC −B C 0 0 0 (2.53) Nesta representação, o principio da separação aparece claramente. Os autovalores em malha fechada podem ser separados segundo os n autovalores do controlador, os n autovalores do estimador e os nq autovalores do parâmetro de Youla: spec(A − BKc), spec(A−KfC) e spec(Aq), respectivamente. A função de transferência em malha fechada pode também ser representada a partir 41 do controlador original (2.46) : Try(s) = (I −G22K)−1G22 = A + BDKC BCK B BKC AK 0 C 0 0 = Acl Bcl Ccl 0 (2.54) cujo vetor de estado é [ xT (T1x̂) T (T2xq) T ]T , com [ T1 T2 ] = T (2.55) Com a ajuda dessas definições e notações, pode-se deduzir as condições que garantem a equivalência entrada-saída entre das representações (2.46) e (2.47). 2.5.2 ESTRUTURA ESTIMAÇÃO-CONTROLE EQUIVALENTE A partir de (2.47) e (2.50), pode-se deduzir: AKT − T [ A + BDKC 0 0 Aq ] − T [ BCK 0 ] T + [ BKC 0 ] = 0 (2.56) T−1BK = [ Kf + BDq Bq ] (2.57) CKT = [ −(Kc + DqC) Cq ] (2.58) DK = Dq (2.59) O problema se reduz, então, a resolver em T ∈ RnK×nK a EQ (2.56) e calcular Kc, Kf , Bq, Cq e Dq usando (2.57), (2.58) e (2.59). Nota-se que Aq é desconhecido em (2.56) e corresponde a uma variável adicional. A solução teórica da EQ. (2.56) pode ser simplificada se ela for dissociada em dois subproblemas. Adotando-se uma partição apropriada de T como em (2.55), obtém-se: T1(A + BDKC)− AKT1 + T1BCKT1 −BKC = 0 (2.60) e (AK − T1BCK)T2 = T2Aq (2.61) A equação de Riccati generalizada, não simétrica e retangular (2.60) pode ser ainda reformulada como: [ −T1 I ] H︷ ︸︸ ︷[ A + BDKC BCK BKC AK ] [ I T1 ] = 0 (2.62) 42 Conseqüentemente, a matriz Hamiltoniana H associada a equação de Riccati (2.60) é a própria matriz da dinâmica do sistema em malha fechada Acl, expressa em (2.54). A equação de Riccati (2.60) pode ser resolvida em T1 ∈ RnK×n pela técnica clássica de cálculo de subespaços invariantes que consiste em: • Calcular um subespaço invariante associado a um conjunto de n autovalores, spec(Λn), escolhidos entre 2n + nq autovalores de spec(Acl), isto é, [ A + BDKC BCK BKC AK ] [ U1 U2 ] = [ U1 U2 ] Λn (2.63) onde U1 ∈ Rn×n e U2 ∈ RnK×n. Tal subespaço é facilmente calculado usando a decomposição de Schur da matriz Acl. • Calcular a solução T1 = U2U −1 1 (2.64) cuja existência é garantida quando todos os autovalores de malha fechada forem distintos. Usando o resultado anterior e de forma similar, o cálculo da solução T2 ∈ RnK×nq da equação de Sylvester (2.61) se reduz a encontrar um subespaço invariante associado com um conjunto de nq autovalores, spec(Aq), escolhidos entre os n + nq autovalores de spec(AK − T1BCK). Partindo de (2.47), (2.50) e (2.58), pode-se verificar que AK − T1BCK = T [ A−KfC 0 −BqC Aq ] T−1 (2.65) Pode-se, então, estabelecer a seguinte proposição: Proposição 2.1. Os n autovalores escolhidos para o cálculo da solução T1 da EQ (2.60), utilizando o método Hamiltoniano, são os n autovalores de realimentação de estados associados à estrutura estimação-controle equivalente, isto é, spec(A−BKc). Além disso, a dinâmica de malha fechada restante8 contém a dinâmica do estimador (A − KfC) aumentada da dinâmica do parâmetro de Youla (Aq). 8Não incluída na seleção da solução de (2.60), isto é, a dinâmica de AK − T1BCK . 43 Esta proposição é uma conseqüência direta de (2.53) e (2.65), consistindo na base da técnica aqui apresentada. A conclusão nela apresentada permitiu a definição de um algo- ritmo para a seleção de autovalores necessária para o cálculo de controladores equivalentes de estrutura estimação-controle (PELLANDA, 2001, 2002b). Existe uma combinação de soluções segundo a escolha da partição dos autovalores de malha fechada, primeiramente para o cálculo de T1 e depois para o cálculo de T2. Na Seção 2.5.3 Algumas considerações adicionais a propósito das possíveis soluções de (2.60) e (2.61)são apresentadas e discutidas. Assim, dados um sistema de ordem n e um controlador de ordem nK , pode-se cal- cular uma transformação linear T−1xK para os estados do controlador tal que eles sejam separados em duas partes: uma partição correspondente