Buscar

IDENTIFICAÇÃO E CONTROLE DE ALGUMAS CLASSES DE SISTEMAS NÃO-ESTACIONÁRIOS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 148 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 148 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 148 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

INSTITUTO MILITAR DE ENGENHARIA
CAP LEONARDO OLIVEIRA DE ARAÚJO
IDENTIFICAÇÃO E CONTROLE DE ALGUMAS CLASSES
DE SISTEMAS NÃO-ESTACIONÁRIOS
Dissertação de Mestrado apresentada ao Curso de
Mestrado em Engenharia Elétrica do Instituto Militar
de Engenharia, como requisito parcial para obtenção do
título de Mestre em Ciências em Engenharia Elétrica.
Orientador: Paulo César Pellanda, Dr. ENSAE
Co-orientador: Roberto Ades, Dr PUC-Rio
Rio de Janeiro
2006
c2006
INSTITUTO MILITAR DE ENGENHARIA
Praça General Tibúrcio, 80-Praia Vermelha
Rio de Janeiro-RJ CEP 22290-270
Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-lo
em base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de
arquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliote-
cas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha
a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem finalidade
comercial e que seja feita a referência bibliográfica completa.
Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es) e do(s)
orientador(es).
A663 Araújo, Leonardo Oliveira de
Identificação e Controle de Algumas Classes de Sistemas
Não-estacionários / Leonardo Oliveira de Araújo. - Rio
de Janeiro : Instituto Militar de Engenharia, 2006.
146 p.: il, graf., tab.
Dissertação (mestrado) - Instituto Militar de
Engenharia- Rio de Janeiro, 2006.
1. Sistemas, identificação e controle. 2. Sistemas não-
estacionários. I. Título. II. Instituto Militar de Engen-
haria.
CDD 621.319
2
INSTITUTO MILITAR DE ENGENHARIA
CAP LEONARDO OLIVEIRA DE ARAÚJO
IDENTIFICAÇÃO E CONTROLE DE ALGUMAS CLASSES DE
SISTEMAS NÃO-ESTACIONÁRIOS
Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica
do Instituto Militar de Engenharia, como requisito parcial para obtenção do título de
Mestre em Ciências em Engenharia Elétrica.
Orientador: Paulo César Pellanda, Dr. ENSAE
Co-orientador: Roberto Ades, Dr PUC-Rio
Aprovada em 31 de Janeiro de 2006 pela seguinte Banca Examinadora:
Paulo César Pellanda, Dr. ENSAE do IME - Presidente
Roberto Ades, Dr PUC-Rio do IME
Geraldo Magela Pinheiro Gomes, Dr. ENSAE do IME
Mario Cesar Mello Massa de Campos, Dr. ECP do CENPES
Rio de Janeiro
2006
3
Àquele que é causa unívoca de todas as coisas, cha-
mado por muitos nomes em tempos, locais e cul-
turas diferentes: O Grande Arquiteto do Universo.
4
AGRADECIMENTOS
Aos amigos e orientadores, Maj Paulo César Pellanda e Maj Roberto Ades, exemplos
de dedicação, compromisso e notório saber, que sacrificaram inúmeras horas de lazer
familiar para possibilitar a existência deste trabalho.
Ao amigo Maj Juraci Ferreira Galdino pelas efetivas e claras orientações prestadas,
ultrapassando os limites de sua área de atuação científica específica, que possibilitou uma
abordagem de maior magnitude nesta dissertação.
Ao professor Marcelo Vieira Corrêa que contribuiu significativamente com elucidações
e arquivos de simulação para comparação de resultados sempre que solicitado, além de
permitir a exploração da tese de doutorado de sua autoria.
Ao Cel Ney Bruno por sua colaboração na modelagem do sistema do levitador mag-
nético, do qual é o idealizador.
À minha esposa, Rosane da Penha Andrade Araújo, pela compreensão e apoio du-
rante este período de extrema dedicação e aplicação ao estudos no qual fiquei envolvido.
Ao meu pai, José Alfredo de Araújo, e ao meu tio, Marlanfe Tavares Oliveira, pelos
sábios conselhos que me conduziram a este momento.
Ao Exército Brasileiro, em especial ao Instituto Militar de Engenharia, por esse
investimento tão significativo.
"Filho meu, não desprezes a instrução de tua mãe nem o ensinamento de teu pai,
ouça os teus maiores porque isto será uma coroa grandiosa para tua cabeça."
Provérbio, 1, 8
5
SUMÁRIO
LISTA DE ILUSTRAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
LISTA DE SÍMBOLOS E ABREVIATURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.1 Contexto e Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Objetivos da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2 FUNDAMENTOS TEÓRICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Projeção Estável e Instável de uma Realização . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3 Redução de Ordem por Truncamento Balanceado . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4 Sistemas LPV e Quasi -LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.1 Modelagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.2 Análise de Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5 Interpolação de Controladores Robustos de Estrutura Estimação-Controle . . 36
2.5.1 Formulação do Problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.5.2 Estrutura Estimação-Controle Equivalente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.5.3 Restrições Para a Seleção de Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5.4 Parâmetro de Youla Dinâmico × Estático . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5.5 Continuação dos Subespaços Invariantes Selecionados . . . . . . . . . . . . . . . . . . . . 55
3 CONTRIBUIÇÕES PARA A IDENTIFICAÇÃO DE SISTEMAS 62
3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2 Representações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3 Identificação de Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3.1 Identificação usando Amostras Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3.2 Identificação usando a Resposta em Freqüência . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.4 Identificação de Sistemas quasi -LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4.1 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6
4 ESCALONAMENTO DE GANHOS EM ESTRUTURAS DO TIPO
ESTIMAÇÃO-CONTROLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.2 Escolha Sistemática dos Modelos de Síntese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2.1 Definição das Faixas de Linearização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.2.2 Transição entre Faixas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3 Escalonamento de Ganhos por Imposição da Dinâmica de Malha Fechada . . . 81
4.3.1 Considerações sobre a Modelagem Não-Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.3.2 Controlador e Observador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . 83
4.3.3 Controlabilidade e Observabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.3.4 Ajuste do Rastreamento e do Ponto de Operação . . . . . . . . . . . . . . . . . . . . . . . . 85
4.4 Escalonamento de Ganhos por Cancelamento de Não-Linearidades . . . . . . . . . 86
4.4.1 Modelagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.4.2 Cancelamento das Não-Linearidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
5 APLICAÇÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.1 Identificação de Modelos Lineares usando a Resposta Discreta no Tempo . . . 89
5.2 Identificação de Modelos Lineares usando a Resposta em Freqüência . . . . . . . 99
5.3 Identificação Quasi -LPV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
5.4 Controle de um Míssil Ar-Ar via Continuação de Subespaços Invariantes . . . . 112
5.5 Controle de um Sistema de Levitação Magnética por Técnicas de
Escalonamento de Ganhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
6 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.1 Contribuições para a Identificação de Sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.2 Contribuições para o Controle por Escalonamento de Ganhos . . . . . . . . . . . . . 127
6.3 Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7 REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8 APÊNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
8.1 Apêndice 1: Modelo do Míssil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
8.2 Apêndice 2: Modelos Lineares Identificados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
8.3 Apêndice 3: Linearização do Modelo de um Levitador Magnético . . . . . . . . . . 145
7
LISTA DE ILUSTRAÇÕES
FIG.2.1 Sistemas em malha fechada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
FIG.2.2 Parametrização de Youla e a estrutura estimação-controle . . . . . . . . . . . . 40
FIG.4.1 Curva f(x) e sua linearização em x = 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
FIG.4.2 Curva f(x) e suas linearizações em x = 6: intervalo 4 ≤ x ≤ 8. . . . . . . . . 78
FIG.4.3 Erros nos processos de linearização. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
FIG.4.4 Transição entre faixas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
FIG.5.1 Sinal v aplicado as plantas físicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
FIG.5.2 Resposta em freqüência (módulo e fase) da dinâmica da planta . . . . . . . . 90
FIG.5.3 Curvas de respostas ao degrau para: planta e modelo. Curva de
erro entre as respostas do modelo e da planta: (A) Gm11(z), (B)
Gm12(z), (C) Gm13(z) e (D) Gm14(z). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
FIG.5.4 Curvas de respostas ao degrau para: planta e modelo. Curva de
erro entre as respostas do modelo e da planta: (A) Gr15(z), (B)
Gr16(z), (C) Gm17(z) e (D) Gm18(z). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
FIG.5.5 Resposta em freqüência (módulo e fase) da dinâmica da planta . . . . . . . . 95
FIG.5.6 Curvas de respostas ao degrau para: planta e modelo. Curva de
erro entre as respostas do modelo e da planta: (A) Gr21(z), (B)
Gr22(z) e (C) Gr23(z). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
FIG.5.7 Curvas de respostas ao sinal v para: planta e modelo. Curva de
erro entre as respostas medida e estimada: Gr24(z) . . . . . . . . . . . . . . . . . . 98
FIG.5.8 Resposta em freqüência (módulo e fase): comparação entre a
planta e o modelo Gr32(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
FIG.5.9 Resposta em freqüência (módulo e fase): comparação entre a
planta e o modelo Gm42(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
FIG.5.10 Resposta em freqüência (módulo e fase): comparação entre a
planta e o modelo Gr52(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
FIG.5.11 Resposta em freqüência (módulo e fase): comparação entre a
planta e o modelo Gm62(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
FIG.5.12 Resposta em freqüência: comparação das amostras com os valores
fornecidos pelo modelo Gm72(s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
8
FIG.5.13 Resposta em freqüência. Comparação das amostras com os valores
fornecidos pelos modelos (A) Gm81(s), (B) Gr82(s) e (C) Gr83(s). . . . . . . . . 107
FIG.5.14 Entrada para validação do modelo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
FIG.5.15 Resposta da planta não-linear e do modelo identificado quasi -LPV
de um míssil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
FIG.5.16 Resposta da planta não-linear e do modelo identificado quasi -LPV
de um míssil entre 35s e 45s de vôo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
FIG.5.17 Estrutura de controle para o exemplo do míssil . . . . . . . . . . . . . . . . . . . . . . 113
FIG.5.18 Resposta ao degrau do sistema linearizado em malha fechada em
três pontos de operação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
FIG.5.19 Resposta do sistema não-linear em malha fechada para três tipos
de interpolação de controladores - aceleração . . . . . . . . . . . . . . . . . . . . . . . 119
FIG.5.20 Resposta do sistema não-linear em malha fechada para três tipos
de interpolação de controladores - aceleração: ampliação de parte
da FIG. 5.19. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
FIG.5.21 Resposta do sistema não-linear em malha fechada para três tipos
de interpolação de controladores - ângulo de ataque . . . . . . . . . . . . . . . . . 120
FIG.5.22 Resposta do sistema não-linear em malha fechada para três tipos
de interpolação de controladores - ângulo de ataque: ampliação
de parte da FIG. 5.22 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
FIG.5.23 Resposta do sistema não-linear em malha fechada para três tipos
de interpolação de controladores - sinal de controle δc . . . . . . . . . . . . . . . 121
FIG.5.24 Resposta do sistema não-linear em malha fechada para três tipos
de interpolação de controladores - sinal de controle δc: ampliação
de parte da FIG. 5.23 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
FIG.5.25 Comparação das saídas controladas com o sinal de referência. . . . . . . . . . 123
FIG.5.26 Comparação entre os sinais de controle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
FIG.8.1 Diagrama físico do míssil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
FIG.8.2 Sistema de levitação magnética de uma esfera de aço . . . . . . . . . . . . . . . . . 145
FIG.8.3 Valores medidos experimentalmente em laboratório: f(N) ×
x(mm)× i(A) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
9
LISTA DE TABELAS
TAB.5.1 Dados referentes aos modelos identificados de GM1(s) . . . . . . . . . . . . . . . . 91
TAB.5.2 Valores dos coeficientes da FT contínua da planta utilizada . . . . . . . . . . . 94
TAB.5.3 Valores dos coeficientesda FT discreta da planta utilizada . . . . . . . . . . . . 94
TAB.5.4 Dados referentes aos modelos identificados . . . . . . . . . . . . . . . . . . . . . . . . . . 95
TAB.5.5 Custos referentes aos modelos identificados . . . . . . . . . . . . . . . . . . . . . . . . . 96
TAB.5.6 Valores da função custo da FT GM3(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
TAB.5.7 Valores da função custo da FT GM4(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
TAB.5.8 Valores da função custo da FT GM5(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
TAB.5.9 Valores da função custo da FT GM6(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
TAB.5.10 Valores da função custo da FT GM7(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
TAB.5.11 Valores dos coeficientes da FT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
TAB.5.12 Comparativo de custos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
TAB.5.13 Parâmetros do filtro W(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
TAB.5.14 Ganhos do controlador e do estimador aumentado . . . . . . . . . . . . . . . . . . 117
TAB.5.15 Pólos em malha fechada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
TAB.5.16 Distribuição dos pólos em malha fechada . . . . . . . . . . . . . . . . . . . . . . . . . . 118
TAB.8.1 Valores dos coeficientes da FT Gm21(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
TAB.8.2 Valores dos coeficientes da FT Gr21(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
TAB.8.3 Valores dos coeficientes da FT Gm22(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
TAB.8.4 Valores dos coeficientes da FT Gr22(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
TAB.8.5 Valores dos coeficientes da FT Gm23(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
TAB.8.6 Valores dos coeficientes da FT Gr23(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
TAB.8.7 Valores dos coeficientes da FT Gm24(z) = Gr24(z) . . . . . . . . . . . . . . . . . . . . . 142
TAB.8.8 Valores dos coeficientes da FT Gm81(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
TAB.8.9 Valores dos coeficientes da FT Gm82(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
TAB.8.10 Valores dos coeficientes da FT Gr82(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
TAB.8.11 Valores dos coeficientes da FT Gm83(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
TAB.8.12 Valores dos coeficientes da FT Gr83(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
TAB.8.13 Diferenças entre as curvas do gráfico força × deslocamento (não-
linear) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
10
LISTA DE SÍMBOLOS E ABREVIATURAS
R - conjunto dos números reais
C - conjunto dos números complexos
Rn - conjunto dos vetores reais de dimensão n
Rm×n - conjunto das matrizes reais m× n
j - índice ou j=
√−1
∈ e ∈ - pertence e não pertence
, - por definição
≈ e ∼= - aproximadamente igual a
× - produto cartesiano
∃ - existe
∀ - para todo
| - tal que
→ - tendendo a
=⇒ - implica em
co - envelope convexo: para Si ∈ Rm×n, i = 1, 2, ..., N,
co{S1, S2, ...SN} , {
∑N
i=1 αiSi : αi ≥ 0,
∑N
i=1 αi = 1}
|α| - valor absoluto de α ∈ R ou de α ∈ C
spec(M) - espectro da matriz M ∈ Rn×n : {λi(M) : i = 1, ..., n}
Re(α) - parte real de α ∈ C
In - matriz indentidade n× n
MT - transposta da matriz M
M−1 - inversa da matriz M
M † - pseudo-inversa, ou inversa de Penrose-Moore, da matriz M
σ(M) - valor singular máximo
σ(M) - valor singular mínimo de M
‖α‖2 - Norma 2 de α ∈ Cn
x(t) - vetor de sinais contínuos, onde para ∀t, x ∈ Rn
x(k) - sinal x ∈ Rn no instante (discreto) k
s - variável de Laplace
z - variável da transformada Z para os sistemas discretos
w - freqüência em rad/s
θ(t) - variável de interpolação
11
G(z) =

 A B
C D

 realização em espaço de estados da função de transferência discreta
G(z) = C(zI − A)−1B + D
G(s) =

 A B
C D

 realização em espaço de estados da função de transferência con-
tínua G(s) = C(sI − A)−1B + D
12
SIGLAS
LTI Linear Invariante no Tempo
LTV Linear Variante no Tempo
LPV Linear a Parâmetros Variáveis
LFT Transformação Linear Fracionária (do inglês Linear Fractional
Transformation)
LMI Desigualdade Matricial Linear
LQG Gaussiano Quadrático Linear
LQ Quadrático Linear
FT Função de Transferência
PRCBI Parameter Robust Control by Bayesian Identification
TF Transformada de Fourier
DFT Transformada discreta de Fourier (do inglês Discrete Fourier
Transform)
FFT Transformada rápida de Fourier (do inglês fast Fourier transform)
NARMAX Modelo não-linear auto-regressivo, de média móvel com entradas
exógenas (do inglês nonlinear autoregressive moving average model
with exogenous input)
13
RESUMO
Esta dissertação apresenta a identificação e o controle de uma classe de sistemas
dinâmicos não-estacionários com representação quasi-LPV. Técnicas de identificação são
definidas e simuladas. Três metodologias do tipo escalonamento de ganhos clássico são
desenvolvidas.
As duas primeiras técnicas de identificação exploradas são lineares. Uma fornece
como resultado uma função de transferência discreta e a outra resulta em uma função de
transferência contínua. A terceira técnica permite a identificação de sistemas dinâmicos
quasi -LPV e depende de uma identificação preliminar de pontos de operação do sistema.
Esta última metodologia é aplicada com sucesso na identificação de um modelo não-linear
realista de um míssil ar-ar.
Em relação às técnicas de controle, a primeira contribuição do trabalho é possibi-
litar uma escolha sistemática da família de modelos de síntese de controladores LTI a
ser interpolada, para uma planta não-linear. A segunda técnica apresentada utiliza uma
abordagem quasi -LPV para modelar o sistema. Através de uma realimentação de esta-
dos estimados, o objetivo é fixar os autovalores de matriz dinâmica de malha fechada. A
terceira metodologia busca o cancelamento do comportamento não-linear de uma mode-
lagem restrita de sistemas não-estacionários.
Os resultados das simulações não-lineares indicam a eficiência das técnicas apresenta-
das para a identificação e o controle de sistemas dinâmicos não-estacionários que possuam
representação quasi-LPV.
14
ABSTRACT
This dissertation deals with the identification and the control of nonlinear dynamical
systems having a quasi-LPV representation. Techniques for identification are given and
simulated. Three methodologies of classic gain scheduling are developed.
The two first identification techniques are linear. One of them obtains a discrete
transfer function as a solution and the other one results in a continuous transfer func-
tion. The third method allows the identification of quasi-LPV dynamical systems and
is dependent of a set of LTI plant known a priori. This technique is applied to the
identification of a realistic nonlinear model of an air-to-air missile.
As a with regard to control technique, the first contribution is a method systematic
choice of a set of LTI controller synthesis models to be scheduled for a nonlinear plant.
The second technique use a quasi-LPV description of a system. The objetive is to fix
the eigenvalues of the closed-loop dynamic matrix by using a parameter dependent state
feedback law. The third control method aims to cancel nonlinearities for a restricted
nonlinear plants state feedback.
The nonlinear simulation results indicate that the techniques presented in this work
are efficient for the identification and the control of nonlinear dynamical systems having
a quasi-LPV representation.
15
1 INTRODUÇÃO
1.1 CONTEXTO E MOTIVAÇÃO
O desenvolvimento da engenhariade controle está intrinsecamente ligada à constru-
ção e análise de modelos que visam reproduzir, o mais fielmente possível, comportamentos
observados na natureza. Tais modelos possibilitam validar teorias e mostrar o funciona-
mento da dinâmica observada. Nos estudos de átomos, do sistema nervoso humano ou
de uma galáxia, por exemplo, modelos são fundamentais e indispensáveis.
Dentre os diversos modelos usados no decorrer da história da humanidade, o mo-
delo matemático destaca-se no atual contexto científico. Este modelo é definido por um
conjunto de equações diferenciais (tempo contínuo) ou equações de diferenças (tempo
discreto) que descrevem a dinâmica de uma planta física a ele relacionado. A complexi-
dade da modelagem, de forma geral, aumenta a medida que o nível de precisão requerida
na representação das dinâmicas envolvidas é maior.
Os modelos matemáticos permitem correlacionar causas e efeitos (AGUIRRE, 2000a),
possibilitando a análise dos dados observados. Porém, a modelagem exata e precisa de
toda a física de uma planta é de altíssima complexidade, senão impossível. No entanto,
dentro de tolerâncias pré-estabelecidas para cada caso, um modelo que tenha sucesso na
reprodução do comportamento de uma planta estudada é fundamental na engenharia,
em particular para as técnicas de controle.
Um sistema dinâmico tem sua análise feita geralmente nos domínios do tempo e da
freqüência. Por esse motivo, os métodos de identificação de plantas podem ser divididos
em (LJUNG, 1987):
• Métodos Paramétricos;
• Métodos Não-Paramétricos;
• Métodos no Domínio da Freqüência.
A técnica paramétrica assume que a estrutura do modelo do sistema é conhecida com
base nas leis físicas que regem a sua dinâmica, embora os parâmetros sejam considerados
desconhecidos. Por outro lado, a técnica não-paramétrica é necessária quando a estrutura
do modelo matemático não está disponível. O resultado dessa técnica não é um modelo
16
matemático, mas uma representação gráfica que caracteriza a dinâmica do sistema em
estudo (AGUIRRE, 2004). Por último, as técnicas no domínio da freqüência geram
modelos que mostram a evolução da dinâmica identificada nesse domínio, utilizando a
transformada de Fourier (HOUGEN, 1972).
Há ainda a possibilidade de se aplicar outras transformadas que possibilitem a iden-
tificação do sistema dinâmico analisado. Como exemplo, pode ser citada a identificação
utilizando a transformada Wavelets que é descrita em (COCA, 1995a,b, 1996a; BAKSHI,
1993), que são trabalhos precursores no desenvolvimento dessa técnica. Portanto, a mo-
delagem no domínio da freqüência é uma particularidade de uma modelagem no domínio
de uma determinada transformada.
Por serem mais simples, os modelos lineares foram fundamentais no desenvolvimento
de técnicas de identificação. Em contraste com a complexidade apresentada pelos mo-
delos não-lineares, o uso de modelos lineares é justificável (BILLINGS, 1980) pela sua
simplicidade, facilidade de obtenção e por possuírem um amplo ferramental matemático
na engenharia de controle. Esses modelos podem ser empregados em faixas operativas
restritas, ou seja, próximos dos pontos de operação onde o modelo foi validado.
A necessidade de obtenção de modelos mais precisos do comportamento de sis-
temas dinâmicos levou a uma modelagem que considera faixas mais amplas de operação
(BILLINGS, 1980). Em conseqüência, as equações obtidas nessa nova modelagem con-
sideram as não-linearidades dos modelos. Aponta-se ainda a dificuldade de identificar os
sistemas não-lineares e a impossibilidade da indicação de uma técnica que seja capaz de
apresentar soluções gerais aceitáveis. O desenvolvimento dos modernos computadores e
a disponibilização de um amplo ferramental matemático são aliados poderosos na mani-
pulação e análise dos dados medidos em plantas dessa natureza.
Em (CORRÊA, 2001), são ressaltados os estudos feitos na década de oitenta sobre a
identificação de sistemas dinâmicos não-lineares, dando particular atenção às técnicas de
representação NARMAX (do inglês Nonlinear Autoregressive Moving Average Model with
Exogenous Input) polinomial (LEONTARITIS, 1985), NARMAX racional (BILLINGS,
1989) e redes neurais (NARENDA, 1990). Na década seguinte, aquele mesmo autor
cita diversos trabalhos de identificação de plantas com modelos não-lineares1, bem como
apresenta as motivações e técnicas empregadas nos trabalhos desenvolvidos.
Neste contexto, o uso de informações a priori é enfatizada, pois provoca o surgimento
1Ver (BILLINGS, 1989; VALLVERDU, 1992; NOSHIRO, 1993; PRÖLL, 1994; JANG, 1994; ?; CU-
BILLOS, 1997; GENÇAY, 1997; TSOI, 1999) .
17
de uma nova classificação de modelagem. Segundo (CORRÊA, 2001), dependendo do
nível e/ou tipo de informação utilizada a priori, as técnicas de obtenção de modelos
passam a ser classificadas como (HERBERT, 1993; SJÖBERG, 1995; BOHLIN, 1995):
• modelagem caixa-branca;
• modelagem caixa-cinza;
• modelagem caixa-preta.
A modelagem caixa-branca, segundo (GARCIA, 1997), engloba os casos onde os
dados de entrada e saída do sistema são dispensáveis, pois o comportamento da dinâmica
do sistema é equacionado a partir do conhecimento da estrutura da planta. Nesse caso, os
parâmetros envolvidos possuem um significado físico. A modelagem caixa-preta, por sua
vez, é atribuída quando os modelos são gerados baseando-se exclusivamente na análise das
relações entre entradas e saídas do sistema dinâmico. Nesse contexto, não há informações
a priori, uma vez que a estrutura da planta é ignorada. Vantagens e desvantagens são
apontadas em ambos os tipos de modelagens, como pode ser visto em (POTTMANN,
1998) e (TIKHONOV, 1977) para caixas-brancas e caixas-pretas, respectivamente.
Entre esses dois casos extremos, a modelagem caixa-cinza agrega parte de ambos os
tipos: usa a relação entre entrada(s) e saída(s) medidas e informações a priori. Segundo
(JORGENSEN, 1995) essa modelagem é definida como: “a ciência de construção de
modelos que incorpora conhecimento a priori do sistema com um certo grau de incerteza
na seleção da estrutura da representação”.
Em (SJÖBERG, 1995), a modelagem em caixa-cinza é dividida em:
• Modelagem física: quando o modelo é determinado pelo conhecimento da estrutura
do sistema e sua dinâmica física/química, sendo estimados apenas os parâmetros,
ou parte destes, com o uso de medições;
• Modelagem semi-física: quando as informações medidas são usadas para sugerir
combinações não-lineares entre os sinais medidos, sendo que a escolha da estrutura
do modelo é fruto da análise destas informações.
Nota-se que na modelagem física, o modelo parametrizado e a modelagem caixa-
branca têm definições semelhantes. Sendo assim, as demais definições da classificação
podem ser entendidas como modelagem caixa-cinza.
As vantagens da modelagem caixa-cinza são relacionadas em (CORRÊA, 2001), com
base em trabalhos de outros autores, enfatizando:
18
• os prováveis benefícios no projeto de controladores avançados que necessitam da
descrição adequada dos processos;
• o uso de informações a priori, que diminui efetivamente o número de parâmetros
a serem estimados, tornando o problema melhor condicionado com modelos menos
incertos, mesmo com relativa escassez de dados;
• a possibilidade do uso da informação a priori, pode vir a se tornar um meio para
escolha diante das diversas possibilidades de representações matemáticas na mode-
lagem de sistemas dinâmicos não-lineares.
Em (GOLDFREY, 1986; AGUIRRE, 2000b,a; CORRÊA, 2001), é evidenciado que
trabalhos em caixa-preta se mostram bem caracterizados localmente, mesmo que a planta
física identificada seja não-linear. A incorporação de informações a priori possibilita que
o modelo tenha uma faixa de correspondência, em relação à planta, mais abrangente,
com pouca perda de precisão e melhora a medida que toda a faixa de trabalho é excitada
pela entrada. Por fim, é dado ênfase ao papel das informações a priori na seleção de
representaçõesmatemáticas para o processo de modelagem.
Um outro desafio deste estudo é usar técnicas de controle já consagradas ou aqui
desenvolvidas para controlar as plantas cujo modelos apresentem não-linearidades ou
sejam lineares a parâmetros variáveis.
Um sistema linear pode ser considerado variante no tempo ou não-estacionário −
Linear a Parâmetros Variantes (LPV) ou Linear Variante no Tempo (LTV, do inglês
Linear Time Variant) − quando um ou mais parâmetros do seu modelo variam ampla-
mente com o tempo e não podem ser considerados como parâmetros incertos. Muitas
vezes, os sistemas não-lineares comumente encontrados na prática podem ser tratados
como sistemas lineares não-estacionários.
Tradicionalmente, o controle de sistemas não-estacionários é realizado, na prática,
pelo uso de técnicas de escalonamento de ganhos (ou interpolação de controladores2). O
principal objetivo desses métodos é controlar um sistema que evolui num amplo domínio
de funcionamento, para o qual as técnicas de controle robusto Linear Invariante no Tempo
(LTI, do inglês Linear Time Invariant) se mostram ineficazes. Além de permitirem a
incorporação de propriedades de robustez em estabilidade face às incertezas do sistema,
2O termo em inglês gain-scheduling costuma ser traduzido para a língua portuguesa como “tabela-
mento de ganho” ou “escalonamento de ganho”. Neste trabalho é adotada a expressão “escalonamento de
ganho”. Para a tradução da palavra scheduling, é adotada a palavra “interpolação” ou “escalonamento”.
19
os controladores interpolados possuem outra característica favorável importante que é
a adaptação em tempo real do seu comportamento dinâmico, segundo a evolução dos
parâmetros (endógenos ou exógenos) que caracterizam as condições de funcionamento
do sistema. Essas técnicas ampliam o alcance dos métodos clássicos de controle robusto
LTI, que consideram somente as características lineares locais e condições particulares de
funcionamento do sistema. Este benefício da estratégia de controle por escalonamento de
ganhos é uma conseqüência da explícita utilização de informações adicionais importantes
oriundas da medida dos parâmetros variantes.
O escalonamento de ganhos é uma técnica bastante eficaz no controle de sistemas
não-estacionários. Desde as primeiras publicações sobre o assunto, há cerca de trinta
anos atrás, essa técnica tem sido aplicada em várias áreas. Apesar dessa prática ter se
difundido em larga escala, só recentemente o interesse teórico sobre ganhos escalonados
para sistemas LPV e sistemas não-lineares têm aumentado significativamente (SHAMMA,
1990; SHAHRUZ, 1992; KAMLER, 1995).
O desenvolvimento de novos métodos de interpolação de controladores tem desper-
tado grande interesse na comunidade científica pela ampla diversidade de suas aplicações
e pelo surgimento de técnicas modernas de controle robusto. Contudo, os métodos mais
utilizados no meio industrial são aqueles chamamos de “clássicos”, “convencionais” ou
“tradicionais”. Eles se baseiam em um conjunto de modelos LTI obtidos a partir da fi-
xação do parâmetro variante de um modelo originalmente LPV ou LTV por linearização
de um modelo não-linear em torno de uma família de pontos de operação3. Um con-
junto de técnicas de controle linear (LQG, PRLQG, PRCBI, H2, H∞, síntese µ , etc.,
e suas variantes) está, então, disponível para o projeto de uma família de controladores
LTI que ofereçam um compromisso razoável entre o desempenho e a robustez em esta-
bilidade em torno das condições de funcionamento dadas. Quanto as estratégias para a
interpolação, elas variam bastante segundo o método de síntese linear e a estrutura dos
controladores LTI escolhidos e são, na maioria das vezes, intuitivas e baseadas em uma
diretiva heurística principal: os controladores lineares são supostos suficientemente próxi-
mos para permitir transições suaves e para assimilar os comportamentos não-estacionários
provenientes das não-linearidades do sistema.
A interpolação é baseada na medida de um parâmetro que define os pontos de ope-
ração do sistema acarretando o ajuste da FT (Função de Transferência) que modela o
3Ver (SHAMMA, 1990; RUGH, 1991; KELLET, 1991; REICHERT, 1992; HYDER, 1993; NICHOLS,
1993; KAMLER, 1995; LAWRENCE, 1995; STILWELL, 1997) .
20
sistema ou dos elementos das matrizes A,B,C e D do modelo em espaço de estado. Entre
as estratégias de interpolação mais utilizadas, encontram-se aquelas que atuam sobre os
coeficientes de funções de transferência (NICHOLS, 1993), ou sobre os coeficientes de
realizações de estado (KELLET, 1991; HYDER, 1993), ou ainda, quando se tratar de
um conjunto de controladores lineares robustos H2 ou H∞, soluções de equações de Ric-
cati (REICHERT, 1992). O controlador interpolado convencional é, então, um sistema
não-estacionário (LPV ou não-linear), obtido por interpolação (linear, fuzzy, ou outra
qualquer) de controladores LTI em relação às variáveis de interpolação.
A interpolação clássica de controladores apresenta dificuldades teóricas no que se
refere à estabilidade e ao desempenho durante as transições entre os controladores locais,
em parte devido à forte dependência do comportamento do sistema global em relação à
estratégia de interpolação utilizada. Além disso, as etapas de síntese dos controladores
e a formulação da lei de interpolação são conduzidas separadamente, o que não garante
que o sistema não-estacionário em malha fechada seja estável e que o desempenho apre-
sentado em torno dos pontos de projeto prevaleçam de uma forma global. Simulações
exaustivas, inclusive simulações hardware-in-the-loop, são em geral efetuadas para avaliar
o comportamento do sistema controlado em regime não-estacionário.
Devido a estas dificuldades, poucos resultados teóricos em escalonamento de ganhos
convencionais têm sido publicados. Em (SHAHRUZ, 1992), um algoritmo para interpo-
lação linear de ganhos por realimentação de estados é proposto. Em (STILWELL, 2000),
os autores apresentam dois métodos para interpolação de controladores por escalona-
mento de ganhos: o primeiro apresenta fatores coprimos de funções de transferências e o
segundo é baseado na descrição em espaço de estado. Em (STILWELL, 1999), os ganhos
de realimentação e de observação de estados são interpolados no contexto do escalona-
mento de ganhos. Essas técnicas garantem, com certo grau de conservadorismo e sob
restrição de variação lenta do parâmetro, a estabilidade exponencial local do sistema em
malha fechada.
Atualmente, a interpolação de controladores é também tratada no contexto do con-
trole LPV (LU, 1992; BECKER, 1993; PACKARD, 1994; LU, 1995; BECKER, 1995;
APKARIAN, 1995a,b; WU, 1996; SCHERER, 1996; APKARIAN, 1998a,b; KAJIWARA,
1999; TUAN, 1999), onde funções de Lyapunov são utilizadas para definir a estabilidade
e o desempenho para uma larga faixa de variação do parâmetro. Na verdade os ter-
mos “controle LPV” ou “interpolação LPV” são utilizados para designar as técnicas de
interpolação de controladores onde as necessidades práticas da interpolação, ou seja, a
21
estabilidade e o desempenho, são satisfeitos de uma forma sistemática dentro de um con-
texto de otimização convexa sob restrições do tipo Desigualdade Matricial Linear (LMI
- do inglês Linear Matrix Inequality).
Os métodos de interpolação LPV distinguem-se das técnicas de interpolação, mais
pela sua maneira sistemática de tratar o problema, do que pelo seu objetivo. Do ponto
de vista conceitual, a interpolação do tipo LPV é, no entanto, muito diferente, já que as
questões relacionadas à estabilidade e ao desempenho em tempo variante são considera-
das diretamente na síntese dos controladores LPV. A tarefa mais exigente consiste em
resolver problemas de otimização do tipo LMI. Isso é relativamente fácil utilizando-se os
códigos de programação semi-definida disponíveis atualmente. Trata-se, na realidade, de
uma extensão dos métodos de controle robusto LTI, do tipo H2 e H∞, aos sistemas não-
estacionáriosLPV ou quasi -LPV. Em suma, as técnicas LPV são igualmente aplicáveis
a modelos por natureza LTV ou LPV, a modelos linearizados (parametrizados por va-
riáveis de interpolação) ou a modelos quasi -LPV. Estas vantagens explicam o repentino
interesse nos últimos anos por esse tipo de técnica (BECKER, 1993; PACKARD, 1994;
APKARIAN, 1995a; SCHERER, 1996; KAJIWARA, 1999).
Apesar dos esforços e desenvolvimentos teóricos recentes, alguns problemas delicados
persistem, não apenas na interpolação convencional, mas também na interpolação LPV.
Percebe-se que, entre as raras técnicas clássicas que garantem teoricamente a estabilidade
não-estacionária, uma boa parte é essencialmente baseada na interpolação de matrizes
de estado ou de ganhos de estruturas estimação-controle (observer-based structures) de
controladores LTI ótimos robustos ou de controladores ótimos LQ (Quadrático Linear)
ou LQG (Gaussiano Quadrático Linear). Uma dificuldade importante reside no fato
que o comportamento dinâmico dos controladores interpolados depende de uma forma
crítica das representações de estado adotadas para a família de controladores lineares
projetados sobre um conjunto de pontos de operação. Assim, as primeiras questões que
se apresentam são:
• Como escolher um conjunto de bases no espaço de estado que conduza a realizações
de controladores locais apropriados para a interpolação?
• Qual o melhor conjunto de pontos de operação sob a ótica da interpolação?
Em relação às técnicas LPV, algumas são potencialmente muito conservadoras, pois
utilizam funções de Lyapunov independentes dos parâmetros do sistema, toleram taxas
22
arbitrárias de variação desses parâmetros e exigem classes específicas e restritivas de repre-
sentações LPV (LU, 1992; BECKER, 1993; APKARIAN, 1995a,b; LU, 1995; SCHERER,
1996; APKARIAN, 2000; PELLANDA, 2002a). Outras, ao contrário, utilizam funções de
Lyapunov dependentes dos parâmetros, consideram limites realistas da taxa de variação
dos parâmetros e toleram uma dependência paramétrica geral do sistema (BECKER,
1995; WU, 1996; APKARIAN, 1998a,b; TUAN, 1999). Estas são muito pouco conser-
vadoras, mas introduzem uma grande complexidade na implementação do controlador
interpolado.
Esta dissertação aborda o estudo, o aprimoramento e o desenvolvimento de técnicas
de escalonamento de ganhos clássicas, com uma orientação particular para o caso da
realimentação de estados e da estrutura estimação-controle, aplicáveis em diversas áreas
no campo da engenharia de controle. Um enfoque especial é também dado ao desen-
volvimento de novos algoritmos de identificação do tipo caixa-preta aplicáveis a sistemas
lineares e do tipo caixa-cinza aplicáveis a sistemas não-lineares.
1.2 OBJETIVOS DA DISSERTAÇÃO
Os objetivos deste trabalho são:
a) Desenvolver novos algoritmos de identificação dos tipos caixa-preta e caixa-cinza,
para sistemas lineares e não-lineares (quasi -LPV), baseados no emprego de amostras
discretas dos sinais de entrada e saída da planta física nos domínios do tempo e da
freqüência;
b) Aprimorar a metodologia de escalonamento de ganhos clássico desenvolvido em
(PELLANDA, 2001) de modo a equipá-lo com um método de escolha sistemática
de um conjunto de pontos de síntese, a fim de aproximar o modelo não-linear da
planta em toda uma faixa de operação;
c) Desenvolver novas metodologias clássicas de escalonamento de ganhos baseadas na
realimentação de estados e na estrutura estimação-controle para algumas classes de
sistemas não-estacionários.
1.3 ORGANIZAÇÃO DA DISSERTAÇÃO
Além desta introdução, a dissertação está organizada em mais 6 capítulos, além de
um apêndice:
23
• O Capítulo 2 recorda os principais fundamentos que permitem entender o desen-
volvimento das contribuições desta dissertação.
• O Capítulo 3 apresenta as contribuições deste trabalho para a identificação de
sistemas. São apresentadas três novas metodologias baseadas na buscas de um
modelo que minimize um custo quadrático representativo do erro de estimação.
Duas delas são apropriadas para a identificação de modelos LTI e a outra é aplicável
a uma classe de sistemas não-lineares, fornecendo modelos não-estacionários do
tipo quasi -LPV. Todas as técnicas desenvolvidas apresentam solução analítica ao
problema de minimização do erro de estimação.
• O Capítulo 4 apresenta o processo de escalonamento de ganhos desenvolvido em
(PELLANDA, 2001) e propõe um método de escolha sistemática de um conjunto
de pontos de síntese que melhor aproxime o modelo não-linear da planta em toda
uma faixa de operação sendo, portanto, mais apropriado para o escalonamento de
ganhos. Apresenta também duas novas metodologias clássicas de escalonamento de
ganhos baseadas na realimentação de estados e na estrutura estimação-controle.
• No Capítulo 5 são ilustradas as técnicas apresentadas nos Capítulos 3 e 4 através
de diversas aplicações numéricas.
• O Capítulo 6 traz as conclusões tiradas a partir dos resultados obtidos ao longo
deste trabalho e aponta algumas perspectivas futuras.
• No Capítulo 7 são apresentadas as referências bibliográficas.
• No Apêndice encontram-se os modelos utilizados e identificados no Capítulo 5.
24
2 FUNDAMENTOS TEÓRICOS
2.1 INTRODUÇÃO
Neste capítulo são revistos alguns fundamentos teóricos e propriedades necessárias
para o entendimento dos trabalhos apresentados nos capítulos posteriores.
A aplicação das técnicas de identificação linear proposta nesta dissertação em plan-
tas físicas estáveis podem gerar modelos que apresentem pólos instáveis. Nestes casos,
também são gerados zeros localizados no plano s sobre esses pólos ou muito próximos
deles, acarretando um modelo de ordem não-mínima. Porém, como é sabido que as
funções identificadas são estáveis, torna-se interessante decompor o modelo identificado
na soma de suas partes estável e antiestável (ou instável), ignorando esta última e apli-
cando à primeira uma redução de ordem por truncamento balanceado. Assim, elimina-se
o problema da ordem não-mínima causado pela parte instável e se obtém um modelo
final estável de ordem reduzida. As Seções 2.2 e 2.3 apresentam o suporte teórico dessas
operações.
Na Seção 2.4 discute-se os conceitos sobre sistemas LPV e quasi -LPV, úteis para
o entendimento das técnicas propostas na Seção 3.4 e no Capítulo 4, que tratam, res-
pectivamente, da identificação e do controle por escalonamento de ganhos de sistemas
não-estacionários.
Por fim, a Seção 2.5 apresenta uma metodologia de interpolação clássica de contro-
ladores dinâmicos predeterminados sob a forma estimação-controle (PELLANDA, 2000,
2001, 2002b), onde os ganhos de realimentação e de estimação de estado são os parâme-
tros interpolados. Contudo, sabe-se que uma dificuldade da interpolação clássica é o fato
do comportamento dinâmico dos controladores interpolados depender fortemente das re-
presentações de estado adotadas para a família de controladores LTI projetados sobre o
conjunto de pontos de operação escolhido. A técnica apresentada uma seqüência de trans-
formações de similaridade a serem aplicadas à família original de controladores robustos
determinados a priori, de forma que o conjunto de controladores obtidos, equivalentes aos
primeiros do ponto de vista entrada-saída, tenha uma estrutura coerente, fisicamente in-
terpretável e de fácil interpolação. Depois da transformação, os controladores apresentam
uma estrutura do tipo estimação-controle, o que facilita a interpolação e a implementação
em tempo variante. O método pode ser aplicado em controladores discretos ou contínuos,
25
de ordem completa ou aumentada e, em particular, aos projetados através de técnicas de
controle robusto H2, H∞ e síntese µ, cuja interpolação é, em geral, de difícil obtenção
sem perdas consideráveis de desempenho.
2.2 PROJEÇÃO ESTÁVEL E INSTÁVEL DE UMA REALIZAÇÃO
Seja G(s) o modelo obtido, descrito pela seguinte realização de estado
G(s) =

 A B
C D

 (2.1)
onde A ∈ Rn×n, B ∈ Rn×p, C ∈ Rq×n eD ∈ Rq×p. Este modelo pode ser reescrito como
G(s) = G(s)+ + G(s)− (2.2)
onde G(s)+ e G(s)− correspondem, respectivamente, às projeções de G(s) nos semi-planos
da direita e esquerda do plano s.
Definindo as matrizes destas realizações, G(s)+ e G(s)−, como
G(s)− =

 A11 B1
C1 D

 (2.3)
e
G(s)+ =

 A22 B2
C2 0

 (2.4)
pode-se afirmar que:
G(s) = G(s)+ + G(s)− =


A11 0
0 A22
B1
B2
C1 C2 D

 =

 Ā B̄
C̄ D

 (2.5)
onde A11 ∈ Rk×k e as demais matrizes são de dimensões compatíveis sendo k o número
de autovalores estáveis.
Definindo P ∈ Rn×n como a matriz de transformação de similaridade tal que
P−1AP = Ā, P−1B = B̄, CP = C̄ (2.6)
o problema de encontrar a decomposição desejada é resolvido ao se calcular P .
26
Aplicando uma decomposição de Schur na matriz A
[
A11 A12
0 A22
]
= UT AU = T (2.7)
onde UT U = I e T é a matriz triangular superior que possui os autovalores da matriz
A em sua diagonal com estes dispostos em ordem crescente, e sendo X uma matriz de
dimensões compatíveis tal que
Ā =
[
I1 −X
0 I2
][
A11 A12
0 A22
][
I1 X
0 I2
]
=
[
A11 A12 −XA22
0 A22
][
I1 X
0 I2
]
Ā =
[
A11 A11X −XA22 + A12
0 A22
] (2.8)
chega-se a:
A11X −XA22 + A12 = 0 (2.9)
O problema se reduz, ao cálculo de uma solução X para a equação de Lyapunov em (2.9).
Adotando-se a seguinte partição: U =
[
U1 U2
]
, de forma que U1 ∈ Rk×k, pode-se
reescrever o produto matricial P−1AP na forma
[
I1 −X
0 I2
][
UT1
UT2
]
A
[
U1 U2
] [ I1 X
0 I2
]
=
[
UT1 −XUT2
UT2
]
A
[
U1 U1X + U2
]
= P−1AP
(2.10)
Assim, tem-se também:
[
B1
B2
]
=
[
UT1 −XUT2
UT2
]
B =
[
(UT1 −XUT2 )B
UT2 B
]
(2.11)
e [
C1 C2
]
= C
[
U1 U1X + U2
]
=
[
CU1 C(U1X + U2)
]
(2.12)
o que define completamente a projeção estável G(s)− do modelo inicialmente identificado
G(s).
2.3 REDUÇÃO DE ORDEM POR TRUNCAMENTO BALANCEADO
Seja Gke(s), a parte estável, de ordem k, do modelo identificado G(s). O ajuste do
modelo Gke(s) aos dados fornecidos pelo sistema real pode acarretar uma ordem maior
27
que a necessária (k∗ = k−r). Uma função estimada não deve possuir uma ordem tão ele-
vada a ponto de acrescentar redundâncias, nem tão baixa a ponto de perder informações
relevantes. A resposta em freqüência pode ser utilizada para comparar o grau de proxi-
midade entre o sistema real e o modelo obtido, permitindo avaliar se a ordem do modelo
é compatível. Caso um modelo tenha sido encontrado com um valor de k elevado, existe
a possibilidade de se aplicar uma técnica para redução de sua ordem. Ou seja, pode se
encontrar um novo modelo de ordem reduzida, Gk−re (s), que preserve o ajuste anterior
de acordo com algum critério. O modelo final Gk−re (s) deve ser parcimonioso.
De acordo com (SKOGESTAD, 1997), uma realização balanceada é uma realização
assintoticamente estável, na qual os Gramianos de controlabilidade e observabilidade são
iguais e também são diagonais. Considerando a seguinte realização estável de G(s):
G(s) =

 A B
C D

 (2.13)
A realização em (2.13) é denominada balanceada se as soluções para as seguintes equações
de Lyapunov:
AP + PAT + BBT = 0
AT Q + QA + CT C = 0
(2.14)
são tais que: P = Q = diag(σ1, σ2, . . . , σk) , Σ, onde σ1 ≥ σ2 ≥ σ3 ≥ . . . ≥ σk ≥ 0. Os
Gramianos de controlabilidade e observabilidade, respectivamente P e Q são definidos
por:
P ,
∫∞
0
eAtBBT eA
T tdt
Q ,
∫∞
0
eA
T tCT CeAtdt
(2.15)
Neste caso
∑
é dito Gramiano de G(s). Os σi são denominados de valores singulares de
Hankel de G(s), sendo definidos por (2.16):
σi , λ
1
2
i (PQ) (2.16)
onde {λi ; i = 1, . . . , k} são os autovalores de A. Cada valor σi está associado a um
estado xi da realização balanceada do sistema. O valor σi se constitui numa medida
da contribuição que o estado xi tem no comportamento de entrada e saída do sistema.
Em resumo, se σi >> σi+1, então o estado xi afeta o comportamento de entrada e saída
para o sistema muito mais do que xi+1, permitindo calcular uma estimativa de erro
em um modelo reduzido onde os r estados {xi+1, . . . , xk} tenham sido descartados. A
implementação para obtenção de modelos de ordem reduzida foi feita a partir da função
balmr do Matlab.
28
2.4 SISTEMAS LPV E QUASI -LPV
2.4.1 MODELAGEM
Uma classe importante de sistemas dinâmicos não-estacionários pode ser represen-
tada por um conjunto de equações diferenciais não-lineares de ordem qualquer. Para uma
escolha apropriada dos vetores das variáveis de estado x(t) ∈ Rn, de entrada u(t) ∈ Rm
e de saída y(t) ∈ Rp, pode-se freqüentemente obter um modelo não-linear em relação
aos estados, mas linear em relação à entrada, que implique em uma equação matricial
diferencial de primeira ordem e uma equação matricial algébrica:
ẋ(t) = A(θx, θp)x + B(θx, θp)u
y(t) = C(θx, θp)x + D(θx, θp)u
(2.17)
As funções matriciais reais A(.), B(.), C(.) e D(.) são supostas contínuas e limi-
tadas, de dimensões compatíveis com as dimensões dos sinais e definem completamente a
dinâmica do sistema. Este tem uma característica não-linear e não-estacionária originada
pelas variáveis θx e θp:
• θx(x(t)) ∈ Rr1 é uma variável endógena, ou seja, que depende da dinâmica interna
do sistema e que o torna não-linear;
• θp(x(t)) ∈ Rr2 é um parâmetro exógeno, ou seja, que evolui no tempo de forma
independente da dinâmica interna do sistema.
Na síntese de controladores dentro da técnica de escalonamento clássico de ganhos,
a primeira etapa corresponde a obtenção de uma descrição linear aproximada do sistema
não-linear (2.17) que envolve um conjunto conveniente das variáveis de interpolação θ(t).
A maneira mais utilizada na prática consiste em:
• obter, via uma linearização Jacobiana clássica do modelo (2.17) em torno de um
conjunto de pontos de equilíbrio x(i)0 (u
(i)
0 ), i = 1, 2, ..., um modelo linearizado:
ẋ = A(θi)x + B(θi)u
y = C(θi)x + D(θi)u
parametrizado por
θi(t) =
[
θ(x
(i)
0 )
θp(t)
]
∈ Rr, r = r1 + r2;
29
• definir uma trajetória nominal de x0(t) para o sistema e, supondo que θx(t) e
dθx(t)/dt são limitadas e independentes de x0(t) e dx0(t)/dt, derivar um modelo do
tipo LPV
ẋ = A(θ)x + B(θ)u
y = C(θ)x + D(θ)u
(2.18)
onde o parâmetro e sua taxa de variação evoluem em domínios compactos, θ(t) ∈
DΘ ⊂ Rr, θ̇(t) ∈ DΘd ⊂ Rr,∀t;
• eventualmente, escolher uma trajetória θ(t) ←− θ0(t) ou “congelar” o parâmetro
em um ponto dado θ(t) ←− θ0(t), para obter, respectivamente, um modelo LTV ou
LTI.
Nota-se que apesar das funções matriciais A(.), B(.), ... terem representações análo-
gas, em geral são diferentes daquelas que constam em (2.17).
Uma outra forma mais recente e mais direta de se chegar a um modelo similar àquele
de (2.18), a partir (2.17), consiste simplesmente em ignorar a etapa de linearização.
Escolhendo convenientemente a função θx(x(t)), reescreve-se o modelo numa forma onde
os termos não-lineares possam ser redefinido por um parâmetro variante unicamente em
função do tempo θx(t). De forma similar ao caso anterior, considera-se que as trajetórias
desse parâmetro são limitadas e independentes das trajetórias de x(t), o que desconecta
as funções matriciais A(.), B(.), ... do espaço de estados. Ele é então incluído na variável
de interpolação, juntamente com o parâmetro θp(t):
θ =
[
θx(t)
θp(t)
]
(2.19)
Isso quer dizer que certos estados, ou funções dos estados, são classificados como
variáveis exógenas em certas partes do modelo, enquanto que em outras permanecem
como variáveis endógenas. Esta hipótese leva a um certo conservadorismo, mais ou menos
importante, na etapa de síntese dos controladores. Nesse caso particular, o modelo (2.18)
é denominado quasi -LPV.
Se uma lei de interpolação é satisfatória para todas as trajetórias no domínio DΘ ×
DΘd , ela é igualmente satisfatória para as trajetórias realistas dos estados que interferem
em θ. Contudo, o conservadorismo introduzido pela modelagem quasi -LPV é tão menos
desprezível quanto maior o número de estados implicados no parâmetro. Considerando,
por exemplo, o sistema não-linearẋ1 = sen(x1) + x2, ẋ2 = x1x2 + u
30
Uma representação quasi -LPV é
ẋ = A(x)x + Bu =
[
sen(x1)/x1 1
x2 0
]
x +
[
0
1
]
u
com x1 6= 0 e θx(x) = x , [x1 x2]T . Esta representação é certamente mais conservadora
do que a seguinte:
ẋ = A(x)x + Bu =
[
sen(x1)/x1 1
0 x1
]
x +
[
0
1
]
u
onde o parâmetro θx(x) é inteiramente definido por somente uma variável de estado
(θx(x) = x1) e, em conseqüência, a dimensão do espaço que pode incluir as trajetórias
não-realistas é menor. Enfim, um sistema pode ainda ser, pela sua própria natureza, LPV
ou LTV e nenhuma aproximação ou linearização suplementar é necessária para construir
o modelo (2.18).
O modelo LPV ou quasi -LPV (2.18) tolera uma dependência paramétrica bastante
geral, que engloba a maior parte das situações práticas. Esta propriedade requer a uti-
lização e o desenvolvimento de metodologias sofisticadas e complexas de análise e síntese
de leis de controle por escalonamento de ganho. No entanto, duas outras classes mais
restritivas de modelos LPV, obtidas da forma mais geral (2.18), são as vezes admissíveis
e mais adaptadas a certos métodos específicos de controle LPV. Embora estes modelos
não sejam diretamente utilizados neste trabalho, eles são apresentados a seguir.
Uma dessas classes refere-se aos modelos do tipo Transformação Linear Fracionária
(LFT, do inglês Linear Fractional Transformation). Uma dependência LFT do sistema
(2.18) em relação ao parâmetro θ(t) é definido como
[
A(θ) B(θ)
C(θ) D(θ)
]
,
[
A B2
C2 D22
]
+
[
Bθ
D2θ
]
∆(θ)(I −Dθθ∆(θ))−1
[
Cθ Dθ2
]
(2.20)
onde ∆(θ) é uma função matricial linear em θ. Este é suposto pertencente a um domínio
politópico
PΘ , co{Θ1, Θ2, ..., ΘL} (2.21)
onde Θi com i = 1, 2, ..., L designam os vértices do politopo PΘ. Tais modelos exigem,
em geral, hipóteses que simplifiquem sua obtenção, o que pode levar a um certo conser-
vadorismo.
A outra classe de representação LPV é a dos modelos politópicos. Se a função
matricial
31
S(θ) ,
[
A(θ) B(θ)
C(θ) D(θ)
]
é afim em θ = [θ1, θ2, ..., θr]T , isto é,
S(θ) = S0 +
∑r
l=1 θlSl
e as componentes escalares θl, l = 1, 2, ..., r, evoluem (por hipótese) independentemente
num domínio limitado DΘ que é um subconjunto do domínio politópico (2.21), DΘ ⊆ PΘ,
então o modelo admite um representação politópica
S(θ) = co{S1, ..., SL} = co{S(Θ1), ..., S(ΘL)} (2.22)
Este modelo não carrega nenhum conservadorismo se a condiçãoDΘ = PΘ é satisfeita.
Ao contrário, se PΘ representa um recobrimento politópico de DΘ o modelo é fortemente
conservador. Nenhuma atenção especial é dedicada à este tipo de representação neste
estudo.
2.4.2 ANÁLISE DE ESTABILIDADE
O critério de estabilidade por meio da localização dos autovalores da matriz de
dinâmica A para sistemas LTI não é suficiente para sistemas LPV. De fato, pode-se
mostrar, por exemplos simples, que mesmo quando todos os componentes da família de
sistemas LTI obtidos pelo congelamento do parâmetro são estáveis, ainda assim o sistema
LPV pode ser instável. Ou seja, para o sistema LPV
ẋ(t) = A(θ(t))x(t) + B(θ(t))u(t)
y(t) = C(θ(t))x(t) + D(θ(t))u(t), ∀θ ∈ PΘ
(2.23)
onde A ∈ Rn×n, D ∈ Rp×m e PΘ é o domínio de variação paramétrica, a condição
Re(λi(A(θ))) < 0, i = 1, ...n, ∀θ ∈ PΘ (2.24)
não é suficiente para que se infira a estabilidade. Apesar disso, existe uma noção intuitiva
de que se a variação do parâmetro for suficientemente lenta, a estabilidade do conjunto de
sistemas LTI implica a estabilidade do sistema LPV. Nesse contexto se insere o teorema
a seguir.
Teorema 2.1. (DESOER, 1975) O sistema LPV 2.23 é globalmente estável se as
condições seguintes forem válidas:
32
• Re(λi(A(θ))) < 0, i = 1, ...n, ∀θ ∈ PΘ,
• ∃α > 0 suficientemente pequeno tal que ‖ d
dt
θ(t)‖ < α, ∀t ≥ 0, ∀θ ∈ PΘ.
Ainda que o Teorema 2.1 mostre que, sob condição de variação lenta do parâmetro,
a estabilidade do sistema LPV pode ser determinada a partir da estabilidade LTI, ele
não indica qual é o valor α que caracteriza a velocidade dessa variação. Assim, do ponto
de vista prático, não se costuma inferir sobre a estabilidade de um sistema LPV pela
estabilidade LTI. Faz-se, então, necessária a utilização de uma teoria mais abrangente,
como a teoria de estabilidade de Lyapunov (VIDYASAGAR, 1978; KHALIL, 1996). A
teoria de Lyapunov é bastante geral, de maneira que são abordados nesta seção apenas
alguns pontos básicos mais interessantes para o contexto deste estudo.
Seja o sistema autônomo geral
ẋ = f(x, t), x ∈ Rn, t ≥ t0
x(t0) = x0
(2.25)
Supõe-se que sejam válidas as hipóteses de existência e unicidade para a solução do
sistema de equações diferenciais que regem o sistema (2.25). Além disso, supõe-se que
x0 = 0 seja um ponto de equilíbrio para o sistema4, ou seja, ∀t ≥ t0, f(0, t) = 0
Definição 2.1 (Estabilidade Assintótica Uniforme (Global)). A trajetória de equi-
líbrio x ≡ 0 é dita uniformemente assintoticamente estável se:
• ∀² > 0, ∃δ(²) tal que t ≥ t0 ≥ 0, ‖x(t0)‖ < δ ⇒ ‖x(t)‖ < ²,
• ∃c > 0 | ∀‖x(t0)‖ < c, x(t) → 0 quando t →∞, sendo que
∀² > 0,∃T (c) | ∀t > t0 + T , ‖x(t)‖ < ².
Se essas condições forem verificadas para c → ∞, então a trajetória de equilíbrio x ≡ 0
é dita globalmente uniformemente assintoticamente estável.
Definição 2.2 (Estabilidade Exponencial (Global)). A trajetória de equilíbrio x ≡ 0
é dita (globalmente) exponencialmente estável se:
• as condições de estabilidade assintótica uniforme (global) forem verificadas,
• ∃λ > 0 tal que ∀‖x(t0)‖ < c, ∃M(x(t0)) tal que t ≥ t0 ⇒ ‖x(t)‖ ≤ Me−λt
O teorema a seguir é central na teoria de Lyapunov.
4Essa hipótese não é restritiva, sendo satisfeita por simples translação (VIDYASAGAR, 1978, p.132).
33
Teorema 2.2. (VIDYASAGAR, 1978) O sistema (2.25) é globalmente uniformemente
assintoticamente estável se existe uma função continuamente diferenciável, V (t, x),
definida sobre R+ × Rn com valores em R, tal que, para todo x ∈ Rn e todo t positivo:
α1(‖x‖) ≤ V (t, x) ≤ α2(‖x‖) (2.26)
∂V
∂t
+
∂V
∂x
f(t, x) ≤ −α3(‖x‖) (2.27)
onde α1, α2 e α3 são funções definidas sobre R+ com valores em R+, contínuas, estrita-
mente crescentes, não limitadas e nulas na origem.
O primeiro membro de (2.27), que representa a derivada temporal de V , é chamado
de derivada de V ao longo das trajetórias do sistema (2.25) e é definido como
V̇ (t, x) :=
dV
dt
=
∂V
∂t
+
∂V
∂x
dx
dt
=
∂V
∂t
+
∂V
∂x
f (2.28)
Pode-se notar que, pelo Teorema 2.2, V (t, 0) = 0 para todo t > 0.
O teorema a seguir é uma variação do Teorema 2.2. Ele faz uma extensão para funções
V que sejam continuamente diferenciáveis por partes. Por outro lado, ele particulariza
as funções αi para
αi(‖x‖) = λi‖x‖c, λi > 0, c > 0 (2.29)
Além disso, V passa a ser função apenas de x.
Teorema 2.3. (PETTERSSON, 1997) O sistema (2.25) é globalmente exponencialmente
estável se existe uma função continuamente diferenciável por partes, V (x), definida sobre
Rn com valores em R, tal que, para todo x ∈ Rn e todo t positivo:
λ1‖x‖c ≤ V (x) ≤ λ2‖x‖c (2.30)
V̇ (x) ≤ −λ3‖x‖c (2.31)
com λ1, λ2, λ3 estritamente positivas e reais.
A função V que atende as condições dos Teoremas 2.2 e 2.3 é chamada de função
de Lyapunov. Essa função pode ser vista como uma medida generalizada da energia do
sistema. Existe uma idéia intuitiva por trás dos Teoremas 2.2 e 2.3 de que o sistema
será estável se a energia do sistema (ou a função V ) for decrescente ao longo de todas as
trajetórias desse sistema. Embora não esteja explicito, a estabilidade exponencial global
garante a estabilidade de um ponto de vista entrada/saída (KHALIL, 1996).
34
Vale destacar que, embora o Teorema 2.3 aponte para a estabilidade do sistema (2.25)
caso seja possível encontrar uma função de Lyapunov para esse sistema, ele não indica
como fazê-lo.
Seja, agora, a particularização do sistema autônomo (2.25) para o caso LPV
ẋ = A(θ)x, x ∈ Rn, t ≥ t0
x(t0) = x0
(2.32)
Para analisar a estabilidade desse sistema, será utilizada uma função de Lyapunov V (θ, x)
quadráticaV (θ, x) = xT P (θ)x (2.33)
com P (θ) simétrica. Isso porque, para sistemas lineares, a estabilidade assintótica uni-
forme pode ser inferida, por meio do Teorema 2.3, utilizando-se uma função de Lya-
punov quadrática (VIDYASAGAR, 1978, p.183). Uma outra característica importante
dos sistemas lineares é que a estabilidade assintótica uniforme é equivalente à estabilidade
exponencial (VIDYASAGAR, 1978, p.170).
Para a função de Lyapunov dependente do parâmetro, V (θ, x), a derivada ao longo
das trajetórias é obtida por
V̇ (θ, x) =
∂V
∂θ
dθ
dt
+
∂V
∂x
dx
dt
(2.34)
Segundo o Teorema 2.3, para que V seja uma função de Lyapunov e, conseqüente-
mente, o sistema seja estável, ela deve satisfazer
V (θ, x) > 0, V̇ (θ, x) < 0, x 6= 0
V (θ, 0) = 0 e V̇ (θ, 0) = 0
(2.35)
A primeira restrição é satisfeita quando a matriz P (θ) é positiva definida
P (θ) = P (θ)T > 0,∀θ ∈ PΘ (2.36)
A segunda implica, de acordo com (2.34), em
xT ∂P (θ)
∂θ
dθ
dt
x + xT P (θ)(A(θ)x) + (xT AT (θ))P (θ)x =
xT [∂P (θ)
∂θ
dθ
dt
+ P (θ)A(θ) + AT (θ)P (θ)]x < 0
(2.37)
que é satisfeito quando
∂P (θ)
∂θ
dθ
dt
+ P (θ)A(θ) + AT (θ)P (θ) < 0, ∀θ ∈ PΘ (2.38)
35
Assim, se for possível determinar uma matriz P dependente de θ e positiva definida
tal que a inequação matricial parametrizada (2.38) seja satisfeita, então V (θ, x) será uma
função de Lyapunov e o sistema (2.32) será estável.
A inequação matricial (2.38) é uma Desigualdade Linear Matricial Parametrizada,
ou PLMI (do inglês Parametrized Linear Matrix Inequality). Como o parâmetro θ é uma
função contínua do tempo, a PLMI tem que ser satisfeita para todos os infinitos valores
de θ.
Para sistemas LTI basta considerar a matriz P constante, de forma que o problema
de análise de estabilidade se reduz a determinar uma matriz P = P T > 0 tal que
PA + AT P < 0 (2.39)
A LMI (2.39) é condição necessária e suficiente para que a parte real dos pólos do
sistema LTI seja negativa (VIDYASAGAR, 1978; KAILATH, 1980).
2.5 INTERPOLAÇÃO DE CONTROLADORES ROBUSTOS DE ESTRUTURA
ESTIMAÇÃO-CONTROLE
No contexto do escalonamento de ganhos clássico, se os controladores lineares a serem
interpolados forem muito diferentes em pontos de operação vizinhos, uma variação rápida
é introduzida artificialmente na dinâmica de malha fechada, o que pode produzir um efeito
desestabilizante ou uma perda de desempenho. Então, para se obter um comportamento
desejável na interpolação de controladores lineares, estes devem obrigatoriamente ter
estruturas compatíveis.
Isto se torna crítico quando os dados são interpolados numa abordagem em espaço de
estado, pois o comportamento dinâmico do controlador escalonado pode depender forte-
mente das realizações adotadas para a família de controladores lineares projetada para
o conjunto escolhido de pontos de operação. Este fato é ilustrado em (LEITH, 1998a;
STILWELL, 1999, 2000). Em (STILWELL, 1999, 2000) os autores apresentam justifica-
tivas teóricas e condições suficientes para a alocação de controladores LTI de modo que
a estabilidade a tempo variante sempre exista5. Também apresentam condições (conser-
vadoras) para o cálculo de um limitante superior para a taxa de variação do parâmetro
de escalonamento, de forma que a estabilidade a tempo variante esteja assegurada. In-
felizmente, no contexto de interpolação em espaço de estado, esses métodos são restritos
a controladores de ordem completa, ou seja, de mesma ordem da planta. Além disso, as
5Ver também (?STILWELL, 1997) e os exemplos numéricos apresentados.
36
condições de estabilidade e desempenho são verificadas a posteriori, o que não elimina o
algo grau de empirismo na escolha dos pontos de operação.
Esses resultados mostram claramente que uma transição satisfatória depende não
somente da “distância” entre os pontos de operação, mas também da “proximidade” en-
tre os coeficientes dos respectivos controladores LTI. Deve-se notar que a interpolação
desses coeficientes representa também uma variação paramétrica para o sistema em malha
fechada e quanto maior a diferença entre eles para pontos vizinhos, maior será a sua taxa
de variação, o que prejudica a estabilidade a tempo variante.
Mesmo supondo que o conjunto de pontos de operação seja apropriadamente esco-
lhido, projetar um conjunto correspondente de controladores de modo a favorecer uma
interpolação suave, não é uma questão de fácil solução no contexto das técnicas clássi-
cas de escalonamento de ganhos, especialmente quando se trata de técnicas de controle
robusto dos tipos H2, H∞ e síntese µ. No caso particular da estrutura controlador-
observador, a interpolação dos ganhos de controle e de estimação é mais intuitiva, apesar
desses ganhos não serem as únicas variáveis a serem interpoladas. Os coeficientes do
controlador também dependem dos dados da realização do modelo do sistema a controlar
e devem evoluir de forma consistente com a sua dinâmica. Isto é, variações significativas
ou não-linearidades da planta devem ser adequadamente compensadas pelo ajuste do
controlador.
Nesta seção, são apresentadas as técnicas propostas em (PELLANDA, 2000, 2001,
2002b) para o cálculo de realizações equivalentes do tipo estimação-controle de um con-
junto de controladores estabilizantes arbitrários associados a um dado conjunto de pontos
de operação de um sistema. A família resultante de controladores de estrutura estimação-
controle pode ser interpolada mais facilmente. Apesar dessas técnicas serem gerais, de
modo a simplificar a apresentação, os casos dos controladores não estritamente próprios
e a tempo discreto são aqui omitidos, mas também a estes são aplicáveis tal metodologia.
Na literatura de controle pode-se encontrar várias expressões freqüentemente uti-
lizadas como termos equivalentes para “controlador de estrutura estimação-controle”:
observer-based structure, observer state (feedback) controller, LQG (form) controller,
estimator-controller structure (or form), observer-controller structure, state estimator-
state feedback structure, entre outras.
37
2.5.1 FORMULAÇÃO DO PROBLEMA
A definição a seguir é necessária para a compreensão do problema a ser proposto
nesta seção.
Definição 2.3 (Controlador de estrutura estimação-controle). (ZHOU, 1996)
Dada uma realização (A,B,C) de um sistema qualquer, com (A,B) estabilizável e (C,A)
detectável, então existem matrizes Kc e Kf tais que os autovalores de A−BKc e A−KfC
são estáveis. O controlador definido por u = K(s)y, onde
K(s) =

 A−BKc −KfC Kf
−Kc 0

 (2.40)
é chamado de “controlador de estrutura estimação-controle”.
Considere os sistemas em malha fechada descritos na FIG. 2.1, onde
G(s) =
[
G11(s) G12(s)
G21(s) G22(s)
]
(2.41)
e
P (s) =
[
P11(s) P12(s)
P21(s) P22(s)
]
(2.42)
são, respectivamente, o modelo de síntese nominal e aumentado. O sinal r é o sinal de
referência e os sinais w, e, z e y são, respectivamente, a entrada exógena, o controle, a
saída controlada e a saída medida de P (s).
+
(
 )
s
P
(
 )
s
G
(
 )
s
W
o
 (
 )
s
W
i
(
 )
s
K
w
r
e
y
z
u
+
(
 )
s
P
(
 )
s
J
w
r
e
y
z
u
(
 )
s
Q
1
y
1
u
(
 )
s
K
e
(a) Controlador original
 (b) Controlador equivalent
(a) - Controlador original (b) - Controlador equivalente
FIG. 2.1: Sistemas em malha fechada
O modelo nominal G22(s), suposto estritamente próprio sem perda de generalidade,
é definido pela representação estabilizável e detectável:
G22(s) =

 A B
C 0

 (2.43)
38
com A ∈ Rn×n, B ∈ Rn×m e C ∈ Rp×n. Supõem-se também que o sistema aumentado
P22(s) =

 Ap Bp
Cp 0

 (2.44)
com spec(Ap) ⊇ spec(A), é estabilizável e detectável e incorpora algumas dinâmicas
fictícias suplementares, notadamente as ponderações frequenciais e/ou os multiplicadores
dinâmicos estáveis Wi(s) e Wo(s). O sistema G22(s) corresponde à dinâmica física6 que se
deseja estabilizar através de um controlador de estrutura estimação-controle. O modelo
P22(s) se distingue de G22(s) pela possível presença de modos não-observáveispor y e/ou
não-controláveis por e. Mesmo que esses dois sistemas sejam equivalentes do ponto de
vista entrada-saída, neste capítulo, as notações (2.43) e (2.44) serão mantidas a fim de
possibilitar a distinção entre as dinâmicas física e aumentada.
Como já foi salientado anteriormente, não existe perda de generalidade ao se supor
que D = 0. De fato, se D 6= 0, é fácil formular um problema equivalente com D = 0
aplicando-se uma transformação linear fracionária apropriada ao controlador. Supondo
que K(s) seja um controlador para G22(s) com D = 0. Para um sistema em que D 6= 0,
o respectivo controlador pode ser reescrito como:
K(s) (I + DK(s))−1 (2.45)
O problema tratado nesta seção pode ser definido como:
Dados os sistemas G22(s) e P22(s) e um controlador estabilizante original (Figure 2.1-(a))
K(s) =
[
AK BK
CK DK
]
(2.46)
onde AK ∈ RnK×nK , nK ≥ n, DK ∈ Rm×p e BK , CK são matrizes reais de dimensões
compatíveis, calcular uma transformação de similaridade, T , tal que o controlador
Ke(s) =
[
T−1AKT T−1BK
CKT DK
]
(2.47)
equivalente a (2.46) do ponto de vista entrada-saída, apresente uma es-
trutura explicitamente separada (FIG. 2.1-(b)) e que J11(s) tenha uma es-
trutura estimação-controle em relação ao sistema físico G22(s) (FIG. 2.2).
O esquema mostrado na FIG. 2.2 explicita a estrutura procurada. Trata-se, portanto,
de buscar, através do cálculo de T , um controlador equivalente Ke(s) que apresente uma
6Eventualmente incluindo a dinâmica dos atuadores e dos sensores.
39
+
(
 )
s
P
(
 )
s
G
(
 )
s
W
o
 (
 )
s
W
i
w
r
e
y
z
u
1
y
1
u
-K
c
+
 C
 +
 +
 B
 +
A
(
 )
s
Q
_
K
f
x
(
 )
s
J
^
 x
^
.
FIG. 2.2: Parametrização de Youla e a estrutura estimação-controle
estrutura do tipo LFT inferior em relação ao parâmetro de Youla Q(s) ∈ RH∞:
Ke(s) = J11(s) + J12(s)Q(s) [I + J22(s)Q(s)]
−1 J21(s)
onde os coeficientes J11(s), J12(s), J21(s), J22(s) são os elementos da matriz transferência
entre [yT yT1 ]T e [uT uT1 ]T
J(s) :=
[
J11(s) J12(s)
J21(s) J22(s)
]
=


A−BKc −KfC Kf B
−Kc 0 Im×m
−C Ip×p 0

 (2.48)
Os ganhos Kc, Kf são escolhidos tais que A − BKc e A − KfC sejam estáveis7. A
representação de estado de J11(s) é a mesma vista em (2.40), com x̂ sendo uma estimativa
assintótica dos reais estados x de G22(s). O erro x− x̂ tende a 0 quando o tempo t tende
a infinito, para entradas exógenas nulas (w = 0).
Adotando a notação
Q(s) =

 Aq Bq
Cq Dq

 (2.49)
para uma realização mínima de Q, onde Aq ∈ Rnq , nq = nK − n e Bq, Cq, Dq têm
7É importante notar que essas restrições de estabilidade são sempre satisfeitas se existe uma tal matriz
T , isto é, se a equivalência entre (2.46) e (2.47) for assegurada.
40
dimensões compatíveis, obtém-se
Ke(s) =


A−BKc −KfC −BDqC BCq Kf + BDq
−BqC Aq Bq
−(Kc + DqC) Cq Dq

 (2.50)
Assim, a função de transferência entre r e y pode ser escrita como
Try(s) = (I −G22Ke)−1G22 =


A + BDqC −B(Kc + DqC) BCq B
(Kf + BDq)C A−BKc −KfC −BDqC BCq 0
BqC −BqC Aq 0
C 0 0 0


(2.51)
O vetor de estados de (2.51) contém os estados do sistema (ou estados físicos), os estados
do observador e os estados do parâmetro de Youla: [xT x̂T xTq ]T .
Por abuso de linguagem, neste trabalho as representações de estado de J(s) e de
Ke(s), expressas por (2.48) e (2.50), são igualmente chamadas de controladores de estru-
tura estimação-controle.
Para facilitar a interpretação da dinâmica de malha fechada, aplica-se à (2.51) a
seguinte transformação de similaridade:


x
xq
x̂− x

 =


I 0 0
0 0 I
−I I 0




x
x̂
xq

 (2.52)
A nova representação de estado em malha fechada (2.53) inclui o erro de estimação do
estado físico, x̂− x, no vetor de estados:
Try(s) =


A−BKc BCq −B(Kc + DqC) B
0 Aq −BqC 0
0 0 A−KfC −B
C 0 0 0


(2.53)
Nesta representação, o principio da separação aparece claramente. Os autovalores
em malha fechada podem ser separados segundo os n autovalores do controlador, os n
autovalores do estimador e os nq autovalores do parâmetro de Youla: spec(A − BKc),
spec(A−KfC) e spec(Aq), respectivamente.
A função de transferência em malha fechada pode também ser representada a partir
41
do controlador original (2.46) :
Try(s) = (I −G22K)−1G22 =


A + BDKC BCK B
BKC AK 0
C 0 0

 =

 Acl Bcl
Ccl 0

 (2.54)
cujo vetor de estado é
[
xT (T1x̂)
T (T2xq)
T
]T , com
[
T1 T2
]
= T (2.55)
Com a ajuda dessas definições e notações, pode-se deduzir as condições que garantem
a equivalência entrada-saída entre das representações (2.46) e (2.47).
2.5.2 ESTRUTURA ESTIMAÇÃO-CONTROLE EQUIVALENTE
A partir de (2.47) e (2.50), pode-se deduzir:
AKT − T
[
A + BDKC 0
0 Aq
]
− T
[
BCK
0
]
T +
[
BKC 0
]
= 0 (2.56)
T−1BK =
[
Kf + BDq
Bq
]
(2.57)
CKT =
[
−(Kc + DqC) Cq
]
(2.58)
DK = Dq (2.59)
O problema se reduz, então, a resolver em T ∈ RnK×nK a EQ (2.56) e calcular Kc,
Kf , Bq, Cq e Dq usando (2.57), (2.58) e (2.59). Nota-se que Aq é desconhecido em (2.56)
e corresponde a uma variável adicional.
A solução teórica da EQ. (2.56) pode ser simplificada se ela for dissociada em dois
subproblemas. Adotando-se uma partição apropriada de T como em (2.55), obtém-se:
T1(A + BDKC)− AKT1 + T1BCKT1 −BKC = 0 (2.60)
e
(AK − T1BCK)T2 = T2Aq (2.61)
A equação de Riccati generalizada, não simétrica e retangular (2.60) pode ser ainda
reformulada como:
[
−T1 I
]
H︷ ︸︸ ︷[
A + BDKC BCK
BKC AK
] [
I
T1
]
= 0 (2.62)
42
Conseqüentemente, a matriz Hamiltoniana H associada a equação de Riccati (2.60)
é a própria matriz da dinâmica do sistema em malha fechada Acl, expressa em (2.54).
A equação de Riccati (2.60) pode ser resolvida em T1 ∈ RnK×n pela técnica clássica de
cálculo de subespaços invariantes que consiste em:
• Calcular um subespaço invariante associado a um conjunto de n autovalores,
spec(Λn), escolhidos entre 2n + nq autovalores de spec(Acl), isto é,
[
A + BDKC BCK
BKC AK
] [
U1
U2
]
=
[
U1
U2
]
Λn (2.63)
onde U1 ∈ Rn×n e U2 ∈ RnK×n. Tal subespaço é facilmente calculado usando a
decomposição de Schur da matriz Acl.
• Calcular a solução
T1 = U2U
−1
1 (2.64)
cuja existência é garantida quando todos os autovalores de malha fechada forem
distintos.
Usando o resultado anterior e de forma similar, o cálculo da solução T2 ∈ RnK×nq
da equação de Sylvester (2.61) se reduz a encontrar um subespaço invariante associado
com um conjunto de nq autovalores, spec(Aq), escolhidos entre os n + nq autovalores de
spec(AK − T1BCK).
Partindo de (2.47), (2.50) e (2.58), pode-se verificar que
AK − T1BCK = T
[
A−KfC 0
−BqC Aq
]
T−1 (2.65)
Pode-se, então, estabelecer a seguinte proposição:
Proposição 2.1. Os n autovalores escolhidos para o cálculo da solução T1 da EQ (2.60),
utilizando o método Hamiltoniano, são os n autovalores de realimentação de estados
associados à estrutura estimação-controle equivalente, isto é, spec(A−BKc). Além disso,
a dinâmica de malha fechada restante8 contém a dinâmica do estimador (A − KfC)
aumentada da dinâmica do parâmetro de Youla (Aq).
8Não incluída na seleção da solução de (2.60), isto é, a dinâmica de AK − T1BCK .
43
Esta proposição é uma conseqüência direta de (2.53) e (2.65), consistindo na base da
técnica aqui apresentada. A conclusão nela apresentada permitiu a definição de um algo-
ritmo para a seleção de autovalores necessária para o cálculo de controladores equivalentes
de estrutura estimação-controle (PELLANDA, 2001, 2002b).
Existe uma combinação de soluções segundo a escolha da partição dos autovalores
de malha fechada, primeiramente para o cálculo de T1 e depois para o cálculo de T2. Na
Seção 2.5.3 Algumas considerações adicionais a propósito das possíveis soluções de (2.60)
e (2.61)são apresentadas e discutidas.
Assim, dados um sistema de ordem n e um controlador de ordem nK , pode-se cal-
cular uma transformação linear T−1xK para os estados do controlador tal que eles sejam
separados em duas partes: uma partição correspondente