Buscar

Resumo Controle Não Linear Aplicado

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

https://www.passeidireto.com/arquivo/31865701/tutorial-de-matlab-para-estudantes?utm-medium=link
Resumo Controle Não Linear Aplicado
Símbolos:
: para qualquer.
: existe.
 pertence ao conjunto.
: implica que.
: termos de ordem mais alta em (_,_) (vai depender do que estiver dentro do parênteses.
h.o.t.: termos de ordem superiro na expansão de Taylor.
n: ordem do sistema (número de estados)
m: número de entradas
Grau relativo do sistema (r): n-m (é o excesso de pólos sobre zeros). Grau relativo: quantas vezes precisamos derivar a saída de um sistema para gerar uma relação explícita entre a saída y e a entrada u. r<n porque não pode haver mais de n vetores linearmente independentes em um espaço tridimensional. Se r=n, a linearização entrada-saída produz linearização do estado de entrada em uma região.
Para qualquer sistema controlável de ordem n, serão necessárias no máximo n derivações de qualquer saída para a entrada de controle aparecer, ou seja . Se a entrada de controle nunca aparecesse, o sistema não seria controlável.
p.d.: positiva definida
p.s.d.: positiva semi definida
PR: real positiva
SPR: estritamente real positiva
: alguma função não linear
x: vetor (saída, escalar) de interesse
y: posição
: velocidade
: aceleração
u: controle (vetor)
y(t): saída real (vetor)
yd(t): saída desejada
v: nova entrada a ser determinada, entrada equivalente (a determinação de v equivale a determinar u, e vice-versa), levando a uma relação de estado de entrada linear.
^: estimado.
â: parâmetros estimados.
p: variável Laplace
T: período de amostragem
f(x): função não linear do estado. (campo vetorial)
h(x): campo vetorial.
b(x): função não linear do estado.
D: constante positiva.
SISO: entrada única.
MIMO: múltiplas entradas.
h: constante estritamente positiva.
Bo(p): estão todos no plano meio esquerdo
B: matriz quadrada, matriz de entrada
G(x): nxm matriz cujas colunas são campos vetoriais suaves gi.
: constante estritamente positiva. Frequência de quebra do filtro.
s: soma ponderada do erro de posição e do erro de velocidade; (escalar) medida real do desempenho de rastreamento. Medida da distância algébrica para a superfície S(t).
: constante estritamente positiva.
S(t): superfície de deslizamento
sgn: função de sinal
b: ganho de controle
: margem de ganho.
: espessura da camada limite.
: precisão garantida.
Sat: função de saturação.
Largura de banda = espessura.
I: matriz identidade nxn.
i: componentes.
r(t): comando de posicionamento (erro de parâmetro). Sinal de referência externo limitado.
: ganho de adaptação (constante positiva).
P(t): ganho de estimativa.
e(t): sinal de saída escalar
H(p): função de transferência real estritamente positiva.
K: constante desconhecida com sinal conhecido.
: função vetorial mx1 do tempo.
v(t): vetor mensurável mx1.
: parâmetro constante da planta (desconhecido).
: parâmetro constante da planta (desconhecido).
: parâmetro constante estritamente positivo.
: parâmetro constante estritamente positivo.
M: função de transferência do modelo de referência (SPR).
: ganho variável de realimentação.
: ganho variável de realimentação.
: vetor de parâmetro verdadeiro .
: ganho de realimentação verdadeiro.
: ganho de realimentação verdadeiro.
f: qualquer função não linear conhecida.
c: constante desconhecida.
yss(t): resposta em estado estacionário.
fss(t): valor da função correspondente.
A e : magnitude e o deslocamento de fase do modelo de referência.
: ganho de alta frequência.
po: ganho do estimador (número positivo).
V: erro do parâmetro ao quadrado.
P(t): matriz estimadora de ganho (semelhante ao caso da estimativa de gradiente).
P: pode ser a matriz de covariância de estimativa.
: fator de esquecimento variável no tempo. Fator de limitação positivo constante ou variável no tempo independente de P.
Ko: matriz p.d. simétrica que especifica o limite superior da matriz de ganho P.
e: erro de rastreamento.
e1: erro de predição.
Esquecimento = limitação.
Fase mínima: todos os seus zeros estão estritamente no plano da metade esquerda.
Estabilidade: se a origem é estável, existe uma função positiva definida V(x,t) com uma derivada não positiva.
A estabilidade não linear é definida em relação às condições iniciais, e apenas perturbações temporárias podem ser traduzidas como condições iniciais.
Estabilidade Assintótica: o equilíbrio é estável e os estados iniciados perto de 0 convergem para 0 a medida que o tempo t vai para o infinito. Exemplo: quando a altitude de um satélite é perturbada a partir de sua posição nominal, não queremos apenas que o satélite mantenha sua altitude em uma faixa determinada pela magnitude de perturbação, ou seja, estabilidade de Lyapunov, mas também que a altitude gradualmente retorne a seu valor original. A<0. Requer que exista uma região atrativa para cada tempo inicial . e e tem que convergir para zero.
Estabilidade Assintótica Uniforme: se o ponto de equilíbrio na origem é uniformemente assintoticamente estável, existe uma função positiva definida e crescente V(x,t) com uma derivada definida negativa.
O sistema não linear é globalmente assintoticamente estável, quando a não linearidade pertence ao primeiro e ao terceiro quadrante.
Marginalmente Estável: um ponto de equilíbrio que é estável em Lyapunov, mas não assintoticamente estável. Quando todos os autovalores de A estão no plano complexo da metade esquerda, mas pelo menos um deles está no eixo jw, então não se pode concluir nada da aproximação linear (o ponto de equilíbrio pode ser estável, assintoticamente estável ou instável para o sistema não linear).
Estabilidade Exponencial: estimação da rapidez com que a trajetória do sistema se aproxima de 0. Um ponto de equilíbrio 0 é exponencialmente estável se existirem dois números estritamente positivos e .
Estabilidade Exponencial: se a função vetorial f(x,t) em tem derivadas parciais contínuas e limitadas em relação a x e , então o ponto de equilíbrio na origem é exponencialmente estável se existir a função V(x,t) e estritamente positivas constantes alphas.
A estabilidade exponencial implica estabilidade assintótica. Mas estabilidade assintótica não garante estabilidade exponencial.
Globalmente assintoticamente (ou exponencialmente) estável: quando a estabilidade assintótica (ou exponencial) for válida para qualquer estado inicial, o ponto de equilíbrio será assintoticamente (ou exponencialmente) estável.
Estritamente estável: se os valores da matriz A estão estritamente no plano complexo da metade esquerda. O ponto de equilíbrio é assintoticamente estável.
Estabilidade Total: capacidade de um sistema suportar pequenas perturbações persistentes.
Um ponto de equilíbrio é totalmente estável se o estado do sistema perturbado puder ser mantido arbitrariamente próximo de zero, restringindo o estado inicial e a perturbação a ser suficientemente pequena. É uma versão local (com pequena entrada) de estabilidade BIBO (saída limitada de entrada limitada).
Se o sistema não perturbado é linear, então a estabilidade total é garantida pela estabilidade assintótica do sistema não perturbado.
Se o ponto de equilíbrio de é uniformemente assintoticamente estável, então é totalmente estável.
Sistema instável: quando pelo menos um autovalor de A estiver estritamente no plano complexo da metade da direita. O ponto de equilíbrio é instável. A>0
Localmente Uniformemente estável: quando o escalar r puder ser escolhido independente de .
Assim como um sistema não linear pode ser globalmente assintoticamente estável enquanto sua aproximação linear é apenas marginalmente estável, um sistema não linear pode ser controlável enquanto sua aproximação linear não é.
A=0: não é possível dizer da linearização.
: (número positivo). Taxa de convergência exponencial.
Sistema de Malha Fechada: possui uma realimentação da saída para a entrada.
É mais preciso e reage a perturbações externas.
Controlador: utiliza o sinal do erro para calcular o sinal de controle a ser aplicado na planta.
Para sistemas Lineares:
LTI: sistema de controle linear no tempo:
Sistema de Controle Linear invarianteno tempo:
Entrada externa u(t):
As tarefas dos sistemas de controle são: estabilização (ou regulação), no qual um estabilizador (ou regulador) deve ser projetado de forma que o estado do sistema de malha fechada seja estabilizado em torno de um ponto de equilíbrio; e rastreamento, no qual constrói um controlador (rastreador) para que a saída do sistema rastreie uma determinada trajetória variável no tempo.
Lei de controle estático: quando a lei de controle depende diretamente dos sinais de medição.
Lei de controle dinâmico: quando a lei de controle depende da medição por meio de uma equação diferencial (há dinâmica na lei de controle).
Ponto de equilíbrio: ponto onde o sistema pode ficar para sempre sem se mover. Um sistema não linear pode ter vários (infinitos) pontos de equilíbrio.
Estabilidade: para qualquer condição inicial, o movimento sempre converge para o ponto de equilíbrio x=0. Comportamento bem comportado em torno de um ponto de operação desejado.
Para sistemas não lineares:
X0<1: irão convergir para o ponto de equilíbrio x=0;
X0>=1: irão para o infinito (em tempo finito).
A estabilidade de sistemas não lineares dependem das condições iniciais.
Condições indesejadas:
Ciclos limite (oscilações auto-excitadas): oscilações de amplitude fixa (independente da condição inicial) e período fixo sem excitação externa. 
Ciclos limite estável: todas as trajetórias na vizinhança do ciclo limite convergem como .
Ciclos limite instável: todas as trajetórias na vizinhança do ciclo limite divergem como .
Ciclo limite semi-estável: algumas das trajetórias na vizinhança convergem para ele, enquanto as outras divergem dele como .
A forma dos sinais em um sistema de ciclo limite é geralmente aproximadamente senoidal.
Na maioria dos sistemas de controle, os ciclos limites são indesejáveis.
Motivos:
· Ciclo limite como forma de instabilidade, tende a causar baixa precisão de controle.
· A oscilação constante associada aos ciclos limite pode causar desgaste crescente ou mesmo falha mecânica do sistema de controle.
· Ciclo limite pode causar desconforto em uma aeronave sob piloto automático.
Bifurcações: mudança quantitativa de parâmetros que conduzem a alterações qualitativas das propriedades do sistema. A bifurcação pode envolver ciclos limite à medida que os parâmetros são alterados.
Caos: a saída do sistema não linear é extremamente sensível as condições iniciais.
Análise do Plano de Fase: gerar no espaço de estados de um sistema dinâmico de apenas segunda ordem, trajetórias de movimento correspondentes a várias condições iniciais e examinar as características qualitativas das trajetórias (estabilidade).
Retrato de Fase: família de trajetórias de fase que corresponde a várias condições iniciais (círculos).
Análise do Plano de Fase para sistema de primeira ordem pode ser aplicado, porém o retrato de fase tem apenas uma trajetória.
Pontos singulares: ponto de equilíbrio no plano de fase.
Simétrico: pode ser dividido em partes e ambas as partes são iguais.
Um sistema não linear pode ser aproximado pelo comportamento de um sistema linear.
Comportamento local dos sistemas não lineares: se o ponto singular de interesse não estiver na origem, definindo a diferença entre o estado original e o singular como um novo conjunto de variáveis de estado, pode sempre deslocar o ponto singular para a origem.
Método de Linearização de Lyapunov: representa a justificativa teórica do controle linear.
Método Direto de Lyapunov: gerar uma função escalar para o sistema dinâmico e examinar a variação temporal dessa função escalar. Ferramenta mais importante para a análise e projeto de sistemas não lineares.
Estabilidade de Lyapunov: a trajetória do sistema pode ser mantida arbitrariamente próxima da origem, iniciando suficientemente próximo a ela. Trajetória tem que permanecer dentro da bola.
Linearização (aproximação linear) de Lyapunov: estabilidade local de um sistema não linear. Um sistema não linear deve se comportar de maneira similar à sua aproximação linearizada para movimentos de pequena escala.
Condições para a função de Lyapunov:
Função localmente positiva: se V(0)=0; x0 , V(x)>0 (positivo definido)
Globalmente positiva: se as propriedades acima se mantiver sobre todo o espaço de estados.
Para derivar V utilizar derivada no domínio do tempo (regra da cadeia).
 (negativo semi definido)
O ponto de equilíbrio 0 é estável porque 
Método Lyapunov em sistema não linear: escolhe uma função definida positiva e determina sua derivada ao longo do caminho dos sistemas não lineares.
Com a função de Lyapunov não pode tirar conclusões sobre a estabilidade assintótica do sistema, porque é apenas semi definida negativa.
Muitas funções de Lyapunov podem existir para o mesmo sistema.
Se uma determinada escolha do candidato de função de Lyapunov V, as condições em não forem satisfeitas, não se pode tirar nenhuma conclusão sobre a estabilidade ou instabilidade do sistema, irá ter que tentar outro candidato.
A exigência de definição positiva V permite usar uma única função de Lyapunov para descrever sistemas com múltiplos equilíbrios.
A soma de duas funções de Lyapunov para um dado sistema também é uma função Lyapunov.
A existência de uma função de Lyapunov para descrever um sistema garantirá o bom comportamento do sistema sob algumas suposições suaves sobre a dinâmica.
Estabilidade:
V: definida positiva.
: negativa semi definida.
Se V é crescente, a origem é uniformemente estável. E é negativo definido.
Se o método de linearização falhar (se o sistema linearizado for marginalmente estável), os teoremas de instabilidade podem ser utilizados. Esses teoremas não requerem linearização do sistema. O V e o são positivos definido neste caso. E o ponto de equilíbrio 0 no tempo é instável.
Se a função de transferência (ou matriz de transferência) (h(p))do subsistema linear for real positiva (grau relativo 0 ou 1), então ela possui propriedades importantes que podem levar à geração de uma função de Lyapunov para todo o sistema.
Diferença entre funções de transferência PR e SPR: as funções de transferência PR podem tolerar polos no eixo jw, enquanto as funções SPR não podem.
As funções de transferência, nas quais os zeros lineares do sistema são baseados, não podem ser definidas para sistemas não lineares. Os zeros são propriedades intrínsecas de uma planta linear.
Sistemas Não Lineares: 
Sistemas invariantes no tempo (LTI) (Autônomo): quando f não depende explicitamente do tempo, ou seja, a equação de estado do sistema é:
Os sistemas LTI são assintoticamente estáveis se seus autovalores tiverem partes reais negativas.
Sistemas variantes no tempo (LTV) (Não Autônomo): quando f depender explicitamente do tempo, ou seja, a equação de estado do sistema é:
f: função de vetor não linear nxl
x: vetor de estado nxl
u: lei de controle
: dinâmica da planta
: estado de equilíbrio (ponto de equilíbrio) (desejado)
Erro: real - desejado
P: matriz positiva definida simétrica. Se P é positiva definida, o sistema é globalmente assintoticamente estável.
Q: a matriz tem que ser semi definida positiva simétrica para V satisfazer as condições do teorema. A matriz Q não é positiva definida. Escolha simples de Q é a matriz identidade.
Métodos para encontrar candidata a função de Lyapunov:
Método Kravovskii’s: método para função candidata de Lyapunov para sistemas não lineares autônomos. Aplicado em sistemas simples.
f: matriz negativa definida em todo o espaço de estados.
Método do Gradiente Variável: aplicado em sistemas simples.
: matriz nxn definida positiva constante.
: matriz nxn definida positiva constante.
É quase impossível usar tentativa e erro para procurar uma função Lyapunov para a dinâmica de malha fechada. Deve usar o máximo de propriedades físicas possíveis para analisar o comportamento de um sistema. Conceitos físicos podem levar a algumas escolhas poderosas de Lyapunov.
Taxa de convergência para sistemas não lineares: manipulação da expressão de de modo a obter uma estimativa explícita de V.
Teorema de La Salle: não se aplica em sistemas nãoautônomos.
Hurwitz: tem todos os seus autovalores estritamente no plano complexo da metade esquerda.
Funções da forma logt, sent, são mais fáceis de encontrar respostas dinâmicas do sistema.
Lema de Barbalat’s: usado em sistemas não autônomos.
Função diferenciável uniforme contínua: sua derivada tem que ser limitada.
V(x,t): tem limite inferior.
: negativa semi definida, uniformemente contínua no tempo ou nula.
 como .
 é limitado.
e: erro de rastreamento.
: erro de parâmetro.
w(t): função contínua limitada.
Lema de Kalman-Yakubovich:
 (EQUAÇÃO DE LYAPUNOV)
Lema Meyer-Kalman-Yakubovich: o sistema só precisa ser estabilizável (mas não necessariamente controlável).
Critério de Popov (para sistemas não lineares): aplica apenas em sistemas autônomos, só pode ter uma não linearidade sem memória, a estabilidade do sistema não linear pode ser determinada examinando as funções de resposta em frequência de um subsistema linear, sem a necessidade de procurar por funções explícitas de Lyapunov. Impõe condições adicionais no subsistema linear, levando a uma condição suficiente para a estabilidade assintótica que lembra o critério de Nyquist (uma condição necessária e suficiente) na análise de sistema linear.
Critério do Círculo: generalização mais direta do critério de Nyquist. Sistemas autônomos e não autônomos.
Lema Bellman-Gronwall: obter um limite explícito na magnitude de y.
Método de resposta e frequência: descrição de um sistema apenas linear por uma função de valor complexo, a resposta de uma frequência, em vez de uma equação diferencial.
Método de função de descrição: usado para analisar e prover aproximadamente o comportamento não linear. O principal uso é a predição de ciclos limites em sistemas não lineares.
Para utilizar o método da função de descrição, o sistema deve satisfazer as condições:
· Existe apenas um único componente não linear.
· O componente não linear é invariante no tempo.
· Correspondente a uma entrada sinusoidal.
· A não linearidade é ímpar.
Se houver dois ou mais componentes não lineares em um sistema, um deles deve agrupá-lo como uma única não linearidade (como pode ser feito com duas não linearidades em paralelo) ou reter apenas a não linearidade primária e negligenciar os outros.
Pode usar a série de Fourier.
Geralmente a função de descrição depende da frequência e amplitude do sinal de entrada. Mas existe alguns casos que a não linearidade é de valor único.
Função de descrição de computação possui 3 métodos: cálculo analítico, integração numérica e avaliação experimental.
Função descritiva independente da frequência: há um número finito de soluções.
Função descritiva dependente da frequência: geralmente há um número infinito de pontos de interseção.
Tipos de imprecisões possíveis:
· A amplitude e a frequência do ciclo limite previsto não são preciso.
· Um ciclo limite previsto na verdade não existe.
· Um ciclo limite existente não é previsto.
As últimas duas hipóteses tem consequências mais graves.
O método da função de descrição é uma extensão do método de resposta em frequência do controle linear. Ele pode ser usado para analisar e prever aproximadamente o comportamento de classes importantes de sistemas não lineares, incluindo sistemas com não linearidades fortes.
A aproximação é razoável para um pequeno valor de , a imprecisão aumenta à medida que aumenta. A medida que cresce a não linearidade se torna mais significativa e a aproximação quase linear torna-se menos precisa. 
Não linearidades descontínuas (duras): não podem ser aproximadas localmente por funções lineares, encontradas em sistemas de controle.
Saturação: quando a entrada é pequena, seu amento leva a um aumento correspondente (frequentemente proporcional) da saída; mas quando a entrada atinge um certo nível, seu aumento adicional produz pouco ou nenhum aumento da saída. A saída fica em torno do seu valor máximo.
A maioria dos atuadores exibem características de saturação.
A ocorrência de saturação equivale a reduzir o ganho do dispositivo à medida que os sinais de entrada são aumentados.
Não linearidade on-off (retransmissão): ocorre quando a faixa de linearidade é reduzida a zero e a inclinação na faixa de linearidade se torna vertical.
Zona Morta: quando a saída é zero até que a magnitude de entrada exceda um determinado valor. É uma das técnicas para modificar a lei de adaptação para evitar o problema de desvio de parâmetros. Observação de pequenos erros de rastreamento, principalmente ruído e perturbação, portanto deve desligar o mecanismo de adaptação para pequenos erros de rastreamento.
O efeito mais comum da zona morta é diminuir a precisão da produção estática. Podem levar a ciclos limites ou instabilidade do sistema por causa da falta de resposta na zona morta. Em alguns casos eles podem realmente estabilizar o sistema ou suprir as auto-oscilações.
Folga e histerese: geralmente ocorre nos sistemas de transmissão. É causada pelas pequenas lacunas que existem nos mecanismos de transmissão.
Histerese: não linearidade de valores múltiplos.
Normalmente, os problemas de rastreamento são mais difíceis de resolver do que os problemas de estabilização, porque em problemas de rastreamento, o controlador deve não apenas manter todo o estado estabilizado, mas também direcionar a saída do sistema para a saída desejada.
Robustez: sensibilidade a efeitos que não são considerados no projeto, como distúrbios, ruído de medição, dinâmica não modelada, etc. O sistema deve ser capaz de resistir a esses efeitos negligenciados ao executar as tarefas de interesse.
Procedimento para Projeto de Controle Não Linear:
1 – Especifique o comportamento desejado e selecione os atuadores e sensores.
2 – Modelar a planta física por um conjunto de equações diferenciais.
3 – Projetar uma lei de controle para o sistema.
4 – Analisar e simular o sistema de controle resultante.
5 – Implementar o sistema de controle no hardware.
As vezes a adição ou realocação de atuadores e sensores pode tornar fácil um problema de controle não linear.
Incertezas do modelo: diferenças entre o modelo e o sistema físico real.
Incertezas paramétricas: incertezas nos parâmetros.
E também há as incertezas não paramétricas.
Feedforward (antecipação): usado para cancelar os efeitos de distúrbios conhecidos e fornecer ações antecipadas em tarefas de rastreamento. Muitas vezes é impossível controlar um sistema não linear de forma estável sem incorporar a ação de feedforward na lei de controle. 
Muitos controladores de rastreamento podem ser escritos na forma:
u = antecipação + realimentação
Antecipação: pretende fornecer a entrada necessária para seguir a trajetória de movimento especificada e cancelar os efeitos das perturbações conhecidas. Pode ser calculada invertendo o modelo da planta.
Realimentação: estabiliza a dinâmica do erro de rastreamento.
Sistemas físicos não lineares são contínuos.
Derivada numérica: tem como objetivo obter uma estimativa razoável da derivada temporal e, ao mesmo tempo, evitar a geração de grandes quantidades de ruído. Pode usar uma derivada filtrada.
Integração numérica: consiste em simular em tempo real algum subcomponente dinâmico (geralmente não linear) requerido pelo controlador. O mais simples, que pode funcionar bem em altas taxas de amostragem ou para sistemas de baixa dimensão, é a integração de Euler. Uma abordagem mais sofisticada, que é muito eficaz na maioria dos casos é a integração de dois passos de Adams-Bashforth.
Métodos de Projeto de Controle Não Linear
Tentativa e erro, Linearização de Realimentação, Controle Robusto,
 Controle Adaptativo: abordagem para lidar com sistemas incertos ou sistemas variantes no tempo. Os projetos atuais de controle adaptativo aplicam principalmente a sistemas com estrutura dinâmica conhecida, mas parâmetros desconhecidos constantes ou de variação lenta.
Escalonamento de Ganho: tentativa de aplicar a metodologia de controle linear bem desenvolvida ao controle de sistemas não lineares. A ideia é selecionar um número de pontos de operação que cobrem o alcance da operação do sistema.Em cada um desses pontos, o projetista faz uma aproximação linear invariante no tempo para a dinâmica da planta e projeta um controlador linear pra cada planta linearizada. Entre os pontos de operação, os parâmetros dos compensadores são interpolados ou programados, resultando em um compensador global. O principal problema é que ele tem apenas garantias teóricas limitadas de estabilidade na operação não linear, mas usa algumas orientações práticas como as variáveis de escalonamento devem mudar lentamente e as variáveis de escalonamento devem capturar as não linearidades da planta. Outro problema é a carga computacional envolvida, devido à necessidade de computar muitos controladores lineares.
Linearização da Realimentação: transformar algebricamente uma dinâmica de sistema não linear em uma (totalmente ou parcialmente) linear, de modo que técnicas de controle linear possam ser aplicadas. Equivale a cancelar as não linearidades em um sistema não linear, de modo que a dinâmica da malha fechada esteja em uma forma linear. Não pode ser usado para todos os sistemas não lineares. O estado completo tem que ser medido. Nenhuma robustez PE garantida na presença de incerteza de parâmetro ou dinâmica não modelada.
Para sistemas que podem ser expressos na forma canônica, usando a entrada de controle podemos cancelar as não linearidades e obter a relação de saída de entrada simples (forma de múltiplos integradores).
Há dificuldade de encontrar observadores convergentes para sistemas não lineares e, quando um observador pode ser encontrado, a falta de um princípio geral de separação que garante que a combinação direta de um controlador de realimentação de estado estável e um observador estável irá garantir a estabilidade do sistema de malha fechada.
O modelo exato do sistema não linear não está disponível na realização de linearização de realimentação. A sensibilidade a erros de modelagem pode ser severa quando a transformação linearizada é mal condicionada. O controle robusto e adaptativo pode ser introduzido para fornecer sistema linearizáveis de realimentação com robustez a incertezas paramétricas.
Linearização do estado de entrada: encontra uma transformação de estado e uma transformação de entrada de modo que a dinâmica do sistema não linear é transformada em uma dinâmica linear invariante no tempo equivalente, na forma familiar. É a linearização completa.
Usa técnicas lineares padrão (como colocação de polos) para projetar v.
Através da transformação de estado e transformação de entrada, o problema de estabilizar a dinâmica original não linear usando a entrada de controle original u foi transformado no problema de estabilizar a nova dinâmica usando a nova entrada v. Então a nova dinâmica é linear e controlável. Se z1 e z2 convergirem para zero, o estado original x converge para zero. Irá haver duas malhas no sistema de controle, com a malha interna alcançando a linearizada da relação estado de entrada, e a malha externa alcançando a estabilização da dinâmica de malha fechada. A entrada de controle u é composta de uma parte de cancelamento de não linearidade e uma parte de compensação linear. O resultado, embora válido em uma grande região do espaço de estado, não é global. Quando o estado inicial está em tais pontos de singularidade, o controlador não pode trazer o sistema para o ponto de equilíbrio.
Linearização Entrada-Saída: o objetivo é fazer com que a saída y(t) rastreie uma trajetória desejada yd(t) enquanto mantém todo o estado limitado, onde yd(t) e suas derivadas de tempo até uma ordem suficientemente alta são assumidas como sendo conhecidas e limitada. Dificuldade com este modelo, é que a saída y está indiretamente relacionada com a entrada u, através da variável de estado x e as equações de estado não lineares. Não é fácil ver como a entrada u pode ser projetada para controlar o comportamento de rastreamento da saída y. A dificuldade pode ser reduzida se pudermos encontrar uma relação direta e simples entre a saída do sistema y e a entrada de controle u. É a linearização parcial. Ela não pode ser aplicada quando o grau realtivo não é definido e não apresenta resultados globais sistemáticos.
Por meio da linearização de entrada-saída, a dinâmica de um sistema não linear é decomposta em uma parte externa (saída de entrada) e uma parte interna (“não observável” (dinâmica zero)).
Projeto de controle baseado na linearização de entrada-saída:
· Derive a saída y até que a entrada u apareça.
· Escolha u para cancelar as não linearidades e garantir convergência de rastreamento.
· Estudar a estabilidade da dinâmica interna.
Se o grau relativo associado a linearização de entrada-saída é o mesmo que a ordem do sistema, o sistema não linear é totalmente linearizado e esse procedimento realmente leva a um controlador satisfatório (supondo que o modelo seja preciso).
Se o grau relativo é menor do que a ordem do sistema, então o sistema não linear é apenas parcialmente linearizado, e se o controlador pode realmente ser aplicado depende da estabilidade da dinâmica interna.
Dinâmica interna: parte da dinâmica do sistema (descrita por um componente de estado) tornada “não observável” na linearização de entrada-saída, ela não pode ser vista a partir do relacionamento de entrada externa. Se dinâmica interna é estável (os estados permanecem limitados durante o rastreamento, ou seja, a estabilidade no sentido BIBO), o problema de projeto de controle de rastreamento foi resolvido. A dinâmica interna é estável se os zeros da planta estiverem no plano complexo da metade esquerda, ou seja, se a planta for “fase mínima”.
Para sistemas de fase não-mínima, o rastreamento perfeito de trajetórias arbitrárias requer esforço de controle infinito.
Para sistemas não lineares a estabilidade da dinâmica interna pode depender da entrada de controle específica. Uma maneira de abordar essas dificuldades é definir uma dinâmica zero para um sistema não linear.
Dinâmica zero: é a dinâmica interna do sistema quando a saída do sistema é mantida em zero pela entrada. A especificação de manter a saída do sistema em zero define a entrada necessária, a dinâmica zero é uma propriedade intrínseca de um sistema não linear. É um sistema de fase mínima assintoticamente estável anasitoticamente (para não linear). É uma característica intrínseca de um sistema não linear, que não depende da lei de controle ou das trajetórias desejadas.
Ao contrário do caso linear, nenhum resultado na estabilidade global ou mesmo na estabilidade de grande amplitude pode ser desenhado para a dinâmica interna de sistemas não lineares, ou seja, somente a estabilidade local é garantida para a dinâmica zero seja globalmente exponencialmente estável.
Examinar a estabilidade da dinâmica zero é muito mais fácil do que examinar a estabilidade da dinâmica interna, porque a dinâmica nula envolve apenas os estados internos, enquanto a dinâmica interna é acoplada a dinâmica externa e as trajetórias desejadas.
Se a dinâmica zero é instável, diferentes estratégias de controle devem ser buscadas, apenas simplificadas pelo fato de que a dinâmica transformada é parcialmente linear.
O cálculo da dinâmica interna do sistema (ou dinâmica zero) não requer colocar primeiro o sistema explicitamente na forma normal.
Sistemas lineares cuja dinâmica zero é estável são chamados de fase mínima.
Dinâmica zero instável é sistema de fase não mínima.
Quando o grau relativo de um sistema é o mesmo que a sua ordem, ou seja, quando a saída y tem que ser derivada n vezes (com n sendo a ordem do sistema) para obter uma relação linear entrada-saída. Nesse caso, as variáveis pode ser usadas como um conjunto de variáveis de estado para o sistema, e não há dinâmica interna associada a essa linearização de entrada-saída. Neste caso a linearização de entrada-saída leva à linearização do estado de entrada, e tanto a regulação do estado quanto o controle de saída (para saída específica) podem ser alcançados.
Exemplo clássico de um semiplano direito é o problema de controlar a altitude de uma aeronave usando um elevador.Derivada de Lie: dada uma função escalar h(x) e um campo vetorial f(x), definimos uma nova função escalar Lfh, chamada derivada de Lie de h em relação a f. Derivada direcional de h ao longo da direção do vetor f.
Colchete de Lie [f,g]: é escrito como adfg (ad: adjunto).
Propriedades dos colchetes de Lie: bilinearidade; comutativa de desvio; identidade de Jacobi.
Difeomorfismo: generalização do conceito familiar de transformação coordenada. Uma função é chamada de difeomorfismo se for suave e o inverso existir e for suave.
Difeomorfismos globais são raros, muitas vezes procura difeomorfismos locais, ou seja, para transformações definidas apenas em uma vizinhança finita de um dado ponto.
Um difeomorfismo pode ser usado pra transformar um sistema não linear em outro sistema não linear em termos de um novo conjunto de estados, similarmente ao que é comumente feito na análise de sistemas lineares.
Teorema de Frobenius: fornece uma condição necessária e suficiente para a solubilidade de uma classe especial de equações diferenciais parciais. O teorema afirma que o conjunto dos campos vetoriais {f,g} é completamente integrável se, e somente se, ele é involutivo.
Involutividade: se formarmos o colchete de Lie de quaisquer pares de campos vetoriais a partir do conjunto [f1,f2,...fm], então o campo vetorial resultante pode ser expresso como uma combinação linear do conjunto original de campos vetoriais. Campos vetoriais constantes são sempre involutivos.
O colchete de Lie de dois vetores constantes é o vetor zero, que pode ser expresso como uma combinação linear dos campos vetoriais. Um conjunto composto por um único vetor f é involutivo.
Estado de linearização: novo estado z.
Lei de controle de linearização: 
Um sistema não linear de ordem n é linearizável no estado de entrada se existir uma função escalar z1(x) tal que a linearização de entrada-saída do sistema com z1(x) como função de saída tem grau relativo n.
Execução da Linearização do Estado de Entrada:
· Construir os campos vetoriais, para o sistema dado.
· Verificar se as condições de controlabilidade e involutividade estão satisfeitas.
· Se ambos estiverem satisfeitos, encontre o primeiro estado z1 (a função de saída que leva a linearização de entrada-saída do grau relativo n).
· Calcule a transformação de estado e a transformação de entrada.
A complexidade de um modelo físico não linear é fortemente dependente da escola de variáveis de estado.
Projeto do Controlador Baseado na Linearização de Entrada de Estado
v é projetado para colocar os polos da dinâmica linear equivalente.
A entrada física u é calculada usando a transformação de entrada correspondente. Também é possível projetar controladores de rastreamento baseados no sistema linear equivalente, desde que a trajetória desejada possa ser expressa em termos do primeiro componente de estado de linearização z1.
Linearização da saída de entrada: derivar a função de saída y repetidamente até que a entrada u apareça e projetar u para cancelar a não linearidade.
Forma normal: quando o grau relativo r é definido e r<n, o sistema não linear é transformado usando como parte dos novos componentes de estado.
Para mostrar que um sistema não linear pode ser transformado na forma normal temos que mostrar não apenas que transformação de coordenadas existe, mas também que ela é uma transformação de estado verdadeira. Ou seja, precisamos mostra que podemos construir um difeomorfismo (local).
Para mostrar que é um difeomorfismo, basta mostrar que o seu Jacobiano é invertível, isto é, que os gradientes e são todos linearmente independentes, ou seja, que os componentes de u podem servir como variáveis de estado.
Controle de Rastreamento para Sistemas de Fase Não-Mínimos
Para tais sistemas, não devemos procurar por leis de controle que obtenham erros de rastreamento convergentes perfeitos ou assintóticos. Em vez disso, devemos encontrar controladores que levam a pequenos erros de rastreamento para as trajetórias de interesse desejadas.
No controle de sistemas de fase não mínima o método de saída redefinição é refefinir a função de saída y1=h(x) de modo que a dinâmica zero resultante seja estável. Desde que a nova função de saída y1 seja definida de tal forma que seja essencialmente igual a função de saída original na faixa de frequência de interesse, o rastreamento exato da nova função de saída y1 também implica um bom rastreamento da saída original y.
Uma abordagem para lidar com sistemas de fase não mínima é modificar a própria planta.
Controle Deslizante (controle robusto): comportamento do sistema uma vez na superfície.
O problema de rastrear o vetor xd pode ser reduzido quando mantém a quantidade escalar s em zero, este problema pode ser substituído por um problema de estabilização de primeira ordem em s (derivar a saída s uma vez para a entrada u aparecer).
: erro de rastreamento na variável x (vetor do erro de rastreamento).
Estrutura do controle adaptativo: o modelo é atualizado durante a operação, com base no desempenho medido.
A superfície S(t) é tanto um lugar quanto uma dinâmica.
A superfície deslizante é uma linha no plano de fase de inclinação – e contendo o ponto (variando como tempo) . A lei de controle tem que ser descontínua em S(t).
Chattering: trepidação.
A metodologioa é substituir um problema de rastreamento de enésima ordem por um problema de estabilização de primeira ordem. Embora o desempenho “perfeito” possa em princípio ser alcançado na presença de imprecisões de parâmetros arbitrários, incertezas na estrutura do modelo (isto é, dinâmica não modelada) levam a um trade-off entre desempenho de rastreamento e incerteza paramétrica, dada a espessura disponível. Na prática isso corresponde à substituição de uma lei de controle de comutação por sua suave aproximação. Em aplicações específicas em que o controle do chattering é aceitável, as leis de comutação podem gerar um desempenho extremamente alto.
Construção de Filippov’s da Dinâmica Equivalente
A dificuldade em obter medições de estado significativas em taxas de amostragem muito altas pode ser revertida usando observadores de estado.
A questão é como derivar leis de controle que mantenham o sistema próximo à superfície, evitando o chattering.
O chattering deve ser eliminado para que o controlador funcione corretamente. Isso pode ser conseguido suavizando a descontinuidade do controle em uma fina camada limite adjacente à superfície de comutação. Ou seja, fazer o rastreamento dentro de uma precisão garantida ao invés de rastreamento “perfeito”.
Para eliminar o chattering pode atribuir um filtro passo baixo à dinâmica local da variável s. Reconhecer essa estrutura semelhante a um filtro permite ajustar a lei de controle, de modo a obter uma compensação entre precisão e robustez de rastreamento e dinâmica não modelada.
A espessura da camada limite pode ser feita variando no tempo e pode ser monitorada para explorar bem a espessura de controle disponível. O desenvolvimento é primeiro detalhado para o caso (sem margem de ganho) e depois generalizado.
A condição de atração da camada limite é mais rigorosa durante a contração da camada limite () e menos rigorosa durante a expansão da camada limite (().
Como é a frequência de quebra do filtro, ela deve ser escolhida para ser “pequena” em relação à dinâmica não modelada de alta frequência (como modos estruturais não modelados ou atrasos de tempo negligenciados).
O erro de rastreamento é meramente uma versão filtrada de s. 
A espessura da camada limite descreve a evolução da incerteza do modelo dinâmico com o tempo.
O trade-off mostra que as condições de equilíbrio especificam o melhor desempenho de rastreamento alcançável, dada a espessura de controle desejada e a extensão de incerteza do parâmetro.
A trajetória desejada xd deve ser escolhida suficientemente suave para não excitar a dinâmica não modelada de alta frequência.
A escolha da dinâmica usada para superfícies deslizantes é a “melhor condicionada” entre as dinâmicas lineares, no sentido de que garante o melhor desempenho de rastreamentodado o desejado controlar a largura de banda e a extensão da incerteza do parâmetro.
Um controlador bem projetado deve ser capaz de lidar graciosamente com distúrbios excepcionais, ou seja, distúrbios de intensidade mais alta do que os limites previstos que são usados na derivação da lei de controle. Por exemplo, um atuador pode saturar como resultado da especificação de uma trajetória desejada inviável. Se o controle integral é usado, ele pode tronar-se excessivamente grande, de forma que uma vez a perturbação para, o sistema passa por grandes oscilações de amplitude para retornar à trajetória desejada (windup integrador), é uma causa potencial de instabilidade devido aos efeitos de saturação e limites físicos do movimento. Pode ser evitado parando a integração (mantendo o termo integral constante) desde que o sistema esteja fora da camada limite. Em circunstâncias normais, o sistema permanece na camada limite, por outro lado, quando as condições retornam ao normal após uma perturbação excepcional, a integração pode ser retomada assim que o sistema estiver de volta à camada limite, uma vez que o termo integral é definido dentro de uma constante arbitrária.
O desempenho do sistema é muito sensível ao controle da espessura. Uma questão chave é determinar tão grande a espessura pode ser escolhida.
O trade-off entre a imprecisão de modelagem e o desempenho pode ser melhorado apenas com a atualização do modelo online. Isso pode realmente ser alcançado quando alguns componentes do modelo depende linearmente de parâmetros desconhecidos, mas constantes, permitindo que as incertezas correspondentes sejam mapeadas de um único vetor constante desconhecido (controle adaptativo).
Sistemas quadrados: sistemas que possuem a mesma quantidade de entrada de controle e de saída a serem controladas por xi.
Teorema de Frobenius-Perron:
O efeito de um controlador deslizante é:
· Elaborar uma lei de controle para efetivamente: incerteza do parâmetro; a presença de dinâmica não modelada.
· Quantificar as compensações de modelagem/desempenho resultantes (trade-off) e, em particular, o efeito no desempenho de rastreamento de descartar qualquer termo específico no modelo dinâmico.
Controle Adaptativo
Controle adaptativo: controle utilizado para adaptar em diversas situações diferentes, por exemplo, massas diferentes em uma aeronave.
Ideia: estimar os parâmetros incertos da planta (ou equivalente, os parâmetros do controlador correspondentes) online com base nos sinais medidos do sistema, e usar os parâmetros online com base nos sinais medidos do sistema, e usar os parâmetros estimados no cálculo da entrada de controle. 
Um sistema de controle adaptativo pode ser considerado como um sistema de controle com estimativa de parâmetros online. Usa-se a teoria de Lyapunov.
O controle adaptativo foi proposto como uma maneira de ajustar automaticamente os parâmetros do controlador em face da mudança na dinâmica da aeronave.
O objetivo básico do controle adaptativo é manter o desempenho consistente de um sistema na presença de incerteza ou variação desconhecida nos parâmetros da planta.
O controle adaptativo foi desenvolvido par atingir um desempenho consistente da aeronave em um grande envelope de voo.
Em algumas aplicações, o controle adaptativo também é usado para reduzir o número de parâmetros de projeto a serem ajustados manualmente, gerando um aumento na eficiência e praticidade da engenharia.
Na prática, os sistemas de controle adaptativo são frequentemente usados para lidar com parâmetros desconhecidos variáveis no tempo. Portanto, os parâmetros da planta variáveis no tempo devem variar consideravelmente mais lentamente do que a adaptação do parâmetro. Variações rápidas de parâmetro também podem indicar que a modelagem é inadequada e que a dinâmica que causa as alterações de parâmetro deve ser modelada adicionalmente.
O controle adaptativo é superior ao controle robusto ao lidar com incertezas em parâmetros constantes ou que variam lentamente. Um controlador adaptativo melhora seu desempenho à medida que a adaptação continua, enquanto um controlador robusto simplesmente tenta manter um desempenho constante. Um controlador adaptativo requer pouca ou nenhuma informação a priori sobre os parâmetros desconhecidos, enquanto um controlador robusto geralmente requer estimativas a priori razoáveis dos limites dos parâmetros. Por outro lado, o controle robusto tem algumas características desejáveis que o controlador adaptativo não possui, como a capacidade de lidar com perturbações, parâmetros que variam rapidamente e dinâmicas não modeladas. Tais características podem ser combinadas com controle adaptativo, levando a controladores robustos adaptativos nos quais as incertezas em parâmetros constantes ou parâmetros de variação lenta são reduzidas por adaptação de parâmetros e outras fontes de incerteza são tratadas por técnicas de robustez. 
As técnicas adaptativas existentes para sistemas não lineares requerem geralmente uma parametrização linear da dinâmica da planta, isto é, que a incerteza paramétrica seja expressa linearmente em termos de um conjunto de parâmetros desconhecidos. Em alguns casos, a parametrização linear completa, o controle adaptativo não pode ser alcançado, mas o controle robusto (ou controle adaptativo com termos robustos) pode ser possível.
No controle adaptativo os parâmetros do controlador são variáveis.
Controle Adaptativo de Modelo de Referência (MRAC)
Planta: contém parâmetros desconhecidos.
Modelo de referência: especifica de forma compacta a saída desejada do sistema de controle.
Lei de controle de realimentação: contém parâmetros ajustáveis.
Mecanismo de adaptação: para atualizar os parâmetros ajustáveis.
Presume-se que a planta tenha uma estrutura conhecida, embora os parâmetros sejam desconhecidos. Para plantas lineares,isso significa que o número de polos e o número de zeros são assumidos como sendo conhecidos, mas que as localizações desses polos e zeros não são. Para plantas não lineares, isso significa que a estrutura das equações dinâmicas é conhecida, mas que alguns parâmetros não são.
Um modelo de referência é usado para especificar a resposta ideal do sistema de controle adaptativo ao comando externo. Intuitivamente, fornece a resposta ideal da planta que o mecanismo de adaptação deve buscar para ajustar os parâmetros. A escolha do modelo de referência tem que satisfazer dois requisitos. Por um lado, deve refletir a especificação de desempenho nas tarefas de controle, como tempo de subida, tempo de estabilização, overshoot ou características do domínio da frequência. Por outro lado, este comportamento ideal deve ser conseguido para o sistema de controle adaptativo, isto é, existem algumas restrições inerentes à estrutura do modelo de referência (por exemplo, sua ordem e grau relativo) dada a estrutura assumida do modelo da planta.
O controlador é geralmente parametrizado por um número de parâmetros ajustáveis (implicando que se pode obter uma família de controladores através da atribuição de vários valores aos parâmetros ajustáveis). O controlador deve ter capacidade de rastreamento perfeito para permitir a possibilidade de rastrear a convergência. Ou seja, quando os parâmetros da planta são exatamente conhecidos, os parâmetros do controlador correspondente devem tornar a saída da planta idêntica à do modelo de referência. Quando os parâmetros da planta não são conhecidos, o mecanismo de adaptação ajustará os parâmetros do controlador para que o rastreamento perfeito seja obtido assintoticamente.
O mecanismo de adaptação é usado para ajustar os parâmetros na lei de controle. Nos sistemas MRAC, a lei de adaptação busca parâmetros de tal forma que a resposta da planta sob controle adaptativo se torne a mesma que a do modelo de referência, ou seja, o objetivo da adaptação é fazer com que o erro de rastreamento coveja para zero. A principal diferença do controle convencional está na existência desse mecanismo. A principal questão no projeto de adaptação é sintetizar um mecanismode adaptação que garanta que o sistema de controle permaneça estável e que o erro de rastreamento converta para zero, já que os parâmetros são variados. Muitos formalismos no controle não linear podem ser usados para esse fim, como a teoria de Lyapunov, a teoria de hiperestabilidade e a teoria da passividade. Embora a aplicação de um formalismo possa ser mais conveniente do que a de outro, os resultados são frequentemente equivalentes.
A convergência do erro de parâmetro r(t) só pode ser obtida quando a massa verdadeira é usada na lei de controle.
Controle de Auto Ajuste (STC): controlador obtido pelo acoplamento de um controlador a um estimador de parâmetros online(recursivo). É um controlador que realiza a identificação simultânea da planta desconhecida.
A sua operação é: a cada instante de tempo, o estimador envia ao controlador um conjunto de parâmetros estimados da planta â que é calculado com base na entrada anterior da planta u e na saída y. O computador encontra os parâmetros do controlador correspondente e, em seguida, calcula uma entrada de controle u com base nos parâmetros do controlador e nos sinais medidos; essa entrada de controle u faz com que uma nova saída da planta seja gerada e todo o ciclo de atualizações de parâmetros e entradas é repetido. Princípio de equivalência de certeza: os parâmetros do controlador são calculados a partir das estimativas dos parâmetros da planta, como se fossem os parâmetros verdadeiros da planta. Desenho no caderno.
Se os parâmetros da planta não são conhecidos, é intuitivamente razoável substituí-los por seus valores estimados, fornecido por um estimador de parâmetros.
Estimativa de parâmetros: usado quando há incerteza de parâmetro em um sistema dinâmico (linear ou não linear), uma maneira de reduzir é usar a estimativa de parâmetro. Processo de encontrar um conjunto de parâmetros que se ajusta aos dados de entrada-saída disponíveis de uma planta. Isso é diferente da adaptação de parâmetros em sistemas MRAC, onde os parâmetros são ajustados para que os erros de rastreamento converjam para zero. Inferir valores dos parâmetros a partir das medições dos sinais de entrada e saída do sistema. A estimativa de parâmetros pode ser feita online ou offline. 
A estimativa offline pode ser preferível se os parâmetros forem constantes e houver tempo suficiente para a estimativa antes do controle. Para parâmetros que variam (embora lentamente) durante a operação, é necessário uma estimativa de parâmetros online para acompanhar os valores dos parâmetros. Como os problemas no controle adaptativo geralmente envolvem parâmetros que variam lentamente, os métodos de estimativa online são mais relevantes.
A essência da estimativa de parâmetros é extrair informações de parâmetros dos dados disponíveis sobre o sistema.
O objetivo da estimativa de parâmetros é resolver essas equações redundantes para os m parâmetros desconhecidos. Para poder estimar m parâmetros, precisamos pelo menos um total de m equações. Para estimar bem os parâmetros na presença de inevitável ruído e erro de modelagem, mais pontos de dados são preferíveis.
A convergência dos parâmetros estimados para os parâmetros verdadeiros depende da excitação dos sinais. 
Controle adaptativo indireto: no controle de auto ajuste, estima os parâmetros da planta e, em seguida, calcula os parâmetros do controlador.
Controle adaptativo direto: devido à necessidade de traduzir os parâmetros estimados em parâmetros do controlador. É possível eliminar essa parte do cálculo. Para isso, observa-se que os parâmetros da lei de controle e os parâmetros da planta estão relacionados entre si para um método de controle específico. Isso implica que podemos reparar novamente o modelo da planta usando parâmetros do controlador (que também são desconhecidos) e, em seguida, usar técnicas de estimativa padrão em tal modelo.
Nos sistemas MRAC, pode-se igualmente considerar formas diretas e indiretas de atualizar os parâmetros do controlador.
Erro de predição: erro de ajustar a entrada conhecida u usando o parâmetro estimado . Esta minimização total de erros pode potencialmente calcular a média dos efeitos do ruído de medição.
No controle de auto ajuste o projeto do estimador e o projeto do controlador são separados. A lei de estimação (usando y e u) é independente da escolha da lei de controle, diferentemente do projeto MRAC onde a lei de adaptação de parâmetros é afetada pela escolha da lei de controle. No controle de auto ajuste a saturação da entrada de controle não tem consequência direta na convergência da estimativa de parâmetro. Embora isso implique flexibilidade no projeto e simplicidade no conceito, a análise da convergência e estabilidade do sistema de controle de auto ajuste é geralmente mais complicada.
Relações entre MRAC e Métodos ST: os parâmetros nos sistemas MRAC são atualizados para minimizar os erros de rastreamento entre a saída da planta e a saída do modelo de referência, e os parâmetros nos sistemas ST sendo atualizadas para minimizar o erro de ajuste de dados nas medições de entrada-saída. Mas existem fortes relações entre as duas metodologias de projeto. Os dois sistemas possuem uma malha interna para controle e uma malha externa para estimativa de parâmetro. Os controladores MRAC e ST podem ser colocados sob uma estrutura unificada.
Os controladores ST são mais flexíveis devido à possibilidade de acoplar vários controladores com vários estimadores (ou seja, a separação de controle e estimativa). A estabilidade e a convergência dos controladores de auto ajuste são geralmente muito difíceis de garantir, exigindo frequentemente que os sinais no sistema sejam suficientemente ricos para que os parâmetros estimados convergem para os parâmetros verdadeiros. Se os sinais não são muito ricos (por exemplo, se o sinal de referência é zero ou uma constante), os parâmetros estimados podem não estar próximos dos verdadeiros parâmetros, e a estabilidade e convergência do sistema de controle resultante podem não ser garantidas. Nessa situação, é preciso introduzir sinais de perturbação na entrada ou modifica de alguma forma alei de controle. Nos sistemas MRAC a estabilidade e a convergência de erros de rastreamento são geralmente garantidas, independentemente da riqueza dos sinais.
No controle adaptativo os parâmetros da planta são desconhecidos, de modo que os parâmetros do controlador devem ser fornecidos por uma lei de adaptação. Como resultado, o projeto de controle adaptativo está mais envolvido com as necessidades adicionais de escolher uma lei de adaptação e comprovar a estabilidade do sistema com a adaptação.
Etapas do projeto de um controlador adaptativo:
· Escolher uma lei de controle contendo parâmetros variáveis.
· Escolher uma lei de adaptação para ajustar esses parâmetros.
· Analisar as propriedades de convergência do sistema de controle resultante.
Quando usa o projeto MRAC, o controlador adaptativo é geralmente encontrado por tentativa e erro. Às vezes, as três etapas são coordenadas pelo uso de uma função apropriada de Lyapunov, ou usando algumas ferramentas simbólicas de construção, como o formalismo de passividade.
As escolhas das leis de controle e adaptação no MRAC podem ser bastante complicadas, enquanto a análise das propriedades de convergência é relativamente simples.
Objetivo do projeto de controle adaptativo: formular uma lei de controle e uma lei de adaptação, de modo que o modelo resultante após o erro y(t)-ym converta assintoticamente para zero. Para conseguir isso, devemos assumir que o sinal do parâmetro b seja conhecido.
No problema de controle adaptativo, como e são desconhecidos, a entrada de controle alcançará esses objetivos de forma adaptativa, ou seja, a lei de adaptação buscará continuamente os ganhos corretos, com base no erro de rastreamento y-ym, de modo que y tende a ym assintoticamente.
Erro de rastreamento: 
O erro de rastreamento é a diferença entre o parâmetro do controlador fornecido (y) pela lei de adaptação e os parâmetros ideais.
No projeto de controle adaptativo, se umpequeno ganho for escolhido, a adaptação será lenta e o erro de rastreamento transitório será grande. Por outro lado, a magnitude do ganho e, consequentemente, o desempenho do sistema de controle adaptativo, são limitados pela excitação da dinâmica não modelada, porque um ganho de adaptação muito grande leva a parâmetros muito oscilatórios.
Análise de convergência de parâmetros
Os parâmetros estimados convergem para os valores dos parâmetros para um sinal de referência, mas não para o outro. Ou seja, os parâmetros estimados não convergirão para os parâmetros ideais do controlador, a menos que o sinal de referência r(t) satisfaça certas condições.
No sistema MRAC, o objetivo do mecanismo de adaptação é descobrir os parâmetros que direcionam o erro de rastreamento para zero. Se o sinal de referência r(t) for muito simples, como zero ou constante, é possível que muitos vetores de parâmetros do controlador, além do vetor de parâmetro ideal, levam ao rastreamento da convergência de erros. Então, a lei de adaptação não se preocupará em descobrir os parâmetros ideais.
Deixe o conjunto composto por todos os vetores de parâmetros que podem garantir a convergência do erro de rastreamento para um determinado histórico de sinal de referência r(t). Dependendo das condições iniciais, o vetor de parâmetros estimados pode convergir para qualquer ponto do conjunto ou ao redor do conjunto, em vez de convergir para os parâmetros reais. Se o sinal de referência r(t) for tão complexo que apenas o vetor de parâmetro verdadeiro pode levar ao rastreamento da convergência de erros então teremos uma convergência de parâmetros.
A questão da convergência de parâmetros é reduzida à questão de quais condições o vetor deve satisfazer para que a equação tenha uma solução zero exclusiva.
Em planta de primeira ordem, a excitação persistente de v pode ser garantida, se r(t) contiver pelo menos um componente sinusoidal.
A relação qualitativa entre r(t) e v(t) é dependente das funções não lineares específicas f(y).
Por exemplo, para r(t)=4 o erro de rastreamento converge para zero, mas os erros dos parâmetros são apenas de ligação. Para o sinal de referência r(t)=4sen(3t) o erro de rastreamento e os erros de parâmetro para os três parâmetros convergem para zero (a razão é que f(y) contem uma sinusóide no dobro da frequência original, este componente em dupla frequência é a razão para a estimativa convergente dos três parâmetros e o comportamento mais oscilatório dos parâmetros estimados). Um único componente sinusoidal permite estimar três parâmetros. A não linearidade geralmente gera mais frequências e, portanto, v(t) pode conter mais sinusóides do que r(t).
Objetivo do projeto: determinar uma lei de controle e uma lei de adaptação associada, de modo que a produção da planta y assintoticamente se aproxime de ym. Ao determinar a entrada de controle, presume-se que a saída y seja medida, mas nenhuma derivada da saída é permitida, de modo a evitar a amplificação de ruído associada à derivada numérica. Ao atingir este projeto, assumimos o seguinte conhecimento a priori da planta:
· A ordem n da planta é conhecida.
· O grau relativo n-m é conhecido.
(a estrutura do modelo da planta é conhecida)
· O sinal de kp é conhecido.
(direção da adaptação dos parâmetros)
· A planta é de fase mínima (é necessário porque queremos obter rastreamento convergente no projeto de controle adaptativo).
(restritiva)
Técnica aumento de erro: pode ser usada para evitar a dificuldade em encontrar uma lei de adaptação para o erro. Considerar o erro aumentado que se correlacionan com o erro de parâmetro de uma maneira mais desejável do que o erro de rastreamento e(t).
Erro auxiliar (n(t)): causado pela natureza variável do tempo dos parâmetros estimados theta(t).
Uma técnica alternativa é gerar um erro aumentado diferente, que está relacionado ao erro de parâmetro (theta) através de uma função de transferência de SPR selecionada corretamente.
Problemas de controle não linear satisfazem as condições: 
1. A dinâmica não linear da planta pode ser parametrizada linearmente
2. O estado completo é mensurável.
3. As não linearidades podem ser canceladas de forma estável (sem modos ou dinâmicas ocultas instáveis) pela entrada de controle se os parâmetros forem conhecidos.
Objetivo do projeto de controle adaptativo: fazer a saída rastrear assintoticamente uma saída desejada yd(t) apesar da incerteza do parâmetro.
As ideias de controle deslizante podem ser usadas para criar controladores que podem se adaptar a parâmetros desconhecidos constantes, enquanto não robustos a coeficientes ou perturbações de variação rápida desconhecidos, mas limitados.
Tipos de incertezas não paramétricas:
· Dinâmica não modelada de alta frequência, como atrito e aderência de Coulomb.
· Ruído de medição.
· Erro de arredondamento de cálculo e atraso de amostragem.
Incertezas não paramétricas geralmente levam à degradação do desempenho, ou seja, ao aumento do modelo após o erro. Geralmente, pequenas incertezas não paramétricas causam pequenos erros de rastreamento, enquanto as maiores causam maiores erros de rastreamento. O sistema de controle adaptativo se torna instável quando as incertezas não paramétricas se tornam muito grandes.
Quando o sinal v é persistentemente excitante indica que os sistemas de controle adaptativos têm alguma robustez em relação a incertezas não paramétricas. Quando os sinais não são persistentemente excitados, mesmo pequenas incertezas podem levar a problemas graves para controles adaptativos.
Quando os parâmetros estimados chegam ao ponto em que os polos de malha fechada entram no plano complexo da metade direita, todo o sistema se trona instável.
O desvio de parâmetros ocorre quando os sinais não são persistentemente excitantes, é principalmente causado por ruído de medição; não afeta a precisão de rastreamento até que ocorra a instabilidade; leva a falha repentina do sistema de controle adaptativo (por meio de dinâmicas não modeladas excitantes). Problema associado a incertezas não paramétricas (ruído e perturbação).
Quando o ganho de adaptação ou o sinal de referência são muito grandes, a adaptação se torna rápida e os parâmetros estimados podem ser bastante oscilatórios. Se as oscilações atingirem a faixa de frequência da dinâmica não modelada, a dinâmica não modelada pode ser excitada e a adaptação do parâmetro pode ser baseada em sinais sem sentido, possivelmente levando à instabilidade do sistema de controle.
Para problemas de oscilações de parâmetros, técnicas como normalização de sinais ou adaptação composta podem ser bastante úteis.
Modificação-sigma: aproxima o integrador original na lei de adaptação por um filtro de passo baixo. Outra técnica é a substituição do regressor (é desejável iniciar essa substituição após o erro de rastreamento ter convergido bem).
Erro de estimativa do parâmetro: 
Devemos considerar que os parâmetros verdadeiros são constantes, pra que informações sobre o comportamento do estimador possam ser obtidos.
Estimativa de gradiente: os parâmetros sejam atualizados para que o erro de predição seja reduzido. Essa ideia é implementada atualizando os parâmetros na direção inversa do gradiente do erro de predição ao quadrado em relação aos parâmetros. O estimador de gradiente é sempre estável.
De um modo geral, em um pequeno intervalo, o aumento do ganho de estimativa leva a uma convergência mais rápida dos parâmetros. Mas, além de algum ponto, aumentar ainda mais o ganho de estimativa leva a uma convergência mais oscilatória e mais lenta. Esse fenômeno é causado pela natureza de gradiente na otimização: dentro de um pequeno intervalo, o aumento no tamanho do passo na direção do gradiente leva a uma convergência mais rápida; mas, além de algum ponto, um tamanho maior leva a uma convergência mais oscilatória e possivelmente mais lenta.
Para que um estimador tenha valor prático, ele deve ter alguma robustez, ou seja, manter uma estimativa de parâmetros razoavelmente boa na presença de variação de parâmetros, ruído de medição, distúrbios,etc.
A qualidade das estimativas de parâmetros em um estimador de gradiente depende de:
· O nível de excitação persistente do sinal W (decidido pela tarefa de controle ou pelo experimento, a excitação persistente é essencial para a robustez do estimador). 
Se os sinais no projeto original não forem persistentemente excitados, os parâmetros não convergirão, mesmo na ausência de incertezas não paramétricas. Na presença de incertezas não paramétricas, o estimador pode se tornar instável, ou seja, os parâmetros podem divergir. Pode ser necessário adicionar alguns sinais de perturbação à entrada de controle para obter uma boa estimativa de parâmetro. Os detalhes específicos na geração de dados podem ser complicados, mas o resultado final é que se deve produzir a excitação persistente que for permitida pelas restrições envolvidas.
· A taxa de variação dos parâmetros e o nível de incertezas não paramétricas.
Afetam a qualidade das estimativas dos parâmetros. Se os parâmetros verdadeiros variarem mais rapidamente, é mais difícil para o estimador de parâmetros estimar com precisão. Se houver muito ruído, perturbações e dinâmicas não modeladas, as estimativas também se tornam fracas. 
· A magnitude do ganho do estimador po.
O método do gradiente sem ruído funciona e com ruído também, mas sem ruído o gráfico fica melhor.
A escolha do ganho inicial P(0) deve ser escolhida o mais alto possível para sensibilizar ao ruído. P(0) pode ser escolhido como diagonal, para simplificar.
Estimador de mínimos quadrados: em uma estrutura de filtro de Kalman, pode ser interpretado como um estado a ser estimado e P sendo a matriz de covariância de estimativa. Tenta ajustar todos os dados até o tempo atual, mas na realidade, os dados antigos são gerados por parâmetros antigos.
Um pequeno erro de parâmetro inicial ã(0) resulta em um pequeno erro de parâmetro o tempo todo. Um grande ganho inicial P(0) também leva a um pequeno erro de parâmetro.
Método dos mínimos quadrados: a grosso modo, possui boa robustez em relação a ruído e perturbação, mas pouca capacidade de rastrear parâmetros variáveis no tempo. O mínimo quadrado converge rapidamente inicialmente, mas lentamente depois. Os parâmetros estimados são muito mais suaves que os do método do gradiente.
O gráfico dos mínimos quadrados, tanto com ruído, como sem ruído, ficam idênticos, e com erros maiores que o método do gradiente.
P(t) converge para zero quando W é persistentemente excitado, ou seja, a atualização dos parâmetros é essencialmente desligada após algum tempo e as alterações nos parâmetros não podem mais ser estimadas.
Mínimos quadrados esquecendo o exponencial: técnica para parâmetros variáveis no tempo. Os dados passados são gerados por parâmetros passados e devem ser descontados ao serem usados para a estimativa dos parâmetros atuais. O termo exponencial na integral representa a ponderação para os dados. O esquecimento exponencial melhora a convergência de parâmetros sobre os mínimos quadrados padrão. A condição “integral infinita” para mínimos quadrados padrão ainda garante a convergência assintótica dos parâmetros estimados. Isso também implica que a excitação persistente do sinal W pode garantir a convergência exponencial dos parâmetros estimados, desde que seja escolhido como maior ou igual a uma constante positiva e que os sinais sejam persistentemente excitados.
Se o fator de esquecimento for constante, a taxa de convergência exponencial dos parâmetros estimados é a mesma que o fator de esquecimento. Um fator de esquecimento constante pode levar a uma magnitude decrescente em certas direções de P^-1 (magnitude ilimitada em certas dimensões de P) na ausência de persistentemente excitados, devido aos componentes de decaimento exponencial. A falta de limites (ou mesmo grande magnitude) da matriz de ganho é indesejável, pois implica que a perturbação e o ruído no erro de predição podem levar a oscilações violentas dos parâmetros estimados.
É preciso ter cautela na escolha do fator de esquecimento. Um fator de esquecimento zero leva ao ganho de desaparecimento (mínimos quadrados padrão e, portanto, incapacidade de rastrear parâmetros variáveis no tempo) na presença de excitação persistente, enquanto um fator positivo constante leve ao ganho explosivo na ausência de excitação persistente. Como um estimador pode encontrar sinais com diferentes níveis de excitação persistente, é necessário um método de ajuste automático para o fator de esquecimento.
Para manter os benefícios do esquecimento de dados (capacidade de rastreamento de parâmetros) e evitar a possibilidade de ganho ilimitado, é desejável ajustar a variação do fator de esquecimento para que o esquecimento de dados seja ativado quando w for persistentemente excitado e suspenso quando w não for.
O fator de esquecimento implica esquecer os dados com um fator se a norma de P for pequena (indicando p.e. forte), reduzindo a velocidade de esquecimento se a norma P se tornar maior e suspender o esquecimento se a norma atingir o limite superior especificado. Como um valor maior de significa esquecimento mais rápido (o que implica maior capacidade de seguir variações de parâmetros, mas também mais oscilações nos parâmetros estimados devido à menor “média” de pontos de dados ruidosos), a escolha de representa uma troca entre a velocidade do rastreamento de parâmetros e o nível de oscilação estimada dos parâmetros.
O limite do ganho afeta a velocidade da atualização do parâmetro e também os efeitos da perturbação no erro de predição, envolvendo uma troca similar.
Sob persistentemente excitado, pode também mostrar que P(t) é uniformemente mais baixo delimitado por uma matriz p.d. constante, uma propriedade desejável para estimar parâmetros variáveis no tempo.
No estimador de limite de ganho limitado (BGF), os erros de parâmetro e a matriz de ganho são sempre superiores. Se W é persistentemente excitado, os parâmetros estimados convergem exponencialmente e P(t) é limitado superior e inferior uniforme por matrizes definidas positivas.
A vantagem do método BGF sobre o método gradiente é que os parâmetros estimados são suaves. Isso implica que, dado o nível permitido de oscilação estimada dos parâmetros, que um limite de ganho muito maior pode ser usado no método BGF. Como resultado, é possível obter uma convergência mais rápida dos parâmetros.
O problema com o fator de limitação diferente de zero é a possibilidade de diminuição de P^-1.
Assumindo que o sinal w é persistentemente excitante, a perturbação d é limitada e a taxa de variação dos parâmetros é limitada. Como P^-1 foi mostrado como limite superior, a entrada para o filtro é limitada.
O limite de ã dependerá da magnitude da perturbação e da taxa de variação do parâmetro aponto. Também depende do nível de excitação persistente do sinal w(t) (que afeta ).
Se o sinal w for persistentemente excitante, o estimados não poderá mais garantir a limitação dos erros dos parâmetros na presença de variações e perturbações. P(t) (independente das perturbações aditivas e das variações dos parâmetros) é limitado e os erros dos parâmetros não podem divergir muito rápido.
O estimador BGF é usado para estimar o parâmetro variável no tempo. 
BGF sem ruído e com ruído fica muito bom, porém tem o chattering.
Quando o sinal W(t) não é persistentemente excitante, levando a evitar o desvio dos parâmetros. A zona morta agora deve ser colocada no erro de predição. O tamanho da zona morta deve ser escolhido para ser maior que a faixa de ruído e perturbação no erro de predição. Pequenos sinais de erro são denominados pelo ruído e não podem ser usados para estimativas confiáveis.
A excitação persistente é essencial para uma boa estimativa. A maioria dos estimadores não possui convergência rápida e boa robustez. O estimador de gradiente é simples, mas possui convergência lenta. O estimador de mínimos quadrados padrão é robusto ao ruído, mas não pode estimar parâmetros variáveis no tempo. A estimativa de mínimos quadrados com fator de esquecimento exponencial tem a capacidade de rastrearparâmetros variáveis no tempo, mas existe a possibilidade de ganho de corda na ausência de excitação persistente.
Uma técnica específica de ajuste de ganho, chamada de ganho limitado de esquecimento, é desenvolvida para manter os benefícios do esquecimento de dados e evitar ganhos de ganho. O estimador resultante possui convergência rápida e boa sensibilidade ao ruído. O cálculo e a análise desse estimador são razoavelmente simples.
Para ter um bom desempenho de estimativa, muitos problemas de implementação devem ser considerados com cuidado, como:
· Escolha da largura de banda do filtro para gerar (8.77).
· Escolha do parâmetro inicial e matriz de ganho inicial.
· Escolha da taxa de esquecimento e ganho vinculado.
· Escolha de sinais de excitação.
Compensações e julgamentos devem ser usados para fazer as escolhas acima. A largura de banda do filtro deve ser escolhida para ser maior que a largura de banda da planta, para que os sinais do sistema possam passar. Mas deve ser menor do que a faixa de frequência (geralmente alta frequência) do ruído. As estimativas iniciais dos parâmetros devem ser escolhidas para serem o mais precisos possível. A matriz de ganho inicial deve ser escolhida para obter a velocidade de convergência adequada e a robustez do ruído. O fator de esquecimento de vê ser escolhido para ser grande o suficiente para que a variação do parâmetro possa ser rastreada com precisão suficiente. Não pode ser escolhido muito grande para que a matriz de ganho seja muito grande ou muito oscilatória. O limite de ganho é escolhido com base no conhecimento da magnitude do ruído e no nível permitido de oscilação estimada dos parâmetros, com um ruído maior levando a um limite de ganho menor.
Os limites de excitação devem conter linhas de espectro suficientes para permitir a convergência dos parâmetros, e suas frequências devem estar dentro da largura de banda da planta para poder excitar a planta. Embora parâmetros desconhecidos possam variar no tempo, a velocidade da variação deve ser muito menor que a largura de banda da planta, caso contrário, a dinâmica dos parâmetros deve ser modelada.
Adaptação composta: novo método de adaptação que conduz a adaptação do parâmetro usando o erro de rastreamento e o erro de predição. Esse esquema de adaptação não apenas mantém a estabilidade global do sistema do controle adaptativo, mas também leva a uma rápida convergência de parâmetros e a erros menores de rastreamento. A característica fundamental da adaptação composta é sua capacidade de obter uma adaptação rápida.
No controle adaptativo composto, a lei de adaptação é uma “combinação” da lei de adaptação anterior e da lei de estimativa baseada em erro de predição. Esta lei de adaptação agora é dirigida por s e e1. O ganho P(t) é fornecido por qualquer uma das leis de atualização de ganho.
Se w é persistentemente excitante, pode mostrar que ambos s e mtil são exponencialmente convergentes a zero, Isto é, o controlador adaptativo tem convergência exponencial.
As vantagens da adaptação composta são mais claramente vistas em sistemas com mais de um parâmetro conhecido. Nesses casos, a lei de adaptação composta permite que um alto ganho de adaptação seja usado sem obter o comportamento oscilatório e a convergência lenta observada para as leis de adaptação baseadas em erros de rastreamento.
Vantagem do controlador adaptativo composto: suavidade dos resultados. Isso tem implicações significativas no desempenho do controle adaptativo. Devido à possibilidade de usar alto ganho de adaptação, podemos obter erros de rastreamento menores, convergência mais rápida de parâmetros sem dinâmica não modelada de alta frequência.
As simulações mostram que os controladores adaptativos compostos têm um desempenho muito melhor do que os controladores adaptativos padrão quando estão presentes dinâmicas não modeladas.
No gráfico, o rastreamento é perfeito com o controlador adaptativo composto, usando o sinal de referência com sen fica melhor ainda.
O filtro estável possui muito menos atenuação nos componentes de baixa frequência em e. Portanto, a busca de parâmetros na adaptação composta segure uma direção “média” ou “filtrada”, conforme especificado pelos componentes de baixa frequência no erro de rastreamento e. Isso explica a suavidade das estimativas de parâmetros no controle adaptativo composto.
O princípio da adaptação composta é combinar uma lei de adaptação baseada em erro de rastreamento e uma lei de estimativa de parâmetro baseada em erro de predição. Essa ideia pode ser estendida diretamente ao controle adaptativo em geral. É necessário parametrizar o modelo da planta e o controlador usando um conjunto comum de parâmetros para poder combinar os dois tipos de erros para adaptação.
O controle adaptativo é uma abordagem atraente para controlar sistemas dinâmicos incertos. Em princípio, os sistemas podem ser incertos em termos de estrutura dinâmica ou parâmetros. Até agora, o controle adaptativo pode lidar apenas com sistemas com parâmetros incertos. Os métodos de adaptação existentes geralmente requerem parametrização linear da lei de controle ou da dinâmica do sistema.
Se o estado completo estiver disponível, o projeto e a implementação do controle adaptativo são bastante simples. Se apenas a realimentação de saída estiver disponível, o projeto do controle adaptativo está muito mais envolvido devido à necessidade de introduzir dinâmica no controlador.
Nos sistemas MRAC, a lei de adaptação extrai informações de parâmetros dos erros de rastreamento. Nos controladores de autoajuste, o estimador de parâmetros extrai informações de erro de predição. No controle adaptativo composto, a lei de adaptação extrai informações de parâmetros de ambas as fontes. Esse novo método de adaptação leva a uma adaptação mais rápida, sem incorrer em oscilações significativas nos parâmetros estimados, resultando em melhor desempenho.

Continue navegando