sistemas linearizados por realimentação fuzzy...
TRANSCRIPT
UNIVERSIDADE ESTADUAL DE CAMPINAS
Faculdade de Engenharia Eletrica e de Computacao
Jeferson Costa da Silva
Sistemas Linearizados por Realimentacao FuzzyEvolutiva
Campinas
2018
UNIVERSIDADE ESTADUAL DE CAMPINAS
Faculdade de Engenharia Eletrica e de Computacao
Jeferson Costa da Silva
Sistemas Linearizados por Realimentacao Fuzzy Evolutiva
Dissertacao apresentada a Faculdade de En-genharia Eletrica e de Computacao da Uni-versidade Estadual de Campinas como partedos requisitos exigidos para a obtencao dotıtulo de Mestre em Engenharia Eletrica, naArea de Engenharia de Computacao.
Orientador: Prof. Dr. Fernando Antonio Campos Gomide
Este exemplar corresponde a versaofinal da tese defendida pelo alunoJeferson Costa da Silva, e orientadapelo Prof. Dr. Fernando AntonioCampos Gomide
Campinas
2018
Agência(s) de fomento e nº(s) de processo(s): Não se aplica.
Ficha catalográficaUniversidade Estadual de Campinas
Biblioteca da Área de Engenharia e ArquiteturaLuciana Pietrosanto Milla - CRB 8/8129
Silva, Jeferson Costa da, 1988- Si38s SilSistemas linearizados por relimentação fuzzy evolutiva / Jeferson Costa da
Silva. – Campinas, SP : [s.n.], 2018.
SilOrientador: Fernando Antônio Campos Gomide. SilDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade
de Engenharia Elétrica e de Computação.
Sil1. Controle robusto. 2. Sistemas evolutivos. 3. Sistemas de controle por
realimentação. I. Gomide, Fernando Antônio Campos, 1951-. II. UniversidadeEstadual de Campinas. Faculdade de Engenharia Elétrica e de Computação.III. Título.
Informações para Biblioteca Digital
Título em outro idioma: Evolving fuzzy feedback linearization systemsPalavras-chave em inglês:Robust controlEvolving systemsFeedback control systemsÁrea de concentração: Engenharia de ComputaçãoTitulação: Mestre em Engenharia ElétricaBanca examinadora:Fernando Antônio Campos Gomide [Orientador]Valter Júnior de Souza LeiteEric RohmerData de defesa: 08-02-2018Programa de Pós-Graduação: Engenharia Elétrica
Powered by TCPDF (www.tcpdf.org)
COMISSÃO JULGADORA - DISSERTAÇÃO DE MESTRADO
Candidato: Jeferson Costa da Silva RA: 163679
Data da Defesa: 08 de fevereiro de 2018
Título da Tese: "Sistemas Linearizados por Realimentação Fuzzy Evolutiva”.
Prof. Dr. Fernando Antônio Campos Gomide (Presidente, FEEC/UNICAMP) Prof. Dr. Valter Júnior de Souza Leite (CEFET-MG) Prof. Dr. Eric Rohmer (FEEC/UNICAMP)
A ata de defesa, com as respectivas assinaturas dos membros da ComissãoJulgadora, encontra-se no processo de vida acadêmica do aluno.
A Marinalva, Jose Neto, Julianny, Kaylens e famılia, Thomas, Amanda.
Agradecimentos
A Deus criador do Universo, por me possibilitar saude, inspiracao e forca para
realizacao desse trabalho.
Aos meus familiares, meu Pai o Sr. Jose Francisco da Silva Neto, minha Mae a
Sra Marinalva Costa da Silva, as minhas irmas Julianny Costa da Silva e Amanda Costa
Brandao aos meus irmaos Thomas Monteiro Costa e Silva e Kaylens Lee Jhonson Lira de
Souza, que tanto apoio me deram durante esta longa jornada e a quem eu os dedico este
trabalho.
Aos colegas e amigos do Laboratorio de Sinais e Sistemas do CEFET-MG campus
Divinopolis, em especial o Professor Msc. Lucas Silva Oliveira e ao Professor Dr Valter
Junior de Souza Leite pela valiosa contribuicao na parte experimental desta pesquisa.
Aos colegas do LCA/FEEC pelos momentos de alegria compartilhados. Aos colegas da
Universidade Federal de Roraima pela confianca, respeito e profissionalismo em especial
a Professora Dra. Gioconda Santos e Souza Martinez.
Um agradecimento especial a TODOS os professores do DCA/FEEC, em particular,
ao Professor Dr Fernando Antonio Campos Gomide pelo compromisso e confianca na
orientacao desta pesquisa.
A Universidade Estadual de Campinas, pela oportunidade.
Resumo
A linearizacao por realimentacao e uma poderosa abordagem de controle, porem pode
apresentar fragilidades diante de erros de modelagem. A falta de robustez desta abor-
dagem de controle pode levar a um desempenho abaixo do esperado ou ate mesmo a
instabilidade. Esta dissertacao sugere uma estrategia para melhorar a robustez em siste-
mas linearizados por realimentacao usando um mecanismo do tipo modelo de referencia e
um algoritmo de aprendizagem participativa evolutiva granular fuzzy. A linearizacao por
realimentacao granular evolutiva robusta fuzzy e uma maneira de controlar sistemas nao
lineares com incertezas e assegurar a estabilidade da malha fechada. O resultado e uma
abordagem mais robusta de controle em malha fechada em que a aprendizagem partici-
pativa evolutiva fuzzy e empregada para estimar as incertezas em tempo real e mitigar
seus efeitos no sistema. A dissertacao tambem aborda aspectos teoricos e praticos de um
sistema de controle de nıvel em um tanque nao linear, e mostra que o desempenho do
controlador granular evolutivo robusto e superior a abordagens alternativas propostas na
literatura como Classic Feedback Linearization, Fuzzy Model Reference Learning Control
e Indirect Adaptive Fuzzy Control. Alem disso, a dissertacao discute os aspectos praticos
e testes experimentais da linearizacao por realimentacao granular evolutiva robusta fuzzy
implementado em um controlador de nıvel de um tanque real de laboratorio.
Palavras-chaves: Controle robusto; Sistemas evolutivos, Sistemas de controle por reali-
mentacao.
Abstract
Exact feedback linearization is a powerful approach for nonlinear control, but has poor
robustness properties. Lack of robustness yields inadequate performance and instability.
This dissertation introduces a novel control approach to improve robustness of nonlinear
feedback linearization systems based on model reference adaptive control, and granu-
lar evolving fuzzy participatory learning. The granular evolving fuzzy robust feedback
linearization approach is a way to robustly control uncertain nonlinear systems around
a given operation point. The result is a robust closed-loop control approach in which
participatory learning is employed to estimate unknown nonlinearities online to cancel
their effects in feedback linearized systems. The dissertation develops studies using a
surge level tank and shows that the performance of the granular evolving robust feed-
back linearization is higher than Classic Feedback Linearization, Fuzzy Model Reference
Learning Control, and the Indirect Adaptive Fuzzy Control approaches. Actual imple-
mentation was done using a laboratory surge tank system. Experimental results agree
with simulation results, and confirms the superior performance of the granular evolving
fuzzy robust feedback linearization approach.
Keywords: Robust control; Evolving systems; Feedback control systems.
Lista de ilustracoes
Figura 2.1 – Linearizacao por realimentacao. . . . . . . . . . . . . . . . . . . . . . . 24
Figura 3.1 – Inferencia fuzzy. Min-Max. . . . . . . . . . . . . . . . . . . . . . . . . . 37
Figura 3.2 – Topologia FMRLC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Figura 4.1 – Modelo de aprendizagem participativa evolutiva. . . . . . . . . . . . . . 53
Figura 4.2 – Topologia do gERF. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
Figura 4.3 – Representacao do tanque com solido nao linear. . . . . . . . . . . . . . 61
Figura 4.4 – Nıvel do tanque com incerteza. . . . . . . . . . . . . . . . . . . . . . . 63
Figura 4.5 – Sinal de controle incerto. . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Figura 4.6 – Sinal de controle linearizado incerto. . . . . . . . . . . . . . . . . . . . 63
Figura 4.7 – Nıvel do tanque com incerteza constante. . . . . . . . . . . . . . . . . . 65
Figura 4.8 – Sinais de controle com incerteza constante. . . . . . . . . . . . . . . . . 65
Figura 4.9 – Sinais de controle linearizados com incerteza constante. . . . . . . . . . 65
Figura 4.10–Nıvel do tanque com incerteza variavel. . . . . . . . . . . . . . . . . . . 66
Figura 4.11–Sinais de controle com incerteza variavel. . . . . . . . . . . . . . . . . . 66
Figura 4.12–Sinais de controle linearizados com incerteza variavel. . . . . . . . . . . 66
Figura 4.13–Dinamica do tanque com perturbacao de carga. . . . . . . . . . . . . . 67
Figura 4.14–Nıvel do tanque com perturbacao de carga. . . . . . . . . . . . . . . . . 68
Figura 4.15–Sinais de controle com perturbacao de carga. . . . . . . . . . . . . . . . 68
Figura 4.16–Sinais de controle linearizados com perturbacao de carga. . . . . . . . . 68
Figura 4.17–Numero de grupos criados durante o teste com perturbacao de carga. . 69
Figura 5.1 – Sistema de tanques interativos do Laboratorio de Sinais e Sistemas
CEFET-MG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Figura 5.2 – Sensor diferencial de pressao Honeywell 26PCBFA6D. . . . . . . . . . . 74
Figura 5.3 – Sensores de vazao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
Figura 5.4 – Solido nao linear instalado dentro do tanque. . . . . . . . . . . . . . . 75
Figura 5.5 – Resposta do modelo do tanque. . . . . . . . . . . . . . . . . . . . . . . 76
Figura 5.6 – Nıvel e sinal de controle do tanque real com gERF e CFL. . . . . . . . 77
Figura 5.7 – Numero de centros criados pelo gERF. . . . . . . . . . . . . . . . . . . 78
Figura 5.8 – Nıvel e sinal de controle do tanque com variacao de parametro. . . . . 80
Figura 5.9 – Estrutura de grupo formada pelo gERF. . . . . . . . . . . . . . . . . . 81
Figura A.1–Diagrama esquematico da planta. . . . . . . . . . . . . . . . . . . . . . 88
Figura B.1 – Curva de calibracao do sensor de nıvel Tanque 03. . . . . . . . . . . . . 92
Figura B.2 – Curva de calibracao da Bomba 01. . . . . . . . . . . . . . . . . . . . . 93
Figura B.3 – Esquema do Tanque 03. . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Figura B.4 – Curva de calibracao do Tanque 03. . . . . . . . . . . . . . . . . . . . . 95
Figura B.5 – Validacao do modelo nao-linear. . . . . . . . . . . . . . . . . . . . . . . 96
Lista de tabelas
Tabela 3.1 – Base de regras do modelo fuzzy inverso. . . . . . . . . . . . . . . . . . 44
Tabela 4.1 – Desempenho normalizado do gERF com variacao de parametro constante. 70
Tabela 4.2 – Desempenho normalizado do gERF com parametro variante no tempo. 70
Tabela 4.3 – Desempenho normalizado do gERF com perturbacao de carga e ruıdo. 70
Tabela 5.1 – Indice de desempenho CFL e gERF. . . . . . . . . . . . . . . . . . . . 78
Tabela 5.2 – Indices de desempenho CFL e gERF com variacao de parametro. . . . 81
Tabela B.1 – Sinais de controle de equilıbrio . . . . . . . . . . . . . . . . . . . . . . 97
Lista de Abreviaturas e Siglas
BFO Bacterial foraging optimization (Modelo evolutivo de colonias
bacterianas)
BLS Batch least squares (Quadrados mınimos em batelada)
CFL Classic feedback linearization (Linearizacao por realimentacao classica)
cv Cavalo vapor
COG Center-of-gravity (Centro de gravidade)
DOF Degree of freedom (Grau de liberdade)
FMRLC Fuzzy model reference learning control
gERF Granular evolving fuzzy robust feedback linearization
IAFC Indirect adaptive fuzzy control
ITAE Integral of time-weighted absolute error
IAE Integral of the absolute magnitude of the error
IVU Integral of time-weighted variability of the signal control
ISE Integral of the square of the error
ITSE Integral of the time multiplied by square of error
LMI Linear matrix inequalities (Desigualdades matriciais lineares)
LMN Local model neural network (Modelo de rede neural local)
MATLAB Matrix laboratory
MIMO Multiple input and multiple output (Multiplas entradas e multiplas
saıdas)
MRAC Model reference adaptive control (Modelo adaptativo de controle por
referencia)
Numpy Numeric python
RMI Robust multi-inversion (Multi-inversao robusta)
RLS Recursive least squares (Quadrados mımimos recursivos)
SISO Single input and single output (Uma entrada e uma saıda)
TS Takagi-Sugeno
Lista de Sımbolos
, Igual por definicao
∃ Existe
∈ Pertence a
/∈ Nao pertence a
⊆ Subconjunto
span Espaco vetorial gerado por vetores linearmente independentes
dim Dimensao de um vetor
rank Posto de uma matriz
(∘) Composicao max − min
sup Supremo entre dois valores
min Mınimo entre dois valores⋃Operacao agregacao entre dois conjuntos fuzzy
≈ Aproximadamente
argmax Argumento que maximiza
𝜑 (·) Difeomorfismo
R Conjunto dos numeros reais
D Subconjunto de R
𝐴𝑗𝑖 Conjunto fuzzy
X Universo de discurso
𝑦𝑖, 𝑥𝑖 Vetores utilizados
𝐿𝑓ℎ Derivada de Lie da funcao ℎ(𝑥) ao longo de 𝑓(𝑥)
𝑎𝑑𝑓𝑔(𝑥) Produto de Lie entre as funcoes 𝑓(𝑥) e 𝑔(𝑥)
Trabalhos publicados
Conferencia nacional
Oliveira, L.; Leite, V.; Silva, J.; Gomide, F. Robustez em linearizacao por rea-
limentacao granular evolutiva. In: SBA. 2017 Simposio Brasileiro de Automacao Inteli-
gente. Porto Alegre – RS, Brasil, 2017. p. 1-8.
Conferencia internacional
Oliveira, L.; Leite, V.; Silva, J.; Gomide, F. Granular evolving fuzzy robust fe-
edback linearization. In: IEEE. 2017 Evolving and Adaptive Intelligent Systems (EAIS).
Ljubljana, SLO, 2017. p. 1-8.
Sumario
1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.1 Revisao bibliografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.2 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.4 Organizacao do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Linearizacao por realimentacao . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1 Controle em linearizacao por realimentacao . . . . . . . . . . . . . . . . . . 23
2.2 Fundamentos de sistemas de controle nao linear . . . . . . . . . . . . . . . 25
2.3 Condicoes necessarias para linearizacao por realimentacao . . . . . . . . . . 28
2.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3 Controle fuzzy adaptativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1 Sistemas fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.1 Sistemas linguısticos fuzzy . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.2 Modelo funcional fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2 Fuzzy Model Reference Learning Control . . . . . . . . . . . . . . . . . . . 39
3.2.1 Controlador fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.2 Modelo de referencia . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.3 Mecanismo de aprendizagem . . . . . . . . . . . . . . . . . . . . . . 42
3.3 Indirect Adaptive Fuzzy Control . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3.1 Metodo de identificacao e estimacao . . . . . . . . . . . . . . . . . . 45
3.3.2 Compensador adaptativo distribuıdo paralelo . . . . . . . . . . . . 49
3.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4 Controle granular evolutivo . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.1 Aprendizagem participativa evolutiva . . . . . . . . . . . . . . . . . . . . . 52
4.2 Formulacao do problema de controle . . . . . . . . . . . . . . . . . . . . . 56
4.3 Linearizacao por realimentacao granular evolutiva robusta fuzzy . . . . . . 57
4.4 Controle de nıvel de tanque . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.5 Analise e avaliacao de desempenho . . . . . . . . . . . . . . . . . . . . . . 64
4.6 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5 Resultados experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.1 Descricao do tanque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
5.2 Teste 01 - Linearizacao por realimentacao classica . . . . . . . . . . . . . . 74
5.3 Teste 02 - Topologia de controle . . . . . . . . . . . . . . . . . . . . . . . . 77
5.4 Teste 03 - Variacao de parametro . . . . . . . . . . . . . . . . . . . . . . . 79
5.5 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6 Conclusao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Anexos 87
ANEXO A Sistema de tanques interativos . . . . . . . . . . . . . . . . . . . . 88
ANEXO B Modelagem do tanque . . . . . . . . . . . . . . . . . . . . . . . . 89
B.1 Calibracao de sensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
B.1.1 Calibracao do sensor de nıvel . . . . . . . . . . . . . . . . . . . . . 90
B.1.2 Calibracao de vazao da Bomba 01 . . . . . . . . . . . . . . . . . . . 91
B.1.3 Calibracao de vazao do Tanque 03 . . . . . . . . . . . . . . . . . . . 93
B.1.4 Validacao do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 96
17
1 Introducao
As primeiras aplicacoes automatizadas surgiram na Grecia, por volta de 300 a.C.,
com a invencao de sistemas de ajuste do fluxo de agua em um reservatorio a fim de
controlar o nıvel (BISSELL, 2009). Inicialmente os processos para controle e automacao
eram simples, rudimentares e utilizavam tecnicas empıricas no desenvolvimento. Ao longo
do tempo, novos estudos e desenvolvimentos consolidaram tecnicas de analise e sıntese que
possibilitam o projeto de sistemas automatizados com desempenho cada vez maior, alem
da aplicabilidade em uma vasta gama de sistemas e processos. A partir do seculo XIX,
as tecnicas de automacao e controle passaram a ser tratadas com formalismo tecnico
e cientıfico mais rigorosos (MAYR; BRYANT, 1971), (ZANKL, 2006). A evolucao dos
estudos em automacao permitiu que diversas tecnicas e metodos de controle fossem criados
para lidar com ambientes cada vez mais complexos e que mudam suas condicoes a todo
instante (OGATA, 2003).
A teoria de controle e automacao aplicada a industria surgiu em meio a Revolucao
Industrial ocorrida em meados do seculo XIX, quando foram criadas as primeiras maquinas
para a manufatura de bens e equipamentos. Dentre os diversos sistemas de controle, os
nao lineares vem sendo pesquisados e desenvolvidos com mais intensidade a partir da
decada de 1980. Atualmente diversas tecnicas de controle nao lineares vem sendo criadas
e melhoradas para garantir robustez as aplicacoes industriais, uma vez que estas lidam
diretamente com sistemas fısicos. O estudo de sistemas de controle envolvem modelos
complexos e demandam grande esforco para o desenvolvimento e projeto, pois levam
em consideracao a dinamica do processo fısico que irao operar. O desenvolvimento de
sistemas de controle esta baseado em modelos dinamicos que descrevem o comportamento
do processo e suas caracterısticas. A partir da analise do modelo, e projetada uma lei
de controle que torna a resposta aceitavel diante das perturbacoes presentes no sinal de
controle e no sistema (BENNETT, 1996), (WILBANKS, 1996).
Uma vez que a lei de controle tenha sido projetada espera-se que esta proporcione
ao sistema em malha fechada uma dinamica que atenda as especificacoes de projeto,
mesmo que existam diferencas entre o modelo e o sistema real. Atualmente o interesse em
pesquisar este tipo de controle consiste em assegurar estabilidade, robustez e desempenho
Capıtulo 1. Introducao 18
(ISIDORI, 1985).
1.1 Revisao bibliografica
A linearizacao por realimentacao exata/classica – Classic Feedback Linearization –
(CFL) e uma tecnica na qual uma lei de controle e adequadamente projetada ou escolhida
para transformar a dinamica de um sistema nao linear em um sistema linear controlavel
equivalente, ao qual pode se reescrito como uma cadeia de integradores e entao projetar os
ganhos do controlador via uma abordagem de sistemas lineares convencionais (KHALIL,
2002). Na pratica, essa abordagem nao apresenta garantia de estabilidade e desempenho
quando o sistema real diverge do modelo utilizado na linearizacao. Diferentes formas de
agregar robustez a essa tecnica de controle foram propostas.
Por exemplo, o trabalho apresentado em (FRANCO, 2006) sugere um metodo de
linearizacao por realimentacao que coloca a origem do sistema em malha fechada entorno
dos pontos de operacoes selecionados. Embora esta abordagem de controle produza um
sistema em malha fechada mais robusto que a CFL, ela tambem pode apresentar compor-
tamento inesperado e instavel na presenca de incertezas suficientemente grandes.
Um metodo frequentemente utilizado e a inversao multi-robusta – Robust Multi-
Inversion – (RMI), desenvolvido por (FAUVEL; LAVERGNE, 2014). Essa tecnica con-
siste em adicionar um sinal de compensacao ao sinal de controle para anular os efeitos
das incertezas. O sinal de compensacao depende da diferenca entre o sinal de saıda do
sistema real e da saıda do modelo nao linear utilizado no projeto do controlador. Todavia
essa abordagem nao fornece uma metodologia sistematica para projetar o controlador.
Em (OLIVEIRA, 2015), uma topologia similar a RMI e proposta com a utilizacao
de um sinal de compensacao ao sinal de controle. Os ganhos do controlador sao calcu-
lados utilizando um algoritmo de evolucao diferencial em que a estabilidade e certificada
via desigualdades matriciais lineares – Linear Matrix Inequalities – (LMI), para fornecer
robustez ao sistema em malha fechada.
No trabalho de (BANERJEE et al., 2011), utilizou-se o modelo evolutivo de colo-
nias bacterianas – Bacterial Foraging Optimization – (BFO). O algoritmo BFO e um
mecanismo de otimizacao estocastica baseado em tecnicas evolutivas das colonias de bac-
terias. Este controlador e projetado com base nos parametros do processo e em tempo
Capıtulo 1. Introducao 19
real sao estimadas as incertezas do sistema de controle de linearizacao por realimentacao
no qual um esquema de equivalencia certa fuzzy e desenvolvido para controlar sistemas
nao lineares.
Em (BLAZIC et al., 2003), encontra-se um algoritmo adaptativo de controle fuzzy
tipo Takagi-Sugeno, no qual, o processo fısico controlado e nao linear de primeira ordem
que torna-se estavel mesmo na presenca de dinamicas nao modeladas. Nesse trabalho
os autores mostram que os sinais de controle tornam-se limitados enquanto o erro de
seguimento de referencia e os parametros estimados convergem para um conjunto residual
dependente do tamanho da amplitude das dinamicas nao modeladas.
Em (ZDESAR et al., 2013), considera-se um algoritmo de controle e auto ajuste
projetado para uso em um sistema nao linear de uma entrada e uma saıda – Single Input
and Single Output – (SISO). O algoritmo de controle desenvolvido e baseado no modelo
adaptativo Takagi-Sugeno e e composto por duas malhas: feedforward e feedback. Na
malha feedforward o controlador deve conduzir a saıda do sistema a uma vizinhanca
do sinal de referencia. Para alcancar a referencia desejada e adicionada uma malha de
feedback ao controlador. O modelo de controlador preditivo utilizado na malha de feedback
e obtido atraves do modelo Takagi-Sugeno construıdo atraves do evolving fuzzy modeling
com base na tecnica de agrupamento recursivo Gustafson-Kessel e quadrados mınimos.
Essa abordagem emprega tecnicas evolutivas para adicionar, remover, fundir e dividir
grupos que caracterizam e ajustam o controlador.
As abordagens classicas de controle fuzzy adaptativo foram propostas em (PAS-
SINO; YURKOVICH, 1997), e introduzem dois metodos para ajuste da lei de controle
por realimentacao: o primeiro e o – Fuzzy Model Reference Learning Control – (FMRLC)
e o segundo o – Indirect Adaptive Fuzzy Control – (IAFC).
Um novo modelo adaptativo de controle por referencia – Model Reference Adaptive
Control – (MRAC), e proposto em (SKRJANC et al., 2002). Os autores apresentam
uma nova abordagem para o FMRLC em que a generalidade do algoritmo e confirmada
pelo teorema de Stone-Weierstrass, indicando que qualquer funcao contınua pode ser
aproximada por uma expansao de funcao de base fuzzy. A lei adaptativa com parametros
fuzzy adaptativos sao obtidos usando o criterio de estabilidade de Lyapunov (KHALIL,
2002).
Capıtulo 1. Introducao 20
No trabalho de (EULER-ROLLE et al., 2016) um modelo simples e introduzido
para criar automaticamente uma lei de controle em um sistema dinamico nao linear uti-
lizando um modelo de rede neural local de tempo discreto – Discrete-time Local Model
Network – (LMN), cuja linearizacao por realimentacao e aplicada ao modelo generico da
LMN e a transformacao de entrada resultante e usada como modelo de controle inverso.
Porem este estudo nao aponta estrategias de controle para lidar com parametros incertos
variantes no tempo do modelo de controle nao linear.
Diante das referencias apresentadas, percebe-se que os sistemas de controle adap-
tativos atraı interesse em relacao a estabilidade e robustez quando existe variacao de
parametros e o desenvolvimento de tecnicas que permitam mitigar tais efeitos no sistema
de controle.
1.2 Motivacao
A estimacao de incertezas em sistemas de controle nao lineares e um tema que
desperta interesse na comunidade cientıfica, pois tais sistemas operam em condicoes com-
plexas e quaisquer alteracoes, nao modeladas, no sistema fısico causa a perda de robustez
(FRANCO, 2006), (KARIMI; MOTLAGH, 2006), (FRANCO et al., 2013). Assim, as-
segurar uma operacao estavel e robusta quando existem parametros variantes no tempo
tem uma importancia fundamental no desempenho de sistemas de controle que dependem
de um modelo do processo.
Um dos problemas comuns no desenvolvimento de controladores esta relacionado
a garantia de robustez quando alguns parametros do modelo variam ou possuem um
grau de incerteza associados. De acordo com (OLIVEIRA, 2015), torna-se extremamente
complexo projetar e garantir robustez as aplicacoes no tocante a escolha de ganhos e ao
mesmo tempo manter a estabilidade da lei de controle linearizante projetada (BAEZA,
2013). Portanto, o desenvolvimento de sistemas de controle robustos para processos nao
lineares e variantes no tempo e uma tarefa de grande relevancia, para ilustrar esta fato
na Secao 4.4 do Capıtulo 4 e apresentada uma simulacao da perda de robustez causada
pela variacao dos parametros do processo.
Capıtulo 1. Introducao 21
1.3 Objetivo
Esta trabalho desenvolve um metodo adaptativo de controle com linearizacao por
realimentacao e compara seu desempenho com abordagens de controle fuzzy adaptativos
existentes na literatura. Esses metodos sao aplicados em sistemas linearizados por reali-
mentacao classica e estimam as incertezas que causam instabilidade e falta de robustez
a malha de controle. Indices de desempenho, tais como Integral of Time-weighted Abso-
lute Error – (ITAE), Integral of Time-weighted Variability of the Signal Control – (IVU),
Integral of the Absolute Magnitude of the Error – (IAE), Integral of Time-weighted Va-
riability of the Error – (IVE), Integral of the Square of the Error – (ISE) e Integral of
Time Multiplied by Square Error – (ITSE) sao utilizados para quantificar o desempenho
de cada metodo.
Assim, o objetivo deste trabalho e implementar, desenvolver, analisar e comparar
o desempenho das abordagens de controle fuzzy adaptativos existentes na literatura CFL,
FMRLC e IAFC com o metodo proposto neste trabalho denominado linearizacao por
realimentacao granular evolutiva robusta fuzzy – Granular Evolving Fuzzy Robust Feedback
Linearization – (gERF). Controladores do tipo gERF sao robustos quanto a variacoes
ou incertezas nos parametros do modelo e os efeitos causados nos sistemas de controle
linearizados por realimentacao.
Mais especificamente, objetiva-se:
1. Estudar, analisar, implementar e simular sistemas de controle fuzzy classicos e o
sistema de controle evolutivo granular gERF;
2. Implementar e testar experimentalmente a abordagem de controle proposta nesta
dissertacao;
3. Quantificar e comparar o desempenho dos sistemas de controle utilizando como
criterio o ındices: ITAE, IVU, IVE, ISE, IAE, ITSE.
1.4 Organizacao do trabalho
Essa dissertacao esta organizada da seguinte forma: O Capıtulo 2, apresenta uma
breve revisao dos conceitos e tecnicas que compreendem a derivada de Lie, as condicoes
Capıtulo 1. Introducao 22
necessarias e os fundamentos da linearizacao por realimentacao. O Capıtulo 3, aborda os
fundamentos dos modelos de controle fuzzy adaptativo FMRLC e IAFC. O Capıtulo 4
inicia com a apresentacao dos conceitos da aprendizagem participativa evolutiva fuzzy. Na
sequencia, formula-se o problema da presenca de incertezas e variacao de parametros no
sistema real projetado com o metodo CFL, para o caso SISO, e apresenta-se o metodo de
linearizacao por realimentacao com o gERF. Um estudo comparativo entre o desempenho
do gERF e o da linearizacao por realimentacao com os metodos CFL, FMRLC e IAFC
utilizando como exemplo o controle de nıvel em um tanque nao linear e os respectivos
resultados de simulacoes sao tambem parte deste capıtulo. O Capıtulo 5 discorre sobre
uma analise de desempenho do gERF num sistema de controle de nıvel em um tanque, e
os resultados de testes experimentais realizados em laboratorio. Finalmente, o Capıtulo 6
conclui a dissertacao enumerando suas principais contribuicoes, e sugerindo topicos para
serem tratados em estudos e desenvolvimentos futuros.
23
2 Linearizacao por realimentacao
Na literatura e possıvel encontrar diversos metodos e tecnicas para linearizar um
sistema de controle, por exemplo, por serie e expansao de Taylor, modos deslizantes, line-
arizacao por realimentacao entre outros. Este Capıtulo apresenta uma breve revisao sobre
os conceitos de linearizacao por realimentacao classica – Classic Feedback Linearization –
(CFL).
2.1 Controle em linearizacao por realimentacao
Segundo (GARCES et al., 2012), o objetivo da CFL e transformar algebricamente
um sistema dinamico nao linear em um sistema dinamico linear equivalente usando a
realimentacao estatica dos estados, por meio de uma transformacao de coordenadas e
analise diferencial do sistema de controle. Considere a classe de sistemas nao lineares
dada por:
�� = 𝑓(𝑥) + 𝑔(𝑥)𝑢
𝑦 = ℎ(𝑥)(2.1)
em que: 𝑥 ∈ R𝑛 e o vetor de variaveis de estado, 𝑢 ∈ R𝑚 e o vetor da variavel de entrada,
𝑦 ∈ R𝑚 e o vetor da variavel de saıda, 𝑓(𝑥) ∈ R𝑛, 𝑔(𝑥) ∈ R𝑛×𝑚 e ℎ(𝑥) ∈ R𝑚 sao vetores
de funcoes nao lineares definidas em um subconjunto aberto D ⊆ 𝑅𝑛 tal que 𝑓 : D → R𝑛,
𝑔: D → R𝑛×𝑚 e ℎ: D → R𝑚. O ponto de operacao e 𝑥0 = [𝑥01, 𝑥
02, . . . , 𝑥
0𝑛]𝑇 . Assume-se
que o vetor de estado 𝑥 e conhecido (SLOTINE; LI, 1991).
A questao envolvendo (2.1) e saber se existe um controle por realimentacao de
estados que, junto com uma mudanca de coordenadas, possa transformar esse sistema
nao linear em um sistema linear equivalente. O primeiro problema que se apresenta e o de
projetar uma lei de controle que cancele exatamente as parcelas nao lineares do sistema
de controle. Em geral deseja-se projetar uma lei de controle que em malha fechada torne
o sistema linear. O cancelamento das nao linearidades utiliza uma transformacao de
Capıtulo 2. Linearizacao por realimentacao 24
coordenadas, chamada difeomorfismo 𝜑(𝑥), com 𝑧 ∈ R𝑛.
𝑧 = 𝜑(𝑥) (2.2)
A rigor, a lei de controle que faz a realimentacao (transformacao) exata dos estados
e feita aplicando o difeomorfismo. A lei de controle pode ser calculada pela expressao:
𝑢 = 𝛼(𝑥) + 𝛽(𝑥)𝑣 (2.3)
em que 𝛼(𝑥) ∈ R𝑚 e 𝛽(𝑥) ∈ R𝑚×𝑚 sao vetores de funcoes nao lineares e 𝑣 ∈ R𝑚 e a variavel
que representa a lei de controle linear. Uma escolha possıvel e determinar 𝛼(𝑥) = −𝑓(𝑥)𝑔(𝑥) e
𝛽(𝑥) = 1𝑔(𝑥) se 𝑔(𝑥) nao for nula em D. A operacao de mudanca de coordenadas e realizada
pelo difeomorfismo (2.2) e pela lei de controle (2.3), tornando o sistema nao linear (2.1)
no sistema linear descrito pela expressao:
�� = 𝐴𝑧 +𝐵𝑣 (2.4)
Conhecida como forma canonica de Brunowsky, o par (𝐴, 𝐵) e controlavel e 𝑣 ∈
R𝑚 e o sinal de controle linear calculado por:
𝑣 = 𝐾𝑧 = 𝐾𝜑(𝑥) (2.5)
Com 𝐾 sendo uma matriz alocacao de polos do sistema (KHALIL, 2002), (DORF;
BISHOP, 2000).
𝑢 = 𝛼(𝑥) + 𝛽(𝑥)𝑣 Sistema Nao Linear 𝜑(𝑥)
𝐾
𝑢 𝑥 𝑧
𝑣
Figura 2.1 – Linearizacao por realimentacao.
A Figura 2.1 mostra a operacao de linearizacao por realimentacao para sistemas
de controle nao lineares. As proximas secoes apresentam os fundamentos de sistemas
Capıtulo 2. Linearizacao por realimentacao 25
nao lineares e da linearizacao por realimentacao. O projeto do controlador com essa
abordagem deve satisfazer as condicoes explicitadas na proxima Secao.
2.2 Fundamentos de sistemas de controle nao linear
Considere sistemas nao lineares representados por modelos na forma (2.1). Esses
sistemas possuem solucoes analıticas exatas para o problema de linearizacao. Por isso e
feita uma formulacao para solucao destes problemas considerando as propriedades diferen-
ciais em torno dos pontos de operacoes do sistema. Algumas abordagens propoem criar
uma lei de controle que faca uma aproximacao de linearizacao entrada-saıda para cancelar
as nao linearidades do sistema. A seguir sao apresentadas as propriedades envolvidas no
calculo do controle que cancela as nao linearidades do sistema. Deste ponto em diante,
havera a omissao do argumento das funcoes sempre que esse fato nao comprometer a
compreensao.
Definicao 2.1 (Derivada de Lie) Seja ℎ: 𝐷 → R uma funcao diferenciavel e um
campo vetorial 𝑓 : D → R em D ⊆ R𝑛. A Derivada de Lie de ℎ(𝑥) ao longo de 𝑓 e
dada pelo produto interno:
⟨𝜕ℎ
𝜕𝑥, 𝑓(𝑥)
⟩= 𝜕ℎ
𝜕𝑥𝑓(𝑥) (2.6)
A Derivada de Lie de ℎ ao longo de 𝑓 e denotada por 𝐿𝑓ℎ
𝐿𝑓ℎ(𝑥) =𝑛∑
𝑖=1
𝜕ℎ
𝜕𝑥𝑖
𝑓𝑖(𝑥) (2.7)
para todo 𝑥 ∈ 𝐷.
Se 𝐿𝑓ℎ for diferenciavel por outro campo vetorial 𝑔, temos:
𝐿𝑔𝐿𝑓ℎ(𝑥) = 𝜕𝐿𝑓ℎ
𝜕𝑥𝑔(𝑥) (2.8)
Capıtulo 2. Linearizacao por realimentacao 26
Realizando esta operacao recursivamente 𝑘−vezes, obtem-se a expressao:
𝐿𝑘𝑓ℎ =
𝜕(𝐿𝑘−1𝑓 ℎ)𝜕𝑥
𝑓(𝑥) (2.9)
em seguida define-se:
𝐿0𝑓ℎ = ℎ(𝑥) (2.10)
Definicao 2.2 (Produto de Lie) Considerando que 𝑓 e 𝑔 sao dois campos vetoriais
definidos em um subconjunto D ⊆ R𝑛, o Produto de Lie de 𝑓 e 𝑔 e um novo campo
vetorial diferenciavel definido por:
[𝑓,𝑔](𝑥) = 𝑎𝑑𝑓𝑔(𝑥) = 𝜕𝑔
𝜕𝑥𝑓(𝑥) − 𝜕𝑓
𝜕𝑥𝑔(𝑥) (2.11)
em que𝜕𝑔
𝜕𝑥e𝜕𝑓
𝜕𝑥sao as matrizes Jacobianas de 𝑔 e 𝑓 :
𝜕𝑔
𝜕𝑥=
⎡⎢⎢⎢⎢⎢⎣𝜕𝑔1𝜕𝑥1
· · · 𝜕𝑔1𝜕𝑥𝑛
.... . .
...
𝜕𝑔𝑛
𝜕𝑥1· · · 𝜕𝑔𝑛
𝜕𝑥𝑛
⎤⎥⎥⎥⎥⎥⎦ (2.12a)
𝜕𝑓
𝜕𝑥=
⎡⎢⎢⎢⎢⎢⎣𝜕𝑓1𝜕𝑥1
· · · 𝜕𝑓1𝜕𝑥𝑛
.... . .
...
𝜕𝑓𝑛
𝜕𝑥1· · · 𝜕𝑓𝑛
𝜕𝑥𝑛
⎤⎥⎥⎥⎥⎥⎦ (2.12b)
𝑥 ∈ 𝐷.
Definicao 2.3 (Grau Relativo e Matriz Caracterıstica) Dado o sistema nao afim
na forma multivariavel (2.1). E dito que cada saıda ℎ𝑗(𝑥) possui grau relativo 𝑟𝑗 no ponto
(𝑥0,𝑦0), se:
1. 𝐿𝑔𝑖ℎ𝑗(𝑥) = 𝐿𝑔𝑖
𝐿𝑓ℎ𝑗(𝑥) = · · · = 𝐿𝑔𝑖𝐿𝑘
𝑓ℎ𝑗(𝑥) = 0, ∀𝑖 ∈ [1,𝑝] e 𝑘 < 𝑟𝑗 − 1. e se existe pelo
menos um 𝑖 tal que 𝐿𝑔𝑖𝐿𝑘
𝑓ℎ𝑗(𝑥) = 0, 𝑘 = 𝑟𝑗 − 1, 𝑖 ∈ [1,𝑝].
Capıtulo 2. Linearizacao por realimentacao 27
2. O grau relativo e definido como 𝑟 = 𝑟1 + 𝑟2 + · · · + 𝑟𝑚 e a matriz caracterıstica 𝑀(𝑥)
nao singular em 𝑥0 e definida como:
𝑀(𝑥) =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣
𝐿𝑔1𝐿𝑟1−1𝑓 ℎ1(𝑥) 𝐿𝑔2𝐿
𝑟1−1𝑓 ℎ1(𝑥) · · · 𝐿𝑔𝑚𝐿
𝑟1−1𝑓 ℎ1(𝑥)
𝐿𝑔1𝐿𝑟2−1𝑓 ℎ2(𝑥) 𝐿𝑔2𝐿
𝑟2−1𝑓 ℎ2(𝑥) · · · 𝐿𝑔𝑚𝐿
𝑟1−1𝑓 ℎ2(𝑥)
......
. . ....
𝐿𝑔1𝐿𝑟𝑚−1𝑓 ℎ𝑚(𝑥) 𝐿𝑔2𝐿
𝑟𝑚−1𝑓 ℎ𝑚(𝑥) · · · 𝐿𝑔𝑚𝐿
𝑟𝑚−1𝑓 ℎ𝑚(𝑥)
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦(2.13)
A consequencia da definicao (2.3) e que sistemas do tipo (2.1) tem grau relativo 𝑟
em um ponto em torno do equilıbrio 𝑥0 quando a saıda 𝑦 e derivada 𝑟 vezes para que 𝑢
apareca nas equacoes. Segundo (KHALIL, 2002) e (ISIDORI, 1995), alem do conceito de
grau relativo apresentado e necessario abordar brevemente os conceitos de distribuicao e
involutividade de uma distribuicao, para avaliar a possibilidade de linearizacao exata do
sistema.
Definicao 2.4 (Distribuicao) Uma distribuicao em 𝑥 e um espaco vetorial gerado pela
colecao de vetores 𝑓𝑖(𝑥), 𝑖 = 1, . . . ,𝑛 em um conjunto aberto D de R𝑛 tal que:
𝐷(𝑥) = span{𝑓1(𝑥), . . . ,𝑓𝑛(𝑥)} (2.14)
E possıvel perceber que nesta definicao a cada ponto 𝑥 ∈ D corresponde um subes-
paco 𝐷(𝑥) de R𝑛. Denota-se por D a colecao de todos os espacos vetoriais 𝐷(𝑥) ∈ 𝑈 . A
dimensao de 𝐷(𝑥), dim(𝐷) = rank[𝑓1(𝑥),𝑓2(𝑥), . . . ,𝑓𝑛(𝑥)], varia com 𝑥. Uma distribuicao
𝐷 e dita nao singular se dim(𝐷(𝑥)) = 𝑛 para todo 𝑥 ∈ 𝑈 (GARCES et al., 2012).
Definicao 2.5 (Involutividade) Uma distribuicao 𝐷 e dita involutiva se os campos
vetoriais 𝑔1, 𝑔2 ∈ D e o produto de Lie [𝑔1,𝑔2] ∈ D.
Definicao 2.6 (Difeomorfismo) A aplicacao 𝜑: Ω → R𝑛, na qual Ω e um subconjunto
aberto de R𝑛, e um difeomorfismo se 𝜑(𝑥)−1 existe e se 𝜑(𝑥) e 𝜑(𝑥)−1 sao diferenciaveis
e contınuas em Ω. Se Ω = R𝑛 entao 𝜑(𝑥) e um difeomorfismo global.
Capıtulo 2. Linearizacao por realimentacao 28
2.3 Condicoes necessarias para linearizacao por realimentacao
De acordo com (SLOTINE; LI, 1991), existem algumas condicoes que devem ser
observadas para tornar um sistema nao linear em linear. Essas condicoes sao importantes
na teoria de controle por realimentacao e parte de duas questoes fundamentais no desen-
volvimento de sistemas nao lineares. A primeira e saber se todos os sistemas do tipo (2.1)
podem ser linearizados e a segunda e saber quando tal linearizacao existe. Para resolver
estas questoes (ISIDORI, 1995) propoe o seguinte.
Lema 2.1 Dada a matriz 𝑔(𝑥0) de posto p, o problema da linearizacao por realimentacao
em espaco de estado e soluvel se somente se existe uma vizinhanca D do ponto de equilıbrio
(𝑥0) e 𝑝 funcoes de valores reais ℎ1(𝑥), ℎ2(𝑥),· · · ,ℎ𝑝(𝑥) definidas em D, tal que o sistema
(2.1) tenha um vetor grau relativo {𝑟1,𝑟2, . . . ,𝑟𝑝} em 𝑥0, com 𝑟1 + 𝑟2 + · · · + 𝑟𝑝 = 𝑛.
O Lema 2.1 torna possıvel a descricao, sob algumas condicoes, dos campos vetoriais
𝑓(𝑥), 𝑔1(𝑥), . . . , 𝑔𝑝(𝑥), de modo que seja possıvel encontrar 𝑝 funcoes ℎ1(𝑥), ℎ2(𝑥),· · · ,ℎ𝑝(𝑥)
em termos das propriedades distributivas e campos vetoriais 𝐺0 ⊂ 𝐺1 ⊂ · · · 𝐺𝑛−1 ⊆ R𝑛
e as distribuicoes associadas ao sistema (2.1) seja:
𝐺0 = span{𝑔1, . . . ,𝑔𝑝}
𝐺1 = span{𝑔1, . . . ,𝑔𝑝,𝑎𝑑𝑓𝑔1, . . . ,𝑎𝑑𝑓𝑔𝑝}
. . .
𝐺𝑖 = span{𝑎𝑑𝑘𝑓𝑔𝑗 : 0 ≤ 𝑘 ≤ 𝑖, 1 ≤ 𝑗 ≤ 𝑝}, 0 ≤ 𝑖 ≤ 𝑛− 1
(2.15)
em que 𝑎𝑑𝑓𝑔 e o Produto de Lie e span representa a distribuicao vetorial de todos os
pontos de 𝑥.
Lema 2.2 Supondo que a matriz 𝑔(𝑥0) tenha posto p. Entao existe uma vizinhanca D de
𝑥0 e p funcoes com valores reais ℎ1(𝑥), ℎ2(𝑥), · · · ,ℎ𝑝(𝑥) definidas em D, tal que o sistema
(2.1) possua vetor grau relativo {𝑟1, · · · ,𝑟𝑝} de 𝑥0, com 𝑟1 + 𝑟2 + · · · + 𝑟𝑝 = 𝑛, se somente
se:
1. Cada uma das distribuicoes 𝐺𝑖, para 0 ≤ 𝑖 ≤ (𝑛 − 1), tem dimensao constante
em torno de 𝑥0, para 0 ≤ 𝑖 ≤ (𝑛− 1);
2. Cada uma das distribuicoes 𝐺𝑖, para 0 ≤ 𝑖 ≤ (𝑛− 2), e involutiva;
Capıtulo 2. Linearizacao por realimentacao 29
3. A distribuicao 𝐺𝑛−1 tem dimensao 𝑛.
entao (2.1) e linearizavel por realimentacao.
Assim, de acordo com (ISIDORI, 1995), um sistema e linearizavel por realimentacao
se as distribuicoes 𝐺0, 𝐺1, . . . , 𝐺𝑛−1 satisfizerem H1 – H3 do Lema 2.2.
Teorema 2.1 Se as distribuicoes 𝐺0, 𝐺1, . . . , 𝐺𝑛−1 satisfazem H1 – H3 do Lema 2.2,
entao existem funcoes escalares reais ℎ1(𝑥), ℎ2(𝑥),. . ., ℎ𝑚(𝑥) definidas em uma vizinhanca
𝑈 de 𝑥0, de graus relativos 𝑟1, 𝑟2, . . ., 𝑟𝑚 = 𝑛, tais que:
1. ∀ 𝑖 ∈ [1,𝑚], ∀ 𝑗 ∈ [1,𝑚] e ∀ 𝑥 ∈ 𝑈
𝐿𝑔𝑖ℎ𝑗(𝑥) = 𝐿𝑔𝑖
𝐿𝑓ℎ𝑗(𝑥) = . . . = 𝐿𝑔𝑖𝐿
𝑟𝑗−2𝑓 ℎ𝑗(𝑥) = 0
2. A matriz (2.13) e nao singular para todo 𝑥 ∈ 𝑈 .
Consequentemente o vetor ℎ(𝑥) com componentes ℎ1(𝑥), ℎ2(𝑥), . . ., ℎ𝑚(𝑥) e:
ℎ(𝑥) =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣
ℎ1(𝑥)
ℎ2(𝑥)...
ℎ𝑚(𝑥)
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦(2.16)
O vetor (2.16) e escolhido como saıda para o sistema (2.1).
�� = 𝑓(𝑥) + 𝑔(𝑥)𝑢 = 𝑓(𝑥) +𝑚∑
𝑖=1𝑔𝑖(𝑥)𝑢𝑖
𝑦 = ℎ(𝑥)(2.17)
De acordo com (GARCES et al., 2012), a linearizacao por realimentacao exata
(linearizacao por realimentacao classica) e a transformacao de um sistema do tipo descrito
por (2.1), sobre os estados estaticos e suas coordenadas em um sistema linear controlavel,
de modo que as nao linearidades do sistema sejam canceladas. Atraves da aplicacao do
Capıtulo 2. Linearizacao por realimentacao 30
difeomorfismo para realizar esta transformacao (2.2) e da realimentacao dos estados por
(2.5), o sistema (2.1) passa a ser escrito na forma canonica de Brunowsky:
�� = 𝐴𝑧 +𝐵𝑣
𝑦 = 𝐶𝑧(2.18)
Em que a matriz 𝐴 tem dimensao 𝑟𝑖 × 𝑟𝑖 e super diagonal composta por 1 e seus
outros elementos por 0. 𝐵, e um vetor 𝑟𝑖 × 1 cujo ultimo elemento e 1 e todos os outros
elementos sao 0. 𝐶, e 1 × 𝑟𝑖, cujo primeiro elemento e 1 e os outros 0, com 𝑥 ∈ R𝑛
representando os estados e 𝑣 ∈ R𝑚 a entrada de controle do sistema respectivamente, de
forma explicita:
𝐴 =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣
𝐴1 0𝑟1×𝑟2 · · · 0𝑟1×𝑟𝑚
0𝑟2×𝑟1 𝐴2 · · · 0𝑟2×𝑟𝑚
......
. . ....
0𝑟𝑚×𝑟1 0𝑟𝑚×𝑟2 · · · 𝐴𝑚
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦
𝐵 =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣
𝐵1 0𝑟1×1 · · · 0𝑟1×1
0𝑟2×1 𝐵2 · · · 0𝑟2×1...
.... . .
...
0𝑟𝑚×1 0𝑟𝑚×1 · · · 𝐵𝑚
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦
𝐶 =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣
𝐶1 01×𝑟2 · · · 01×𝑟𝑚
01×𝑟1 𝐶2 · · · 01×𝑟𝑚
......
. . ....
01×𝑟1 01×𝑟2 · · · 𝐶𝑚
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦
Teorema 2.2 (Linearizacao por realimentacao classica) Dado o sistema (2.1), a
linearizacao por realimentacao e feita atraves da aplicacao do difeomorfismo:
𝑧 = 𝜑(𝑥) (2.19)
Capıtulo 2. Linearizacao por realimentacao 31
e a realimentacao dos estados feita por:
𝑢(𝑥,𝑣) = 𝛼(𝑥) + 𝛽(𝑥)𝑣 (2.20)
com,
𝜑(𝑥) =
⎡⎢⎢⎢⎢⎢⎣𝜑1(𝑥)
...
𝜑𝑚(𝑥)
⎤⎥⎥⎥⎥⎥⎦ , 𝜑𝑖(𝑥) =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣
ℎ𝑖(𝑥)
𝐿𝑓ℎ𝑖(𝑥)...
𝐿𝑟𝑖−1𝑓 ℎ𝑖(𝑥)
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦(2.21)
𝛼(𝑥) = −𝑀−1(𝑥)
⎡⎢⎢⎢⎢⎢⎣𝐿𝑟1
𝑓 ℎ1(𝑥)...
𝐿𝑟𝑚𝑓 ℎ𝑚(𝑥)
⎤⎥⎥⎥⎥⎥⎦ (2.22)
𝛽(𝑥) = 𝑀−1(𝑥) (2.23)
A forma (2.18) e o sistema resultante, com estados 𝑥.
De acordo com (FRANCO, 2006), a interpretacao do Teorema 1, e que um novo
estado 𝑥 pode ser definido atraves do difeomorfismo (2.19). Derivando-se 𝑥 para obter a
expressao (2.24).
�� = 𝜕𝜑(𝑥)𝜕𝑥
�� =(𝜕𝜑(𝑥)𝜕𝑥
𝑓(𝑥))𝑥=𝜑−1(𝑥)
+(𝜕𝜑(𝑥)𝜕𝑥
𝑔(𝑥))𝑥=𝜑−1(𝑥)
𝑢 (2.24)
Desta forma e possıvel reescrever uma nova representacao para os estados do sis-
tema (2.1), com estado 𝑧 e saıda 𝑦
�� = 𝐴𝑧 +𝐵
⎛⎜⎜⎜⎜⎜⎝
⎡⎢⎢⎢⎢⎢⎣𝐿𝑟1
𝑓 ℎ1(𝑥)...
𝐿𝑟𝑚𝑓 ℎ𝑚(𝑥)
⎤⎥⎥⎥⎥⎥⎦+𝑀(𝑥)𝑢
⎞⎟⎟⎟⎟⎟⎠𝑦 = 𝐶𝑧
(2.25)
Capıtulo 2. Linearizacao por realimentacao 32
Atraves da aplicacao da lei de controle 𝑢(𝑥,𝑣), calculada por (2.20), o sistema (2.25)
pode ser transformado no sistema (2.18) novamente.
E possıvel identificar duas desvantagens ligadas a linearizacao por realimentacao
classica, cujas caracterısticas estao fortemente ligadas ao modelo nao linear. Como con-
sequencia direta se existirem incertezas associadas as variaveis de estado o sistema passara
a perder o sentido fısico. Torna-se complexo definir os objetivos e especificar variaveis abs-
tratas que nao apresentam correlacao com os estados do sistema, pois nem sempre existe
uma relacao direta dos estados linearizados com os estados fısicos reais (VIDYASAGAR,
1992).
Outra caracterıstica importante e diferenca de comportamentos entre o sistema
linearizado e o sistema nao linear devido ao cancelamento das nao linearidades e a presenca
de pequenas variacoes nos parametros do sistema pode impedir o cancelamento exato das
nao linearidades. Assim, como o controlador linear e projetado com a suposicao que todos
os cancelamentos foram realizados de forma exata, e possıvel que se obtenha uma resposta
inesperada, ou seja, que haja uma falha do controlador. Consequentemente, o sistema em
malha fechada nao e, em geral, robusto (FRANCO, 2006), (OLIVEIRA, 2015).
2.4 Resumo
Este Capıtulo resumiu conceitos fundamentais de sistemas nao lineares, bem como
os criterios e conceitos para linearizacao por realimentacao em sistemas de controle nao
lineares. No proximo Capıtulo sera abordado os aspectos formais de uma classe de con-
troladores fuzzy adaptativos.
33
3 Controle fuzzy adaptativo
No Capıtulo anterior, o desenvolvimento de controladores assume que o sistema e
modelado com equacoes precisas, que nao havia incerteza no modelo. Porem na pratica
tais modelos nao sao precisos e podem sofrer variacao nos parametros. Uma alternativa
para mitigar estes efeitos e utilizar sistemas de controle fuzzy. Em geral, controladores
fuzzy possuem a capacidade de controlar um determinado processo sem a necessidade de
conhecer o modelo exato do processo. Este Capıtulo abordara os fundamentos relaciona-
dos aos sistemas e controladores adaptativos fuzzy.
3.1 Sistemas fuzzy
Os modelos de sistemas fuzzy que serao abordados sao caracterizados por regras
do tipo “SE-ENTAO”, regras essas que representam relacoes locais do modelo de entrada-
saıda de um sistema. Esta Secao discute os sistemas mais comuns. Estes sistemas podem
representar tanto modelos quanto controladores de processos.
3.1.1 Sistemas linguısticos fuzzy
Sao sistemas definidos por uma colecao de regras linguısticas do tipo Se-Entao
que envolvem conceitos de conjuntos e inferencia fuzzy. Essas regras desempenham um
papel importante na representacao de um sistema relacionando as variaveis de entrada as
variaveis de saıda do mesmo. Os modelos linguısticos foram introduzidos por Mamdani
(MAMDANI; ASSILIAN, 1975). Um exemplo de regra linguıstica e a seguinte:
Se Velocidade e Alta e Aceleracao e Pequena⏟ ⏞ 𝐴𝑛𝑡𝑒𝑐𝑒𝑑𝑒𝑛𝑡𝑒
Entao Frenagem e Pequena⏟ ⏞ 𝐶𝑜𝑛𝑠𝑒𝑞𝑢𝑒𝑛𝑡𝑒
(3.1)
O modelo linguıstico e a forma mais predominante pois descrevem linguisticamente
a maneira como os seres humanos se comportam, pensam, e raciocinam, ou seja, e concei-
tualmente mais natural (KLIR; YUAN, 1995). Os sistemas de controle fuzzy sao baseados
Capıtulo 3. Controle fuzzy adaptativo 34
em um conjunto de regras, onde 𝑋, 𝑌 e 𝑍 sao variaveis linguısticas 𝐴𝑖, 𝐵𝑖 e 𝐶𝑖 sao con-
juntos fuzzy nos universos de discurso X, Y e Z e definidas como:
𝑅𝑖 : Se 𝑋 e 𝐴𝑖 e 𝑌 e 𝐵𝑖 Entao 𝑍 e 𝐶𝑖, com 𝑖 = 1, . . . , 𝑛. (3.2)
Em geral o projeto de sistemas fuzzy depende de algumas escolhas, como normas
triangulares (𝑡−𝑛𝑜𝑟𝑚𝑎𝑠 ou 𝑠−𝑛𝑜𝑟𝑚𝑎𝑠) para agregar expressoes atomicas (𝑋 e 𝐴𝑖) e (𝑌
e 𝐵𝑖) no antecedente da regra e da relacao para expressar o significado da regra Se-Entao
entre o antecedente e o consequente. A escolha de uma 𝑠 − 𝑛𝑜𝑟𝑚𝑎 e necessaria para
agregar as regras individuais.
As operacoes de agregacao mais comuns nos antecedentes das regras sao o mınimo
ou produto algebrico (𝑡 − 𝑛𝑜𝑟𝑚𝑎). As composicoes de regras mais usadas sao supremo
(sup) e mınimo (min) ou supremo (sup) e produto (produto) (DUBOIS; PRADE, 1992).
O processamento de um sistema fuzzy e feito usando a composicao sup − min. O processo
geral de inferencia via composicao e feito da forma:
Entrada: 𝑋 e 𝐴 e 𝑌 e 𝐵
𝑅1 : Se 𝑋 e 𝐴1 e 𝑌 e 𝐵1 Entao 𝑍 e 𝐶1
𝑅2 : Se 𝑋 e 𝐴2 e 𝑌 e 𝐵2 Entao 𝑍 e 𝐶2...
𝑅𝑖 : Se 𝑋 e 𝐴𝑖 e 𝑌 e 𝐵𝑖 Entao 𝑍 e 𝐶𝑖
...
𝑅𝑛 : Se 𝑋 e 𝐴𝑛 e 𝑌 e 𝐵𝑛 Entao 𝑍 e 𝐶𝑛
Saıda: 𝑍 e 𝐶
(3.3)
A tarefa da inferencia e determinar o conjunto fuzzy 𝐶, ou a funcao pertinencia
de 𝐶, dada uma entrada e uma regra da base. Para isso traduz-se o modelo de inferencia
(3.3) para a forma:
Entrada: 𝑃 (𝑥,𝑦) = min{𝐴(𝑥), 𝐵(𝑦)}
𝑅𝑖 : 𝑅𝑖(𝑥,𝑦,𝑧) = min{𝐴𝑖(𝑥), 𝐵𝑖(𝑦), 𝐶𝑖(𝑧)}
Saıda: 𝐶 = 𝑃 ∘𝑛⋃
𝑖=1𝑅𝑖
(3.4)
em que (∘) denota a composicao sup − min.
Capıtulo 3. Controle fuzzy adaptativo 35
De acordo com (PEDRYCZ; GOMIDE, 2007) em termos de funcoes de pertinencia
o conjunto fuzzy 𝐶 e obtido, utilizando-se a operacao uniao padrao, segundo a expressao:
𝐶(𝑧) = sup𝑥,𝑦
{min[𝑃 (𝑥,𝑦),max(𝑅𝑖(𝑥,𝑦,𝑧))]} (3.5)
Utilizando uma notacao alternativa com ∧ para a operacao max e ∨ para a operacao
min, (3.4) torna-se:
𝐶(𝑧) = sup𝑥,𝑦
{𝑃 (𝑥,𝑦) ∧ [𝑅1(𝑥,𝑦,𝑧) ∨ · · · ∨𝑅𝑛(𝑥,𝑦,𝑧)]}
𝐶(𝑧) = sup𝑥,𝑦
{[𝑃 (𝑥,𝑦) ∧𝑅1(𝑥,𝑦,𝑧)] ∨ · · · ∨ [𝑃 (𝑥,𝑦) ∧𝑅𝑛(𝑥,𝑦,𝑧)]}
𝐶(𝑧) = min{sup𝑥,𝑦
[𝑃 (𝑥,𝑦) ∧𝑅1(𝑥,𝑦,𝑧)] , · · · , sup𝑥,𝑦
[𝑃 (𝑥,𝑦) ∧𝑅𝑛(𝑥,𝑦,𝑧)]}.
(3.6)
Se 𝐶′𝑖(𝑧) = sup
𝑥,𝑦[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] entao 𝐶
′𝑖 = 𝑃 ∘ 𝑅𝑖, e (3.6) pode ser simbolica-
mente expressa por:
𝐶(𝑧) =𝑛⋃
𝑖=1(𝑃 ∘𝑅𝑖) =
𝑛⋃𝑖=1
𝐶′
𝑖 (3.7)
De (3.4) e (3.7), tem-se:
𝐶(𝑧) = 𝑃 ∘𝑛⋃
𝑖=1𝑅𝑖 =
𝑛⋃𝑖=1
(𝑃 ∘𝑅𝑖) =𝑛⋃
𝑖=1𝐶
′
𝑖 (3.8)
A expressao (3.8) e valida para qualquer composicao sup −𝑡 com uma 𝑡 − 𝑛𝑜𝑟𝑚𝑎
contınua e a uniao padrao (max) (KLIR; YUAN, 1995). No caso da composicao sup − min
tem-se:
sup𝑥,𝑦
[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] = sup𝑥,𝑦
[𝐴(𝑥) ∧𝐵(𝑦) ∧ 𝐴𝑖(𝑥) ∧𝐵𝑖(𝑦) ∧ 𝐶𝑖(𝑧)] (3.9)
ou seja, rearranjando:
sup𝑥,𝑦
[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] = sup𝑥,𝑦
[(𝐴(𝑥) ∧ 𝐴𝑖(𝑥)) ∧ (𝐵(𝑦) ∧𝐵𝑖(𝑦)) ∧ 𝐶𝑖(𝑧)] (3.10)
Capıtulo 3. Controle fuzzy adaptativo 36
Como o supremo e determinado com relacao a 𝑥 e 𝑦, pode-se reescrever (3.10) como
sendo:
sup𝑥,𝑦
[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] = sup𝑥
[𝐴(𝑥) ∧ 𝐴𝑖(𝑥)] ∧ sup𝑦
[𝐵(𝑦) ∧𝐵𝑖(𝑦)] ∧ 𝐶𝑖(𝑧) (3.11)
Assim:
sup𝑥
[𝐴(𝑥) ∧ 𝐴𝑖(𝑥)] ∧ sup𝑦
[𝐵(𝑦) ∧𝐵𝑖(𝑦)] ∧𝐶𝑖(𝑧) = Poss(𝐴,𝐴𝑖) ∧ Poss(𝐵,𝐵𝑖) ∧𝐶𝑖(𝑧) (3.12)
Com:
Poss(𝐴,𝐴𝑖) = sup[𝐴(𝑥) ∧ 𝐴𝑖(𝑥)] = 𝑚𝑖 e Poss(𝐵,𝐵𝑖) = sup[𝐵(𝑦) ∧𝐵𝑖(𝑥)] = 𝑛𝑖 (3.13)
entao, reescreve-se (3.12) da seguinte forma:
sup𝑥
[𝐴(𝑥) ∧ 𝐴𝑖(𝑥)] ∧ sup𝑦
[𝐵(𝑦) ∧𝐵𝑖(𝑦)] ∧ 𝐶𝑖(𝑧) = 𝑚𝑖 ∧ 𝑛𝑖 ∧ 𝐶𝑖(𝑧) (3.14)
Portanto, substituindo (3.14) em (3.6), tem-se:
𝐶(𝑧) = max{[𝑚1 ∧ 𝑛1 ∧ 𝐶1(𝑧)] , [𝑚2 ∧ 𝑛2 ∧ 𝐶2(𝑧)] , · · · , [𝑚𝑛 ∧ 𝑛𝑛 ∧ 𝐶𝑛(𝑧)]} (3.15)
Considerando que 𝜓𝑖 = (𝑚𝑖 ∧ 𝑛𝑖) seja o grau de ativacao da regra 𝑅𝑖 entao (3.15)
indica que se 𝜓𝑖 = 0 a regra nao contribui para inferir um valor sobre o conjunto fuzzy 𝐶,
porque sua parte correspondente a (𝜓𝑖 ∧𝐶𝑖) = 0. A Figura 3.1 ilustra a operacao deduzida
na Equacao (3.15), considerando a participacao de duas regras 𝑅𝑖 e 𝑅𝑗 (PEDRYCZ;
GOMIDE, 2007).
Computacionalmente isto significa que ao inves de combinar todas as regras usando
a operacao de agregacao max, produzir uma relacao correspondente e depois proceder com
a inferencia fuzzy via composicao sup − min, pode-se primeiro inferir o conjunto fuzzy
individual de cada regra, usando a composicao sup − min e produzir o resultado desejado
Capıtulo 3. Controle fuzzy adaptativo 37
X
𝑚𝑗
𝑚𝑖
1𝐴𝑖 𝐴𝑗 𝐴
Y
𝑛𝑗𝑛𝑖
1𝐵𝑖 𝐵 𝐵𝑗
minZ
𝑛𝑗
𝑚𝑖
1𝐶𝑖 𝐶𝑗
𝐶′
𝑖
𝐶′
𝑗
Figura 3.1 – Inferencia fuzzy. Min-Max.
Algoritmo 3.1 Inferencia Min-Max.
Entrada: 𝐴, 𝐵Saıda: Um conjunto fuzzy 𝐶.
C = ∅para 𝑖 = 1 ate 𝑛 fazer𝑚𝑖 = max(min(𝐴,𝐴𝑖))𝑛𝑖 = max(min(𝐵,𝐵𝑖))𝜓𝑖 = min(𝑚𝑖, 𝑛𝑖)se 𝜓𝑖 = 0 entao𝐶
′𝑖 = min(𝜓𝑖, 𝐶𝑖)
𝐶 = max(𝐶,𝐶 ′𝑖)
fim sefim pararetorna 𝐶
combinando os conjuntos individuais via operacao de agregacao max. O algoritmo 3.1
resume o procedimento de inferencia Min-Max.
Analisando algumas propriedades do modelo de inferencia descrito pelas expressoes
(3.5) a (3.15) e possıvel notar que se 𝐴 = 𝐵 = ∅ entao o resultado e tambem um conjunto
vazio 𝐶 = ∅. Se 𝐴 = X e 𝐵 = Y o resultado e um conjunto fuzzy que e a uniao de todos
os conjuntos 𝐶𝑖, 𝐶 =𝑛⋃
𝑖=1𝐶𝑖, pois todas as regras sao ativadas.
Quando as entradas dos sistemas fuzzy sao pontos 𝐴 = {𝑥0} e 𝐵 = {𝑦0} o calculo
da medida de possibilidade nos passos iniciais torna-se muito simples porque nestes casos
𝑚𝑖 = 𝐴𝑖(𝑥0) e 𝑛𝑖 = 𝐵𝑖(𝑥0).
De acordo com (PEDRYCZ, 2013), sistemas fuzzy com entradas numericas geral-
mente requerem saıdas numericas. Assim o sistema deve fornecer um ponto no universo
representativo do conjunto fuzzy inferido. Os modelos linguısticos fuzzy com entradas nu-
mericas e saıda produzida por defuzzificacao sao um mapeamento nao linear de entrada-
saıda do sistema. A defuzzificacao e uma forma de encontrar um ponto representativo
da saıda. Uma forma e calcular o centroide ou centro de gravidade, (center-of-gravity -
Capıtulo 3. Controle fuzzy adaptativo 38
COG), para defuzzificar a saıda e:
𝑧 =∫
𝑍 𝑧𝐶(𝑧)𝑑𝑧∫𝑍 𝐶(𝑧)𝑑𝑧 (3.16)
Uma alternativa mais simples e utilizar a media ponderada do valor modal dos
conjuntos fuzzy dos consequentes. Se 𝑣𝑖 e o valor modal do conjunto 𝐶𝑖, entao o valor 𝑧
produzido pela entrada e:
𝑧 =∑𝑛
𝑖=1(𝑚𝑖 ∧ 𝑛𝑖)𝑣𝑖∑𝑛𝑖=1(𝑚𝑖 ∧ 𝑛𝑖)
(3.17)
com 𝑚𝑖 = 𝐴𝑖(𝑥0) e 𝑛𝑖 = 𝐵𝑖(𝑥0). O processo de inferencia fuzzy sugere diferentes formas
de construir sistemas baseados em regras de controle, dependendo da escolha das normas
triangulares e da semantica das regras contidas na base.
3.1.2 Modelo funcional fuzzy
Entre os modelos fuzzy existentes, o Takagi-Sugeno e particularmente importante
em modelagem e controle. Proposto em (TAKAGI; SUGENO, 1985), o modelo funcional
mostrou ser adequado para aplicacoes a projetos de sistemas dinamicos nao lineares devido
a forma e sua estrutura.
Esse modelo e formado por regras cujos antecedentes sao conjuntos fuzzy e os
consequentes sao funcoes, em geral de natureza local:
𝑅𝑖 : Se 𝑋 e 𝐴𝑖 e 𝑌 e 𝐵𝑖 Entao 𝑧 = 𝑓𝑖(𝑥,𝑦), com 𝑖 = 1, . . . , 𝑛. (3.18)
em que 𝑋, 𝑌 sao variaveis linguısticas com valores 𝐴𝑖 e 𝐵𝑖 que sao conjuntos fuzzy nos
universos de discurso X e Y cujas variaveis de base sao 𝑥 e 𝑦, e 𝑓𝑖(𝑥,𝑦) e uma funcao.
Polinomios sao exemplos de funcoes que descrevem os consequentes deste tipo de regra;
a ordem do polinomio indica a ordem do modelo. Por exemplo, quando o consequente e
um numero real, o modelo e de ordem zero. Quando o consequente e um polinomio de
segunda ordem o modelo e chamado de funcional de segunda ordem. (ABONYI, 2002).
Capıtulo 3. Controle fuzzy adaptativo 39
A inferencia e feita calculando o grau de ativacao de cada regra e agregando as
saıdas usando a media ponderada. Mais especificamente assumindo que as entradas sao
os pontos 𝑥 e 𝑦 o grau de ativacao da regra 𝑅𝑖 e calculada conforme:
𝜆𝑖(𝑥,𝑦) = 𝐴𝑖(𝑥)𝑡𝐵𝑖(𝑦) (3.19)
resultando em:
𝑧 =∑𝑛
𝑖=1 𝜆𝑖(𝑥,𝑦)𝑓𝑖(𝑥,𝑦)∑𝑛𝑖=1 𝜆𝑖(𝑥,𝑦) (3.20)
em que 𝑧 e a saıda do modelo e 𝑡 e uma norma triangular (PEDRYCZ; GOMIDE, 2007).
Fazendo:
𝑤𝑖(𝑥,𝑦) = 𝜆𝑖(𝑥,𝑦)∑𝑛𝑖=1 𝜆𝑖(𝑥,𝑦) (3.21)
Podemos reescrever (3.20) como:
𝑧 =𝑛∑
𝑖=1𝑤𝑖(𝑥,𝑦)𝑓𝑖(𝑥,𝑦), 𝑖 = 1, . . . ,𝑛 (3.22)
As caracterısticas de entrada e saıda dos modelos fuzzy baseados em regras sao
afetadas pela escolha das funcoes de pertinencia e das funcoes 𝑓𝑖(𝑥,𝑦) o mapeamento
entrada-saıda em geral resulta em uma funcao nao linear.
3.2 Fuzzy Model Reference Learning Control
Um dos primeiros modelos adaptativos e o Fuzzy Model Reference Learning Control
– (FMRLC) (PASSINO; YURKOVICH, 1997). O ajuste da sua estrutura usa um meca-
nismo de aprendizagem e de uma base de regras. O FMRLC e uma extensao do controle
fuzzy auto-organizavel, desenvolvido por (PROCYK; MAMDANI, 1979), e e um tipo de
Model Reference Learning Control – (MRAC), em que o controlador aprende a relacionar
as entradas com as saıdas por meio de uma base de regras fuzzy e um mecanismo de
aprendizagem.
Capıtulo 3. Controle fuzzy adaptativo 40
O controlador FMRLC, Figura 3.2, utiliza um mecanismo de aprendizagem que:
∙ recebe as medicoes da saıda do processo;
∙ caracteriza o desempenho atual do controlador;
∙ ajusta o controlador fuzzy para atender o objetivo de projeto;
O objetivo a ser atendido e especificado pelo modelo de referencia. Analogamente
ao MRAC convencional o FMRLC e ajustado para que o sistema em malha fechada atue
da forma especificada pelo modelo de referencia, isto e, aproxima a saıda 𝑦(𝑘) a referencia
𝑦𝑟(𝑘).
∑
Controlador fuzzy
Base de conhecimento
Conjuntosfuzzy
Base deregras
Inferenciafuzzy
ge
gd
gu
Processoe(k)
1−z−1
T
de(k)
u(k)
Mecanismo de aprendizagem
Modelo inverso fuzzy
Base de conhecimento
Conjuntosfuzzy
Base deregras
Inferenciafuzzy
gye
gyd
gp
Modificador base de conhecimento
Armazenamentop(k)
r(k)
+ y(k)
∑
−
−ye(k)
1−z−1
Tyd(k)
Modelode
referencia
+
ym(k)
Figura 3.2 – Topologia FMRLC.
A Figura 3.2 tem 4 partes principais: o processo, o controlador fuzzy, o modelo de
referencia e o mecanismo de aprendizagem. Cada uma destas partes e descrita a seguir.
Capıtulo 3. Controle fuzzy adaptativo 41
3.2.1 Controlador fuzzy
Considerado um processo com 𝑟 entradas e 𝑠 saıdas – as entradas do controla-
dor sao o erro 𝑒(𝑘) = [𝑒1(𝑘), . . . ,𝑒𝑠(𝑘)] e a variacao do erro 𝑑𝑒(𝑘) = [𝑑𝑒1(𝑘), . . . ,𝑑𝑒𝑠(𝑘)],
respectivamente, com 𝑦𝑟(𝑘) = [𝑦𝑟1(𝑘), . . . ,𝑦𝑟𝑠(𝑘)] sendo o vetor de referencia e 𝑦(𝑘) =
[𝑦1(𝑘), . . . ,𝑦𝑠(𝑘)] a saıda do processo, 𝑡 = 𝑘𝑇 onde 𝑘 e a 𝑘−esima amostra e 𝑇 e o perıodo
de amostragem. O erro e a variacao no erro sao calculados conforme:
𝑒(𝑘) = 𝑦𝑟(𝑘) − 𝑦(𝑘) (3.23)
e
𝑑𝑒(𝑘) = 𝑒(𝑘) − 𝑒(𝑘 − 1)𝑇
(3.24)
Frequentemente, para maior flexibilidade na implementacao do controlador fuzzy,
os universos de discurso sao normalizados no intervalo [−1, + 1]. Os ganhos 𝑔𝑒, 𝑔𝑑 e
𝑔𝑢 normalizam o erro 𝑒(𝑘), a variacao do erro 𝑑𝑒(𝑘) e saıda do controlador (entrada do
processo) 𝑢(𝑘), respectivamente.
A base de conhecimento do controlador fuzzy contem regras de controle fuzzy na
forma:
Se 𝑒1 e ��11 e . . . e 𝑒𝑠 e ��𝑗
𝑠 e 𝑑𝑒1 e ��11 e . . . e 𝑑𝑒𝑠 e ��𝑚
𝑠 Entao ��𝑛 e ��1,...,𝑗;1,...,𝑚𝑛 ,
com 𝑛 = 1, . . . , 𝑟.(3.25)
em que 𝑒𝑠 e 𝑑𝑒𝑠 sao as variaveis linguısticas associadas as entradas 𝑒(𝑘) e 𝑑𝑒(𝑘) e ��𝑛
e a variavel linguıstica associada a saıda do controlador 𝑢(𝑘), ��𝑗𝑠 e ��𝑚
𝑠 sao os valores
linguısticos associados a 𝑒𝑠 e 𝑑𝑒𝑠, respectivamente e ��1,...,𝑗;1,...,𝑚𝑛 e o valor linguıstico do
consequente associado a ��𝑛. A regra em (3.25) e interpretada como:
𝑅1,...,𝑗;1,...,𝑚𝑛 = (��1
1 × . . .× ��𝑗𝑠) × (��1
1 × . . .× ��𝑚𝑠 ) × 𝑈1,...,𝑗;1,...,𝑚
𝑛(3.26)
Capıtulo 3. Controle fuzzy adaptativo 42
A regra da composicao (3.8) fornece a saıda do controlador.
��1,...,𝑗;1,...,𝑚𝑛 (𝑘) = ((��1(𝑘) × ��2(𝑘) × . . .× ��𝑠(𝑘))×
(��1(𝑘) × ��2(𝑘) × . . .× ��𝑠(𝑘))) ∘𝑅1,...,𝑗;1,...,𝑚𝑛
(3.27)
em que ��𝑠(𝑘) e ��𝑠(𝑘) sao valores do erro e da variacao do erro fornecidos ao controlador,
respectivamente, e, ��1,...,𝑗;1,...,𝑚𝑛 (𝑘) e o conjunto fuzzy resultante e (∘) e a composicao
sup − min que existe para todas as combinacoes de conjuntos que descrevem a entrada
para o sistema, portanto, o controlador fuzzy determina a acao de controle usando o centro
de gravidade, conforme (3.20).
3.2.2 Modelo de referencia
O modelo de referencia especifica o comportamento e, consequentemente, o desem-
penho desejado do processo. Em geral o modelo de referencia trata-se de um modelo
linear. O desempenho do sistema e calculado em relacao ao modelo de referencia e pelo
sinal de erro 𝑦𝑒(𝑘) = [𝑦𝑒1 , . . . , 𝑦𝑒𝑠 ]:
𝑦𝑒(𝑘) = 𝑦𝑚(𝑘) − 𝑦(𝑘) (3.28)
em que 𝑦𝑚(𝑘) e a saıda do modelo de referencia e 𝑦(𝑘) e a saıda do processo. Implici-
tamente, o modelo de referencia caracteriza o desempenho, em termos da estabilidade,
tempo de subida, sobre elevacao e tempo de acomodacao. A entrada do modelo de referen-
cia e 𝑟(𝑘). Se 𝑦𝑒(𝑘) ≈ 0, entao o mecanismo de aprendizagem nao ira fazer modificacoes
significativas no controlador. Por outro lado se 𝑦𝑒(𝑘) e grande, entao o mecanismo de
aprendizagem ajusta o controlador fuzzy.
3.2.3 Mecanismo de aprendizagem
O mecanismo de aprendizagem ajusta a base de regras do controlador fuzzy para
que a malha de controle comporte-se conforme o especificado pelo modelo de referencia. As
modificacoes sao feitas pela observacao da saıda do processo, do modelo de referencia e do
controlador fuzzy. O mecanismo de aprendizagem e composto de duas partes: um modelo
inverso e um modificador da base de conhecimento. O modelo inverso e um mapeamento
Capıtulo 3. Controle fuzzy adaptativo 43
de 𝑦𝑒(𝑘), em mudanca na entrada do processo 𝑝(𝑘) que forcam 𝑦𝑒(𝑘) aproximadamente 0.
O modificador da base de conhecimento transforma a base de regras do controlador para
efetivar as mudancas na entrada do processo.
O modelo inverso caracteriza a mudanca na entrada do processo, tornando a saıda
𝑦(𝑘) proxima a 𝑦𝑚(𝑘), isto e, fazendo 𝑦𝑒(𝑘) ser bem pequeno. Observando a Figura 3.2, o
modelo inverso possui fatores de escala 𝑔𝑦𝑒 , 𝑔𝑦𝑑, 𝑔𝑝 para normalizar suas entradas. A base
de conhecimento do modelo fuzzy inverso e formada por regras na forma:
Se 𝑌 1𝑒1 e . . . e 𝑌 𝑠
𝑒𝑠e 𝑌 1
𝑑1 e . . . e 𝑌 𝑚𝑑𝑚
Entao 𝑃 1,...,𝑗;1,...,𝑚𝑛
com 𝑌 𝑠𝑒𝑠
e 𝑌 𝑚𝑑𝑚
definidos por conjuntos fuzzy associados ao erro 𝑦𝑒𝑠 e a variacao no erro
𝑦𝑑𝑠 , 𝑃 1,...,𝑗;1,...,𝑚𝑛 sao os conjuntos fuzzy dos consequentes das regras do modelo inverso. O
modelo inverso e interpretado pela relacao:
𝑆1,...,𝑗;1,...,𝑚𝑛 = (𝑌 1
𝑒1 × · · · × 𝑌 𝑠𝑒𝑠
) × (𝑌 1𝑑1 × · · · × 𝑌 𝑚
𝑑𝑚) × 𝑃 1,...,𝑗;1,...,𝑚
𝑛(3.29)
O mecanismo de inferencia e a regra de composicao:
𝑃 1,...,𝑗;1,...,𝑚𝑛 (𝑘) = ((𝑌𝑒1(𝑘) × 𝑌𝑒2(𝑘) × · · · × 𝑌𝑒𝑠(𝑘))
×(𝑌𝑑1(𝑘) × 𝑌𝑑2(𝑘) × · · · × 𝑌𝑑𝑠(𝑘))) ∘ 𝑆1,...,𝑗;1,...,𝑚𝑛
(3.30)
em que 𝑌𝑒𝑠(𝑘) e 𝑌𝑑𝑠(𝑘) sao os conjuntos fuzzy correspondentes ao erro e variacao do erro,
respectivamente. 𝑃 1,...,𝑗;1,...,𝑚𝑛 (𝑘) e o conjunto fuzzy da saıda do modelo inverso. A saıda
do modelo inverso e determinado pelo metodo do COG.
Uma base de regras pode ser representada como uma matriz, no modelo fuzzy
inverso, com 𝑌 𝑗𝑒 e 𝑌 𝑚
𝑑 sendo os conjuntos fuzzy associados a 𝑦𝑒(𝑘) e 𝑦𝑑(𝑘), respectivamente,
e 𝑃 𝑗,𝑚𝑖 os conjuntos fuzzy que quantificam a mudanca da entrada desejada 𝑝𝑖(𝑘). A Tabela
3.1 lista os centros dos valores das funcoes pertinencias convexas simetricas, e normalizados
no universo [−1,+ 1] de 𝑌 𝑗𝑒 , 𝑌 𝑚
𝑑 e 𝑃 𝑗,𝑚𝑖
Segundo (LAYNE; PASSINO, 1993), os ganhos do controlador fuzzy, mostrados na
Figura 3.2, podem ser escolhidos de acordo com o seguinte procedimento:
Capıtulo 3. Controle fuzzy adaptativo 44
Tabela 3.1 – Base de regras do modelo fuzzy inverso.
𝑌 𝑗,𝑚𝑓
𝑌 𝑗𝑒
-5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5
𝑌 𝑚𝑑
-5 -1.0 -1.0 -1.0 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0-4 -1.0 -1.0 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2-3 -1.0 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4-2 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6-1 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.80 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0+1 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0+2 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0+3 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0 +1.0+4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0 +1.0 +1.0+5 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0 +1.0 +1.0 +1.0
1. Selecionar os ganhos 𝑔𝑒, 𝑔𝑑 e 𝑔𝑢 de modo que 𝑦𝑒(𝑘) nao sature as respectivas funcoes
de pertinencias;
2. Escolher o ganho 𝑔𝑝 para ser o mesmo do ganho 𝑔𝑢 e 𝑔𝑦𝑒 ;
3. Aplicar a entrada de referencia 𝑟(𝑘);
4. Observar a resposta do processo e do modelo de referencia:
∙ Se existir oscilacao inaceitavel na resposta de saıda do processo sobre a resposta
do modelo de referencia, entao aumentar 𝑔𝑦𝑒 . Retorne ao passo 2;
∙ Se a saıda do processo nao mantem a resposta do processo proxima a resposta
do modelo de referencia, entao diminuir 𝑔𝑦𝑒 . Retorne ao passo 3;
∙ Se a resposta do processo e aceitavel com relacao a resposta do modelo de
referencia entao o projeto do controlador esta completo.
De acordo com (KWONG; PASSINO, 1996), o modificador da base de conheci-
mento altera o controlador fuzzy para que a acao de controle aplicada torne-se um valor
aproximado a 𝑝(𝑘), selecionado pelo modelo fuzzy inverso. O modificador da base de co-
nhecimentos altera a base de regras do controlador fuzzy considerando a acao de controle
𝑢(𝑘 − 1) calculada no passo anterior e assumindo que sua contribuicao atual determina o
desempenho do sistema no proximo passo.
Assumindo funcoes de pertinencias de saıda simetricas e que 𝑏𝑚 e definido como
o centro de ��𝑚, o modificador da base de conhecimento atua deslocando os centros das
funcoes de pertinencias com 𝑏𝑚. Assim o modificador da base de conhecimentos atua
seguindo os passos:
Capıtulo 3. Controle fuzzy adaptativo 45
1. Encontrar todas as regras no controlador fuzzy cujo grau de ativacao seja
𝜇𝑖(𝑒(𝑘 − 1),𝑑𝑒(𝑘 − 1)) > 0
2. Considerar 𝑏𝑚(𝑘) os centros das 𝑚 regras ativas no passo 𝑘. Para todas as regras
ativas fazer:
𝑏𝑚(𝑘) = 𝑏𝑚(𝑘 − 1) + 𝑝(𝑘)
para modificar os centros das funcoes de pertinencias ativas.
3.3 Indirect Adaptive Fuzzy Control
Essa Secao resume o Indirect Adaptive Fuzzy Control (IAFC), baseado em meto-
dos de identificacao e estimacao dos parametros dos consequentes de regras de controle
funcionais (PASSINO; YURKOVICH, 1997).
O IAFC e um tipo de compensador distribuıdo paralelo cujo controlador e definido
por um modelo do processo na forma de regras do tipo Takagi-Sugeno. A ideia e obter
um compensador distribuıdo paralelo assintoticamente estavel.
3.3.1 Metodo de identificacao e estimacao
A literatura destaca dois metodos de estimacao e identificacao, quadrados mınimos
recursivos ou em batelada. Esta dissertacao aborda apenas os metodos dos quadrados
mınimos para estimar os parametros dos consequentes das regras fuzzy.
Quadrados mınimos
De acordo com (PASSINO; YURKOVICH, 1997), dado um conjunto de treina-
mento 𝐺, que relaciona as entradas e as saıdas desejadas, de um sistema linear, estima-se
seus parametros minimizando a soma dos quadrados das diferencas entre o valor estimado
Capıtulo 3. Controle fuzzy adaptativo 46
e o valor observado. Se 𝑢(𝑡) e 𝑦(𝑡) sao as entradas e as saıdas, respectivamente, em 𝑡,
entao o modelo linear e da forma:
𝑦(𝑡) =𝑞∑
𝑖=1𝜃𝑎𝑖𝑦(𝑡− 𝑖) +
𝑝∑𝑖=0
𝜃𝑏𝑖𝑢(𝑡− 𝑖) (3.31)
fazendo 𝑥(𝑡) = [𝑦(𝑡− 1), . . . , 𝑦(𝑡− 𝑞),𝑢(𝑡− 1), . . . , 𝑢(𝑡−𝑝)]𝑇 e 𝜃 = [𝜃𝑎1 , . . . ,𝜃𝑎𝑞 , 𝜃𝑏1 , . . . ,𝜃𝑏𝑝 ],
podemos reescrever (3.31) como 𝑦(𝑡) = 𝑓(𝑥,𝜃) = 𝜃𝑇𝑥(𝑡). Reescrevendo o sistema de
identificacao para o ajuste de 𝜃 e utilizando a informacao em 𝐺, pode se escolher 𝑓(𝑥,𝜃) ≈
𝑔(𝑥) para todo 𝑥 ∈ 𝑋. Para 𝑥𝑖 = 𝑥(𝑖), 𝑦𝑖 = 𝑦(𝑖) e 𝐺 = {(𝑥𝑖,𝑦𝑖) : 𝑖 = 1, . . . ,𝑀}. O
algoritmo dos quadrados mınimos pode ser formulado na forma batelada – Batch Least
Squares – (BLS) ou recursivo Recursive Least Squares – (RLS). Na forma batelada, um
vetor 𝑌 (𝑀) = [𝑦1, 𝑦2, . . . , 𝑦𝑀 ]𝑇 de dimensao 1 × 𝑀 e construıdo com os dados de saıda,
𝑦𝑖 de 𝐺. Constroi-se tambem a matriz:
Φ(𝑀) =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣
(𝑥1)𝑇
(𝑥2)𝑇
...
(𝑥𝑀)𝑇
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦
de dimensoes 𝑀 ×𝑁 , que consiste de vetores 𝑥𝑖 de 𝐺 empilhados. O erro de aproximacao
para (𝑥𝑖, 𝑦𝑖) ∈ 𝐺 e calculado como 𝜖𝑖 = 𝑦𝑖 − (𝑥𝑖)𝑇 𝜃. O vetor 𝐸(𝑀) = [𝜖1, 𝜖2, . . . 𝜖𝑀 ]𝑇
e a matriz erro sao 𝐸 = 𝑌 − Φ𝜃. Escolhendo 𝑉 (𝜃) = 12𝐸
𝑇𝐸 como sendo a medida do
quao boa e a aproximacao deseja-se escolher um 𝜃 que minimize 𝑉 (𝜃). A funcao 𝑉 (𝜃) e
convexa em 𝜃 e tem um mınimo local que e o mınimo global.
Derivando 𝑉 em relacao 𝜃 e igualando a zero obtem-se o valor 𝜃 que minimiza 𝑉 (𝜃).
Outra abordagem e notar que:
2𝑉 = 𝐸𝑇𝐸 = 𝑌 𝑇𝑌 − 𝑌 𝑇 Φ𝜃 − 𝜃𝑇 Φ𝑇𝑌 + 𝜃𝑇 Φ𝑇 Φ𝜃 (3.32)
Capıtulo 3. Controle fuzzy adaptativo 47
Entao completando o quadrado, assumindo que Φ𝑇 Φ e inversıvel:
2𝑉 = 𝐸𝑇𝐸 = 𝑌 𝑇𝑌 − 𝑌 𝑇 Φ𝜃 − 𝜃𝑇 Φ𝑇𝑌 + 𝜃𝑇 Φ𝑇 Φ𝜃 + 𝑌 𝑇 Φ(Φ𝑇 Φ)−1Φ𝑇𝑌 − 𝑌 𝑇 Φ(Φ𝑇 Φ)−1Φ𝑇𝑌
(3.33)
E apos algumas operacoes algebricas obtem-se:
2𝑉 = 𝑌 𝑇 (𝐼 − Φ(Φ𝑇 Φ)−1Φ𝑇 )𝑌 + (𝜃 − (Φ𝑇 Φ)−1Φ𝑇𝑌 )𝑇 Φ(𝜃 − (Φ𝑇 Φ)−1Φ𝑇𝑌 ) (3.34)
Como o primeiro termo de (3.34) e independente de 𝜃, o menor valor de 𝑉 e obtido
escolhendo 𝜃 para que o segundo termo seja zero, isto e:
𝜃 = (Φ𝑇 Φ)−1Φ𝑇𝑌 (3.35)
A expressao (3.35) estima os valores de 𝜃 diretamente dos dados em 𝐺. As entradas
devem ter uma grande variedade de componentes frequenciais para que Φ𝑇 Φ seja invertıvel
(LJUNG, 1999). O metodo dos quadrados mınimos ponderados visa minimizar (3.36).
𝑉 (𝜃) = 12𝐸
𝑇𝑊𝐸 (3.36)
em que 𝑊 e uma matriz diagonal 𝑀 × 𝑀 com 𝑤𝑖 > 0 para 𝑖 = 1, . . . ,𝑀 , que modula a
importancia de certos elementos em 𝐺. O resultado da estimacao da versao ponderada
dos quadrados mınimos e calculada usando a expressao:
𝜃 = (Φ𝑇𝑊Φ)−1Φ𝑇𝑊𝑌 (3.37)
O metodo dos quadrados mınimos recursivos (RLS) usa uma matriz de covariancia
𝑃 (𝑘) de dimensao 𝑁 ×𝑁 .
𝑃 (𝑘) = (Φ𝑇 Φ)−1 =(
𝑡∑𝑖=1
𝑥𝑖(𝑥𝑖)𝑇
)−1(3.38)
Capıtulo 3. Controle fuzzy adaptativo 48
Se 𝜃(𝑘−1) e a melhor estimativa feita em 𝑘−1 e assumindo que Φ𝑇 Φ e nao singular
para todo 𝑘, entao tem-se que 𝑃−1(𝑘) = (Φ𝑇 Φ) =(
𝑘∑𝑖=1
𝑥𝑖(𝑥𝑖)𝑇
)e desmembrando o ultimo
termo do somatorio:
𝑃−1(𝑘) =𝑘−1∑𝑖=1
𝑥𝑖(𝑥𝑖)𝑇 + 𝑥𝑘(𝑥𝑘)𝑇
𝑃−1(𝑘) = 𝑃−1(𝑘 − 1) + 𝑥𝑘(𝑥𝑘)𝑇
(3.39)
Utilizando (3.35) deduz-se que:
𝜃(𝑘) = (Φ𝑇 Φ)−1Φ𝑇𝑌
𝜃(𝑘) =(
𝑘∑𝑖=1
𝑥𝑖(𝑥𝑖)𝑇
)−1 (𝑘∑
𝑖=1𝑥𝑖𝑦𝑖
)
𝜃(𝑘) = 𝑃 (𝑘)(
𝑘−1∑𝑖=1
𝑥𝑖𝑦𝑖 + 𝑥𝑘𝑦𝑘
)(3.40a)
Consequentemente,
𝜃(𝑘 − 1) = 𝑃 (𝑘 − 1)𝑘−1∑𝑖=1
𝑥𝑖𝑦𝑖 (3.41)
𝑃−1(𝑘 − 1)𝜃(𝑘 − 1) =𝑘−1∑𝑖=1
𝑥𝑖𝑦𝑖 (3.42)
Reescrevendo 𝑃−1(𝑘 − 1) usando (3.40a), obtem-se:
(𝑃−1(𝑘) − 𝑥𝑘(𝑥𝑘)𝑇 )𝜃(𝑘 − 1) =𝑘−1∑𝑖=1
𝑥𝑖𝑦𝑖
Assim, a estimativa de 𝜃(𝑘) no passo 𝑘 e:
𝜃(𝑘) = 𝜃(𝑘 − 1) + 𝑃 (𝑘)𝑥𝑘(𝑦𝑘 − (𝑥𝑘)𝑇 𝜃(𝑘 − 1)) (3.43)
com
𝑃 (𝑘) = 𝑃 (𝑘 − 1) − 𝑃 (𝑘 − 1)𝑥𝑘(𝐼 + (𝑥𝑘)𝑇𝑃 (𝑘 − 1)𝑥𝑘)−1(𝑥𝑘)𝑇𝑃 (𝑘 − 1) (3.44)
Capıtulo 3. Controle fuzzy adaptativo 49
A estimacao dos parametros torna-se:
𝜃(𝑘) = 𝜃(𝑘 − 1) + 𝑃 (𝑘)𝑥𝑘(𝑦𝑘 − (𝑥𝑘)𝑇 )𝑇 (𝑥𝑘)𝑇 𝜃(𝑘 − 1) (3.45)
Inicializa-se o algoritmo RLS com 𝜃 = 0, 𝑃 (0) = 𝑃0 considerando 𝑃0 = 𝛼𝐼 e
fazendo 𝛼 > 0 suficientemente grande e 𝐼 e a matriz identidade de ordem 𝑀 . A versao
ponderada do RLS considera um fator de esquecimento 𝛿, 0 < 𝛿 ≤ 1, para que as medidas
muito antigas nao ponderem demais na determinacao dos parametros atuais:
𝑃 (𝑘) = 1𝛿(𝐼 − 𝑃 (𝑘 − 1)𝑥𝑘(𝛿𝐼 + (𝑥𝑘)𝑇𝑃 (𝑘 − 1)𝑥𝑘)−1(𝑥𝑘)𝑇𝑃 (𝑘 − 1) (3.46)
𝜃(𝑘) = 𝜃(𝑘 − 1) + 𝑃 (𝑘)𝑥𝑘(𝑦𝑘 − (𝑥𝑘)𝑇 𝜃(𝑘 − 1)) (3.47)
Se 𝛿 = 1 entao tem-se o RLS padrao. Na sequencia o RLS com fator de esqueci-
mento sera utilizado para estimar e identificar os parametros nos consequentes das regras
fuzzy funcionais do tipo Takagi-Sugeno.
3.3.2 Compensador adaptativo distribuıdo paralelo
O controlador adaptativo indireto fuzzy usa regras de controle do tipo Takagi-
Sugeno. O controlador e construıdo para prover assintoticamente um ponto de equilıbrio
para o sistema em malha fechada. Considerando serem conhecidas as saıdas da planta,
um metodo de identificacao pode ser usado para ajuste dos parametros do modelo de
processo. Supondo-se que o modelo do processo e especificado por 𝑅 regras:
Se 𝑦(𝑘) e 𝐴𝑗1 e · · · e 𝑦(𝑘 − 𝑛+ 1) e 𝐴𝑙
𝑛 Entao
𝑦𝑖(𝑘 + 1) = 𝛼𝑖,1𝑦(𝑘) + · · · + 𝛼𝑖,𝑛𝑦(𝑘 − 𝑛+ 1) + 𝛽𝑖,1𝑢(𝑘) + . . .+ 𝛽𝑖,𝑚𝑢(𝑘 −𝑚+ 1)
em que 𝑦(𝑘) e a saıda e 𝑢(𝑘) e o sinal de entrada do processo, respectivamente, em 𝑘.
𝐴𝑖𝑛 sao os conjuntos fuzzy associados a saıda do processo. 𝛼𝑖,𝑗 e 𝛽𝑖,𝑝, com 𝑖 = 1, 2, . . . , 𝑅,
𝑗 = 1, 2, . . . , 𝑛 e 𝑝 = 1, 2, . . . ,𝑚, sao parametros dos consequentes das regras e 𝑦𝑖(𝑘 + 1)
e a saıda correspondente a 𝑖−esima regra. Os parametros 𝛼𝑖,𝑗 e 𝛽𝑖,𝑝 sao ajustados pelo
Capıtulo 3. Controle fuzzy adaptativo 50
metodo dos quadrados mınimos recursivos. Se 𝜇𝑖 e o grau de ativacao da 𝑖−esima regra,
entao a saıda do modelo de sistema e dada por:
𝑦(𝑘 + 1) =∑𝑅
𝑖=1 𝑦𝑖(𝑘+1)𝜇𝑖∑𝑅
𝑖=1 𝜇𝑖=
𝑅∑𝑖=1𝜉𝑖𝑦𝑖(𝑘 + 1) (3.48)
Fazendo,
𝜉𝑖 = 𝜇𝑖∑𝑅
𝑖=1 𝜇𝑖(3.49)
e definido 𝜉 e 𝜃 como
𝜉 =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣
𝑦(𝑘)𝜉1
𝑦(𝑘)𝜉2...
𝑦(𝑘)𝜉𝑅
...
𝑢(𝑘 −𝑚+ 1)𝜉1
𝑢(𝑘 −𝑚+ 1)𝜉2...
𝑢(𝑘 −𝑚+ 1)𝜉𝑅
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦
, 𝜃 =
⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣
𝛼1,1
𝛼2,1...
𝛼𝑅,1...
𝛽1,𝑚
...
𝛽𝑅,𝑚
⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦
(3.50)
Obtem-se:
𝑦(𝑘 + 1) = 𝜃𝑇 𝜉 (3.51)
Para o controlador sao utilizadas regras funcionais da forma:
Se 𝑦(𝑘) e 𝐴𝑗𝑖 e · · · e 𝑦(𝑘 − 𝑛+ 1) e 𝐴𝑛
𝑖 Entao 𝑢𝑖(𝑘) = 𝐿𝑖(·)
Onde 𝐿𝑖(·) e uma funcao linear cujos argumentos podem depender de valores da
entrada e da saıda do processo em passos anteriores, dos valores de referencia e 𝑢𝑖(𝑘),
Capıtulo 3. Controle fuzzy adaptativo 51
a saıda do controlador corresponde a 𝑖−esima regra. Uma escolha comum e utilizar a
funcao 𝐿𝑖(·):
𝐿𝑖(𝑦𝑟(𝑘),𝑦(𝑘)) = 𝑘𝑖,0𝑦𝑟(𝑘) − 𝑘𝑖,1𝑦(𝑘) (3.52)
e
𝑘𝑖,1 = 𝛼𝑖,1 − 0.1𝛽𝑖,1
e 𝑘𝑖,0 = 1 − 𝛼𝑖,1 + 𝛽𝑖,1𝑘𝑖,1
𝛽𝑖,1(3.53)
A funcao (3.52) e um controlador proporcional com ganhos 𝑘𝑖,0 e 𝑘𝑖,1, calculados
por (3.53), 𝑦𝑟(𝑘) o sinal de referencia, e os parametros 𝛼𝑖 e 𝛽𝑖 sao ajustados pelo metodo
dos quadrados mınimos recursivos de cada regra.
3.4 Resumo
Este Capıtulo apresentou uma revisao dos conceitos de controle adaptativo fuzzy,
suas caracterısticas principais, formas de ajuste dos parametros de controle e operacao.
Tambem foram discutidos os principais conceitos relacionados a implementacao de con-
troladores adaptativos que permitem fornecer robustez aos sistemas de controle por reali-
mentacao. No proximo Capıtulo estes conceitos serao utilizados para desenvolver contro-
ladores adaptativos utilizando metodos de aprendizagem participativa evolutiva fuzzy.
52
4 Controle granular evolutivo
Este Capıtulo trata o problema de fornecer robustez a sistemas de controle lineari-
zados por realimentacao quando existem parametros variantes ou incertos e seus efeitos no
desempenho dos sistemas de controles nao lineares. Os conceitos de linearizacao por rea-
limentacao CFL e de controle adaptativo evolutivo fuzzy sao utilizados para desenvolver
solucoes que visam cancelar os efeitos da variacao/incerteza de parametros.
Alem da formulacao do problema e a metodologia para estimar os valores que
cancelam os efeitos da incerteza compara-se esta metodologia frente aos metodos FMRLC,
IAFC utilizando um modelo nao linear de tanque.
4.1 Aprendizagem participativa evolutiva
Modelos evolutivos possuem a capacidade de aprender sua estrutura e parametros
de acordo com um fluxo de dados. Modelos evolutivos fuzzy sao equipados com algoritmos
incrementais que constroem a base de regras e estimam os parametros dos antecedentes
e consequentes (LEITE et al., 2015). Um destes modelos e o Evolving Participatory
Learning – (ePL), proposto em (LIMA et al., 2006). O ePL utiliza regras funcionais na
forma:
Se 𝑥1(𝑘) e 𝐴𝑖1 e · · · e 𝑥𝑝(𝑘) e 𝐴𝑝
1 Entao 𝑦𝑖(𝑘) = 𝑓𝑖(𝑥(𝑘))
em que 𝑥(𝑘) = [𝑥1(𝑘), . . . ,𝑥𝑝(𝑘)]𝑇 . O ePL, Figura 4.1, baseia-se no agrupamento par-
ticipativo de dados cuja estrutura e adaptada sempre que um novo dado de entrada e
recebido. No ePL a cada grupo corresponde uma regra funcional. Os grupos em 𝑘 sao
representados pelos centros 𝑣(𝑘) = [𝑣1(1), . . . , 𝑣𝑝(𝑘)]𝑇 . O algoritmo utiliza os parametros:
taxa de aprendizagem 𝜙 ∈ [0,1], ındice de alerta 𝜂 ∈ [0,1], grau de compatibilidade 𝜆 ∈
[0,1], limiar do ındice de alerta 𝜏 ∈ [0,1] e funcoes de pertinencia Gaussianas com pa-
rametro 𝑟, escolhidos conforme criterio sugerido em (LIMA et al., 2006), ou seja, com
𝜏 ≤ 𝜂(1 − 𝜆), 𝜂 = 𝜏 e 𝜆 = 1−𝜏2 .
Capıtulo 4. Controle granular evolutivo 53
processode
aprendizagem
mecanismode
alerta
x(k)
ρ(k) a(k)
v(k + 1)
Figura 4.1 – Modelo de aprendizagem participativa evolutiva.
Por causa de sua natureza nao supervisionada e auto adaptativa, em cada iteracao
o ePL pode criar novos grupos, atualizar os grupos ja existentes, ou eliminar grupos
redundantes. A Figura 4.1 resume o modelo de aprendizagem participativa evolutiva
(LIMA et al., 2006), (LEITE et al., 2015). Dado o valor do parametro 𝜏 , uma regra e
criada caso 𝑎𝑖(𝑘) > 𝜏 para todos os grupos existentes no passo 𝑘, caso contrario, a regra
que possui o maior ındice de compatibilidade tem seu centro atualizado utilizando:
𝑣𝑖(𝑘 + 1) = 𝑣𝑖(𝑘) +𝐺𝑖(𝑘)(𝑥(𝑘) − 𝑣𝑖) (4.1)
Com o termo 𝐺𝑖(𝑘) ∈ [0,1] calculado por:
𝐺𝑖(𝑘) = 𝜙𝜌𝑖(𝑘) (4.2)
e
𝜌𝑖(𝑘) = 1 − ‖𝑥(𝑘)−𝑣𝑖(𝑘)‖𝑛
(4.3)
O maior ındice de compatibilidade e tal que:
𝑖 = argmax𝑗
{𝜌𝑗(𝑘)} (4.4)
Capıtulo 4. Controle granular evolutivo 54
O 𝑖−esimo centro do grupo e uma combinacao convexa da nova amostra 𝑥(𝑘) e do
grupo mais proximo. O ındice de alerta 𝑎𝑖(𝑘) e atualizado usando:
𝑎𝑖(𝑘 + 1) = 𝑎𝑖(𝑘) + 𝜂(1 − 𝜌𝑖(𝑘 + 1) − 𝑎𝑖(𝑘)) (4.5)
O valor de 𝜂 controla a taxa de atualizacao do ındice de alerta, quanto mais proximo
𝜂 for de 1, maior a sensibilidade do sistema em relacao a mudanca na compatibilidade.
Por este motivo, os centros do grupo 𝑣𝑖(𝑘) sao modificados na direcao da nova amostra
observada 𝑥(𝑘) sendo que o tamanho da modificacao depende do ındice de alerta e do
ındice de compatibilidade 𝜌(𝑘). O ePL considera o mecanismo de alerta incorporando o
ındice de alerta na compatibilidade, isto e, fazendo:
𝐺𝑖(𝑘) = 𝜙(𝜌𝑖(𝑘))1−𝑎𝑖(𝑘) (4.6)
O ePL possui um mecanismo que calcula a compatibilidade entre os centros para
evitar a criacao de regras redundantes. O calculo da compatibilidade entre os centros dos
grupos e feita de forma similar ao calculo do ındice de compatibilidade entre o centro e
um dado, ou seja, por:
𝜌𝑣𝑖(𝑘) = 1 −𝑝∑
𝑗=1|𝑣𝑖(𝑘) − 𝑣𝑗(𝑘)| (4.7)
Serao substituıdas por uma unica as regras que apresentarem grau de compatibili-
dade maior ou igual que o limiar 𝜆 ∈ [0,1], ou seja, se 𝜌𝑣𝑖(𝑘) ≥ 𝜆 for satisfeita a 𝑖−esima
regra e redundante. Os grupos redundantes sao substituıdos por um novo grupo, com cen-
tro que e a combinacao linear entre os centros redundantes, ou simplesmente mantendo
um grupo e excluindo o outro.
Apos o processo de agrupamento, as funcoes de pertinencia Gaussianas dos antece-
dentes sao usados para obter o grau de ativacao de cada regra. No ePL, o grau de ativacao
da regra 𝑖 e denotado por 𝜇𝑖, calculado usando:
𝜇𝑖 = 𝑒−𝑟‖𝑥(𝑘)−𝑣𝑖(𝑘)‖2 (4.8)
em que ‖ · ‖ e a norma Euclidiana e 𝑟 um parametro da Gaussiana, 𝑖 = 1, . . . ,𝑐(𝑘). Os
Capıtulo 4. Controle granular evolutivo 55
consequentes das regras sao funcoes afim cujos coeficientes sao estimados pelo algoritmo
dos quadrados mınimos recursivo.
No ePL a modificacao ou criacao de uma nova regra implica na alteracao dos
parametros dos respectivos consequentes. A saıda do modelo e calculada usando (3.20),
ou seja:
𝑦(𝑘) =∑𝑐(𝑘)
𝑗=1 𝜇𝑗𝑦𝑗∑𝑐(𝑘)𝑗=1 𝜇𝑗
(4.9)
Algoritmo 4.1 Evolving Participatory Learning
Entrada: dado 𝑥(𝑘) ∈ [0,1], 𝑘 = 1, 2, . . .Saıda: 𝑦(𝑘)
Inicializar os parametros 𝑟, 𝜙, 𝜂, 𝜆, 𝜏Ler dado 𝑥(𝑘)Calcular o ındice de compatibilidade usando (4.3)Calcular o ındice de alerta usando (4.5)se 𝑎𝑖(𝑘) ≥ 𝜏 , ∀ i ∈ {1, . . . , 𝑐(𝑘)} entao𝑥(𝑘) e um novo centro de grupoFazer 𝑣𝑖(𝑐(𝑘) + 1) = 𝑥(𝑘)Fazer 𝑎𝑖(𝑐(𝑘) + 1) = 0
senaoAtualizar 𝑣𝑖(𝑘 + 1) usando (4.1)Atualizar 𝑎𝑖(𝑘 + 1) usando (4.5)
fim seCalcular a compatibilidade entre os centros usando (4.7)se 𝜌𝑣𝑖(𝑘) ≥ 𝜆, ∀ i ∈ {1, . . . , 𝑐(𝑘)} entao
Excluir 𝑣𝑖
Fazer 𝑐(𝑘 + 1) = 𝑐(𝑘) − 1senao
Manter a estrutura de grupofim seAtualizar a Base de RegrasCalcular os parametros dos consequentes das regrasCalcular o grau de ativacao da regra usando (4.8)Calcular a saıda usando (4.9)
Lembrando que 𝑐(𝑘) e o numero de regras no passo 𝑘, 𝑦𝑗 e a saıda da 𝑗−esima
regra. O algoritmo 4.1 resume os passos do ePL (LIMA et al., 2006).
As proximas Secoes propoe uma solucao para o problema de estimacao de incerteza
nos parametros de um sistema de controle SISO nao linear no contexto de linearizacao
por realimentacao.
Capıtulo 4. Controle granular evolutivo 56
4.2 Formulacao do problema de controle
O sistema nao linear na forma mostrada pela Equacao (2.1), possui multiplas en-
tradas e multiplas saıdas, pode ser linearizado por realimentacao e transformado para a
forma canonica como em (2.18), desde que sejam satisfeitas algumas condicoes que ga-
rantam que o sistema possa ser linearizado. Como sera mostrado, nem sempre e possıvel
linearizar o modelo, de forma exata, utilizando as tecnicas da Secao 2.3, para tal, nesta e
nas proximas Secoes considere o caso particular, de uma entrada e uma saıda (caso SISO),
do sistema (2.1).
De acordo com (KHALIL, 2002), as nao linearidades podem ser canceladas em
virtude de algumas propriedades estruturais do sistema. Para existir o cancelamento e
necessario que a lei de controle e 𝑢 o termo nao linear 𝛼(𝑥) sempre apareca como uma
soma (𝑢+𝛼(𝑥)) e, para cancelar o termo nao linear 𝛾(𝑥) por divisao, e necessario que na lei
de controle 𝑢 sempre apareca como um produto (𝛾(𝑥)𝑢). Se a matriz 𝛾(𝑥) e nao singular
no domınio de interesse, entao o sistema (2.1) pode ser linearizado por 𝑢 = 𝛽(𝑥)𝑣, onde
𝛽(𝑥) = 𝛾−1(𝑥) e a inversa da matriz 𝛾(𝑥). Considerando que 𝑓(𝑥) = 𝐴𝑥 − 𝐵𝛾(𝑥)𝛼(𝑥) e
𝑔(𝑥) = 𝐵𝛾(𝑥) o sistema (2.1), com apenas uma entrada e uma saıda, torna-se:
�� = 𝐴𝑥+𝐵𝛾(𝑥)(𝑢− 𝛼(𝑥)) (4.10)
em que 𝐴 ∈ R e 𝐵 ∈ R e controlavel, as funcoes 𝛼(𝑥): R → R e 𝛾(𝑥): R → R sao definidas
no domınio D ⊂ R e a matriz 𝛾(𝑥) e nao singular para todo 𝑥 ∈ D.
De acordo com (OLIVEIRA et al., 2017), 𝛾(𝑥) e 𝛼(𝑥) descrevem as nao linearidades
do sistema, e em geral nao sao perfeitamente conhecidas. Elas podem se reescritas como:
𝛾(𝑥) = 𝛾𝑛(𝑥) + Δ𝛾(𝑥) e 𝛼(𝑥) = 𝛼𝑛(𝑥) + Δ𝛼(𝑥) (4.11)
em que 𝛾𝑛(𝑥) e 𝛼𝑛(𝑥) sao os valores nominais das nao linearidades, e Δ𝛾(𝑥) e Δ𝛼(𝑥) sao
as incertezas, ou seja, representam as diferencas do sistema real em relacao ao modelo
nominal usado. Substituindo (4.11) em (4.10) e apos algumas operacoes algebricas, obtem-
Capıtulo 4. Controle granular evolutivo 57
se o sistema linear incerto ou modelo linear real, conforme:
�� = 𝐴𝑥+𝐵𝛾𝑛(𝑥)(𝑢(𝑥) − 𝛼𝑛(𝑥)) +𝐵Δ𝛾(𝑥)𝑢(𝑥)
−𝐵 [(𝛾𝑛(𝑥) + Δ𝛾(𝑥))Δ𝛼(𝑥) + Δ𝛾(𝑥)𝛼𝑛(𝑥)](4.12)
Fazendo:
𝑢 = 𝛼𝑛(𝑥) + 𝛾−1𝑛 (𝑥)𝑣 (4.13)
com 𝛽𝑛(𝑥) = 𝛾−1𝑛 (𝑥), e substituindo (4.13) em (4.12) obtemos:
�� = 𝐴𝑧 +𝐵𝑣 +𝐵Δ𝑠
𝑦 = 𝐶𝑧(4.14)
com Δ𝑠 = (𝛾𝑛(𝑥) + Δ𝛾(𝑥))Δ𝛼(𝑥) + Δ𝛾(𝑥)𝛼𝑛(𝑥) descrevendo o erro de modelagem do
sistema produzido pela variacao nos parametros fısicos do sistema de controle, com 𝐴 ∈
R, 𝐵 ∈ R e 𝐶 ∈ R sendo as matrizes canonicas de Brunovsky.
4.3 Linearizacao por realimentacao granular evolutiva robusta fuzzy
A solucao preconizada para desenvolver um controlador evolutivo robusto fuzzy
(gERF) passa pela utilizacao do algoritmo de aprendizagem participativa evolutiva para
que este possa estimar os valores da variacao nos parametros Δ𝛾(𝑥) e Δ𝛼(𝑥) que causam
diferencas entre o comportamento do sistema real e o modelo do sistema. Para isso, a
proposta e utilizar as expressoes (2.22) e (2.23) para obter 𝛼(𝑥) e 𝛽(𝑥) com base no modelo
nominal do sistema. Essas expressoes sao utilizadas para determinar 𝛼 e 𝛽 tanto para os
estados do sistema real 𝑥 quanto para os estados do modelo de sistema 𝑥𝑚, deste modo,
escrevendo-se o seguinte:
Δ𝑎 = 𝛼(𝑥) − 𝛼(𝑥𝑚)
Δ𝑏 = 𝛽(𝑥) − 𝛽(𝑥𝑚)(4.15)
Capıtulo 4. Controle granular evolutivo 58
em que Δ𝑎 e Δ𝑏 descrevem uma aproximacao da diferenca entre os valores de 𝛼 e 𝛽 reais
e os respectivos valores nominais. Seja 𝑒(𝑥) o erro entre o estado do sistema e do modelo:
𝑒(𝑥) = 𝑥− 𝑥𝑚 (4.16)
A partir do erro 𝑒(𝑥), sugere-se expressoes para Δ𝛼(𝑒(𝑥)) e Δ𝛽(𝑒(𝑥)) como sendo:
Δ𝛼(𝑒(𝑥)) = 𝑝+ 𝑞𝑒(𝑥)
Δ𝛽(𝑒(𝑥)) = 𝑟 + 𝑠𝑒(𝑥)(4.17)
em que os coeficientes 𝑝, 𝑞, 𝑟 e 𝑠 sao valores estimados usando o algoritmo dos quadrados
mınimos recursivo. As expressoes em (4.17) sao utilizadas nos consequentes das regras
construıdas pelo algoritmo ePL. Os valores de Δ𝛼(𝑒(𝑥)) e Δ𝛽(𝑒(𝑥)) sao determinados
utilizando regras do tipo:
Se 𝑒(𝑘) e 𝐴𝑖1 e Δ𝑎(𝑘) e 𝐴𝑖
2 e Δ𝑏(𝑘) e 𝐴𝑖3 Entao Δ𝛼𝑖(𝑘) = Δ𝛼 e Δ𝛽𝑖(𝑘) = Δ𝛽
em que as expressoes Δ𝛼(𝑘) e Δ𝛽(𝑘), nos consequentes das regras, sao determinadas por
(4.18) e (4.19), respectivamente.
Δ𝛼(𝑘) =∑𝑐(𝑘)
𝑖=1 𝜇𝑖(𝑝𝑖+𝑞𝑖𝑒(𝑘))∑𝑐(𝑘)𝑖=1 𝜇𝑖
(4.18)
Δ𝛽(𝑘) =∑𝑐(𝑘)
𝑖=1 𝜇𝑖(𝑟𝑖+𝑠𝑖𝑒(𝑘))∑𝑐(𝑘)𝑖=1 𝜇𝑖
(4.19)
Uma vez estimados os valores de Δ𝛼(𝑘) e Δ𝛽(𝑘) pode-se calcular o valor do sinal
de controle para compensar as incertezas utilizando a expressao:
𝑢𝑐(𝑘) = Δ𝛼(𝑘) + Δ𝛽(𝑘)𝑣 (4.20)
Desta forma, sugere-se uma nova topologia de controle que induz o metodo denomi-
nado linearizacao por realimentacao granular evolutiva robusta fuzzy (gERF), mostrado
na Figura 4.2. O Algoritmo 4.2 sumariza os passos executados pelo gERF.
Capıtulo 4. Controle granular evolutivo 59
Algoritmo 4.2 Controlador gERF
Entrada: 𝑒(𝑘), 𝑥𝑚(𝑘), 𝑣𝑧(𝑘), 𝛼𝑥(𝑘), 𝛽𝑥(𝑘),Saıda: 𝑢𝑐(𝑘)
Definir os parametros 𝑟, 𝜙, 𝜂, 𝜆, 𝜏 ;Ler dado 𝑥(𝑘) de entrada, 𝑘 = 1,2;Calcular Δ𝑎(𝑘) e Δ𝑏(𝑘), usando (2.22), (2.23) e (4.15);Definir vetor de dados;𝑥(𝑘) = [𝑒(𝑘) Δ𝑎(𝑘) Δ𝑏(𝑘)];Inicializar os centros 𝑣1 = 𝑥(1) e 𝑣2 = 𝑥(2);enquanto verdade fazer
Ler dados de entrada;Calcular Δ𝑎(𝑘) e Δ𝑏(𝑘), usando (2.22), (2.23) e (4.15);Definir vetor de dados;𝑥(𝑘) = [𝑒(𝑘) Δ𝑎(𝑘) Δ𝑏(𝑘)]𝑇 ;Calcular 𝜌𝑖(𝑘) usando (4.3);Calcular 𝑎𝑖(𝑘) usando (4.5);se 𝑎𝑖(𝑘) ≥ 𝜏 , ∀ j ∈ {1, . . . , 𝑐(𝑘)} entao𝑥(𝑘) e um novo centro de grupo;Fazer 𝑣𝑖(𝑐(𝑘) + 1) = 𝑥(𝑘);Fazer 𝑎𝑖(𝑐(𝑘) + 1) = 0;
senaoAtualizar 𝑣𝑖(𝑘 + 1) usando (4.1);Atualizar 𝑎𝑖(𝑘 + 1) usando (4.5);
fim seCalcular a compatibilidade entre os centros;𝜌𝑣𝑖(𝑘) = 1 −∑𝑝
𝑗=1 |𝑣𝑖(𝑘) − 𝑣𝑗(𝑘)|;se 𝜌𝑣𝑖(𝑘) ≥ 𝜆, ∀ i ∈ {1, . . . , 𝑐(𝑘)} entao
Excluir 𝑣𝑖;Fazer 𝑐(𝑘 + 1) = 𝑐(𝑘) − 1;
senaoManter a estrutura de grupo;
fim seAtualizar a base de regras;Calcular o grau de ativacao de cada regra 𝜇𝑖 = 𝑒−𝑟‖𝑥(𝑘)−𝑣𝑖‖2
;Calcular Δ𝛼 e Δ𝛽 usando (4.18) e (4.19);Calcular 𝑢𝑐(𝑘) usando (4.20);
fim enquanto
Capıtulo 4. Controle granular evolutivo 60
𝛼(𝑥) + 𝛽(𝑥)𝑣(𝑧) Processo��+ 𝑢
𝑢0
+
𝐾
𝑣(𝑧) 𝑦
𝜑(��)
𝑥+
��𝑧
𝑥0−
Modelo𝑔𝐸𝑅𝐹
𝛼(𝑥), 𝛽(𝑥)+
𝑢𝑐
𝑒
𝑣(𝑧) +𝑥𝑚
−𝑦𝑚
Figura 4.2 – Topologia do gERF.
Assim a proposta desta dissertacao e aplicar o metodo gERF para estimar os valores
de incerteza que causam incompatibilidade entre o comportamento do sistema real e o
modelo, de modo a adicionar um sinal de compensacao 𝑢𝑐 ao sinal de controle que cancele
os efeitos das incertezas.
4.4 Controle de nıvel de tanque
Para verificar o desempenho da linearizacao por realimentacao exata/classica (CFL)
e mostrar as fragilidades desta tecnica quando os parametros de modelo sao incertos,
utiliza-se um processo SISO. O exemplo trata do controle de nıvel (ℎ) de um tanque
caracterizado por:
ℎ =
⎧⎪⎪⎨⎪⎪⎩15,8551𝑢−13,3401ℎ−643,9361
3019,0705 se ℎ < 815,8551𝑢−13,3401ℎ−643,9361
𝐴(ℎ) se 8 ≤ ℎ ≤ 80(4.21)
O tanque tem um solido no seu interior que introduz a nao linearidade mostrada
na Figura (4.3) (FRANCO, 2015) e (QUADROS, 2016). Sua dinamica e dada por (4.21),
em que 𝑢 ∈ [0%, 100%] e o sinal de controle, ℎ ∈ [0, 80] 𝑐𝑚 e o nıvel da coluna de lıquido
no tanque e 𝐴(ℎ) e a area de secao transversal do tanque (𝑐𝑚2) dada por:
𝐴(ℎ) = 1556,82 − 1349,1948 cos(2,5𝜋(0,01(ℎ− 8) − 0,4))𝑒−(0,01(ℎ−8)−0,4)2
0,065 (4.22)
Capıtulo 4. Controle granular evolutivo 61
Figura 4.3 – Representacao do tanque com solido nao linear.
De acordo (FRANCO, 2006), reescreve-se (4.21) para tornar a origem o ponto de
operacao do sistema, fazendo:
ℎ = ℎ− ℎ0 (4.23)
em que ℎ0 e a referencia (Set-point). Analogamente 𝑢0 e o sinal de controle necessario
para manter o valor ℎ0, assim o controle efetivo e:
�� = 𝑢− 𝑢0 (4.24)
para manter o nıvel do tanque no ponto de equilıbrio (Set-point). Substituindo (4.24)
e (4.23) em (4.21) obtem-se o modelo do nıvel do tanque com origem em ℎ0. Para o
intervalo 8 ≤ ℎ+ ℎ0 ≤ 80 𝑐𝑚, temos:
˙ℎ = −13,3401(ℎ+ℎ0)−643,9361+15,8551𝑢0
𝐴(ℎ+ℎ0) + 15,8551��
𝐴(ℎ+ℎ0)(4.25)
A CFL utiliza (2.21), (2.22) e (2.23), que satisfazem as hipoteses H1, H2 e H3 do
Lema (2.2), Secao 2.3, para determinar o difeomorfismo:
𝜑(ℎ(𝑡)) = ℎ (4.26)
Capıtulo 4. Controle granular evolutivo 62
Os parametros 𝛼(ℎ) e 𝛽(ℎ) sao definidos por (4.27) e o sinal de controle �� e calculado
usando:
𝛼(ℎ) = 13,3401(ℎ+ℎ0)+643,9361−15,8551𝑢015,8551 e 𝛽(ℎ) = 𝐴(ℎ+ℎ0)
15,8551 (4.27)
�� = 𝛼(ℎ) + 𝛽(ℎ)𝑣 (4.28)
com
𝑣 = −𝐾𝑧 = −𝐾𝜑(ℎ) (4.29)
Aproximando (4.25) por Euler com incremento 𝑇 = 1,0 𝑠, o suficiente para se
aproximar a dinamica contınua do tanque e, considerando que o tempo e representado
por 𝑡 = 𝑘𝑇 em que 𝑘 e o 𝑘−esimo passo e 𝑇 e o perıodo de amostragem, o sistema
continuo (4.21) tem sua versao discretizada, pelo metodo de Euler de primeira ordem,
dada por:
ℎ𝑚(𝑘 + 1) = ℎ𝑚(𝑘) + 𝑇(
15,8551𝑢(𝑘)−13,3401ℎ𝑚(𝑘)−643,9361𝐴(ℎ𝑚(𝑘))
)(4.30)
Considera-se que o atuador do tanque satura com uma vazao maior que 𝑢𝑛(𝑘) >
100 %. Assim o sinal de controle fica restrito as condicoes resumidas em (4.31). As
respostas do modelo nominal em malha fechada sao mostradas nas Figuras 4.4 a 4.6, e
foram obtidas considerando que a condicao inicial do tanque e 20 𝑐𝑚 e que o ponto de
operacao do sistema e ℎ0 = 30 𝑐𝑚. De acordo com (FRANCO et al., 2016) o ganho
𝐾 = 0,05. E possıvel perceber que a resposta do modelo nesta configuracao atinge o
ponto de operacao especificado e existe um cancelamento exato das nao linearidades do
sistema 𝛼(ℎ(𝑘)) e 𝛾(ℎ(𝑘)), atendendo os requisitos de projeto.
𝑢𝑛(𝑘) =
⎧⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎩
100% se ��(𝑘) + 𝑢0 > 100%
��(𝑘) + 𝑢0 se 0% ≤ ��(𝑘) + 𝑢0 ≤ 100%
0% se ��(𝑘) + 𝑢0 < 0%
(4.31)
Capıtulo 4. Controle granular evolutivo 63
Porem quando os parametros, 13,3401 e 643,9361 utilizados no modelo (4.30), sao
diferentes daqueles do processo real a resposta apresenta um erro de regime conforme
mostram as Figuras 4.4 a 4.6, em que as linhas na cor verde representam os sinais de
resposta do modelo ideal e a as linhas na cor vermelha representam os sinais de resposta
do sistema onde nao houve um cancelamento exato das nao linearidades do sistema.
Tempo (s)0 20 40 60 80 100 120 140
h(cm)
20
25
30
35
Figura 4.4 – Nıvel do tanque com incerteza.
Tempo (s)0 20 40 60 80 100 120 140
u(%
)
50
60
70
80
90
100
Figura 4.5 – Sinal de controle incerto.
Tempo (s)0 20 40 60 80 100 120 140
v
-0.2
0
0.2
0.4
0.6
Figura 4.6 – Sinal de controle linearizado incerto.
Capıtulo 4. Controle granular evolutivo 64
4.5 Analise e avaliacao de desempenho
Nesta Secao sao avaliados os desempenhos dos metodos CFL, IAFC, FMRLC e
gERF no controle de nıvel do tanque. Para tal, tres testes foram realizados levando em
consideracao o modelo (4.30) e supondo que o tanque real tem a dinamica expressa por
(4.32).
A simulacao adota os valores sugeridos por (FRANCO, 2015) para o ganho de
realimentacao dos estados 𝐾 = 0,05, perıodo de amostragem foi 𝑇 = 1,0 𝑠. O tempo de
simulacao foi 𝑡 = 0 a 3000 𝑠. Os pontos de operacoes sao: (ℎ0;𝑢0) = (23; 60), (31; 68) e
(16; 53). As simulacoes realizadas utilizam o modelo do sistema (4.30) linearizado seguindo
a CFL (linha verde) e o tanque real (4.32) com linearizacao CFL (linha vermelha) e os
controladores FMRLC (linha ciana), IAFC (linha magenta) e gERF (linha azul) conforme
as Figuras 4.7 a 4.16.
O primeiro teste supoe que a incerteza e decorrente do erro de modelagem entre o
modelo (4.30) e o tanque real representado por:
ℎ𝑟(𝑘 + 1) = ℎ𝑟(𝑘) + 𝑇(
15,8551𝑢(𝑘)−6,5ℎ𝑟(𝑘)−630𝐴(ℎ𝑟(𝑘))
)(4.32)
Desta forma (4.32) representa o sistema real com incerteza constante, correspon-
dendo a um fechamento de 50% da valvula de saıda do tanque, enquanto que (4.30)
descreve o modelo utilizado para projetar o controlador nominal. Qualitativamente o de-
sempenho dos metodos pode ser observado nas Figuras 4.7 a 4.9, considerando o perıodo
de simulacao 𝑡 ∈ [0, 3000]𝑠.
O segundo teste considera uma incerteza que varia no tempo, fazendo 𝑐ℎ = 6,5 +
0,5 sin(0,08𝑡) 𝑐𝑚 para todo o perıodo de simulacao, em que 𝑐ℎ substitui o coeficiente 6,5
que multiplica ℎ𝑟(𝑘) em (4.32). Isso equivale a fechar a valvula de saıda de aproximada-
mente 40% a 60% durante o perıodo de simulacao 𝑡 ∈ [0,3500] 𝑠. Os desempenhos sao
mostrados nas Figuras 4.10 a 4.12.
O terceiro teste procede como no primeiro teste, mas acrescenta-se uma perturbacao
de carga ao sistema real, de 20% na vazao da bomba durante 60 𝑠 nos intervalos (375,435),
(1125,1185), (1875,1935) e (2625,2685) 𝑠. Alem disso, acrescenta-se um ruıdo Gaussiano
de media zero e desvio padrao 2,5 𝑐𝑚 na leitura de nıvel do tanque. Os parametros do
Capıtulo 4. Controle granular evolutivo 65
Tempo (s)
0 500 1000 1500 2000 2500 3000
h (
cm
)
0
20
40
60CFL
IAFC
FMRLC
gERF
REF
MOD
Figura 4.7 – Nıvel do tanque com incerteza constante.
Tempo (s)
0 500 1000 1500 2000 2500 3000
u(%
)
0
50
100 CFL
IAFC
FMRLC
gERF
MOD
Figura 4.8 – Sinais de controle com incerteza constante.
Tempo (s)
0 500 1000 1500 2000 2500 3000
v
-2
-1
0
1CFL
IAFC
FMRLC
gERF
MOD
Figura 4.9 – Sinais de controle linearizados com incerteza constante.
gERF sao: 𝜙 = 0,01, 𝜂 = 0,001, 𝜏 = 0,001, 𝜆 = 0,4995 e 𝑟 = 0,05. As Figuras 4.14
a 4.16 mostram qualitativamente o desempenho dos metodos durante todo o perıodo de
simulacao 𝑡 ∈ [0,3000] 𝑠.
A Figura 4.17 mostra a variacao do numero de grupos (regras fuzzy) criados levando
em consideracao a perturbacao de carga. Inicialmente o gERF cria 2 grupos e apos um
perıodo de aproximadamente 300 segundos ele adapta sua estrutura para apenas 1 unico
grupo.
Capıtulo 4. Controle granular evolutivo 66
Tempo (s)
0 500 1000 1500 2000 2500 3000 3500
h (
cm
)
0
20
40
60CFL
IAFC
FMRLC
gERF
REF
MOD
Figura 4.10 – Nıvel do tanque com incerteza variavel.
Tempo (s)
0 500 1000 1500 2000 2500 3000 3500
u(%
)
0
50
100 CFL
IAFC
FMRLC
gERF
MOD
Figura 4.11 – Sinais de controle com incerteza variavel.
Tempo (s)
0 500 1000 1500 2000 2500 3000 3500
v
-2
-1
0
1CFL
IAFC
FMRLC
gERF
MOD
Figura 4.12 – Sinais de controle linearizados com incerteza variavel.
Qualitativamente e possıvel perceber que quando nao existem incertezas presentes
na modelagem a linearizacao por realimentacao classica apresenta comportamento em
acordo com o que e projetado (linha verde) e sempre acompanha o sinal de referencia
selecionado (linha pontilhada preta), conforme destacado nos graficos da Figura 4.13.
A dinamica do nıvel do tanque depende do metodo de linearizacao por realimentacao, e
percebe-se que o sistema real com linearizacao por realimentacao apresenta a pior resposta
em todos os testes simulados (linha continua vermelha). Em particular, nota-se que o
sistema real em malha fechada apresenta comportamento diferente do esperado com a
Capıtulo 4. Controle granular evolutivo 67
Tempo (s)
600 650 700 750 800 850 900 950 1000
h (
cm
)
10
20
30
40CFL
IAFC
FMRLC
gERF
REF
MOD
Figura 4.13 – Dinamica do tanque com perturbacao de carga.
mesma estrutura de linearizacao por realimentacao. E notoria a diferenca entre o ponto
de estabilizacao e o ponto de operacao quando o sistema possui incerteza no modelo.
O metodo FMRLC usa 121 regras e mesmo assim percebe-se que o sistema tem
um comportamento oscilatorio em torno do ponto de operacao (linha contınua ciana).
Da mesma forma, tambem oscila o IAFC com 5 regras (linha contınua magenta). As
oscilacoes observadas em torno do ponto de operacao se devem ao ruıdo nas medidas de
nıvel do tanque. Os dois metodos ao sistema real tem desempenho qualitativo melhores
que a CFL.
O comportamento do sistema real linearizado pelo gERF e similar ao do modelo
do tanque em todos os testes, onde vemos que a resposta do sistema alcanca o ponto
de operacao e tem desempenho qualitativamente superior aos metodos FMRLC, IAFC e
CFL.
Percebe-se tambem que o FMRLC faz um esforco de controle maior que o deman-
dado pelos outros metodos para manter o nıvel do lıquido no tanque em torno do ponto de
operacao, conforme as Figuras 4.8 a 4.15. Oscilacoes no sinal de controle sao indesejaveis
pois podem ocasionar um desgaste prematuro no atuador. No caso especıfico do tanque,
isto podera ocasionar um desgaste prematuro dos componentes eletro-mecanicos do pro-
cesso. Outro fato relevante, mostrado pelas Figuras 4.9 a 4.16 e o cancelamento das nao
linearidades do sistema real com a utilizacao do gERF ser proximo ao exato enquanto que
nos outros metodos nao e observado o mesmo efeito.
Quantitativamente o melhor desempenho foi alcancado pelo controlador gERF.
Capıtulo 4. Controle granular evolutivo 68
Tempo (s)
0 500 1000 1500 2000 2500 3000
h (
cm
)
0
20
40
60CFL
IAFC
FMRLC
gERF
REF
MOD
Figura 4.14 – Nıvel do tanque com perturbacao de carga.
Tempo (s)
0 500 1000 1500 2000 2500 3000
u (
%)
0
20
40
60
80
100 CFL
IAFC
FMRLC
gERF
MOD
Figura 4.15 – Sinais de controle com perturbacao de carga.
Tempo (s)
0 500 1000 1500 2000 2500 3000
v
-2
-1
0
1CFL
IAFC
FMRLC
gERF
MOD
Figura 4.16 – Sinais de controle linearizados com perturbacao de carga.
Para esta analise foram utilizados ındices classicos como: Integral of Time-weighted Abso-
lute error – (ITAE), Integral of Time-weighted Variability of the Signal Control – (IVU),
Integral of Time-weighted Variability of the Error – (IVE), Integral of the Square of the
Error – (ISE), Integral of the Absolute Magnitude of the Error – (IAE), Integral of Time
Multiplied by Square Error – (ITSE). O ITAE quantifica o erro de controle durante o
regime permanente. O IVU e o IVE avaliam o esforco do controlador e a variabilidade do
sinal de saıda, respectivamente.
Capıtulo 4. Controle granular evolutivo 69
Tempo (s)0 500 1000 1500 2000 2500 3000
Nú
me
ro
0.5
1
1.5
2
2.5
Figura 4.17 – Numero de grupos criados durante o teste com perturbacao de carga.
Os ındices sao calculados usando as expressoes (4.33) a (4.36), em que, 𝑒 e �� sao o
valor medio do erro e o sinal de controle no intervalo [𝑡0,𝑡𝑓 ].
𝐼𝑇𝐴𝐸 =∫ 𝑡𝑓
𝑡0𝑡|𝑒(𝑡)|𝑑𝑡 (4.33)
𝐼𝑆𝐸 =∫ 𝑡𝑓
𝑡0𝑒(𝑡)2𝑑𝑡 (4.34)
𝐼𝑇𝑆𝐸 =∫ 𝑡𝑓
𝑡0𝑡𝑒(𝑡)2𝑑𝑡 (4.35)
𝐼𝐴𝐸 =∫ 𝑡𝑓
𝑡0|𝑒(𝑡)|𝑑𝑡 (4.36)
𝐼𝑉 𝐸 =√
1𝑡𝑓 − 𝑡0
∫ 𝑡𝑓
𝑡0|𝑒(𝑡) − 𝑒|2𝑑𝑡 (4.37)
𝐼𝑉 𝑈 =√
1𝑡𝑓 − 𝑡0
∫ 𝑡𝑓
𝑡0|𝑢(𝑡) − ��|2𝑑𝑡 (4.38)
O desempenho relativo normalizado ao gERF e dos controladores sao mostrados
nas Tabela 4.1 a Tabela 4.3. O desempenho normalizado, e calculado usando a expressao
(4.39).
𝑃% =(𝐼𝑁𝐷𝐼𝐶𝐸𝑚𝑒𝑡𝑜𝑑𝑜
𝐼𝑁𝐷𝐼𝐶𝐸𝑔𝐸𝑅𝐹
− 1)
× 100% (4.39)
Capıtulo 4. Controle granular evolutivo 70
Tabela 4.1 – Desempenho normalizado do gERF com variacao de parametro constante.
Metodo 𝐼𝑇𝐴𝐸(%) 𝐼𝑉 𝐸(%) 𝐼𝑉 𝑈(%) 𝐼𝐴𝐸(%) 𝐼𝑆𝐸(%) 𝐼𝑇𝑆𝐸(%)IAFC 559,07 563,17 417,27 559,07 4,22 × 103 4,22 × 103
FMRLC 934,10 867,10 213,12 934,11 10,78 × 103 10,78 × 103
CFL 6,42 × 103 2,27 × 103 -47,73 12,9 × 103 2,85 × 105 2,85 × 105
Tabela 4.2 – Desempenho normalizado do gERF com parametro variante no tempo.
Metodo 𝐼𝑇𝐴𝐸(%) 𝐼𝑉 𝐸(%) 𝐼𝑉 𝑈(%) 𝐼𝐴𝐸(%) 𝐼𝑆𝐸(%) 𝐼𝑇𝑆𝐸(%)IAFC 677,22 678,77 360,61 677,22 5,96 × 103 5,96 × 103
FMRLC 1,06 × 103 991,52 191,06 1,06 × 103 13,58 × 103 13,58 × 103
CFL 7,12 × 103 2,46 × 103 -52,76 14,34 × 103 3,51 × 105 3,51 × 105
Tabela 4.3 – Desempenho normalizado do gERF com perturbacao de carga e ruıdo.
Metodo 𝐼𝑇𝐴𝐸(%) 𝐼𝑉 𝐸(%) 𝐼𝑉 𝑈(%) 𝐼𝐴𝐸(%) 𝐼𝑆𝐸(%) 𝐼𝑇𝑆𝐸(%)IAFC 62,26 × 103 193,92 441,74 311,39 759,51 759,51
FMRLC 65,5 × 103 182,45 12,67 62,74 742,75 742,75CFL 1,91 × 103 909,61 -1,11 3,91 × 103 22,2 × 103 22,2 × 103
Em geral, todos os ındices de desempenho mencionados mensuram o erro da variavel
controlada, por tanto, observando os valores normalizados nas Tabelas 4.1 a 4.3 quanto
maior for o valor do desempenho positivo, pior e o desempenho do metodo. Por outro
lado, quanto maior for o valor do desempenho normalizado negativo, melhor e o metodo
em relacao ao gERF.
Resumindo, somente no quesito IVU a CFL apresenta desempenho melhor que o
alcancado pelo gERF, nos outros ındices o gERF apresentou melhores resultados e seu
desempenho do gERF e perceptivelmente melhor em todas as situacoes. O ITAE, IAE,
ISE, ITSE e o IVE apontam para um erro de regime permanente importante em todas
as simulacoes em relacao ao alcancado pelo gERF. Nestes casos, mesmo com aumento
no esforco de controle, o desempenho do sistema fica aquem do alcancado pelo metodo
proposto neste trabalho.
4.6 Resumo
Este Capıtulo apresentou a abordagem de linearizacao por realimentacao evolu-
tiva robusta fuzzy (gERF). Os resultados de simulacoes mostraram que o gERF tem
desempenho superior aos demais metodos de controle CFL, FMRLC e IAFC, tanto qua-
Capıtulo 4. Controle granular evolutivo 71
litativamente quanto quantitativamente, conforme os ındices ITAE, IAE, ITSE, ISE, IVE
e IVU.
Por fim e razoavel afirmar que o gERF tem desempenho superior aos demais meto-
dos de controle, pois se mostra robusto frente a variacoes em parametros do processo. No
proximo Capıtulo alguns testes experimentais com o gERF sao realizados e apresentados
os resultados.
72
5 Resultados experimentais
No Capıtulo anterior foi desenvolvida e fundamentada uma solucao teorica para o
problema da variacao de parametros em sistemas linearizados por realimentacao atraves
da abordagem denominada gERF. Este Capıtulo apresenta os resultados de testes experi-
mentais desenvolvidos em laboratorio do sistema de controle de nıvel de um tanque com
solido nao linear.
5.1 Descricao do tanque
O gERF foi utilizado para controlar um dos tanques do sistema de tanques itera-
tivos do Laboratorio de Sinais e Sistemas do Centro Federal de Educacao Tecnologica de
Minas Gerais (CEFET-MG, Divinopolis-MG), o diagrama esta na Figura A.1 do Anexo
A.
O sistema possui 4 tanques com capacidade nominal de 200 litros cada, dois reser-
vatorios com capacidade nominal de 400 litros cada, para armazenar a agua dos tanques,
e duas bombas hidraulicas trifasicas de 1.0 cv, conforme mostra a Figura 5.1. As bombas
sao acionadas por dois inversores de frequencia WEG CFW09. Cada uma das bombas
possui um conjunto de tubos especıficos. Os tubos acoplados a Bomba 01 sao para circu-
lacao de agua fria enquanto que a tubulacao da Bomba 02 esta preparada para circulacao
de agua quente.
O controle do sistema e realizado por um microcomputador. A aquisicao dos dados
e feita por um Programmable Logic Controller – (PLC) Siemens S7-300. O microcom-
putador e o PLC estao conectados a um roteador por meio de suas interfaces de rede
Ethernet que se comunicam atraves do pacote Snap7 desenvolvido pela Siemens, fabri-
cante do PLC. Para implementacao dos controladores, o microcomputador pode ser pro-
gramado utilizando as linguagens Python (Numeric Python - NumPy), C/C++, Pascal
ou LabView. A aquisicao e armazenagem de dados no PLC utiliza a biblioteca Ahio da lin-
guagem Python. O PLC, os inversores de frequencia, os reles de acionamento, o roteador
e o microcomputador estao instalados num painel, localizado ao lado dos tanques.
A instrumentacao e composta por: 4 sensores diferenciais de pressao Honeywell
Capıtulo 5. Resultados experimentais 73
Figura 5.1 – Sistema de tanques interativos do Laboratorio de Sinais e Sistemas CEFET-MG.
26PCBFA6D Figura 5.2, para medir o nıvel do tanque, cada deles ligado a um circuito
integrado XRT106, para transformar o sinal de baixa tensao proveniente do sensor em um
sinal de corrente no intervalo de 4 a 20 𝑚𝐴. O sistema conta ainda com dois medidores de
vazao, um do tipo roda d’agua fabricado pela Dwyler Equipamentos Industriais e outro
do tipo magnetico fabricado pela Incontrol, mostrados na Figura 5.3.
O Tanque 03 (TQ-03 no diagrama) foi utilizado nos experimentos desta dissertacao,
devido a facilidade de instalacao do solido nao linear mostrado na Figura 5.4. O sinal de
controle aplicado ao tanque e a rotacao da bomba que varia de 0% a 100%. A variavel
a ser controlada e o nıvel da coluna de lıquido no tanque, medida pelo sensor diferencial
Capıtulo 5. Resultados experimentais 74
Figura 5.2 – Sensor diferencial de pressao Honeywell 26PCBFA6D.
(a) Sensor de vazao tipo roda d’agua Dwyler. (b) Sensor de vazao magnetico Incontrol.
Figura 5.3 – Sensores de vazao.
de pressao do tanque, que varia entre 0 a 80 𝑐𝑚. As proximas secoes apresentam os
resultados dos testes experimentais.
5.2 Teste 01 - Linearizacao por realimentacao classica
O primeiro teste consiste em utilizar a linearizacao por realimentacao classica (CFL)
para controlar o nıvel do tanque. Neste teste o controlador e projetado conforme a metodo-
logia apresentada na Secao 2.1 e simulado na Secao 4.4. O Anexo B mostra a metodologia
utilizada para obter o modelo (5.1). O modelo (5.1) foi obtido com a valvula de saıda do
tanque 100% aberta.
ℎ = 23,15𝑢− 14,32ℎ− 1021,5𝐴(ℎ) (5.1)
Capıtulo 5. Resultados experimentais 75
Figura 5.4 – Solido nao linear instalado dentro do tanque.
O modelo continuo do tanque com origem em ℎ0 e 𝑢0 e dado por:
˙ℎ = −14,32(ℎ+ ℎ0) + 23,15��− 1021,5
𝐴(ℎ+ ℎ0)+ 23,15𝑢0
𝐴(ℎ+ ℎ0)(5.2)
A versao discretizada de (5.1) e dada por:
ℎ(𝑘 + 1) = ℎ(𝑘) + 𝑇
(23,15𝑢(𝑘) − 14,32ℎ(𝑘) − 1021,5
𝐴(ℎ(𝑘))
)(5.3)
Se ℎ0 e a referencia, 𝑢0 e o sinal de controle de equilıbrio do sistema em ℎ0, ℎ e o
nıvel da coluna de lıquido no tanque, o ganho de realimentacao dos estados e 𝐾 = 0,04 e
𝐴(ℎ) e area do solido nao linear introduzido no tanque e o perıodo de amostragem de 1
Capıtulo 5. Resultados experimentais 76
segundo, e o controlador modelado por:
ℎ(𝑘) = ℎ(𝑘) − ℎ0
𝜑(ℎ)(𝑘) = ℎ(𝑘)
𝑣(ℎ) = −𝐾𝜑(ℎ(𝑘))
𝛼(ℎ(𝑘)) = 14,32ℎ(𝑘)−23,15𝑢0+1021,523,15
𝛽(ℎ(𝑘)) = 𝐴(ℎ(𝑘))23,15
��(𝑘) = 𝛼(ℎ(𝑘)) + 𝛽(ℎ(𝑘))𝑣(ℎ)
𝑢(𝑘) = ��(𝑘) + 𝑢0
(5.4)
0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)
20.022.525.027.530.032.535.0
h (cm)
CFLReferência
0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)
505560657075
u (%
)
u0ucfl
Figura 5.5 – Resposta do modelo do tanque.
A Figura 5.5 mostra a resposta do modelo do tanque, utilizando a CLF, e consi-
derando que a valvula de saıda do tanque esta 100% aberta, que e a mesma utilizada
no projeto do controlador. Percebe-se um erro de regime, entorno de 2% em relacao a
referencia, devido a diferenca entre os parametros do modelo utilizado no projeto e o
tanque real. O controlador desenvolvido faz a linearizacao pela realimentacao de forma
quase exata. A proxima Secao apresenta o teste do controlador gERF considerando a
posicao/condicao da valvula de saıda do tanque a mesma usada pela CFL.
Capıtulo 5. Resultados experimentais 77
5.3 Teste 02 - Topologia de controle
Este teste utiliza o controlador gERF, da Secao 4.3, para controlar o nıvel de
lıquido no tanque sem modificar a condicao operacional da valvula de saıda do tanque
para a qual o modelo dinamico (5.3) foi desenvolvido, considerando a valvula de saıda do
tanque 100% aberta. A introducao de incerteza ocorre quando a condicao da valvula e
modificada, seja fechando ou abrindo-a, de modo que a dinamica do sistema seja alterada
e o sistema nominal nao e capaz de estabilizar o nıvel de lıquido no ponto de operacao
selecionado.
A Figura 5.6 mostra os sinais de controle e nıvel do tanque considerando que a
condicao da valvula e mesma daquela utilizada no projeto. As curvas em azul sao as
respostas do modelo ao controlador gERF. As curvas em vermelho sao as respostas do
modelo ao controlador CFL. As curvas em verde sao os sinais da resposta do tanque
real ao controlador gERF, e as curvas em magenta sao as respostas do tanque real ao
controlador CFL. A resposta do sistema simulado e a resposta do sistema ao gERF sao
similares.
0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)
1520253035
h (cm)
ReferênciagERFgERF SimCFL
0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)
50607080
u (%
)
ugerf
ucfl
ugerf Simu0
Figura 5.6 – Nıvel e sinal de controle do tanque real com gERF e CFL.
O gERF percebe as variacoes entre o sistema real e seu modelo e faz um ajuste
no controlador, melhorando a resposta do sistema. A linearizacao feita pelo controlador
e continuamente ajustada pois o gERF percebe a existencia de erro de regime e faz
a correcao adicionando um sinal de controle para compensar o efeito da variacao no
Capıtulo 5. Resultados experimentais 78
parametro. Os sinais de controle da CFL e gERF oscilam entorno do sinal de controle de
equilıbrio 𝑢0, porem o sinal da CFL tem uma variacao 0,94 % menor que o sinal produzido
pelo gERF.
0 1000 2000 3000 4000Tempo (s)
1.001.251.501.752.002.252.502.753.00
Núm
ero
RealSim
Figura 5.7 – Numero de centros criados pelo gERF.
A Figura 5.7 mostra a variacao do numero de grupos (ou numero de regras fuzzy)
criados pelo gERF para compensar o erro de modelagem. O gERF adapta sua estrutura
para compensar o efeito da variacao de parametro.
Para quantificar e comparar o desempenho dos controladores CFL e gERF utiliza-se
dos ındices (4.33) a (4.39) apresentados na Secao 4.5. Em geral, os ındices de desempe-
nhos quantificam o erro entre a resposta do sistema e a referencia ou modelo projetado.
Exceto para o IVU, quanto maior o valor percentual do desempenho normalizado pior
e o desempenho do sistema de controle em relacao ao gERF. Os valores dos ındices e o
desempenho relativo sao mostrado na Tabela:
Tabela 5.1 – Indice de desempenho CFL e gERF.
Indice CFL gERF Desempenho Normalizado (%)𝐼𝐴𝐸 2029,58 1871,53 8,44𝐼𝑉 𝐸 0,97 0,93 4,3𝐼𝑆𝐸 5679,73 5261,09 7,95𝐼𝑉 𝑈 3,14 3,17 -0,94𝐼𝑇𝐴𝐸 1014,79 935,76 8,44𝐼𝑇𝑆𝐸 2839,86 2630,54 7,95
Analisando a Tabela 5.1 e as repostas da Figura 5.6 percebe-se que o tanque real
com controle gERF tem um desempenho melhor que o sistema de controle linearizado com
Capıtulo 5. Resultados experimentais 79
a realimentacao classica. Observa-se tambem que o gERF acompanha a referencia melhor
que a CFL, uma vez que este tem um erro de regime. Nota-se tambem que a resposta e
o controle do gERF aplicado ao tanque e similar as respostas obtidas via simulacao.
Por outro lado o IVU, normalizado e um numero negativo, o que indica que a
variabilidade do sinal de controle do gERF e maior que o da CFL. A proxima Secao
analisa o desempenho do gERF quando a valvula de saıda do tanque e diferente da
condicao operacional assumida pelo modelo.
5.4 Teste 03 - Variacao de parametro
O teste consiste em alterar a vazao de saıda do tanque modificando a condicao
operacional da valvula de saıda para que o tanque se comporte de forma distinta daquela
que o modelo assume originalmente. Neste teste a abertura da valvula foi de apenas 60
%, assim a dinamica do tanque real passa a ser dada pela expressao:
ℎ = 23,15𝑢− 14,32ℎ− (1021,5 + 0,1𝐴(ℎ))𝐴(ℎ) (5.5)
A alteracao na posicao da valvula de saıda do Tanque 03 resulta na mudanca do
parametro independente do modelo dinamico (5.1), tal que esse parametro seja modificado
em aproximadamente de ±2,7% a ±21% de acordo com o ponto de operacao. O efeito
maximo da mudanca na condicao operacional da valvula e observado no ponto de operacao
onde a nao linearidade tem a maior secao transversal (ℎ = 44𝑐𝑚). Por outro lado, o menor
efeito ocorre onde a nao linearidade tem a menor secao transversal (ℎ = 16𝑐𝑚). A Figura
5.8 mostra o nıvel e o sinal de controle.
A parte superior da Figura 5.8 mostra o nıvel do tanque, quando o gERF e utilizado
para compensar o efeito da mudanca na vazao de saıda do tanque. A parte inferior da
Figura 5.8 mostra os sinais de controle (rotacao da bomba em %), aplicados utilizando a
CFL e o gERF. A resposta do sistema com a CFL (curva vermelha) estabiliza em pontos
diferentes, ou seja, apresenta erro de regime e nao segue a referencia. O sinal de controle
da CFL varia pouco, mas nao compensa a variacao no parametro. Simulando as mesmas
condicoes descritas neste teste, o gERF apresenta desempenho melhor que a CFL, pois
atinge todos os pontos de operacao.
Capıtulo 5. Resultados experimentais 80
0 1000 2000 3000 4000 5000 6000Tempo (s)
1020304050
h (cm)
ReferênciagERFCFLgERF Sim α=0.01gERF Sim α=0.001MODELO
0 1000 2000 3000 4000 5000 6000Tempo (s)
020406080
u (%)
ugerfucflΔuevoum
Figura 5.8 – Nıvel e sinal de controle do tanque com variacao de parametro.
O desempenho do gERF quando submetido as mesmas condicoes operacionais em
que a CFL foi testada e consideravelmente melhor pois o gERF estima as variacoes do
sistema e as compensa. O gERF acompanha a referencia, conforme mostra a Figura 5.8
(curva verde). O comportamento do gERF e similar ao modelo de referencia (curva ciano),
sugerindo que o gERF lineariza o sistema de forma precisa com desempenho similar aquele
do modelo de controle nominal projetado. Nesse teste a taxa de aprendizagem utilizada
foi 𝛼 = 0,001, o limiar do ındice de alerta 𝜏 = 0,0001, o grau de compatibilidade entre os
grupos 𝜆 = 0,7 e o raio das funcoes de pertinencias gaussianas 𝑟 = 0,25. Um outro teste
foi realizado, sob as mesmas condicoes operacionais do tanque, porem com a mudanca
na taxa de aprendizagem do gERF para 𝛼 = 0,01. Conforme pode ser visto pelas curvas
magenta e amarela na Figura 5.8, a mudanca taxa de aprendizagem nao produz uma
mudanca significativa na dinamica do sistema em comparacao com o teste anterior.
Para ilustrar a adaptacao da estrutura do gERF, a Figura 5.9 mostra a distribuicao
dos dados durante o Teste 03. Na Figura 5.9, os valores de Δ𝑎(ℎ) e Δ𝑏(ℎ) sao as aproxi-
macoes normalizadas da diferenca entre 𝛼(ℎ) e 𝛽(ℎ) de seus respectivos valores nominais
sao agrupados. 𝐸(ℎ) e o erro ℎ(𝑡) − ℎ0.
Atraves da modificacao na estrutura de grupo dos dados e possıvel estimar variacoes
de parametros do sistema e calcular o sinal de controle que compensa estas variacoes. Por
isso o sinal de controle no gERF tem uma maior variabilidade pois os dados modificam a
Capıtulo 5. Resultados experimentais 81
Δa(h)
0.00.2
0.40.6
0.81.0
Δb(h)0.0
0.20.4
0.60.8
1.0
E(h)
0.0
0.2
0.4
0.6
0.8
1.0
Centro de GrupoDados
Figura 5.9 – Estrutura de grupo formada pelo gERF.
estrutura de grupos a cada novo dado recebido. A Figura 5.9 mostra que ao final do teste
apenas dois grupos forma necessarios.
Tabela 5.2 – Indices de desempenho CFL e gERF com variacao de parametro.
Indice CFL gERF Desempenho Normalizado (%)𝐼𝐴𝐸 21,7 × 103 4,55 × 103 376,5𝐼𝑉 𝐸 1,57 1,49 5,36𝐼𝑆𝐸 81,5 × 103 15,06 × 103 441,14𝐼𝑉 𝑈 5,88 6,29 -6,51𝐼𝑇𝐴𝐸 10,58 × 103 2,27 × 103 376,5𝐼𝑇𝑆𝐸 40,77 × 103 7,5 × 103 441,14
A Tabela 5.2 mostra os valores dos ındices de desempenho para o Teste 03. Nova-
mente e possıvel perceber a diferenca entre o gERF e a CFL, e conjecturar que a CFL nao
e robusta o suficiente para compensar os efeitos da variacao de parametros no sistema. A
CFL tem erro de regime enquanto que o gERF atinge a referencia. Um fato a ser desta-
cado e o valor percentual do ındice IVU normalizado do gERF, que e um numero negativo,
indicando que o sinal de controle gerado pelo gERF varia mais do que o sinal de controle
gerado pela CFL. Nas condicoes do Teste 03, o esforco de controle do gERF foi maior do
que o esforco de controle da CFL. Os resultados sugerem que o gERF proporciona melhor
Capıtulo 5. Resultados experimentais 82
desempenho que os controladores alternativos.
5.5 Resumo
Este Capıtulo apresentou os resultados de testes experimentais e os respectivos
resultados de simulacao. As simulacoes realizas serviram para comparar o desempenho
do gERF na pratica com as situacoes aproximadas das simulacoes. Conforme mostrado, o
gERF tem desempenho superior aos controladores alternativos quando existem variacoes
nos parametros no modelo usado para projeto e o sistema real.
83
6 Conclusao
Este trabalho objetivou estudar tecnicas de linearizacao por realimentacao em sis-
temas nao lineares e suas fragilidades. Em particular, o trabalho sugeriu uma abordagem
de controle denominada linearizacao por realimentacao granular evolutiva robusta fuzzy
– gERF, que se traduz em um metodo para estimar e compensar variacoes de parametros
utilizando o algoritmo de aprendizagem participativa evolutiva fuzzy – ePL.
Sob este aspecto os estudos teoricos e praticos apresentados nessa dissertacao apon-
tou resultados coerentes com o que foi idealizado nos objetivos da pesquisa, perfazendo
assim uma contribuicao para o estudo de robustez e estabilidade em sistemas de controles
nao lineares utilizando modelos fuzzy adaptativos para estimar e compensar tais efeitos.
O desempenho do gERF foi comparado aos metodos de controle fuzzy adaptativos,
como o Fuzzy Modelo Reference Learning Control – FMRLC e o Indirect Adaptive Fuzzy
Control – IAFC. Testes experimentais com um tanque foram realizados para verificar e
comparar a eficiencia do gERF quanto a variacao em parametros. Os testes experimentais
foram realizados no Laboratorio de Sinais e Sistemas do Centro Federal de Educacao
Tecnologica de Minas Gerais - CEFET-MG, Divinopolis-MG.
Os resultados se mostram promissores, uma vez que o gERF apresenta desempenho
superior aos demais metodos adaptativos de controle fuzzy existentes na literatura, alem
da CFL.
Apesar dos resultados, alguns topicos merecem uma investigacao mais detalhada,
entre eles investigar a eficiencia do gERF em sistemas de multiplas entradas e multiplas
saıdas (caso MIMO) com incerteza na modelagem, investigar a utilizacao do gERF para
sistemas com dinamicas nao modeladas e seus efeitos para a malha de controle, uma vez
que o metodo proposto considera apenas a incerteza nos parametros de modelagem e nao
as dinamicas dos diversos atuadores do sistema real, e por fim investigar a utilizacao do
gERF em sistemas com atraso nas variaveis de entrada – saıda e sistemas com atrasos de
transporte sao topicos igualmente interessantes a serem pesquisados na sequencia deste
trabalho.
84
Referencias
ABONYI, J. Fuzzy model identification. In: Fuzzy Model Identification for Control.Boston-USA: Birkhauser, 2002. p. 87–164. Citado na pagina 38.
BAEZA, J. Controle nao linear aplicado a malhas de controle com valvulas de alto atrito.Tese (Doutorado) — Universidade de Sao Paulo, Sao Paulo-Brasil, 2013. Citado napagina 20.
BANERJEE, S.; CHAKRABARTY, A.; MAITY, S.; CHATTERJEE, A. Feedbacklinearizing indirect adaptive fuzzy control with foraging based on-line plant modelestimation. Applied Soft Computing, Elsevier, v. 11, n. 4, p. 3441–3450, 2011. Citado napagina 18.
BENNETT, S. A brief history of automatic control. IEEE Control Systems, IEEE, v. 16,n. 3, p. 17–25, 1996. Citado na pagina 17.
BISSELL, C. A history of automatic control. In: Springer Handbook of Automation.Heidelberg-Berlin: Springer, 2009. cap. 4, p. 53–69. Citado na pagina 17.
BLAZIC, S.; SKRJANC, I.; MATKO, D. Globally stable direct fuzzy model referenceadaptive control. Fuzzy Sets and Systems, Elsevier, v. 139, n. 1, p. 3–33, 2003. Citadona pagina 19.
DORF, R.; BISHOP, R. Modern Control Systems. 9th. ed. Upper Saddle River, NewJersey, USA: Prentice-Hall, Inc., 2000. Citado na pagina 24.
DUBOIS, D.; PRADE, H. Gradual inference rules in approximate reasoning. InformationSciences, Elsevier, v. 61, n. 1-2, p. 103–122, 1992. Citado na pagina 34.
EULER-ROLLE, N.; SKRJANC, I.; HAMETNER, C.; JAKUBEK, S. Automatedgeneration of feedforward control using feedback linearization of local model networks.Engineering Applications of Artificial Intelligence, Elsevier, v. 50, p. 320–330, 2016.Citado na pagina 20.
FAUVEL, T.; LAVERGNE, F. Patent, Device for Balancing a Simulation Platform,and Associated Method. Google Patents, 2014. US Patent 8,731,879. Disponıvel em:<https://www.google.ch/patents/US8731879>. Citado na pagina 18.
FRANCO, A. Controle nao linear robusto: um metodo baseado em uma linearizacaopor realimentacao. Tese (Doutorado) — Universidade Federal de Santa Catarina, 2006.Citado 5 vezes nas paginas 18, 20, 31, 32 e 61.
FRANCO, A. Sıntese Convexa de Ganhos para Compensacao Robusta de SistemasLinearizados por Realimentacao. Dissertacao (Mestrado) — CEFET-MG, Divinopolis,MG, 2015. Citado 2 vezes nas paginas 60 e 64.
FRANCO, A.; LEITE, V.; OLIVEIRA, J. Controle automatico de um processo termicocom multiplas entradas e multiplas saıdas utilizando tecnicas de controle moderno. In:SBA. Simposio Brasileiro de Automacao Inteligente. Fortaleza-Ceara, 2013. Citado napagina 20.
Referencias 85
FRANCO, A.; OLIVEIRA, L.; LEITE, V. Sıntese de ganhos para compensacao robustade sistemas linearizados por realimentacao. In: SBA. Congresso Brasileiro de Automatica.Vitoria, ES, Brasil, 2016. p. 2695 – 2700. Citado na pagina 62.
GARCES, F.; BECERRA, V.; KAMBHAMPATI, C.; WARWICK, K. Strategies forFeedback Linearisation: A Dynamic Neural Network Approach. London-UK: Springer,2012. Citado 3 vezes nas paginas 23, 27 e 29.
ISIDORI, A. Nonlinear Control Systems: An introduction. 1. ed. New York:Springer-Verlag, Inc, 1985. Citado na pagina 18.
ISIDORI, A. Nonlinear Control Systems. 3. ed. London-UK: Springer-Verlag, 1995.Citado 3 vezes nas paginas 27, 28 e 29.
KARIMI, H.; MOTLAGH, M. Robust feedback linearization control for a non linearizablemimo nonlinear system in the presence of model uncertainties. In: IEEE. 2006 IEEEInternational Conference on Service Operations and Logistics, and Informatics.Shanghai-China, 2006. p. 965–970. Citado na pagina 20.
KHALIL, H. Nonlinear Systems. 3. ed. Upper Saddle River, New Jersey: Prentice Hall,2002. Citado 5 vezes nas paginas 18, 19, 24, 27 e 56.
KLIR, G.; YUAN, B. Fuzzy Sets and Fuzzy Logic: Theory and Applications. New Jersey,USA: Prentice-hall, Inc, 1995. v. 4. Citado 2 vezes nas paginas 33 e 35.
KWONG, W.; PASSINO, K. Dynamically focused fuzzy learning control. IEEETransactions on Systems, Man, and Cybernetics, Part B Cybernetics, v. 26, n. 1, p.53–74, Feb 1996. Citado na pagina 44.
LAYNE, J.; PASSINO, K. Fuzzy model reference learning control for cargo ship steering.IEEE Control Systems, v. 13, n. 6, p. 23–34, Dec 1993. Citado na pagina 43.
LEITE, D.; PALHARES, R.; CAMPOS, V.; GOMIDE, F. Evolving granular fuzzymodel-based control of nonlinear dynamic systems. IEEE Transactions on Fuzzy Systems,v. 23, n. 4, p. 923–938, 2015. Citado 2 vezes nas paginas 52 e 53.
LIMA, E.; GOMIDE, F.; BALLINI, R. Participatory evolving fuzzy modeling. In: IEEE.International Symposium on Evolving Fuzzy Systems. Ambleside, UK, 2006. p. 36–41.Citado 3 vezes nas paginas 52, 53 e 55.
LJUNG, L. System Identification: Theory for the User. 2. ed. Upper Saddle River, NewJersey, USA: Prentice Hall, PTR, 1999. Citado na pagina 47.
MAMDANI, E.; ASSILIAN, S. An experiment in linguistic synthesis with a fuzzy logiccontroller. International Journal of Man-Machine Studies, Elsevier, v. 7, n. 1, p. 1–13,1975. Citado na pagina 33.
MAYR, O.; BRYANT, L. The origins of feedback control. IEEE Transactions onSystems, Man, and Cybernetics, v. 1, n. 4, p. 407–407, 1971. Citado na pagina 17.
OGATA, K. Modern Control Engineering. 4. ed. Upper Saddle River, New Jersey, USA:Prentice Hall, 2003. Citado 2 vezes nas paginas 17 e 94.
Referencias 86
OLIVEIRA, L. Compensacao por Inversao Dinamica Robusta Aplicada a SistemasLinearizados por Realimentacao. Dissertacao (Mestrado) — Centro Federal de EducacaoTecnologica de Minas Gerais e Universidade Federal de Sao Joao Del Rei - Minas Gerais,Belo Horizonte-MG, 2015. Citado 3 vezes nas paginas 18, 20 e 32.
OLIVEIRA, L.; LEITE, V.; SILVA, J.; GOMIDE, F. Granular evolving fuzzy robustfeedback linearization. In: IEEE. 2017 Evolving and Adaptive Intelligent Systems(EAIS). Ljubljana,SLO, 2017. p. 1–8. Citado na pagina 56.
PASSINO, K.; YURKOVICH, S. Fuzzy Control. 1. ed. Boston, MA, USA: Addison-Wesley, 1997. Citado 3 vezes nas paginas 19, 39 e 45.
PEDRYCZ, W. Granular Computing: Analysis and Design of Intelligent Systems. NewYork, USA: CRC press, 2013. Citado na pagina 37.
PEDRYCZ, W.; GOMIDE, F. Fuzzy Systems Engineering: Toward Human-CentricComputing. Hoboken, New Jersey, USA: Wiley Interscience, 2007. Citado 3 vezes naspaginas 35, 36 e 39.
PROCYK, T.; MAMDANI, E. A linguistic self-organizing process controller.Automatica, v. 15, n. 1, p. 15 – 30, 1979. ISSN 0005-1098. Disponıvel em:<http://www.sciencedirect.com/science/article/pii/0005109879900840>. Citado napagina 39.
QUADROS, M. Projeto e Implementacao de Controladores PI Hıbridos e Lineares coma Utilizacao de CLP. Divinopolis, MG: CEFET-MG, 2016. Trabalho de Conclusao deCurso em Engenharia Mecatronica. Citado 3 vezes nas paginas 60, 89 e 94.
SKRJANC, I.; BLAZIC, S.; MATKO, D. Direct fuzzy model-reference adaptive control.International Journal of Intelligent Systems, Wiley Online Library, v. 17, n. 10, p.943–963, 2002. Citado na pagina 19.
SLOTINE, J.; LI, W. Applied Nonlinear Control. Englewood Cliffs, New Jersey, USA:Prentice-Hall, 1991. v. 199. Citado 2 vezes nas paginas 23 e 28.
TAKAGI, T.; SUGENO, M. Fuzzy identification of systems and its applications tomodeling and control. IEEE Transactions on Systems, Man, and Cybernetics, n. 1, p.116–132, 1985. Citado na pagina 38.
VIDYASAGAR, M. Nonlinear systems analysis. 2. ed. Upper Saddle River, New Jersey,USA: Prentice Hall, 1992. Citado na pagina 32.
WILBANKS, G. 50 years of progress in measuring and controlling industrial processes.IEEE Control Systems, v. 16, n. 1, p. 62–66, 1996. Citado na pagina 17.
ZANKL, A. Milestones in Automation. Boston, USA: Publicis, 2006. Citado na pagina17.
ZDESAR, A.; CERMAN, O.; DOVZAN, D.; HUSEK, P.; SKRJANC, I. Fuzzy controlof a helio-crane. Journal of Intelligent & Robotic Systems, Springer Science & BusinessMedia, v. 72, n. 3-4, p. 497, 2013. Citado na pagina 19.
Anexos
88
ANEXO A – Sistema de tanques interativos
Figura A.1 – Diagrama esquematico da planta.
89
ANEXO B – Modelagem do tanque
O processo de modelagem consiste em realizar os procedimentos de calibracao dos
sensores de nıvel, calibracao de vazao da Bomba 01 (curva da bomba) e a calibracao do
Tanque 03 (curva do tanque), ao qual o controlador por realimentacao sera projetado,
considerando o solido nao linear instalado no interior do mesmo, em outras palavras, a
modelagem consiste na aquisicao dos dados para o projeto do controlador da planta.
B.1 Calibracao de sensores
O procedimento de calibracao de instrumento e realizado com o objetivo de esta-
belecer, sob certas condicoes, uma relacao entre os valores indicados pelo instrumento e
os valores correspondentes aos padroes metricos utilizados, e deve ser feito de forma a
assegurar que o instrumento utilizado esteja dentro de um criterio aceitavel, em que, este
nao interfira de forma a prejudicar a execucao do projeto.
De acordo com (QUADROS, 2016), existem dois tipos de calibracao, a estatica
e a dinamica. A calibracao dinamica e a obtencao da funcao de transferencia ou da
representacao no espaco de estados da dinamica do sistema calibrado. Na calibracao
estatica e obtida uma curva que relaciona as entradas a saıda do sistema calibrado, de
acordo com seus valores em regime permanente. Nesta dissertacao sera utilizada apenas
a calibracao estatica, considerando que a dinamica dos sistemas calibrados e desprezıvel
em relacao a dinamica do sistema.
Para calibracao estatica, a entrada e variada sobre uma determinada faixa de valo-
res constantes, que causam na saıda uma variacao tambem sobre uma faixa de valores. O
sinal de entrada e mantido constante ate que a saıda entre em regime permanente e entao,
e feita a media dos valores obtidos e determinada uma relacao entre o sinal fornecido pelo
sensor e o valor medido e supondo que tal relacao seja linear entao pode ser determinada
por uma expressao linear como (B.1).
𝑞𝑜 = 𝑚𝑞𝑖 + 𝑏 (B.1)
ANEXO B. Modelagem do tanque 90
Em que os coeficientes 𝑚 e 𝑏 sao obtidos por meio do metodo dos mınimos qua-
drados, ou seja, por:
𝑚 =𝑁
𝑁∑𝑖,𝑜=1
𝑞𝑖𝑞𝑜 −(
𝑁∑𝑖=1𝑞𝑖
)(𝑁∑
𝑜=1𝑞𝑜
)
𝑁𝑁∑
𝑖=1𝑞2
𝑖 −(
𝑁∑𝑖=1𝑞𝑖
)2 (B.2)
em que 𝑁 sendo o numero de amostras, e
𝑏 =
(𝑁∑
𝑜=1𝑞𝑜
)(𝑁∑
𝑖=1𝑞2
𝑖
)−
⎛⎝ 𝑁∑𝑖,𝑜=1
𝑞𝑖𝑞𝑜
⎞⎠( 𝑁∑𝑖=1𝑞𝑖
)
𝑁𝑁∑
𝑖=1𝑞2
𝑖 −(
𝑁∑𝑖=1𝑞𝑖
)2 (B.3)
Os desvios padroes de 𝑚, 𝑏 e 𝑞𝑜 sao determinados pela equacoes (B.4), (B.5) e (B.6)
𝜎2𝑚 =
𝑁𝜎2𝑞𝑜
𝑁𝑁∑
𝑖=1𝑞2
𝑖 −(
𝑁∑𝑖=1𝑞𝑖
)2 (B.4)
𝜎2𝑏 =
𝜎2𝑞𝑜
𝑁∑𝑖=1𝑞2
𝑖
𝑁𝑁∑
𝑖=1𝑞2
𝑖 −(
𝑁∑𝑖=1𝑞𝑖
)2 (B.5)
𝜎2𝑞𝑜
= 1𝑁
𝑁∑𝑖,𝑜=1
(𝑚𝑞𝑖 + 𝑏− 𝑞𝑜)2 (B.6)
em que 𝜎𝑚, 𝜎𝑏 e 𝜎𝑞𝑜 sao as incertezas de mediacao de cada parametro na Equacao (B.2). Os
limites de confianca estabelecidos sao de 99,7% para o intervalo ±3𝜎𝑚 e ±3𝜎𝑏 considerando
o modelo estatico. Desta forma e apresentada a fundamentacao estatıstica da calibracao
dos dispositivos na planta.
B.1.1 Calibracao do sensor de nıvel
Nesta Secao e abordado o procedimento a ser realizado para calibracao estatica do
sensor de nıvel do Tanque 03 (obtencao da curva do sensor de nıvel), considerando a teoria
ANEXO B. Modelagem do tanque 91
estatıstica apresentada em na Secao B.1. Atraves do Procedimento B.1 foi realizada a
coleta dos dados para calibracao do sensor de nıvel do Tanque 03.
Procedimento B.1 Coleta de dados para calibracao do sensor de nıvel do Tanque 03
1. Feche completamente o registro de gaveta;
2. Feche completamente a valvula da saıda do Tanque 03;
3. Acione a Bomba 01 ate que o nıvel de lıquido no Tanque 03 atinja 70𝑐𝑚;
4. Leia o nıvel na escala, salve os valores das leituras provenientes do sensor e faca a
media dos valores lidos;
5. Abra a valvula de saıda do Tanque 03 ate que o nıvel diminua 2𝑐𝑚, depois feche
novamente a valvula de saıda do Tanque 03;
6. Repita os passos 4 e 5 ate que o nıvel de lıquido no Tanque 03 seja menor 10𝑐𝑚.
Desta forma, o Tanque 03 e completamente esvaziado, de forma a abordar na
calibracao os valores de leitura para a situacao de descarga. Utilizando o conjunto de
equacoes (B.1), (B.4), (B.5) e (B.6), foram determinados os valores dos coeficientes 𝑚 e 𝑏
dos respectivos desvios padroes como apresentado em (B.7).
ℎ = 3,504 × 10−3𝑣 − 22,32
+𝜎𝑚 = 3,493 × 10−3 e − 𝜎𝑚 = 3,514 × 10−3
+𝜎𝑏 = −22,12 × 10−3 e − 𝜎𝑏 = −22,52 × 10−3
(B.7)
Em que ℎ e o nıvel de lıquido e 𝑣 e o valor medido no sensor. A calibracao realizada
fornece um intervalo de confianca de 99,7%, logo pode-se afirmar que os valores medidos
estao muito proximos a faixa dos valores reais, conforme verificado na Figura B.1.
B.1.2 Calibracao de vazao da Bomba 01
Para a obtencao da calibracao de vazao da Bomba 01 deve-se seguir o passos des-
critos no Procedimento B.2.
Procedimento B.2 Calibracao de vazao da Bomba 01 no Tanque 03
ANEXO B. Modelagem do tanque 92
Sensor ×1040.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8
Nív
el (c
m)
0
20
40
60
80
DadosCurva Ajuste Sensor+3σ
m +3σ
b
-3σm
-3σb
Figura B.1 – Curva de calibracao do sensor de nıvel Tanque 03.
1. Feche completamente o registro de gaveta;
2. Abra a valvula da saıda do Tanque 03, em acordo com as condicoes operacionais
escolhidas, neste caso completamente aberta;
3. Acione a Bomba 01 com sinal de controle em 20%;
4. Aguarde ate o sistema entrar em equilıbrio e faca a medicao do nıvel de lıquido no
Tanque 03;
5. Aumente o sinal de controle em 5%;
6. Repita os passos 4 e 5 ate que o sinal de controle atinja 100% ou ate que o nıvel de
lıquido no Tanque 03 atinja 70𝑐𝑚.
Seguindo tal procedimento, foram obtidos os dados do sinal de controle 𝑢(%), que
equivale a rotacao da Bomba 01 em porcentagem, e da vazao de entrada (𝑞𝑒) entregue ao
Tanque 03. A partir disso, realizou-se um ajuste de primeira ordem da curva utilizando
a ferramenta cftool do MATLAB, apresentada na Figura B.2. O polinomio de ajuste
da vazao de entrada e mostrado em (B.8), juntamente com os seus respectivos desvios
padroes para 𝑚 e 𝑏, respectivamente, em (B.9).
ANEXO B. Modelagem do tanque 93
Sinal de controle u(%)20 30 40 50 60 70 80 90 100
Va
zã
o (
cm
3/s
eg
)
0
500
1000
1500
2000
2500
DadosCurva Ajuste Bomba+3σ
m +3σ
b
-3σm
-3σb
Figura B.2 – Curva de calibracao da Bomba 01.
𝑞𝑒 =
⎧⎪⎪⎨⎪⎪⎩0% se 𝑢(%) < 20%
23,15𝑢(%) − 340,6 se 20% ≤ 𝑢(%) ≤ 100%(B.8)
+𝜎𝑚 = 25,97 × 10−3 e − 𝜎𝑚 = 22,32 × 10−3
+𝜎𝑏 = −218,8 e − 𝜎𝑏 = −462,4(B.9)
Considerando que um sinal de controle 𝑢(%) menor que 20% nao causa nenhuma
alteracao no nıvel de lıquido no Tanque 03 entao considera-se que a vazao de entrada e
zero (0), e que a maxima vazao que a Bomba 01 pode aplicar e de 1974,4𝑐𝑚3/𝑠𝑒𝑔, quando
aplicado o maximo sinal de controle, isto e, (𝑢 = 100%). E importante ressaltar que a
introducao do solido nao-linear no Tanque 03 nao altera a curva de calibracao do sensor
de nıvel, nem a curva de vazao da Bomba 01.
B.1.3 Calibracao de vazao do Tanque 03
Em sistemas que envolvem fluxos de fluidos, e necessario distinguir os regimes
de fluxo em laminar ou turbulento, de acordo com o numero de Reynolds. O fluxo e
considerando turbulento se o numero de Reynolds estiver entre 3000 e 4000, sendo menor
que 2000, logo o fluxo e laminar. No caso laminar, o fluxo de fluido ocorre entre linhas de
fluxo sem turbulencia, tais sistemas que envolvem fluxo turbulento, na maior parte, sao
ANEXO B. Modelagem do tanque 94
representados por equacoes diferenciais nao lineares, enquanto sistemas de fluxo laminar
podem ser representados por equacoes diferenciais lineares (QUADROS, 2016).
Muitos processos industriais envolvem fluxo de lıquidos atraves de tanques e tubu-
lacoes cujo fluxo muitas vezes e turbulento e nao laminar, no entanto, o sistema podera
ser linearizado se as variacoes das variaveis sao mantidas pequenas. Para objetivos de
controle, pode se entao linearizar o sistema entorno de um ponto de operacao, desde que
os controladores projetados sejam capazes de fornecer respostas satisfatorias, mesmo na
presenca de pequena variacoes no processo (OGATA, 2003).
A representacao do Tanque 03 e apresentada na Figura B.3, em que ℎ e a nıvel
de lıquido em 𝑐𝑚, 𝑞𝑒 a vazao, em 𝑐𝑚3/𝑠𝑒𝑔, de entrada entregue pela bomba e 𝑞𝑠, em
𝑐𝑚3/𝑠𝑒𝑔, a vazao de saıda do Tanque 03. Assim a taxa de variacao do volume e calculada
pela diferenca entre a entrada e a saıda de fluido do tanque, logo e calculada pela usando
(B.10).
𝐴ℎ = 𝑞𝑒 − 𝑞𝑠 (B.10)
qe
qs
h
Figura B.3 – Esquema do Tanque 03.
Em que a area de secao transversal do tanque e dada por 𝐴 = 𝜋𝑟2, com 𝑟 = 31𝑐𝑚
e ℎ e a variacao da altura em relacao ao tempo (𝑑ℎ/𝑑𝑡). Portanto e necessario determinar
a vazao de saıda (𝑞𝑠) em funcao do nıvel da lıquido no tanque. Para isso, foi determinada
a curva de vazao a partir dos dados obtidos com execucao do procedimento B.2. De
ANEXO B. Modelagem do tanque 95
maneira semelhante a qual foi determinada a calibracao da Bomba 01, a calibracao/curva
de calibracao de saıda do Tanque 03 foi determinada em funcao do nıvel (ℎ), a partir dos
dados de vazao da bomba (𝑞𝑒).
Isto se deve ao fato de que, em regime permanente, a vazao de saıda e igual a vazao
entrada, entao utilizando-se novamente da ferramenta cftool do MATLAB, foi obtida a
curva representada na Figura B.4, por meio do ajuste polinomial de primeira ordem.
Nível (cm)0 10 20 30 40 50 60 70
Va
zão
(cm
3/s
eg
)
500
1000
1500
2000
DadosCurva Ajuste Tanque+3σ
m -3σ
b
-3σm
-3σb
Figura B.4 – Curva de calibracao do Tanque 03.
Assim, o polinomio de 𝑞𝑠(ℎ) e seu intervalo de validacao sao calculados em (B.11).
Com intervalo de confianca de 99,7% da calibracao no Tanque 03 os desvios padroes sao
mostrados em (B.12). Considerando que para valores de ℎ inferiores a 5,3𝑐𝑚 a vazao
𝑞𝑠 e 0, pois somente a partir deste valor mudancas na vazao de entrada (𝑞𝑒) provocam
variacoes de ℎ. Alem disso, para a maior vazao possıvel (com 𝑢(%) = 100%), o nıvel
corresponde a 70𝑐𝑚, para que o sistema de protecao do tanque nao seja ativado.
Pela Equacao de Bernoulli, a vazao de saıda do tanque e 𝑞𝑠 = (𝜌√
2𝑔ℎ𝐴𝑜), em que
𝜌 e a viscosidade do lıquido e 𝐴𝑜 e a area do do orifıcio de saıda do tanque, ou seja,
𝑞𝑠 depende de√ℎ, porem o que se observa na curva de calibracao/vazao do Tanque 03,
apresentada na Figura B.4 e uma reta, este fato pode ser explicado devido a area do
orifıcio 𝐴𝑜 ser relativamente grande.
𝑞𝑠 =
⎧⎪⎪⎨⎪⎪⎩0 se ℎ < 5,3
14,32ℎ− 680,9 se 5,3 ≤ ℎ ≤ 68(B.11)
ANEXO B. Modelagem do tanque 96
+𝜎𝑚 = 16,07 e − 𝜎𝑚 = 10,45
+𝜎𝑏 = 877 e − 𝜎𝑏 = 675,2(B.12)
Logo apos a determinacao da vazao de saıda 𝑞𝑠, dada por (B.11), e da vazao de
entrada 𝑞𝑒, dada por (B.8), a dinamica do sistema e determinada substituindo-se 𝑞𝑠 e 𝑞𝑒
na Equacao (B.10), logo obtem-se a Equacao (B.13).
ℎ = 23,15𝑢− 14,32ℎ− 1021,5𝐴(ℎ) (B.13)
Com a 𝐴(ℎ) sendo a area do solido nao-linear dado em (4.22).
B.1.4 Validacao do modelo
Para validar o modelo (B.13), foram aplicados sinais de controle em degraus na
entrada do sistema em malha aberta para verificar o ponto em que o sistema modelado
estabiliza-se. Inicialmente foi aplicado um sinal de controle 𝑢 = 60% durante 900 segun-
dos, com o objetivo de verificar o ponto de equilıbrio do sistema, passados 900 o sinal de
controle foi modificado desta vez para 𝑢 = 67%, e novamente foi observado o ponto de
equilıbrio do sistema.
0 500 1000 1500 2000 2500 3000 3500Tempo (seg)
10
20
30
40
Níve
l (cm
)
Sist. realSist. modelado
0 500 1000 1500 2000 2500 3000 3500Tempo (seg)
58
60
62
64
66
u(%)
Degraus
Figura B.5 – Validacao do modelo nao-linear.
A Figura B.5 mostra a resposta do sistema real (curva vermelha) quando submetido
a varios degraus do sinal de controle 𝑢 e a resposta do sistema modelado (curva azul) e
ANEXO B. Modelagem do tanque 97
Tabela B.1 – Sinais de controle de equilıbrio
ℎ0 26 37 26 28 23 30 26 21 26 31 24 28 31𝑢0 60 67 60 61,5 58,8 63 60 57 60 63 58,8 61,5 60
simulado. E interessante notar que o sistema modelado tem resposta similar ao sistema
real quando submetido aos mesmos sinais de controle. Atraves da analise do grafico
e possıvel perceber que os pontos de equilıbrio do Tanque 03 sao os sinais de controle
mostrados na Tabela B.1.
E possıvel afirmar que o sistema nao-linear modelado aproximou-se de forma sa-
tisfatoria ao sistema real, uma vez que apresentou constante de tempo e ganhos muito
semelhantes ao obtido na pratica.