sistemas linearizados por realimentação fuzzy...

UNIVERSIDADE ESTADUAL DE CAMPINAS

Faculdade de Engenharia Eletrica e de Computacao

Jeferson Costa da Silva

Sistemas Linearizados por Realimentacao FuzzyEvolutiva

Campinas

2018

UNIVERSIDADE ESTADUAL DE CAMPINAS

Faculdade de Engenharia Eletrica e de Computacao

Jeferson Costa da Silva

Sistemas Linearizados por Realimentacao Fuzzy Evolutiva

Dissertacao apresentada a Faculdade de En-genharia Eletrica e de Computacao da Uni-versidade Estadual de Campinas como partedos requisitos exigidos para a obtencao dotıtulo de Mestre em Engenharia Eletrica, naArea de Engenharia de Computacao.

Orientador: Prof. Dr. Fernando Antonio Campos Gomide

Este exemplar corresponde a versaofinal da tese defendida pelo alunoJeferson Costa da Silva, e orientadapelo Prof. Dr. Fernando AntonioCampos Gomide

Campinas

2018

Agência(s) de fomento e nº(s) de processo(s): Não se aplica.

Ficha catalográficaUniversidade Estadual de Campinas

Biblioteca da Área de Engenharia e ArquiteturaLuciana Pietrosanto Milla - CRB 8/8129

Silva, Jeferson Costa da, 1988- Si38s SilSistemas linearizados por relimentação fuzzy evolutiva / Jeferson Costa da

Silva. – Campinas, SP : [s.n.], 2018.

SilOrientador: Fernando Antônio Campos Gomide. SilDissertação (mestrado) – Universidade Estadual de Campinas, Faculdade

de Engenharia Elétrica e de Computação.

Sil1. Controle robusto. 2. Sistemas evolutivos. 3. Sistemas de controle por

realimentação. I. Gomide, Fernando Antônio Campos, 1951-. II. UniversidadeEstadual de Campinas. Faculdade de Engenharia Elétrica e de Computação.III. Título.

Informações para Biblioteca Digital

Título em outro idioma: Evolving fuzzy feedback linearization systemsPalavras-chave em inglês:Robust controlEvolving systemsFeedback control systemsÁrea de concentração: Engenharia de ComputaçãoTitulação: Mestre em Engenharia ElétricaBanca examinadora:Fernando Antônio Campos Gomide [Orientador]Valter Júnior de Souza LeiteEric RohmerData de defesa: 08-02-2018Programa de Pós-Graduação: Engenharia Elétrica

Powered by TCPDF (www.tcpdf.org)

COMISSÃO JULGADORA - DISSERTAÇÃO DE MESTRADO

Candidato: Jeferson Costa da Silva RA: 163679

Data da Defesa: 08 de fevereiro de 2018

Título da Tese: "Sistemas Linearizados por Realimentação Fuzzy Evolutiva”.

Prof. Dr. Fernando Antônio Campos Gomide (Presidente, FEEC/UNICAMP) Prof. Dr. Valter Júnior de Souza Leite (CEFET-MG) Prof. Dr. Eric Rohmer (FEEC/UNICAMP)

A ata de defesa, com as respectivas assinaturas dos membros da ComissãoJulgadora, encontra-se no processo de vida acadêmica do aluno.

A Marinalva, Jose Neto, Julianny, Kaylens e famılia, Thomas, Amanda.

Agradecimentos

A Deus criador do Universo, por me possibilitar saude, inspiracao e forca para

realizacao desse trabalho.

Aos meus familiares, meu Pai o Sr. Jose Francisco da Silva Neto, minha Mae a

Sra Marinalva Costa da Silva, as minhas irmas Julianny Costa da Silva e Amanda Costa

Brandao aos meus irmaos Thomas Monteiro Costa e Silva e Kaylens Lee Jhonson Lira de

Souza, que tanto apoio me deram durante esta longa jornada e a quem eu os dedico este

trabalho.

Aos colegas e amigos do Laboratorio de Sinais e Sistemas do CEFET-MG campus

Divinopolis, em especial o Professor Msc. Lucas Silva Oliveira e ao Professor Dr Valter

Junior de Souza Leite pela valiosa contribuicao na parte experimental desta pesquisa.

Aos colegas do LCA/FEEC pelos momentos de alegria compartilhados. Aos colegas da

Universidade Federal de Roraima pela confianca, respeito e profissionalismo em especial

a Professora Dra. Gioconda Santos e Souza Martinez.

Um agradecimento especial a TODOS os professores do DCA/FEEC, em particular,

ao Professor Dr Fernando Antonio Campos Gomide pelo compromisso e confianca na

orientacao desta pesquisa.

A Universidade Estadual de Campinas, pela oportunidade.

Resumo

A linearizacao por realimentacao e uma poderosa abordagem de controle, porem pode

apresentar fragilidades diante de erros de modelagem. A falta de robustez desta abor-

dagem de controle pode levar a um desempenho abaixo do esperado ou ate mesmo a

instabilidade. Esta dissertacao sugere uma estrategia para melhorar a robustez em siste-

mas linearizados por realimentacao usando um mecanismo do tipo modelo de referencia e

um algoritmo de aprendizagem participativa evolutiva granular fuzzy. A linearizacao por

realimentacao granular evolutiva robusta fuzzy e uma maneira de controlar sistemas nao

lineares com incertezas e assegurar a estabilidade da malha fechada. O resultado e uma

abordagem mais robusta de controle em malha fechada em que a aprendizagem partici-

pativa evolutiva fuzzy e empregada para estimar as incertezas em tempo real e mitigar

seus efeitos no sistema. A dissertacao tambem aborda aspectos teoricos e praticos de um

sistema de controle de nıvel em um tanque nao linear, e mostra que o desempenho do

controlador granular evolutivo robusto e superior a abordagens alternativas propostas na

literatura como Classic Feedback Linearization, Fuzzy Model Reference Learning Control

e Indirect Adaptive Fuzzy Control. Alem disso, a dissertacao discute os aspectos praticos

e testes experimentais da linearizacao por realimentacao granular evolutiva robusta fuzzy

implementado em um controlador de nıvel de um tanque real de laboratorio.

Palavras-chaves: Controle robusto; Sistemas evolutivos, Sistemas de controle por reali-

mentacao.

Abstract

Exact feedback linearization is a powerful approach for nonlinear control, but has poor

robustness properties. Lack of robustness yields inadequate performance and instability.

This dissertation introduces a novel control approach to improve robustness of nonlinear

feedback linearization systems based on model reference adaptive control, and granu-

lar evolving fuzzy participatory learning. The granular evolving fuzzy robust feedback

linearization approach is a way to robustly control uncertain nonlinear systems around

a given operation point. The result is a robust closed-loop control approach in which

participatory learning is employed to estimate unknown nonlinearities online to cancel

their effects in feedback linearized systems. The dissertation develops studies using a

surge level tank and shows that the performance of the granular evolving robust feed-

back linearization is higher than Classic Feedback Linearization, Fuzzy Model Reference

Learning Control, and the Indirect Adaptive Fuzzy Control approaches. Actual imple-

mentation was done using a laboratory surge tank system. Experimental results agree

with simulation results, and confirms the superior performance of the granular evolving

fuzzy robust feedback linearization approach.

Keywords: Robust control; Evolving systems; Feedback control systems.

Lista de ilustracoes

Figura 2.1 – Linearizacao por realimentacao. . . . . . . . . . . . . . . . . . . . . . . 24

Figura 3.1 – Inferencia fuzzy. Min-Max. . . . . . . . . . . . . . . . . . . . . . . . . . 37

Figura 3.2 – Topologia FMRLC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Figura 4.1 – Modelo de aprendizagem participativa evolutiva. . . . . . . . . . . . . . 53

Figura 4.2 – Topologia do gERF. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

Figura 4.3 – Representacao do tanque com solido nao linear. . . . . . . . . . . . . . 61

Figura 4.4 – Nıvel do tanque com incerteza. . . . . . . . . . . . . . . . . . . . . . . 63

Figura 4.5 – Sinal de controle incerto. . . . . . . . . . . . . . . . . . . . . . . . . . . 63

Figura 4.6 – Sinal de controle linearizado incerto. . . . . . . . . . . . . . . . . . . . 63

Figura 4.7 – Nıvel do tanque com incerteza constante. . . . . . . . . . . . . . . . . . 65

Figura 4.8 – Sinais de controle com incerteza constante. . . . . . . . . . . . . . . . . 65

Figura 4.9 – Sinais de controle linearizados com incerteza constante. . . . . . . . . . 65

Figura 4.10–Nıvel do tanque com incerteza variavel. . . . . . . . . . . . . . . . . . . 66

Figura 4.11–Sinais de controle com incerteza variavel. . . . . . . . . . . . . . . . . . 66

Figura 4.12–Sinais de controle linearizados com incerteza variavel. . . . . . . . . . . 66

Figura 4.13–Dinamica do tanque com perturbacao de carga. . . . . . . . . . . . . . 67

Figura 4.14–Nıvel do tanque com perturbacao de carga. . . . . . . . . . . . . . . . . 68

Figura 4.15–Sinais de controle com perturbacao de carga. . . . . . . . . . . . . . . . 68

Figura 4.16–Sinais de controle linearizados com perturbacao de carga. . . . . . . . . 68

Figura 4.17–Numero de grupos criados durante o teste com perturbacao de carga. . 69

Figura 5.1 – Sistema de tanques interativos do Laboratorio de Sinais e Sistemas

CEFET-MG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

Figura 5.2 – Sensor diferencial de pressao Honeywell 26PCBFA6D. . . . . . . . . . . 74

Figura 5.3 – Sensores de vazao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

Figura 5.4 – Solido nao linear instalado dentro do tanque. . . . . . . . . . . . . . . 75

Figura 5.5 – Resposta do modelo do tanque. . . . . . . . . . . . . . . . . . . . . . . 76

Figura 5.6 – Nıvel e sinal de controle do tanque real com gERF e CFL. . . . . . . . 77

Figura 5.7 – Numero de centros criados pelo gERF. . . . . . . . . . . . . . . . . . . 78

Figura 5.8 – Nıvel e sinal de controle do tanque com variacao de parametro. . . . . 80

Figura 5.9 – Estrutura de grupo formada pelo gERF. . . . . . . . . . . . . . . . . . 81

Figura A.1–Diagrama esquematico da planta. . . . . . . . . . . . . . . . . . . . . . 88

Figura B.1 – Curva de calibracao do sensor de nıvel Tanque 03. . . . . . . . . . . . . 92

Figura B.2 – Curva de calibracao da Bomba 01. . . . . . . . . . . . . . . . . . . . . 93

Figura B.3 – Esquema do Tanque 03. . . . . . . . . . . . . . . . . . . . . . . . . . . 94

Figura B.4 – Curva de calibracao do Tanque 03. . . . . . . . . . . . . . . . . . . . . 95

Figura B.5 – Validacao do modelo nao-linear. . . . . . . . . . . . . . . . . . . . . . . 96

Lista de tabelas

Tabela 3.1 – Base de regras do modelo fuzzy inverso. . . . . . . . . . . . . . . . . . 44

Tabela 4.1 – Desempenho normalizado do gERF com variacao de parametro constante. 70

Tabela 4.2 – Desempenho normalizado do gERF com parametro variante no tempo. 70

Tabela 4.3 – Desempenho normalizado do gERF com perturbacao de carga e ruıdo. 70

Tabela 5.1 – Indice de desempenho CFL e gERF. . . . . . . . . . . . . . . . . . . . 78

Tabela 5.2 – Indices de desempenho CFL e gERF com variacao de parametro. . . . 81

Tabela B.1 – Sinais de controle de equilıbrio . . . . . . . . . . . . . . . . . . . . . . 97

Lista de Abreviaturas e Siglas

BFO Bacterial foraging optimization (Modelo evolutivo de colonias

bacterianas)

BLS Batch least squares (Quadrados mınimos em batelada)

CFL Classic feedback linearization (Linearizacao por realimentacao classica)

cv Cavalo vapor

COG Center-of-gravity (Centro de gravidade)

DOF Degree of freedom (Grau de liberdade)

FMRLC Fuzzy model reference learning control

gERF Granular evolving fuzzy robust feedback linearization

IAFC Indirect adaptive fuzzy control

ITAE Integral of time-weighted absolute error

IAE Integral of the absolute magnitude of the error

IVU Integral of time-weighted variability of the signal control

ISE Integral of the square of the error

ITSE Integral of the time multiplied by square of error

LMI Linear matrix inequalities (Desigualdades matriciais lineares)

LMN Local model neural network (Modelo de rede neural local)

MATLAB Matrix laboratory

MIMO Multiple input and multiple output (Multiplas entradas e multiplas

saıdas)

MRAC Model reference adaptive control (Modelo adaptativo de controle por

referencia)

Numpy Numeric python

RMI Robust multi-inversion (Multi-inversao robusta)

RLS Recursive least squares (Quadrados mımimos recursivos)

SISO Single input and single output (Uma entrada e uma saıda)

TS Takagi-Sugeno

Lista de Sımbolos

, Igual por definicao

∃ Existe

∈ Pertence a

/∈ Nao pertence a

⊆ Subconjunto

span Espaco vetorial gerado por vetores linearmente independentes

dim Dimensao de um vetor

rank Posto de uma matriz

(∘) Composicao max − min

sup Supremo entre dois valores

min Mınimo entre dois valores⋃Operacao agregacao entre dois conjuntos fuzzy

≈ Aproximadamente

argmax Argumento que maximiza

𝜑 (·) Difeomorfismo

R Conjunto dos numeros reais

D Subconjunto de R

𝐴𝑗𝑖 Conjunto fuzzy

X Universo de discurso

𝑦𝑖, 𝑥𝑖 Vetores utilizados

𝐿𝑓ℎ Derivada de Lie da funcao ℎ(𝑥) ao longo de 𝑓(𝑥)

𝑎𝑑𝑓𝑔(𝑥) Produto de Lie entre as funcoes 𝑓(𝑥) e 𝑔(𝑥)

Trabalhos publicados

Conferencia nacional

Oliveira, L.; Leite, V.; Silva, J.; Gomide, F. Robustez em linearizacao por rea-

limentacao granular evolutiva. In: SBA. 2017 Simposio Brasileiro de Automacao Inteli-

gente. Porto Alegre – RS, Brasil, 2017. p. 1-8.

Conferencia internacional

Oliveira, L.; Leite, V.; Silva, J.; Gomide, F. Granular evolving fuzzy robust fe-

edback linearization. In: IEEE. 2017 Evolving and Adaptive Intelligent Systems (EAIS).

Ljubljana, SLO, 2017. p. 1-8.

Sumario

1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.1 Revisao bibliografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.2 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.3 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1.4 Organizacao do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2 Linearizacao por realimentacao . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1 Controle em linearizacao por realimentacao . . . . . . . . . . . . . . . . . . 23

2.2 Fundamentos de sistemas de controle nao linear . . . . . . . . . . . . . . . 25

2.3 Condicoes necessarias para linearizacao por realimentacao . . . . . . . . . . 28

2.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3 Controle fuzzy adaptativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.1 Sistemas fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.1.1 Sistemas linguısticos fuzzy . . . . . . . . . . . . . . . . . . . . . . . 33

3.1.2 Modelo funcional fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.2 Fuzzy Model Reference Learning Control . . . . . . . . . . . . . . . . . . . 39

3.2.1 Controlador fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.2.2 Modelo de referencia . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.2.3 Mecanismo de aprendizagem . . . . . . . . . . . . . . . . . . . . . . 42

3.3 Indirect Adaptive Fuzzy Control . . . . . . . . . . . . . . . . . . . . . . . . 45

3.3.1 Metodo de identificacao e estimacao . . . . . . . . . . . . . . . . . . 45

3.3.2 Compensador adaptativo distribuıdo paralelo . . . . . . . . . . . . 49

3.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4 Controle granular evolutivo . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.1 Aprendizagem participativa evolutiva . . . . . . . . . . . . . . . . . . . . . 52

4.2 Formulacao do problema de controle . . . . . . . . . . . . . . . . . . . . . 56

4.3 Linearizacao por realimentacao granular evolutiva robusta fuzzy . . . . . . 57

4.4 Controle de nıvel de tanque . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.5 Analise e avaliacao de desempenho . . . . . . . . . . . . . . . . . . . . . . 64

4.6 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

5 Resultados experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.1 Descricao do tanque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.2 Teste 01 - Linearizacao por realimentacao classica . . . . . . . . . . . . . . 74

5.3 Teste 02 - Topologia de controle . . . . . . . . . . . . . . . . . . . . . . . . 77

5.4 Teste 03 - Variacao de parametro . . . . . . . . . . . . . . . . . . . . . . . 79

5.5 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

6 Conclusao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

Anexos 87

ANEXO A Sistema de tanques interativos . . . . . . . . . . . . . . . . . . . . 88

ANEXO B Modelagem do tanque . . . . . . . . . . . . . . . . . . . . . . . . 89

B.1 Calibracao de sensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

B.1.1 Calibracao do sensor de nıvel . . . . . . . . . . . . . . . . . . . . . 90

B.1.2 Calibracao de vazao da Bomba 01 . . . . . . . . . . . . . . . . . . . 91

B.1.3 Calibracao de vazao do Tanque 03 . . . . . . . . . . . . . . . . . . . 93

B.1.4 Validacao do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 96

17

1 Introducao

As primeiras aplicacoes automatizadas surgiram na Grecia, por volta de 300 a.C.,

com a invencao de sistemas de ajuste do fluxo de agua em um reservatorio a fim de

controlar o nıvel (BISSELL, 2009). Inicialmente os processos para controle e automacao

eram simples, rudimentares e utilizavam tecnicas empıricas no desenvolvimento. Ao longo

do tempo, novos estudos e desenvolvimentos consolidaram tecnicas de analise e sıntese que

possibilitam o projeto de sistemas automatizados com desempenho cada vez maior, alem

da aplicabilidade em uma vasta gama de sistemas e processos. A partir do seculo XIX,

as tecnicas de automacao e controle passaram a ser tratadas com formalismo tecnico

e cientıfico mais rigorosos (MAYR; BRYANT, 1971), (ZANKL, 2006). A evolucao dos

estudos em automacao permitiu que diversas tecnicas e metodos de controle fossem criados

para lidar com ambientes cada vez mais complexos e que mudam suas condicoes a todo

instante (OGATA, 2003).

A teoria de controle e automacao aplicada a industria surgiu em meio a Revolucao

Industrial ocorrida em meados do seculo XIX, quando foram criadas as primeiras maquinas

para a manufatura de bens e equipamentos. Dentre os diversos sistemas de controle, os

nao lineares vem sendo pesquisados e desenvolvidos com mais intensidade a partir da

decada de 1980. Atualmente diversas tecnicas de controle nao lineares vem sendo criadas

e melhoradas para garantir robustez as aplicacoes industriais, uma vez que estas lidam

diretamente com sistemas fısicos. O estudo de sistemas de controle envolvem modelos

complexos e demandam grande esforco para o desenvolvimento e projeto, pois levam

em consideracao a dinamica do processo fısico que irao operar. O desenvolvimento de

sistemas de controle esta baseado em modelos dinamicos que descrevem o comportamento

do processo e suas caracterısticas. A partir da analise do modelo, e projetada uma lei

de controle que torna a resposta aceitavel diante das perturbacoes presentes no sinal de

controle e no sistema (BENNETT, 1996), (WILBANKS, 1996).

Uma vez que a lei de controle tenha sido projetada espera-se que esta proporcione

ao sistema em malha fechada uma dinamica que atenda as especificacoes de projeto,

mesmo que existam diferencas entre o modelo e o sistema real. Atualmente o interesse em

pesquisar este tipo de controle consiste em assegurar estabilidade, robustez e desempenho

Capıtulo 1. Introducao 18

(ISIDORI, 1985).

1.1 Revisao bibliografica

A linearizacao por realimentacao exata/classica – Classic Feedback Linearization –

(CFL) e uma tecnica na qual uma lei de controle e adequadamente projetada ou escolhida

para transformar a dinamica de um sistema nao linear em um sistema linear controlavel

equivalente, ao qual pode se reescrito como uma cadeia de integradores e entao projetar os

ganhos do controlador via uma abordagem de sistemas lineares convencionais (KHALIL,

2002). Na pratica, essa abordagem nao apresenta garantia de estabilidade e desempenho

quando o sistema real diverge do modelo utilizado na linearizacao. Diferentes formas de

agregar robustez a essa tecnica de controle foram propostas.

Por exemplo, o trabalho apresentado em (FRANCO, 2006) sugere um metodo de

linearizacao por realimentacao que coloca a origem do sistema em malha fechada entorno

dos pontos de operacoes selecionados. Embora esta abordagem de controle produza um

sistema em malha fechada mais robusto que a CFL, ela tambem pode apresentar compor-

tamento inesperado e instavel na presenca de incertezas suficientemente grandes.

Um metodo frequentemente utilizado e a inversao multi-robusta – Robust Multi-

Inversion – (RMI), desenvolvido por (FAUVEL; LAVERGNE, 2014). Essa tecnica con-

siste em adicionar um sinal de compensacao ao sinal de controle para anular os efeitos

das incertezas. O sinal de compensacao depende da diferenca entre o sinal de saıda do

sistema real e da saıda do modelo nao linear utilizado no projeto do controlador. Todavia

essa abordagem nao fornece uma metodologia sistematica para projetar o controlador.

Em (OLIVEIRA, 2015), uma topologia similar a RMI e proposta com a utilizacao

de um sinal de compensacao ao sinal de controle. Os ganhos do controlador sao calcu-

lados utilizando um algoritmo de evolucao diferencial em que a estabilidade e certificada

via desigualdades matriciais lineares – Linear Matrix Inequalities – (LMI), para fornecer

robustez ao sistema em malha fechada.

No trabalho de (BANERJEE et al., 2011), utilizou-se o modelo evolutivo de colo-

nias bacterianas – Bacterial Foraging Optimization – (BFO). O algoritmo BFO e um

mecanismo de otimizacao estocastica baseado em tecnicas evolutivas das colonias de bac-

terias. Este controlador e projetado com base nos parametros do processo e em tempo


real sao estimadas as incertezas do sistema de controle de linearizacao por realimentacao

no qual um esquema de equivalencia certa fuzzy e desenvolvido para controlar sistemas

nao lineares.

Em (BLAZIC et al., 2003), encontra-se um algoritmo adaptativo de controle fuzzy

tipo Takagi-Sugeno, no qual, o processo fısico controlado e nao linear de primeira ordem

que torna-se estavel mesmo na presenca de dinamicas nao modeladas. Nesse trabalho

os autores mostram que os sinais de controle tornam-se limitados enquanto o erro de

seguimento de referencia e os parametros estimados convergem para um conjunto residual

dependente do tamanho da amplitude das dinamicas nao modeladas.

Em (ZDESAR et al., 2013), considera-se um algoritmo de controle e auto ajuste

projetado para uso em um sistema nao linear de uma entrada e uma saıda – Single Input

and Single Output – (SISO). O algoritmo de controle desenvolvido e baseado no modelo

adaptativo Takagi-Sugeno e e composto por duas malhas: feedforward e feedback. Na

malha feedforward o controlador deve conduzir a saıda do sistema a uma vizinhanca

do sinal de referencia. Para alcancar a referencia desejada e adicionada uma malha de

feedback ao controlador. O modelo de controlador preditivo utilizado na malha de feedback

e obtido atraves do modelo Takagi-Sugeno construıdo atraves do evolving fuzzy modeling

com base na tecnica de agrupamento recursivo Gustafson-Kessel e quadrados mınimos.

Essa abordagem emprega tecnicas evolutivas para adicionar, remover, fundir e dividir

grupos que caracterizam e ajustam o controlador.

As abordagens classicas de controle fuzzy adaptativo foram propostas em (PAS-

SINO; YURKOVICH, 1997), e introduzem dois metodos para ajuste da lei de controle

por realimentacao: o primeiro e o – Fuzzy Model Reference Learning Control – (FMRLC)

e o segundo o – Indirect Adaptive Fuzzy Control – (IAFC).

Um novo modelo adaptativo de controle por referencia – Model Reference Adaptive

Control – (MRAC), e proposto em (SKRJANC et al., 2002). Os autores apresentam

uma nova abordagem para o FMRLC em que a generalidade do algoritmo e confirmada

pelo teorema de Stone-Weierstrass, indicando que qualquer funcao contınua pode ser

aproximada por uma expansao de funcao de base fuzzy. A lei adaptativa com parametros

fuzzy adaptativos sao obtidos usando o criterio de estabilidade de Lyapunov (KHALIL,

2002).


No trabalho de (EULER-ROLLE et al., 2016) um modelo simples e introduzido

para criar automaticamente uma lei de controle em um sistema dinamico nao linear uti-

lizando um modelo de rede neural local de tempo discreto – Discrete-time Local Model

Network – (LMN), cuja linearizacao por realimentacao e aplicada ao modelo generico da

LMN e a transformacao de entrada resultante e usada como modelo de controle inverso.

Porem este estudo nao aponta estrategias de controle para lidar com parametros incertos

variantes no tempo do modelo de controle nao linear.

Diante das referencias apresentadas, percebe-se que os sistemas de controle adap-

tativos atraı interesse em relacao a estabilidade e robustez quando existe variacao de

parametros e o desenvolvimento de tecnicas que permitam mitigar tais efeitos no sistema

de controle.

1.2 Motivacao

A estimacao de incertezas em sistemas de controle nao lineares e um tema que

desperta interesse na comunidade cientıfica, pois tais sistemas operam em condicoes com-

plexas e quaisquer alteracoes, nao modeladas, no sistema fısico causa a perda de robustez

(FRANCO, 2006), (KARIMI; MOTLAGH, 2006), (FRANCO et al., 2013). Assim, as-

segurar uma operacao estavel e robusta quando existem parametros variantes no tempo

tem uma importancia fundamental no desempenho de sistemas de controle que dependem

de um modelo do processo.

Um dos problemas comuns no desenvolvimento de controladores esta relacionado

a garantia de robustez quando alguns parametros do modelo variam ou possuem um

grau de incerteza associados. De acordo com (OLIVEIRA, 2015), torna-se extremamente

complexo projetar e garantir robustez as aplicacoes no tocante a escolha de ganhos e ao

mesmo tempo manter a estabilidade da lei de controle linearizante projetada (BAEZA,

2013). Portanto, o desenvolvimento de sistemas de controle robustos para processos nao

lineares e variantes no tempo e uma tarefa de grande relevancia, para ilustrar esta fato

na Secao 4.4 do Capıtulo 4 e apresentada uma simulacao da perda de robustez causada

pela variacao dos parametros do processo.


1.3 Objetivo

Esta trabalho desenvolve um metodo adaptativo de controle com linearizacao por

realimentacao e compara seu desempenho com abordagens de controle fuzzy adaptativos

existentes na literatura. Esses metodos sao aplicados em sistemas linearizados por reali-

mentacao classica e estimam as incertezas que causam instabilidade e falta de robustez

a malha de controle. Indices de desempenho, tais como Integral of Time-weighted Abso-

lute Error – (ITAE), Integral of Time-weighted Variability of the Signal Control – (IVU),

Integral of the Absolute Magnitude of the Error – (IAE), Integral of Time-weighted Va-

riability of the Error – (IVE), Integral of the Square of the Error – (ISE) e Integral of

Time Multiplied by Square Error – (ITSE) sao utilizados para quantificar o desempenho

de cada metodo.

Assim, o objetivo deste trabalho e implementar, desenvolver, analisar e comparar

o desempenho das abordagens de controle fuzzy adaptativos existentes na literatura CFL,

FMRLC e IAFC com o metodo proposto neste trabalho denominado linearizacao por

realimentacao granular evolutiva robusta fuzzy – Granular Evolving Fuzzy Robust Feedback

Linearization – (gERF). Controladores do tipo gERF sao robustos quanto a variacoes

ou incertezas nos parametros do modelo e os efeitos causados nos sistemas de controle

linearizados por realimentacao.

Mais especificamente, objetiva-se:

1. Estudar, analisar, implementar e simular sistemas de controle fuzzy classicos e o

sistema de controle evolutivo granular gERF;

2. Implementar e testar experimentalmente a abordagem de controle proposta nesta

dissertacao;

3. Quantificar e comparar o desempenho dos sistemas de controle utilizando como

criterio o ındices: ITAE, IVU, IVE, ISE, IAE, ITSE.

1.4 Organizacao do trabalho

Essa dissertacao esta organizada da seguinte forma: O Capıtulo 2, apresenta uma

breve revisao dos conceitos e tecnicas que compreendem a derivada de Lie, as condicoes


necessarias e os fundamentos da linearizacao por realimentacao. O Capıtulo 3, aborda os

fundamentos dos modelos de controle fuzzy adaptativo FMRLC e IAFC. O Capıtulo 4

inicia com a apresentacao dos conceitos da aprendizagem participativa evolutiva fuzzy. Na

sequencia, formula-se o problema da presenca de incertezas e variacao de parametros no

sistema real projetado com o metodo CFL, para o caso SISO, e apresenta-se o metodo de

linearizacao por realimentacao com o gERF. Um estudo comparativo entre o desempenho

do gERF e o da linearizacao por realimentacao com os metodos CFL, FMRLC e IAFC

utilizando como exemplo o controle de nıvel em um tanque nao linear e os respectivos

resultados de simulacoes sao tambem parte deste capıtulo. O Capıtulo 5 discorre sobre

uma analise de desempenho do gERF num sistema de controle de nıvel em um tanque, e

os resultados de testes experimentais realizados em laboratorio. Finalmente, o Capıtulo 6

conclui a dissertacao enumerando suas principais contribuicoes, e sugerindo topicos para

serem tratados em estudos e desenvolvimentos futuros.

23

2 Linearizacao por realimentacao

Na literatura e possıvel encontrar diversos metodos e tecnicas para linearizar um

sistema de controle, por exemplo, por serie e expansao de Taylor, modos deslizantes, line-

arizacao por realimentacao entre outros. Este Capıtulo apresenta uma breve revisao sobre

os conceitos de linearizacao por realimentacao classica – Classic Feedback Linearization –

(CFL).

2.1 Controle em linearizacao por realimentacao

Segundo (GARCES et al., 2012), o objetivo da CFL e transformar algebricamente

um sistema dinamico nao linear em um sistema dinamico linear equivalente usando a

realimentacao estatica dos estados, por meio de uma transformacao de coordenadas e

analise diferencial do sistema de controle. Considere a classe de sistemas nao lineares

dada por:

�� = 𝑓(𝑥) + 𝑔(𝑥)𝑢

𝑦 = ℎ(𝑥)(2.1)

em que: 𝑥 ∈ R𝑛 e o vetor de variaveis de estado, 𝑢 ∈ R𝑚 e o vetor da variavel de entrada,

𝑦 ∈ R𝑚 e o vetor da variavel de saıda, 𝑓(𝑥) ∈ R𝑛, 𝑔(𝑥) ∈ R𝑛×𝑚 e ℎ(𝑥) ∈ R𝑚 sao vetores

de funcoes nao lineares definidas em um subconjunto aberto D ⊆ 𝑅𝑛 tal que 𝑓 : D → R𝑛,

𝑔: D → R𝑛×𝑚 e ℎ: D → R𝑚. O ponto de operacao e 𝑥0 = [𝑥01, 𝑥

02, . . . , 𝑥

0𝑛]𝑇 . Assume-se

que o vetor de estado 𝑥 e conhecido (SLOTINE; LI, 1991).

A questao envolvendo (2.1) e saber se existe um controle por realimentacao de

estados que, junto com uma mudanca de coordenadas, possa transformar esse sistema

nao linear em um sistema linear equivalente. O primeiro problema que se apresenta e o de

projetar uma lei de controle que cancele exatamente as parcelas nao lineares do sistema

de controle. Em geral deseja-se projetar uma lei de controle que em malha fechada torne

o sistema linear. O cancelamento das nao linearidades utiliza uma transformacao de

Capıtulo 2. Linearizacao por realimentacao 24

coordenadas, chamada difeomorfismo 𝜑(𝑥), com 𝑧 ∈ R𝑛.

𝑧 = 𝜑(𝑥) (2.2)

A rigor, a lei de controle que faz a realimentacao (transformacao) exata dos estados

e feita aplicando o difeomorfismo. A lei de controle pode ser calculada pela expressao:

𝑢 = 𝛼(𝑥) + 𝛽(𝑥)𝑣 (2.3)

em que 𝛼(𝑥) ∈ R𝑚 e 𝛽(𝑥) ∈ R𝑚×𝑚 sao vetores de funcoes nao lineares e 𝑣 ∈ R𝑚 e a variavel

que representa a lei de controle linear. Uma escolha possıvel e determinar 𝛼(𝑥) = −𝑓(𝑥)𝑔(𝑥) e

𝛽(𝑥) = 1𝑔(𝑥) se 𝑔(𝑥) nao for nula em D. A operacao de mudanca de coordenadas e realizada

pelo difeomorfismo (2.2) e pela lei de controle (2.3), tornando o sistema nao linear (2.1)

no sistema linear descrito pela expressao:

�� = 𝐴𝑧 +𝐵𝑣 (2.4)

Conhecida como forma canonica de Brunowsky, o par (𝐴, 𝐵) e controlavel e 𝑣 ∈

R𝑚 e o sinal de controle linear calculado por:

𝑣 = 𝐾𝑧 = 𝐾𝜑(𝑥) (2.5)

Com 𝐾 sendo uma matriz alocacao de polos do sistema (KHALIL, 2002), (DORF;

BISHOP, 2000).

𝑢 = 𝛼(𝑥) + 𝛽(𝑥)𝑣 Sistema Nao Linear 𝜑(𝑥)

𝐾

𝑢 𝑥 𝑧

𝑣

Figura 2.1 – Linearizacao por realimentacao.

A Figura 2.1 mostra a operacao de linearizacao por realimentacao para sistemas

de controle nao lineares. As proximas secoes apresentam os fundamentos de sistemas


nao lineares e da linearizacao por realimentacao. O projeto do controlador com essa

abordagem deve satisfazer as condicoes explicitadas na proxima Secao.

2.2 Fundamentos de sistemas de controle nao linear

Considere sistemas nao lineares representados por modelos na forma (2.1). Esses

sistemas possuem solucoes analıticas exatas para o problema de linearizacao. Por isso e

feita uma formulacao para solucao destes problemas considerando as propriedades diferen-

ciais em torno dos pontos de operacoes do sistema. Algumas abordagens propoem criar

uma lei de controle que faca uma aproximacao de linearizacao entrada-saıda para cancelar

as nao linearidades do sistema. A seguir sao apresentadas as propriedades envolvidas no

calculo do controle que cancela as nao linearidades do sistema. Deste ponto em diante,

havera a omissao do argumento das funcoes sempre que esse fato nao comprometer a

compreensao.

Definicao 2.1 (Derivada de Lie) Seja ℎ: 𝐷 → R uma funcao diferenciavel e um

campo vetorial 𝑓 : D → R em D ⊆ R𝑛. A Derivada de Lie de ℎ(𝑥) ao longo de 𝑓 e

dada pelo produto interno:

⟨𝜕ℎ

𝜕𝑥, 𝑓(𝑥)

⟩= 𝜕ℎ

𝜕𝑥𝑓(𝑥) (2.6)

A Derivada de Lie de ℎ ao longo de 𝑓 e denotada por 𝐿𝑓ℎ

𝐿𝑓ℎ(𝑥) =𝑛∑

𝑖=1

𝜕ℎ

𝜕𝑥𝑖

𝑓𝑖(𝑥) (2.7)

para todo 𝑥 ∈ 𝐷.

Se 𝐿𝑓ℎ for diferenciavel por outro campo vetorial 𝑔, temos:

𝐿𝑔𝐿𝑓ℎ(𝑥) = 𝜕𝐿𝑓ℎ

𝜕𝑥𝑔(𝑥) (2.8)


Realizando esta operacao recursivamente 𝑘−vezes, obtem-se a expressao:

𝐿𝑘𝑓ℎ =

𝜕(𝐿𝑘−1𝑓 ℎ)𝜕𝑥

𝑓(𝑥) (2.9)

em seguida define-se:

𝐿0𝑓ℎ = ℎ(𝑥) (2.10)

Definicao 2.2 (Produto de Lie) Considerando que 𝑓 e 𝑔 sao dois campos vetoriais

definidos em um subconjunto D ⊆ R𝑛, o Produto de Lie de 𝑓 e 𝑔 e um novo campo

vetorial diferenciavel definido por:

[𝑓,𝑔](𝑥) = 𝑎𝑑𝑓𝑔(𝑥) = 𝜕𝑔

𝜕𝑥𝑓(𝑥) − 𝜕𝑓

𝜕𝑥𝑔(𝑥) (2.11)

em que𝜕𝑔

𝜕𝑥e𝜕𝑓

𝜕𝑥sao as matrizes Jacobianas de 𝑔 e 𝑓 :

𝜕𝑔

𝜕𝑥=

⎡⎢⎢⎢⎢⎢⎣𝜕𝑔1𝜕𝑥1

· · · 𝜕𝑔1𝜕𝑥𝑛

.... . .

...

𝜕𝑔𝑛

𝜕𝑥1· · · 𝜕𝑔𝑛

𝜕𝑥𝑛

⎤⎥⎥⎥⎥⎥⎦ (2.12a)

𝜕𝑓

𝜕𝑥=

⎡⎢⎢⎢⎢⎢⎣𝜕𝑓1𝜕𝑥1

· · · 𝜕𝑓1𝜕𝑥𝑛

.... . .

...

𝜕𝑓𝑛

𝜕𝑥1· · · 𝜕𝑓𝑛

𝜕𝑥𝑛

⎤⎥⎥⎥⎥⎥⎦ (2.12b)

𝑥 ∈ 𝐷.

Definicao 2.3 (Grau Relativo e Matriz Caracterıstica) Dado o sistema nao afim

na forma multivariavel (2.1). E dito que cada saıda ℎ𝑗(𝑥) possui grau relativo 𝑟𝑗 no ponto

(𝑥0,𝑦0), se:

1. 𝐿𝑔𝑖ℎ𝑗(𝑥) = 𝐿𝑔𝑖

𝐿𝑓ℎ𝑗(𝑥) = · · · = 𝐿𝑔𝑖𝐿𝑘

𝑓ℎ𝑗(𝑥) = 0, ∀𝑖 ∈ [1,𝑝] e 𝑘 < 𝑟𝑗 − 1. e se existe pelo

menos um 𝑖 tal que 𝐿𝑔𝑖𝐿𝑘

𝑓ℎ𝑗(𝑥) = 0, 𝑘 = 𝑟𝑗 − 1, 𝑖 ∈ [1,𝑝].


2. O grau relativo e definido como 𝑟 = 𝑟1 + 𝑟2 + · · · + 𝑟𝑚 e a matriz caracterıstica 𝑀(𝑥)

nao singular em 𝑥0 e definida como:

𝑀(𝑥) =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

𝐿𝑔1𝐿𝑟1−1𝑓 ℎ1(𝑥) 𝐿𝑔2𝐿

𝑟1−1𝑓 ℎ1(𝑥) · · · 𝐿𝑔𝑚𝐿

𝑟1−1𝑓 ℎ1(𝑥)

𝐿𝑔1𝐿𝑟2−1𝑓 ℎ2(𝑥) 𝐿𝑔2𝐿

𝑟2−1𝑓 ℎ2(𝑥) · · · 𝐿𝑔𝑚𝐿

𝑟1−1𝑓 ℎ2(𝑥)

......

. . ....

𝐿𝑔1𝐿𝑟𝑚−1𝑓 ℎ𝑚(𝑥) 𝐿𝑔2𝐿

𝑟𝑚−1𝑓 ℎ𝑚(𝑥) · · · 𝐿𝑔𝑚𝐿

𝑟𝑚−1𝑓 ℎ𝑚(𝑥)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦(2.13)

A consequencia da definicao (2.3) e que sistemas do tipo (2.1) tem grau relativo 𝑟

em um ponto em torno do equilıbrio 𝑥0 quando a saıda 𝑦 e derivada 𝑟 vezes para que 𝑢

apareca nas equacoes. Segundo (KHALIL, 2002) e (ISIDORI, 1995), alem do conceito de

grau relativo apresentado e necessario abordar brevemente os conceitos de distribuicao e

involutividade de uma distribuicao, para avaliar a possibilidade de linearizacao exata do

sistema.

Definicao 2.4 (Distribuicao) Uma distribuicao em 𝑥 e um espaco vetorial gerado pela

colecao de vetores 𝑓𝑖(𝑥), 𝑖 = 1, . . . ,𝑛 em um conjunto aberto D de R𝑛 tal que:

𝐷(𝑥) = span{𝑓1(𝑥), . . . ,𝑓𝑛(𝑥)} (2.14)

E possıvel perceber que nesta definicao a cada ponto 𝑥 ∈ D corresponde um subes-

paco 𝐷(𝑥) de R𝑛. Denota-se por D a colecao de todos os espacos vetoriais 𝐷(𝑥) ∈ 𝑈 . A

dimensao de 𝐷(𝑥), dim(𝐷) = rank[𝑓1(𝑥),𝑓2(𝑥), . . . ,𝑓𝑛(𝑥)], varia com 𝑥. Uma distribuicao

𝐷 e dita nao singular se dim(𝐷(𝑥)) = 𝑛 para todo 𝑥 ∈ 𝑈 (GARCES et al., 2012).

Definicao 2.5 (Involutividade) Uma distribuicao 𝐷 e dita involutiva se os campos

vetoriais 𝑔1, 𝑔2 ∈ D e o produto de Lie [𝑔1,𝑔2] ∈ D.

Definicao 2.6 (Difeomorfismo) A aplicacao 𝜑: Ω → R𝑛, na qual Ω e um subconjunto

aberto de R𝑛, e um difeomorfismo se 𝜑(𝑥)−1 existe e se 𝜑(𝑥) e 𝜑(𝑥)−1 sao diferenciaveis

e contınuas em Ω. Se Ω = R𝑛 entao 𝜑(𝑥) e um difeomorfismo global.


2.3 Condicoes necessarias para linearizacao por realimentacao

De acordo com (SLOTINE; LI, 1991), existem algumas condicoes que devem ser

observadas para tornar um sistema nao linear em linear. Essas condicoes sao importantes

na teoria de controle por realimentacao e parte de duas questoes fundamentais no desen-

volvimento de sistemas nao lineares. A primeira e saber se todos os sistemas do tipo (2.1)

podem ser linearizados e a segunda e saber quando tal linearizacao existe. Para resolver

estas questoes (ISIDORI, 1995) propoe o seguinte.

Lema 2.1 Dada a matriz 𝑔(𝑥0) de posto p, o problema da linearizacao por realimentacao

em espaco de estado e soluvel se somente se existe uma vizinhanca D do ponto de equilıbrio

(𝑥0) e 𝑝 funcoes de valores reais ℎ1(𝑥), ℎ2(𝑥),· · · ,ℎ𝑝(𝑥) definidas em D, tal que o sistema

(2.1) tenha um vetor grau relativo {𝑟1,𝑟2, . . . ,𝑟𝑝} em 𝑥0, com 𝑟1 + 𝑟2 + · · · + 𝑟𝑝 = 𝑛.

O Lema 2.1 torna possıvel a descricao, sob algumas condicoes, dos campos vetoriais

𝑓(𝑥), 𝑔1(𝑥), . . . , 𝑔𝑝(𝑥), de modo que seja possıvel encontrar 𝑝 funcoes ℎ1(𝑥), ℎ2(𝑥),· · · ,ℎ𝑝(𝑥)

em termos das propriedades distributivas e campos vetoriais 𝐺0 ⊂ 𝐺1 ⊂ · · · 𝐺𝑛−1 ⊆ R𝑛

e as distribuicoes associadas ao sistema (2.1) seja:

𝐺0 = span{𝑔1, . . . ,𝑔𝑝}

𝐺1 = span{𝑔1, . . . ,𝑔𝑝,𝑎𝑑𝑓𝑔1, . . . ,𝑎𝑑𝑓𝑔𝑝}

. . .

𝐺𝑖 = span{𝑎𝑑𝑘𝑓𝑔𝑗 : 0 ≤ 𝑘 ≤ 𝑖, 1 ≤ 𝑗 ≤ 𝑝}, 0 ≤ 𝑖 ≤ 𝑛− 1

(2.15)

em que 𝑎𝑑𝑓𝑔 e o Produto de Lie e span representa a distribuicao vetorial de todos os

pontos de 𝑥.

Lema 2.2 Supondo que a matriz 𝑔(𝑥0) tenha posto p. Entao existe uma vizinhanca D de

𝑥0 e p funcoes com valores reais ℎ1(𝑥), ℎ2(𝑥), · · · ,ℎ𝑝(𝑥) definidas em D, tal que o sistema

(2.1) possua vetor grau relativo {𝑟1, · · · ,𝑟𝑝} de 𝑥0, com 𝑟1 + 𝑟2 + · · · + 𝑟𝑝 = 𝑛, se somente

se:

1. Cada uma das distribuicoes 𝐺𝑖, para 0 ≤ 𝑖 ≤ (𝑛 − 1), tem dimensao constante

em torno de 𝑥0, para 0 ≤ 𝑖 ≤ (𝑛− 1);

2. Cada uma das distribuicoes 𝐺𝑖, para 0 ≤ 𝑖 ≤ (𝑛− 2), e involutiva;


3. A distribuicao 𝐺𝑛−1 tem dimensao 𝑛.

entao (2.1) e linearizavel por realimentacao.

Assim, de acordo com (ISIDORI, 1995), um sistema e linearizavel por realimentacao

se as distribuicoes 𝐺0, 𝐺1, . . . , 𝐺𝑛−1 satisfizerem H1 – H3 do Lema 2.2.

Teorema 2.1 Se as distribuicoes 𝐺0, 𝐺1, . . . , 𝐺𝑛−1 satisfazem H1 – H3 do Lema 2.2,

entao existem funcoes escalares reais ℎ1(𝑥), ℎ2(𝑥),. . ., ℎ𝑚(𝑥) definidas em uma vizinhanca

𝑈 de 𝑥0, de graus relativos 𝑟1, 𝑟2, . . ., 𝑟𝑚 = 𝑛, tais que:

1. ∀ 𝑖 ∈ [1,𝑚], ∀ 𝑗 ∈ [1,𝑚] e ∀ 𝑥 ∈ 𝑈

𝐿𝑔𝑖ℎ𝑗(𝑥) = 𝐿𝑔𝑖

𝐿𝑓ℎ𝑗(𝑥) = . . . = 𝐿𝑔𝑖𝐿

𝑟𝑗−2𝑓 ℎ𝑗(𝑥) = 0

2. A matriz (2.13) e nao singular para todo 𝑥 ∈ 𝑈 .

Consequentemente o vetor ℎ(𝑥) com componentes ℎ1(𝑥), ℎ2(𝑥), . . ., ℎ𝑚(𝑥) e:

ℎ(𝑥) =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

ℎ1(𝑥)

ℎ2(𝑥)...

ℎ𝑚(𝑥)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦(2.16)

O vetor (2.16) e escolhido como saıda para o sistema (2.1).

�� = 𝑓(𝑥) + 𝑔(𝑥)𝑢 = 𝑓(𝑥) +𝑚∑

𝑖=1𝑔𝑖(𝑥)𝑢𝑖

𝑦 = ℎ(𝑥)(2.17)

De acordo com (GARCES et al., 2012), a linearizacao por realimentacao exata

(linearizacao por realimentacao classica) e a transformacao de um sistema do tipo descrito

por (2.1), sobre os estados estaticos e suas coordenadas em um sistema linear controlavel,

de modo que as nao linearidades do sistema sejam canceladas. Atraves da aplicacao do


difeomorfismo para realizar esta transformacao (2.2) e da realimentacao dos estados por

(2.5), o sistema (2.1) passa a ser escrito na forma canonica de Brunowsky:

�� = 𝐴𝑧 +𝐵𝑣

𝑦 = 𝐶𝑧(2.18)

Em que a matriz 𝐴 tem dimensao 𝑟𝑖 × 𝑟𝑖 e super diagonal composta por 1 e seus

outros elementos por 0. 𝐵, e um vetor 𝑟𝑖 × 1 cujo ultimo elemento e 1 e todos os outros

elementos sao 0. 𝐶, e 1 × 𝑟𝑖, cujo primeiro elemento e 1 e os outros 0, com 𝑥 ∈ R𝑛

representando os estados e 𝑣 ∈ R𝑚 a entrada de controle do sistema respectivamente, de

forma explicita:

𝐴 =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

𝐴1 0𝑟1×𝑟2 · · · 0𝑟1×𝑟𝑚

0𝑟2×𝑟1 𝐴2 · · · 0𝑟2×𝑟𝑚

......

. . ....

0𝑟𝑚×𝑟1 0𝑟𝑚×𝑟2 · · · 𝐴𝑚

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦

𝐵 =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

𝐵1 0𝑟1×1 · · · 0𝑟1×1

0𝑟2×1 𝐵2 · · · 0𝑟2×1...

.... . .

...

0𝑟𝑚×1 0𝑟𝑚×1 · · · 𝐵𝑚

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦

𝐶 =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

𝐶1 01×𝑟2 · · · 01×𝑟𝑚

01×𝑟1 𝐶2 · · · 01×𝑟𝑚

......

. . ....

01×𝑟1 01×𝑟2 · · · 𝐶𝑚

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦

Teorema 2.2 (Linearizacao por realimentacao classica) Dado o sistema (2.1), a

linearizacao por realimentacao e feita atraves da aplicacao do difeomorfismo:

𝑧 = 𝜑(𝑥) (2.19)


e a realimentacao dos estados feita por:

𝑢(𝑥,𝑣) = 𝛼(𝑥) + 𝛽(𝑥)𝑣 (2.20)

com,

𝜑(𝑥) =

⎡⎢⎢⎢⎢⎢⎣𝜑1(𝑥)

...

𝜑𝑚(𝑥)

⎤⎥⎥⎥⎥⎥⎦ , 𝜑𝑖(𝑥) =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

ℎ𝑖(𝑥)

𝐿𝑓ℎ𝑖(𝑥)...

𝐿𝑟𝑖−1𝑓 ℎ𝑖(𝑥)

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦(2.21)

𝛼(𝑥) = −𝑀−1(𝑥)

⎡⎢⎢⎢⎢⎢⎣𝐿𝑟1

𝑓 ℎ1(𝑥)...

𝐿𝑟𝑚𝑓 ℎ𝑚(𝑥)

⎤⎥⎥⎥⎥⎥⎦ (2.22)

𝛽(𝑥) = 𝑀−1(𝑥) (2.23)

A forma (2.18) e o sistema resultante, com estados 𝑥.

De acordo com (FRANCO, 2006), a interpretacao do Teorema 1, e que um novo

estado 𝑥 pode ser definido atraves do difeomorfismo (2.19). Derivando-se 𝑥 para obter a

expressao (2.24).

�� = 𝜕𝜑(𝑥)𝜕𝑥

�� =(𝜕𝜑(𝑥)𝜕𝑥

𝑓(𝑥))𝑥=𝜑−1(𝑥)

+(𝜕𝜑(𝑥)𝜕𝑥

𝑔(𝑥))𝑥=𝜑−1(𝑥)

𝑢 (2.24)

Desta forma e possıvel reescrever uma nova representacao para os estados do sis-

tema (2.1), com estado 𝑧 e saıda 𝑦

�� = 𝐴𝑧 +𝐵

⎛⎜⎜⎜⎜⎜⎝

⎡⎢⎢⎢⎢⎢⎣𝐿𝑟1

𝑓 ℎ1(𝑥)...

𝐿𝑟𝑚𝑓 ℎ𝑚(𝑥)

⎤⎥⎥⎥⎥⎥⎦+𝑀(𝑥)𝑢

⎞⎟⎟⎟⎟⎟⎠𝑦 = 𝐶𝑧

(2.25)


Atraves da aplicacao da lei de controle 𝑢(𝑥,𝑣), calculada por (2.20), o sistema (2.25)

pode ser transformado no sistema (2.18) novamente.

E possıvel identificar duas desvantagens ligadas a linearizacao por realimentacao

classica, cujas caracterısticas estao fortemente ligadas ao modelo nao linear. Como con-

sequencia direta se existirem incertezas associadas as variaveis de estado o sistema passara

a perder o sentido fısico. Torna-se complexo definir os objetivos e especificar variaveis abs-

tratas que nao apresentam correlacao com os estados do sistema, pois nem sempre existe

uma relacao direta dos estados linearizados com os estados fısicos reais (VIDYASAGAR,

1992).

Outra caracterıstica importante e diferenca de comportamentos entre o sistema

linearizado e o sistema nao linear devido ao cancelamento das nao linearidades e a presenca

de pequenas variacoes nos parametros do sistema pode impedir o cancelamento exato das

nao linearidades. Assim, como o controlador linear e projetado com a suposicao que todos

os cancelamentos foram realizados de forma exata, e possıvel que se obtenha uma resposta

inesperada, ou seja, que haja uma falha do controlador. Consequentemente, o sistema em

malha fechada nao e, em geral, robusto (FRANCO, 2006), (OLIVEIRA, 2015).

2.4 Resumo

Este Capıtulo resumiu conceitos fundamentais de sistemas nao lineares, bem como

os criterios e conceitos para linearizacao por realimentacao em sistemas de controle nao

lineares. No proximo Capıtulo sera abordado os aspectos formais de uma classe de con-

troladores fuzzy adaptativos.

33

3 Controle fuzzy adaptativo

No Capıtulo anterior, o desenvolvimento de controladores assume que o sistema e

modelado com equacoes precisas, que nao havia incerteza no modelo. Porem na pratica

tais modelos nao sao precisos e podem sofrer variacao nos parametros. Uma alternativa

para mitigar estes efeitos e utilizar sistemas de controle fuzzy. Em geral, controladores

fuzzy possuem a capacidade de controlar um determinado processo sem a necessidade de

conhecer o modelo exato do processo. Este Capıtulo abordara os fundamentos relaciona-

dos aos sistemas e controladores adaptativos fuzzy.

3.1 Sistemas fuzzy

Os modelos de sistemas fuzzy que serao abordados sao caracterizados por regras

do tipo “SE-ENTAO”, regras essas que representam relacoes locais do modelo de entrada-

saıda de um sistema. Esta Secao discute os sistemas mais comuns. Estes sistemas podem

representar tanto modelos quanto controladores de processos.

3.1.1 Sistemas linguısticos fuzzy

Sao sistemas definidos por uma colecao de regras linguısticas do tipo Se-Entao

que envolvem conceitos de conjuntos e inferencia fuzzy. Essas regras desempenham um

papel importante na representacao de um sistema relacionando as variaveis de entrada as

variaveis de saıda do mesmo. Os modelos linguısticos foram introduzidos por Mamdani

(MAMDANI; ASSILIAN, 1975). Um exemplo de regra linguıstica e a seguinte:

Se Velocidade e Alta e Aceleracao e Pequena⏟ ⏞ 𝐴𝑛𝑡𝑒𝑐𝑒𝑑𝑒𝑛𝑡𝑒

Entao Frenagem e Pequena⏟ ⏞ 𝐶𝑜𝑛𝑠𝑒𝑞𝑢𝑒𝑛𝑡𝑒

(3.1)

O modelo linguıstico e a forma mais predominante pois descrevem linguisticamente

a maneira como os seres humanos se comportam, pensam, e raciocinam, ou seja, e concei-

tualmente mais natural (KLIR; YUAN, 1995). Os sistemas de controle fuzzy sao baseados

Capıtulo 3. Controle fuzzy adaptativo 34

em um conjunto de regras, onde 𝑋, 𝑌 e 𝑍 sao variaveis linguısticas 𝐴𝑖, 𝐵𝑖 e 𝐶𝑖 sao con-

juntos fuzzy nos universos de discurso X, Y e Z e definidas como:

𝑅𝑖 : Se 𝑋 e 𝐴𝑖 e 𝑌 e 𝐵𝑖 Entao 𝑍 e 𝐶𝑖, com 𝑖 = 1, . . . , 𝑛. (3.2)

Em geral o projeto de sistemas fuzzy depende de algumas escolhas, como normas

triangulares (𝑡−𝑛𝑜𝑟𝑚𝑎𝑠 ou 𝑠−𝑛𝑜𝑟𝑚𝑎𝑠) para agregar expressoes atomicas (𝑋 e 𝐴𝑖) e (𝑌

e 𝐵𝑖) no antecedente da regra e da relacao para expressar o significado da regra Se-Entao

entre o antecedente e o consequente. A escolha de uma 𝑠 − 𝑛𝑜𝑟𝑚𝑎 e necessaria para

agregar as regras individuais.

As operacoes de agregacao mais comuns nos antecedentes das regras sao o mınimo

ou produto algebrico (𝑡 − 𝑛𝑜𝑟𝑚𝑎). As composicoes de regras mais usadas sao supremo

(sup) e mınimo (min) ou supremo (sup) e produto (produto) (DUBOIS; PRADE, 1992).

O processamento de um sistema fuzzy e feito usando a composicao sup − min. O processo

geral de inferencia via composicao e feito da forma:

Entrada: 𝑋 e 𝐴 e 𝑌 e 𝐵

𝑅1 : Se 𝑋 e 𝐴1 e 𝑌 e 𝐵1 Entao 𝑍 e 𝐶1

𝑅2 : Se 𝑋 e 𝐴2 e 𝑌 e 𝐵2 Entao 𝑍 e 𝐶2...

𝑅𝑖 : Se 𝑋 e 𝐴𝑖 e 𝑌 e 𝐵𝑖 Entao 𝑍 e 𝐶𝑖

...

𝑅𝑛 : Se 𝑋 e 𝐴𝑛 e 𝑌 e 𝐵𝑛 Entao 𝑍 e 𝐶𝑛

Saıda: 𝑍 e 𝐶

(3.3)

A tarefa da inferencia e determinar o conjunto fuzzy 𝐶, ou a funcao pertinencia

de 𝐶, dada uma entrada e uma regra da base. Para isso traduz-se o modelo de inferencia

(3.3) para a forma:

Entrada: 𝑃 (𝑥,𝑦) = min{𝐴(𝑥), 𝐵(𝑦)}

𝑅𝑖 : 𝑅𝑖(𝑥,𝑦,𝑧) = min{𝐴𝑖(𝑥), 𝐵𝑖(𝑦), 𝐶𝑖(𝑧)}

Saıda: 𝐶 = 𝑃 ∘𝑛⋃

𝑖=1𝑅𝑖

(3.4)

em que (∘) denota a composicao sup − min.


De acordo com (PEDRYCZ; GOMIDE, 2007) em termos de funcoes de pertinencia

o conjunto fuzzy 𝐶 e obtido, utilizando-se a operacao uniao padrao, segundo a expressao:

𝐶(𝑧) = sup𝑥,𝑦

{min[𝑃 (𝑥,𝑦),max(𝑅𝑖(𝑥,𝑦,𝑧))]} (3.5)

Utilizando uma notacao alternativa com ∧ para a operacao max e ∨ para a operacao

min, (3.4) torna-se:


{𝑃 (𝑥,𝑦) ∧ [𝑅1(𝑥,𝑦,𝑧) ∨ · · · ∨𝑅𝑛(𝑥,𝑦,𝑧)]}


{[𝑃 (𝑥,𝑦) ∧𝑅1(𝑥,𝑦,𝑧)] ∨ · · · ∨ [𝑃 (𝑥,𝑦) ∧𝑅𝑛(𝑥,𝑦,𝑧)]}

𝐶(𝑧) = min{sup𝑥,𝑦

[𝑃 (𝑥,𝑦) ∧𝑅1(𝑥,𝑦,𝑧)] , · · · , sup𝑥,𝑦

[𝑃 (𝑥,𝑦) ∧𝑅𝑛(𝑥,𝑦,𝑧)]}.

(3.6)

Se 𝐶′𝑖(𝑧) = sup

𝑥,𝑦[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] entao 𝐶

′𝑖 = 𝑃 ∘ 𝑅𝑖, e (3.6) pode ser simbolica-

mente expressa por:

𝐶(𝑧) =𝑛⋃

𝑖=1(𝑃 ∘𝑅𝑖) =

𝑛⋃𝑖=1

𝐶′

𝑖 (3.7)

De (3.4) e (3.7), tem-se:

𝐶(𝑧) = 𝑃 ∘𝑛⋃

𝑖=1𝑅𝑖 =

𝑛⋃𝑖=1

(𝑃 ∘𝑅𝑖) =𝑛⋃

𝑖=1𝐶

′

𝑖 (3.8)

A expressao (3.8) e valida para qualquer composicao sup −𝑡 com uma 𝑡 − 𝑛𝑜𝑟𝑚𝑎

contınua e a uniao padrao (max) (KLIR; YUAN, 1995). No caso da composicao sup − min

tem-se:

sup𝑥,𝑦

[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] = sup𝑥,𝑦

[𝐴(𝑥) ∧𝐵(𝑦) ∧ 𝐴𝑖(𝑥) ∧𝐵𝑖(𝑦) ∧ 𝐶𝑖(𝑧)] (3.9)

ou seja, rearranjando:

sup𝑥,𝑦

[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] = sup𝑥,𝑦

[(𝐴(𝑥) ∧ 𝐴𝑖(𝑥)) ∧ (𝐵(𝑦) ∧𝐵𝑖(𝑦)) ∧ 𝐶𝑖(𝑧)] (3.10)


Como o supremo e determinado com relacao a 𝑥 e 𝑦, pode-se reescrever (3.10) como

sendo:

sup𝑥,𝑦

[𝑃 (𝑥,𝑦) ∧𝑅𝑖(𝑥,𝑦,𝑧)] = sup𝑥

[𝐴(𝑥) ∧ 𝐴𝑖(𝑥)] ∧ sup𝑦

[𝐵(𝑦) ∧𝐵𝑖(𝑦)] ∧ 𝐶𝑖(𝑧) (3.11)

Assim:

sup𝑥


[𝐵(𝑦) ∧𝐵𝑖(𝑦)] ∧𝐶𝑖(𝑧) = Poss(𝐴,𝐴𝑖) ∧ Poss(𝐵,𝐵𝑖) ∧𝐶𝑖(𝑧) (3.12)

Com:

Poss(𝐴,𝐴𝑖) = sup[𝐴(𝑥) ∧ 𝐴𝑖(𝑥)] = 𝑚𝑖 e Poss(𝐵,𝐵𝑖) = sup[𝐵(𝑦) ∧𝐵𝑖(𝑥)] = 𝑛𝑖 (3.13)

entao, reescreve-se (3.12) da seguinte forma:

sup𝑥


[𝐵(𝑦) ∧𝐵𝑖(𝑦)] ∧ 𝐶𝑖(𝑧) = 𝑚𝑖 ∧ 𝑛𝑖 ∧ 𝐶𝑖(𝑧) (3.14)

Portanto, substituindo (3.14) em (3.6), tem-se:

𝐶(𝑧) = max{[𝑚1 ∧ 𝑛1 ∧ 𝐶1(𝑧)] , [𝑚2 ∧ 𝑛2 ∧ 𝐶2(𝑧)] , · · · , [𝑚𝑛 ∧ 𝑛𝑛 ∧ 𝐶𝑛(𝑧)]} (3.15)

Considerando que 𝜓𝑖 = (𝑚𝑖 ∧ 𝑛𝑖) seja o grau de ativacao da regra 𝑅𝑖 entao (3.15)

indica que se 𝜓𝑖 = 0 a regra nao contribui para inferir um valor sobre o conjunto fuzzy 𝐶,

porque sua parte correspondente a (𝜓𝑖 ∧𝐶𝑖) = 0. A Figura 3.1 ilustra a operacao deduzida

na Equacao (3.15), considerando a participacao de duas regras 𝑅𝑖 e 𝑅𝑗 (PEDRYCZ;

GOMIDE, 2007).

Computacionalmente isto significa que ao inves de combinar todas as regras usando

a operacao de agregacao max, produzir uma relacao correspondente e depois proceder com

a inferencia fuzzy via composicao sup − min, pode-se primeiro inferir o conjunto fuzzy

individual de cada regra, usando a composicao sup − min e produzir o resultado desejado


X

𝑚𝑗

𝑚𝑖

1𝐴𝑖 𝐴𝑗 𝐴

Y

𝑛𝑗𝑛𝑖

1𝐵𝑖 𝐵 𝐵𝑗

minZ

𝑛𝑗

𝑚𝑖

1𝐶𝑖 𝐶𝑗

𝐶′

𝑖

𝐶′

𝑗

Figura 3.1 – Inferencia fuzzy. Min-Max.

Algoritmo 3.1 Inferencia Min-Max.

Entrada: 𝐴, 𝐵Saıda: Um conjunto fuzzy 𝐶.

C = ∅para 𝑖 = 1 ate 𝑛 fazer𝑚𝑖 = max(min(𝐴,𝐴𝑖))𝑛𝑖 = max(min(𝐵,𝐵𝑖))𝜓𝑖 = min(𝑚𝑖, 𝑛𝑖)se 𝜓𝑖 = 0 entao𝐶

′𝑖 = min(𝜓𝑖, 𝐶𝑖)

𝐶 = max(𝐶,𝐶 ′𝑖)

fim sefim pararetorna 𝐶

combinando os conjuntos individuais via operacao de agregacao max. O algoritmo 3.1

resume o procedimento de inferencia Min-Max.

Analisando algumas propriedades do modelo de inferencia descrito pelas expressoes

(3.5) a (3.15) e possıvel notar que se 𝐴 = 𝐵 = ∅ entao o resultado e tambem um conjunto

vazio 𝐶 = ∅. Se 𝐴 = X e 𝐵 = Y o resultado e um conjunto fuzzy que e a uniao de todos

os conjuntos 𝐶𝑖, 𝐶 =𝑛⋃

𝑖=1𝐶𝑖, pois todas as regras sao ativadas.

Quando as entradas dos sistemas fuzzy sao pontos 𝐴 = {𝑥0} e 𝐵 = {𝑦0} o calculo

da medida de possibilidade nos passos iniciais torna-se muito simples porque nestes casos

𝑚𝑖 = 𝐴𝑖(𝑥0) e 𝑛𝑖 = 𝐵𝑖(𝑥0).

De acordo com (PEDRYCZ, 2013), sistemas fuzzy com entradas numericas geral-

mente requerem saıdas numericas. Assim o sistema deve fornecer um ponto no universo

representativo do conjunto fuzzy inferido. Os modelos linguısticos fuzzy com entradas nu-

mericas e saıda produzida por defuzzificacao sao um mapeamento nao linear de entrada-

saıda do sistema. A defuzzificacao e uma forma de encontrar um ponto representativo

da saıda. Uma forma e calcular o centroide ou centro de gravidade, (center-of-gravity -


COG), para defuzzificar a saıda e:

𝑧 =∫

𝑍 𝑧𝐶(𝑧)𝑑𝑧∫𝑍 𝐶(𝑧)𝑑𝑧 (3.16)

Uma alternativa mais simples e utilizar a media ponderada do valor modal dos

conjuntos fuzzy dos consequentes. Se 𝑣𝑖 e o valor modal do conjunto 𝐶𝑖, entao o valor 𝑧

produzido pela entrada e:

𝑧 =∑𝑛

𝑖=1(𝑚𝑖 ∧ 𝑛𝑖)𝑣𝑖∑𝑛𝑖=1(𝑚𝑖 ∧ 𝑛𝑖)

(3.17)

com 𝑚𝑖 = 𝐴𝑖(𝑥0) e 𝑛𝑖 = 𝐵𝑖(𝑥0). O processo de inferencia fuzzy sugere diferentes formas

de construir sistemas baseados em regras de controle, dependendo da escolha das normas

triangulares e da semantica das regras contidas na base.

3.1.2 Modelo funcional fuzzy

Entre os modelos fuzzy existentes, o Takagi-Sugeno e particularmente importante

em modelagem e controle. Proposto em (TAKAGI; SUGENO, 1985), o modelo funcional

mostrou ser adequado para aplicacoes a projetos de sistemas dinamicos nao lineares devido

a forma e sua estrutura.

Esse modelo e formado por regras cujos antecedentes sao conjuntos fuzzy e os

consequentes sao funcoes, em geral de natureza local:

𝑅𝑖 : Se 𝑋 e 𝐴𝑖 e 𝑌 e 𝐵𝑖 Entao 𝑧 = 𝑓𝑖(𝑥,𝑦), com 𝑖 = 1, . . . , 𝑛. (3.18)

em que 𝑋, 𝑌 sao variaveis linguısticas com valores 𝐴𝑖 e 𝐵𝑖 que sao conjuntos fuzzy nos

universos de discurso X e Y cujas variaveis de base sao 𝑥 e 𝑦, e 𝑓𝑖(𝑥,𝑦) e uma funcao.

Polinomios sao exemplos de funcoes que descrevem os consequentes deste tipo de regra;

a ordem do polinomio indica a ordem do modelo. Por exemplo, quando o consequente e

um numero real, o modelo e de ordem zero. Quando o consequente e um polinomio de

segunda ordem o modelo e chamado de funcional de segunda ordem. (ABONYI, 2002).


A inferencia e feita calculando o grau de ativacao de cada regra e agregando as

saıdas usando a media ponderada. Mais especificamente assumindo que as entradas sao

os pontos 𝑥 e 𝑦 o grau de ativacao da regra 𝑅𝑖 e calculada conforme:

𝜆𝑖(𝑥,𝑦) = 𝐴𝑖(𝑥)𝑡𝐵𝑖(𝑦) (3.19)

resultando em:

𝑧 =∑𝑛

𝑖=1 𝜆𝑖(𝑥,𝑦)𝑓𝑖(𝑥,𝑦)∑𝑛𝑖=1 𝜆𝑖(𝑥,𝑦) (3.20)

em que 𝑧 e a saıda do modelo e 𝑡 e uma norma triangular (PEDRYCZ; GOMIDE, 2007).

Fazendo:

𝑤𝑖(𝑥,𝑦) = 𝜆𝑖(𝑥,𝑦)∑𝑛𝑖=1 𝜆𝑖(𝑥,𝑦) (3.21)

Podemos reescrever (3.20) como:

𝑧 =𝑛∑

𝑖=1𝑤𝑖(𝑥,𝑦)𝑓𝑖(𝑥,𝑦), 𝑖 = 1, . . . ,𝑛 (3.22)

As caracterısticas de entrada e saıda dos modelos fuzzy baseados em regras sao

afetadas pela escolha das funcoes de pertinencia e das funcoes 𝑓𝑖(𝑥,𝑦) o mapeamento

entrada-saıda em geral resulta em uma funcao nao linear.

3.2 Fuzzy Model Reference Learning Control

Um dos primeiros modelos adaptativos e o Fuzzy Model Reference Learning Control

– (FMRLC) (PASSINO; YURKOVICH, 1997). O ajuste da sua estrutura usa um meca-

nismo de aprendizagem e de uma base de regras. O FMRLC e uma extensao do controle

fuzzy auto-organizavel, desenvolvido por (PROCYK; MAMDANI, 1979), e e um tipo de

Model Reference Learning Control – (MRAC), em que o controlador aprende a relacionar

as entradas com as saıdas por meio de uma base de regras fuzzy e um mecanismo de

aprendizagem.


O controlador FMRLC, Figura 3.2, utiliza um mecanismo de aprendizagem que:

∙ recebe as medicoes da saıda do processo;

∙ caracteriza o desempenho atual do controlador;

∙ ajusta o controlador fuzzy para atender o objetivo de projeto;

O objetivo a ser atendido e especificado pelo modelo de referencia. Analogamente

ao MRAC convencional o FMRLC e ajustado para que o sistema em malha fechada atue

da forma especificada pelo modelo de referencia, isto e, aproxima a saıda 𝑦(𝑘) a referencia

𝑦𝑟(𝑘).

∑

Controlador fuzzy

Base de conhecimento

Conjuntosfuzzy

Base deregras

Inferenciafuzzy

ge

gd

gu

Processoe(k)

1−z−1

T

de(k)

u(k)

Mecanismo de aprendizagem

Modelo inverso fuzzy

Base de conhecimento

Conjuntosfuzzy

Base deregras

Inferenciafuzzy

gye

gyd

gp

Modificador base de conhecimento

Armazenamentop(k)

r(k)

+ y(k)

∑

−

−ye(k)

1−z−1

Tyd(k)

Modelode

referencia

+

ym(k)

Figura 3.2 – Topologia FMRLC.

A Figura 3.2 tem 4 partes principais: o processo, o controlador fuzzy, o modelo de

referencia e o mecanismo de aprendizagem. Cada uma destas partes e descrita a seguir.


3.2.1 Controlador fuzzy

Considerado um processo com 𝑟 entradas e 𝑠 saıdas – as entradas do controla-

dor sao o erro 𝑒(𝑘) = [𝑒1(𝑘), . . . ,𝑒𝑠(𝑘)] e a variacao do erro 𝑑𝑒(𝑘) = [𝑑𝑒1(𝑘), . . . ,𝑑𝑒𝑠(𝑘)],

respectivamente, com 𝑦𝑟(𝑘) = [𝑦𝑟1(𝑘), . . . ,𝑦𝑟𝑠(𝑘)] sendo o vetor de referencia e 𝑦(𝑘) =

[𝑦1(𝑘), . . . ,𝑦𝑠(𝑘)] a saıda do processo, 𝑡 = 𝑘𝑇 onde 𝑘 e a 𝑘−esima amostra e 𝑇 e o perıodo

de amostragem. O erro e a variacao no erro sao calculados conforme:

𝑒(𝑘) = 𝑦𝑟(𝑘) − 𝑦(𝑘) (3.23)

e

𝑑𝑒(𝑘) = 𝑒(𝑘) − 𝑒(𝑘 − 1)𝑇

(3.24)

Frequentemente, para maior flexibilidade na implementacao do controlador fuzzy,

os universos de discurso sao normalizados no intervalo [−1, + 1]. Os ganhos 𝑔𝑒, 𝑔𝑑 e

𝑔𝑢 normalizam o erro 𝑒(𝑘), a variacao do erro 𝑑𝑒(𝑘) e saıda do controlador (entrada do

processo) 𝑢(𝑘), respectivamente.

A base de conhecimento do controlador fuzzy contem regras de controle fuzzy na

forma:

Se 𝑒1 e ��11 e . . . e 𝑒𝑠 e ��𝑗

𝑠 e 𝑑𝑒1 e ��11 e . . . e 𝑑𝑒𝑠 e ��𝑚

𝑠 Entao ��𝑛 e ��1,...,𝑗;1,...,𝑚𝑛 ,

com 𝑛 = 1, . . . , 𝑟.(3.25)

em que 𝑒𝑠 e 𝑑𝑒𝑠 sao as variaveis linguısticas associadas as entradas 𝑒(𝑘) e 𝑑𝑒(𝑘) e ��𝑛

e a variavel linguıstica associada a saıda do controlador 𝑢(𝑘), ��𝑗𝑠 e ��𝑚

𝑠 sao os valores

linguısticos associados a 𝑒𝑠 e 𝑑𝑒𝑠, respectivamente e ��1,...,𝑗;1,...,𝑚𝑛 e o valor linguıstico do

consequente associado a ��𝑛. A regra em (3.25) e interpretada como:

𝑅1,...,𝑗;1,...,𝑚𝑛 = (��1

1 × . . .× ��𝑗𝑠) × (��1

1 × . . .× ��𝑚𝑠 ) × 𝑈1,...,𝑗;1,...,𝑚

𝑛(3.26)


A regra da composicao (3.8) fornece a saıda do controlador.

��1,...,𝑗;1,...,𝑚𝑛 (𝑘) = ((��1(𝑘) × ��2(𝑘) × . . .× ��𝑠(𝑘))×

(��1(𝑘) × ��2(𝑘) × . . .× ��𝑠(𝑘))) ∘𝑅1,...,𝑗;1,...,𝑚𝑛

(3.27)

em que ��𝑠(𝑘) e ��𝑠(𝑘) sao valores do erro e da variacao do erro fornecidos ao controlador,

respectivamente, e, ��1,...,𝑗;1,...,𝑚𝑛 (𝑘) e o conjunto fuzzy resultante e (∘) e a composicao

sup − min que existe para todas as combinacoes de conjuntos que descrevem a entrada

para o sistema, portanto, o controlador fuzzy determina a acao de controle usando o centro

de gravidade, conforme (3.20).

3.2.2 Modelo de referencia

O modelo de referencia especifica o comportamento e, consequentemente, o desem-

penho desejado do processo. Em geral o modelo de referencia trata-se de um modelo

linear. O desempenho do sistema e calculado em relacao ao modelo de referencia e pelo

sinal de erro 𝑦𝑒(𝑘) = [𝑦𝑒1 , . . . , 𝑦𝑒𝑠 ]:

𝑦𝑒(𝑘) = 𝑦𝑚(𝑘) − 𝑦(𝑘) (3.28)

em que 𝑦𝑚(𝑘) e a saıda do modelo de referencia e 𝑦(𝑘) e a saıda do processo. Implici-

tamente, o modelo de referencia caracteriza o desempenho, em termos da estabilidade,

tempo de subida, sobre elevacao e tempo de acomodacao. A entrada do modelo de referen-

cia e 𝑟(𝑘). Se 𝑦𝑒(𝑘) ≈ 0, entao o mecanismo de aprendizagem nao ira fazer modificacoes

significativas no controlador. Por outro lado se 𝑦𝑒(𝑘) e grande, entao o mecanismo de

aprendizagem ajusta o controlador fuzzy.

3.2.3 Mecanismo de aprendizagem

O mecanismo de aprendizagem ajusta a base de regras do controlador fuzzy para

que a malha de controle comporte-se conforme o especificado pelo modelo de referencia. As

modificacoes sao feitas pela observacao da saıda do processo, do modelo de referencia e do

controlador fuzzy. O mecanismo de aprendizagem e composto de duas partes: um modelo

inverso e um modificador da base de conhecimento. O modelo inverso e um mapeamento


de 𝑦𝑒(𝑘), em mudanca na entrada do processo 𝑝(𝑘) que forcam 𝑦𝑒(𝑘) aproximadamente 0.

O modificador da base de conhecimento transforma a base de regras do controlador para

efetivar as mudancas na entrada do processo.

O modelo inverso caracteriza a mudanca na entrada do processo, tornando a saıda

𝑦(𝑘) proxima a 𝑦𝑚(𝑘), isto e, fazendo 𝑦𝑒(𝑘) ser bem pequeno. Observando a Figura 3.2, o

modelo inverso possui fatores de escala 𝑔𝑦𝑒 , 𝑔𝑦𝑑, 𝑔𝑝 para normalizar suas entradas. A base

de conhecimento do modelo fuzzy inverso e formada por regras na forma:

Se 𝑌 1𝑒1 e . . . e 𝑌 𝑠

𝑒𝑠e 𝑌 1

𝑑1 e . . . e 𝑌 𝑚𝑑𝑚

Entao 𝑃 1,...,𝑗;1,...,𝑚𝑛

com 𝑌 𝑠𝑒𝑠

e 𝑌 𝑚𝑑𝑚

definidos por conjuntos fuzzy associados ao erro 𝑦𝑒𝑠 e a variacao no erro

𝑦𝑑𝑠 , 𝑃 1,...,𝑗;1,...,𝑚𝑛 sao os conjuntos fuzzy dos consequentes das regras do modelo inverso. O

modelo inverso e interpretado pela relacao:

𝑆1,...,𝑗;1,...,𝑚𝑛 = (𝑌 1

𝑒1 × · · · × 𝑌 𝑠𝑒𝑠

) × (𝑌 1𝑑1 × · · · × 𝑌 𝑚

𝑑𝑚) × 𝑃 1,...,𝑗;1,...,𝑚

𝑛(3.29)

O mecanismo de inferencia e a regra de composicao:

𝑃 1,...,𝑗;1,...,𝑚𝑛 (𝑘) = ((𝑌𝑒1(𝑘) × 𝑌𝑒2(𝑘) × · · · × 𝑌𝑒𝑠(𝑘))

×(𝑌𝑑1(𝑘) × 𝑌𝑑2(𝑘) × · · · × 𝑌𝑑𝑠(𝑘))) ∘ 𝑆1,...,𝑗;1,...,𝑚𝑛

(3.30)

em que 𝑌𝑒𝑠(𝑘) e 𝑌𝑑𝑠(𝑘) sao os conjuntos fuzzy correspondentes ao erro e variacao do erro,

respectivamente. 𝑃 1,...,𝑗;1,...,𝑚𝑛 (𝑘) e o conjunto fuzzy da saıda do modelo inverso. A saıda

do modelo inverso e determinado pelo metodo do COG.

Uma base de regras pode ser representada como uma matriz, no modelo fuzzy

inverso, com 𝑌 𝑗𝑒 e 𝑌 𝑚

𝑑 sendo os conjuntos fuzzy associados a 𝑦𝑒(𝑘) e 𝑦𝑑(𝑘), respectivamente,

e 𝑃 𝑗,𝑚𝑖 os conjuntos fuzzy que quantificam a mudanca da entrada desejada 𝑝𝑖(𝑘). A Tabela

3.1 lista os centros dos valores das funcoes pertinencias convexas simetricas, e normalizados

no universo [−1,+ 1] de 𝑌 𝑗𝑒 , 𝑌 𝑚

𝑑 e 𝑃 𝑗,𝑚𝑖

Segundo (LAYNE; PASSINO, 1993), os ganhos do controlador fuzzy, mostrados na

Figura 3.2, podem ser escolhidos de acordo com o seguinte procedimento:


Tabela 3.1 – Base de regras do modelo fuzzy inverso.

𝑌 𝑗,𝑚𝑓

𝑌 𝑗𝑒

-5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5

𝑌 𝑚𝑑

-5 -1.0 -1.0 -1.0 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0-4 -1.0 -1.0 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2-3 -1.0 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4-2 -1.0 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6-1 -1.0 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.80 -1.0 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0+1 -0.8 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0+2 -0.6 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0+3 -0.4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0 +1.0+4 -0.2 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0 +1.0 +1.0+5 0.0 +0.2 +0.4 +0.6 +0.8 +1.0 +1.0 +1.0 +1.0 +1.0 +1.0

1. Selecionar os ganhos 𝑔𝑒, 𝑔𝑑 e 𝑔𝑢 de modo que 𝑦𝑒(𝑘) nao sature as respectivas funcoes

de pertinencias;

2. Escolher o ganho 𝑔𝑝 para ser o mesmo do ganho 𝑔𝑢 e 𝑔𝑦𝑒 ;

3. Aplicar a entrada de referencia 𝑟(𝑘);

4. Observar a resposta do processo e do modelo de referencia:

∙ Se existir oscilacao inaceitavel na resposta de saıda do processo sobre a resposta

do modelo de referencia, entao aumentar 𝑔𝑦𝑒 . Retorne ao passo 2;

∙ Se a saıda do processo nao mantem a resposta do processo proxima a resposta

do modelo de referencia, entao diminuir 𝑔𝑦𝑒 . Retorne ao passo 3;

∙ Se a resposta do processo e aceitavel com relacao a resposta do modelo de

referencia entao o projeto do controlador esta completo.

De acordo com (KWONG; PASSINO, 1996), o modificador da base de conheci-

mento altera o controlador fuzzy para que a acao de controle aplicada torne-se um valor

aproximado a 𝑝(𝑘), selecionado pelo modelo fuzzy inverso. O modificador da base de co-

nhecimentos altera a base de regras do controlador fuzzy considerando a acao de controle

𝑢(𝑘 − 1) calculada no passo anterior e assumindo que sua contribuicao atual determina o

desempenho do sistema no proximo passo.

Assumindo funcoes de pertinencias de saıda simetricas e que 𝑏𝑚 e definido como

o centro de ��𝑚, o modificador da base de conhecimento atua deslocando os centros das

funcoes de pertinencias com 𝑏𝑚. Assim o modificador da base de conhecimentos atua

seguindo os passos:


1. Encontrar todas as regras no controlador fuzzy cujo grau de ativacao seja

𝜇𝑖(𝑒(𝑘 − 1),𝑑𝑒(𝑘 − 1)) > 0

2. Considerar 𝑏𝑚(𝑘) os centros das 𝑚 regras ativas no passo 𝑘. Para todas as regras

ativas fazer:

𝑏𝑚(𝑘) = 𝑏𝑚(𝑘 − 1) + 𝑝(𝑘)

para modificar os centros das funcoes de pertinencias ativas.

3.3 Indirect Adaptive Fuzzy Control

Essa Secao resume o Indirect Adaptive Fuzzy Control (IAFC), baseado em meto-

dos de identificacao e estimacao dos parametros dos consequentes de regras de controle

funcionais (PASSINO; YURKOVICH, 1997).

O IAFC e um tipo de compensador distribuıdo paralelo cujo controlador e definido

por um modelo do processo na forma de regras do tipo Takagi-Sugeno. A ideia e obter

um compensador distribuıdo paralelo assintoticamente estavel.

3.3.1 Metodo de identificacao e estimacao

A literatura destaca dois metodos de estimacao e identificacao, quadrados mınimos

recursivos ou em batelada. Esta dissertacao aborda apenas os metodos dos quadrados

mınimos para estimar os parametros dos consequentes das regras fuzzy.

Quadrados mınimos

De acordo com (PASSINO; YURKOVICH, 1997), dado um conjunto de treina-

mento 𝐺, que relaciona as entradas e as saıdas desejadas, de um sistema linear, estima-se

seus parametros minimizando a soma dos quadrados das diferencas entre o valor estimado


e o valor observado. Se 𝑢(𝑡) e 𝑦(𝑡) sao as entradas e as saıdas, respectivamente, em 𝑡,

entao o modelo linear e da forma:

𝑦(𝑡) =𝑞∑

𝑖=1𝜃𝑎𝑖𝑦(𝑡− 𝑖) +

𝑝∑𝑖=0

𝜃𝑏𝑖𝑢(𝑡− 𝑖) (3.31)

fazendo 𝑥(𝑡) = [𝑦(𝑡− 1), . . . , 𝑦(𝑡− 𝑞),𝑢(𝑡− 1), . . . , 𝑢(𝑡−𝑝)]𝑇 e 𝜃 = [𝜃𝑎1 , . . . ,𝜃𝑎𝑞 , 𝜃𝑏1 , . . . ,𝜃𝑏𝑝 ],

podemos reescrever (3.31) como 𝑦(𝑡) = 𝑓(𝑥,𝜃) = 𝜃𝑇𝑥(𝑡). Reescrevendo o sistema de

identificacao para o ajuste de 𝜃 e utilizando a informacao em 𝐺, pode se escolher 𝑓(𝑥,𝜃) ≈

𝑔(𝑥) para todo 𝑥 ∈ 𝑋. Para 𝑥𝑖 = 𝑥(𝑖), 𝑦𝑖 = 𝑦(𝑖) e 𝐺 = {(𝑥𝑖,𝑦𝑖) : 𝑖 = 1, . . . ,𝑀}. O

algoritmo dos quadrados mınimos pode ser formulado na forma batelada – Batch Least

Squares – (BLS) ou recursivo Recursive Least Squares – (RLS). Na forma batelada, um

vetor 𝑌 (𝑀) = [𝑦1, 𝑦2, . . . , 𝑦𝑀 ]𝑇 de dimensao 1 × 𝑀 e construıdo com os dados de saıda,

𝑦𝑖 de 𝐺. Constroi-se tambem a matriz:

Φ(𝑀) =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎣

(𝑥1)𝑇

(𝑥2)𝑇

...

(𝑥𝑀)𝑇

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎦

de dimensoes 𝑀 ×𝑁 , que consiste de vetores 𝑥𝑖 de 𝐺 empilhados. O erro de aproximacao

para (𝑥𝑖, 𝑦𝑖) ∈ 𝐺 e calculado como 𝜖𝑖 = 𝑦𝑖 − (𝑥𝑖)𝑇 𝜃. O vetor 𝐸(𝑀) = [𝜖1, 𝜖2, . . . 𝜖𝑀 ]𝑇

e a matriz erro sao 𝐸 = 𝑌 − Φ𝜃. Escolhendo 𝑉 (𝜃) = 12𝐸

𝑇𝐸 como sendo a medida do

quao boa e a aproximacao deseja-se escolher um 𝜃 que minimize 𝑉 (𝜃). A funcao 𝑉 (𝜃) e

convexa em 𝜃 e tem um mınimo local que e o mınimo global.

Derivando 𝑉 em relacao 𝜃 e igualando a zero obtem-se o valor 𝜃 que minimiza 𝑉 (𝜃).

Outra abordagem e notar que:

2𝑉 = 𝐸𝑇𝐸 = 𝑌 𝑇𝑌 − 𝑌 𝑇 Φ𝜃 − 𝜃𝑇 Φ𝑇𝑌 + 𝜃𝑇 Φ𝑇 Φ𝜃 (3.32)


Entao completando o quadrado, assumindo que Φ𝑇 Φ e inversıvel:

2𝑉 = 𝐸𝑇𝐸 = 𝑌 𝑇𝑌 − 𝑌 𝑇 Φ𝜃 − 𝜃𝑇 Φ𝑇𝑌 + 𝜃𝑇 Φ𝑇 Φ𝜃 + 𝑌 𝑇 Φ(Φ𝑇 Φ)−1Φ𝑇𝑌 − 𝑌 𝑇 Φ(Φ𝑇 Φ)−1Φ𝑇𝑌

(3.33)

E apos algumas operacoes algebricas obtem-se:

2𝑉 = 𝑌 𝑇 (𝐼 − Φ(Φ𝑇 Φ)−1Φ𝑇 )𝑌 + (𝜃 − (Φ𝑇 Φ)−1Φ𝑇𝑌 )𝑇 Φ(𝜃 − (Φ𝑇 Φ)−1Φ𝑇𝑌 ) (3.34)

Como o primeiro termo de (3.34) e independente de 𝜃, o menor valor de 𝑉 e obtido

escolhendo 𝜃 para que o segundo termo seja zero, isto e:

𝜃 = (Φ𝑇 Φ)−1Φ𝑇𝑌 (3.35)

A expressao (3.35) estima os valores de 𝜃 diretamente dos dados em 𝐺. As entradas

devem ter uma grande variedade de componentes frequenciais para que Φ𝑇 Φ seja invertıvel

(LJUNG, 1999). O metodo dos quadrados mınimos ponderados visa minimizar (3.36).

𝑉 (𝜃) = 12𝐸

𝑇𝑊𝐸 (3.36)

em que 𝑊 e uma matriz diagonal 𝑀 × 𝑀 com 𝑤𝑖 > 0 para 𝑖 = 1, . . . ,𝑀 , que modula a

importancia de certos elementos em 𝐺. O resultado da estimacao da versao ponderada

dos quadrados mınimos e calculada usando a expressao:

𝜃 = (Φ𝑇𝑊Φ)−1Φ𝑇𝑊𝑌 (3.37)

O metodo dos quadrados mınimos recursivos (RLS) usa uma matriz de covariancia

𝑃 (𝑘) de dimensao 𝑁 ×𝑁 .

𝑃 (𝑘) = (Φ𝑇 Φ)−1 =(

𝑡∑𝑖=1

𝑥𝑖(𝑥𝑖)𝑇

)−1(3.38)


Se 𝜃(𝑘−1) e a melhor estimativa feita em 𝑘−1 e assumindo que Φ𝑇 Φ e nao singular

para todo 𝑘, entao tem-se que 𝑃−1(𝑘) = (Φ𝑇 Φ) =(

𝑘∑𝑖=1


)e desmembrando o ultimo

termo do somatorio:

𝑃−1(𝑘) =𝑘−1∑𝑖=1

𝑥𝑖(𝑥𝑖)𝑇 + 𝑥𝑘(𝑥𝑘)𝑇

𝑃−1(𝑘) = 𝑃−1(𝑘 − 1) + 𝑥𝑘(𝑥𝑘)𝑇

(3.39)

Utilizando (3.35) deduz-se que:

𝜃(𝑘) = (Φ𝑇 Φ)−1Φ𝑇𝑌

𝜃(𝑘) =(

𝑘∑𝑖=1


)−1 (𝑘∑

𝑖=1𝑥𝑖𝑦𝑖

)

𝜃(𝑘) = 𝑃 (𝑘)(

𝑘−1∑𝑖=1

𝑥𝑖𝑦𝑖 + 𝑥𝑘𝑦𝑘

)(3.40a)

Consequentemente,

𝜃(𝑘 − 1) = 𝑃 (𝑘 − 1)𝑘−1∑𝑖=1

𝑥𝑖𝑦𝑖 (3.41)

𝑃−1(𝑘 − 1)𝜃(𝑘 − 1) =𝑘−1∑𝑖=1

𝑥𝑖𝑦𝑖 (3.42)

Reescrevendo 𝑃−1(𝑘 − 1) usando (3.40a), obtem-se:

(𝑃−1(𝑘) − 𝑥𝑘(𝑥𝑘)𝑇 )𝜃(𝑘 − 1) =𝑘−1∑𝑖=1

𝑥𝑖𝑦𝑖

Assim, a estimativa de 𝜃(𝑘) no passo 𝑘 e:

𝜃(𝑘) = 𝜃(𝑘 − 1) + 𝑃 (𝑘)𝑥𝑘(𝑦𝑘 − (𝑥𝑘)𝑇 𝜃(𝑘 − 1)) (3.43)

com

𝑃 (𝑘) = 𝑃 (𝑘 − 1) − 𝑃 (𝑘 − 1)𝑥𝑘(𝐼 + (𝑥𝑘)𝑇𝑃 (𝑘 − 1)𝑥𝑘)−1(𝑥𝑘)𝑇𝑃 (𝑘 − 1) (3.44)


A estimacao dos parametros torna-se:

𝜃(𝑘) = 𝜃(𝑘 − 1) + 𝑃 (𝑘)𝑥𝑘(𝑦𝑘 − (𝑥𝑘)𝑇 )𝑇 (𝑥𝑘)𝑇 𝜃(𝑘 − 1) (3.45)

Inicializa-se o algoritmo RLS com 𝜃 = 0, 𝑃 (0) = 𝑃0 considerando 𝑃0 = 𝛼𝐼 e

fazendo 𝛼 > 0 suficientemente grande e 𝐼 e a matriz identidade de ordem 𝑀 . A versao

ponderada do RLS considera um fator de esquecimento 𝛿, 0 < 𝛿 ≤ 1, para que as medidas

muito antigas nao ponderem demais na determinacao dos parametros atuais:

𝑃 (𝑘) = 1𝛿(𝐼 − 𝑃 (𝑘 − 1)𝑥𝑘(𝛿𝐼 + (𝑥𝑘)𝑇𝑃 (𝑘 − 1)𝑥𝑘)−1(𝑥𝑘)𝑇𝑃 (𝑘 − 1) (3.46)

𝜃(𝑘) = 𝜃(𝑘 − 1) + 𝑃 (𝑘)𝑥𝑘(𝑦𝑘 − (𝑥𝑘)𝑇 𝜃(𝑘 − 1)) (3.47)

Se 𝛿 = 1 entao tem-se o RLS padrao. Na sequencia o RLS com fator de esqueci-

mento sera utilizado para estimar e identificar os parametros nos consequentes das regras

fuzzy funcionais do tipo Takagi-Sugeno.

3.3.2 Compensador adaptativo distribuıdo paralelo

O controlador adaptativo indireto fuzzy usa regras de controle do tipo Takagi-

Sugeno. O controlador e construıdo para prover assintoticamente um ponto de equilıbrio

para o sistema em malha fechada. Considerando serem conhecidas as saıdas da planta,

um metodo de identificacao pode ser usado para ajuste dos parametros do modelo de

processo. Supondo-se que o modelo do processo e especificado por 𝑅 regras:

Se 𝑦(𝑘) e 𝐴𝑗1 e · · · e 𝑦(𝑘 − 𝑛+ 1) e 𝐴𝑙

𝑛 Entao

𝑦𝑖(𝑘 + 1) = 𝛼𝑖,1𝑦(𝑘) + · · · + 𝛼𝑖,𝑛𝑦(𝑘 − 𝑛+ 1) + 𝛽𝑖,1𝑢(𝑘) + . . .+ 𝛽𝑖,𝑚𝑢(𝑘 −𝑚+ 1)

em que 𝑦(𝑘) e a saıda e 𝑢(𝑘) e o sinal de entrada do processo, respectivamente, em 𝑘.

𝐴𝑖𝑛 sao os conjuntos fuzzy associados a saıda do processo. 𝛼𝑖,𝑗 e 𝛽𝑖,𝑝, com 𝑖 = 1, 2, . . . , 𝑅,

𝑗 = 1, 2, . . . , 𝑛 e 𝑝 = 1, 2, . . . ,𝑚, sao parametros dos consequentes das regras e 𝑦𝑖(𝑘 + 1)

e a saıda correspondente a 𝑖−esima regra. Os parametros 𝛼𝑖,𝑗 e 𝛽𝑖,𝑝 sao ajustados pelo


metodo dos quadrados mınimos recursivos. Se 𝜇𝑖 e o grau de ativacao da 𝑖−esima regra,

entao a saıda do modelo de sistema e dada por:

𝑦(𝑘 + 1) =∑𝑅

𝑖=1 𝑦𝑖(𝑘+1)𝜇𝑖∑𝑅

𝑖=1 𝜇𝑖=

𝑅∑𝑖=1𝜉𝑖𝑦𝑖(𝑘 + 1) (3.48)

Fazendo,

𝜉𝑖 = 𝜇𝑖∑𝑅

𝑖=1 𝜇𝑖(3.49)

e definido 𝜉 e 𝜃 como

𝜉 =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

𝑦(𝑘)𝜉1

𝑦(𝑘)𝜉2...

𝑦(𝑘)𝜉𝑅

...

𝑢(𝑘 −𝑚+ 1)𝜉1

𝑢(𝑘 −𝑚+ 1)𝜉2...

𝑢(𝑘 −𝑚+ 1)𝜉𝑅

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

, 𝜃 =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

𝛼1,1

𝛼2,1...

𝛼𝑅,1...

𝛽1,𝑚

...

𝛽𝑅,𝑚

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

(3.50)

Obtem-se:

𝑦(𝑘 + 1) = 𝜃𝑇 𝜉 (3.51)

Para o controlador sao utilizadas regras funcionais da forma:

Se 𝑦(𝑘) e 𝐴𝑗𝑖 e · · · e 𝑦(𝑘 − 𝑛+ 1) e 𝐴𝑛

𝑖 Entao 𝑢𝑖(𝑘) = 𝐿𝑖(·)

Onde 𝐿𝑖(·) e uma funcao linear cujos argumentos podem depender de valores da

entrada e da saıda do processo em passos anteriores, dos valores de referencia e 𝑢𝑖(𝑘),


a saıda do controlador corresponde a 𝑖−esima regra. Uma escolha comum e utilizar a

funcao 𝐿𝑖(·):

𝐿𝑖(𝑦𝑟(𝑘),𝑦(𝑘)) = 𝑘𝑖,0𝑦𝑟(𝑘) − 𝑘𝑖,1𝑦(𝑘) (3.52)

e

𝑘𝑖,1 = 𝛼𝑖,1 − 0.1𝛽𝑖,1

e 𝑘𝑖,0 = 1 − 𝛼𝑖,1 + 𝛽𝑖,1𝑘𝑖,1

𝛽𝑖,1(3.53)

A funcao (3.52) e um controlador proporcional com ganhos 𝑘𝑖,0 e 𝑘𝑖,1, calculados

por (3.53), 𝑦𝑟(𝑘) o sinal de referencia, e os parametros 𝛼𝑖 e 𝛽𝑖 sao ajustados pelo metodo

dos quadrados mınimos recursivos de cada regra.

3.4 Resumo

Este Capıtulo apresentou uma revisao dos conceitos de controle adaptativo fuzzy,

suas caracterısticas principais, formas de ajuste dos parametros de controle e operacao.

Tambem foram discutidos os principais conceitos relacionados a implementacao de con-

troladores adaptativos que permitem fornecer robustez aos sistemas de controle por reali-

mentacao. No proximo Capıtulo estes conceitos serao utilizados para desenvolver contro-

ladores adaptativos utilizando metodos de aprendizagem participativa evolutiva fuzzy.

52

4 Controle granular evolutivo

Este Capıtulo trata o problema de fornecer robustez a sistemas de controle lineari-

zados por realimentacao quando existem parametros variantes ou incertos e seus efeitos no

desempenho dos sistemas de controles nao lineares. Os conceitos de linearizacao por rea-

limentacao CFL e de controle adaptativo evolutivo fuzzy sao utilizados para desenvolver

solucoes que visam cancelar os efeitos da variacao/incerteza de parametros.

Alem da formulacao do problema e a metodologia para estimar os valores que

cancelam os efeitos da incerteza compara-se esta metodologia frente aos metodos FMRLC,

IAFC utilizando um modelo nao linear de tanque.

4.1 Aprendizagem participativa evolutiva

Modelos evolutivos possuem a capacidade de aprender sua estrutura e parametros

de acordo com um fluxo de dados. Modelos evolutivos fuzzy sao equipados com algoritmos

incrementais que constroem a base de regras e estimam os parametros dos antecedentes

e consequentes (LEITE et al., 2015). Um destes modelos e o Evolving Participatory

Learning – (ePL), proposto em (LIMA et al., 2006). O ePL utiliza regras funcionais na

forma:

Se 𝑥1(𝑘) e 𝐴𝑖1 e · · · e 𝑥𝑝(𝑘) e 𝐴𝑝

1 Entao 𝑦𝑖(𝑘) = 𝑓𝑖(𝑥(𝑘))

em que 𝑥(𝑘) = [𝑥1(𝑘), . . . ,𝑥𝑝(𝑘)]𝑇 . O ePL, Figura 4.1, baseia-se no agrupamento par-

ticipativo de dados cuja estrutura e adaptada sempre que um novo dado de entrada e

recebido. No ePL a cada grupo corresponde uma regra funcional. Os grupos em 𝑘 sao

representados pelos centros 𝑣(𝑘) = [𝑣1(1), . . . , 𝑣𝑝(𝑘)]𝑇 . O algoritmo utiliza os parametros:

taxa de aprendizagem 𝜙 ∈ [0,1], ındice de alerta 𝜂 ∈ [0,1], grau de compatibilidade 𝜆 ∈

[0,1], limiar do ındice de alerta 𝜏 ∈ [0,1] e funcoes de pertinencia Gaussianas com pa-

rametro 𝑟, escolhidos conforme criterio sugerido em (LIMA et al., 2006), ou seja, com

𝜏 ≤ 𝜂(1 − 𝜆), 𝜂 = 𝜏 e 𝜆 = 1−𝜏2 .

Capıtulo 4. Controle granular evolutivo 53

processode

aprendizagem

mecanismode

alerta

x(k)

ρ(k) a(k)

v(k + 1)

Figura 4.1 – Modelo de aprendizagem participativa evolutiva.

Por causa de sua natureza nao supervisionada e auto adaptativa, em cada iteracao

o ePL pode criar novos grupos, atualizar os grupos ja existentes, ou eliminar grupos

redundantes. A Figura 4.1 resume o modelo de aprendizagem participativa evolutiva

(LIMA et al., 2006), (LEITE et al., 2015). Dado o valor do parametro 𝜏 , uma regra e

criada caso 𝑎𝑖(𝑘) > 𝜏 para todos os grupos existentes no passo 𝑘, caso contrario, a regra

que possui o maior ındice de compatibilidade tem seu centro atualizado utilizando:

𝑣𝑖(𝑘 + 1) = 𝑣𝑖(𝑘) +𝐺𝑖(𝑘)(𝑥(𝑘) − 𝑣𝑖) (4.1)

Com o termo 𝐺𝑖(𝑘) ∈ [0,1] calculado por:

𝐺𝑖(𝑘) = 𝜙𝜌𝑖(𝑘) (4.2)

e

𝜌𝑖(𝑘) = 1 − ‖𝑥(𝑘)−𝑣𝑖(𝑘)‖𝑛

(4.3)

O maior ındice de compatibilidade e tal que:

𝑖 = argmax𝑗

{𝜌𝑗(𝑘)} (4.4)


O 𝑖−esimo centro do grupo e uma combinacao convexa da nova amostra 𝑥(𝑘) e do

grupo mais proximo. O ındice de alerta 𝑎𝑖(𝑘) e atualizado usando:

𝑎𝑖(𝑘 + 1) = 𝑎𝑖(𝑘) + 𝜂(1 − 𝜌𝑖(𝑘 + 1) − 𝑎𝑖(𝑘)) (4.5)

O valor de 𝜂 controla a taxa de atualizacao do ındice de alerta, quanto mais proximo

𝜂 for de 1, maior a sensibilidade do sistema em relacao a mudanca na compatibilidade.

Por este motivo, os centros do grupo 𝑣𝑖(𝑘) sao modificados na direcao da nova amostra

observada 𝑥(𝑘) sendo que o tamanho da modificacao depende do ındice de alerta e do

ındice de compatibilidade 𝜌(𝑘). O ePL considera o mecanismo de alerta incorporando o

ındice de alerta na compatibilidade, isto e, fazendo:

𝐺𝑖(𝑘) = 𝜙(𝜌𝑖(𝑘))1−𝑎𝑖(𝑘) (4.6)

O ePL possui um mecanismo que calcula a compatibilidade entre os centros para

evitar a criacao de regras redundantes. O calculo da compatibilidade entre os centros dos

grupos e feita de forma similar ao calculo do ındice de compatibilidade entre o centro e

um dado, ou seja, por:

𝜌𝑣𝑖(𝑘) = 1 −𝑝∑

𝑗=1|𝑣𝑖(𝑘) − 𝑣𝑗(𝑘)| (4.7)

Serao substituıdas por uma unica as regras que apresentarem grau de compatibili-

dade maior ou igual que o limiar 𝜆 ∈ [0,1], ou seja, se 𝜌𝑣𝑖(𝑘) ≥ 𝜆 for satisfeita a 𝑖−esima

regra e redundante. Os grupos redundantes sao substituıdos por um novo grupo, com cen-

tro que e a combinacao linear entre os centros redundantes, ou simplesmente mantendo

um grupo e excluindo o outro.

Apos o processo de agrupamento, as funcoes de pertinencia Gaussianas dos antece-

dentes sao usados para obter o grau de ativacao de cada regra. No ePL, o grau de ativacao

da regra 𝑖 e denotado por 𝜇𝑖, calculado usando:

𝜇𝑖 = 𝑒−𝑟‖𝑥(𝑘)−𝑣𝑖(𝑘)‖2 (4.8)

em que ‖ · ‖ e a norma Euclidiana e 𝑟 um parametro da Gaussiana, 𝑖 = 1, . . . ,𝑐(𝑘). Os


consequentes das regras sao funcoes afim cujos coeficientes sao estimados pelo algoritmo

dos quadrados mınimos recursivo.

No ePL a modificacao ou criacao de uma nova regra implica na alteracao dos

parametros dos respectivos consequentes. A saıda do modelo e calculada usando (3.20),

ou seja:

𝑦(𝑘) =∑𝑐(𝑘)

𝑗=1 𝜇𝑗𝑦𝑗∑𝑐(𝑘)𝑗=1 𝜇𝑗

(4.9)

Algoritmo 4.1 Evolving Participatory Learning

Entrada: dado 𝑥(𝑘) ∈ [0,1], 𝑘 = 1, 2, . . .Saıda: 𝑦(𝑘)

Inicializar os parametros 𝑟, 𝜙, 𝜂, 𝜆, 𝜏Ler dado 𝑥(𝑘)Calcular o ındice de compatibilidade usando (4.3)Calcular o ındice de alerta usando (4.5)se 𝑎𝑖(𝑘) ≥ 𝜏 , ∀ i ∈ {1, . . . , 𝑐(𝑘)} entao𝑥(𝑘) e um novo centro de grupoFazer 𝑣𝑖(𝑐(𝑘) + 1) = 𝑥(𝑘)Fazer 𝑎𝑖(𝑐(𝑘) + 1) = 0

senaoAtualizar 𝑣𝑖(𝑘 + 1) usando (4.1)Atualizar 𝑎𝑖(𝑘 + 1) usando (4.5)

fim seCalcular a compatibilidade entre os centros usando (4.7)se 𝜌𝑣𝑖(𝑘) ≥ 𝜆, ∀ i ∈ {1, . . . , 𝑐(𝑘)} entao

Excluir 𝑣𝑖

Fazer 𝑐(𝑘 + 1) = 𝑐(𝑘) − 1senao

Manter a estrutura de grupofim seAtualizar a Base de RegrasCalcular os parametros dos consequentes das regrasCalcular o grau de ativacao da regra usando (4.8)Calcular a saıda usando (4.9)

Lembrando que 𝑐(𝑘) e o numero de regras no passo 𝑘, 𝑦𝑗 e a saıda da 𝑗−esima

regra. O algoritmo 4.1 resume os passos do ePL (LIMA et al., 2006).

As proximas Secoes propoe uma solucao para o problema de estimacao de incerteza

nos parametros de um sistema de controle SISO nao linear no contexto de linearizacao

por realimentacao.


4.2 Formulacao do problema de controle

O sistema nao linear na forma mostrada pela Equacao (2.1), possui multiplas en-

tradas e multiplas saıdas, pode ser linearizado por realimentacao e transformado para a

forma canonica como em (2.18), desde que sejam satisfeitas algumas condicoes que ga-

rantam que o sistema possa ser linearizado. Como sera mostrado, nem sempre e possıvel

linearizar o modelo, de forma exata, utilizando as tecnicas da Secao 2.3, para tal, nesta e

nas proximas Secoes considere o caso particular, de uma entrada e uma saıda (caso SISO),

do sistema (2.1).

De acordo com (KHALIL, 2002), as nao linearidades podem ser canceladas em

virtude de algumas propriedades estruturais do sistema. Para existir o cancelamento e

necessario que a lei de controle e 𝑢 o termo nao linear 𝛼(𝑥) sempre apareca como uma

soma (𝑢+𝛼(𝑥)) e, para cancelar o termo nao linear 𝛾(𝑥) por divisao, e necessario que na lei

de controle 𝑢 sempre apareca como um produto (𝛾(𝑥)𝑢). Se a matriz 𝛾(𝑥) e nao singular

no domınio de interesse, entao o sistema (2.1) pode ser linearizado por 𝑢 = 𝛽(𝑥)𝑣, onde

𝛽(𝑥) = 𝛾−1(𝑥) e a inversa da matriz 𝛾(𝑥). Considerando que 𝑓(𝑥) = 𝐴𝑥 − 𝐵𝛾(𝑥)𝛼(𝑥) e

𝑔(𝑥) = 𝐵𝛾(𝑥) o sistema (2.1), com apenas uma entrada e uma saıda, torna-se:

�� = 𝐴𝑥+𝐵𝛾(𝑥)(𝑢− 𝛼(𝑥)) (4.10)

em que 𝐴 ∈ R e 𝐵 ∈ R e controlavel, as funcoes 𝛼(𝑥): R → R e 𝛾(𝑥): R → R sao definidas

no domınio D ⊂ R e a matriz 𝛾(𝑥) e nao singular para todo 𝑥 ∈ D.

De acordo com (OLIVEIRA et al., 2017), 𝛾(𝑥) e 𝛼(𝑥) descrevem as nao linearidades

do sistema, e em geral nao sao perfeitamente conhecidas. Elas podem se reescritas como:

𝛾(𝑥) = 𝛾𝑛(𝑥) + Δ𝛾(𝑥) e 𝛼(𝑥) = 𝛼𝑛(𝑥) + Δ𝛼(𝑥) (4.11)

em que 𝛾𝑛(𝑥) e 𝛼𝑛(𝑥) sao os valores nominais das nao linearidades, e Δ𝛾(𝑥) e Δ𝛼(𝑥) sao

as incertezas, ou seja, representam as diferencas do sistema real em relacao ao modelo

nominal usado. Substituindo (4.11) em (4.10) e apos algumas operacoes algebricas, obtem-


se o sistema linear incerto ou modelo linear real, conforme:

�� = 𝐴𝑥+𝐵𝛾𝑛(𝑥)(𝑢(𝑥) − 𝛼𝑛(𝑥)) +𝐵Δ𝛾(𝑥)𝑢(𝑥)

−𝐵 [(𝛾𝑛(𝑥) + Δ𝛾(𝑥))Δ𝛼(𝑥) + Δ𝛾(𝑥)𝛼𝑛(𝑥)](4.12)

Fazendo:

𝑢 = 𝛼𝑛(𝑥) + 𝛾−1𝑛 (𝑥)𝑣 (4.13)

com 𝛽𝑛(𝑥) = 𝛾−1𝑛 (𝑥), e substituindo (4.13) em (4.12) obtemos:

�� = 𝐴𝑧 +𝐵𝑣 +𝐵Δ𝑠

𝑦 = 𝐶𝑧(4.14)

com Δ𝑠 = (𝛾𝑛(𝑥) + Δ𝛾(𝑥))Δ𝛼(𝑥) + Δ𝛾(𝑥)𝛼𝑛(𝑥) descrevendo o erro de modelagem do

sistema produzido pela variacao nos parametros fısicos do sistema de controle, com 𝐴 ∈

R, 𝐵 ∈ R e 𝐶 ∈ R sendo as matrizes canonicas de Brunovsky.

4.3 Linearizacao por realimentacao granular evolutiva robusta fuzzy

A solucao preconizada para desenvolver um controlador evolutivo robusto fuzzy

(gERF) passa pela utilizacao do algoritmo de aprendizagem participativa evolutiva para

que este possa estimar os valores da variacao nos parametros Δ𝛾(𝑥) e Δ𝛼(𝑥) que causam

diferencas entre o comportamento do sistema real e o modelo do sistema. Para isso, a

proposta e utilizar as expressoes (2.22) e (2.23) para obter 𝛼(𝑥) e 𝛽(𝑥) com base no modelo

nominal do sistema. Essas expressoes sao utilizadas para determinar 𝛼 e 𝛽 tanto para os

estados do sistema real 𝑥 quanto para os estados do modelo de sistema 𝑥𝑚, deste modo,

escrevendo-se o seguinte:

Δ𝑎 = 𝛼(𝑥) − 𝛼(𝑥𝑚)

Δ𝑏 = 𝛽(𝑥) − 𝛽(𝑥𝑚)(4.15)


em que Δ𝑎 e Δ𝑏 descrevem uma aproximacao da diferenca entre os valores de 𝛼 e 𝛽 reais

e os respectivos valores nominais. Seja 𝑒(𝑥) o erro entre o estado do sistema e do modelo:

𝑒(𝑥) = 𝑥− 𝑥𝑚 (4.16)

A partir do erro 𝑒(𝑥), sugere-se expressoes para Δ𝛼(𝑒(𝑥)) e Δ𝛽(𝑒(𝑥)) como sendo:

Δ𝛼(𝑒(𝑥)) = 𝑝+ 𝑞𝑒(𝑥)

Δ𝛽(𝑒(𝑥)) = 𝑟 + 𝑠𝑒(𝑥)(4.17)

em que os coeficientes 𝑝, 𝑞, 𝑟 e 𝑠 sao valores estimados usando o algoritmo dos quadrados

mınimos recursivo. As expressoes em (4.17) sao utilizadas nos consequentes das regras

construıdas pelo algoritmo ePL. Os valores de Δ𝛼(𝑒(𝑥)) e Δ𝛽(𝑒(𝑥)) sao determinados

utilizando regras do tipo:

Se 𝑒(𝑘) e 𝐴𝑖1 e Δ𝑎(𝑘) e 𝐴𝑖

2 e Δ𝑏(𝑘) e 𝐴𝑖3 Entao Δ𝛼𝑖(𝑘) = Δ𝛼 e Δ𝛽𝑖(𝑘) = Δ𝛽

em que as expressoes Δ𝛼(𝑘) e Δ𝛽(𝑘), nos consequentes das regras, sao determinadas por

(4.18) e (4.19), respectivamente.

Δ𝛼(𝑘) =∑𝑐(𝑘)

𝑖=1 𝜇𝑖(𝑝𝑖+𝑞𝑖𝑒(𝑘))∑𝑐(𝑘)𝑖=1 𝜇𝑖

(4.18)

Δ𝛽(𝑘) =∑𝑐(𝑘)

𝑖=1 𝜇𝑖(𝑟𝑖+𝑠𝑖𝑒(𝑘))∑𝑐(𝑘)𝑖=1 𝜇𝑖

(4.19)

Uma vez estimados os valores de Δ𝛼(𝑘) e Δ𝛽(𝑘) pode-se calcular o valor do sinal

de controle para compensar as incertezas utilizando a expressao:

𝑢𝑐(𝑘) = Δ𝛼(𝑘) + Δ𝛽(𝑘)𝑣 (4.20)

Desta forma, sugere-se uma nova topologia de controle que induz o metodo denomi-

nado linearizacao por realimentacao granular evolutiva robusta fuzzy (gERF), mostrado

na Figura 4.2. O Algoritmo 4.2 sumariza os passos executados pelo gERF.


Algoritmo 4.2 Controlador gERF

Entrada: 𝑒(𝑘), 𝑥𝑚(𝑘), 𝑣𝑧(𝑘), 𝛼𝑥(𝑘), 𝛽𝑥(𝑘),Saıda: 𝑢𝑐(𝑘)

Definir os parametros 𝑟, 𝜙, 𝜂, 𝜆, 𝜏 ;Ler dado 𝑥(𝑘) de entrada, 𝑘 = 1,2;Calcular Δ𝑎(𝑘) e Δ𝑏(𝑘), usando (2.22), (2.23) e (4.15);Definir vetor de dados;𝑥(𝑘) = [𝑒(𝑘) Δ𝑎(𝑘) Δ𝑏(𝑘)];Inicializar os centros 𝑣1 = 𝑥(1) e 𝑣2 = 𝑥(2);enquanto verdade fazer

Ler dados de entrada;Calcular Δ𝑎(𝑘) e Δ𝑏(𝑘), usando (2.22), (2.23) e (4.15);Definir vetor de dados;𝑥(𝑘) = [𝑒(𝑘) Δ𝑎(𝑘) Δ𝑏(𝑘)]𝑇 ;Calcular 𝜌𝑖(𝑘) usando (4.3);Calcular 𝑎𝑖(𝑘) usando (4.5);se 𝑎𝑖(𝑘) ≥ 𝜏 , ∀ j ∈ {1, . . . , 𝑐(𝑘)} entao𝑥(𝑘) e um novo centro de grupo;Fazer 𝑣𝑖(𝑐(𝑘) + 1) = 𝑥(𝑘);Fazer 𝑎𝑖(𝑐(𝑘) + 1) = 0;

senaoAtualizar 𝑣𝑖(𝑘 + 1) usando (4.1);Atualizar 𝑎𝑖(𝑘 + 1) usando (4.5);

fim seCalcular a compatibilidade entre os centros;𝜌𝑣𝑖(𝑘) = 1 −∑𝑝

𝑗=1 |𝑣𝑖(𝑘) − 𝑣𝑗(𝑘)|;se 𝜌𝑣𝑖(𝑘) ≥ 𝜆, ∀ i ∈ {1, . . . , 𝑐(𝑘)} entao

Excluir 𝑣𝑖;Fazer 𝑐(𝑘 + 1) = 𝑐(𝑘) − 1;

senaoManter a estrutura de grupo;

fim seAtualizar a base de regras;Calcular o grau de ativacao de cada regra 𝜇𝑖 = 𝑒−𝑟‖𝑥(𝑘)−𝑣𝑖‖2

;Calcular Δ𝛼 e Δ𝛽 usando (4.18) e (4.19);Calcular 𝑢𝑐(𝑘) usando (4.20);

fim enquanto


𝛼(𝑥) + 𝛽(𝑥)𝑣(𝑧) Processo��+ 𝑢

𝑢0

+

𝐾

𝑣(𝑧) 𝑦

𝜑(��)

𝑥+

��𝑧

𝑥0−

Modelo𝑔𝐸𝑅𝐹

𝛼(𝑥), 𝛽(𝑥)+

𝑢𝑐

𝑒

𝑣(𝑧) +𝑥𝑚

−𝑦𝑚

Figura 4.2 – Topologia do gERF.

Assim a proposta desta dissertacao e aplicar o metodo gERF para estimar os valores

de incerteza que causam incompatibilidade entre o comportamento do sistema real e o

modelo, de modo a adicionar um sinal de compensacao 𝑢𝑐 ao sinal de controle que cancele

os efeitos das incertezas.

4.4 Controle de nıvel de tanque

Para verificar o desempenho da linearizacao por realimentacao exata/classica (CFL)

e mostrar as fragilidades desta tecnica quando os parametros de modelo sao incertos,

utiliza-se um processo SISO. O exemplo trata do controle de nıvel (ℎ) de um tanque

caracterizado por:

ℎ =

⎧⎪⎪⎨⎪⎪⎩15,8551𝑢−13,3401ℎ−643,9361

3019,0705 se ℎ < 815,8551𝑢−13,3401ℎ−643,9361

𝐴(ℎ) se 8 ≤ ℎ ≤ 80(4.21)

O tanque tem um solido no seu interior que introduz a nao linearidade mostrada

na Figura (4.3) (FRANCO, 2015) e (QUADROS, 2016). Sua dinamica e dada por (4.21),

em que 𝑢 ∈ [0%, 100%] e o sinal de controle, ℎ ∈ [0, 80] 𝑐𝑚 e o nıvel da coluna de lıquido

no tanque e 𝐴(ℎ) e a area de secao transversal do tanque (𝑐𝑚2) dada por:

𝐴(ℎ) = 1556,82 − 1349,1948 cos(2,5𝜋(0,01(ℎ− 8) − 0,4))𝑒−(0,01(ℎ−8)−0,4)2

0,065 (4.22)


Figura 4.3 – Representacao do tanque com solido nao linear.

De acordo (FRANCO, 2006), reescreve-se (4.21) para tornar a origem o ponto de

operacao do sistema, fazendo:

ℎ = ℎ− ℎ0 (4.23)

em que ℎ0 e a referencia (Set-point). Analogamente 𝑢0 e o sinal de controle necessario

para manter o valor ℎ0, assim o controle efetivo e:

�� = 𝑢− 𝑢0 (4.24)

para manter o nıvel do tanque no ponto de equilıbrio (Set-point). Substituindo (4.24)

e (4.23) em (4.21) obtem-se o modelo do nıvel do tanque com origem em ℎ0. Para o

intervalo 8 ≤ ℎ+ ℎ0 ≤ 80 𝑐𝑚, temos:

˙ℎ = −13,3401(ℎ+ℎ0)−643,9361+15,8551𝑢0

𝐴(ℎ+ℎ0) + 15,8551��

𝐴(ℎ+ℎ0)(4.25)

A CFL utiliza (2.21), (2.22) e (2.23), que satisfazem as hipoteses H1, H2 e H3 do

Lema (2.2), Secao 2.3, para determinar o difeomorfismo:

𝜑(ℎ(𝑡)) = ℎ (4.26)


Os parametros 𝛼(ℎ) e 𝛽(ℎ) sao definidos por (4.27) e o sinal de controle �� e calculado

usando:

𝛼(ℎ) = 13,3401(ℎ+ℎ0)+643,9361−15,8551𝑢015,8551 e 𝛽(ℎ) = 𝐴(ℎ+ℎ0)

15,8551 (4.27)

�� = 𝛼(ℎ) + 𝛽(ℎ)𝑣 (4.28)

com

𝑣 = −𝐾𝑧 = −𝐾𝜑(ℎ) (4.29)

Aproximando (4.25) por Euler com incremento 𝑇 = 1,0 𝑠, o suficiente para se

aproximar a dinamica contınua do tanque e, considerando que o tempo e representado

por 𝑡 = 𝑘𝑇 em que 𝑘 e o 𝑘−esimo passo e 𝑇 e o perıodo de amostragem, o sistema

continuo (4.21) tem sua versao discretizada, pelo metodo de Euler de primeira ordem,

dada por:

ℎ𝑚(𝑘 + 1) = ℎ𝑚(𝑘) + 𝑇(

15,8551𝑢(𝑘)−13,3401ℎ𝑚(𝑘)−643,9361𝐴(ℎ𝑚(𝑘))

)(4.30)

Considera-se que o atuador do tanque satura com uma vazao maior que 𝑢𝑛(𝑘) >

100 %. Assim o sinal de controle fica restrito as condicoes resumidas em (4.31). As

respostas do modelo nominal em malha fechada sao mostradas nas Figuras 4.4 a 4.6, e

foram obtidas considerando que a condicao inicial do tanque e 20 𝑐𝑚 e que o ponto de

operacao do sistema e ℎ0 = 30 𝑐𝑚. De acordo com (FRANCO et al., 2016) o ganho

𝐾 = 0,05. E possıvel perceber que a resposta do modelo nesta configuracao atinge o

ponto de operacao especificado e existe um cancelamento exato das nao linearidades do

sistema 𝛼(ℎ(𝑘)) e 𝛾(ℎ(𝑘)), atendendo os requisitos de projeto.

𝑢𝑛(𝑘) =

⎧⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎩

100% se ��(𝑘) + 𝑢0 > 100%

��(𝑘) + 𝑢0 se 0% ≤ ��(𝑘) + 𝑢0 ≤ 100%

0% se ��(𝑘) + 𝑢0 < 0%

(4.31)


Porem quando os parametros, 13,3401 e 643,9361 utilizados no modelo (4.30), sao

diferentes daqueles do processo real a resposta apresenta um erro de regime conforme

mostram as Figuras 4.4 a 4.6, em que as linhas na cor verde representam os sinais de

resposta do modelo ideal e a as linhas na cor vermelha representam os sinais de resposta

do sistema onde nao houve um cancelamento exato das nao linearidades do sistema.

Tempo (s)0 20 40 60 80 100 120 140

h(cm)

20

25

30

35

Figura 4.4 – Nıvel do tanque com incerteza.

Tempo (s)0 20 40 60 80 100 120 140

u(%

)

50

60

70

80

90

100

Figura 4.5 – Sinal de controle incerto.

Tempo (s)0 20 40 60 80 100 120 140

v

-0.2

0

0.2

0.4

0.6

Figura 4.6 – Sinal de controle linearizado incerto.


4.5 Analise e avaliacao de desempenho

Nesta Secao sao avaliados os desempenhos dos metodos CFL, IAFC, FMRLC e

gERF no controle de nıvel do tanque. Para tal, tres testes foram realizados levando em

consideracao o modelo (4.30) e supondo que o tanque real tem a dinamica expressa por

(4.32).

A simulacao adota os valores sugeridos por (FRANCO, 2015) para o ganho de

realimentacao dos estados 𝐾 = 0,05, perıodo de amostragem foi 𝑇 = 1,0 𝑠. O tempo de

simulacao foi 𝑡 = 0 a 3000 𝑠. Os pontos de operacoes sao: (ℎ0;𝑢0) = (23; 60), (31; 68) e

(16; 53). As simulacoes realizadas utilizam o modelo do sistema (4.30) linearizado seguindo

a CFL (linha verde) e o tanque real (4.32) com linearizacao CFL (linha vermelha) e os

controladores FMRLC (linha ciana), IAFC (linha magenta) e gERF (linha azul) conforme

as Figuras 4.7 a 4.16.

O primeiro teste supoe que a incerteza e decorrente do erro de modelagem entre o

modelo (4.30) e o tanque real representado por:

ℎ𝑟(𝑘 + 1) = ℎ𝑟(𝑘) + 𝑇(

15,8551𝑢(𝑘)−6,5ℎ𝑟(𝑘)−630𝐴(ℎ𝑟(𝑘))

)(4.32)

Desta forma (4.32) representa o sistema real com incerteza constante, correspon-

dendo a um fechamento de 50% da valvula de saıda do tanque, enquanto que (4.30)

descreve o modelo utilizado para projetar o controlador nominal. Qualitativamente o de-

sempenho dos metodos pode ser observado nas Figuras 4.7 a 4.9, considerando o perıodo

de simulacao 𝑡 ∈ [0, 3000]𝑠.

O segundo teste considera uma incerteza que varia no tempo, fazendo 𝑐ℎ = 6,5 +

0,5 sin(0,08𝑡) 𝑐𝑚 para todo o perıodo de simulacao, em que 𝑐ℎ substitui o coeficiente 6,5

que multiplica ℎ𝑟(𝑘) em (4.32). Isso equivale a fechar a valvula de saıda de aproximada-

mente 40% a 60% durante o perıodo de simulacao 𝑡 ∈ [0,3500] 𝑠. Os desempenhos sao

mostrados nas Figuras 4.10 a 4.12.

O terceiro teste procede como no primeiro teste, mas acrescenta-se uma perturbacao

de carga ao sistema real, de 20% na vazao da bomba durante 60 𝑠 nos intervalos (375,435),

(1125,1185), (1875,1935) e (2625,2685) 𝑠. Alem disso, acrescenta-se um ruıdo Gaussiano

de media zero e desvio padrao 2,5 𝑐𝑚 na leitura de nıvel do tanque. Os parametros do


Tempo (s)

0 500 1000 1500 2000 2500 3000

h (

cm

)

0

20

40

60CFL

IAFC

FMRLC

gERF

REF

MOD

Figura 4.7 – Nıvel do tanque com incerteza constante.

Tempo (s)

0 500 1000 1500 2000 2500 3000

u(%

)

0

50

100 CFL

IAFC

FMRLC

gERF

MOD

Figura 4.8 – Sinais de controle com incerteza constante.

Tempo (s)

0 500 1000 1500 2000 2500 3000

v

-2

-1

0

1CFL

IAFC

FMRLC

gERF

MOD

Figura 4.9 – Sinais de controle linearizados com incerteza constante.

gERF sao: 𝜙 = 0,01, 𝜂 = 0,001, 𝜏 = 0,001, 𝜆 = 0,4995 e 𝑟 = 0,05. As Figuras 4.14

a 4.16 mostram qualitativamente o desempenho dos metodos durante todo o perıodo de

simulacao 𝑡 ∈ [0,3000] 𝑠.

A Figura 4.17 mostra a variacao do numero de grupos (regras fuzzy) criados levando

em consideracao a perturbacao de carga. Inicialmente o gERF cria 2 grupos e apos um

perıodo de aproximadamente 300 segundos ele adapta sua estrutura para apenas 1 unico

grupo.


Tempo (s)

0 500 1000 1500 2000 2500 3000 3500

h (

cm

)

0

20

40

60CFL

IAFC

FMRLC

gERF

REF

MOD

Figura 4.10 – Nıvel do tanque com incerteza variavel.

Tempo (s)

0 500 1000 1500 2000 2500 3000 3500

u(%

)

0

50

100 CFL

IAFC

FMRLC

gERF

MOD

Figura 4.11 – Sinais de controle com incerteza variavel.

Tempo (s)

0 500 1000 1500 2000 2500 3000 3500

v

-2

-1

0

1CFL

IAFC

FMRLC

gERF

MOD

Figura 4.12 – Sinais de controle linearizados com incerteza variavel.

Qualitativamente e possıvel perceber que quando nao existem incertezas presentes

na modelagem a linearizacao por realimentacao classica apresenta comportamento em

acordo com o que e projetado (linha verde) e sempre acompanha o sinal de referencia

selecionado (linha pontilhada preta), conforme destacado nos graficos da Figura 4.13.

A dinamica do nıvel do tanque depende do metodo de linearizacao por realimentacao, e

percebe-se que o sistema real com linearizacao por realimentacao apresenta a pior resposta

em todos os testes simulados (linha continua vermelha). Em particular, nota-se que o

sistema real em malha fechada apresenta comportamento diferente do esperado com a


Tempo (s)

600 650 700 750 800 850 900 950 1000

h (

cm

)

10

20

30

40CFL

IAFC

FMRLC

gERF

REF

MOD

Figura 4.13 – Dinamica do tanque com perturbacao de carga.

mesma estrutura de linearizacao por realimentacao. E notoria a diferenca entre o ponto

de estabilizacao e o ponto de operacao quando o sistema possui incerteza no modelo.

O metodo FMRLC usa 121 regras e mesmo assim percebe-se que o sistema tem

um comportamento oscilatorio em torno do ponto de operacao (linha contınua ciana).

Da mesma forma, tambem oscila o IAFC com 5 regras (linha contınua magenta). As

oscilacoes observadas em torno do ponto de operacao se devem ao ruıdo nas medidas de

nıvel do tanque. Os dois metodos ao sistema real tem desempenho qualitativo melhores

que a CFL.

O comportamento do sistema real linearizado pelo gERF e similar ao do modelo

do tanque em todos os testes, onde vemos que a resposta do sistema alcanca o ponto

de operacao e tem desempenho qualitativamente superior aos metodos FMRLC, IAFC e

CFL.

Percebe-se tambem que o FMRLC faz um esforco de controle maior que o deman-

dado pelos outros metodos para manter o nıvel do lıquido no tanque em torno do ponto de

operacao, conforme as Figuras 4.8 a 4.15. Oscilacoes no sinal de controle sao indesejaveis

pois podem ocasionar um desgaste prematuro no atuador. No caso especıfico do tanque,

isto podera ocasionar um desgaste prematuro dos componentes eletro-mecanicos do pro-

cesso. Outro fato relevante, mostrado pelas Figuras 4.9 a 4.16 e o cancelamento das nao

linearidades do sistema real com a utilizacao do gERF ser proximo ao exato enquanto que

nos outros metodos nao e observado o mesmo efeito.

Quantitativamente o melhor desempenho foi alcancado pelo controlador gERF.


Tempo (s)

0 500 1000 1500 2000 2500 3000

h (

cm

)

0

20

40

60CFL

IAFC

FMRLC

gERF

REF

MOD

Figura 4.14 – Nıvel do tanque com perturbacao de carga.

Tempo (s)

0 500 1000 1500 2000 2500 3000

u (

%)

0

20

40

60

80

100 CFL

IAFC

FMRLC

gERF

MOD

Figura 4.15 – Sinais de controle com perturbacao de carga.

Tempo (s)

0 500 1000 1500 2000 2500 3000

v

-2

-1

0

1CFL

IAFC

FMRLC

gERF

MOD

Figura 4.16 – Sinais de controle linearizados com perturbacao de carga.

Para esta analise foram utilizados ındices classicos como: Integral of Time-weighted Abso-

lute error – (ITAE), Integral of Time-weighted Variability of the Signal Control – (IVU),

Integral of Time-weighted Variability of the Error – (IVE), Integral of the Square of the

Error – (ISE), Integral of the Absolute Magnitude of the Error – (IAE), Integral of Time

Multiplied by Square Error – (ITSE). O ITAE quantifica o erro de controle durante o

regime permanente. O IVU e o IVE avaliam o esforco do controlador e a variabilidade do

sinal de saıda, respectivamente.


Tempo (s)0 500 1000 1500 2000 2500 3000

Nú

me

ro

0.5

1

1.5

2

2.5

Figura 4.17 – Numero de grupos criados durante o teste com perturbacao de carga.

Os ındices sao calculados usando as expressoes (4.33) a (4.36), em que, 𝑒 e �� sao o

valor medio do erro e o sinal de controle no intervalo [𝑡0,𝑡𝑓 ].

𝐼𝑇𝐴𝐸 =∫ 𝑡𝑓

𝑡0𝑡|𝑒(𝑡)|𝑑𝑡 (4.33)

𝐼𝑆𝐸 =∫ 𝑡𝑓

𝑡0𝑒(𝑡)2𝑑𝑡 (4.34)

𝐼𝑇𝑆𝐸 =∫ 𝑡𝑓

𝑡0𝑡𝑒(𝑡)2𝑑𝑡 (4.35)

𝐼𝐴𝐸 =∫ 𝑡𝑓

𝑡0|𝑒(𝑡)|𝑑𝑡 (4.36)

𝐼𝑉 𝐸 =√

1𝑡𝑓 − 𝑡0

∫ 𝑡𝑓

𝑡0|𝑒(𝑡) − 𝑒|2𝑑𝑡 (4.37)

𝐼𝑉 𝑈 =√

1𝑡𝑓 − 𝑡0

∫ 𝑡𝑓

𝑡0|𝑢(𝑡) − ��|2𝑑𝑡 (4.38)

O desempenho relativo normalizado ao gERF e dos controladores sao mostrados

nas Tabela 4.1 a Tabela 4.3. O desempenho normalizado, e calculado usando a expressao

(4.39).

𝑃% =(𝐼𝑁𝐷𝐼𝐶𝐸𝑚𝑒𝑡𝑜𝑑𝑜

𝐼𝑁𝐷𝐼𝐶𝐸𝑔𝐸𝑅𝐹

− 1)

× 100% (4.39)


Tabela 4.1 – Desempenho normalizado do gERF com variacao de parametro constante.

Metodo 𝐼𝑇𝐴𝐸(%) 𝐼𝑉 𝐸(%) 𝐼𝑉 𝑈(%) 𝐼𝐴𝐸(%) 𝐼𝑆𝐸(%) 𝐼𝑇𝑆𝐸(%)IAFC 559,07 563,17 417,27 559,07 4,22 × 103 4,22 × 103

FMRLC 934,10 867,10 213,12 934,11 10,78 × 103 10,78 × 103

CFL 6,42 × 103 2,27 × 103 -47,73 12,9 × 103 2,85 × 105 2,85 × 105

Tabela 4.2 – Desempenho normalizado do gERF com parametro variante no tempo.

Metodo 𝐼𝑇𝐴𝐸(%) 𝐼𝑉 𝐸(%) 𝐼𝑉 𝑈(%) 𝐼𝐴𝐸(%) 𝐼𝑆𝐸(%) 𝐼𝑇𝑆𝐸(%)IAFC 677,22 678,77 360,61 677,22 5,96 × 103 5,96 × 103

FMRLC 1,06 × 103 991,52 191,06 1,06 × 103 13,58 × 103 13,58 × 103

CFL 7,12 × 103 2,46 × 103 -52,76 14,34 × 103 3,51 × 105 3,51 × 105

Tabela 4.3 – Desempenho normalizado do gERF com perturbacao de carga e ruıdo.

Metodo 𝐼𝑇𝐴𝐸(%) 𝐼𝑉 𝐸(%) 𝐼𝑉 𝑈(%) 𝐼𝐴𝐸(%) 𝐼𝑆𝐸(%) 𝐼𝑇𝑆𝐸(%)IAFC 62,26 × 103 193,92 441,74 311,39 759,51 759,51

FMRLC 65,5 × 103 182,45 12,67 62,74 742,75 742,75CFL 1,91 × 103 909,61 -1,11 3,91 × 103 22,2 × 103 22,2 × 103

Em geral, todos os ındices de desempenho mencionados mensuram o erro da variavel

controlada, por tanto, observando os valores normalizados nas Tabelas 4.1 a 4.3 quanto

maior for o valor do desempenho positivo, pior e o desempenho do metodo. Por outro

lado, quanto maior for o valor do desempenho normalizado negativo, melhor e o metodo

em relacao ao gERF.

Resumindo, somente no quesito IVU a CFL apresenta desempenho melhor que o

alcancado pelo gERF, nos outros ındices o gERF apresentou melhores resultados e seu

desempenho do gERF e perceptivelmente melhor em todas as situacoes. O ITAE, IAE,

ISE, ITSE e o IVE apontam para um erro de regime permanente importante em todas

as simulacoes em relacao ao alcancado pelo gERF. Nestes casos, mesmo com aumento

no esforco de controle, o desempenho do sistema fica aquem do alcancado pelo metodo

proposto neste trabalho.

4.6 Resumo

Este Capıtulo apresentou a abordagem de linearizacao por realimentacao evolu-

tiva robusta fuzzy (gERF). Os resultados de simulacoes mostraram que o gERF tem

desempenho superior aos demais metodos de controle CFL, FMRLC e IAFC, tanto qua-


litativamente quanto quantitativamente, conforme os ındices ITAE, IAE, ITSE, ISE, IVE

e IVU.

Por fim e razoavel afirmar que o gERF tem desempenho superior aos demais meto-

dos de controle, pois se mostra robusto frente a variacoes em parametros do processo. No

proximo Capıtulo alguns testes experimentais com o gERF sao realizados e apresentados

os resultados.

72

5 Resultados experimentais

No Capıtulo anterior foi desenvolvida e fundamentada uma solucao teorica para o

problema da variacao de parametros em sistemas linearizados por realimentacao atraves

da abordagem denominada gERF. Este Capıtulo apresenta os resultados de testes experi-

mentais desenvolvidos em laboratorio do sistema de controle de nıvel de um tanque com

solido nao linear.

5.1 Descricao do tanque

O gERF foi utilizado para controlar um dos tanques do sistema de tanques itera-

tivos do Laboratorio de Sinais e Sistemas do Centro Federal de Educacao Tecnologica de

Minas Gerais (CEFET-MG, Divinopolis-MG), o diagrama esta na Figura A.1 do Anexo

A.

O sistema possui 4 tanques com capacidade nominal de 200 litros cada, dois reser-

vatorios com capacidade nominal de 400 litros cada, para armazenar a agua dos tanques,

e duas bombas hidraulicas trifasicas de 1.0 cv, conforme mostra a Figura 5.1. As bombas

sao acionadas por dois inversores de frequencia WEG CFW09. Cada uma das bombas

possui um conjunto de tubos especıficos. Os tubos acoplados a Bomba 01 sao para circu-

lacao de agua fria enquanto que a tubulacao da Bomba 02 esta preparada para circulacao

de agua quente.

O controle do sistema e realizado por um microcomputador. A aquisicao dos dados

e feita por um Programmable Logic Controller – (PLC) Siemens S7-300. O microcom-

putador e o PLC estao conectados a um roteador por meio de suas interfaces de rede

Ethernet que se comunicam atraves do pacote Snap7 desenvolvido pela Siemens, fabri-

cante do PLC. Para implementacao dos controladores, o microcomputador pode ser pro-

gramado utilizando as linguagens Python (Numeric Python - NumPy), C/C++, Pascal

ou LabView. A aquisicao e armazenagem de dados no PLC utiliza a biblioteca Ahio da lin-

guagem Python. O PLC, os inversores de frequencia, os reles de acionamento, o roteador

e o microcomputador estao instalados num painel, localizado ao lado dos tanques.

A instrumentacao e composta por: 4 sensores diferenciais de pressao Honeywell

Capıtulo 5. Resultados experimentais 73

Figura 5.1 – Sistema de tanques interativos do Laboratorio de Sinais e Sistemas CEFET-MG.

26PCBFA6D Figura 5.2, para medir o nıvel do tanque, cada deles ligado a um circuito

integrado XRT106, para transformar o sinal de baixa tensao proveniente do sensor em um

sinal de corrente no intervalo de 4 a 20 𝑚𝐴. O sistema conta ainda com dois medidores de

vazao, um do tipo roda d’agua fabricado pela Dwyler Equipamentos Industriais e outro

do tipo magnetico fabricado pela Incontrol, mostrados na Figura 5.3.

O Tanque 03 (TQ-03 no diagrama) foi utilizado nos experimentos desta dissertacao,

devido a facilidade de instalacao do solido nao linear mostrado na Figura 5.4. O sinal de

controle aplicado ao tanque e a rotacao da bomba que varia de 0% a 100%. A variavel

a ser controlada e o nıvel da coluna de lıquido no tanque, medida pelo sensor diferencial


Figura 5.2 – Sensor diferencial de pressao Honeywell 26PCBFA6D.

(a) Sensor de vazao tipo roda d’agua Dwyler. (b) Sensor de vazao magnetico Incontrol.

Figura 5.3 – Sensores de vazao.

de pressao do tanque, que varia entre 0 a 80 𝑐𝑚. As proximas secoes apresentam os

resultados dos testes experimentais.

5.2 Teste 01 - Linearizacao por realimentacao classica

O primeiro teste consiste em utilizar a linearizacao por realimentacao classica (CFL)

para controlar o nıvel do tanque. Neste teste o controlador e projetado conforme a metodo-

logia apresentada na Secao 2.1 e simulado na Secao 4.4. O Anexo B mostra a metodologia

utilizada para obter o modelo (5.1). O modelo (5.1) foi obtido com a valvula de saıda do

tanque 100% aberta.

ℎ = 23,15𝑢− 14,32ℎ− 1021,5𝐴(ℎ) (5.1)


Figura 5.4 – Solido nao linear instalado dentro do tanque.

O modelo continuo do tanque com origem em ℎ0 e 𝑢0 e dado por:

˙ℎ = −14,32(ℎ+ ℎ0) + 23,15��− 1021,5

𝐴(ℎ+ ℎ0)+ 23,15𝑢0

𝐴(ℎ+ ℎ0)(5.2)

A versao discretizada de (5.1) e dada por:

ℎ(𝑘 + 1) = ℎ(𝑘) + 𝑇

(23,15𝑢(𝑘) − 14,32ℎ(𝑘) − 1021,5

𝐴(ℎ(𝑘))

)(5.3)

Se ℎ0 e a referencia, 𝑢0 e o sinal de controle de equilıbrio do sistema em ℎ0, ℎ e o

nıvel da coluna de lıquido no tanque, o ganho de realimentacao dos estados e 𝐾 = 0,04 e

𝐴(ℎ) e area do solido nao linear introduzido no tanque e o perıodo de amostragem de 1


segundo, e o controlador modelado por:

ℎ(𝑘) = ℎ(𝑘) − ℎ0

𝜑(ℎ)(𝑘) = ℎ(𝑘)

𝑣(ℎ) = −𝐾𝜑(ℎ(𝑘))

𝛼(ℎ(𝑘)) = 14,32ℎ(𝑘)−23,15𝑢0+1021,523,15

𝛽(ℎ(𝑘)) = 𝐴(ℎ(𝑘))23,15

��(𝑘) = 𝛼(ℎ(𝑘)) + 𝛽(ℎ(𝑘))𝑣(ℎ)

𝑢(𝑘) = ��(𝑘) + 𝑢0

(5.4)

0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)

20.022.525.027.530.032.535.0

h (cm)

CFLReferência

0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)

505560657075

u (%

)

u0ucfl

Figura 5.5 – Resposta do modelo do tanque.

A Figura 5.5 mostra a resposta do modelo do tanque, utilizando a CLF, e consi-

derando que a valvula de saıda do tanque esta 100% aberta, que e a mesma utilizada

no projeto do controlador. Percebe-se um erro de regime, entorno de 2% em relacao a

referencia, devido a diferenca entre os parametros do modelo utilizado no projeto e o

tanque real. O controlador desenvolvido faz a linearizacao pela realimentacao de forma

quase exata. A proxima Secao apresenta o teste do controlador gERF considerando a

posicao/condicao da valvula de saıda do tanque a mesma usada pela CFL.


5.3 Teste 02 - Topologia de controle

Este teste utiliza o controlador gERF, da Secao 4.3, para controlar o nıvel de

lıquido no tanque sem modificar a condicao operacional da valvula de saıda do tanque

para a qual o modelo dinamico (5.3) foi desenvolvido, considerando a valvula de saıda do

tanque 100% aberta. A introducao de incerteza ocorre quando a condicao da valvula e

modificada, seja fechando ou abrindo-a, de modo que a dinamica do sistema seja alterada

e o sistema nominal nao e capaz de estabilizar o nıvel de lıquido no ponto de operacao

selecionado.

A Figura 5.6 mostra os sinais de controle e nıvel do tanque considerando que a

condicao da valvula e mesma daquela utilizada no projeto. As curvas em azul sao as

respostas do modelo ao controlador gERF. As curvas em vermelho sao as respostas do

modelo ao controlador CFL. As curvas em verde sao os sinais da resposta do tanque

real ao controlador gERF, e as curvas em magenta sao as respostas do tanque real ao

controlador CFL. A resposta do sistema simulado e a resposta do sistema ao gERF sao

similares.

0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)

1520253035

h (cm)

ReferênciagERFgERF SimCFL

0 500 1000 1500 2000 2500 3000 3500 4000Tempo (s)

50607080

u (%

)

ugerf

ucfl

ugerf Simu0

Figura 5.6 – Nıvel e sinal de controle do tanque real com gERF e CFL.

O gERF percebe as variacoes entre o sistema real e seu modelo e faz um ajuste

no controlador, melhorando a resposta do sistema. A linearizacao feita pelo controlador

e continuamente ajustada pois o gERF percebe a existencia de erro de regime e faz

a correcao adicionando um sinal de controle para compensar o efeito da variacao no


parametro. Os sinais de controle da CFL e gERF oscilam entorno do sinal de controle de

equilıbrio 𝑢0, porem o sinal da CFL tem uma variacao 0,94 % menor que o sinal produzido

pelo gERF.

0 1000 2000 3000 4000Tempo (s)

1.001.251.501.752.002.252.502.753.00

Núm

ero

RealSim

Figura 5.7 – Numero de centros criados pelo gERF.

A Figura 5.7 mostra a variacao do numero de grupos (ou numero de regras fuzzy)

criados pelo gERF para compensar o erro de modelagem. O gERF adapta sua estrutura

para compensar o efeito da variacao de parametro.

Para quantificar e comparar o desempenho dos controladores CFL e gERF utiliza-se

dos ındices (4.33) a (4.39) apresentados na Secao 4.5. Em geral, os ındices de desempe-

nhos quantificam o erro entre a resposta do sistema e a referencia ou modelo projetado.

Exceto para o IVU, quanto maior o valor percentual do desempenho normalizado pior

e o desempenho do sistema de controle em relacao ao gERF. Os valores dos ındices e o

desempenho relativo sao mostrado na Tabela:

Tabela 5.1 – Indice de desempenho CFL e gERF.

Indice CFL gERF Desempenho Normalizado (%)𝐼𝐴𝐸 2029,58 1871,53 8,44𝐼𝑉 𝐸 0,97 0,93 4,3𝐼𝑆𝐸 5679,73 5261,09 7,95𝐼𝑉 𝑈 3,14 3,17 -0,94𝐼𝑇𝐴𝐸 1014,79 935,76 8,44𝐼𝑇𝑆𝐸 2839,86 2630,54 7,95

Analisando a Tabela 5.1 e as repostas da Figura 5.6 percebe-se que o tanque real

com controle gERF tem um desempenho melhor que o sistema de controle linearizado com


a realimentacao classica. Observa-se tambem que o gERF acompanha a referencia melhor

que a CFL, uma vez que este tem um erro de regime. Nota-se tambem que a resposta e

o controle do gERF aplicado ao tanque e similar as respostas obtidas via simulacao.

Por outro lado o IVU, normalizado e um numero negativo, o que indica que a

variabilidade do sinal de controle do gERF e maior que o da CFL. A proxima Secao

analisa o desempenho do gERF quando a valvula de saıda do tanque e diferente da

condicao operacional assumida pelo modelo.

5.4 Teste 03 - Variacao de parametro

O teste consiste em alterar a vazao de saıda do tanque modificando a condicao

operacional da valvula de saıda para que o tanque se comporte de forma distinta daquela

que o modelo assume originalmente. Neste teste a abertura da valvula foi de apenas 60

%, assim a dinamica do tanque real passa a ser dada pela expressao:

ℎ = 23,15𝑢− 14,32ℎ− (1021,5 + 0,1𝐴(ℎ))𝐴(ℎ) (5.5)

A alteracao na posicao da valvula de saıda do Tanque 03 resulta na mudanca do

parametro independente do modelo dinamico (5.1), tal que esse parametro seja modificado

em aproximadamente de ±2,7% a ±21% de acordo com o ponto de operacao. O efeito

maximo da mudanca na condicao operacional da valvula e observado no ponto de operacao

onde a nao linearidade tem a maior secao transversal (ℎ = 44𝑐𝑚). Por outro lado, o menor

efeito ocorre onde a nao linearidade tem a menor secao transversal (ℎ = 16𝑐𝑚). A Figura

5.8 mostra o nıvel e o sinal de controle.

A parte superior da Figura 5.8 mostra o nıvel do tanque, quando o gERF e utilizado

para compensar o efeito da mudanca na vazao de saıda do tanque. A parte inferior da

Figura 5.8 mostra os sinais de controle (rotacao da bomba em %), aplicados utilizando a

CFL e o gERF. A resposta do sistema com a CFL (curva vermelha) estabiliza em pontos

diferentes, ou seja, apresenta erro de regime e nao segue a referencia. O sinal de controle

da CFL varia pouco, mas nao compensa a variacao no parametro. Simulando as mesmas

condicoes descritas neste teste, o gERF apresenta desempenho melhor que a CFL, pois

atinge todos os pontos de operacao.


0 1000 2000 3000 4000 5000 6000Tempo (s)

1020304050

h (cm)

ReferênciagERFCFLgERF Sim α=0.01gERF Sim α=0.001MODELO

0 1000 2000 3000 4000 5000 6000Tempo (s)

020406080

u (%)

ugerfucflΔuevoum

Figura 5.8 – Nıvel e sinal de controle do tanque com variacao de parametro.

O desempenho do gERF quando submetido as mesmas condicoes operacionais em

que a CFL foi testada e consideravelmente melhor pois o gERF estima as variacoes do

sistema e as compensa. O gERF acompanha a referencia, conforme mostra a Figura 5.8

(curva verde). O comportamento do gERF e similar ao modelo de referencia (curva ciano),

sugerindo que o gERF lineariza o sistema de forma precisa com desempenho similar aquele

do modelo de controle nominal projetado. Nesse teste a taxa de aprendizagem utilizada

foi 𝛼 = 0,001, o limiar do ındice de alerta 𝜏 = 0,0001, o grau de compatibilidade entre os

grupos 𝜆 = 0,7 e o raio das funcoes de pertinencias gaussianas 𝑟 = 0,25. Um outro teste

foi realizado, sob as mesmas condicoes operacionais do tanque, porem com a mudanca

na taxa de aprendizagem do gERF para 𝛼 = 0,01. Conforme pode ser visto pelas curvas

magenta e amarela na Figura 5.8, a mudanca taxa de aprendizagem nao produz uma

mudanca significativa na dinamica do sistema em comparacao com o teste anterior.

Para ilustrar a adaptacao da estrutura do gERF, a Figura 5.9 mostra a distribuicao

dos dados durante o Teste 03. Na Figura 5.9, os valores de Δ𝑎(ℎ) e Δ𝑏(ℎ) sao as aproxi-

macoes normalizadas da diferenca entre 𝛼(ℎ) e 𝛽(ℎ) de seus respectivos valores nominais

sao agrupados. 𝐸(ℎ) e o erro ℎ(𝑡) − ℎ0.

Atraves da modificacao na estrutura de grupo dos dados e possıvel estimar variacoes

de parametros do sistema e calcular o sinal de controle que compensa estas variacoes. Por

isso o sinal de controle no gERF tem uma maior variabilidade pois os dados modificam a


Δa(h)

0.00.2

0.40.6

0.81.0

Δb(h)0.0

0.20.4

0.60.8

1.0

E(h)

0.0

0.2

0.4

0.6

0.8

1.0

Centro de GrupoDados

Figura 5.9 – Estrutura de grupo formada pelo gERF.

estrutura de grupos a cada novo dado recebido. A Figura 5.9 mostra que ao final do teste

apenas dois grupos forma necessarios.

Tabela 5.2 – Indices de desempenho CFL e gERF com variacao de parametro.

Indice CFL gERF Desempenho Normalizado (%)𝐼𝐴𝐸 21,7 × 103 4,55 × 103 376,5𝐼𝑉 𝐸 1,57 1,49 5,36𝐼𝑆𝐸 81,5 × 103 15,06 × 103 441,14𝐼𝑉 𝑈 5,88 6,29 -6,51𝐼𝑇𝐴𝐸 10,58 × 103 2,27 × 103 376,5𝐼𝑇𝑆𝐸 40,77 × 103 7,5 × 103 441,14

A Tabela 5.2 mostra os valores dos ındices de desempenho para o Teste 03. Nova-

mente e possıvel perceber a diferenca entre o gERF e a CFL, e conjecturar que a CFL nao

e robusta o suficiente para compensar os efeitos da variacao de parametros no sistema. A

CFL tem erro de regime enquanto que o gERF atinge a referencia. Um fato a ser desta-

cado e o valor percentual do ındice IVU normalizado do gERF, que e um numero negativo,

indicando que o sinal de controle gerado pelo gERF varia mais do que o sinal de controle

gerado pela CFL. Nas condicoes do Teste 03, o esforco de controle do gERF foi maior do

que o esforco de controle da CFL. Os resultados sugerem que o gERF proporciona melhor


desempenho que os controladores alternativos.

5.5 Resumo

Este Capıtulo apresentou os resultados de testes experimentais e os respectivos

resultados de simulacao. As simulacoes realizas serviram para comparar o desempenho

do gERF na pratica com as situacoes aproximadas das simulacoes. Conforme mostrado, o

gERF tem desempenho superior aos controladores alternativos quando existem variacoes

nos parametros no modelo usado para projeto e o sistema real.

83

6 Conclusao

Este trabalho objetivou estudar tecnicas de linearizacao por realimentacao em sis-

temas nao lineares e suas fragilidades. Em particular, o trabalho sugeriu uma abordagem

de controle denominada linearizacao por realimentacao granular evolutiva robusta fuzzy

– gERF, que se traduz em um metodo para estimar e compensar variacoes de parametros

utilizando o algoritmo de aprendizagem participativa evolutiva fuzzy – ePL.

Sob este aspecto os estudos teoricos e praticos apresentados nessa dissertacao apon-

tou resultados coerentes com o que foi idealizado nos objetivos da pesquisa, perfazendo

assim uma contribuicao para o estudo de robustez e estabilidade em sistemas de controles

nao lineares utilizando modelos fuzzy adaptativos para estimar e compensar tais efeitos.

O desempenho do gERF foi comparado aos metodos de controle fuzzy adaptativos,

como o Fuzzy Modelo Reference Learning Control – FMRLC e o Indirect Adaptive Fuzzy

Control – IAFC. Testes experimentais com um tanque foram realizados para verificar e

comparar a eficiencia do gERF quanto a variacao em parametros. Os testes experimentais

foram realizados no Laboratorio de Sinais e Sistemas do Centro Federal de Educacao

Tecnologica de Minas Gerais - CEFET-MG, Divinopolis-MG.

Os resultados se mostram promissores, uma vez que o gERF apresenta desempenho

superior aos demais metodos adaptativos de controle fuzzy existentes na literatura, alem

da CFL.

Apesar dos resultados, alguns topicos merecem uma investigacao mais detalhada,

entre eles investigar a eficiencia do gERF em sistemas de multiplas entradas e multiplas

saıdas (caso MIMO) com incerteza na modelagem, investigar a utilizacao do gERF para

sistemas com dinamicas nao modeladas e seus efeitos para a malha de controle, uma vez

que o metodo proposto considera apenas a incerteza nos parametros de modelagem e nao

as dinamicas dos diversos atuadores do sistema real, e por fim investigar a utilizacao do

gERF em sistemas com atraso nas variaveis de entrada – saıda e sistemas com atrasos de

transporte sao topicos igualmente interessantes a serem pesquisados na sequencia deste

trabalho.

84

Referencias

ABONYI, J. Fuzzy model identification. In: Fuzzy Model Identification for Control.Boston-USA: Birkhauser, 2002. p. 87–164. Citado na pagina 38.

BAEZA, J. Controle nao linear aplicado a malhas de controle com valvulas de alto atrito.Tese (Doutorado) — Universidade de Sao Paulo, Sao Paulo-Brasil, 2013. Citado napagina 20.

BANERJEE, S.; CHAKRABARTY, A.; MAITY, S.; CHATTERJEE, A. Feedbacklinearizing indirect adaptive fuzzy control with foraging based on-line plant modelestimation. Applied Soft Computing, Elsevier, v. 11, n. 4, p. 3441–3450, 2011. Citado napagina 18.

BENNETT, S. A brief history of automatic control. IEEE Control Systems, IEEE, v. 16,n. 3, p. 17–25, 1996. Citado na pagina 17.

BISSELL, C. A history of automatic control. In: Springer Handbook of Automation.Heidelberg-Berlin: Springer, 2009. cap. 4, p. 53–69. Citado na pagina 17.

BLAZIC, S.; SKRJANC, I.; MATKO, D. Globally stable direct fuzzy model referenceadaptive control. Fuzzy Sets and Systems, Elsevier, v. 139, n. 1, p. 3–33, 2003. Citadona pagina 19.

DORF, R.; BISHOP, R. Modern Control Systems. 9th. ed. Upper Saddle River, NewJersey, USA: Prentice-Hall, Inc., 2000. Citado na pagina 24.

DUBOIS, D.; PRADE, H. Gradual inference rules in approximate reasoning. InformationSciences, Elsevier, v. 61, n. 1-2, p. 103–122, 1992. Citado na pagina 34.

EULER-ROLLE, N.; SKRJANC, I.; HAMETNER, C.; JAKUBEK, S. Automatedgeneration of feedforward control using feedback linearization of local model networks.Engineering Applications of Artificial Intelligence, Elsevier, v. 50, p. 320–330, 2016.Citado na pagina 20.

FAUVEL, T.; LAVERGNE, F. Patent, Device for Balancing a Simulation Platform,and Associated Method. Google Patents, 2014. US Patent 8,731,879. Disponıvel em:<https://www.google.ch/patents/US8731879>. Citado na pagina 18.

FRANCO, A. Controle nao linear robusto: um metodo baseado em uma linearizacaopor realimentacao. Tese (Doutorado) — Universidade Federal de Santa Catarina, 2006.Citado 5 vezes nas paginas 18, 20, 31, 32 e 61.

FRANCO, A. Sıntese Convexa de Ganhos para Compensacao Robusta de SistemasLinearizados por Realimentacao. Dissertacao (Mestrado) — CEFET-MG, Divinopolis,MG, 2015. Citado 2 vezes nas paginas 60 e 64.

FRANCO, A.; LEITE, V.; OLIVEIRA, J. Controle automatico de um processo termicocom multiplas entradas e multiplas saıdas utilizando tecnicas de controle moderno. In:SBA. Simposio Brasileiro de Automacao Inteligente. Fortaleza-Ceara, 2013. Citado napagina 20.

https://www.google.ch/patents/US8731879

Referencias 85

FRANCO, A.; OLIVEIRA, L.; LEITE, V. Sıntese de ganhos para compensacao robustade sistemas linearizados por realimentacao. In: SBA. Congresso Brasileiro de Automatica.Vitoria, ES, Brasil, 2016. p. 2695 – 2700. Citado na pagina 62.

GARCES, F.; BECERRA, V.; KAMBHAMPATI, C.; WARWICK, K. Strategies forFeedback Linearisation: A Dynamic Neural Network Approach. London-UK: Springer,2012. Citado 3 vezes nas paginas 23, 27 e 29.

ISIDORI, A. Nonlinear Control Systems: An introduction. 1. ed. New York:Springer-Verlag, Inc, 1985. Citado na pagina 18.

ISIDORI, A. Nonlinear Control Systems. 3. ed. London-UK: Springer-Verlag, 1995.Citado 3 vezes nas paginas 27, 28 e 29.

KARIMI, H.; MOTLAGH, M. Robust feedback linearization control for a non linearizablemimo nonlinear system in the presence of model uncertainties. In: IEEE. 2006 IEEEInternational Conference on Service Operations and Logistics, and Informatics.Shanghai-China, 2006. p. 965–970. Citado na pagina 20.

KHALIL, H. Nonlinear Systems. 3. ed. Upper Saddle River, New Jersey: Prentice Hall,2002. Citado 5 vezes nas paginas 18, 19, 24, 27 e 56.

KLIR, G.; YUAN, B. Fuzzy Sets and Fuzzy Logic: Theory and Applications. New Jersey,USA: Prentice-hall, Inc, 1995. v. 4. Citado 2 vezes nas paginas 33 e 35.

KWONG, W.; PASSINO, K. Dynamically focused fuzzy learning control. IEEETransactions on Systems, Man, and Cybernetics, Part B Cybernetics, v. 26, n. 1, p.53–74, Feb 1996. Citado na pagina 44.

LAYNE, J.; PASSINO, K. Fuzzy model reference learning control for cargo ship steering.IEEE Control Systems, v. 13, n. 6, p. 23–34, Dec 1993. Citado na pagina 43.

LEITE, D.; PALHARES, R.; CAMPOS, V.; GOMIDE, F. Evolving granular fuzzymodel-based control of nonlinear dynamic systems. IEEE Transactions on Fuzzy Systems,v. 23, n. 4, p. 923–938, 2015. Citado 2 vezes nas paginas 52 e 53.

LIMA, E.; GOMIDE, F.; BALLINI, R. Participatory evolving fuzzy modeling. In: IEEE.International Symposium on Evolving Fuzzy Systems. Ambleside, UK, 2006. p. 36–41.Citado 3 vezes nas paginas 52, 53 e 55.

LJUNG, L. System Identification: Theory for the User. 2. ed. Upper Saddle River, NewJersey, USA: Prentice Hall, PTR, 1999. Citado na pagina 47.

MAMDANI, E.; ASSILIAN, S. An experiment in linguistic synthesis with a fuzzy logiccontroller. International Journal of Man-Machine Studies, Elsevier, v. 7, n. 1, p. 1–13,1975. Citado na pagina 33.

MAYR, O.; BRYANT, L. The origins of feedback control. IEEE Transactions onSystems, Man, and Cybernetics, v. 1, n. 4, p. 407–407, 1971. Citado na pagina 17.

OGATA, K. Modern Control Engineering. 4. ed. Upper Saddle River, New Jersey, USA:Prentice Hall, 2003. Citado 2 vezes nas paginas 17 e 94.

Referencias 86

OLIVEIRA, L. Compensacao por Inversao Dinamica Robusta Aplicada a SistemasLinearizados por Realimentacao. Dissertacao (Mestrado) — Centro Federal de EducacaoTecnologica de Minas Gerais e Universidade Federal de Sao Joao Del Rei - Minas Gerais,Belo Horizonte-MG, 2015. Citado 3 vezes nas paginas 18, 20 e 32.

OLIVEIRA, L.; LEITE, V.; SILVA, J.; GOMIDE, F. Granular evolving fuzzy robustfeedback linearization. In: IEEE. 2017 Evolving and Adaptive Intelligent Systems(EAIS). Ljubljana,SLO, 2017. p. 1–8. Citado na pagina 56.

PASSINO, K.; YURKOVICH, S. Fuzzy Control. 1. ed. Boston, MA, USA: Addison-Wesley, 1997. Citado 3 vezes nas paginas 19, 39 e 45.

PEDRYCZ, W. Granular Computing: Analysis and Design of Intelligent Systems. NewYork, USA: CRC press, 2013. Citado na pagina 37.

PEDRYCZ, W.; GOMIDE, F. Fuzzy Systems Engineering: Toward Human-CentricComputing. Hoboken, New Jersey, USA: Wiley Interscience, 2007. Citado 3 vezes naspaginas 35, 36 e 39.

PROCYK, T.; MAMDANI, E. A linguistic self-organizing process controller.Automatica, v. 15, n. 1, p. 15 – 30, 1979. ISSN 0005-1098. Disponıvel em:<http://www.sciencedirect.com/science/article/pii/0005109879900840>. Citado napagina 39.

QUADROS, M. Projeto e Implementacao de Controladores PI Hıbridos e Lineares coma Utilizacao de CLP. Divinopolis, MG: CEFET-MG, 2016. Trabalho de Conclusao deCurso em Engenharia Mecatronica. Citado 3 vezes nas paginas 60, 89 e 94.

SKRJANC, I.; BLAZIC, S.; MATKO, D. Direct fuzzy model-reference adaptive control.International Journal of Intelligent Systems, Wiley Online Library, v. 17, n. 10, p.943–963, 2002. Citado na pagina 19.

SLOTINE, J.; LI, W. Applied Nonlinear Control. Englewood Cliffs, New Jersey, USA:Prentice-Hall, 1991. v. 199. Citado 2 vezes nas paginas 23 e 28.

TAKAGI, T.; SUGENO, M. Fuzzy identification of systems and its applications tomodeling and control. IEEE Transactions on Systems, Man, and Cybernetics, n. 1, p.116–132, 1985. Citado na pagina 38.

VIDYASAGAR, M. Nonlinear systems analysis. 2. ed. Upper Saddle River, New Jersey,USA: Prentice Hall, 1992. Citado na pagina 32.

WILBANKS, G. 50 years of progress in measuring and controlling industrial processes.IEEE Control Systems, v. 16, n. 1, p. 62–66, 1996. Citado na pagina 17.

ZANKL, A. Milestones in Automation. Boston, USA: Publicis, 2006. Citado na pagina17.

ZDESAR, A.; CERMAN, O.; DOVZAN, D.; HUSEK, P.; SKRJANC, I. Fuzzy controlof a helio-crane. Journal of Intelligent & Robotic Systems, Springer Science & BusinessMedia, v. 72, n. 3-4, p. 497, 2013. Citado na pagina 19.

http://www.sciencedirect.com/science/article/pii/0005109879900840

Anexos

88

ANEXO A – Sistema de tanques interativos

Figura A.1 – Diagrama esquematico da planta.

89

ANEXO B – Modelagem do tanque

O processo de modelagem consiste em realizar os procedimentos de calibracao dos

sensores de nıvel, calibracao de vazao da Bomba 01 (curva da bomba) e a calibracao do

Tanque 03 (curva do tanque), ao qual o controlador por realimentacao sera projetado,

considerando o solido nao linear instalado no interior do mesmo, em outras palavras, a

modelagem consiste na aquisicao dos dados para o projeto do controlador da planta.

B.1 Calibracao de sensores

O procedimento de calibracao de instrumento e realizado com o objetivo de esta-

belecer, sob certas condicoes, uma relacao entre os valores indicados pelo instrumento e

os valores correspondentes aos padroes metricos utilizados, e deve ser feito de forma a

assegurar que o instrumento utilizado esteja dentro de um criterio aceitavel, em que, este

nao interfira de forma a prejudicar a execucao do projeto.

De acordo com (QUADROS, 2016), existem dois tipos de calibracao, a estatica

e a dinamica. A calibracao dinamica e a obtencao da funcao de transferencia ou da

representacao no espaco de estados da dinamica do sistema calibrado. Na calibracao

estatica e obtida uma curva que relaciona as entradas a saıda do sistema calibrado, de

acordo com seus valores em regime permanente. Nesta dissertacao sera utilizada apenas

a calibracao estatica, considerando que a dinamica dos sistemas calibrados e desprezıvel

em relacao a dinamica do sistema.

Para calibracao estatica, a entrada e variada sobre uma determinada faixa de valo-

res constantes, que causam na saıda uma variacao tambem sobre uma faixa de valores. O

sinal de entrada e mantido constante ate que a saıda entre em regime permanente e entao,

e feita a media dos valores obtidos e determinada uma relacao entre o sinal fornecido pelo

sensor e o valor medido e supondo que tal relacao seja linear entao pode ser determinada

por uma expressao linear como (B.1).

𝑞𝑜 = 𝑚𝑞𝑖 + 𝑏 (B.1)

ANEXO B. Modelagem do tanque 90

Em que os coeficientes 𝑚 e 𝑏 sao obtidos por meio do metodo dos mınimos qua-

drados, ou seja, por:

𝑚 =𝑁

𝑁∑𝑖,𝑜=1

𝑞𝑖𝑞𝑜 −(

𝑁∑𝑖=1𝑞𝑖

)(𝑁∑

𝑜=1𝑞𝑜

)

𝑁𝑁∑

𝑖=1𝑞2

𝑖 −(


)2 (B.2)

em que 𝑁 sendo o numero de amostras, e

𝑏 =

(𝑁∑

𝑜=1𝑞𝑜

)(𝑁∑

𝑖=1𝑞2

𝑖

)−

⎛⎝ 𝑁∑𝑖,𝑜=1

𝑞𝑖𝑞𝑜

⎞⎠( 𝑁∑𝑖=1𝑞𝑖

)

𝑁𝑁∑

𝑖=1𝑞2

𝑖 −(


)2 (B.3)

Os desvios padroes de 𝑚, 𝑏 e 𝑞𝑜 sao determinados pela equacoes (B.4), (B.5) e (B.6)

𝜎2𝑚 =

𝑁𝜎2𝑞𝑜

𝑁𝑁∑

𝑖=1𝑞2

𝑖 −(


)2 (B.4)

𝜎2𝑏 =

𝜎2𝑞𝑜

𝑁∑𝑖=1𝑞2

𝑖

𝑁𝑁∑

𝑖=1𝑞2

𝑖 −(


)2 (B.5)

𝜎2𝑞𝑜

= 1𝑁

𝑁∑𝑖,𝑜=1

(𝑚𝑞𝑖 + 𝑏− 𝑞𝑜)2 (B.6)

em que 𝜎𝑚, 𝜎𝑏 e 𝜎𝑞𝑜 sao as incertezas de mediacao de cada parametro na Equacao (B.2). Os

limites de confianca estabelecidos sao de 99,7% para o intervalo ±3𝜎𝑚 e ±3𝜎𝑏 considerando

o modelo estatico. Desta forma e apresentada a fundamentacao estatıstica da calibracao

dos dispositivos na planta.

B.1.1 Calibracao do sensor de nıvel

Nesta Secao e abordado o procedimento a ser realizado para calibracao estatica do

sensor de nıvel do Tanque 03 (obtencao da curva do sensor de nıvel), considerando a teoria


estatıstica apresentada em na Secao B.1. Atraves do Procedimento B.1 foi realizada a

coleta dos dados para calibracao do sensor de nıvel do Tanque 03.

Procedimento B.1 Coleta de dados para calibracao do sensor de nıvel do Tanque 03

1. Feche completamente o registro de gaveta;

2. Feche completamente a valvula da saıda do Tanque 03;

3. Acione a Bomba 01 ate que o nıvel de lıquido no Tanque 03 atinja 70𝑐𝑚;

4. Leia o nıvel na escala, salve os valores das leituras provenientes do sensor e faca a

media dos valores lidos;

5. Abra a valvula de saıda do Tanque 03 ate que o nıvel diminua 2𝑐𝑚, depois feche

novamente a valvula de saıda do Tanque 03;

6. Repita os passos 4 e 5 ate que o nıvel de lıquido no Tanque 03 seja menor 10𝑐𝑚.

Desta forma, o Tanque 03 e completamente esvaziado, de forma a abordar na

calibracao os valores de leitura para a situacao de descarga. Utilizando o conjunto de

equacoes (B.1), (B.4), (B.5) e (B.6), foram determinados os valores dos coeficientes 𝑚 e 𝑏

dos respectivos desvios padroes como apresentado em (B.7).

ℎ = 3,504 × 10−3𝑣 − 22,32

+𝜎𝑚 = 3,493 × 10−3 e − 𝜎𝑚 = 3,514 × 10−3

+𝜎𝑏 = −22,12 × 10−3 e − 𝜎𝑏 = −22,52 × 10−3

(B.7)

Em que ℎ e o nıvel de lıquido e 𝑣 e o valor medido no sensor. A calibracao realizada

fornece um intervalo de confianca de 99,7%, logo pode-se afirmar que os valores medidos

estao muito proximos a faixa dos valores reais, conforme verificado na Figura B.1.

B.1.2 Calibracao de vazao da Bomba 01

Para a obtencao da calibracao de vazao da Bomba 01 deve-se seguir o passos des-

critos no Procedimento B.2.

Procedimento B.2 Calibracao de vazao da Bomba 01 no Tanque 03


Sensor ×1040.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8

Nív

el (c

m)

0

20

40

60

80

DadosCurva Ajuste Sensor+3σ

m +3σ

b

-3σm

-3σb

Figura B.1 – Curva de calibracao do sensor de nıvel Tanque 03.

1. Feche completamente o registro de gaveta;

2. Abra a valvula da saıda do Tanque 03, em acordo com as condicoes operacionais

escolhidas, neste caso completamente aberta;

3. Acione a Bomba 01 com sinal de controle em 20%;

4. Aguarde ate o sistema entrar em equilıbrio e faca a medicao do nıvel de lıquido no

Tanque 03;

5. Aumente o sinal de controle em 5%;

6. Repita os passos 4 e 5 ate que o sinal de controle atinja 100% ou ate que o nıvel de

lıquido no Tanque 03 atinja 70𝑐𝑚.

Seguindo tal procedimento, foram obtidos os dados do sinal de controle 𝑢(%), que

equivale a rotacao da Bomba 01 em porcentagem, e da vazao de entrada (𝑞𝑒) entregue ao

Tanque 03. A partir disso, realizou-se um ajuste de primeira ordem da curva utilizando

a ferramenta cftool do MATLAB, apresentada na Figura B.2. O polinomio de ajuste

da vazao de entrada e mostrado em (B.8), juntamente com os seus respectivos desvios

padroes para 𝑚 e 𝑏, respectivamente, em (B.9).


Sinal de controle u(%)20 30 40 50 60 70 80 90 100

Va

zã

o (

cm

3/s

eg

)

0

500

1000

1500

2000

2500

DadosCurva Ajuste Bomba+3σ

m +3σ

b

-3σm

-3σb

Figura B.2 – Curva de calibracao da Bomba 01.

𝑞𝑒 =

⎧⎪⎪⎨⎪⎪⎩0% se 𝑢(%) < 20%

23,15𝑢(%) − 340,6 se 20% ≤ 𝑢(%) ≤ 100%(B.8)

+𝜎𝑚 = 25,97 × 10−3 e − 𝜎𝑚 = 22,32 × 10−3

+𝜎𝑏 = −218,8 e − 𝜎𝑏 = −462,4(B.9)

Considerando que um sinal de controle 𝑢(%) menor que 20% nao causa nenhuma

alteracao no nıvel de lıquido no Tanque 03 entao considera-se que a vazao de entrada e

zero (0), e que a maxima vazao que a Bomba 01 pode aplicar e de 1974,4𝑐𝑚3/𝑠𝑒𝑔, quando

aplicado o maximo sinal de controle, isto e, (𝑢 = 100%). E importante ressaltar que a

introducao do solido nao-linear no Tanque 03 nao altera a curva de calibracao do sensor

de nıvel, nem a curva de vazao da Bomba 01.

B.1.3 Calibracao de vazao do Tanque 03

Em sistemas que envolvem fluxos de fluidos, e necessario distinguir os regimes

de fluxo em laminar ou turbulento, de acordo com o numero de Reynolds. O fluxo e

considerando turbulento se o numero de Reynolds estiver entre 3000 e 4000, sendo menor

que 2000, logo o fluxo e laminar. No caso laminar, o fluxo de fluido ocorre entre linhas de

fluxo sem turbulencia, tais sistemas que envolvem fluxo turbulento, na maior parte, sao


representados por equacoes diferenciais nao lineares, enquanto sistemas de fluxo laminar

podem ser representados por equacoes diferenciais lineares (QUADROS, 2016).

Muitos processos industriais envolvem fluxo de lıquidos atraves de tanques e tubu-

lacoes cujo fluxo muitas vezes e turbulento e nao laminar, no entanto, o sistema podera

ser linearizado se as variacoes das variaveis sao mantidas pequenas. Para objetivos de

controle, pode se entao linearizar o sistema entorno de um ponto de operacao, desde que

os controladores projetados sejam capazes de fornecer respostas satisfatorias, mesmo na

presenca de pequena variacoes no processo (OGATA, 2003).

A representacao do Tanque 03 e apresentada na Figura B.3, em que ℎ e a nıvel

de lıquido em 𝑐𝑚, 𝑞𝑒 a vazao, em 𝑐𝑚3/𝑠𝑒𝑔, de entrada entregue pela bomba e 𝑞𝑠, em

𝑐𝑚3/𝑠𝑒𝑔, a vazao de saıda do Tanque 03. Assim a taxa de variacao do volume e calculada

pela diferenca entre a entrada e a saıda de fluido do tanque, logo e calculada pela usando

(B.10).

𝐴ℎ = 𝑞𝑒 − 𝑞𝑠 (B.10)

qe

qs

h

Figura B.3 – Esquema do Tanque 03.

Em que a area de secao transversal do tanque e dada por 𝐴 = 𝜋𝑟2, com 𝑟 = 31𝑐𝑚

e ℎ e a variacao da altura em relacao ao tempo (𝑑ℎ/𝑑𝑡). Portanto e necessario determinar

a vazao de saıda (𝑞𝑠) em funcao do nıvel da lıquido no tanque. Para isso, foi determinada

a curva de vazao a partir dos dados obtidos com execucao do procedimento B.2. De


maneira semelhante a qual foi determinada a calibracao da Bomba 01, a calibracao/curva

de calibracao de saıda do Tanque 03 foi determinada em funcao do nıvel (ℎ), a partir dos

dados de vazao da bomba (𝑞𝑒).

Isto se deve ao fato de que, em regime permanente, a vazao de saıda e igual a vazao

entrada, entao utilizando-se novamente da ferramenta cftool do MATLAB, foi obtida a

curva representada na Figura B.4, por meio do ajuste polinomial de primeira ordem.

Nível (cm)0 10 20 30 40 50 60 70

Va

zão

(cm

3/s

eg

)

500

1000

1500

2000

DadosCurva Ajuste Tanque+3σ

m -3σ

b

-3σm

-3σb

Figura B.4 – Curva de calibracao do Tanque 03.

Assim, o polinomio de 𝑞𝑠(ℎ) e seu intervalo de validacao sao calculados em (B.11).

Com intervalo de confianca de 99,7% da calibracao no Tanque 03 os desvios padroes sao

mostrados em (B.12). Considerando que para valores de ℎ inferiores a 5,3𝑐𝑚 a vazao

𝑞𝑠 e 0, pois somente a partir deste valor mudancas na vazao de entrada (𝑞𝑒) provocam

variacoes de ℎ. Alem disso, para a maior vazao possıvel (com 𝑢(%) = 100%), o nıvel

corresponde a 70𝑐𝑚, para que o sistema de protecao do tanque nao seja ativado.

Pela Equacao de Bernoulli, a vazao de saıda do tanque e 𝑞𝑠 = (𝜌√

2𝑔ℎ𝐴𝑜), em que

𝜌 e a viscosidade do lıquido e 𝐴𝑜 e a area do do orifıcio de saıda do tanque, ou seja,

𝑞𝑠 depende de√ℎ, porem o que se observa na curva de calibracao/vazao do Tanque 03,

apresentada na Figura B.4 e uma reta, este fato pode ser explicado devido a area do

orifıcio 𝐴𝑜 ser relativamente grande.

𝑞𝑠 =

⎧⎪⎪⎨⎪⎪⎩0 se ℎ < 5,3

14,32ℎ− 680,9 se 5,3 ≤ ℎ ≤ 68(B.11)


+𝜎𝑚 = 16,07 e − 𝜎𝑚 = 10,45

+𝜎𝑏 = 877 e − 𝜎𝑏 = 675,2(B.12)

Logo apos a determinacao da vazao de saıda 𝑞𝑠, dada por (B.11), e da vazao de

entrada 𝑞𝑒, dada por (B.8), a dinamica do sistema e determinada substituindo-se 𝑞𝑠 e 𝑞𝑒

na Equacao (B.10), logo obtem-se a Equacao (B.13).

ℎ = 23,15𝑢− 14,32ℎ− 1021,5𝐴(ℎ) (B.13)

Com a 𝐴(ℎ) sendo a area do solido nao-linear dado em (4.22).

B.1.4 Validacao do modelo

Para validar o modelo (B.13), foram aplicados sinais de controle em degraus na

entrada do sistema em malha aberta para verificar o ponto em que o sistema modelado

estabiliza-se. Inicialmente foi aplicado um sinal de controle 𝑢 = 60% durante 900 segun-

dos, com o objetivo de verificar o ponto de equilıbrio do sistema, passados 900 o sinal de

controle foi modificado desta vez para 𝑢 = 67%, e novamente foi observado o ponto de

equilıbrio do sistema.

0 500 1000 1500 2000 2500 3000 3500Tempo (seg)

10

20

30

40

Níve

l (cm

)

Sist. realSist. modelado

0 500 1000 1500 2000 2500 3000 3500Tempo (seg)

58

60

62

64

66

u(%)

Degraus

Figura B.5 – Validacao do modelo nao-linear.

A Figura B.5 mostra a resposta do sistema real (curva vermelha) quando submetido

a varios degraus do sinal de controle 𝑢 e a resposta do sistema modelado (curva azul) e


Tabela B.1 – Sinais de controle de equilıbrio

ℎ0 26 37 26 28 23 30 26 21 26 31 24 28 31𝑢0 60 67 60 61,5 58,8 63 60 57 60 63 58,8 61,5 60

simulado. E interessante notar que o sistema modelado tem resposta similar ao sistema

real quando submetido aos mesmos sinais de controle. Atraves da analise do grafico

e possıvel perceber que os pontos de equilıbrio do Tanque 03 sao os sinais de controle

mostrados na Tabela B.1.

E possıvel afirmar que o sistema nao-linear modelado aproximou-se de forma sa-

tisfatoria ao sistema real, uma vez que apresentou constante de tempo e ganhos muito

semelhantes ao obtido na pratica.

sistemas linearizados por realimentação fuzzy...

Documents