identificaÇÃo de um sistema multitanques utilizando … · silva, brenna karolyna dos santos -...
Post on 02-Feb-2020
0 Views
Preview:
TRANSCRIPT
UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE TECNOLOGIA – CT
CENTRO DE CIÊNCIAS EXATAS E DA TERRA – CCET
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA E ENGENHARIA DE
PETRÓLEO - PPGCEP
DISSERTAÇÃO DE MESTRADO
IDENTIFICAÇÃO DE UM SISTEMA MULTITANQUES UTILIZANDO
REDES DE FUNÇÕES DE BASE RADIAL
Brenna Karolyna dos Santos Silva
Orientador: Prof. Dr. André Laurindo Maitelli
Natal / RN, fevereiro de 2016
IDENTIFICAÇÃO DE UM SISTEMA MULTITANQUES UTILIZANDO
REDES DE FUNÇÕES DE BASE RADIAL
Brenna Karolyna dos Santos Silva
Natal / RN, fevereiro de 2016
Silva, Brenna Karolyna dos Santos. Identificação de um sistema multitanques utilizando redes defunções de base radial / Brenna Karolyna dos Santos Silva. -Natal, 2016. vii, 87f: il.
Orientador: Prof. Dr. André Laurindo Maitelli.
Dissertação (Mestrado) - Universidade Federal do Rio Grandedo Norte. Centro de Ciências Exatas e da Terra. Programa de PósGraduação em Ciência e Engenharia de Petróleo.
1. Redes neurais artificiais. 2. Funções de base radial. 3.Identificação de sistemas não lineares. 4. Multitanques. I.Maitelli, André Laurindo. II. Título.
Catalogação da Publicação na FonteUniversidade Federal do Rio Grande do Norte - UFRN
Sistema de Bibliotecas - SISBI
Brenna Karolyna dos Santos Silva
Identificação de um Sistema Multitanques Utilizando Redes de Funções de Base Radial
Dissertação de Mestrado apresentada ao
Programa de Pós-Graduação em Ciência e
Engenharia de Petróleo - PPGCEP, da
Universidade Federal do Rio Grande do
Norte, como parte dos requisitos para
obtenção do título de Mestre em Ciência e
Engenharia de Petróleo.
Aprovado em 23 de fevereiro de 2016.
____________________________________
Prof. Dr. André Laurindo Maitelli
Orientador – DCA/UFRN
____________________________________
Prof. Dr. Fábio Meneghetti Ugulino de Araújo
Membro Interno – DCA/UFRN
____________________________________
Prof. Dr. Oscar Gabriel Filho
Membro Externo à Instituição – PRH PB-220/PETROBRAS
SILVA, Brenna Karolyna dos Santos - Identificação de um Sistema Multitanques Utilizando
Redes de Funções de Base Radial. Dissertação de Mestrado, UFRN, Programa de Pós-
Graduação em Ciência e Engenharia de Petróleo. Área de Concentração: Pesquisa e
Desenvolvimento em Ciência e Engenharia de Petróleo. Linha de Pesquisa: Automação na
Indústria de Petróleo e Gás, Natal – RN, Brasil.
Orientador: Prof. Dr. André Laurindo Maitelli
RESUMO
A identificação de sistemas dinâmicos não lineares tem grande importância em várias
áreas da Engenharia. Esta dissertação apresenta uma técnica de identificação de sistemas
utilizando Redes Neurais Artificiais do tipo Funções de Base Radial – RBF aplicada a um
sistema bastante comum na indústria de química e petroquímica, o sistema de multitanques
(tanques acoplados), que apresenta uma dinâmica de natureza não linear. Em tal sistema, o
comportamento não linear deste pode dificultar a identificação e apresentar um modelo que não
reflete seu comportamento real. Esse fator é fonte de motivação para utilizarmos uma
ferramenta matemática tal como a RBF na identificação dos aspectos não lineares do sistema.
Essa rede apresenta potencialidades como habilidade de tratar sistemas complexos, aprendizado
e generalização. A identificação de sistemas utilizando RBF pode ser tratada como um
problema de ajuste de curvas através da combinação das funções de base.
Palavras-Chaves: redes neurais artificiais, funções de base radial, identificação de sistemas
não lineares, multitanques.
SILVA, Brenna Karolyna dos Santos - Identification a Multi tanks System Using Radial Basis
Function Networks. Master's dissertation, UFRN, Graduate Program in Science and Petroleum
Engineering. Concentration Area: Research and Development in Science and Petroleum
Engineering. Research Line: Automation in the oil and gas industry, Natal - RN, Brazil.
Leader: Prof. Dr. André Laurindo Maitelli
ABSTRACT
The identification of nonlinear dynamical systems is of great importance in many areas
of engineering. In this dissertation presents a system identification technique using Artificial
Neural Networks Radial Basis Function type - RBF applied to a very common system in the
chemical and petrochemical industry, multi tanks system (coupled tanks), which features a
dynamic nature not linear. In such a system, the nonlinear behavior of this can make it difficult
to identify and present a model that does not reflect their actual behavior. This factor is a source
of motivation we use a mathematical tool such as RBF in the identification of nonlinear aspects
of the system. This network has potential as ability to handle complex systems, learning and
generalization. Identification systems using RBF can be treated as a curve fitting problem by
combining the basic functions.
Keywords: neural networks, radial basis functions, identification of nonlinear systems, multi
tanks.
“... gradualmente, depois rapidamente’. É assim que a depressão
atinge. Você acorda numa manhã com medo de viver”.
Geração Prozac
i
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Dedico esta dissertação aos meus pais, Sr. Batú e Nice, à minha Tia
Egivânia, minha segunda mãe, minha Alice... Em nome de todo amor
e carinho que a mim é dado ao longo de toda minha vida.
Com muito amor, para vocês!
ii
Brenna Karolyna dos Santos Silva – Fevereiro 2016
AGRADECIMENTOS
A Deus, primeiramente, pela vida a qual tento aproveitar e viver plenamente; por todo amor,
proteção e força para continuar minha jornada.
Aos meus Pais, Sebastião e Eunice, pela educação, zelo e amor com que me criaram, pelo apoio
em todos os momentos, pelos investimentos em meus estudos e por confiarem em mim.
À minha Tia, Egivânia, por esse amor puro e imenso que me tornam uma filha muito querida e
especial; por tanta dedicação a mim e confiança em minha capacidade de realizar meus sonhos.
Ao meu Namorado, que acima de tudo foi meu companheiro, por tanta paciência e estímulo
constante, por aguentar meus choros, por colocar um sorriso em mim e jamais ter me deixado
sozinha.
Ao meu irmão, Iure, e a minha avó Maria de Lourdes, que sempre se fazem presente em minha
vida e contribuem com seu incentivo, carinho e motivos que fazem sorrir e me sentir cuidada.
Ao meu orientador, Prof. Dr. André Laurindo Maitelli por todo conhecimento que me foi
passado, colaboração e orientação para realização deste trabalho; agradeço também pela
paciência e confiança em mim, por não ter desistido de meu sonho. Obrigada de todo coração
Professor.
Ao Programa de Recursos Humanos (PRH – PB 220/UFRN), pelo apoio e suporte financeiro.
Ao Laboratório de Automação em Petróleo (LAUT/UFRN) pela estrutura disponibilizada.
A todos os professores do Programa de Pós-Graduação em Ciência e Engenharia de Petróleo –
PPGCEP.
A todos meus colegas do LAUT, pelas trocas de informações e sugestões, também pela amizade
que foi construída durante esse tempo, em especial a Ana Carla, sempre presente e prestativa.
Ao Dr. Bruno, por cuidar de minha saúde, sempre priorizando meu desempenho acadêmico.
A Dra. Tatiana, por estar comigo apoiando e ajudando a vencer e mim mesma.
Meu agradecimento se estende a todos aqueles que contribuíram de alguma forma para a
realização dessa dissertação de mestrado.
Muito obrigada!
iii
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Sumário
LISTA DE FIGURAS .............................................................................................................. IV
1. INTRODUÇÃO .................................................................................................................... 2
1.1 - Objetivo.......................................................................................................................... 3
1.2 - Definição do problema .................................................................................................. 3
1.3 - Apresentação do trabalho............................................................................................... 3
2. ASPECTOS TEÓRICOS ..................................................................................................... 6
2.1 - Identificação de Sistemas............................................................................................... 6
2.1.1 - Sistemas dinâmicos................................................................................................. 6
2.1.2 - Modelagem.............................................................................................................. 8
2.1.3 - Estimação de parâmetros....................................................................................... 11
2.1.4 - Estimador dos mínimosquadrados......................................................................... 11
2.2 - Redes de funções de base radial.................................................................................... 14
2.2.1 - Redes Neurais Artificiais....................................................................................... 14
2.2.2 - Redes de funções de base radial............................................................................ 18
3. ESTADO DA ARTE ........................................................................................................... 24
4. METODOLOGIA ............................................................................................................... 28
4.1 - Representações lineares................................................................................................ 28
4.1.1 - Modelo AR............................................................................................................. 29
4.1.2 - Autoregressivo com média móvel.......................................................................... 30
4.1.3 - Autoregressivo com entradas externas................................................................... 30
4.1.4 - Modelo autoregressivo com média móvel e entradas externas.............................. 30
4.2 - Representações não lineares......................................................................................... 32
4.3 - Redes neurais artificiais do tipo RBF em modelagem não linear................................ 33
4.4 - Sistema de tanques acoplados...................................................................................... 37
4.5 - Modelagem matemática............................................................................................... 39
5. RESULTADOS OBTIDOS ................................................................................................ 55
5.1 - Análises dos resultados obtidos da identificação......................................................... 55
6. CONCLUSÕES ................................................................................................................... 69
REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................. 72
APÊNDICE ............................................................................................................................. 78
iv
Brenna Karolyna dos Santos Silva – Fevereiro 2016
LISTA DE FIGURAS
Figura 2.1. Representação gráfica de um sistema sofrendo estímulos externos............................... 7
Figura 2.2. Tempo continuo............................................................................................................. 8
Figura 2.3. Tempo discreto............................................................................................................... 8
Figura 2.4. Representação gráfica de um problema de identificação de sistemas............................ 9
Figura 2.5. Representação gráfica das etapas envolvidas na identificação de sistemas................... 10
Figura 2.6. Neurônio artificial.......................................................................................................... 14
Figura 2.7. Função limiar................................................................................................................. 15
Figura 2.8. Função linear ................................................................................................................. 15
Figura 2.9. Função sigmoide............................................................................................................ 16
Figura 2.10. Função gaussiana......................................................................................................... 16
Figura 2.11. Arquitetura de uma RBF com uma única camada oculta............................................ 19
Figura 2.12. Função gaussiana......................................................................................................... 20
Figura 2.13. Soma ponderada de funções de base radial do tipo gaussiana..................................... 21
Figura 2.14. Estrutura implementada para identificação utilizando rede RBF................................ 22
Figura 4.1. Diagrama em blocos de um sistema dinâmico não linear.............................................. 32
Figura 4.2. Rede neural NARX para um sistema SISO.................................................................... 34
Figura 4.3. Sistema de tanques acoplados implementado no simulink®.......................................... 38
Figura 4.4. Modelo do sistema de tanques acoplados implementado no simulink®........................ 39
Figura 4.5. Sistema utilizado na simulação para obtenção do conjunto entrada / saída utilizado
no processo de identificação.............................................................................................................
43
Figura 4.6. Visualização do primeiro e do segundo tanque com suas respectivas entradas e as
saídas acrescidas de ruído...............................................................................................................
44
Figura 4.7. Visualização da soma do valor absoluto de um sinal senoidal...................................... 44
Figura 4.8. Visualização do sinal de entrada no primeiro tanque, o sinal de entrada composto das
10000 primeiras amostras e o nível de saída no primeiro tanque.....................................................
46
Figura 4.9. Visualização do sinal de entrada no segundo tanque, o sinal de entrada composto das
10000 primeiras amostras e o nível de saída no segundo tanque.....................................................
47
Figura 4.10. Visualização do sinal de entrada no terceiro tanque, o sinal de entrada composto
das 10000 primeiras amostras e o nível de saída no terceiro tanque................................................
48
Figura 4.11. Visualização do sinal de entrada no quarto tanque, o sinal de entrada composto das
10000 primeiras amostras e o nível de saída no quarto tanque........................................................
49
Figura 4.12. Visualização do sinal de entrada no quinto tanque, o sinal de entrada composto das
10000 primeiras amostras e o nível de saída no quinto tanque........................................................
50
Figura 4.13. Gráfico dos dados de entrada / saída do primeiro tanque utilizados durante a fase de
treinamento.......................................................................................................................................
51
Figura 4.14. Gráfico dos dados de entrada / saída do segundo tanque utilizados durante a fase de
treinamento.......................................................................................................................................
52
Figura 4.15. Gráfico dos dados de entrada / saída do terceiro tanque utilizados durante a fase de
treinamento.......................................................................................................................................
52
Figura 4.16. Gráfico dos dados de entrada / saída do quarto tanque utilizados durante a fase de
treinamento.......................................................................................................................................
53
Figura 4.17. Gráfico dos dados de entrada / saída do quinto tanque utilizados durante a fase de
treinamento.......................................................................................................................................
53
Figura 5.1a. Gráfico comparativo do nível no primeiro tanque onde temos os dados acrescidos de
ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a
presença de ruído, tido como o desejado (preto, tracejado)..............................................................
56
Figura 5.1b. As mil primeiras amostras referentes a Figura 5.1a..................................................... 57
v
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.2a. Gráfico comparativo do nível no segundo tanque onde temos os dados acrescidos de
ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a
presença de ruído, tido como o desejado (preto, tracejado)..............................................................
57
Figura 5.2b. As mil primeiras amostras referentes a Figura 5.2a..................................................... 58
Figura 5.3a. Gráfico comparativo do nível no terceiro tanque onde temos os dados acrescidos de
ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a
presença de ruído, tido como o desejado (preto, tracejado)...............................................................
58
Figura 5.3b. As mil primeiras amostras referentes a Figura 5.3a..................................................... 59
Figura 5.4a. Gráfico comparativo do nível no quarto tanque onde temos os dados acrescidos de
ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a
presença de ruído, tido como o desejado (preto, tracejado)...............................................................
59
Figura 5.4b. As mil primeiras amostras referentes a Figura 5.4a..................................................... 60
Figura 5.5a. Gráfico comparativo do nível no quinto tanque onde temos os dados acrescidos de
ruído (em azul, pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a
presença de ruído, tido como o desejado (preto, tracejado)...............................................................
60
Figura 5.5b. As mil primeiras amostras referentes a figura 5.5a...................................................... 61
Figura 5.6. Gráfico do resultado obtido na validação do nível no primeiro tanque para o sinal de
entrada apresentado..........................................................................................................................
62
Figura 5.7. Gráfico do resultado obtido na validação do nível no segundo tanque para o sinal de
entrada apresentado..........................................................................................................................
63
Figura 5.8. Gráfico do resultado obtido na validação do nível no terceiro tanque para o sinal de
entrada apresentado..........................................................................................................................
64
Figura 5.9. Gráfico do resultado obtido na validação do nível no quarto tanque para o sinal de
entrada apresentado..........................................................................................................................
65
Figura 5.10. Gráfico do resultado obtido na validação do nível no quinto tanque para o sinal de
entrada apresentado..........................................................................................................................
66
vi
Brenna Karolyna dos Santos Silva – Fevereiro 2016
LISTA DE TABELAS
Tabela 1. Parâmetros escolhidos durante a fase de treinamento.................................. 55
Tabela 2. Erro médio quadrático na etapa de validação............................................... 66
vii
Brenna Karolyna dos Santos Silva – Fevereiro 2016
LISTA DE ABREVIAÇÕES E SIGLAS
AR autoregressive
ARMA autoregressive moving average model structure
ARX autoregressive model structure with exogenous inputs
BIBO bounded input bounded output
BFGS Broyden-Fletcher-Goldfarb-Shanno
BJ
BP
Box-Jenkins model structure
back propagation
CPNN constructive probabilistic neural network
FIR finite impulse response
GN Gauss-Newton
HMLP hybrid multilayered perceptron
LM
LMS
Levenberg-Marquardt
least mean square
MIMO multi inputs multi outputs
MISO multi inputs and single outputs
MLP multi layer perceptron
NARX
NARMAX
non-linear autoregressive model structure with exogenous inputs
non-linear autoregressive moving average model structure with
exogenous inputs
NNARX
neural network autoregressive
NNARMA neural network autoregressive moving average output error model
OE output error model
OLS orthogonal least square
RNA’S Redes neurais artificiais
RBF Radial basis function
RMSE
WNN
Roots Mean Squared Error
Wavelets Neural Networks
Capítulo 1
Introdução
Capítulo 1 - Introdução
2
Brenna Karolyna dos Santos Silva – Fevereiro 2016
1. Introdução
A indústria petrolífera visa cada vez mais elevar a qualidade dos produtos e segurança
na operação, bem como alcançar níveis elevados de eficiência. Para isso é necessário que os
equipamentos envolvidos no processo estejam em boas condições de operação. No entanto, tais
equipamentos apresentam um alto grau de não linearidades que influenciam diretamente na
dinâmica do sistema. Daí a importância de se obter um modelo matemático que possa ser
implementado computacionalmente, sendo possível utilizá-lo na otimização e controle de
plantas sem interferir na estabilidade do sistema, por exemplo.
A área do conhecimento que desenvolve modelos matemáticos empíricos relacionando
diferentes variáveis (entrada / saída) e a determinação dos parâmetros associados ao modelo é
chamada de identificação (COELHO, 2004).
A identificação de sistemas pode ser tratada como um problema de otimização que
envolve algumas medidas para adequação de modelos candidatos a representar um processo
real (COELHO, 2004). Para obtenção de modelos, alguns passos são necessários: coleta de
dados, detecção de não linearidades, seleção de uma estrutura de modelo, estimação de
parâmetros e validação do modelo. Com um modelo matemático que represente o processo real
é possível desenvolver diversos estudos como: detecção de falhas, controle de processos,
análise de comportamento etc. Uma potencialidade da identificação de sistemas é a capacidade
de se prever o comportamento dinâmico de um sistema com certo tempo de antecedência
tornando possível a tomada de decisões preventivas quando o sistema estiver sujeito a falhas
ou mudanças em sua dinâmica. Isso justifica a fundamental importância em compreender um
sistema antes de manipulá-lo.
Nesta dissertação a ferramenta computacional utilizada na identificação é uma rede
neural do tipo Funções de Base Radial – RBF (“radial basis funtion”). As redes neurais
artificiais (RNA) são aplicáveis na área de identificação e controle de sistemas não lineares
devido suas características de capacidade de aprendizado através de treinamento e por serem
mapeadores universais de funções (LIPPMANN, 1987). A identificação de sistemas dinâmicos
utilizando RBF pode ser tratada como um problema de ajuste de curvas (aproximação de
funções), nesse contexto, as redes de função de base radial possuem apenas uma camada oculta,
cujos neurônios possuem função de ativação não linear, geralmente gaussianas, e a estrutura
Capítulo 1 - Introdução
3
Brenna Karolyna dos Santos Silva – Fevereiro 2016
pode ser entendida como um modelo matemático que realiza aproximação de funções (ou
interpolação) através da combinação linear de funções de base gaussianas.
1.1 - Objetivo
O objetivo deste trabalho é realizar a identificação de um sistema bastante utilizado na
indústria petrolífera, o sistema multitanques, utilizando uma rede de funções de base radial.
1.2 - Definição do Problema
A construção de um modelo neural capaz de descrever o comportamento dinâmico de
um sistema não linear com múltiplas entradas e múltiplas saídas.
1.3 - Apresentação do trabalho
A dissertação está organizada da seguinte forma:
No Capítulo 2 apresentamos os aspectos teóricos em duas áreas de conhecimento:
identificação de sistemas e redes neurais artificiais. Traz conceitos básicos sobre identificação
de sistemas, envolvendo conceitos sobre a modelagem matemática, as etapas de um processo
de identificação e um algoritmo de estimação baseado no método dos mínimos quadrados. É
apresentado as redes neurais de funções de base radial bem como as funções de ativações
comumente utilizadas em projetos que envolvem redes neurais artificias, a topologia da rede e
seu algoritmo de treinamento.
O Capítulo 3 apresenta o estado da arte com o objetivo de contextualizar a relevância
do tema apresentando algumas pesquisas desenvolvidas nesta área de estudo ao longo dos anos.
No Capítulos 4 apresentamos a metodologia utilizada no uso das redes de funções de
base radial na identificação de sistemas encontrados na literatura para apresentar a eficácia do
algoritmo na identificação de sistemas dinâmicos de natureza não linear, bem como são
apresentados resultados para a visualização de tal eficácia e o método utilizado no treinamento
da rede neural.
Capítulo 1 - Introdução
4
Brenna Karolyna dos Santos Silva – Fevereiro 2016
No Capítulo 5 finalmente apresentamos a identificação proposta para a conclusão do
trabalho, expandindo a técnica de identificação para sistemas com múltiplas entradas e
múltiplas saídas e uma análise dos resultados obtidos, em seguida é apresentado o Capítulo 6
com as conclusões obtidas e perspectivas de trabalhos futuros.
Capítulo 2
Aspectos Teóricos
Capítulo 2 – Aspectos Teóricos
6
Brenna Karolyna dos Santos Silva – Fevereiro 2016
2. Aspectos Teóricos
Neste capítulo são apresentadas as definições básicas sobre sistemas, os aspectos
teóricos de modelagem e identificação de sistemas dinâmicos, e da estimação de parâmetros, e
também algumas definições básicas sobre redes neurais artificiais e alguns aspectos teóricos
das redes de funções de base radial.
2.1- Identificação de sistemas
Conhecer o comportamento dinâmico do sistema é de vital importância em diversas
áreas do conhecimento, dentre elas a petrolífera. Identificação de sistemas é a capacidade de se
prever o comportamento dinâmico de um sistema a partir do conjunto entrada – saída.
Existem diversas formas e técnicas para se obter modelos matemáticos que
representem o comportamento dinâmico do sistema, uma delas é a modelagem caixa branca,
em que se tem conhecimento aprofundado do sistema e das leis físicas que regem tal sistema.
Em modelos obtidos sem nenhum conhecimento prévio do sistema e nenhuma equação
matemática é assumida, a modelagem é caixa preta. Quando o modelo obtido não atender
nenhuma técnica dos procedimentos anteriores, a modelagem é caixa cinza.
A seleção de tais modelos matemáticos e ajustes de parâmetros são influenciados por
diversos fatores: (i) conhecimento a priori do sistema (grau de não linearidade, atraso de
transporte etc.); (ii) propriedades do modelo a ser identificado (complexidade); (iii) seleção da
medida de erro a ser minimizado; (iv) presença de ruídos.
2.1.2 - Sistemas dinâmicos
Um sistema pode ser definido como, uma combinação de componentes que atuam em
conjunto, onde suas variáveis internas interagem realizando um objetivo em que suas
propriedades pretendem ser estudadas, produzindo sinas denominados saídas (AGUIRRE,
2007A). Colunas de destilação, vasos separadores, tanques de armazenamento, caldeiras, fornos
etc., são alguns exemplos de sistemas. A Figura 2.1 ilustra a representação gráfica de um
sistema sofrendo estímulos externos, denominados de entradas, produzindo uma saída em
relação à entrada.
Capítulo 2 – Aspectos Teóricos
7
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 2.1. Representação gráfica de um sistema sofrendo estímulos externos.
O sistema pode ser considerado como estático ou dinâmico. Quando o valor atual da
saída do sistema y(t) depender apenas do valor atual da entrada u(t) aplicada é classificado como
estático, e como sendo dinâmico quando o valor atual de sua saída y(t) depender do valor atual
da entrada u(t) e também dos valores de entrada e saídas passados.
O sistema pode ser classificado como linear se sua resposta, quando excitado pela
combinação linear de duas entradas, for igual à combinação linear das saídas que resultam da
aplicação isolada de cada entrada (AGUIRRE, 2007). Os sistemas lineares são geralmente
representados por equações algébricas. Já quando o sistema não apresenta nenhuma das
propriedades citadas anteriormente e o seu desempenho operacional é marcado por oscilações
em sua dinâmica o sistema é dito não linear.
Quando o sistema possui uma única entrada e uma única saída, o sistema é considerado
como sendo monovariável. Quando possui mais de uma entrada e/ou mais de uma saída, o
sistema é multivariável (AGUIRRE, 2007A).
Os sinais de entrada e saída evoluem em relação do tempo, logo o sistema é dito de
tempo contínuo quando suas entradas u(t) e saídas y(t) são definidas no tempo contínuo
(representadas por equações diferenciais). Quando as entradas u(t) e saídas y(t) só são definidas
no tempo discreto (representadas por equações à diferença), o sistema é dito de tempo discreto
(AGUIRRE, 2007).
Planta Entradas Saída do modelo
Capítulo 2 – Aspectos Teóricos
8
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Quando as características de um sistema não mudam ao longo do tempo, ou seja, sob
as mesmas condições iniciais respondem da mesma maneira a um sinal de entrada,
independente de quando o sinal é aplicado, o sistema é dito como invariante no tempo. Já
quando suas características sofrem mudanças ao longo do tempo o sistema é variante no tempo.
O sistema pode ser determinístico quando para um dado estado inicial e uma dada
entrada houver apenas uma saída possível (AGUIRRE, 2007). Ou seja, o conhecimento das
condições iniciais e da entrada do sistema, determina unicamente sua saída. Se as entradas e as
saídas forem variáveis aleatórias o sistema pode ser considerado como sendo estocástico
(AGUIRRE, 2007).
2.1.3 - Modelagem
Um modelo pode ser entendido como um conjunto de regras que descrevem o
comportamento do sistema fornecendo informações de uma ou mais variáveis observadas
(COELHO, 2004). Modelos podem ser mentais, gráficos, algorítmicos e matemáticos.
A identificação de sistemas é a área do conhecimento que desenvolve modelos
matemáticos relacionando diferentes variáveis (entrada/saída) e a determinação dos parâmetros
associados ao modelo.
Em outras palavras, identificar um sistema significa construir um modelo matemático
que represente, o mais próximo possível, as características da dinâmica do sistema real. Através
do modelo matemático obtido que represente o sistema é possível desenvolver diversos estudos
como, por exemplo: análise de comportamento, e inferir propriedades dinâmicas e estatísticas
do sistema real (AGUIRRE, 2007).
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
Figura 2.2. Tempo continuo
Figura 2.3. Tempo discreto
Capítulo 2 – Aspectos Teóricos
9
Brenna Karolyna dos Santos Silva – Fevereiro 2016
A Figura 2.4 ilustra um problema de identificação de sistemas que consiste em ao se
aplicar um conjunto de dados de entrada à técnica de identificação, as variáveis interagem
internamente resultando em um modelo matemático como saída estimada.
Figura 2.4. Representação gráfica de um problema de identificação de sistemas
As etapas envolvidas para a obtenção de um modelo matemático através da
identificação de sistemas são:
1. Testes dinâmicos e coleta de dados: é necessária a obtenção de um conjunto de dados
entrada/saída, que representem o comportamento dinâmico do sistema.
2. Escolha da representação matemática a ser utilizada: se o modelo do sistema é linear
ou não linear, contínuo ou discreto, etc.
3. Determinação da estrutura do modelo: neste caso, será utilizada uma rede de funções
de base radial para estrutura do modelo.
4. Estimação de parâmetros: esta etapa começa com a escolha do algoritmo a ser
utilizado.
Capítulo 2 – Aspectos Teóricos
10
Brenna Karolyna dos Santos Silva – Fevereiro 2016
5. Validação do modelo: tendo sido obtido um conjunto de modelos, é necessário verificar
se eles incorporam ou não as características de interesse do sistema original.
Figura 2.5. Representação gráfica das etapas envolvidas na identificação de sistemas
O processo de construção do modelo que represente um determinado sistema é
definido como modelagem. Na identificação de sistemas, a modelagem consiste em determinar
ou construir as equações matemáticas ou regras que melhor regem as características do sistema
dinâmico (AGUIRRE, 2007B).
Tais modelos obtidos podem ser definidos como sendo modelos paramétricos, quando
utilizam estruturas matemáticas parametrizadas para descrever o comportamento dinâmico
original no domínio do tempo. Esses parâmetros são ajustados por algoritmos de estimação a
partir dos dados medidos. Os modelos não paramétricos geram modelos no domínio do tempo,
porém o comportamento dinâmico do sistema é determinado através de relações entre os dados
disponíveis (ex. correlação), (COELHO, 2004).
Muitas são as técnicas para se obter modelos matemáticos que representem o
comportamento dinâmico de um sistema; uma delas é a modelagem caixa branca, em que se
tem conhecimento aprofundado do sistema e das leis físicas que regem tal sistema. Em modelos
obtidos sem nenhum conhecimento prévio do sistema e onde nenhuma equação matemática é
assumida, a modelagem é caixa preta. Quando o processo de modelagem não atender às técnicas
anteriormente citadas, a modelagem é dita ser caixa cinza (COELHO, 2004).
Capítulo 2 – Aspectos Teóricos
11
Brenna Karolyna dos Santos Silva – Fevereiro 2016
O tipo de problema, uso pretendido, disponibilidade e qualidade dos dados utilizados,
restrições na manipulação do sistema entre outros, são alguns pré-requisitos para a escolha do
modelo. Geralmente são preferíveis os modelos complexos que permitam a ampliação e a
redução de forma simples. O conhecimento a priori do sistema também influencia na escolha
do modelo (AGUIRRE, 2007B).
Através da combinação entre conhecimento a priori, tentativa e erro e avaliação do
erro entre a saída real do sistema e a saída estimada é possível selecionar a ordem do modelo.
A escolha da estrutura e complexidade do modelo é normalmente feita por tentativa e erro,
manualmente.
2.1.4 - Estimação de parâmetros
A estimação de parâmetros é uma das principais etapas envolvidas no processo de
identificação de sistemas. Essa etapa ocorre logo após a modelagem, determinando as
constantes matemáticas presentes nas equações que descrevem o sistema (AGUIRRE, 2007 B).
A evolução da entrada e saída é levada em conta na estimação de parâmetros. Logo,
as informações usadas vêm na forma de sinais obtidos do sistema dinâmico. Esses sinais podem
passar por um pré-processamento como uma filtragem ou remoção de ruídos, antes de serem
utilizados para a determinação dos parâmetros desconhecidos do modelo (AGUIRRE, 2007).
Adicionar uma regra que traduz os critérios a serem observados na semelhança entre
o modelo e o sistema real, é necessária para encontrar os parâmetros da equação que descreve
o modelo. Basicamente consiste na sintetização de um critério de desempenho ou uma função
custo, geralmente minimizada. Um critério bastante utilizado nessa etapa é o erro médio
quadrático entre as amostras e o valor apresentado pelo modelo, como exemplo podemos citar
o método dos mínimos quadrados (AGUIRRE, 2007 B).
2.1.5 - Estimador dos mínimos quadrados
Em geral, no problema de mínimos quadrados a saída do modelo 𝑦 é dada por uma
expressão linearmente parametrizada (AGUIRRE, 2007).
𝑦 = 𝜃1𝑓1(𝒖) + 𝜃2𝑓2(𝒖) + ⋯+ 𝜃𝑛𝑓𝑛(𝒖)
(2.1)
Capítulo 2 – Aspectos Teóricos
12
Brenna Karolyna dos Santos Silva – Fevereiro 2016
em que 𝒖 = [𝑢1, ⋯ , 𝑢𝒎]𝑻 é o vetor de entradas, 𝑓1, ⋯ , 𝑓𝑛 são funções desconhecidas de 𝒖 , e
𝜃1, ⋯ , 𝜃𝑛 são os parâmetros desconhecidos a serem estimados (AGUIRRE, 2007). Em
estatística, este modelo é conhecido como modelo de regressão linear.
Para identificar os parâmetros desconhecidos 𝜃𝑖, usualmente fazemos experimentos
para obtermos o conjunto de dados de treinamento composto pelo par {(𝑢𝑖; 𝑦𝑖), 𝑖 = 1,⋯ ,𝑚}
que representam o conjunto entrada / saída do sistema a ser identificado. Substituindo cada par
de dados na equação (2.2) temos o seguinte sistema de equações lineares:
{
𝑓1(𝒖1)𝜃1 + 𝑓2(𝒖1)𝜃2 +⋯+ 𝑓1(𝒖1)𝜃𝑛 = 𝑦1𝑓1(𝒖2)𝜃1 + 𝑓2(𝒖2)𝜃2 +⋯+ 𝑓1(𝒖2)𝜃𝑛 = 𝑦2𝑓1(𝒖3)𝜃1 + 𝑓2(𝒖3)𝜃2 +⋯+ 𝑓1(𝒖3)𝜃1 = 𝑦3
⋮𝑓1(𝒖𝑚)𝜃1 + 𝑓2(𝒖𝑚)𝜃2 +⋯+ 𝑓1(𝒖𝑚)𝜃1 = 𝑦𝑚
(2.2)
Utilizando a relação matricial, temos:
𝑨𝜽 = 𝒚
(2.3)
em que 𝑨 é uma matriz 𝑚 𝑥 𝑛
𝑨 = [𝑓1(𝒖1) ⋯ 𝑓𝑛(𝒖1)⋮ ⋱ ⋮
𝑓1(𝒖𝑚) ⋯ 𝑓𝑛(𝒖𝑚)]
𝜽 é um vetor 𝑛 𝑥 1 de parâmetros desconhecidos:
𝜽 = [𝜃1⋮𝜃𝑛
]
e 𝒚 é um vetor 𝑚 𝑥 1,
Capítulo 2 – Aspectos Teóricos
13
Brenna Karolyna dos Santos Silva – Fevereiro 2016
𝒚 = [
𝑦1⋮𝑦𝑚]
Se 𝑨 for uma matriz quadrada e não singular (invertível), podemos obter 𝜽 através da
seguinte expressão:
𝑨𝜽 = 𝒚
𝑨−1𝑨𝜽 = 𝑨−1𝒚
𝜽 = 𝑨−1𝒚
(2.4)
No entanto, como geralmente 𝑨 é uma matriz não quadrada (𝑚 ≠ 𝑛) então encontrar
a solução da Equação (2.3), equivalente a aproximar 𝜽 ≅ �� através da minimização do erro
médio quadrático definido por:
𝐸(𝜽) =∑(𝑦𝑖 − 𝑎𝑖𝑇𝜃)2
𝑚
𝑖=1
= 𝒆𝑇𝒆 = (𝒚 − 𝑨𝜽)𝑇(𝒚 − 𝑨𝜽)
(2.5)
em que 𝒆 = 𝒚 − 𝑨𝜽 é o vetor erro produzido pela escolha do parâmetro 𝜽. O erro médio
quadrático da equação (2.5) é minimizado quando 𝜽 = ��, e o método é chamado de estimador
de mínimos quadrados – LSE, que satisfaz a equação normal:
𝑨𝑇𝑨�� = 𝑨𝑇𝒚
(2.6)
Se 𝑨𝑇𝑨 é não singular, então a solução da equação normal para �� é única, ou seja:
�� = (𝑨𝑇𝑨)−1𝑨𝑇𝒚
(2.7)
Capítulo 2 – Aspectos Teóricos
14
Brenna Karolyna dos Santos Silva – Fevereiro 2016
2.2 - Redes de funções de base radial
Redes de funções de base radial é um tipo de rede neural artificial bastante utilizada
na teoria de aproximação de funções. Esse tipo de rede possui apenas uma única camada oculta,
diferentemente das redes de múltiplas camadas, onde o processamento dos dados é realizado o
seu treinamento é baseado no método dos mínimos quadrados.
2.2.1 - Redes Neurais Artificiais
O cérebro humano é composto por bilhões de neurônios. Os neurônios são células
formadas por corpo, dendritos e axônios. Os dendritos são responsáveis por captar os estímulos
e os transmitir ao corpo dos neurônios onde são processados. A conexão entre um axônio de
um neurônio e um dendrito de outro é denominada sinapse. A sinapse é a unidade funcional
básica envolvendo as membranas plasmáticas de dois neurônios, de modo a formar uma junção
pontual (o tamanho de uma junção sináptica é menor do que 1 mm) e orientada do neurônio
pré-sináptico para o pós-sináptico (KHANNA, 1990).
Buscando um modelo computacional que representasse o funcionamento do cérebro,
em 1943 McCulloch e Pitts desenvolveram um modelo matemático que resultaria na concepção
de neurônio artificial (HAYKIN, 2009).
O modelo matemático de um neurônio artificial é ilustrado na Figura 2.6, onde são
observados os elementos básicos que compõe um neurônio:
Figura 2.6. Neurônio artificial
Pesos sinápticos – estrutura que une os neurônios, formando as RNAs e tem
capacidade de controlar os impulsos propagados na rede.
Capítulo 2 – Aspectos Teóricos
15
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Somador – combinador linear responsável pela adição dos sinais de entrada
ponderados pelos pesos sinápticos.
Função de ativação – define o valor da saída do neurônio.
Existem alguns tipos de funções de ativação bastante utilizadas para definir as saídas
da RNA. São elas:
1. Função limiar, que segundo Haykin (2009) descreve a propriedade do modelo
neuronal de McCulloch e Pitts.
Figura 2.7. Função limiar
2. Função linear, onde a saída linear para os dados de entrada é definida por um
valor real.
Figura 2.8. Função linear
1 2 3 4 5 6 7 8 9 10
0
0.2
0.4
0.6
0.8
1
-3 -2 -1 0 1 2 3-6
-4
-2
0
2
4
6
Capítulo 2 – Aspectos Teóricos
16
Brenna Karolyna dos Santos Silva – Fevereiro 2016
3. Função sigmóide, em forma de ‘s’, essa função de ativação é a mais utilizada na
teoria de RNAs. Apresenta um balanceamento entre o comportamento linear e não
linear (HAYKIN, 2009). Ela é ilustrada na figura como uma tangente sigmóide.
Figura 2.9. Função sigmoide
4. Função gaussiana usada principalmente em RNAs de base radial. Função de
ativação bastante utilizada na aproximação de funções através do mapeamento dos
dados para um espaço de alta dimensionalidade.
Figura 2.10. Função gaussiana
O neurônio artificial é uma estrutura com capacidade de processar informações, o que
é de fundamental importância no funcionamento da rede neural (HAYKIN, 2001). As
-3 -2 -1 0 1 2 3-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
-3 -2 -1 0 1 2 30
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Capítulo 2 – Aspectos Teóricos
17
Brenna Karolyna dos Santos Silva – Fevereiro 2016
combinações de diversos neurônios artificiais feita pela conexão entre os pesos sinápticos
formam uma rede neural artificial.
Segundo Haykin (2009), uma Rede Neural Artificial (RNA) é um processador
maciçamente paralelamente distribuído constituído de unidades de processamento simples, que
têm a propensão natural para armazenar conhecimento experimental e torna-lo disponível para
uso. A semelhança da rede neural com o cérebro humano se dá em dois aspectos: o
conhecimento é adquirido pela rede a partir de seu ambiente através de um processador de
aprendizagem. E, forças de conexão entre neurônios, conhecidas como pesos sinápticos, são
utilizadas para armazenar o conhecimento adquirido.
As RNAs apresentam potencialidades que podem ser aplicadas à identificação de
sistemas, modelagem, reconhecimento de padrões, processamento de sinais, entre outros.
Haykin (2001) aborda as características das RNAs como:
Processamento paralelo inspirado no comportamento do cérebro humano, logo
as informações não são buscadas sequencialmente.
Aprendizagem, capacidade que a rede tem de aprender determinado
conhecimento através de suas iterações sem necessariamente explicitar o
algoritmo para executar determinada tarefa.
Associação, característica que permite que a rede associe diferentes padrões
em seu treinamento.
Generalização, habilidade da RNA em lidar com dados não lineares e
responder satisfatoriamente a um sinal de entrada nunca visto anteriormente,
apenas pela similaridade dos dados já apresentados.
Abstração, capacidade de a rede abstrair informações a partir de um conjunto
de entradas.
Tolerância à falha, o que permite que a rede continue apresentando resultados
satisfatórios em caso de falha em algum neurônio.
Robustez, o que faz com que mesmo perdendo elementos de processamento a
rede não funcione inapropriadamente e sim continue seu processamento.
Segundo Sjoberg (1995), as características das RNAs as tornam potencialmente
aplicáveis a problemas como: classificação de padrões, identificação, diagnóstico,
processamento de sinais e de imagens, otimização e controle.
Capítulo 2 – Aspectos Teóricos
18
Brenna Karolyna dos Santos Silva – Fevereiro 2016
A arquitetura de uma RNA é basicamente organizada em camadas, que podem estrar
interligadas ou não ás camadas posteriores. Geralmente essas camadas são divididas da seguinte
maneira:
Camada de entrada – os padrões são apresentados à rede;
Camadas ocultas – onde é realizado a maior do processamento de dados
através das conexões ponderadas;
Camada de saída – onde o resultado é concluído e apresentado.
Uma RNA pode ser considerada como perceptron de camada única ou perceptron de
múltiplas camadas. Em 1958, Rosemblat desenvolveu seu modelo de perceptron, e definia o
perceptron como sendo um único neurônio com sinapses ajustáveis e bias. Segundo Haykin
(2001) o perceptron é a forma mais simples de uma rede neural. Basicamente a topologia de
um peceptron de única camada é composta por três níveis, porem são definidas como de uma
única camada pois o processamento de dados ocorre basicamente em uma única camada, na
saída da rede. Já o perceptron de múltiplas camadas é a forma mais complexa das RNAs, uma
vez que apresentam duas ou mais camadas que realizam o processamento dos dados, ou seja, o
sinal de entrada se propaga para frente camada por camada até que a camada de saída conclua
o processamento e mostre o resultado (BRAGA et al., 2000).
Uma etapa bastante importante no funcionamento de uma RNA é a fase de
aprendizado, onde a rede aprende a partir de iterações e ajusta seus pesos sinápticos para obter
o melhor resultado possível. Para que o processo de aprendizagem seja realizado é necessário
utilizar uma ferramenta denominada de algoritmo de aprendizagem, que tem a função de
modificar os pesos sinápticos da rede para alcançar um determinado objetivo (BRAGA et al.,
2000).
As RNAs também podem ser classificadas de acordo com o seu aprendizado como
redes supervisionadas, quando há participação auxiliar de um supervisor, e redes não
supervisionadas quando a rede trabalha sem nenhuma interferência humana apenas com os
dados apresentados à rede.
2.2.2 - Redes de funções de base radial
As redes de funções de base radial (RBF) são redes formadas por neurônios seletivos
ou neurônios com função de ativação de base radial local. Com um processo de treinamento
Capítulo 2 – Aspectos Teóricos
19
Brenna Karolyna dos Santos Silva – Fevereiro 2016
bastante simples e uma boa eficiência computacional essas redes têm ganhado uma significativa
posição no campo das redes neurais artificiais (HAYKIN, 2009).
As redes RBF são consideradas aproximadores universais de funções. A teoria de
aproximação de funções consiste em aproximar (identificar) uma função y(.) por uma função
aproximada 𝑓 (w,u), dado um número fixo de parâmetros w e de entradas u, em que u e w são
vetores. Sendo assim tem-se dois aspectos importantes a serem definidos: a função aproximada
𝑓 (.) e o vetor de parâmetros w. Escolhida uma função 𝑓 (.) específica, o problema se reduz a
determinação do vetor de parâmetros w que oferecem a melhor aproximação da função y(.) para
o conjunto de dados de entrada u.
Redes RBF realizam o aprendizado supervisionado e são constituídas de várias
camadas, que desempenham papeis diferentes. Em sua topologia mais básica a camada de
entrada conecta a RBF ao ambiente; sua camada oculta, aplica uma transformação não linear
dos dados de entrada mapeando-os para um espaço de alta dimensionalidade; E a sua camada
de saída é responsável por aplicar uma transformação linear nos dados, gerando a saída da rede
(HAYKIN, 2009).
A Figura 2.11 mostra a arquitetura de uma RBF:
Figura 2.11. Arquitetura de uma RBF com uma única camada oculta
As variáveis x1, x2, ..., xn são os dados de entrada, 𝜙1, 𝜙2, … , 𝜙𝑖 as funções de base e
w1, w2, ..,wi os parâmetros do modelo e na saída da rede uma função estimada 𝑓(𝒘, 𝐱).
Em rede de funções de base radial, aprender é encontrar uma superfície em um espaço
multidimensional, que forneça o melhor ajuste para os dados de treinamento.
Correspondentemente, generalizar os dados é fazer uso dessas superfícies multidimensionais
Capítulo 2 – Aspectos Teóricos
20
Brenna Karolyna dos Santos Silva – Fevereiro 2016
para interpolar os dados, onde a camada oculta fornece um conjunto de funções que constituem
uma base arbitrária para os padrões de entrada.
Uma função de base radial bastante utilizada na teoria de aproximação de funções é a
função gaussiana (Figura 2.12):
Figura 2.12. Função gaussiana
E expressa pela Equação (2.8):
∅(𝑟) = 𝑔(𝑟) = exp(−𝑟2
2𝜎2)
(2.8)
Na função o 𝑟2 define a norma euclidiana e o parâmetro 𝜎 define a largura da função
gaussiana, ou seja, define a distância euclidiana média que mede o espalhamento dos dados de
entrada em torno do seu centro c (HAYKIN, 2001).
Essas redes realizam um mapeamento não linear dos dados de entrada para um espaço
oculto (camada oculta) de alta dimensionalidade, posteriormente um mapeamento linear do
espaço oculto para a saída da rede (HAYKIN, 2001).
Uma RBF pode aproximar qualquer função através da combinação linear de funções
gaussianas com centros em diferentes pontos escolhidos aleatoriamente do espaço de entrada
conforme podemos observar na Figura 2.13, no exemplo apresentando três funções de base
radial (em azul) que são ponderadas em amplitude pelos pesos sinápticos e em seguidas
somadas para produzir na saída uma função aproximada (em vermelho).
-3 -2 -1 0 1 2 30
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Função de Base Radial
Entrada p
Saíd
a a
Capítulo 2 – Aspectos Teóricos
21
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 2.13. Soma ponderada de funções de base radial do tipo gaussiana.
As redes de funções de base radial surgiram de um problema de interpolação exata.
A partir de um conjunto de dados para treinamento, necessita-se estimar uma função 𝑓
o mais próxima possível da função objetivo utilizando uma rede RBF.
Considerando um modelo de regressão linear para aproximar uma função f através de:
𝑓(. ) ≅ 𝑓(𝐱,𝐰) = 𝑤0 + 𝑤1𝑥1 +⋯+𝑤𝑛𝑥𝑛
(2.9)
Em que 𝑓 representa a função aproximada, 𝒙 = [𝑥1, ⋯ , 𝑥𝑛]𝑇 o vetor de entrada e 𝒘 =
[𝑤1, ⋯ ,𝑤𝑛]𝑇 o vetor de parâmetros do modelo. Podemos observar a partir desse que o fato do
mesmo ser linear para as variáveis de entrada impõe certa restrição ao modelo (o sistema de
multitanques é não linear).
Com a obtenção do vetor de treinamento a rede está apta para realizar testes onde sua
saída será comparada com a saída real do sistema para ser analisada o quanto essa saída
estimada se aproxima das características do sistema real. A Figura 2.14, ilustra como esse
processo de identificação utilizando uma RBF será realizado.
Capítulo 2 – Aspectos Teóricos
22
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 2.14. Estrutura implementada para identificação utilizando rede RBF
Na figura acima pode-se observar que a planta ao ser excitada por um sinal u(t) produz
uma saída y(t) em função da entrada. Esse mesmo sinal utilizado para excitar a planta será
aplicado na técnica de identificação que também irá produzir uma saída y em função do sinal
de entrada aplicado. Essa saída estimada pela RBF será comparada com a saída real do sistema.
A diferença das saídas gera um erro o qual deve ser o menor possível. O erro obtido é utilizado
para reajustar os parâmetros da rede e dessa forma com os parâmetros ajustados, o que significa
que, quanto menor o erro da rede RBF, um modelo mais próximo possível do sistema real é
obtido.
Capítulo 3
Estado da Arte
Capítulo 3 – Estado da Arte
24
Brenna Karolyna dos Santos Silva – Fevereiro 2016
3. Estado da Arte
Existem diversos estudos relacionados à identificação de sistemas não lineares em
engenharia, principalmente na área petrolífera. A literatura aponta várias pesquisas quanto à
utilização de redes neurais artificias e outros sistemas inteligentes em aplicações vinculadas a
identificação de sistemas.
Uma das principais citações sobre a identificação de sistemas não lineares, no caso
específico dos modelos de Hammerstein, foi atribuída a Narendra e Gallman em 1966. Uma
boa abordagem dos modelos de Volterra, Wiener e Hammerstein aplicados à identificação de
sistemas podem ser encontradas em Billings, 1980.
Recentemente o uso de modelos de Hammerstein e Wiener têm atraído a atenção de
vários pesquisadores (Greblicki, 1992, 1996; Wigren, 1993; Pawlwk, 1994). Em 1993, Wigren
desenvolveu um algoritmo para a estimação recursiva de modelos Wiener.
Tan et al., (1995) utilizaram uma estrutura de RBF (Radial Basis Function) com
algoritmos k-médias e LMS, para identificação de um sistema não linear, multivariável (MIMO
(Multi Inputs Multi Outputs) e BIBO (Bounded Input Bounded Output) com um modelo ARMA
(Autoregressive Moving Average Model Structure).
Yu et al., (2000) realizaram a identificação de um sistema MIMO (Multiple Inputs,
Multiple Outputs) e MISO (Multi Inputs and Single Outputs) utilizando a RBF com algoritmos
k-médias e OLS (Orthogonal Least Square) com modelos NARX (Non-linear Autoregressive
model structure with exogenous inputs), NARMAX (Non-linear Autoregressive Moving
Average model structure with exogenous inputs) e ARX (Autoregressive model structure with
exogenous inputs).
Em 2001, Ljung, propôs estruturas de redes de Walvelets, RBF, B-spline e Fuzzy para a
identificação de um modelo MIMO do tipo caixa preta, sendo estes modelos um linear ARMAX
(Autoregressive Moving Average model structure with exogenous inputs), e de espaço de
estados ARX, OE (Output Error model), e BJ (Box-Jenkins model structure).
Uma rede neural RBF, com algoritmo de treinamento o método dos mínimos quadrados
ortogonais, foi utilizada na identificação de falhas em uma linha de transmissão elétrica. Nesse
estudo Lin et al. (2001) aborda o uso da RBF em simulações que demonstraram resultados
satisfatórios com a rede de convergência rápida e capaz de detectar falhas em um curto espaço
de tempo podendo ser usada, em alguns casos, em tempo real.
Capítulo 3 – Estado da Arte
25
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Em 2002, uma comparação do desempenho entre as redes neurais MLP (Multi Layer
Perceptron) e RBF foi realizada por Park et al. As redes foram utilizadas na identificação de
um sistema dinâmico não linear e os experimentos demonstraram que a RBF converge mais
rápido e necessita de menos memória que a MLP.
Peng et al. (2003), utilizaram a estrutura da RBF com os algoritmos LM (Levenberg-
Marquardt), LMS (Least Mean Square), BFGS (Broyden-Fletcher-Goldfarb-Shanno),
McLoone e GN (Gauss-Newton) para a identificação de um sistema não linear utilizando
modelos AR (Auto Regressive) e ARX para um sistema de decomposição de óxido de nitrogênio
de uma planta química.
Dudul (2004) utilizou uma estrutura da MLP e RBF na identificação do sistema caótico
de Lorenz, com os algoritmos LM, método de quase-Newton, BP (Back Propagation) e
Lyapunov, utilizando modelos AR, ARMA, FIR (Finite Impulse Response), ARX, NNARX
(Neural Network Autoregressive) e NNARMA (Neural Network Autoregressive moving
Average).
Também em 2004 Mashor, utilizou estruturas HMLP (Hybrid Multilayered
Perceptron), MLP e RBF com os algoritmos BP, k-médias adaptativo para a identificação não
linear de um modelo NARMAX na aplicação de dois sistemas não lineares.
Em 2007 Linhares et al; apresentaram a aplicação de redes neurais artificiais de
múltiplas camadas na indústria de processos químicos. O sistema identificado foi uma coluna
debutanizadora de GLP (gás liquefeito), que tem a função de separar o GLP da gasolina natural.
A estrutura de identificação utilizada no processo foi uma NNARX. Os resultados obtidos
comprovaram a funcionalidade da técnica aplicada.
Rêgo (2010) descreveu a utilização de uma ferramenta matemática na solução de
problemas decorrentes na teoria de controle, incluindo a identificação, a análise do retrato de
fase e a estabilidade, bem como a evolução temporal da planta de corrente do motor de indução.
A ferramenta computacional utilizada na identificação e análise do sistema dinâmico não linear,
foi uma rede neural artificial do tipo funções de base radial (RBF).
Rebouças (2011) utilizou redes neurais artificiais treinadas em modo offline pelo
software matemático Matlab®, para detecção e diagnóstico de falhas de um sistema de tanques
acoplados em que o conjunto de dados das falhas foi gerado computacionalmente, bem como
os resultados coletados a partir de simulações numéricas do modelo do processo, não havendo
risco de dano aos equipamentos.
Capítulo 3 – Estado da Arte
26
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Diversos tipos de redes neurais artificiais são utilizadas em identificação de sistemas,
uma rede que tem se destacado bastante nesse processo é a rede neural Wavelet (Wavelet Neural
Network - WNN). Em 2013 Araújo Júnior realizou a identificação de um sistema não linear
simulado que representa o mecanismo dinâmico de um joelho humano utilizando redes neurais
Wavelet. Tal sistema possui não linearidades bastante acentuadas. Os resultados obtidos com a
WNN foram comparados com resultados obtidos através de uma rede neural clássica, redes
MLP e tais resultados mostraram que a WNN apresentou um desempenho satisfatório e um erro
médio quadrático menor que o obtido pela MLP.
Em 2014, Araújo Júnior, utilizou uma rede neural Wavelet modificada para a
identificação de dois sistemas simulados encontrados na literatura e um sistema real não linear,
que consiste de um tanque de multisseções.
É possível encontrar na literatura diversos trabalhos que aplicam as redes RBF na
identificação de sistemas, como em Folland (2004), que na identificação de sons da respiração
humana realizou uma comparação entre as redes CPNN (Constructive Probabilistic Neural
Network) e RBF. Em Yates (2005) que utilizou a RBF na identificação de sistemas de uma
colônia de bactérias. Rocha (2006), abordando a identificação de sistemas não lineares usando
redes neurais MLP e RBF. Panigrahi (2006) utilizou uma rede RBF integrada com um sistema
de ruído para identificação spoiled beef.
As pesquisas utilizando RNA’S são de grande interesse e têm sido bastante utilizadas
para identificação de sistemas de qualquer complexidade e tipo. Dentre os inúmeros tipos de
RNA’s, as redes de funções de base radial têm se destacado na identificação de sistemas. Muitas
são as aplicações utilizando as redes neurais bem como inúmeros algoritmos são desenvolvidos
ou melhorados de acordo com cada aplicação.
Neste trabalho a rede neural do tipo RBF será utilizada na identificação de um sistema
dinâmico multivariável, o processo de cinco tanques acoplados, tendo como algoritmo de
treinamento o método dos mínimos quadrados.
Capítulo 4
Metodologia
Capítulo 4 – Metodologia
28
Brenna Karolyna dos Santos Silva – Fevereiro 2016
4. Metodologia
Identificando uma relação entre entrada / saída de um sistema ou descobrindo uma lei
evolucionária de um sinal baseado em observações, e aplicando-a na construção de modelos
matemáticos para predição, controle ou extração de informações constitui um problema que
vem chamando a atenção na Engenharia e ganhando importância em diversas áreas, tais como:
Economia, Biologia, Medicina e muitas outras áreas do conhecimento. Nos últimos anos,
pesquisas relacionadas aparecem com diferentes termos, tal como análise de séries temporais,
processamento de sinais e identificação de sistemas.
A identificação de sistemas é uma técnica que pode ser utilizada para inferir e construir
modelos para um sistema a partir de dados experimentais. Os sistemas podem ser lineares ou
não lineares, variantes ou invariantes, contínuos ou discretos no tempo, etc. E podem ser
classificados baseados nestas categorias. Dentre tais modelos temos alguns que são utilizados
para descrever os sistemas lineares, tais como: AR – Autoregressivo, ARMA – Autoregressivo
com Média Móvel, ARX – Autoregressivo com Entradas Externas e, ARMAX – Modelo
Autoregressivo com Média Móvel e Entradas Externas, esses modelos são comumente
utilizados na identificação de sistemas lineares (Aguirre,2007). Para modelos não lineares
adota-se o NARMAX – Modelo Não linear Autoregressivo com Média Móvel e Entradas
Externas, onde os modelos NAR e NARX não lineares são um caso particular, tais modelos são
os mais populares em identificação de sistemas no domínio de tempo discreto.
4.1 – Representações lineares
Existem inúmeras técnicas de identificação de tais sistemas conforme pode ser visto
em Box e Jenkins, 1970; Norton, 1986; Södeströn e Stoica, 1989; Johansson,1993. Seguindo a
notação tradicional adotada por (Södeströn e Stoica, 1989), temos o modelo geral para sistemas
lineares de ordem finita dado por:
𝐴(𝑧−1)𝑦(𝑘) =𝐵(𝑧−1)
𝐹(𝑧−1)𝑢(𝑘) +
𝐶(𝑧−1)
𝐷(𝑧−1)𝜀(𝑘)
(4.1)
Capítulo 4 – Metodologia
29
Brenna Karolyna dos Santos Silva – Fevereiro 2016
em que
𝐴(𝑧−1) = 1 + 𝑎1𝑧−1 +⋯+ 𝑎𝑛𝑎𝑧
−𝑛𝑎
𝐵(𝑧−1) = 𝑏1𝑧−1 +⋯+ 𝑏𝑛𝑏𝑧
−𝑛𝑏
𝐶(𝑧−1) = 1 + 𝑐1𝑧−1 +⋯+ 𝑐𝑛𝑐𝑧
−𝑛𝑐
𝐷(𝑧−1) = 1 + 𝑑1𝑧−1 +⋯+ 𝑑𝑛𝑑𝑧
−𝑛𝑑
𝐹(𝑧−1) = 1 + 𝑓1𝑧−1 +⋯+ 𝑓𝑛𝑓𝑧
−𝑛𝑓
(4.2)
{𝑦(𝑘)} e {𝑢(𝑘)}, (𝑘 = 1,2, … ) são a saída e entrada, respectivamente; 𝑛𝑎, 𝑛𝑏 , 𝑛𝑐, 𝑛𝑑 , 𝑛𝑒 𝑒 𝑛𝑓
indicam a ordem polinomial, geralmente referidas como a ordem do modelo; {𝜀(𝑘)} é o ruído
e geralmente assumido como sendo independente com média nula e variância finita. O símbolo
𝑧−1 denota o operador atraso unitário. Ex: 𝑧−1𝑥(𝑘) = 𝑥(𝑘 − 1). Na Equação (4.1), se
𝐴(𝑧−1) = 1, 𝐹(𝑧−1) = 1 𝑒 𝐶(𝑧−1) = 0, considerando 𝑛𝑎 = 𝑛𝑦, 𝑒 𝑛𝑏 = 𝑛𝑢 podemos escrever
alguns modelos dinâmicos, entre eles o denominado de modelo FIR – Resposta Finita ao
Impulso. Ou seja,
𝑦(𝑘) = 𝑏1𝑢(𝑘 − 1) + 𝑏2𝑢(𝑘 − 2) + ⋯+ 𝑏𝑛𝑢𝑢(𝑘 − 𝑛𝑢) (4.3)
sendo a saída uma combinação linear das entradas defasadas em 𝑛𝑢 amostras no tempo discreto.
4.1.1- Modelo AR
Se 𝐵(𝑧−1) = 0, 𝐶(𝑧−1) = 𝐷(𝑧−1) = 1, o modelo da Equação (4.1) é denominado de
modelo Autoregressivo.
𝑦(𝑘) + 𝑎1𝑦(𝑘 − 1) + 𝑎2𝑦(𝑘 − 2) + ⋯+ 𝑎𝑛𝑦𝑦(𝑘 − 𝑛𝑦) = 𝜀(𝑘) (4.4)
O modelo autoregressivo especifica que a variável de saída depende linearmente de seus
próprios valores anteriores.
Capítulo 4 – Metodologia
30
Brenna Karolyna dos Santos Silva – Fevereiro 2016
4.1.2 - Autoregressivo com média móvel
Fazendo 𝐵(𝑧−1) = 0, 𝐷(𝑧−1) = 1, na Equação (4.1) teremos o modelo ARMA,
𝑦(𝑘) + 𝑎1𝑦(𝑘 − 1) +⋯+ 𝑎𝑛𝑦𝑦(𝑘 − 𝑛𝑦)
= 𝜀(𝑘) + 𝑐1𝜀(𝑘 − 1) + ⋯+ 𝑐𝑛𝑐𝜀(𝑘 − 𝑛𝑐)
(4.5)
O modelo ARMA é formado de duas partes, uma parte autoregressiva (AR) e outra de média
móvel (MA).
4.1.3 – Autoregressivo com Entradas Externas
Admitindo 𝐶(𝑧−1) = 𝐷(𝑧−1) = 𝐹(𝑧−1) = 1, na Equação (4.1) teremos o modelo
ARX,
𝑦(𝑘) + 𝑎1𝑦(𝑘 − 1) + ⋯+ 𝑎𝑛𝑦𝑦(𝑘 − 𝑛𝑦)
= 𝑏1𝑢(𝑘 − 1) + ⋯+ 𝑏𝑛𝑢𝑢(𝑘 − 𝑛𝑢) + 𝜀(𝑘)
(4.5)
Onde 𝑛𝑢 𝑒 𝑛𝑦 são os valores inteiros que descrevem o número de exemplos anteriores dos sinais
𝑢 e 𝑦 que são necessários para predizer a próxima saída.
4.1.4 – Modelo Autoregressivo com Média Móvel e Entradas Externas
Admitindo-se que na Equação (5.1) 𝐷(𝑧−1) = 𝐹(𝑧−1) = 1, temos então o modelo
ARMAX, dado por,
𝑦(𝑘) + 𝑎1𝑦(𝑘 − 1) + ⋯+ 𝑎𝑛𝑦𝑦(𝑘 − 𝑛𝑦)
= 𝑏1𝑢(𝑘 − 1) + ⋯+ 𝑏𝑛𝑢𝑢(𝑘 − 𝑛𝑢)
+𝜀(𝑘) + 𝑐1𝜀(𝑘 − 1) + ⋯+ 𝑐𝑛𝑐𝜀(𝑘 − 𝑛𝑐)
(4.6)
Geralmente os modelos mais utilizados para estimação de parâmetros em modelos lineares são
os modelos ARX e ARMAX, utilizando o método dos mínimos quadrados.
Capítulo 4 – Metodologia
31
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Sejam {𝑦(𝑘), 𝑢(𝑘), 𝑘 = 1,2, … , 𝑁} as amostras observadas do sistema, ou seja, o par saída /
entrada. Supondo que o modelo em questão seja do tipo ARX, então podemos estimar os
parâmetros utilizando o algoritmo baseado nos mínimos quadrados. Seja 𝑚 = 1 +
max(𝑛𝑢, 𝑛𝑦), e
𝒀 = [𝑦(𝑚), 𝑦(𝑚 + 1),… , 𝑦(𝑁) ]𝑇
𝜺 = [𝜀(𝑚), 𝜀(𝑚 + 1),… , 𝜀(𝑁) ]𝑇
𝜽 = [𝑎1 , 𝑎2, … , 𝑎𝑛𝑦, 𝑏1, 𝑏2, … , 𝑏𝑛𝑢 ]𝑇
𝑿
=
[ −𝑦(𝑚 − 1) −𝑦(𝑚 − 2) ⋯−𝑦(𝑚) −𝑦(𝑚 − 1) ⋯
−𝑦(𝑚 + 1) −𝑦(𝑚) ⋯
−𝑦(𝑚 − 𝑛𝑦) 𝑢(𝑚 − 1) ⋯ 𝑢(𝑚 − 𝑛𝑢)
−𝑦(𝑚 + 1 − 𝑛𝑦) 𝑢(𝑚) ⋯ 𝑢(𝑚 + 1 − 𝑛𝑢)
−𝑦(𝑚 + 2 − 𝑛𝑦) 𝑢(𝑚 + 1) ⋯ 𝑢(𝑚 + 2 − 𝑛𝑢)⋯ ⋯ ⋯
−𝑦(𝑁 − 2) −𝑦(𝑁 − 3) ⋯−𝑦(𝑁 − 1) −𝑦(𝑁 − 2) ⋯
⋯ ⋯ ⋯ ⋯
−𝑦(𝑁 − 1 − 𝑛𝑦) 𝑢(𝑁 − 2) ⋯ 𝑢(𝑁 − 1 − 𝑛𝑢)
−𝑦(𝑁 − 𝑛𝑦) 𝑢(𝑁 − 1) ⋯ 𝑢(𝑁 − 𝑛𝑢) ]
(4.7)
(4.8)
(4.9)
(4.10)
De modo que o modelo ARX da Equação (4.5) pode ser escrito em sua forma matricial,
𝒀 = 𝑿𝜽 + 𝜺 (4.11)
Cuja solução para o vetor de parâmetros desconhecidos 𝜽 é dada por:
�� = (𝑿𝑇𝑿)−1𝑿𝑇𝒀 (4.12)
No contexto de sistemas dinâmicos, as variáveis presente na matriz de regressores 𝑿
serão escolhidas de forma que haja uma relação dinâmica e iterativa entre tais variáveis e a
saída do sistema. Nos sistemas de tempo discreto a dinâmica se dá devido à diferença temporal
existente entre os regressores e a variável de saída. Desta forma, podemos reescrever a Equação
(4.12) como (Aguirre, 2007),
�� = [1
𝑁∑𝑋(𝑘 − 1)𝑋𝑇(𝑘 − 1)
𝑁
𝑘=1
]
−1
[1
𝑁∑𝑋(𝑘 − 1)𝑦(𝑘)
𝑁
𝑘=1
]
(4.13)
A estimação de um modelo ARMAX requer um procedimento iterativo tal como o algoritmo
dos mínimos quadrados generalizado e pode ser visto em detalhes em Södeströn & Stoica, 1989.
Capítulo 4 – Metodologia
32
Brenna Karolyna dos Santos Silva – Fevereiro 2016
4.2 – Representações não lineares
Sistemas não lineares são sistemas cuja saída é uma função não linear de sua entrada,
para a classe de sistemas multivariáveis dinâmicos não lineares, descrito na seguinte figura,
Figura 4.1. Diagrama em blocos de um sistema dinâmico não linear
A relação entrada / saída pode ser escrita como
𝑦(𝑘) = 𝑓𝑠[𝑦(𝑘 − 1),⋯ , 𝑦(𝑘 − 𝑛𝑦), 𝑢(𝑘 − 𝑑), 𝑢(𝑘 − 𝑑 − 1),… , 𝑢(𝑘 − 𝑑
− 𝑛𝑢), 𝑒(𝑘 − 1),… , 𝑒(𝑘 − 𝑛𝑒)] + 𝑒(𝑘)
(4.14)
Onde
𝒚(𝒌) = [𝑦1(𝑘)⋮
𝑦𝑚(𝑘)] , 𝒖(𝒌) = [
𝑢1(𝑘)⋮
𝑢𝑟(𝑘)] , 𝒆(𝒌) = [
𝑒1(𝑘)⋮
𝑒𝑚(𝑘)]
(4.15)
São a saída m-dimensional do sistema, a entrada r-dimensional e o vetor ruído m-
dimensional, respectivamente; 𝑛𝑦, 𝑛𝑢 e 𝑛𝑒 são os atrasos máximo na saída, entrada e ruído,
respectivamente; 𝑓𝑠 é algum vetor m-dimensional de funções não lineares, e 𝑑 é o atraso de
tempo, geralmente definido como sendo unitário. Essa representação é descrita na literatura
como sendo modelo NARMAX (Leontaritis e Billings,1985; Chen e Billings; 1989).
Os modelos NARMAX provêm uma base geral para o desenvolvimento de técnicas
não lineares de identificação de sistemas. Um caso especial do modelo NARMAX é o NARX
Capítulo 4 – Metodologia
33
Brenna Karolyna dos Santos Silva – Fevereiro 2016
que não inclui os termos do ruído dependente do modelo. Em outras palavras, o modelo NARX
pode ser explicitado através da seguinte formulação,
𝑦(𝑘) = 𝑓𝑠[𝑦(𝑘 − 1),⋯ , 𝑦(𝑘 − 𝑛𝑦), 𝑢(𝑘 − 𝑑), 𝑢(𝑘 − 𝑑 − 1),… , 𝑢(𝑘 − 𝑑
− 𝑛𝑢)] + 𝑒(𝑘)
(4.16)
sendo o ruído 𝑒(𝑘) uma variável independente.
Nos modelos apresentados, a forma funcional de 𝑓𝑠(. ) para um sistema real é
geralmente muito complexa e desconhecida. Algumas modelagens práticas são baseadas na
escolha de um conjunto de funções conhecidas. Obviamente, tais modelos devem ser capazes
de aproximar o processo dentro de uma acuracidade aceitável. Na prática muitos tipos de
modelos são avaliados para aproximar o mapeamento desconhecido 𝑓𝑠(. ) nas Equações (4.14)
e (4.16), dentre tais modelos podemos citar as redes neurais do tipo funções de base radial.
4.3 - Redes Neurais do tipo RBF em modelagem não linear
A teoria de aproximação de funções consiste em aproximar uma função multivariável
𝑦(. ) por uma função estimada 𝑓(𝒘, 𝒙), dado um número fixo de parâmetros w , onde wx e
são vetores. Dois importantes aspectos devem ser considerados na definição do modelo: a
função (.)f e o vetor de parâmetros w . Havendo a escolha de uma função estimada específica
f , o problema é reduzido à determinação do vetor de parâmetros w que oferecem a melhor
aproximação da função a ser modelada (.)y a partir dos parâmetros de entrada. A identificação
de sistemas utilizando RBF consiste em aproximar uma função desconhecida através da
combinação linear de função não lineares, conhecidas como função de base, a partir de um
conjunto de entradas / saída desejada. (Bishop, 2006).
Em modelagem e identificação de sistemas dinâmicos não lineares, o foco é na busca
e aquisição de modelos a partir de dados experimentais que represente a dinâmica do sistema
ou, o comportamento em torno de uma região de interesse (local ou global). Ou seja, o objetivo
é a implementação de redes neurais que simulem dinamicamente o comportamento do sistema.
A estrutura básica de uma rede neural é ilustrada na Figura 4.2, onde 𝑦(𝑘), 𝑢(𝑘), 𝑒(𝑘), 𝑛𝑦 e 𝑛𝑢
são definidas na Equação 4.14, 𝜑𝑖(∙), 𝑖 = 1,2,⋯ ,𝑚 na camada oculta são funções não lineares
pré-definidas, denominadas de funções de ativação. O modelo algumas vezes é denominado de
Capítulo 4 – Metodologia
34
Brenna Karolyna dos Santos Silva – Fevereiro 2016
rede neural recorrente NARX, e pode ser vista como uma representação alternativa do modelo
NARX da equação 4.16.
Figura 4.2. Rede neural NARX para um sistema SISO.
Matematicamente, a rede neural recorrente NARX vista na figura 4.2 é representada
por,
𝑦(𝑘) = 𝑓𝑠[𝑿(𝑘)] = 𝑤0 +∑𝑤𝑖𝜑𝑖(𝑿(𝑘)) + 𝑒(𝑘)
𝑚
𝑖=1
(4.17)
em que 𝑿(𝑘) = [𝑥1(𝑘), 𝑥2(𝑘),… , 𝑥𝑛(𝑘)]𝑇 , com 𝑥𝑗(𝑘), 𝑗 = 1,2, … , 𝑛 como em 4.10, 𝑒(𝑘)
representa o erro de modelagem, e a função de ativação 𝜑𝑖(∙), 𝑖 = 1,2,⋯ ,𝑚 é usualmente pré-
definida. Observa-se que a rede é uma estrutura simples e composta por um conjunto de funções
de ativação não lineares.
Redes neurais de funções de base radial foram apresentadas por Broomhead e Lowe
em 1988 e se tornaram muito popular na identificação de sistemas não lineares (Billings et al.,
1992; Haykin, 1998).
O problema basicamente consiste em que dada uma sequência de entradas 𝒖(𝑘) e a
saída correspondente 𝒚(𝑘) de um sistema discreto não linear desconhecido, a seguinte estrutura
consiga identificar / modelar o sistema desconhecido (Powell, 1987).
Capítulo 4 – Metodologia
35
Brenna Karolyna dos Santos Silva – Fevereiro 2016
𝒚(𝑘) = 𝑓𝑠[𝑿(𝑘)] =∑𝑤𝑖𝜙(‖𝒙(𝑘) − 𝒄(𝑖)‖)
𝑚
𝑖=1
(4.18)
em que 𝑿(𝑘) = [𝑥1(𝑘), 𝑥2(𝑘),… , 𝑥𝑛(𝑘)]𝑇 , 𝑘 = 1,2, … ,𝑁, representa a matriz regressora,
𝜙(‖𝒙(𝑘) − 𝒄(𝑖)‖) uma função conhecida por função de base radial, o símbolo ‖∙‖ denota a
norma euclidiana e 𝑤𝑖 os pesos sinápticos (geralmente desconhecidos).
Analisando a equação (4.18), podemos montar o seguinte sistema de n equações:
𝑓1 = 𝑤1𝑒𝑥𝑝 [−𝒙1 − 𝒄12𝜎2
] + ⋯+ 𝑤𝑛𝑒𝑥𝑝 [−𝒙1 − 𝒄𝑛2𝜎2
]
𝑓2 = 𝑤1𝑒𝑥𝑝 [−𝒙2 − 𝒄12𝜎2
] + ⋯+ 𝑤𝑛𝑒𝑥𝑝 [−𝒙2 − 𝒄𝑛2𝜎2
]
⋮
𝑓𝑛 = 𝑤1𝑒𝑥𝑝 [−𝒙𝑛 − 𝒄12𝜎2
] + ⋯+ 𝑤𝑛𝑒𝑥𝑝 [−𝒙𝑛 − 𝒄𝑛2𝜎2
]
(4.19)
em que 𝒄 = [𝑐1, 𝑐2, ⋯ , 𝑐𝑛]𝑇 representa o vetor de centros escolhidos a partir do conjunto de
treinamento, a equações podem ser escritas de forma simplificada como:
{
𝜙11𝑤1 + 𝜙12𝑤2 +⋯+ 𝜙1𝑛𝑤𝑛 = 𝑓1𝜙21𝑤1 + 𝜙22𝑤2 +⋯+ 𝜙2𝑛𝑤𝑛 = 𝑓2
⋮𝜙𝑛1𝑤1 + 𝜙𝑛2𝑤2 +⋯+ 𝜙𝑛𝑛𝑤𝑛 = 𝑓𝑛
(4.20)
sendo 𝜙 i,j = 1, ..., n as funções de base radial do tipo gaussianas, 𝑤𝑖 os parâmetros do modelo,
as equações podem ser escritas na forma matricial como:
[ 𝑓1𝑓2⋮𝑓𝑛]
=
[ 𝜙11 = 𝑒𝑥𝑝 [−
𝒙1 − 𝒄12𝜎2
] ⋯ 𝜙1𝑛 = 𝑒𝑥𝑝 [−𝒙1 − 𝒄𝑛2𝜎2
]
⋮ ⋮ ⋮
𝜙𝑛1 = 𝑒𝑥𝑝 [−𝒙𝑛 − 𝒄12𝜎2
] ⋯ 𝜙𝑛𝑛 = 𝑒𝑥𝑝 [−𝒙𝑛 − 𝒄𝑛2𝜎2
]]
[
𝑤1𝑤2⋮𝑤𝑛
]
Capítulo 4 – Metodologia
36
Brenna Karolyna dos Santos Silva – Fevereiro 2016
ou seja:
[ 𝑓1𝑓2⋮𝑓𝑛]
= [
𝜙11 𝜙12 ⋯ 𝜙1𝑛𝜙21 𝜙22 ⋯ 𝜙2𝑛⋮𝜙𝑛1
⋮𝜙𝑛2
⋱⋯
⋮𝜙𝑛𝑛
] [
𝑤1𝑤2⋮𝑤𝑛
]
(4.21)
Na forma compacta, teremos:
�� = 𝝓.𝒘 (4.22)
em que a matriz do sistema 𝝓 possui entradas 𝜙𝑖𝑗 e 𝒘 representa o vetor de parâmetros
(coeficientes) desconhecidos definido por,
𝒘 =1
𝜆(𝒚 − ��) (4.23)
Substituindo a Equação (4.22) na (4.23),com 𝒚 o vetor dos valores desejados, temos:
𝒘 =1
𝜆(𝒚 − 𝝓.𝒘)
𝒘+1
𝜆 𝝓.𝒘 =
1
𝜆𝒚
( 𝝓 + 𝜆𝑰)𝒘 = 𝒚
(4.24)
Em muitos casos de identificação de sistemas a matriz do sistema é não quadrada, ou
seja, o número de vetores linhas é diferente do número de vetores colunas, inviabilizando a
simples solução através da inversão da matriz. Nesse caso, se faz necessário o uso da pseudo
inversa. Ou seja:
𝝓+𝒇 = 𝒘 (4.25)
onde 𝝓+ = ( 𝝓𝑇 𝝓)−1 𝝓𝑇 representa a pseudo inversa da matriz 𝝓.
Se necessário utilizaremos o parâmetro para evitar que a matriz 𝝓 seja mal
condicionada, ou seja, apresenta algum determinante seja igual a zero, dessa forma podemos
reescrever a pseudo inversa como:
𝝓+ = ( 𝝓𝑇 𝝓 + 𝜆𝑰)−1 𝝓𝑇 (4.26)
Capítulo 4 – Metodologia
37
Brenna Karolyna dos Santos Silva – Fevereiro 2016
ou:
𝒘 = 𝝓+𝒇 para 𝜆 = 0 (4.27)
Dessa forma, conseguimos encontrar o vetor de parâmetros desconhecidos necessários ao ajuste
do modelo. Ou seja, A grande vantagem da RBF é que possui apenas uma camada oculta, o que
facilita o treinamento.
Assumindo um conjunto de dados para treinamento, necessitamos estimar a função 𝑓
como a mais próxima possível da função objetivo (desejada) y utilizando uma rede RBF.
Existem diferentes estratégias para treinamento de uma rede RBF, utilizaremos a técnica de
escolha fixa dos centros e treinamento através do método de mínimos quadrados (pseudo
inversa). Assumimos as funções radial de base como sendo gaussianas, bem como a localização
dos centros é feita de forma aleatória a partir do conjunto de treinamento. A largura das
gaussianas é dada através da seguinte relação:
𝜎 =𝑑
√2𝑛𝑐 (4.28)
em que: d é a máxima distância entre os centros escolhidos e nc o número de centros (Haykin,
2009).
4.4 - Sistema de tanques acoplados
O trabalho desenvolvido nessa dissertação foi realizado através de simulações
computacionais no sistema sOPC_110913 composto por um software de simulação de um
sistema de cinco tanques acoplados (desenvolvido no LAUT – Laboratório de Automação em
Petróleo). Na planta o nível é controlado através da vazão de entrada de outro tanque. O módulo
de simulação dos cinco tanques acoplados é mostrado na figura 4.1. O módulo é composto de
uma interface gráfica (GUI) desenvolvida no ambiente de simulação Simulink / Matlab cuja
planta consiste de cinco bombas alimentadas através de um controlador e cinco tanques de
seções transversais uniformes, perturbações são acrescentadas ao modelo durante a simulação.
A planta constitui um sistema autônomo e fechado de recirculação. Os tanques estão
configurados de tal modo que o fluxo a partir do primeiro tanque (superior) pode fluir para
dentro do segundo tanque (inferior) e assim sucessivamente. Em cada um dos tanques, o líquido
é retirado do fundo através de uma saída (orifício). A pressão de saída é atmosférica. Ambas as
inserções de saída são configuráveis e pode ser ajustado alterando as inserções na parte inferior
Capítulo 4 – Metodologia
38
Brenna Karolyna dos Santos Silva – Fevereiro 2016
de cada reservatório. A fim de introduzir um fluxo de perturbação, o primeiro tanque é
igualmente equipado com uma válvula de drenagem de modo que, quando aberto, o fluxo pode
ser liberado diretamente para o reservatório. Para fins de configurações didáticas os orifícios
ou enseadas, podem possuir diferentes diâmetros.
A seleção das saídas da bomba controla a relação de fluxo. O nível em cada tanque é
medido e apresentado na área de trabalho, sendo, a escala vertical do nível dada em centímetros
e, é colocado ao lado de cada tanque um “feedback” visual sobre o nível em cada tanque. Tal
como ilustrado na Figura 4.4.1, o objetivo inicial da simulação é projetar um sistema de controle
que regula o nível no sistema de multitanques acoplados. O controlador pode, em seguida,
monitorar o nível do líquido para uma trajetória desejada. Neste trabalho, utilizamos como base
o sistema apenas para obtermos o conjunto de dados necessário ao treinamento e teste da RBF.
Na simulação, fornecemos uma tensão suficiente às bombas para que possamos manter a
dinâmica em cada tanque de modo a não comprometer a dinâmica do sistema, cuja
identificação é o principal objetivo.
Figura 4.3. Sistema de tanques acoplados implementado no simulink®.
Capítulo 4 – Metodologia
39
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Por meio do modelo não linear da planta apresentado na Figura 4.3, podemos realizar
simulações, que serão mostradas, para justificar a metodologia proposta, objetivando a
identificação do sistema. Diversos parâmetros de simulação do sistema são carregados no
momento em que o modelo é aberto, eles envolvem tempo de simulação, parâmetros físicos da
planta, características do ruído presente no meio, dentre outros, conforme pode ser visto na
seguinte figura.
Figura 4.4. Modelo do sistema de tanques acoplados implementado no simulink®.
Na simulação adotaremos o modelo apresentado, no entanto, utilizaremos apenas a
planta, cuja identificação é o principal objetivo desse trabalho. Os parâmetros completos de
modelagem e sistema matemático serão apresentados.
4.5 - Modelagem Matemática
Considerando apenas o primeiro tanque do sistema conforme mostrado na Figura 4.1,
podemos considerar o fluxo de entrada do tanque (em 𝑐𝑚3/𝑠) como:
𝐹𝑖𝑛1 = 𝑘𝑚1𝑉𝑏1 (4.29)
em que 𝑘𝑚1 representa a constante da bomba 01 e 𝑉𝑏1 a voltagem aplicada à mesma. A
velocidade do fluxo de saída (em 𝑐𝑚/𝑠) é dada pela equação de Bernoulli para pequenos
orifícios:
Capítulo 4 – Metodologia
40
Brenna Karolyna dos Santos Silva – Fevereiro 2016
𝑉0 = √2𝑔𝐿1 (4.30)
Sendo 𝑔 a aceleração da gravidade em 𝑐𝑚/𝑠2 e 𝐿1 é a altura do nível presente no tanque (em
𝑐𝑚). O escoamento na saída (em 𝑐𝑚3/𝑠) é dado por:
𝐹𝑜𝑢𝑡1 = 𝑎1√2𝑔𝐿1 (4.31)
em que 𝑎1 representa o diâmetro do orifício de saída. De modo que a variação no fluxo através
do tanque (em 𝑐𝑚3/𝑠) é:
𝐹𝑖𝑛1 − 𝐹𝑜𝑢𝑡1 = 𝑘𝑚1𝑉𝑏1 − 𝑎1√2𝑔𝐿1 (4.32)
e a mudança no nível (em 𝑐𝑚/𝑠),
𝑑𝐿1𝑑𝑡
= −𝑎1𝐴1√2𝑔𝐿1 +
𝑘𝑚1𝐴1
𝑉𝑏1 (4.33)
De modo que 𝑑𝐿1
𝑑𝑡 significa a variação de volume no tempo, 𝐴1 representa o diâmetro
do tanque, desse modo podemos concluir que o sistema é não linear, pois a variação na saída
do tanque depende da raiz quadrada das alturas do líquido. No entanto, para um dado nível 𝐿01
(set point), precisamos manter a voltagem aplicada à bomba constante de modo a manter o nível
estacionário. Um integrador é acrescentado ao modelo e ao circuito de regulação para
compensar a constante (relativa) à perturbação devido ao orifício de saída. Dessa forma,
linearizando o modelo em torno de um ponto de operação 𝐿01, temos a seguinte equação de
estado para o primeiro tanque:
��1 = −𝑎1𝐴1√
𝑔
2𝐿01𝐿1 +
𝑘𝑚1𝐴1
𝑉𝑏1
(4.34)
Para o segundo tanque acoplado, o fluxo de entrada é dado a partir do primeiro tanque e da
bomba 02, de modo que,
𝐹𝑖𝑛1 = 𝑘𝑚2𝑉𝑏2 + 𝑎1√2𝑔𝐿1 (4.35)
e o fluxo de saída é,
𝐹𝑜𝑢𝑡2 = 𝑎2√2𝑔𝐿2 (4.36)
em que 𝑎2 representa o diâmetro do orifício de saída do segundo tanque. Então, a variação do
nível no segundo tanque pode ser escrita como:
Capítulo 4 – Metodologia
41
Brenna Karolyna dos Santos Silva – Fevereiro 2016
𝑑𝐿2𝑑𝑡⁄ = −
𝑎2𝐴2√2𝑔𝐿2 +
𝑘𝑚2𝐴2
𝑉𝑏2 +𝑎1𝐴2√2𝑔𝐿1
(4.37)
em que 𝐴2 representa o diâmetro do tanque 02, linearizando o modelo em torno de
𝐿01 𝑒 𝐿02, temos as seguintes equações de estado:
��2 = −𝑎2𝐴2√𝑔2𝐿02⁄ 𝐿2 +
𝑎1𝐴2√𝑔2𝐿01⁄ 𝐿1 +
𝑘𝑚2𝐴2
𝑉𝑏2
(4.38)
que na forma matricial pode ser escrita como:
[��1��2] =
[ −𝑎1𝐴1
√𝑔2𝐿01⁄ 0
𝑎1𝐴2
√𝑔2𝐿01⁄ −
𝑎2𝐴2
√𝑔2𝐿02⁄
]
[𝐿1𝐿2] +
[ 𝑘𝑚1𝐴1
0
0𝑘𝑚2𝐴2 ]
[𝑉𝑏1𝑉𝑏2
]
(4.39)
Para o terceiro tanque acoplado, o fluxo de entrada é dado a partir do segundo tanque e da
bomba 03, de modo que,
𝐹𝑖𝑛3 = 𝑘𝑚3𝑉𝑏3 + 𝑎2√2𝑔𝐿2 (4.40)
e o fluxo de saída é,
𝐹𝑜𝑢𝑡3 = 𝑎3√2𝑔𝐿3 (4.41)
em que 𝑎3 representa o diâmetro do orifício de saída do terceiro tanque. Então, a variação do
nível no terceiro tanque linearizada em torno de 𝐿02 𝑒 𝐿03 pode ser escrita como:
��3 = −𝑎3𝐴3√𝑔2𝐿03⁄ 𝐿3 +
𝑎2𝐴3√𝑔2𝐿02⁄ 𝐿2 +
𝑘𝑚3𝐴3
𝑉𝑏3
(4.42)
Capítulo 4 – Metodologia
42
Brenna Karolyna dos Santos Silva – Fevereiro 2016
em que 𝐴3 representa o diâmetro do tanque 03, escrevendo as equações na forma matricial,
obtemos:
[
��1��2��3
] =
[ −𝑎1𝐴1
√𝑔2𝐿01⁄ 0 0
𝑎1𝐴2
√𝑔2𝐿01⁄ −
𝑎2𝐴2
√𝑔2𝐿02⁄ 0
0𝑎2𝐴3√𝑔2𝐿02⁄ −
𝑎3𝐴3
√𝑔2𝐿03⁄
]
[
𝐿1𝐿2𝐿3
]
+
[ 𝑘𝑚1𝐴1
0 0
0𝑘𝑚2𝐴2
0
0 0𝑘𝑚3𝐴3 ]
[
𝑉𝑏1𝑉𝑏2𝑉𝑏3
]
(4.43)
Seguindo a mesma analogia para o tanque quatro teremos as seguintes equações de estado:
��4 = −𝑎4𝐴4√𝑔2𝐿04⁄ 𝐿4 +
𝑎3𝐴4√𝑔2𝐿03⁄ 𝐿3 +
𝑘𝑚4𝐴4
𝑉𝑏4
(4.44)
Finalmente temos o modelo geral linearizado representando as equações de estado e de saída
do sistema completo na sua forma matricial:
[ ��1��2��3��4��5]
=
[ −𝑎1𝐴1
√𝑔2𝐿01⁄ 0 0 0 0
𝑎1𝐴2
√𝑔2𝐿01⁄ −
𝑎2𝐴2
√𝑔2𝐿02⁄ 0 0 0
0𝑎2𝐴3
√𝑔2𝐿02⁄ −
𝑎3𝐴3
√𝑔2𝐿03⁄ 0 0
0 0𝑎3𝐴4
√𝑔2𝐿03⁄ −
𝑎4𝐴4
√𝑔2𝐿04⁄ 0
0 0 0𝑎4𝐴4
√𝑔2𝐿04⁄ −
𝑎4𝐴5
√𝑔2𝐿05⁄
]
[ 𝐿1𝐿2𝐿3𝐿4𝐿5]
+
[ 𝑘𝑚1𝐴1
0 0 0 0
0𝑘𝑚2𝐴2
0 0 0
0 0𝑘𝑚3𝐴3
0 0
0 0 0𝑘𝑚4𝐴4
0
0 0 0 0𝑘𝑚5𝐴5 ]
[ 𝑉𝑏1𝑉𝑏2𝑉𝑏3𝑉𝑏4𝑉𝑏5]
Capítulo 4 – Metodologia
43
Brenna Karolyna dos Santos Silva – Fevereiro 2016
e as equações de saída são dadas por:
[ 𝑦1𝑦2𝑦3𝑦4𝑦5]
=
[ 1 0 0 0 0
0 1 0 0 0
0 0 1 0 0
0 0 0 1 0
0 0 0 0 1]
[ 𝐿1𝐿2𝐿3𝐿4𝐿5]
O diagrama em blocos do modelo final do sistema de cinco tanques acoplados
implementado no simulink® é mostrado na Figura 4.5.
Figura 4.5. Sistema utilizado na simulação para obtenção do conjunto entrada / saída utilizado no processo de
identificação.
A Figura 4.6 é uma ampliação de parte da Figura 4.5 para uma melhor visualização do exposto.
Capítulo 4 – Metodologia
44
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 4.6. Visualização do primeiro e do segundo tanque com suas respectivas entradas e as saídas acrescidas
de ruído.
No sistema, a soma do valor absoluto de um sinal senoidal e o mesmo limitado em uma faixa
de valores que vai de 0,1 a 1 é utilizado para simular a entrada em cada tanque, na saída temos
um nível medido e em seguida sendo acrescido de um ruído para simular o ruído presente no
ambiente, sendo então realimentado e servindo também de entrada para o tanque seguinte. Isso
pode ser visualizado melhor na Figura 4.7.
Figura 4.7. Visualização da soma do valor absoluto de um sinal senoidal.
Em algumas situações, a escolha de entrada é imposta pelo tipo de método de identificação
empregado. Por exemplo, se desejamos analisar apenas o estado transitório do sistema um
simples impulso na entrada é suficiente, enquanto que a análise de correlação geralmente utiliza
uma sequência binária pseudo-aleatório (PRBS) como sinal de entrada. Em outras situações, no
entanto, a entrada pode ser escolhida em muitas formas diferentes e o problema da escolha
Capítulo 4 – Metodologia
45
Brenna Karolyna dos Santos Silva – Fevereiro 2016
torna-se um aspecto importante da concepção de experiências de identificação do sistema
(Söderström et al., 1989).
O espectro do sinal de entrada deve satisfazer determinadas propriedades, a fim de
garantir que o sistema possa ser identificada. Isto levará ao conceito de sinal persistentemente
excitante. O conteúdo de frequência de um sinal de entrada e sua distribuição durante o intervalo
[0, π] pode ser de grande importância na identificação. Na maioria dos casos, a entrada deve
realçar as propriedades do sistema em baixa frequência e, portanto, deve ter um teor rico de
baixas frequências. Deste modo, o sinal de entrada deve enfatizar as propriedades do sistema
de baixa frequência durante o experimento de identificação. A frequência do sinal de entrada
pode influenciar a precisão do modelo identificadas em diferentes faixas de freqüência. A Soma
de senóides é um sinal persistentemente excitante de ordem finita (na maioria dos casos, igual
a duas vezes o número de senóides). Portanto, recomendado à determinados sistemas. Uma
considerável vantagem na utilização da soma de sinóides é que ela proporciona um meio
eficiente de manifestar as características não lineares dos sistemas, através de sua resposta às
frequências e harmônicos do sinal aplicado (Victor et al., 1980).
Neste trabalho especificamente, a soma de senóides apresentou o resultado esperado e
satisfatório na simulação e na identificação do sistema através da RBF. A resposta de um
sistema a um sinal senoidal será um sinal senoidal com mesma frequência porém com fase e
amplitude diferentes, conforme pode ser observado na Figura 4.5.
Mostraremos a seguir a simulação da dinâmica em cada tanque a partir do sinal de
entrada proposto.
Cada tanque possui a opção de ajuste na largura e no dreno durante a simulação optou-
se por deixar o diâmetro de cada tanque em 10 cm e o diâmetro do dreno em 0,1781 cm. Ao
final de cada simulação, serão executados arquivos que utilizam variáveis para mostrar
automaticamente os gráficos resultantes.
Primeiramente é apresentado o sinal de entrada utilizado para o primeiro tanque,
devido à figura ter ficado com muita informação dificultando a visualização, optou-se por
mostrar a mesma figura numa escala intercalada facilitando a compreensão através de uma
melhor visualização, em seguida é apresentada a figura referente à medição do nível no primeiro
tanque, a mesma metodologia foi adotada aos demais tanques conforme pode ser visualizado
nas Figuras 4.8 a 4.12.
Capítulo 4 – Metodologia
46
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 4.8. Visualização do sinal de entrada no primeiro tanque, o sinal de entrada composto das 10000
primeiras amostras e o nível de saída no primeiro tanque.
Na Figura 4.9 é apresentada a mesma metodologia para o segundo tanque, sendo
destacada uma alteração no tempo de resposta e no tempo de estabilização do nível em relação
ao primeiro tanque e uma estabilização no nível em torno de aproximadamente 500 cm,
enquanto que no primeiro tanque a estabilização se deu em torno de 125 cm.
Capítulo 4 – Metodologia
47
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 4.9. Visualização do sinal de entrada no segundo tanque, o sinal de entrada composto das 10000 primeiras
amostras e o nível de saída no segundo tanque.
Capítulo 4 – Metodologia
48
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Na Figura 4.10 é apresentada a mesma metodologia para o terceiro tanque, sendo
destacada uma alteração no tempo de resposta e no tempo de estabilização do nível em relação
aos tanques anteriores e uma estabilização no nível em torno de aproximadamente 1000 cm,
enquanto que no primeiro tanque a estabilização se deu em torno de 125 cm e no segundo tanque
em torno de 500 cm.
Figura 4.10. Visualização do sinal de entrada no terceiro tanque, o sinal de entrada composto das 10000
primeiras amostras e o nível de saída no terceiro tanque.
Capítulo 4 – Metodologia
49
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Na Figura 4.11 é apresentada a mesma metodologia para o quarto tanque, sendo
destacada uma alteração no tempo de resposta e no tempo de estabilização do nível em relação
aos tanques anteriores e uma estabilização no nível em torno de aproximadamente 2000 cm,
enquanto que no primeiro tanque a estabilização se deu em torno de 125 cm, no segundo tanque
em torno de 500 cm e no terceiro tanque em torno de 1000 cm.
Figura 4.11. Visualização do sinal de entrada no quarto tanque, o sinal de entrada composto das 10000 primeiras
amostras e o nível de saída no quarto tanque.
Capítulo 4 – Metodologia
50
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Na Figura 4.12 é apresentada a mesma metodologia para o quinto tanque, sendo
destacada uma alteração no tempo de resposta e no tempo de estabilização do nível em relação
aos tanques anteriores e uma estabilização no nível em torno de aproximadamente 3000 cm,
enquanto que no primeiro tanque a estabilização se deu em torno de 125 cm, no segundo tanque
em torno de 500 cm, no terceiro tanque em torno de 1000 cm e em torno de 2000 cm para o
quarto tanque.
Figura 4.12. Visualização do sinal de entrada no quinto tanque, o sinal de entrada composto das 10000 primeiras
amostras e o nível de saída no quinto tanque.
Capítulo 4 – Metodologia
51
Brenna Karolyna dos Santos Silva – Fevereiro 2016
As Figuras 4.13 a 4.17 representam os sinais de entrada e saída da planta a ser
identificada pela rede neural do tipo RBF. Uma vez obtido tal conjunto de dados, através da
simulação apresentada na figura 4.5, o mesmo será utilizado para treinamento e teste na rede
RBF. Para exemplificar apresentamos os gráficos de um conjunto entrada e saída dos dados
simulados a partir do sistema e utilizados na fase de treinamento da RBF. Durante a fase de
treinamento foram escolhidas 20000 amostras dos dados simulados, sendo 10000 dados de
entrada e 10000 dados de saída para cada tanque.
Figura 4.13. Gráfico dos dados de entrada / saída do primeiro tanque utilizados durante a fase de treinamento.
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 100000
0.2
0.4
0.6
0.8
1tensão na primeira bomba
tempo (s)
tensão (
V)
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-50
0
50
100
150
200Nível no primeiro tanque
tempo (s)
nív
el (c
m)
Capítulo 4 – Metodologia
52
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 4.14. Gráfico dos dados de entrada / saída do segundo tanque utilizados durante a fase de treinamento.
Figura 4.15. Gráfico dos dados de entrada / saída do terceiro tanque utilizados durante a fase de treinamento.
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 100000
0.2
0.4
0.6
0.8
1tensão na segunda bomba
tempo (s)
tensão (
V)
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-200
0
200
400
600
800
1000Nível no segundo tanque
tempo (s)
nív
el (c
m)
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 100000
0.2
0.4
0.6
0.8
1tensão na terceira bomba
tempo (s)
tensão (
V)
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-500
0
500
1000
1500
2000Nível no terceiro tanque
tempo (s)
nív
el (c
m)
Capítulo 4 – Metodologia
53
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 4.16. Gráfico dos dados de entrada / saída do quarto tanque utilizados durante a fase de treinamento.
Figura 4.17. Gráfico dos dados de entrada / saída do quinto tanque utilizados durante a fase de treinamento.
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 100000
0.2
0.4
0.6
0.8
1tensão na quarta bomba
tempo (s)
tensão (
V)
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-500
0
500
1000
1500
2000
2500Nível no quarto tanque
tempo (s)
nív
el (c
m)
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 100000
0.2
0.4
0.6
0.8
1tensão na quinta bomba
tempo (s)
tensão (
V)
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000-500
0
500
1000
1500
2000
2500Nível no quinto tanque
tempo (s)
nív
el (c
m)
Capítulo 5
Resultados Obtidos
Capítulo 5 – Resultados obtidos
55
Brenna Karolyna dos Santos Silva – Fevereiro 2016
5. Resultados Obtidos
5.1 - Análises dos resultados da identificação
O procedimento de análise dos resultados obtidos na identificação do sistema de
tanques utilizando a rede RBF é dividido nas seguintes etapas: Escolha da estrutura da RBF
para representar o sistema a ser identificado, otimização da RBF usando agrupamento de dados
e estimação dos parâmetros do modelo matemático através da pseudo inversa (fase de
treinamento), teste do modelo obtido e a validação do mesmo.
No processo de treinamento da RBF primeiramente, escolhemos o número de centros
que corresponde ao número de neurônios na única camada oculta, de modo que esse número
seja o menor possível para termos ganho computacional e evitarmos um sobre treinamento da
rede. Faz-se necessário também nessa etapa a escolha da largura das gaussianas através da
Equação (4.28). Em seguida realizamos diferentes testes com os parâmetros escolhidos e
analisamos o erro de treinamento para diferentes cenários, sendo escolhido o de menor erro e
dentro de uma tolerância estabelecida (menor ou igual a 10-2). Sendo, portanto os parâmetros
escolhidos apresentados na seguinte tabela:
Tabela 1. Parâmetros escolhidos durante a fase de treinamento
Após a obtenção de um modelo durante a fase de treinamento e que forneceu os
melhores desempenhos baseados no erro médio quadrático, podemos utilizar tal modelo numa
nova fase denominada de teste. No caso foram escolhidos 1000 centros com uma largura das
Capítulo 5 – Resultados obtidos
56
Brenna Karolyna dos Santos Silva – Fevereiro 2016
gaussianas fixa em 0,02. Embora 2000 centros apresente o menor erro, não escolhemos esse
valor pois há o risco de sobre treinamento o que dificulta uma boa generalização da RBF.
As seguintes figuras representam os resultados obtidos na fase de teste, onde foram
utilizados os mesmos dados simulados com a presença de ruído (reais) e foram comparados aos
obtidos pela RBF e os dados desejados (sem a presença de ruído).
Figura 5.1a. Gráfico comparativo do nível no primeiro tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o
desejado (preto, tracejado).
Ao analisarmos o gráfico, podemos ver claramente que a estimativa da RBF
acompanha a dinâmica do sistema, onde além de identificar tal comportamento ainda atenua o
ruído presente nos dados.
Para uma melhor visualização optamos por ampliar uma determinada área da Figura
5.1a. Ou seja, as 1000 primeiras amostras. Na figura 5.1b fica bem visível o comportamento da
RBF acompanhando a dinâmica do nível no primeiro tanque. A analogia é válida aos demais
tanques.
Capítulo 5 – Resultados obtidos
57
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.1b. As mil primeiras amostras referentes a Figura 5.1a.
O mesmo teste é feito nos demais tanques conforme pode ser observado nas Figuras a seguir.
Figura 5.2a. Gráfico comparativo do nível no segundo tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o
desejado (preto, tracejado).
Capítulo 5 – Resultados obtidos
58
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.2b. As mil primeiras amostras referentes a Figura 5.2a.
Figura 5.3a. Gráfico comparativo do nível no terceiro tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o
desejado (preto, tracejado).
Capítulo 5 – Resultados obtidos
59
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.3b. As mil primeiras amostras referentes a Figura 5.3a.
Figura 5.4a. Gráfico comparativo do nível no quarto tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o
desejado (preto, tracejado).
Capítulo 5 – Resultados obtidos
60
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.4b. As mil primeiras amostras referentes a Figura 5.4a.
Figura 5.5a. Gráfico comparativo do nível no quinto tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado) e os dados sem a presença de ruído, tido como o
desejado (preto, tracejado).
Capítulo 5 – Resultados obtidos
61
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.5b. As mil primeiras amostras referentes a figura 5.5a.
Após o treinamento a RBF apresentou resultados bem próximos ao desejado. No
entanto, para a obtenção do modelo tido como ideal é imprescindível verificar se o modelo é
confiável para o propósito desejado. Existem diversas maneiras de se realizar a validação de
um modelo. Neste trabalho, o índice de desempenho utilizado foi o erro médio quadrático
(“Mean Squared Error “– MSE).
Na etapa de validação o principal objetivo é apresentar a RBF um sinal de entrada que
seja diferente do sinal utilizado durante a fase de treinamento e teste a fim de observar se a rede
responde de forma satisfatória à dinâmica do sistema identificado. Uma vez constatado que a
rede responde como o esperado, podemos dizer que a mesma está generalizando, ou seja, que
para qualquer sinal apresentado podemos inferir como será a dinâmica real do processo.
Nessa fase, primeiramente criamos um sinal de entrada oscilando entre 1 e 10 para
aplicarmos na RBF e observar se o resultado obtido corresponde ao que se espera, ou seja, se
acompanha a dinâmica do sistema, simulações com o mesmo sinal de entrada foi apresentado
ao sistema para comparação.
Ao realizarmos as simulações obtemos os resultados apresentados nas seguintes
figuras, onde a RBF apresentou um resultado satisfatório na identificação da dinâmica do
sistema conforme pode ser visualizado através da linha em vermelho, que representa a saída da
RBF, enquanto que a linha azul representa a saída de cada tanque no sistema. Para uma melhor
Capítulo 5 – Resultados obtidos
62
Brenna Karolyna dos Santos Silva – Fevereiro 2016
visualização do sinal de entrada foi necessário fazer um gráfico com amostras intercaladas em
50 amostras.
Figura 5.6. Gráfico do resultado obtido na validação do nível no primeiro tanque para o sinal de entrada
apresentado.
Capítulo 5 – Resultados obtidos
63
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.7. Gráfico do resultado obtido na validação do nível no segundo tanque para o sinal de entrada
apresentado.
Capítulo 5 – Resultados obtidos
64
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.8. Gráfico do resultado obtido na validação do nível no terceiro tanque para o sinal de entrada
apresentado.
Capítulo 5 – Resultados obtidos
65
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.9. Gráfico do resultado obtido na validação do nível no quarto tanque para o sinal de entrada
apresentado.
Capítulo 5 – Resultados obtidos
66
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5.10. Gráfico do resultado obtido na validação do nível no quinto tanque para o sinal de entrada
apresentado.
Ao observarmos as figuras podemos concluir que a RBF foi devidamente
treinada e obteve um bom conjunto de parâmetros que representa satisfatoriamente a dinâmica
do sistema de tanques acoplados. A seguinte tabela apresenta o erro médio quadrático obtido
na etapa de validação.
Tabela 2. Erro médio quadrático na etapa de validação
Tanque Erro de
treinamento
Erro de
validação
01 0,0006 0,0205
02 0,0007 0,0164
03 0,0004 0,0169
04 0,0010 0,0110
05 0,0005 0,0013
Capítulo 5 – Resultados obtidos
67
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Ao analisarmos as figuras e a tabela podemos concluir que a RBF identificou de
maneira satisfatória a dinâmica do sistema de tanques.
Capítulo 6
Conclusão
Capítulo 6 – Conclusão
69
Brenna Karolyna dos Santos Silva – Fevereiro 2016
6. Conclusão
Nesta dissertação foi apresentado um estudo sobre o uso de redes neurais artificiais do
tipo funções de base radial, na identificação de um sistema não linear de cinco tanques
acoplados, utilizando uma estrutura RBF ARMAX para um sistema de múltiplas entradas e
múltiplas saídas, realizada no software Matlab® em um computador comercial de uso geral.
A utilização de redes neurais artificiais na identificação de sistemas dinâmicos não-
lineares vem se consolidando como uma alternativa de entender e otimizar tais processos, com
o objetivo de garantir que o modelo obtido reproduza, o mais próximo possível, as
características reais do sistema. Neste sentido as redes de função de base radial atendem muito
bem aos requisitos propostos, devido ao fato de serem aproximadores universais de funções e
possuírem um algoritmo de treinamento simples e rápido se comparado a outros tipos de RNAs.
A grande vantagem em utilizar uma rede neural do tipo RBF na identificação de sistemas está
associada à capacidade de aproximação de funções não-lineares, rapidez e eficiência do
aprendizado, gerando um baixo custo operacional.
Os resultados mostraram-se bastante satisfatórios desde a fase de treinamento, uma
vez que a rede neural do tipo RBF identificou a planta apresentando uma diferença mínima na
comparação da saída real do sistema com a saída da rede neural RBF, e também durante a
generalização do modelo obtido pela rede neural RBF, quando o modelo respondeu
satisfatoriamente a padrões que não haviam sido apresentados a rede.
Com isso conclui-se que as redes neurais RBF são eficientes e totalmente aplicáveis
na identificação de sistemas não lineares com várias entradas e várias saídas. Vale ressaltar que,
os resultados são dependentes da arquitetura adotada para a rede neural, isto é, número de
entradas da RBF, número de neurônios na camada oculta, método de treinamento e também do
conjunto de dados utilizados nas fases de treinamento e validação do modelo obtido com a rede
neural.
Como trabalhos futuros indicam-se:
Testar novos métodos de treinamento para a RBF com algoritmos evolutivos
e de inteligência coletiva, por exemplo, para problemas de identificação de
sistemas não lineares e multivariáveis.
Projetar um controlador juntamente com o identificador do sistema utilizando
redes de função de base radial.
Capítulo 6 – Conclusão
70
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Um estudo aprofundado envolvendo diferentes tipos de RNAs para explorar
melhor os possíveis parâmetros de configuração dessas técnicas.
Referências Bibliográficas
Referências Bibliográficas
72
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Referências Bibliográficas
AGUIRRE, L. A. Introdução à identificação de sistemas: técnicas lineares e não lineares
aplicadas a sistemas reais. 3. ed. Belo Horizonte, MG, 2007.
AGUIRRE, L. A. et al. Enciclopédia de automática, controle & automação – vol. II. São
Paulo: Blucher, 2007.
AGUIRRE, L. A. et al. Enciclopédia de automática controle & automação – vol. III. São
Paulo: Blucher, 2007.
ARAÚJO JÚNIOR, J. M.; LINHARES, L. L. S.; ARAÚJO, F. M. U. Identificação de sistema
biomecânico a partir de redes neurais wavelets. 2013. 6f. Artigo científico. In: XI SBAI,
Fortaleza - CE.
ARAÚJO JÚNIOR, J. M. de. Identificação não linear usando uma rede fuzzy wavelet
neural network modificada. 2014. 110 f. Tese (Doutorado em Automação e Sistemas;
Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do
Norte, Natal, 2014.
BISHOP, C. M., Pattern Recognition and Machine Learning, Springer, New York, NY,
USA, 2006.
BILLINGS, S.A.; JAMALUDDIN, H.B.; CHEN, S. Properties of neural networks with
applications to modelling nonlinear dynamic systems. International Journal of Control,
55(1), 193–224, 1992.
BILLINGS, S.A.; CHEN, S. The determination of multivariable nonlinear models for
dynamic systems using neural networks. In C.T. Leondes (ed.), Neural Network System
Techniques and Applications. San Diego, CA: Academic Press, pp. 231–278, 1998.
BUHMANN, M. D. Radial Basis Functions: Theory and Implementations, Cambridge
University Press (Cambridge), 2003.
Referências Bibliográficas
73
Brenna Karolyna dos Santos Silva – Fevereiro 2016
BRAGA, A.; CARVALHO, A.; LUDERMIR, T. Redes Neurais Artificiais: Teoria e
Aplicações, Livro Técnico e Científico: Rio de Janeiro, 2000.
BROOMHEAD, D.S.; LOWE, D. Multivariable functional interpolation and adaptive
networks. Complex Systems, 2, 321–355, 1988.
CASTRO, F. C. C.; CASTRO, M. C. F. Redes neurais artificiais. Notas de aula. Pontifícia
Universidade Católica do Rio Grande do Sul, Porto Alegre, 2000.
COELHO, A. A. R.; COELHO, L. S. Identificação de sistemas dinâmicos lineares.
Florianópolis: UFSC, 2004.
COELHO, L. S. Introdução às redes neurais artificiais. Notas de aula. Sistemas Inteligentes,
PPGEPS. Pontifícia Universidade Católica do Paraná, Curitiba, 2004.
COVER, T. M. Geometrical and statistical properties of systems of linear inequalities with
applications in pattern recognition, Electronic Computers, IEEE Transactions on, v. 14, n. 3,
p. 326-334, 1965.
CHEN, S.; BILLINGS, S.A. Representation of non-linear systems: the NARMAX model.
International J. Control 49:1013 – 1032, 1989.
DUDUL. S. V. Prediction of a Lorenz chaotic Attractor using Two-layer Perceptron
Neural Network. Applied Soft Computing, 2004.
FOLLAND, R.; HINES, E.; DUTTA, R., BOILOT, P.; MORGAN, D. Comparison of neural
network predictors in the classification of tracheal–bronchial breath sounds by
respiratory auscultation. Artificial Intelligence in Medicine, vol. 31, no. 3, July 2004, p. 211-
220.
HAYKIN, S. Neural Networks: A Comprehensive Foundation (2nd ed.). Prentice Hall PTR,
Upper Saddle River, New Jersey, USA, 1998.
Referências Bibliográficas
74
Brenna Karolyna dos Santos Silva – Fevereiro 2016
HAYKIN, S. Neural networks and learning machines. 3 ed. Pearson Education,2009.
HAYKIN, S. Neural Networks and Learning Machines. 2 ed. Prentice Hall, Upper Saddle
River, New Jersey, USA, 2009.
HAYKIN, S. Redes neurais: princípios e prática. 2.ed. Porto Alegre, Bookman, 2001.
KAR-ANN Toh; MAO, K.Z. A global transformation approach to RBF neural network
learning. Pattern Recognition, 2002. Proceedings. 16th International Conference on, vol.2, no.
pp.96,99 vol.2, 2002 doi: 10.1109/ICPR.2002.1048246
KHANNA, T. Foundation of Neural Networks. Ed. Addison-Wesley Publishing Company,
Princeton, USA, 1990.
LEONTARITIS, I.J.; BILLINGS, S.A. Model selection and validation methods for non-
linear systems. International J. Control 45:311 – 341, 1987.
LIN, W. M.; YANG, C. D.; LIN, J. H.; Tsay, M. T. A fault classification method by RBF
neural network with OLS learning procedure. IEEE Transactions on Power Delivery, vol.
16, no 4, p. 473-477, 2001.
LINHARES, L. L. S.; ARAÚJO JÚNIOR, J. M.; ARAÚJO, F. M. U. Redes neurais artificiais
para identificação da fração molar de pentano na composição do GLP. 2007. 6f. Artigo
científico. Natal - RN.
LIPPMANN, R.P. An introduction to computing with neural nets. IEEE ASSP Mag, vol.4,
nº2, 1987.
MASHOR, M.Y. Performance Comparison between HMLP, MLP and RBF Networks
with Application to On-line System Identification. Proceedings IEEE, Conference on
Cybernetics and Intelligent Systems, Singapore, 2004.
Referências Bibliográficas
75
Brenna Karolyna dos Santos Silva – Fevereiro 2016
MENDEL, J. M.; MACLAREN, R. W. Reinforcement learning control and pattern
recognition systems, in Adaptive, Learning, and Pattern Recognition Systems: Theory and
Applications, J. M. Mendel and K. S. Fu, Eds. New York: Academic Press, 1970.
NUNES, G. C.; MEDEIROS, J. L.; ARAÚJO, O. Q. F. Modelagem e controle na produção
de petróleo: aplicações em MATLAB. São Paulo: Ed. Blucher, 2009.
NUNES, D. C., Modelagem e controle avançado de um sistema de tanques acoplados
multivariável. 2013. 56p. Trabalho de conclusão de curso, Universidade Federal do Rio
Grande do Norte, Natal, 2013.
PANIGRAHI, S.; BALASUBRAMANIAN, S.; GU, H.; LOGUE, C.; MARCHELLO, M.
Neural-network-integrated electronic nose system for identification of spoiled beef. LWT
- Food Science and Technology, vol. 39, no. 2, 2006, p. 135-145.
PARK, J.W.; HARLEY, R. G.; VENAYAGAMOORTHY, G. K. Comparison of MLP and
RBF neural networks using deviation signals for on-line identification of a synchronous
generator. IEEE Power Engineering Society Winter Meeting, New York, USA, 2002.
PENG, H.; OZAKI, T.; OZAKI, V. H.; TOYODA, Y. A Parameter Optimization Method
for Radial Basis Function Type Models. IEEE Transactions on Neural Networks, vol. 14, no.
2, 2003.
POWELL, M. J. D. Radial basis function approximation to polynomials. Proceedings of
12th Biennial Numerical Analysis Conference, Dundee, pp. 223–241, 1987.
POGGIO, T.; GIROSI, F., Networks for approximation and learning. Proceeding of the
IEEE, vol 78, pp. 1481 - 1497, 1990a.
RÊGO, J. B. de A. Identificação de uma planta de corrente de um motor de indução
utilizando redes de base radial. 2010. 104 f. Dissertação (Mestrado em Automação e
Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio
Grande do Norte, Natal, 2010.
Referências Bibliográficas
76
Brenna Karolyna dos Santos Silva – Fevereiro 2016
REBOUÇAS, D. L. Utilização de redes neurais artificiais para detecção e diagnóstico de
falhas. 2011. 93 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de
Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2011.
SILVA, B. K. S.; MAITELLI, A. L.; FILHO, O.G. Identificação de um sistema de tanques
acoplados utilizando funções de base radial. In: SIMPÓSIO DE AUTOMAÇÃO E
SISTEMAS, 2014, 1, Hotel Parque da Costeira, Artigo Científico, Natal, 2014, 5 páginas.
SILVA, B. K. S.; MAITELLI, A.L.; FILHO, O.G. Identificação de um sistema de tanques
acoplados utilizando funções de base radial. In: RIO OIL & GAS EXPO AND
CONFERENCE, 17, 2014, Riocentro, Artigo Científico, Rio de Janeiro, 2014 10 páginas.
SÖDESTRÖN, T.; STOICA, P. System Identification. Prentice Hall, 1989.
SJOBERG, J. Non-linear system identification with neural networks. Electrical Engineer
Department, Linkoping University. Linkoping, Sweden 1995.
TAN, S.; HAO, J.; VANDEWALLE, J. Efficient Identification of RBF Neural Net
Models for Nonlinear Discrete-time Multivariable Dynamical Systems. Neurocomputing,
vol.9, p. 11 - 26, 1995.
VICTOR, J. D.; SHAPLEY, R. M. A method of nonlinear analysis in the frequency domain.
Biophys. J. 29:459-484. 1980.
YATES, J.W.T.; GARDNER, J.W.; CHAPPELL, M.J. & DOW, C.S. Identification of
bacterial pathogens using quadrupole mass spectrometer data and radial basis function
neural networks. Science, Measurement and Technology, IEE Proceedings, vol. 152, no. 3,
May 2005, p.97- 102.
YU, D. L.; GOMM, J. B. & WILLIAMS, D. Neural Model Input Selection for a MIMO
Chemical Process. Engineering Applications of Artificial Intelligence, vol. 13, 2000.
Apêndice
Apêndice
78
Brenna Karolyna dos Santos Silva – Fevereiro 2016
APÊNDICE A
Apêndice A - Resultados complementares
Nesta dissertação foi apresentado um estudo sobre o uso de redes neurais artificiais do
tipo funções de base radial, na identificação de um sistema não linear de cinco tanques
acoplados, que durante a fase de treinamento utilizou um conjunto de 20000 amostras dos dados
simulados, sendo 10000 dados de entrada e 10000 dados de saída para cada tanque. A nível de
comparação para comprovar a eficiência da rede neural na identificação do sistema de tanques,
foram obtidos resultados através de um conjunto de 40000 amostras, sendo 20000 dos dados de
entrada e 20000 dos dados de saída para cada tanque.
Tais resultados podem ser vistos nas Figuras a seguir.
Primeiramente é apresentado o sinal de entrada utilizado para o primeiro tanque,
devido à figura ter ficado com muita informação dificultando a visualização, optou-se por
mostrar a mesma figura numa escala intercalada facilitando a compreensão através de uma
melhor visualização, em seguida é apresentada a figura referente à medição do nível no primeiro
tanque, a mesma metodologia foi adotada aos demais tanques conforme pode ser visualizado
nas Figuras 1 a 5.
Apêndice
79
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 1. Visualização do sinal de entrada no primeiro tanque, o sinal de entrada composto das 20000 primeiras
amostras e o nível de saída no primeiro tanque.
Figura 2. Visualização do sinal de entrada no segundo tanque, o sinal de entrada composto das 20000 primeiras
amostras e o nível de saída no segundo tanque.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
0.5
1
amostras
tensão (
V)
tensão na primeira bomba
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
0
0.5
1
amostras
tensão (
V)
tensão na primeira bomba (0 - 20000 amostras)
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
100
200
amostras
nív
el (
cm
)
Nível no primeiro tanque
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
0.5
1
amostras
tensão (
V)
tensão na segunda bomba
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
0
0.5
1
amostras
tensão (
V)
tensão na segunda bomba (0 - 20000 amostras)
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
500
amostras
nív
el (
cm
)
Nível no segundo tanque
Apêndice
80
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 3. Visualização do sinal de entrada no terceiro tanque, o sinal de entrada composto das 20000 primeiras
amostras e o nível de saída no terceiro tanque.
Figura 4. Visualização do sinal de entrada no quarto tanque, o sinal de entrada composto das 20000 primeiras
amostras e o nível de saída no quarto tanque.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
0.5
1
amostras
tensão (
V)
tensão na terceira bomba
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
0
0.5
1
amostras
tensão (
V)
tensão na terceira bomba (0 - 20000 amostras)
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
1000
2000
amostras
nív
el (
cm
)
Nível no terceiro tanque
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
0.5
1
amostras
tensão (
V)
tensão na quarta bomba
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
0
0.5
1
amostras
tensão (
V)
tensão na quarta bomba (0 - 20000 amostras)
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
1000
2000
amostras
nív
el (
cm
)
Nível no quarto tanque
Apêndice
81
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 5. Visualização do sinal de entrada no quinto tanque, o sinal de entrada composto das 20000 primeiras
amostras e o nível de saída no quinto tanque.
As seguintes figuras representam os resultados obtidos na fase de teste, onde foram
utilizados os mesmos dados simulados com a presença de ruído (reais) e foram comparados aos
obtidos pela RBF.
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
0.5
1
amostras
tensão (
V)
tensão na quinta bomba
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
0
0.5
1
amostras
tensão (
V)
tensão na quinta bomba (0 - 20000 amostras)
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
x 105
0
2000
4000
amostras
nív
el (
cm
)
Nível no quinto tanque
Apêndice
82
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 6. Gráfico comparativo do nível no primeiro tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado)
Figura 7. Gráfico comparativo do nível no segundo tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado)
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
-50
0
50
100
150
200
250
amostras
Nív
el (
cm
)
Identificação do nível no primeiro tanque utilizando a RBF
real
estimado
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
-200
0
200
400
600
800
1000
amostras
Nív
el (
cm
)
Identificação do nível no segundo tanque utilizando a RBF
real
estimado
Apêndice
83
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 8. Gráfico comparativo do nível no terceiro tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado)
Figura 9. Gráfico comparativo do nível no quarto tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado)
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
-500
0
500
1000
1500
2000
2500
amostras
Nív
el (
cm
)
Identificação do nível no terceiro tanque utilizando a RBF
real
estimado
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
-500
0
500
1000
1500
2000
2500
3000
3500
amostras
Nív
el (
cm
)
Identificação do nível no quarto tanque utilizando a RBF
real
estimado
Apêndice
84
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 10. Gráfico comparativo do nível no quinto tanque onde temos os dados acrescidos de ruído (em azul,
pontilhado), o estimado pela RBF (em vermelho, tracejado).
Durante a etapa de validação em que realizarmos as simulações obtemos os resultados
apresentados nas seguintes Figuras, onde a RBF apresentou um resultado satisfatório na
identificação da dinâmica do sistema conforme pode ser visualizado através da linha em
vermelho, que representa a saída da RBF, enquanto que a linha azul representa a saída de cada
tanque no sistema. Para uma melhor visualização do sinal de entrada foi necessário fazer um
gráfico com amostras intercaladas em 50 amostras.
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
x 104
-500
0
500
1000
1500
2000
2500
3000
3500
4000
4500
amostras
Nív
el (
cm
)
Identificação do nível no quinto tanque utilizando a RBF
real
estimado
Apêndice
85
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 11. Gráfico do resultado obtido na validação do nível no primeiro tanque para o sinal de entrada
apresentado.
Figura 12. Gráfico do resultado obtido na validação do nível no segundo tanque para o sinal de entrada
apresentado.
0 50 100 150 200 250 300 350 4000
2
4
6
8
10
amostras x 50
tensão (
V)
tensão na primeira bomba
0 50 100 150 200 250 300 350 400-10
0
10
20
30
40
amostras x 50
Nív
el (
cm
)
Nível no primeiro tanque
real
validado
0 50 100 150 200 250 300 350 4000
2
4
6
8
10
amostras x 50
tensão (
V)
tensão na segunda bomba
0 50 100 150 200 250 300 350 4000
20
40
60
80
100
120
amostras x 50
Nív
el (
cm
)
Nível no segundo tanque
real
validado
Apêndice
86
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 13. Gráfico do resultado obtido na validação do nível no terceiro tanque para o sinal de entrada
apresentado.
Figura 14. Gráfico do resultado obtido na validação do nível no quarto tanque para o sinal de entrada
apresentado.
0 50 100 150 200 250 300 350 4000
2
4
6
8
10
amostras x 50
tensão (
V)
tensão na terceira bomba
0 50 100 150 200 250 300 350 400-1000
0
1000
2000
3000
4000
amostras x 50
Nív
el (
cm
)
Nível no terceiro tanque
real
validado
0 50 100 150 200 250 300 350 4000
2
4
6
8
10
amostras x 50
tensão (
V)
tensão na quarta bomba
0 50 100 150 200 250 300 350 400-1000
0
1000
2000
3000
4000
amostras x 50
Nív
el (
cm
)
Nível no quarto tanque
real
validado
Apêndice
87
Brenna Karolyna dos Santos Silva – Fevereiro 2016
Figura 15. Gráfico do resultado obtido na validação do nível no quinto tanque para o sinal de entrada
apresentado.
0 50 100 150 200 250 300 350 4000
2
4
6
8
10
amostras x 50
tensão (
V)
tensão na quinta bomba
0 50 100 150 200 250 300 350 4000
200
400
600
800
1000
amostras x 50
Nív
el (
cm
)
Nível no quinto tanque
real
validado
top related