otimizaÇÃo genÉtica assistida no controle de …swge.inf.br/cba2014/anais/pdf/1569933397.pdf ·...

8
OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE CONFIGURAÇÃO DE ROBÔS MÓVEIS MULTIARTICULADOS DIEGO NUNES BERTOLANI * ,EDSON DE PAULA FERREIRA ,LEONARDO DE ASSIS SILVA * Instituto Federal do Espírito Santo - IFES - Estrada da Tartaruga, s/n - Guarapari, Brasil Universidade Federal do Espírito Santo - UFES - Av. Fernando Ferrari, 514 - Vitória, Brasil Emails: [email protected], [email protected], [email protected] Abstract— The main goal of this article is to propose an assisted method for optimization up to four parameters, in configuration controllers, based on an adequate interface using Genetic Algorithm, for Multi-Articulated Mobile Robots (RMMA). A model obtained from a real prototype truck-trailer-trailer will be used as the object of analysis. The methodology will be applied for two nonlinear control structures, Feedback and Feedforward, the latter being this article’s original proposal, both based on the singular conditions of rotation’s unstable equilibrium of the articulated mechanical chain of RMMAs. The paper explicits the importance of the interface in the synthesis and performance analysis of nonlinear structures of configuration control. Keywords— Multiarticulated Mobile Robots, Non Linear Control, Gain Tunning, Genetic Algorithm Resumo— O objetivo principal deste artigo é propor um método assistido de otimização de até quatro ganhos, em controladores de configuração, baseado numa interface adequada utilizando Algoritmo Genético, para Robôs Móveis Multiarticulados (RMMA). Como objeto de análise será utilizado um modelo obtido a partir de um protótipo real truck-trailer-trailer. A metodologia será apli- cada para duas estruturas não lineares de controle, Feedback e Feedforward, sendo esta última uma proposta original deste artigo, ambas baseadas nas condições singulares em equilíbrio instável de giro da cadeia mecânica articulada de RMMAs. O trabalho explicita a importância da interface na síntese e análise de desempenho de estruturas não lineares de controle de configuração. Palavras-chave— Robôs Móveis Multiarticulados, Controle Não Linear, Sintonia de Ganhos, Algoritmo Genético. 1 Introdução Este artigo trata dos robôs móveis de uma estrutura genérica, composta por elementos conectados sequen- cialmente, sendo o primeiro denominado truck ou tra- tor, dotado de tração, traseira ou dianteira, e os demais passivos, sem motorização ou controle local, denomi- nados trailers. A ligação entre elementos da cadeia articulada pode ser do tipo on-axle 1 ou off-axle 2 , con- forme Figura 1. Esta estrutura é denominada Robô Móvel Multiarticulado (RMMA) ou Veículo Multiar- ticulado (VMA)(Ferreira and Pandolfi, 2011). A Figura 1 mostra uma cadeia articulada genérica, ilustrando o ângulo de direção (γ ) e os de configuração (θ 1 ,...,θ n ), bem como os parâmetros geométricos da cadeia mecânica articulada, A i e B i , onde para B i 6= 0, tem-se uma ligação off-axle. Figura 1: Cadeia cinemática genérica de um RMMA. Os RMMAs e VMAs possuem diversas caracte- rísticas geométricas e cinemáticas semelhantes e por esta razão são objeto de soluções de controle similares. 1 Engate entre dois trailers feito sobre o eixo das rodas 2 Engate entre dois trailers feito fora do eixo das rodas Como exemplo suficientemente representativo, neste trabalho, será utilizada uma estrutura truck-trailer- trailer, conforme Figura 2, tendo o truck, tração tra- seira e controle de direção nas rodas dianteiras, e sendo os engates dos dois trailers, respectivamente, on-axle e off-axle. Figura 2: RMMA - Protótipo de testes. A principal motivação deste trabalho consiste em desenvolver ferramentas para a navegação de RMMAs ou VMAs em movimentos à ré. Progressos neste campo poderiam contribuir para redução de custos e melhoria de eficiência no setor industrial e na cadeia logística brasileira. A complexidade maior do controle de manobras e navegação de RMMAs está ligada aos movimentos à ré. Nesta situação, o sistema comporta-se como um pêndulo invertido múltiplo horizontal. Uma vez que os engates permitem a livre rotação, os ângulos entre os trailers (em um ou mais engates) podem aumentar para valores inadequados, evoluindo para uma situa- ção de jackknife (engavetamento). A adição de trailers à estrutura dos RMMAs torna mais difícil a realização de manobras, principalmente em marcha à ré. Isto faz com que seja necessário uti- lizar controladores com estruturas complexas, que não Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 24

Upload: others

Post on 15-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE CONFIGURAÇÃO DE ROBÔS MÓVEISMULTIARTICULADOS

DIEGO NUNES BERTOLANI∗, EDSON DE PAULA FERREIRA†, LEONARDO DE ASSIS SILVA†

∗Instituto Federal do Espírito Santo - IFES - Estrada da Tartaruga, s/n - Guarapari, Brasil†Universidade Federal do Espírito Santo - UFES - Av. Fernando Ferrari, 514 - Vitória, Brasil

Emails: [email protected], [email protected],[email protected]

Abstract— The main goal of this article is to propose an assisted method for optimization up to four parameters, in configurationcontrollers, based on an adequate interface using Genetic Algorithm, for Multi-Articulated Mobile Robots (RMMA). A modelobtained from a real prototype truck-trailer-trailer will be used as the object of analysis. The methodology will be applied for twononlinear control structures, Feedback and Feedforward, the latter being this article’s original proposal, both based on the singularconditions of rotation’s unstable equilibrium of the articulated mechanical chain of RMMAs. The paper explicits the importanceof the interface in the synthesis and performance analysis of nonlinear structures of configuration control.

Keywords— Multiarticulated Mobile Robots, Non Linear Control, Gain Tunning, Genetic Algorithm

Resumo— O objetivo principal deste artigo é propor um método assistido de otimização de até quatro ganhos, em controladoresde configuração, baseado numa interface adequada utilizando Algoritmo Genético, para Robôs Móveis Multiarticulados (RMMA).Como objeto de análise será utilizado um modelo obtido a partir de um protótipo real truck-trailer-trailer. A metodologia será apli-cada para duas estruturas não lineares de controle, Feedback e Feedforward, sendo esta última uma proposta original deste artigo,ambas baseadas nas condições singulares em equilíbrio instável de giro da cadeia mecânica articulada de RMMAs. O trabalhoexplicita a importância da interface na síntese e análise de desempenho de estruturas não lineares de controle de configuração.

Palavras-chave— Robôs Móveis Multiarticulados, Controle Não Linear, Sintonia de Ganhos, Algoritmo Genético.

1 Introdução

Este artigo trata dos robôs móveis de uma estruturagenérica, composta por elementos conectados sequen-cialmente, sendo o primeiro denominado truck ou tra-tor, dotado de tração, traseira ou dianteira, e os demaispassivos, sem motorização ou controle local, denomi-nados trailers. A ligação entre elementos da cadeiaarticulada pode ser do tipo on-axle1 ou off-axle2, con-forme Figura 1. Esta estrutura é denominada RobôMóvel Multiarticulado (RMMA) ou Veículo Multiar-ticulado (VMA)(Ferreira and Pandolfi, 2011).

A Figura 1 mostra uma cadeia articulada genérica,ilustrando o ângulo de direção (γ) e os de configuração(θ1,...,θn), bem como os parâmetros geométricos dacadeia mecânica articulada, Ai e Bi, onde para Bi 6=0, tem-se uma ligação off-axle.

Figura 1: Cadeia cinemática genérica de um RMMA.

Os RMMAs e VMAs possuem diversas caracte-rísticas geométricas e cinemáticas semelhantes e poresta razão são objeto de soluções de controle similares.

1Engate entre dois trailers feito sobre o eixo das rodas2Engate entre dois trailers feito fora do eixo das rodas

Como exemplo suficientemente representativo, nestetrabalho, será utilizada uma estrutura truck-trailer-trailer, conforme Figura 2, tendo o truck, tração tra-seira e controle de direção nas rodas dianteiras, esendo os engates dos dois trailers, respectivamente,on-axle e off-axle.

Figura 2: RMMA - Protótipo de testes.

A principal motivação deste trabalho consiste emdesenvolver ferramentas para a navegação de RMMAsou VMAs em movimentos à ré. Progressos nestecampo poderiam contribuir para redução de custos emelhoria de eficiência no setor industrial e na cadeialogística brasileira.

A complexidade maior do controle de manobrase navegação de RMMAs está ligada aos movimentosà ré. Nesta situação, o sistema comporta-se como umpêndulo invertido múltiplo horizontal. Uma vez queos engates permitem a livre rotação, os ângulos entreos trailers (em um ou mais engates) podem aumentarpara valores inadequados, evoluindo para uma situa-ção de jackknife (engavetamento).

A adição de trailers à estrutura dos RMMAs tornamais difícil a realização de manobras, principalmenteem marcha à ré. Isto faz com que seja necessário uti-lizar controladores com estruturas complexas, que não

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

24

Page 2: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

apresentam metodologia de sintonia definida na litera-tura, no controle de configuração. O controle de con-figuração, definido em (Ferreira and Pandolfi, 2011), éexecutado à partir de referências geradas na coordena-ção de movimentos em manobras de navegação.

Os métodos clássicos de ajuste de ganhos no do-mínio da frequência e via lugar geométrico das raí-zes, além dos empíricos, como o método de Ziegler-Nichols, são aplicáveis a um conjunto restrito de pro-blemas linearizáveis. O uso da Inteligência Compu-tacional permite sintonizar controladores com estru-turas mais complexas, em um escopo mais amplo deproblemas, envolvendo não linearidades e/ou incerte-zas. Nesta área, o Algoritmo Genético, um algoritmoprobabilístico que provê um mecanismo de busca pa-ralela e adaptativa, tem apresentado bons resultados.Este algoritmo é a base da ferramenta proposta, capazde conduzir a um bom ajuste de ganhos, de compen-sadores lineares, presentes em estruturas não linearesde controle de configuração, necessários para realizarmovimentos à ré com RMMAs de forma satisfatória.

A sistemática de otimização proposta pressupõealgumas escolhas: O Algoritmo Genético como algo-ritmo de busca, o espaço de configurações como es-paço de síntese, e finalmente um particionamento doespaço de configurações. Nesta estratégia, cada parti-ção corresponde a uma condição de giro da cadeia cujocomportamento é ainda não linear, mas pode ser asso-ciado a um conjunto de parâmetros de controle cons-tantes que proporcionam desempenho satisfatório noentorno correspondente. Sendo a solução final de con-trole, para um movimento amplo no espaço de con-figurações, não pertencente ao escopo deste trabalho,podendo ser obtida através da interpolação ou adapta-ção fuzzy, dos melhores ganhos obtidos nas partiçõescorrespondentes segundo a sistemática proposta.

O Algoritmo Genético como base da interfacepara fazer a otimização assistida de ganhos é motivadopelo fato das soluções na literatura apresentarem osajustes necessários para dar robustez e/ou prover esca-lamento e normalizações adequadas, por exemplo nastécnicas neurais e fuzzy, serem feitos empiricamente,por tentativa e erro. Em segundo lugar, a síntese noespaço de configurações apresenta vantagens sobre asíntese no espaço de tarefas. Este é um resultado jáclássico na robótica de manipulação, mas que aindanão está consolidado no controle de RMMAs. A van-tagem principal é a de retirar da malha de controleas complexas transformações geométricas e cinemá-ticas necessárias para resolver os problemas de coor-denação de movimentos na navegação, de seguimentode trajetórias e desvio de obstáculos. Soluções neu-rais propostas na literatura, como em (Nguyen, 1989),treinando redes para solucionar problemas no espaçode tarefas são inviáveis, pois para um mesmo robô,se a tarefa é alterada, a rede tem que ser retreinada.Mesmo uma simples alteração de sistemas de coorde-nadas de representação exigiria um novo processo detreinamento da rede. Este problema de falta de gene-ralidade se estende, por razões diversas, a outras solu-

ções propostas na literatura, sendo isso objeto de aná-lise na Seção 2 deste artigo, análise que também servepara justificar e contextualizar a estratégia proposta.

Na Seção 3, além do novo controlador Feed-forward proposto, são caracterizadas as condições sin-gulares de giro para cadeias cinemáticas genéricas. NaSeção 4 o modelo cinemático genérico é adequado aoprotótipo de testes. Na Seção 5 é detalhada a interfacede auxílio ao ajuste, e na Seção 6 são apresentadosos resultados da aplicação ao protótipo motivando asconclusões da Seção 7.

2 Contextualização da Estratégia Proposta

Tendo em vista que o problema de controle é base-ado na reversão da evolução da cadeia cinemática parasituações de jacknife, este trabalho utiliza uma carac-terização dos ângulos limites para cada articulação doveículo deduzidas analiticamente em trabalhos anteri-ores (Ferreira and Pandolfi, 2011). Esta caracterizaçãose mostra mais realista do que em outros trabalhos naliteratura como (Sharafi and Nikpoor, 2010), em quese considera o engavetamento somente quando o ân-gulo entre engates atinge 90◦, desprezando as restri-ções reais dependentes dos formatos dos trailers dacomposição. Para o veículo em estudo nesta pesquisaconsidera-se θ1max ≈ ±32◦ e θ2max ≈ ±55◦, já queγmax ≈ ±20◦.

Os ângulos limites caracterizam a manobrabili-dade do veículo e dependem analiticamente do ângulomáximo de direção. A maioria das soluções de con-trole propostas na literatura apresentadas em simula-ção não consideram restrições nas variáveis de estadoe de controle do sistema. Neste trabalho é conside-rado um ângulo máximo de direção bastante restritivode aproximadamente ≈ ±20◦, o que é um caso de di-ficuldade extrema para execução de manobras à ré.

Apesar da sistemática de otimização proposta servalidada em simulação, por ser esta uma exigênciado trabalho com Algoritmo Genético, o núcleo utili-zado pela interface é baseado em um protótipo real,apresentando uma visão mais fiel do comportamentode um RMMA. Este robô serviu de base em diversostrabalhos já realizados, como em (Ferreira and Oli-veira, 2010) e (Ferreira, 2011).

Na literatura, muitos artigos tratam o problemamais simples de um RMA, robôs com uma única ar-ticulação, conforme (Petrov, 2010). Já (Stahn andStopp, 2007) e (Park et al., 2004) abordam estruturasmultiarticuladas.

Para veículos com dois ou mais trailers verificou-se que uma das dificuldades encontradas na literaturaé o da caracterização adequada de um modelo cine-mático genérico que contemple todas as característicascomo o tamanho dos reboques, a distância entre eixos,formas de tração e engate, dentre outras. Neste traba-lho utilizou-se como base um modelo genérico com-pleto apresentado em (Ferreira and Pandolfi, 2011).

Diante da complexidade associada ao problema,muitos trabalhos propõem técnicas de controle inte-

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

25

Page 3: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

ligente para realizar o controle da cadeia articuladaem movimentos à ré. Em (Nguyen, 1989) faz-se usode redes neurais tanto para realização do controle,quanto para simulação da cinemática do veículo (pre-ditor). Em (Kong, 1992) as redes neurais funcionamde forma adaptativa, alterando as regras fuzzy do sis-tema, evidenciando uma interação neuro-fuzzy para re-alização do controle do RMMA. Outros estudos sãofeitos aplicando-se as técnicas fuzzy no controle da ca-deia, como em (Ren et al., 2012).

Também são propostas soluções lineares válidasem uma determinada faixa de operação, como em(Altafini and Wahlberh, 2001). Estas e as outras téc-nicas anteriores pecam pela falta de generalidade epela inexistência de uma sistemática prática de tun-ning. Outras técnicas complicam extremamente a sin-tonia final por fecharem a malha de controle no espaçode tarefas, como em (Pradalier, 2007) e (Mendoza andBricaire, 2011).

Em (Jaen-Cuellar et al., 2013) é apresentada umasistemática de otimização de ganhos de um PID viaAlgoritmos Genéticos, proposto para melhorar a sín-tese grosseira no domínio da frequência baseada nocritério de margem de fase, utilizando uma função fit-ness multiobjetivo, definida de modo a penalizar o so-bressinal e outros parâmetros da resposta ao degrau,indiretamente, através da integral do erro e de seu des-vio padrão. Neste caso existe uma redundância quepoderia ser evitada, utilizando outra fitness como fun-ção direta do sobressinal e dos tempos de subida e es-tabilização. Além disso, a proposta é validada em si-mulação para 3 plantas de segunda ordem muito sim-ples.

Para preencherem as lacunas anteriormente men-cionadas, este trabalho vem contribuir para o estabele-cimento da síntese à nível de espaço de configuraçãoprovendo estratégias adequadas para a sintonia siste-mática de ganhos.

3 Condições de Giro e Estruturas de Controle

Um RMMA qualquer, com n trailers, assume umacondição de giro quando seus ângulos de configuraçãoalcançam valores específicos para os quais a composi-ção executa uma trajetória circular ou retilínea, casoo ângulo de direção seja constante e fixado correta-mente. A Equação 1 calcula o ângulo de giro entrereboques consecutivos à partir do segundo elementoda cadeia.

θi−1 =

∣∣∣∣tan−1 Aisen(θi)

Ai+1 + cos(θi)Bi

∣∣∣∣ sgn(θi) (1)

∀ i = 2, 3, ...(n− 1)

A Equação 2 relaciona o elemento truck e o pri-meiro elemento passivo da cadeia articulada para ocaso do veículo com tração nas rodas traseiras.

γ =1

2

∣∣∣∣sen−1 ( 2A1senθ1A2 +B1cos(θ1)

)∣∣∣∣ sgn(−θ1) (2)

Estas condições de giro servem de núcleo paraexercer o controle não linear do RMMA e estão pre-sentes nas estruturas Feedback e Feedforward, junta-mente com o controle linear, representado por um PIDe por um ganho proporcional, conforme Figuras 3 e 4.

Figura 3: Controlador Feedback.

Figura 4: Controlador Feedforward.

Tendo como base uma condição angular de giro,a ideia é trabalhar no entorno desta condição segundouma partição adequada do espaço, num modelo singu-lar simplificado, controlando as transições entre giros.

Analisando a Figura 3 é possível perceber queuma característica desta estrutura de controle é que ocálculo das equações de giro é feito dependendo daconfiguração corrente do robô. Assim, a cada instantedo movimento novos valores de θ1giro e γgiro são uti-lizados para a obtenção do sinal de controle que é im-posto ao protótipo.

A principal modificação da estrutura de controleproposta, Feedforward, ante o controlador Feedbacké que para uma entrada em degrau, as equações degiro sempre calculam o mesmo valor de θ1giro e γgirodurante toda a manobra realizada. Esta característicaé vantajosa, pois mantém o controlador sempre bus-cando o giro em torno da referência imposta, indepen-dente da situação em que se encontre o ângulo θ2 nodecorrer do movimento.

Para o ângulo da primeira articulação (θ1), ocontrole implementado é simplesmente proporcional,dado pelo ganho Kp1, já para o controle do ângulo dasegunda articulação (θ2), utiliza-se um PID linear.

Os saturadores limitam os sinais de controle, pro-porcionando com isso, um melhor entendimento dequal a contribuição relativa de cada um destes sinaisna composição final do sinal de controle do veículo.

A própria arquitetura dos controladores propostosdificulta o ajuste dos ganhos lineares, já que não se co-nhece uma metologia precisa de sintonia para estrutu-ras desta natureza. Tal característica origina a busca deum processo estruturado que consiga, de forma menoscustosa e mais eficiente, realizar de forma satisfatória,

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

26

Page 4: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

o ajuste dos valores devidos visando obter o melhorcontrole do sistema.

Um trabalho de investigação com repetidas mano-bras foi realizado previamente, em que se tentou en-contrar valores adequados de ganhos, mas isto ficava acargo do operador do veículo, sendo portanto os crité-rios puramente subjetivos. Estes ficavam comprometi-dos devido a dificuldade de se encontrar conjuntos dequatro ganhos satisfatórios. A ferramenta desenvol-vida propõe resolver tal problemática de forma eficaz,simples e rápida, diminuindo o esforço do operador eproduzindo resultados significativamente melhores.

4 Modelo Cinemático e Veículo de Testes

Conforme mencionado na seção 3, as primeiras ten-tativas de sintonia foram feitas diretamente no robôde testes em que gerou-se uma tabela de ajustes paraalguns movimentos. Este processo custoso foi substi-tuído por um sistema de otimização em um ambientede simulação, permitindo realizar mais movimentosem um intervalo menor de tempo. O software A4Gfunciona de forma off-line, necessitando portanto deum bom modelo representativo da planta real do sis-tema.

Para a caracterização do modelo cinemático sãonecessárias duas equações básicas, a primeira delasconsidera a interação entre o elemento trator e o trai-ler imediatamente posterior da cadeia articulada. AEquação 3 mostra a variação do ângulo entre estes doiselementos do robô.

∆θ1 = V T

[(1 +

cos(θ1)B1

A2

)cos(γ)sen(γ)

A1

+sen(θ1)

A2

](3)

Já a Equação 4 define a variação dos ângulos parauma cadeia articulada com n elementos, a partir do se-gundo trailer posicionado imediatamente após o ele-mento de tração do veículo.

∆θi = ϑi−1

1 +cos(θi)Bi

Ai+1

−sen(θi−1)

Ai

+cos(θi−1)sen(θi)

Ai+1

(4)

∀ i = 2, 3, ..n.

Na Equação 4, o termo ϑi−1, para um veículocom dois reboques, é definido da seguinte forma:

ϑi−1 = V T (5)

O modelo cinemático não representa a dinâmicade movimentação do robô, portanto os valores de ga-nhos encontrados pelo programa A4G, nestas con-dições, não se aplicam ao veículo em testes reais.Fez-se necessário adicionar ao modelo as não line-aridades presentes no robô. Alguns fatores foramfacilmente identificáveis e por inspeção foram inse-ridos no modelo cinemático da forma mais aproxi-mada que se conseguiu comparando-se com o com-portamento do protótipo. No entanto, algumas ca-racterísticas são muito difíceis de serem mensuradas,pois existem muitos comportamentos indesejados em

um protótipo real e que podem acontecer esporadi-camente ou em somente um determinado instante domovimento, como exemplo, as folgas mecânicas, des-lizamentos, agarramentos, ruídos, dentre outras. Em(Bertolani, 2013) foi desenvolvido e validado um bommodelo representativo do veículo de testes, este mo-delo foi utilizado para realizar os testes mostradosneste artigo.

5 Algoritmo Genético e Software A4G

Os Algoritmos Genéticos são uma classe de algorit-mos evolutivos que utilizam técnicas baseadas na bio-logia evolutiva, como por exemplo, mutação, reprodu-ção, exclusão e recombinação (crossover), para definiros melhores indivíduos de uma determinada popula-ção. Inspiram-se no princípio Darwiniano da evoluçãodas espécies e na genética.

Estes algoritmos são implementados em softwa-res de simulação, em que uma população de represen-tações abstratas da solução é avaliada objetivando-seencontrar, a cada iteração do programa, soluções maisadequadas e melhor aplicáveis ao problema existente.

A priori, o método de tentativa e erro para casoscom um número pequeno e limitado de soluções re-presenta uma boa opção para resolução de problemas.Entretanto, para situações com inúmeras possibilida-des de sintonia e estratégias de ajuste, esse método nãoapresenta uma boa opção. Os algoritmos evolutivosconsistem numa metodologia de busca direcionada.

O processo básico de evolução dos indivíduos, seinicia a partir de um conjunto de soluções criado ale-atoriamente, e é realizado por meio de gerações. Acada geração, a adaptação de cada solução é avaliada,alguns indivíduos são selecionados para a próxima ge-ração, e recombinados e/ou por mutação formam umanova população. Esta é utilizada como entrada paraa próxima iteração do algoritmo. Este processo, deforma recursiva, se apresentar comportamento conver-gente, acaba por selecionar o melhor conjunto de indi-víduos (soluções) representantes de uma população.

O método de seleção implementado pelo softwareé o da roleta, e as condições padrão de utilização doprograma para geração de resultados, bem como seufluxograma de funcionamento, estão ilustrados na Fi-gura 5.

Os critérios de parada são por intervenção di-reta do usuário ou pelo fim do processo recur-sivo, alcançando o limite de gerações estabeleci-das. Os indivíduos são compostos de quatro ganhos,[Kp1,Kp,Kd e Ki] e inicializados de forma aleatória,respeitando os limites definidos pelo usuário, sendopossível escolher quantos destes parâmetros sintoni-zar. O sinal de entrada é um degrau com amplitudeselecionável, bem como a amplitude dos saturadorespresentes nas estruturas de controle.

A função de fitness pode ser escolhida entre trêsopções: erro ao degrau, erro à resposta de segunda or-dem e erro ao degrau ponderando o sinal de controle.A primeira opção implementa o erro quadrático, com

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

27

Page 5: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

Figura 5: Fluxograma de funcionamento do A4G.

a função de aptidão sendo calculada como o inversodeste erro. A segunda opção calcula o erro entre asaída do sistema e uma resposta de segunda ordem pa-rametrizada pelo tempo de subida ou pelo tempo depico desejado, e pela sobrelevação requerida, sendo afitness o inverso deste erro. A terceira opção é seme-lhante a primeira, mas considera a amplitude dos si-nais de controle no cálculo de erro, visando conseguirsinais mais suaves.

O posicionamento angular inicial do veículo de-fine os últimos parâmetros necessários para inicializa-ção do programa. Assim que o processo de busca co-meça, o A4G procura em cada geração o melhor indi-víduo e atualiza na interface a resposta deste membro,caso esta, seja ainda melhor, que a resposta anteriorencontrada. Assim, ao final do processo, obtêm-se omelhor conjunto de ganhos (indivíduo). As seguintescaracterísticas da melhor resposta encontrada são cal-culadas e apresentadas ao usuário: tempo de subida,tempo de pico, sobrelevação, tempo de atraso (delay)e erro médio estacionário.

A Figura 6 mostra o layout do A4G e exibe o pro-grama em funcionamento para um determinado movi-mento.

6 Resultados e Discussões

Os resultados conseguidos com a utilização do soft-ware são baseados em uma sistemática adequada desintonia, em que adota-se uma estratégia de particio-namento do espaço de configuração do robô, visandoum bom ajuste por partição para que se consiga reali-zar manobras mais amplas e complexas.

O particionamento de movimentos foi feitodividindo-se o espaço de configuração em manobrasde fechamento e de abertura. Um movimento de fe-chamento é definido como uma variação específicado ângulo θ2, em que o valor de referência solicitado(θ2h) equivale ao valor inicial (θ2i) reduzido de 5◦ emmódulo. O movimento de abertura consiste na varia-ção do ângulo θ2, cujo valor de referência solicitado(θ2j) equivale ao valor inicial (θ2i) acrescido de 5◦ emmódulo, conforme Figura 7.

Figura 7: Definição da movimentação do veículo.

A própria dinâmica de translação do veículo paratrás leva a composição à realizar movimentos de aber-tura, portanto tais movimentos são mais fáceis de se-rem executados. As manobras de fechamento reque-rem uma reversão do ângulo θ1 no intuito de realizar amovimentação de forma satisfatória.

Definiu-se como entrada o sinal degrau, com am-plitude fixada em ±5◦, em que à partir de um ânguloinicial θ2, com a cadeia articulada em situação de giro,realizaram-se os testes. O espaço de configuração davariável θ2 foi dividido em quatro partes, com os ân-gulos iniciais: 0◦, +12◦, +18◦ e +30◦.

Considerou-se o erro à resposta de segunda ordemcomo função de fitness, esta, parametrizada com so-brelevação de 5% e tempos de subidas fixados em 2 e3 segundos (Teste 1 e Teste 2, respectivamente). Estesresultados conseguidos com o A4G serão comparadoscom resultados obtidos via tentativa e erro, por inspe-ção, em testes reais com o robô (Testes 3 e 4).

Neste artigo define-se um padrão de representa-ção das manobras executadas pelo veículo, como:

[θ1, θ2]→ [θ∗2 ] (6)

A Equação 6 representa antes da seta as condiçõesiniciais dos ângulos de configuração dos reboques θ1e θ2, e depois da seta, o ângulo de referência para oúltimo trailer da composição.

A Tabela 1 mostra a bateria de testes realizadapara análise de desempenho do sistema, com e semo auxílio do software A4G.

Apenas dois ganhos proporcionais são utilizados,não sendo sintonizados os ganhosKd eKi do controlePID. Esta característica pôde ser confirmada após umasérie de testes em que o ganho integral se apresentoumuito pequeno ante o valor proporcional, sendo insig-nificante sua contribuição, assim como o ganho deri-vativo.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

28

Page 6: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

Figura 6: Exemplo de funcionamento do software A4G.

Nota-se também, analisando a Tabela 1, que osganhos lineares de Kp e de Kp1 tem sempre sinaisopostos. Este comportamento é inerente ao sistema,haja vista que os dois trailers apresentam uma dinâ-mica de movimentação contrária, assim, aumentando-se o ângulo θ1 em módulo, e transladando a composi-ção para trás, nota-se uma diminuição, em módulo, doângulo θ2. E diminuindo θ1, o ângulo θ2 aumenta.

Alguns pontos merecem destaque após analisar aTabela 1, dentre os quais pode-se citar:

Controlador FeedforwardSintonia Experimental (Testes 3 e 4)Estratégia de sintonia adotada: |Kp| = 2×|Kp1|.

Apresentou jacknife principalmente em manobras defechamento e grande sobrelevação em todas as mano-bras. Esta característica é indesejada e crucial paraocasionar o engavetamento da composição já que ummovimento inicialmente de abertura passa a ser de fe-chamento, e um movimento de fechamento passa aser abertura, assim que a saída ultrapassa a referência.Esta mudança de movimentos interfere diretamente nasintonia do sistema, já que cada manobra exige umamovimentação específica da cadeia, requisitando umajuste diferente para cada situação. Assim, encontrarum conjunto de ganhos, que para uma única manobrarealize ambos os movimentos, abertura e fechamento,de forma satisfatória, não é uma tarefa simples, sendoainda mais complexa se ficar a cargo de um especi-alista. Os tempos obtidos foram muito baixos, suge-rindo ganhos superdimensionados.

Sintonia via A4G (Testes 1 e 2)O sistema geralmente é mais rápido, quanto maior

a diferença entre os valores absolutos de Kp e Kp1,comprovando que a estratégia utilizada na sintonia ex-perimental é válida, já que, considerando que a sin-

tonia foi realizada por tentativa e erro, é prudente eaceitável que o operador sempre busque o ajuste quepermita a movimentação mais rápida da cadeia. Todasas manobras de abertura apresentam |Kp1| ≤ |Kp|,priorizando a velocidade em detrimento da manobra-bilidade. A sobrelevação, nas manobras de abertura,está dentro do limite desejado, já no fechamento algu-mas manobras ultrapassam esta faixa. O erro médio éaceitável em todas as manobras.

Controlador FeedbackSintonia Experimental (Testes 3 e 4)Estratégia básica de sintonia adotada: |Kp| =

|Kp1|. Apresentou jacknife em muitas manobras,principalmente, naquelas em que optou-se por fazer|Kp| = 2× |Kp1|, mostrando que esta não é uma boaestratégia de sintonia para este controlador, pois o sis-tema perde em manobrabilidade, sendo melhor pro-curar por ganhos próximos em módulo. A sobreleva-ção média verificada é menor que no controle Feed-forward, mas ainda elevada, sendo prejudicial ao sis-tema. Tempos muito baixos, sugerindo também ga-nhos superdimensionados.

Sintonia via A4G (Testes 1 e 2)Nas manobras M1 e M2, para que se consiga uma

resposta mais rápida, os ganhos devem ser próximosem módulo, comprovando a eficácia da estratégia bá-sica adotada na sintonia experimental. Nos movimen-tos de abertura, para uma resposta mais lenta, nota-se uma redução dos valores de |Kp| em relação aosvalores de |Kp1|, para a mesma manobra, tal caracte-rística de ajuste prioriza a manobrabilidade em detri-mento da velocidade. A Sobrelevação e o erro médiosão aceitáveis para todos os casos. Os ganhos obtidospelo A4G, geralmente são menores, em módulo, dosque os obtidos de forma experimental, comprovando

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

29

Page 7: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

Tabela 1: Bateria de testesParticionamento do Espaço de Configuração Controlador Feedforward Controlador Feedback

Sintonia Via A4G Sintonia Experimental Sintonia Via A4G Sintonia ExperimentalManobras Número da Manobra Parâmetros de Desempenho Teste 1 Teste 2 Teste 3 Teste 4 Teste 1 Teste 2 Teste 3 Teste 4

[θ1, θ2] = [0, 00◦, 0◦] → [−5◦] M1 Sobrelevação (%) 0,00 8,95 90,41 87,53 6,09 0,00 3,28 15,92Tempo de delay (s) 0,46 0,48 0,46 0,46 0,50 0,96 0,50 0,46Tempo de pico (s) ***1 11,04 3,47 3,52 3,78 ***1 4,08 3,33Erro médio (◦ ) -0,0160 0,0524 -0,0982 -0,4772 0,0914 0,0265 0,1279 -0,0173Tempo de subida (s) 1,00 2,04 0,82 0,78 1,04 2,94 1,10 0,90GanhoKp1 10,7766 14,0975 4 6 5,62451 4,60997 6 9GanhoKp -17,4959 -20,3136 -8 -12 -5,7238 -2,56603 -6 -10

[θ1, θ2] = [0, 00◦, 0◦] → [5◦] M2 Sobrelevação (%) 12,43 5,15 66,60 76,20 8,79 0,00 13,75 JacknifeTempo de delay (s) 0,43 0,79 0,48 0,50 0,54 0,71 0,66 JacknifeTempo de pico (s) 3,12 6,12 3,36 3,77 5,87 ***1 4,48 JacknifeErro médio (◦ ) -0,4191 -0,5226 -0,2182 -0,5501 -0,3015 -0,2149 -0,1723 JacknifeTempo de subida (s) 0,96 2,21 0,84 0,84 1,22 1,98 1,20 JacknifeGanhoKp1 9,31799 11,2960 5 6 10,6063 10,0736 5 5GanhoKp -16,9114 -15,3392 -10 -12 -11,6232 -8,40579 -5 -10

[θ1, θ2] = [7, 77◦, 12◦] → [7◦] M3 Sobrelevação (%) 4,92 0,98 Jacknife 91,99 4,26 4,35 6,64 4,89Tempo de delay (s) 0,60 0,60 Jacknife 0,34 0,54 0,57 0,54 0,54Tempo de pico (s) 4,14 6,60 Jacknife 3,90 4,08 4,98 4,08 4,20Erro médio (◦ ) 0,0576 -0,0218 Jacknife 0,2589 0,0161 0,0017 0,0181 0,0160Tempo de subida (s) 1,58 1,74 Jacknife 0,90 1,38 1,86 1,26 1,43GanhoKp1 8,67134 13,7307 6 10 13,6592 12,3139 9 10GanhoKp -12,6760 -18,9695 -12 -20 -14,0220 -10,8831 -9 -10

[θ1, θ2] = [7, 77◦, 12◦] → [17◦] M4 Sobrelevação (%) 10,07 3,07 31,32 19,67 2,63 4,00 2,37 JacknifeTempo de delay (s) 0,48 0,60 0,42 0,42 0,43 0,54 0,48 JacknifeTempo de pico (s) 3,60 6,06 3,05 3,00 6,33 5,82 6,48 JacknifeErro médio (◦ ) -0,0125 -0,0452 -0,0252 -0,0618 -0,1152 -0,0467 -0,1100 JacknifeTempo de subida (s) 0,90 2,34 0,72 0,80 0,96 2,34 2,10 JacknifeGanhoKp1 4,59241 5,32349 5 9 9,39721 6,35139 8 6GanhoKp -7,40913 -6,62976 -10 -18 -11,9121 -5,52436 -8 -12

[θ1, θ2] = [11, 57◦, 18◦] → [13◦] M5 Sobrelevação (%) 3,61 3,92 Jacknife Jacknife 10,61 7,17 18,25 30,67Tempo de delay (s) 0,56 0,66 Jacknife Jacknife 0,60 0,66 0,54 0,48Tempo de pico (s) 4,68 5,28 Jacknife Jacknife 4,02 5,16 3,90 3,94Erro médio (◦ ) 0,0102 0,0199 Jacknife Jacknife 0,0373 0,0023 0,1185 0,1348Tempo de subida (s) 1,46 1,86 Jacknife Jacknife 1,20 1,73 1,14 1,08GanhoKp1 13,89900 8,04245 10 13 10,8251 6,1325 9 11GanhoKp -19,49290 -10,55610 -20 -26 -9,91349 -4,6615 -9 -11

[θ1, θ2] = [11, 57◦, 18◦] → [23◦] M6 Sobrelevação (%) 1,41 0,00 14,54 5,59 7,37 7,73 2,26 JacknifeTempo de delay (s) 0,48 0,48 0,42 0,42 0,45 0,43 0,48 JacknifeTempo de pico (s) 5,70 ***1 2,94 3,04 5,70 7,18 6,42 JacknifeErro médio (◦ ) -0,0370 -0,0641 -0,05733 -0,2876 -0,0810 -0,0651 -0,0384 JacknifeTempo de subida (s) 2,28 2,28 0,72 0,78 1,05 2,40 2,38 JacknifeGanhoKp1 7,3797 8,70487 6 12 5,14858 6,23751 7 8GanhoKp -11,5027 -12,4048 -12 -24 -6,24618 -5,78396 -7 -16

[θ1, θ2] = [18, 86◦, 30◦] → [25◦] M7 Sobrelevação (%) 0,00 9,62 Jacknife Jacknife 2,33 0,00 Jacknife JacknifeTempo de delay (s) 0,72 0,90 Jacknife Jacknife 0,78 0,70 Jacknife JacknifeTempo de pico (s) ***1 5,19 Jacknife Jacknife 5,22 ***1 Jacknife JacknifeErro médio (◦ ) 0,0337 0,073 Jacknife Jacknife 0,0490 0,0280 Jacknife JacknifeTempo de subida (s) 1,86 1,80 Jacknife Jacknife 1,74 1,92 Jacknife JacknifeGanhoKp1 8,86533 5,16268 11 19 6,91495 12,0486 12 15GanhoKp -10,2043 -5,70466 -21 -38 -4,91895 -6,61189 15 -15

[θ1, θ2] = [18, 86◦, 30◦] → [35◦] M8 Sobrelevação (%) 0,00 0,00 0,00 0,00 0,00 0,00 0,00 7,77Tempo de delay (s) 0,60 0,60 0,60 0,60 0,60 0,60 0,60 0,60Tempo de pico (s) ***1 ***1 ***1 ***1 ***1 ***1 ***1 3,59Erro médio (◦ ) -0,0989 -0,1431 -0,1772 -0,4697 -0,1313 -0,0593 -0,1440 -0,2618Tempo de subida (s) 0,90 0,96 1,02 3,24 0,90 2,82 2,76 0,90GanhoKp1 5,7488 10,8543 10 15 7,24734 9,21775 9 9GanhoKp -12,2029 -24,2674 -20 -30 -12,8585 -12,613 -9 -18

***1Valor não pode ser medido, manobra sem sobrelevação.

a consistência dos valores conseguidos com o uso dosoftware. Nas manobras de fechamento, nota-se que:|Kp| ≤ |Kp1|, esta estratégia é diferente da adotada nasintonia experimental e apresenta manobras mais len-tas se comparadas as de abertura partindo da mesmaconfiguração. Manobras de abertura possuem respos-tas que se aproximam por “baixo"da referência e nasmanobras de fechamento as respostas se aproximampor “cima". Nas manobras de fechamento, de formageral, para se obter um tempo de resposta menor dosistema, os ganhos devem ser próximos em módulo.

Algumas constatações podem ser feitas de ma-neira geral sobre os testes realizados, propondo umasistemática básica e viável de ajuste, válida para am-bos os controladores:

• Para manobras com o ângulo de configuração θ2menor que ±20◦, deve-se definir os valores dosganhos |Kp| e |Kp1| próximos.

• Para manobras de abertura, deve-se manter o va-lor de |Kp| sempre maior que |Kp1|, para deixaro sistema mais rápido. Porém, não deve-se man-ter uma diferença muito grande entre estes valo-res, pois isto acarreta sobrelevação na resposta

do sistema. Uma boa estratégia é manter |Kp|no seguinte intervalo: 1, 0 × |Kp1| ≤ |Kp| ≤1, 5× |Kp1|.

• Para manobras de fechamento, deve-se manter ovalor de |Kp| sempre menor ou igual a |Kp1|,para aumentar a manobrabilidade.

• Com o aumento em módulo dos ângulos de con-figuração, devem-se diminuir os ganhos, já quenestas condições, apesar do sistema necessitar deum sinal de controle mais elevado, pode-se facil-mente levar o RMMA ao engavetamento, devidoà sobrelevação. Portanto, uma boa estratégia émanter o sistema mais lento, porém menos osci-latório e mais preciso.

7 Conclusão

A análise da Tabela 1 permite concluir que o sis-tema apresenta melhores respostas com o ajuste viaA4G, podendo-se afirmar que a interface em ques-tão mostrou-se eficiente e de fácil utilização, compro-vando, que no caso, os Algoritmos Genéticos se con-

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

30

Page 8: OTIMIZAÇÃO GENÉTICA ASSISTIDA NO CONTROLE DE …swge.inf.br/CBA2014/anais/PDF/1569933397.pdf · gulo entre engates atinge 90 , desprezando as restri-ções reais dependentes dos

solidam como uma boa ferramenta de ajuste otimizadode ganhos. Além disso, o programa é facilmente adap-tável a alterações na estrutura do controlador, na dinâ-mica da planta e na quantidade de parâmetros que sedeseje otimizar. A aplicação em questão não utilizoutodo o potencial da interface de otimização de quatroparâmetros, já que a sintonia se deu em dois ganhos.

O controlador Feedforward, apesar de apresen-tar alguns resultados próximos aos obtidos pelo Feed-back, tem características próprias e estratégia de sin-tonia bem definida, ficando isto explícito em testes di-retamente na plataforma experimental, mostrando queeste controlador é uma alternativa viável para o con-trole de configuração de RMMAs.

A continuação deste trabalho será a síntese da so-lução final de controle de trajetória, para movimentosamplos no espaço de configurações, obtida através dainterpolação ou adaptação fuzzy, dos melhores ganhosotimizados nas partições correspondentes, segundo asistemática proposta. Posteriormente serão desenvol-vidas as estratégias para a composição do controle deconfiguração em soluções para a navegação no espaçode tarefas.

Referências

Altafini, C.; Speranzon, A. and Wahlberh, B. (2001).A Feedback Control Scheme for Reversing aTruck and Trailer Vehicle, IEEE Transactions onRobotics and Automation v. 17(n. 6): p. 915–922.

Bertolani, D. N. (2013). Sintonia do Controle de Con-figuração de Robôs Móveis Multiarticulados ViaAlgoritmo Genético, Dissertação de Mestradoem Engenharia Elétrica - Universidade Federaldo Espírito Santo.

Ferreira, E. P.; Bertolani, D. N. and Pandolfi, F. (2011).Equações de Movimento à Ré de Robôs Mó-veis Multiarticulados, no Espaço de Configura-ções e no Espaço de Tarefas com Tração Dian-teira ou Traseira e Ligações On-Axle e Off-Axle- Controle Nonlinear Feedback., 10th BrazilianCongress on Computational Intelligence (CBIC2011) .

Ferreira, E. P.; Miranda, V. M. (2011). Developmentof Static Neural Networks as Full Pre-Dictors orControllers for Multi-Articulated Mobile Robotsin Backward Movements - New Models and To-ols, 9th IEEE International Conference on Con-trol and Automation (ICCA) 2011, p. 985-990 .

Ferreira, E. P.; Pandolfi, F. and Oliveira, T. R. B.(2010). Modelagem Fuzzy de Rôbos Mó-veis Multi-Articulados em Manobras Comple-xas com Atraso: Uma Nova Sistemática para aDescrição de Movimentos e Controladores, CBA2010 .

Jaen-Cuellar, A. Y. et al. (2013). PID - ControllerTuning Optimization with Genetic Algorithms in

Servo Systems, International Journal of Advan-ced Robotic Systems v. 10: p. 324–337.

Kong, S.-G.; Kosko, B. (1992). Adaptive Fuzzy Sys-tems for Backing up a Truck-and-Trailer, IEEETransactions on Neural Networks v. 03(n. 02): p.211–223.

Mendoza, G. R. P.; Mendoza, D. E. H. and Bricaire,E. A. (2011). Time-Varying Formation Controlfor Multi-Agent Systems Applied to n-TrailerConfiguration, 8th International Conference onElectrical Engineering Computing Science andAutomatic Control (CCE), 2011, p. 1 - 6 .

Nguyen, N.; Widrow, B. (1989). The Truck Backer-Upper: An Example of Self Learning in NeuralNetworks, Proceedings of the International JointConference on Neural Networks v. 2: p. 357–363.

Park, M. et al. (2004). Control of a Mobile Robotwith Passive Multiple Trailers, IEEE Internati-onal Conference on Robotics and Automation.ICRA 2004 v. 5: p. 4369–4374.

Petrov, P. (2010). Nonlinear Backward Tracking Con-trol of an Articulated Mobile Robot with Off-Axle Hitching, Proceedings of the 9th WSEASInternational Conference on Signal Proces-sing,Robotics and Automation. ISPRA10, p. 269-273 .

Pradalier, C.; Usher, K. (2007). A Simple and Effici-ent Control Scheme to Reverse a Tractor-TrailerSystem on a Trajectory, IEEE International Con-ference on Robotics and Automation, p. 2208-2214 .

Ren, T. et al. (2012). Automatic Rule Turning FuzzyController Design for a Truck and Trailer Sys-tem, IEEE International Symposium on Indus-trial Electronics (ISIE), 2012, p. 808 - 813 .

Sharafi, M.; Zare, A. and Nikpoor, S. (2010). Intel-ligent Parking Method for Truck in Presence ofFixed and Moving Obstacles and Trailer in Pre-sence of Fixed Obstacles, International Confe-rence on Electronics and Information Enginee-ring (ICEIE) v. 2: p. 268–272.

Stahn, R. ; Stark, T. and Stopp, A. (2007). La-ser Scanner-Based Navigation and Motion Plan-ning for Truck-Trailer Combinations, 2007IEEE/ASME International Conference on Ad-vanced Intelligent Mechatronics, p. 1-6 .

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

31