optimo inverso amca2011

C l N l Ó i i G di dControl Neuronal Óptimo inverso con Gradiente de Velocidad para Regular la Producción de Metano en un

Proceso de Digestión AnaeróbicaProceso de Digestión Anaeróbica

K. J. Gurubel1, E. N. Sánchez1 , S. Carlos‐Hernández2 y F. Ornelas1

AMCA 2011CONGRESO NACIONAL

Saltillo, Coahuila 5 – 7 de Octubre

1Cinvestav Unidad Guadalajara1Cinvestav Unidad Guadalajara2Cinvestav Unidad Saltillo

1

INTRODUCCIÓN

La digestión anaeróbica es un proceso biológico en el que lag p g qmateria orgánica (sustrato) es degradada por bacteriasanaeróbicas (biomasa), en ausencia de oxígeno. Tal degradaciónproduce biogás, que consiste en metano (CH4), dióxido de

b (CO ) bié b i id á icarbono (CO2), y también se obtienen residuos orgánicosestables.

El proceso anaeróbico es un proceso complejo y secuencial queocurre en cuatro etapas básicas: Hidrólisis, Acidogénesis,Acetogénesis y Metanogénesis. Cada etapa tiene una dinámica

ífi l é i l á l i lespecífica; la metanogénesis, que es la más lenta impone ladinámica del proceso y se considera la etapa limitante. Por lotanto, la fase de metanogénesis es la más importante para elpresente estudio Este proceso es desarrollado en un reactorpresente estudio. Este proceso es desarrollado en un reactorcontinuo de tanque agitado con filtro de biomasa.

2

ÓINTRODUCCIÓNDiversos sensores de biogás se han desarrollado para medir el

b l d d d l bCH4; sin embargo, las mediciones de sustrato y de la biomasa sonmás restrictivas.

E t b j i b d lEn un trabajo previo se propone un observador neuronal nolineal en tiempo discreto para sistemas no lineales desconocidosen presencia de perturbaciones externas e incertidumbre de

bl d blparámetros, para estimar variables no medibles.

Este observador se basa en una red neuronal recurrente de altod (RHONN i l i l ) t dorden (RHONN, por sus siglas en ingles) entrenada con un

algoritmo de FKE. El objetivo es estimar la concentración debiomasa, la degradación del sustrato y el carbono inorgánico enun proceso anaeróbico.

3

OBJETIVO

Para controlar el proceso anaeróbico, se propone uncontrolador neuronal óptimo inverso con gradiente develocidad. Este controlador es desarrollado sobre la base delvelocidad. Este controlador es desarrollado sobre la base delobservador neuronal mencionado. La meta del controlador esseguir una trayectoria de referencia de YCH4 y evitar lainhibición del proceso anaeróbico La ley de control calcula lainhibición del proceso anaeróbico. La ley de control calcula larazón de dilución y la cantidad de bicarbonato requeridos,para seguir la trayectoria de referencia de YCH4.

44

FENÓMENOS FISICOQUÍMICOS

El modelo propuesto está compuesto por un conjunto deEl modelo propuesto está compuesto por un conjunto decinco ecuaciones algebraicas y seis ecuaciones diferencialesordinarias. El fenómeno fisicoquímico (equilibrio ácido‐b ió d l i ) d l d lbase y conservación de la materia) son modelados por lasecuaciones algebraicas.

5

Ó ÍFENÓMENOS FISICOQUÍMICOS

,02 =−+ − SSHS

,0

,0

2 =−

=−+

−+

COKBH

HSKSH

db

a

,0

,02

=−+

=−+− ZSB

ICCOB d

donde HS es el ácido acético no ionizado (mol L−1), S− es elácido acético ionizado (mol L−1), H+ es el hidrógeno ionizado(mol L−1) B es el bicarbonato medido (mol L−1) CO es el(mol L 1), B es el bicarbonato medido (mol L 1), CO2d es eldióxido de carbón disuelto (mol L−1), Ka es una constante deequilibrio ácido‐base, Kb es una constante de equilibrio entreB CO

6

B y CO2d.

MODELO MATEMÁTICOMODELO MATEMÁTICO El fenómeno biológico es modelado por ecuacionesdiferenciales ordinarias , que representa la parte dinámicadel proceso como:

( )Xkdt

dXd−= ,111

1 μ

( )

( )XkdX

SSDXRdt

dSinin

=

−+−= ,

2

111161

μ

μ

( )

( )SSDXRXRdt

dS

Xkdt

inin

d

−++−=

−=

,

,

221142232

222

μμ

μ

( )ICICD

XRRXRXRRdt

dIC

inin −

+−+=

,

22311152232 μλμμ

7

( )ZZDdtdZ

inin −=

ÁMODELO MATEMÁTICOdonde X1, corresponde a las bacterias hidrolíticas, acidogénicas yacetogénicas y X corresponde a las bacterias metanogénicas Laacetogénicas y X2, corresponde a las bacterias metanogénicas. Lacarga orgánica es clasificada en S1, que modela las moléculascomplejas y S2 , que representa las moléculas transformadas enácido acético. μ1 es la razón de crecimiento (tipo Haldane) de X1(h 1) l ó d i i t (ti H ld ) d X (h 1) k(h−1), μ2 es la razón de crecimiento (tipo Haldane) de X2 (h−1), kd1el índice de mortalidad de X1 (mol L−1), kd2 el índice demortalidad de X2 (mol L−1), Din la razón de dilución (h−1), S1in laentrada del sustrato rápidamente degradable (mol L−1), S2in lap g ( ), 2inentrada del sustrato lentamente degradable (mol L−1), IC carbonoinorgánico (mol L−1), Z el total de cationes (mol L−1), ICin laentrada de carbono inorgánico (mol L−1), Zin la entrada decationes (mol L−1) λ es un coeficiente que considera la ley de lacationes (mol L ), λ es un coeficiente que considera la ley de lapresión parcial para el CO2 disuelto, y R1,…, R6 son loscoeficientes de producción.

8

MODELO MATEMÁTICOFinalmente la fase gaseosa es considerada como la salidadel proceso

2232

2221

2

4

XRRY

XRRY

CO

CH

μλ

μ

=

=

El crecimiento de la biomasa, la degradación del sustrato yYCH4, son buenos indicadores de actividad biológicad d l bl d ddentro del reactor. Esas variables pueden ser usadas paramonitorear el proceso y para diseñar el control neuronalóptimo inverso con gradiente de velocidad.p g

9

El RHONO en tiempo discreto estima las variables de la etapad l b ( ) ( ) b

RHONO EN TIEMPO DISCRETO

de metanogénesis: la biomasa (X2), sustrato (S2) y carbonoinorgánico (IC). La propiedad de observabilidad de esteproceso de digestión anaeróbica fue analizado en un trabajop g jprevio.

E d l b d

10

Esquema del observador


13,22

12,2111,2 kkkk ICSwXSwXSwX ⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛=

∧∧∧

+

∧

,1,,22

15,,22

14 kkinkkink egICXSwDXSw

⎞⎛⎞⎛⎞⎛

+⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+

⎠⎝⎠⎝⎠⎝∧∧

,2222

2522

24

23,22

22,2211,2

kkikkik

kkkk

egSSSwDSSw

ICSwSSwSSwS

+⎟⎞

⎜⎛+⎟

⎞⎜⎛+

⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛=

∧∧

∧∧∧

+

∧

,

,2332

32311

2,2,225,,224

kkkk

kkinkkink

XSwICSwICSwIC

egSSSwDSSw

⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛=

+⎟⎠

⎜⎝

+⎟⎠

⎜⎝

+

∧∧∧

+

∧

Estructura del observador

,3,2

35,2

34 kkinkkink egICICSwDICSw +⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+

∧∧

Estructura del observador

11


donde wij es el respectivo vector de pesos adaptado en línea;ijwij p p p ;X2, S2 y IC son los estados estimados; S() es la funciónsigmoidal definida como S(x)=atanh(Bx)BB; (g1, g2, g3) sonlas ganancias Luenberger del observador e es el error de

22 ,∧∧

SX∧

IC )(•S)tanh()( xxS βα=

ij

las ganancias Luenberger del observador, ek es el error desalida, Din, S2iny ICin son definidas como antes.

12

ALGORITMO DE ENTRENAMIENTO FKEALGORITMO DE ENTRENAMIENTO FKEEn este trabajo, usamos un algoritmo de entrenamientobasado en el FKE descrito porbasado e e desc to po

( ) ( ) ( ) ( )K k P k H k M k

( ) ( ) ( ) ( ) ( ) ( ) ( )kykykekekKkwkw iii

∧

−=+=+ ,1 η

( ) ( ) ( ) ( )i i i iK k P k H k M k=

( ) ( ) ( ) ( ) ( ) ( )1 Ti i i i i iP k P k K k H k P k Q k+ = − +

( ) ( ) ( ) ( ) ( )( ) 1 1TM k R k H k P k H k i n−

= + =

donde es la estimación del error de salida yes la matriz de covarianza del error de predicción, es el

( ) ( ) ( ) ( ) ( )( ) , 1, ,i i i iiM k R k H k P k H k i n= + = K

( ) pe k ∈ℜ ( ) i iL LiP k ×∈ℜ

iLiw∈ℜes la matriz de covarianza del error de predicción, es el

vector de pesos(estados), es el numero respectivo de pesosde la red

iw ℜiL

13

ALGORITMO DE ENTRENAMIENTO FKE• es la salida de la planta, es la salida de la redpy∈ℜ ˆ py∈ℜ

neuronal, , es el numero de estados, ηi es la razón deaprendizaje, es la matriz de ganancia de Kalman,

, es la matriz de covarianza del ruido deiL p

iK ×∈ℜi iL L

iQ ×∈ℜ

n

,estimación, , es la covarianza del ruido del error yh es una matriz, dada como sigue:

iQ ℜp p

iR ×∈ℜiL p

iH ×∈ℜ

( )( )ˆ

T

ijij

y kH

w k⎡ ⎤∂

= ⎢ ⎥∂⎢ ⎥⎣ ⎦

donde y .1, ,i n= K 1, , ij L= K

14

CONTROL NEURONAL ÓPTIMO INVERSO CONCONTROL NEURONAL ÓPTIMO INVERSO CON GRADIENTE DE VELOCIDAD

Considere un sistema no lineal en tiempo discreto afíncomo

donde xk ϵ Rn es el estado del sistema al tiempo k ϵ Z ,

( ) ( ) kkkk uxgxfx +=+1

donde xk ϵ R es el estado del sistema al tiempo k ϵ Z+,u ϵ Rm es el control de entrada, f : Rn →Rn, g : Rn →Rnxm

son funciones de mapeo suaves. Se asume f(0)=0 y{ } t d E (O l ){ } 0≠∀rango{g}=mparatodax En (Ornelas, 2011), se propone una

función de lyapunov para control en tiempo discreto paraasegurar estabilidad del sistema , como

{ } .0≠∀= kxmgrango

15

ÓCONTROL NEURONAL ÓPTIMO INVERSO CON GRADIENTE DE VELOCIDAD

( ) ( ) ( ) 021, ,,, >=−−= T

kkkkkT

kkkkc PPxxPxxxxV δδδ

Empleando esta función en la ley de control, queda de lasiguiente forma

2

siguiente forma

( ) ( ) ( ) ( ) ( ) ( )11

* ,11 −

⎟⎞

⎜⎛ +−= kkkkk

Tkkk

Tkk xxfxgPxgxgPxgxRu δ( ) ( ) ( ) ( ) ( ) ( )1,,

22 +⎟⎠

⎜⎝

+ kkkkkkkkkk xxfxgPxgxgPxgxRu δ

16


Pk y R son matrices definidas positivas y simétricas; así laexistencia de la inversa en el control es asegurada.x es la trayectoria deseada Para computar Pk quenRx ∈x es la trayectoria deseada. Para computar Pk , queasegure estabilidad del sistema, usaremos el algoritmogradiente de velocidad. La ley de control depende de la

i P d d i D fi i l i P

k Rx +∈,δ

matriz Pk en cada paso de tiempo. Definimos la matriz Pken cada pasa de tiempo k como:

'PpP kk =

17


Donde P’ = P’ T > 0 es una matriz constante dada y pk es un parámetro escalar a ser ajustado por el algoritmo gradiente de velocidad Entonces la ley de control es transformada de velocidad. Entonces la ley de control es transformada en:

( ) ( ) ( ) ( ) ( ).22

'1

'*kdk

Tkk

Tkk

k xfPxgxgPxgpxRpuk

−

⎟⎠⎞

⎜⎝⎛ +−=

La variación dinámica del parámetro pk es calculada como:

( ) ( ) ( ) ( ) ( )22k ⎠⎝

( ) ( ) ( ) ( ) ( )( ) ( ) ( )( )3

2

,1'2

'8kk

Tkk

kT

dkT

kkkT

dkdkk

xgPxgpxRxfxgxRxgPxfpP

++=+ γ

18


que es positiva para todo paso de tiempo k si p0>0. Por lotanto la positividad de pk es asegurada y el requerimientoPk=Pk

T >0 para es garantizado Además con la función dePk=Pk >0 para es garantizado. Además, con la función deLyapunov para control (definida anteriormente) y P=pP ( pes un valor constante cuando el algoritmo gradiente del id d l ) l l d l ó i i

ppk = p

velocidad concluye) , la ley de control es óptima inversa enel sentido de que minimiza la variedad funcional dadacomo

( ) ( )( )∑∞

=

+=0

.k

kkTkk uxRuxlJ

19

RHONO COMO SISTEMA AFÍN

+⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛=⎟

⎠⎞

⎜⎝⎛ ∧∧∧∧∧

kkkkkk egICSwXSwXSwICXf 113,22

12,211,21 ,,

RHONO COMO SISTEMA AFÍN

⎞⎛⎞⎛⎞⎛⎞⎛

⎟⎠⎞

⎜⎝⎛=⎟

⎠⎞

⎜⎝⎛=

⎠⎝⎠⎝⎠⎝⎠⎝∧∧∧∧

kkkk XSwXGXSwXG ,22

14,212,22

14,211 )()(

+⎟⎠⎞

⎜⎝⎛+

⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛=⎟

⎠⎞

⎜⎝⎛

∧

∧∧∧∧∧

kkik

kkkkk

egSSSw

ICSwSSwSSwICSf

2222

25

23,22

22,221,22

,

,

⎟⎠⎞

⎜⎝⎛=

+⎟⎠

⎜⎝

+

∧∧

kk

kkink

SSwSG

egSSSw

,22

24,221

2,2,225

)(

,

⎟⎞

⎜⎛

⎟⎞

⎜⎛

+⎟⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛=⎟

⎠⎞

⎜⎝⎛

∧∧∧∧

∧∧∧∧∧

kkkkkk

ICSICGICSICG

egXSwICSwICSwICXf

22

3,2332

3231,23

)()(

,

20

⎟⎠⎞

⎜⎝⎛=⎟

⎠⎞

⎜⎝⎛+= kkkk ICSwICGICSwICG 2

35322

3431 )()(

RHONO COMO SISTEMA AFÍNRHONO COMO SISTEMA AFÍN

1312111211⎥⎤

⎢⎡

⎥⎤

⎢⎡ PPPGG

( )333231

232221

131211

3231

21

1211

'0

⎤⎡

⎥⎥⎥

⎦⎢⎢⎢

⎣

=⎥⎥⎥

⎦⎢⎢⎢

⎣

=k

PPPPPPP

GGGxg

( )3

2

1

6.0' ==⎥⎥⎥

⎦

⎤

⎢⎢⎢

⎣

⎡= kkk RPpP

fff

xf

( ) ( ) ( ) ( )1,2

2

1,

3

++ −=⎥⎥⎥⎤

⎢⎢⎢⎡

=

⎥⎦⎢⎣

krefkkdref

ref

kref xfxfxfSX

xf

f

δδ

⎥⎥⎦⎢

⎢⎣ refIC

21

ÓRESULTADOS DE SIMULACIÓN15

x 10-3

10x 10-3

Estimada

0

5

10

x2ob

s EstimadaSistema

0

5

S2o

bs

EstimadaSistema

0 500 1000 1500-5

Tiempo (h)

0 500 1000 1500

-5

Tiempo (h)

0.1

0.15

0.2

obs

EstimadaSistema

La biomasa, sustrato y carbonoinorgánico son bien estimadosdesde el principio. Así, el

0 500 1000 15000

0.05

0.1

ICo

p pRHONO propuesto es una buenaalternativa para estimar losestados importantes del proceso

22

Tiempo (h)p p

anaeróbico considerado.

RESULTADOS DE SIMULACIÓN

El algoritmo de control es probado ante una perturbación enEl algoritmo de control es probado ante una perturbación enS2in del 200% en t=200 h, como se muestra en la figura

0.25)

0.15

0.2

med

ida

(mol

/L

0 500 1000 15000.05

0.1

Tiempo (h)

x4in

m

A continuación se muestra el seguimiento de trayectoriaspara la biomasa sustrato carbono inorgánico y YCH

23

para la biomasa, sustrato, carbono inorgánico y YCH4

RESULTADOS DE SIMULACIÓN15

x 10-3

0.02

5

10

x 2 (A

U)

Modelo neuronalTrayectoria de Referencia

0

0.01

2 (m

ol/l)


0 500 1000 1500-5

0

Tiempo (h)

x

0 500 1000 1500-0.01

0

Tiempo (h)

S

Tiempo (h) p ( )

0.15

0.2

l/l)


0.025

0.03

0.035

0.04

h)


0

0.05

0.1

IC (m

o

0

0.005

0.01

0.015

0.02

YC

H 4 (mol

/h

24

0 500 1000 15000

Tiempo (h)

0 500 1000 1500

-0.005

Tiempo (h)

RESULTADOS DE SIMULACIÓNLas figuras ilustran el desempeño de seguimiento para labiomasa, como se puede ver el seguimiento de trayectorias eseficiente y el error se acerca a cero en el estado estable. YCHeficiente y el error se acerca a cero en el estado estable. YCH4es calculada con la ecuación algebraica descrita anteriormenteque está en función de los estados observados del sistema, porlo cual el error en el seguimiento es debido al error delo cual el error en el seguimiento es debido al error deseguimiento de los estados observados del sistema.Los errores de seguimiento son desplegados en la siguientefigura.

25

RESULTADOS DE SIMULACIÓN0.01or

0 1or

0 500 1000 1500-0.01

0

Ti (h)

x2 (A

U) e

rro

Error X2

0 500 1000 1500-0.1

0

0.1

IC (m

ol/l)

erro

Error IC

Tiempo (h)

0

0.02

(mol

/l) e

rror Error S2

Tiempo (h)

0

0.05

4 (mol

/h) e

rror

Error QCH4

0 500 1000 1500-0.02

Tiempo (h)

S2

0 500 1000 1500

-0.05

Tiempo (h)

YC

H 4

Estos errores podrían ser debidos a la estructura simple delp pobservador; es posible que la red neuronal no sea capaz deaprender la dinámica no lineal relacionada con las variables ytambién es posible que las ganancias de la ley de control necesiten

26

también es posible que las ganancias de la ley de control necesitenser ajustadas.

RESULTADOS DE SIMULACIÓN

La figura muestra las señales de control para las entradas ByDin.

0 2

0.1

0.2

B

0 500 1000 15000

Tiempo (h)

0.2

0 500 1000 15000

0.1Din

27

Tiempo (h)

CONCLUSIONESCONCLUSIONESUn observador neuronal recurrente de alto orden no lineal en tiempodiscreto (RHONO) es empleado para estimar la concentración dep pbiomasa, degradación del sustrato y carbono inorgánico. Se basa en unared neuronal recurrente de alto orden en tiempo discreto entrenadacon un algoritmo basado en un filtro de Kalman extendido (FKE).

Un modelo matemático afín es obtenido con el propósito de aplicarcontrol neuronal óptimo inverso con gradiente de velocidad. Una vezobtenido el modelo neuronal, una ley de control óptimo inverso,basada en este modelo es desarrolladobasada en este modelo, es desarrollado.

La meta es forzar al sistema para seguir señales de referencia deseadas.La producción de metano es la trayectoria de referencia objetivo.

Los resultados en simulación ilustran que el controlador propuestoasegura estabilización y seguimiento de trayectorias de un sistema nolineal y minimiza una variedad funcional de costolineal y minimiza una variedad funcional de costo.

28

TRABAJO FUTURO

Como trabajo futuro se determinarán trayectorias dereferencia óptimas para la producción de metano.

El desempeño del RHONO puede ser mejoradoagregándole más términos a la estructura.g g

Esta investigación será continuada para evaluar laaplicación del observador y la ley de control propuestos enel proceso de tratamiento de aguas residuales.

29

optimo inverso amca2011

Documents