optimo inverso amca2011
TRANSCRIPT
C l N l Ó i i G di dControl Neuronal Óptimo inverso con Gradiente de Velocidad para Regular la Producción de Metano en un
Proceso de Digestión AnaeróbicaProceso de Digestión Anaeróbica
K. J. Gurubel1, E. N. Sánchez1 , S. Carlos‐Hernández2 y F. Ornelas1
AMCA 2011CONGRESO NACIONAL
Saltillo, Coahuila 5 – 7 de Octubre
1Cinvestav Unidad Guadalajara1Cinvestav Unidad Guadalajara2Cinvestav Unidad Saltillo
1
INTRODUCCIÓN
La digestión anaeróbica es un proceso biológico en el que lag p g qmateria orgánica (sustrato) es degradada por bacteriasanaeróbicas (biomasa), en ausencia de oxígeno. Tal degradaciónproduce biogás, que consiste en metano (CH4), dióxido de
b (CO ) bié b i id á icarbono (CO2), y también se obtienen residuos orgánicosestables.
El proceso anaeróbico es un proceso complejo y secuencial queocurre en cuatro etapas básicas: Hidrólisis, Acidogénesis,Acetogénesis y Metanogénesis. Cada etapa tiene una dinámica
ífi l é i l á l i lespecífica; la metanogénesis, que es la más lenta impone ladinámica del proceso y se considera la etapa limitante. Por lotanto, la fase de metanogénesis es la más importante para elpresente estudio Este proceso es desarrollado en un reactorpresente estudio. Este proceso es desarrollado en un reactorcontinuo de tanque agitado con filtro de biomasa.
2
ÓINTRODUCCIÓNDiversos sensores de biogás se han desarrollado para medir el
b l d d d l bCH4; sin embargo, las mediciones de sustrato y de la biomasa sonmás restrictivas.
E t b j i b d lEn un trabajo previo se propone un observador neuronal nolineal en tiempo discreto para sistemas no lineales desconocidosen presencia de perturbaciones externas e incertidumbre de
bl d blparámetros, para estimar variables no medibles.
Este observador se basa en una red neuronal recurrente de altod (RHONN i l i l ) t dorden (RHONN, por sus siglas en ingles) entrenada con un
algoritmo de FKE. El objetivo es estimar la concentración debiomasa, la degradación del sustrato y el carbono inorgánico enun proceso anaeróbico.
3
OBJETIVO
Para controlar el proceso anaeróbico, se propone uncontrolador neuronal óptimo inverso con gradiente develocidad. Este controlador es desarrollado sobre la base delvelocidad. Este controlador es desarrollado sobre la base delobservador neuronal mencionado. La meta del controlador esseguir una trayectoria de referencia de YCH4 y evitar lainhibición del proceso anaeróbico La ley de control calcula lainhibición del proceso anaeróbico. La ley de control calcula larazón de dilución y la cantidad de bicarbonato requeridos,para seguir la trayectoria de referencia de YCH4.
44
FENÓMENOS FISICOQUÍMICOS
El modelo propuesto está compuesto por un conjunto deEl modelo propuesto está compuesto por un conjunto decinco ecuaciones algebraicas y seis ecuaciones diferencialesordinarias. El fenómeno fisicoquímico (equilibrio ácido‐b ió d l i ) d l d lbase y conservación de la materia) son modelados por lasecuaciones algebraicas.
5
Ó ÍFENÓMENOS FISICOQUÍMICOS
,02 =−+ − SSHS
,0
,0
2 =−
=−+
−+
COKBH
HSKSH
db
a
,0
,02
=−+
=−+− ZSB
ICCOB d
donde HS es el ácido acético no ionizado (mol L−1), S− es elácido acético ionizado (mol L−1), H+ es el hidrógeno ionizado(mol L−1) B es el bicarbonato medido (mol L−1) CO es el(mol L 1), B es el bicarbonato medido (mol L 1), CO2d es eldióxido de carbón disuelto (mol L−1), Ka es una constante deequilibrio ácido‐base, Kb es una constante de equilibrio entreB CO
6
B y CO2d.
MODELO MATEMÁTICOMODELO MATEMÁTICO El fenómeno biológico es modelado por ecuacionesdiferenciales ordinarias , que representa la parte dinámicadel proceso como:
( )Xkdt
dXd−= ,111
1 μ
( )
( )XkdX
SSDXRdt
dSinin
=
−+−= ,
2
111161
μ
μ
( )
( )SSDXRXRdt
dS
Xkdt
inin
d
−++−=
−=
,
,
221142232
222
μμ
μ
( )ICICD
XRRXRXRRdt
dIC
inin −
+−+=
,
22311152232 μλμμ
7
( )ZZDdtdZ
inin −=
ÁMODELO MATEMÁTICOdonde X1, corresponde a las bacterias hidrolíticas, acidogénicas yacetogénicas y X corresponde a las bacterias metanogénicas Laacetogénicas y X2, corresponde a las bacterias metanogénicas. Lacarga orgánica es clasificada en S1, que modela las moléculascomplejas y S2 , que representa las moléculas transformadas enácido acético. μ1 es la razón de crecimiento (tipo Haldane) de X1(h 1) l ó d i i t (ti H ld ) d X (h 1) k(h−1), μ2 es la razón de crecimiento (tipo Haldane) de X2 (h−1), kd1el índice de mortalidad de X1 (mol L−1), kd2 el índice demortalidad de X2 (mol L−1), Din la razón de dilución (h−1), S1in laentrada del sustrato rápidamente degradable (mol L−1), S2in lap g ( ), 2inentrada del sustrato lentamente degradable (mol L−1), IC carbonoinorgánico (mol L−1), Z el total de cationes (mol L−1), ICin laentrada de carbono inorgánico (mol L−1), Zin la entrada decationes (mol L−1) λ es un coeficiente que considera la ley de lacationes (mol L ), λ es un coeficiente que considera la ley de lapresión parcial para el CO2 disuelto, y R1,…, R6 son loscoeficientes de producción.
8
MODELO MATEMÁTICOFinalmente la fase gaseosa es considerada como la salidadel proceso
2232
2221
2
4
XRRY
XRRY
CO
CH
μλ
μ
=
=
El crecimiento de la biomasa, la degradación del sustrato yYCH4, son buenos indicadores de actividad biológicad d l bl d ddentro del reactor. Esas variables pueden ser usadas paramonitorear el proceso y para diseñar el control neuronalóptimo inverso con gradiente de velocidad.p g
9
El RHONO en tiempo discreto estima las variables de la etapad l b ( ) ( ) b
RHONO EN TIEMPO DISCRETO
de metanogénesis: la biomasa (X2), sustrato (S2) y carbonoinorgánico (IC). La propiedad de observabilidad de esteproceso de digestión anaeróbica fue analizado en un trabajop g jprevio.
E d l b d
10
Esquema del observador
RHONO EN TIEMPO DISCRETO
13,22
12,2111,2 kkkk ICSwXSwXSwX ⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛=
∧∧∧
+
∧
,1,,22
15,,22
14 kkinkkink egICXSwDXSw
⎞⎛⎞⎛⎞⎛
+⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+
⎠⎝⎠⎝⎠⎝∧∧
,2222
2522
24
23,22
22,2211,2
kkikkik
kkkk
egSSSwDSSw
ICSwSSwSSwS
+⎟⎞
⎜⎛+⎟
⎞⎜⎛+
⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛=
∧∧
∧∧∧
+
∧
,
,2332
32311
2,2,225,,224
kkkk
kkinkkink
XSwICSwICSwIC
egSSSwDSSw
⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛=
+⎟⎠
⎜⎝
+⎟⎠
⎜⎝
+
∧∧∧
+
∧
Estructura del observador
,3,2
35,2
34 kkinkkink egICICSwDICSw +⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+
∧∧
Estructura del observador
11
RHONO EN TIEMPO DISCRETO
donde wij es el respectivo vector de pesos adaptado en línea;ijwij p p p ;X2, S2 y IC son los estados estimados; S() es la funciónsigmoidal definida como S(x)=atanh(Bx)BB; (g1, g2, g3) sonlas ganancias Luenberger del observador e es el error de
22 ,∧∧
SX∧
IC )(•S)tanh()( xxS βα=
ij
las ganancias Luenberger del observador, ek es el error desalida, Din, S2iny ICin son definidas como antes.
12
ALGORITMO DE ENTRENAMIENTO FKEALGORITMO DE ENTRENAMIENTO FKEEn este trabajo, usamos un algoritmo de entrenamientobasado en el FKE descrito porbasado e e desc to po
( ) ( ) ( ) ( )K k P k H k M k
( ) ( ) ( ) ( ) ( ) ( ) ( )kykykekekKkwkw iii
∧
−=+=+ ,1 η
( ) ( ) ( ) ( )i i i iK k P k H k M k=
( ) ( ) ( ) ( ) ( ) ( )1 Ti i i i i iP k P k K k H k P k Q k+ = − +
( ) ( ) ( ) ( ) ( )( ) 1 1TM k R k H k P k H k i n−
= + =
donde es la estimación del error de salida yes la matriz de covarianza del error de predicción, es el
( ) ( ) ( ) ( ) ( )( ) , 1, ,i i i iiM k R k H k P k H k i n= + = K
( ) pe k ∈ℜ ( ) i iL LiP k ×∈ℜ
iLiw∈ℜes la matriz de covarianza del error de predicción, es el
vector de pesos(estados), es el numero respectivo de pesosde la red
iw ℜiL
13
ALGORITMO DE ENTRENAMIENTO FKE• es la salida de la planta, es la salida de la redpy∈ℜ ˆ py∈ℜ
neuronal, , es el numero de estados, ηi es la razón deaprendizaje, es la matriz de ganancia de Kalman,
, es la matriz de covarianza del ruido deiL p
iK ×∈ℜi iL L
iQ ×∈ℜ
n
,estimación, , es la covarianza del ruido del error yh es una matriz, dada como sigue:
iQ ℜp p
iR ×∈ℜiL p
iH ×∈ℜ
( )( )ˆ
T
ijij
y kH
w k⎡ ⎤∂
= ⎢ ⎥∂⎢ ⎥⎣ ⎦
donde y .1, ,i n= K 1, , ij L= K
14
CONTROL NEURONAL ÓPTIMO INVERSO CONCONTROL NEURONAL ÓPTIMO INVERSO CON GRADIENTE DE VELOCIDAD
Considere un sistema no lineal en tiempo discreto afíncomo
donde xk ϵ Rn es el estado del sistema al tiempo k ϵ Z ,
( ) ( ) kkkk uxgxfx +=+1
donde xk ϵ R es el estado del sistema al tiempo k ϵ Z+,u ϵ Rm es el control de entrada, f : Rn →Rn, g : Rn →Rnxm
son funciones de mapeo suaves. Se asume f(0)=0 y{ } t d E (O l ){ } 0≠∀rango{g}=mparatodax En (Ornelas, 2011), se propone una
función de lyapunov para control en tiempo discreto paraasegurar estabilidad del sistema , como
{ } .0≠∀= kxmgrango
15
ÓCONTROL NEURONAL ÓPTIMO INVERSO CON GRADIENTE DE VELOCIDAD
( ) ( ) ( ) 021, ,,, >=−−= T
kkkkkT
kkkkc PPxxPxxxxV δδδ
Empleando esta función en la ley de control, queda de lasiguiente forma
2
siguiente forma
( ) ( ) ( ) ( ) ( ) ( )11
* ,11 −
⎟⎞
⎜⎛ +−= kkkkk
Tkkk
Tkk xxfxgPxgxgPxgxRu δ( ) ( ) ( ) ( ) ( ) ( )1,,
22 +⎟⎠
⎜⎝
+ kkkkkkkkkk xxfxgPxgxgPxgxRu δ
16
ÓCONTROL NEURONAL ÓPTIMO INVERSO CON GRADIENTE DE VELOCIDAD
Pk y R son matrices definidas positivas y simétricas; así laexistencia de la inversa en el control es asegurada.x es la trayectoria deseada Para computar Pk quenRx ∈x es la trayectoria deseada. Para computar Pk , queasegure estabilidad del sistema, usaremos el algoritmogradiente de velocidad. La ley de control depende de la
i P d d i D fi i l i P
k Rx +∈,δ
matriz Pk en cada paso de tiempo. Definimos la matriz Pken cada pasa de tiempo k como:
'PpP kk =
17
ÓCONTROL NEURONAL ÓPTIMO INVERSO CON GRADIENTE DE VELOCIDAD
Donde P’ = P’ T > 0 es una matriz constante dada y pk es un parámetro escalar a ser ajustado por el algoritmo gradiente de velocidad Entonces la ley de control es transformada de velocidad. Entonces la ley de control es transformada en:
( ) ( ) ( ) ( ) ( ).22
'1
'*kdk
Tkk
Tkk
k xfPxgxgPxgpxRpuk
−
⎟⎠⎞
⎜⎝⎛ +−=
La variación dinámica del parámetro pk es calculada como:
( ) ( ) ( ) ( ) ( )22k ⎠⎝
( ) ( ) ( ) ( ) ( )( ) ( ) ( )( )3
2
,1'2
'8kk
Tkk
kT
dkT
kkkT
dkdkk
xgPxgpxRxfxgxRxgPxfpP
++=+ γ
18
ÓCONTROL NEURONAL ÓPTIMO INVERSO CON GRADIENTE DE VELOCIDAD
que es positiva para todo paso de tiempo k si p0>0. Por lotanto la positividad de pk es asegurada y el requerimientoPk=Pk
T >0 para es garantizado Además con la función dePk=Pk >0 para es garantizado. Además, con la función deLyapunov para control (definida anteriormente) y P=pP ( pes un valor constante cuando el algoritmo gradiente del id d l ) l l d l ó i i
ppk = p
velocidad concluye) , la ley de control es óptima inversa enel sentido de que minimiza la variedad funcional dadacomo
( ) ( )( )∑∞
=
+=0
.k
kkTkk uxRuxlJ
19
RHONO COMO SISTEMA AFÍN
+⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛=⎟
⎠⎞
⎜⎝⎛ ∧∧∧∧∧
kkkkkk egICSwXSwXSwICXf 113,22
12,211,21 ,,
RHONO COMO SISTEMA AFÍN
⎞⎛⎞⎛⎞⎛⎞⎛
⎟⎠⎞
⎜⎝⎛=⎟
⎠⎞
⎜⎝⎛=
⎠⎝⎠⎝⎠⎝⎠⎝∧∧∧∧
kkkk XSwXGXSwXG ,22
14,212,22
14,211 )()(
+⎟⎠⎞
⎜⎝⎛+
⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛=⎟
⎠⎞
⎜⎝⎛
∧
∧∧∧∧∧
kkik
kkkkk
egSSSw
ICSwSSwSSwICSf
2222
25
23,22
22,221,22
,
,
⎟⎠⎞
⎜⎝⎛=
+⎟⎠
⎜⎝
+
∧∧
kk
kkink
SSwSG
egSSSw
,22
24,221
2,2,225
)(
,
⎟⎞
⎜⎛
⎟⎞
⎜⎛
+⎟⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛=⎟
⎠⎞
⎜⎝⎛
∧∧∧∧
∧∧∧∧∧
kkkkkk
ICSICGICSICG
egXSwICSwICSwICXf
22
3,2332
3231,23
)()(
,
20
⎟⎠⎞
⎜⎝⎛=⎟
⎠⎞
⎜⎝⎛+= kkkk ICSwICGICSwICG 2
35322
3431 )()(
RHONO COMO SISTEMA AFÍNRHONO COMO SISTEMA AFÍN
1312111211⎥⎤
⎢⎡
⎥⎤
⎢⎡ PPPGG
( )333231
232221
131211
3231
21
1211
'0
⎤⎡
⎥⎥⎥
⎦⎢⎢⎢
⎣
=⎥⎥⎥
⎦⎢⎢⎢
⎣
=k
PPPPPPP
GGGxg
( )3
2
1
6.0' ==⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡= kkk RPpP
fff
xf
( ) ( ) ( ) ( )1,2
2
1,
3
++ −=⎥⎥⎥⎤
⎢⎢⎢⎡
=
⎥⎦⎢⎣
krefkkdref
ref
kref xfxfxfSX
xf
f
δδ
⎥⎥⎦⎢
⎢⎣ refIC
21
ÓRESULTADOS DE SIMULACIÓN15
x 10-3
10x 10-3
Estimada
0
5
10
x2ob
s EstimadaSistema
0
5
S2o
bs
EstimadaSistema
0 500 1000 1500-5
Tiempo (h)
0 500 1000 1500
-5
Tiempo (h)
0.1
0.15
0.2
obs
EstimadaSistema
La biomasa, sustrato y carbonoinorgánico son bien estimadosdesde el principio. Así, el
0 500 1000 15000
0.05
0.1
ICo
p pRHONO propuesto es una buenaalternativa para estimar losestados importantes del proceso
22
Tiempo (h)p p
anaeróbico considerado.
RESULTADOS DE SIMULACIÓN
El algoritmo de control es probado ante una perturbación enEl algoritmo de control es probado ante una perturbación enS2in del 200% en t=200 h, como se muestra en la figura
0.25)
0.15
0.2
med
ida
(mol
/L
0 500 1000 15000.05
0.1
Tiempo (h)
x4in
m
A continuación se muestra el seguimiento de trayectoriaspara la biomasa sustrato carbono inorgánico y YCH
23
para la biomasa, sustrato, carbono inorgánico y YCH4
RESULTADOS DE SIMULACIÓN15
x 10-3
0.02
5
10
x 2 (A
U)
Modelo neuronalTrayectoria de Referencia
0
0.01
2 (m
ol/l)
Modelo neuronalTrayectoria de Referencia
0 500 1000 1500-5
0
Tiempo (h)
x
0 500 1000 1500-0.01
0
Tiempo (h)
S
Tiempo (h) p ( )
0.15
0.2
l/l)
Modelo neuronalTrayectoria de Referencia
0.025
0.03
0.035
0.04
h)
Modelo neuronalTrayectoria de Referencia
0
0.05
0.1
IC (m
o
0
0.005
0.01
0.015
0.02
YC
H 4 (mol
/h
24
0 500 1000 15000
Tiempo (h)
0 500 1000 1500
-0.005
Tiempo (h)
RESULTADOS DE SIMULACIÓNLas figuras ilustran el desempeño de seguimiento para labiomasa, como se puede ver el seguimiento de trayectorias eseficiente y el error se acerca a cero en el estado estable. YCHeficiente y el error se acerca a cero en el estado estable. YCH4es calculada con la ecuación algebraica descrita anteriormenteque está en función de los estados observados del sistema, porlo cual el error en el seguimiento es debido al error delo cual el error en el seguimiento es debido al error deseguimiento de los estados observados del sistema.Los errores de seguimiento son desplegados en la siguientefigura.
25
RESULTADOS DE SIMULACIÓN0.01or
0 1or
0 500 1000 1500-0.01
0
Ti (h)
x2 (A
U) e
rro
Error X2
0 500 1000 1500-0.1
0
0.1
IC (m
ol/l)
erro
Error IC
Tiempo (h)
0
0.02
(mol
/l) e
rror Error S2
Tiempo (h)
0
0.05
4 (mol
/h) e
rror
Error QCH4
0 500 1000 1500-0.02
Tiempo (h)
S2
0 500 1000 1500
-0.05
Tiempo (h)
YC
H 4
Estos errores podrían ser debidos a la estructura simple delp pobservador; es posible que la red neuronal no sea capaz deaprender la dinámica no lineal relacionada con las variables ytambién es posible que las ganancias de la ley de control necesiten
26
también es posible que las ganancias de la ley de control necesitenser ajustadas.
RESULTADOS DE SIMULACIÓN
La figura muestra las señales de control para las entradas ByDin.
0 2
0.1
0.2
B
0 500 1000 15000
Tiempo (h)
0.2
0 500 1000 15000
0.1Din
27
Tiempo (h)
CONCLUSIONESCONCLUSIONESUn observador neuronal recurrente de alto orden no lineal en tiempodiscreto (RHONO) es empleado para estimar la concentración dep pbiomasa, degradación del sustrato y carbono inorgánico. Se basa en unared neuronal recurrente de alto orden en tiempo discreto entrenadacon un algoritmo basado en un filtro de Kalman extendido (FKE).
Un modelo matemático afín es obtenido con el propósito de aplicarcontrol neuronal óptimo inverso con gradiente de velocidad. Una vezobtenido el modelo neuronal, una ley de control óptimo inverso,basada en este modelo es desarrolladobasada en este modelo, es desarrollado.
La meta es forzar al sistema para seguir señales de referencia deseadas.La producción de metano es la trayectoria de referencia objetivo.
Los resultados en simulación ilustran que el controlador propuestoasegura estabilización y seguimiento de trayectorias de un sistema nolineal y minimiza una variedad funcional de costolineal y minimiza una variedad funcional de costo.
28
TRABAJO FUTURO
Como trabajo futuro se determinarán trayectorias dereferencia óptimas para la producción de metano.
El desempeño del RHONO puede ser mejoradoagregándole más términos a la estructura.g g
Esta investigación será continuada para evaluar laaplicación del observador y la ley de control propuestos enel proceso de tratamiento de aguas residuales.
29